Forecasting Dropout of Undergraduates Pibulsongkram Rajabhat University with Data Mining Technique
รหัสดีโอไอ
Creator Chutiphon Srisawat
Title Forecasting Dropout of Undergraduates Pibulsongkram Rajabhat University with Data Mining Technique
Contributor Tanaphorn Klaythong
Publisher Faculty of Informatics, Mahasarakham University
Publication Year 2566
Journal Title Journal of Applied Informatics and Technology
Journal Vol. 5
Journal No. 1
Page no. 1-17
Keyword Fall off, Decision Tree, Naïve Bayes, Rule Induction
URL Website https://ph01.tci-thaijo.org/index.php/jait/index
Website title Journal of Applied Informatics and Technology (JIT)
ISSN 2586-8136
Abstract Abstract:The objectives of this research were 1) to analyze characteristics and study factors related to the dropout of undergraduate students. Pibulsongkram Rajabhat University 2) to create a model and compare the efficiency of the model and 3) to develop a forecasting system for student dropout. The data of undergraduate students were obtained from the Education Services Division, Pibulsongkram Rajabhat University, between the 2015 and 2020 academic years, a total of 20,093 data sets containing 16 attributes. The filter approach feature selection method based on information gain was presented to analyze the factors affecting student dropout. It was found that ten factors influence student dropout, namely total GPA, year attended in university, programs of study, course of study, mother's occupation, father's occupation, faculty, educational level, region, and aptitude/talent. Then, the relevant factors were used to create the model using 3 data mining techniques: Decision Tree, Naïve Bayes, and Rule Induction technique. The model's performance was investigated using the 5-Fold Cross-Validation and 10-Fold Cross-Validation methods. The model's accuracy and mean absolute error (MAE) were also quantified. The results showed that the decision tree technique model had the highest value in the 10-Fold Cross-Validation. The accuracy and MAE of the model were 97.81% and 0.026, respectively. The researcher also designed and developed the model system using the form of a web application. The results from system evaluation data found the total mean of the correct prediction of the system. Accounted for 86.29%.บทคัดย่อ:งานวิจัยนี้มีวัตถุประสงค์เพื่อ 1) วิเคราะห์คุณลักษณะและศึกษาปัจจัยที่เกี่ยวข้องในการตกออกของนักศึกษาระดับปริญญาตรี มหาวิทยาลัยราชภัฏพิบูลสงคราม 2) สร้างโมเดลและเปรียบเทียบประสิทธิภาพของโมเดลและ 3) เพื่อพัฒนาระบบการพยากรณ์การตกออกของนักศึกษา โดยรวบรวมข้อมูลของนักศึกษาระดับปริญญาตรีจากกองบริการการศึกษา มหาวิทยาลัยราชภัฏพิบูลสงคราม ตั้งแต่ปีการศึกษา 2558-2563 จำนวนทั้งสิ้น 20,093 ชุดข้อมูล มีแอททริบิวต์ทั้งหมด 16 แอททริบิวต์ วิธีการคัดเลือกคุณลักษณะ (Feature Selection) ด้วยเทคนิค Filter Approach โดยใช้ค่า Information Gain ถูกนำมาประยุกต์ใช้เพื่อการวิเคราะห์หาปัจจัยที่มีผลต่อการตกออกของนักศึกษา พบว่ามีปัจจัยที่เกี่ยวข้องในการตกออกของนักศึกษาจำนวน 10 ปัจจัย ได้แก่ เกรดเฉลี่ยรวม ปีที่เข้าศึกษา สาขาวิชา หลักสูตร อาชีพมารดา อาชีพบิดา คณะ ระดับการศึกษา ภาค และความถนัด/ความสามารถพิเศษ จากนั้นนำปัจจัยที่เกี่ยวข้องไปสร้างแบบจำลอง โดยใช้เทคนิคเหมืองข้อมูล 3 เทคนิค คือ เทคนิคต้นไม้ตัดสินใจ (Decision Tree) เทคนิคนาอีฟเบย์ (Naïve Bayes) และกฎการอุปนัย (Rule Induction) ในการทดสอบประสิทธิภาพของโมเดลด้วยวิธีการ 5-Fold Cross-Validation และ 10-Fold Cross-Validation ซึ่งวัดประสิทธิภาพแบบจำลองด้วยค่าความถูกต้อง (Accuracy) และค่าความผิดพลาด (Mean Absolute Error: MAE) ผลการทดสอบประสิทธิภาพพบว่าแบบจำลองที่ใช้เทคนิคต้นไม้ตัดสินใจได้ค่าสูงที่สุดในการแบ่งข้อมูลทดสอบ 10-Fold Cross-Validation ให้ค่าความถูกต้อง (Accuracy) 97.81% และค่าความผิดพลาด (MAE) เท่ากับ 0.026 ผู้วิจัยจึงได้ศึกษาออกแบบ และพัฒนาระบบในรูปแบบเว็บแอปพลิเคชัน ผลการประเมินระบบจากการสุ่มตัวอย่างข้อมูลมาทดสอบในระบบ ค่าเฉลี่ยรวมของการทำนายถูกต้องของระบบคิดเป็นร้อยละ 86.29%
Faculty of Informatics

บรรณานุกรม

EndNote

APA

Chicago

MLA

ดิจิตอลไฟล์

Digital File
DOI Smart-Search
สวัสดีค่ะ ยินดีให้บริการสอบถาม และสืบค้นข้อมูลตัวระบุวัตถุดิจิทัล (ดีโอไอ) สำนักการวิจัยแห่งชาติ (วช.) ค่ะ