|
Forecasting Dropout of Undergraduates Pibulsongkram Rajabhat University with Data Mining Technique |
|---|---|
| รหัสดีโอไอ | |
| Creator | Chutiphon Srisawat |
| Title | Forecasting Dropout of Undergraduates Pibulsongkram Rajabhat University with Data Mining Technique |
| Contributor | Tanaphorn Klaythong |
| Publisher | Faculty of Informatics, Mahasarakham University |
| Publication Year | 2566 |
| Journal Title | Journal of Applied Informatics and Technology |
| Journal Vol. | 5 |
| Journal No. | 1 |
| Page no. | 1-17 |
| Keyword | Fall off, Decision Tree, Naïve Bayes, Rule Induction |
| URL Website | https://ph01.tci-thaijo.org/index.php/jait/index |
| Website title | Journal of Applied Informatics and Technology (JIT) |
| ISSN | 2586-8136 |
| Abstract | Abstract:The objectives of this research were 1) to analyze characteristics and study factors related to the dropout of undergraduate students. Pibulsongkram Rajabhat University 2) to create a model and compare the efficiency of the model and 3) to develop a forecasting system for student dropout. The data of undergraduate students were obtained from the Education Services Division, Pibulsongkram Rajabhat University, between the 2015 and 2020 academic years, a total of 20,093 data sets containing 16 attributes. The filter approach feature selection method based on information gain was presented to analyze the factors affecting student dropout. It was found that ten factors influence student dropout, namely total GPA, year attended in university, programs of study, course of study, mother's occupation, father's occupation, faculty, educational level, region, and aptitude/talent. Then, the relevant factors were used to create the model using 3 data mining techniques: Decision Tree, Naïve Bayes, and Rule Induction technique. The model's performance was investigated using the 5-Fold Cross-Validation and 10-Fold Cross-Validation methods. The model's accuracy and mean absolute error (MAE) were also quantified. The results showed that the decision tree technique model had the highest value in the 10-Fold Cross-Validation. The accuracy and MAE of the model were 97.81% and 0.026, respectively. The researcher also designed and developed the model system using the form of a web application. The results from system evaluation data found the total mean of the correct prediction of the system. Accounted for 86.29%.บทคัดย่อ:งานวิจัยนี้มีวัตถุประสงค์เพื่อ 1) วิเคราะห์คุณลักษณะและศึกษาปัจจัยที่เกี่ยวข้องในการตกออกของนักศึกษาระดับปริญญาตรี มหาวิทยาลัยราชภัฏพิบูลสงคราม 2) สร้างโมเดลและเปรียบเทียบประสิทธิภาพของโมเดลและ 3) เพื่อพัฒนาระบบการพยากรณ์การตกออกของนักศึกษา โดยรวบรวมข้อมูลของนักศึกษาระดับปริญญาตรีจากกองบริการการศึกษา มหาวิทยาลัยราชภัฏพิบูลสงคราม ตั้งแต่ปีการศึกษา 2558-2563 จำนวนทั้งสิ้น 20,093 ชุดข้อมูล มีแอททริบิวต์ทั้งหมด 16 แอททริบิวต์ วิธีการคัดเลือกคุณลักษณะ (Feature Selection) ด้วยเทคนิค Filter Approach โดยใช้ค่า Information Gain ถูกนำมาประยุกต์ใช้เพื่อการวิเคราะห์หาปัจจัยที่มีผลต่อการตกออกของนักศึกษา พบว่ามีปัจจัยที่เกี่ยวข้องในการตกออกของนักศึกษาจำนวน 10 ปัจจัย ได้แก่ เกรดเฉลี่ยรวม ปีที่เข้าศึกษา สาขาวิชา หลักสูตร อาชีพมารดา อาชีพบิดา คณะ ระดับการศึกษา ภาค และความถนัด/ความสามารถพิเศษ จากนั้นนำปัจจัยที่เกี่ยวข้องไปสร้างแบบจำลอง โดยใช้เทคนิคเหมืองข้อมูล 3 เทคนิค คือ เทคนิคต้นไม้ตัดสินใจ (Decision Tree) เทคนิคนาอีฟเบย์ (Naïve Bayes) และกฎการอุปนัย (Rule Induction) ในการทดสอบประสิทธิภาพของโมเดลด้วยวิธีการ 5-Fold Cross-Validation และ 10-Fold Cross-Validation ซึ่งวัดประสิทธิภาพแบบจำลองด้วยค่าความถูกต้อง (Accuracy) และค่าความผิดพลาด (Mean Absolute Error: MAE) ผลการทดสอบประสิทธิภาพพบว่าแบบจำลองที่ใช้เทคนิคต้นไม้ตัดสินใจได้ค่าสูงที่สุดในการแบ่งข้อมูลทดสอบ 10-Fold Cross-Validation ให้ค่าความถูกต้อง (Accuracy) 97.81% และค่าความผิดพลาด (MAE) เท่ากับ 0.026 ผู้วิจัยจึงได้ศึกษาออกแบบ และพัฒนาระบบในรูปแบบเว็บแอปพลิเคชัน ผลการประเมินระบบจากการสุ่มตัวอย่างข้อมูลมาทดสอบในระบบ ค่าเฉลี่ยรวมของการทำนายถูกต้องของระบบคิดเป็นร้อยละ 86.29% |