![]() |
การเปรียบเทียบวิธีการใส่ค่าสูญหายสำหรับอนุกรมเวลาเชิงพหุ กรณีศึกษาดัชนีราคากลุ่มอุตสาหกรรมตลาดหลักทรัพย์แห่งประเทศไทย |
---|---|
รหัสดีโอไอ | |
Creator | พงษ์พล ยิ่งประทานพร |
Title | การเปรียบเทียบวิธีการใส่ค่าสูญหายสำหรับอนุกรมเวลาเชิงพหุ กรณีศึกษาดัชนีราคากลุ่มอุตสาหกรรมตลาดหลักทรัพย์แห่งประเทศไทย |
Publisher | คณะวิทยาศาสตร์ มหาวิทยาลัยขอนแก่น |
Publication Year | 2568 |
Journal Title | KKU Science Journal |
Journal Vol. | 53 |
Journal No. | 2 |
Page no. | 134-148 |
Keyword | ข้อมูลสูญหาย, รูปแบบของการสูญหาย, การใส่ค่าสูญหาย, อนุกรมเวลาเชิงพหุ, การเปรียบเทียบประสิทธิภาพ |
URL Website | https://ph01.tci-thaijo.org/index.php/KKUSciJ |
Website title | Thai Journal Online (ThaiJO) |
ISSN | 3027-6667 |
Abstract | การศึกษานี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการใส่ค่าสูญหายสำหรับอนุกรมเวลาเชิงพหุ และประเมินผลเพื่อเลือกวิธีการใส่ค่าสูญหายที่เหมาะสมที่สุดสำหรับอนุกรมเวลาเชิงพหุ โดยใช้ข้อมูลทุติยภูมิดัชนีราคากลุ่มอุตสาหกรรมของตลาดหลักทรัพย์แห่งประเทศไทย 8 กลุ่มอุตสาหกรรม จากฐานข้อมูล SETSMART ตั้งแต่วันที่ 1 มกราคม พ.ศ. 2547 ถึง 1 มกราคม พ.ศ. 2567 รวมทั้งสิ้น 4,877 วัน ซึ่งได้มีการกำหนดรูปแบบการสูญหายออกเป็น 3 รูปแบบ ได้แก่ การสูญหายรูปแบบสุ่ม การสูญหายรูปแบบช่วงตามลำดับ และการสูญหายรูปแบบบล็อก และกำหนดสัดส่วนการสูญหายของข้อมูลที่ร้อยละ 5 10 20 30 40 และ 50 ตามลำดับ โดยจำแนกวิธีการใส่ค่าสูญหายออกเป็น 3 วิธี ได้แก่ วิธีการใส่ค่าสูญหายด้วยวิธีการเชิงสถิติ ประกอบไปด้วย ค่าเฉลี่ย ค่ามัธยฐาน ข้อมูลสุดท้ายก่อนการสูญหาย (LOCF) ข้อมูลล่าสุดหลังการสูญหาย (NOCB) และการประมาณค่าช่วงเส้นตรง (Linear Interpolation) วิธีการใส่ค่าสูญหายด้วยวิธีการเรียนรู้ของเครื่อง ประกอบไปด้วย ค่าคาดหวังสูงที่สุด (EM) การใส่ค่าสูญหายด้วยการทดแทนแบบพหุคูณด้วยสมการลูกโซ่ (MICE) เพื่อนบ้านใกล้เคียงที่สุด (KNN) และป่าสุ่ม (Random Forest) และวิธีการใส่ค่าสูญหายด้วยวิธีการเรียนรู้เชิงลึก ประกอบไปด้วย GP-VAE USGAN และ SAITS โดยผู้วิจัยเปรียบเทียบประสิทธิภาพของวิธีการใส่ค่าสูญหายด้วยค่ารากที่สองของค่าความคลาดเคลื่อนกำลังสองโดยเฉลี่ย (RMSE) ค่าความคลาดเคลื่อนสัมบูรณ์โดยเฉลี่ย (MAE) และค่าร้อยละความคลาดเคลื่อนสัมบูรณ์โดยเฉลี่ย (MAPE) ผลการศึกษาพบว่า ทุกรูปแบบการสูญหาย กรณีเมื่อสัดส่วนการสูญหายน้อยกว่าร้อยละ 50 การใส่ค่าสูญหายด้วยวิธีการเชิงสถิติโดยการประมาณค่าช่วงเส้นตรง (Linear Interpolation) จะมีประสิทธิภาพสูงที่สุด ส่วนกรณีสัดส่วนการสูญหายเท่ากับร้อยละ 50 พบว่าการใส่ค่าสูญหายด้วยวิธีการเรียนรู้ของเครื่องโดยวิธีป่าสุ่ม (Random Forest) มีประสิทธิภาพสูงที่สุด |