|
การเปรียบเทียบวิธีคัดกรองตัวแปรสำหรับข้อมูลที่มีมิติสูง |
|---|---|
| รหัสดีโอไอ | |
| Title | การเปรียบเทียบวิธีคัดกรองตัวแปรสำหรับข้อมูลที่มีมิติสูง |
| Creator | ทวีศักดิ์ เล็กตระกูลชัย |
| Contributor | วิฐรา พึ่งพาพงศ์ |
| Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
| Publication Year | 2559 |
| Keyword | การวิเคราะห์การถดถอย, การถดถอยริดจ์, Regression analysis, Ridge regression (Statistics) |
| Abstract | งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีคัดกรองตัวแปรอิสระจากวิธีการวิเคราะห์การถดถอยพหุเชิงเส้น วิธีลาสโซ วิธีการกรองตัวแปรที่เป็นอิสระโดยการคงตัวแปรที่สำคัญ วิธีการกรองตัวแปรที่เป็นอิสระโดยการคงตัวแปรที่สำคัญด้วยค่าความสัมพันธ์ของระยะห่าง และวิธีการกรองตัวแปรด้วยการถดถอยริดจ์แบบวนซ้ำ สำหรับข้อมูลที่มีมิติสูง โดยการจำลองข้อมูลที่มีขอบเขตต่างๆ กัน โดยที่กำหนดจำนวนตัวแปรอิสระเป็น 1000 , 2000 และ 4000 ซึ่งความสัมพันธ์ของตัวแปรอิสระเป็น 0.5 และ 0.9 ทั้งนี้จะใช้ค่าความถูกต้องในการคัดกรองตัวแปร ค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของจำนวนตัวแปรอิสระที่น้อยที่สุดของเซตตัวแปรอิสระที่ผ่านการคัดกรอง ที่ทำให้เซตตัวแปรอิสระที่แท้จริงเป็นสับเซตของเซตตัวแปรอิสระที่ผ่านการคัดกรอง เป็นเครื่องมือในการเปรียบเทียบและวัดประสิทธิภาพ จากการศึกษาภายใต้ขอบเขตดังกล่าวผลปรากฏว่าวิธีลาสโซ สามารถคัดกรองตัวแปรได้มีประสิทธิภาพมากที่สุด รองลงมาคือวิธีการวิเคราะห์การถดถอยพหุเชิงเส้น วิธีการกรองตัวแปรที่เป็นอิสระโดยการคงตัวแปรที่สำคัญกับวิธีการกรองตัวแปรที่เป็นอิสระโดยการคงตัวแปรที่สำคัญด้วยค่าความสัมพันธ์ของระยะห่างมีความสามารถเท่าเทียมกัน และวิธีการกรองตัวแปรด้วยการถดถอยริดจ์แบบวนซ้ำเป็นวิธีที่มีประสิทธิภาพที่น้อยที่สุด |
| URL Website | cuir.car.chula.ac.th |