|
การจัดเส้นทางบนพื้นฐานของการเรียนรู้แบบเสิรมแรงด้วยเร็พพิวเทชันของเส้นทางในโครงข่ายเซนเซอร์ไร้สาย เพื่อการประยุกต์ใช้ในการเตือนเหตุอุทกภัย |
|---|---|
| รหัสดีโอไอ | |
| Title | การจัดเส้นทางบนพื้นฐานของการเรียนรู้แบบเสิรมแรงด้วยเร็พพิวเทชันของเส้นทางในโครงข่ายเซนเซอร์ไร้สาย เพื่อการประยุกต์ใช้ในการเตือนเหตุอุทกภัย |
| Creator | ณัฐธิดา ขาวสะอาด |
| Contributor | ชัยเชษฐ์ สายวิจิตร |
| Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
| Publication Year | 2557 |
| Keyword | ระบบเตือนภัยธรรมชาติ, เครือข่ายตัวรับรู้ไร้สาย, คณิตศาสตร์วิศวกรรม, แบบจำลองทางภูมิศาสตร์, Natural disaster warning systems, Wireless sensor networks, Engineering mathematics, Relief models |
| Abstract | วิทยานิพนธ์นี้มีจุดมุ่งหมายเพื่อพัฒนากรอบการวิเคราะห์เชิงคณิตศาสตร์เพื่อใช้ในการพัฒนาการเรียนรู้แบบอัตโนมัติเพื่อช่วยในกระบวนการตัดสินใจเลือกเส้นทางในโครงข่ายเซนเซอร์ไร้สายโดยประยุกต์ใช้ในระบบเตือนภัยอุทกภัย ซึ่งกระบวนการเรียนรู้ที่นำมาใช้คือการเรียนรู้แบบเสริมแรง (Reinforcement learning: RL) โดยเส้นทางที่ดีที่สุดจะถูกหาผ่านจากนโยบายซึ่งประเมินจากค่าของแอคชั่นแวลู่ฟังก์ชันโดยทดสอบผ่านโครงข่ายขนาดเล็กที่ระบบมีการเปลี่ยนแปลงแบบคงที่และโครงข่ายขนาดใหญ่แบบที่ระบบมีการเปลี่ยนแปลงแบบไม่คงที่ การประยุกต์ใช้วิธีการแบบมอนติคาร์โลในระบบเตือนภัยอุทกภัย โดยมีการนำมาใช้เพื่อช่วยในการตัดสินใจเลือกเส้นทางที่ดีที่สุดในโครงข่ายขนาดเล็กที่มีการควบคุมเงื่อนไขบังคับ (constraints) ทั้งหมดสามตัวแปรได้แก่ระดับพลังงาน อายุการใช้งาน และค่าเร็พพิวเทชันของเส้นทาง โดยค่าตัวแปรเงื่อนไขทั้งสามตัวได้ถูกนำมาพิจารณาเป็นเงื่อนไขสำคัญในโครงข่ายขนาดเล็ก โดยค่าเร็พพิวเทชันของเส้นทางเป็นตัวแปรสำคัญเพื่อทำให้การตัดสินใจเลือกเส้นทางนั้นสามารถหลีกเลี่ยงโอกาสของโนดที่จะเป็นจุดปัญหา (single point of failure) ของระบบได้ ผลการทดลองที่ได้พบว่าการนำวิธีการมอนติคาร์โลมาประยุกต์ใช้ในโครงข่ายขนาดเล็กสามารถทำงานได้อย่างมีประสิทธิภาพและทำการพิจารณาในโครงข่ายขนาดใหญ่เป็นลำดับถัดไป การทดสอบในระบบโครงข่ายขนาดใหญ่ได้มีการพัฒนาแนวคิดด้วยการเพิ่มขีดความสามารถของวิธีการมอนติคาร์โลโดยการปรับเปลี่ยนตัวแปรสถานะจากมอนติคาร์โลอย่างง่าย ที่ไม่ได้นำข้อมูลที่เกี่ยวข้องกับระบบมารวมเข้ากับตัวแปรสถานะให้นำเข้ามาพิจารณาร่วมเพื่อปรับปรุงนโยบายของการเลือกเส้นทางที่จะเปลี่ยนไป โดยการทดสอบได้นำเข้าสู่การพิจารณาเรื่องของผลกระทบของฟังก์ชันผลรางวัลต่อการตัดสินใจของมอนติคาร์โลในสถานการณ์ต่างๆ และการกระจายภาระงานที่เหมาะสม (optimal load balancing) โดยพบว่าสำหรับตัวแปรสถานะที่มีค่าพลังงานปัจจุบันและค่าเร็พพิวเทชัน และการใช้ฟังก์ชันผลรางวัลที่มีสามตัวแปร ที่มีการถ่วงน้ำหนักอย่างเท่าเทียม เช่นเดียวกับในโครงข่ายขนาดเล็กเป็นหนึ่งในคำตอบที่เป็นไปได้และในการทดลองลำดับสุดท้ายจะเป็นการพิจารณาเปรียบเทียบความสามารถในการรักษาการเชื่อมต่อของโครงข่ายได้โดยทำการเปรียบเทียบกับวิธีการที่มีอยู่เดิมซึ่งพบว่าความสำคัญของการเพิ่มโอกาสเลือกตัวกระทำใหม่โดยเปิดโอกาสให้ระบบเข้าถึงทุกสภาวะของสถานะจะเป็นวิธีที่เหมาะสมที่สุดในระบบที่มีการเปลี่ยนแปลงสูง เมื่อพิจารณาเปรียบเทียบกับวิธีอื่นจะพบว่าความสามารถในการรักษาการเชื่อมต่อของโครงข่ายนั้นดีขึ้นถึง 20% เมื่อเทียบกับวิธีมาตรฐานจากการเลือกเส้นทางที่สั้นที่สุด สำหรับการพิจารณาในด้านของความซับซ้อนของระบบเมื่อเทียบกับวิธีการที่นำเสนอและข้อจำกัดในการนำวิธีการมอนติคาร์โลไปใช้รวมถึงข้อเสนอของงานวิจัยในอนาคตได้ถูกแสดงในวิทยานิพนธ์ฉบับนี้ |
| URL Website | cuir.car.chula.ac.th |