![]() |
การค้นคืนข้อมูลจากแฟ้มข้อมูลเสียงภาษาไทยด้วยข้อคำถามเสียง |
---|---|
รหัสดีโอไอ | |
Title | การค้นคืนข้อมูลจากแฟ้มข้อมูลเสียงภาษาไทยด้วยข้อคำถามเสียง |
Creator | ภูเบศ โต๊ะลง |
Contributor | โชติรัตน์ รัตนามหัทธนะ |
Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
Publication Year | 2549 |
Keyword | การรู้จำเสียงพูดอัตโนมัติ, ระบบประมวลผลเสียงพูด, ระบบมัลติมีเดีย, ระบบการจัดเก็บและค้นข้อสนเทศ |
Abstract | ปัจจุบันข้อมูลสื่อประสมได้เพิ่มปริมาณขึ้นอย่างรวดเร็วและมีหลายรูปแบบ ทั้งที่อยู่ในรูปแฟ้มข้อมูลเสียง แฟ้มข้อมูลวีดิทัศน์ และแฟ้มข้อมูลภาพ ซึ่งแฟ้มข้อมูลสื่อประสมแต่ละแบบมีวิธีการค้นคืนหลากหลายวิธี งานวิจัยนี้สนใจและเลือกที่จะศึกษาวิธีการที่จะค้นคืนข้อมูลภายในแฟ้มข้อมูลเสียงภาษาไทยขนาดใหญ่ เช่น แฟ้มข้อมูลเสียงสื่อการเรียนการสอนอิเล็กทรอนิกส์ แฟ้มข้อมูลเสียงการอ่านหนังสือ เป็นต้น ปัจจุบันวิธีที่ได้รับความนิยมในการค้นคืนข้อมูลภายในแฟ้มข้อมูลเสียงมักใช้วิธีการสืบค้นด้วยคำหลัก ชื่อเรื่องหรือชื่อผู้แต่ง ซึ่งวิธีการดังกล่าวเป็นการค้นคืนด้วยการพิมพ์ หรือแม้แต่การพูดข้อคำถามเสียงเข้าไปเพื่อค้นหาจากรายการที่มีอยู่ โดยใช้กระบวนการรู้จำคำพูดในการค้นคืนข้อมูลเสียง แต่การใช้กระบวนการรู้จำคำพูดมีข้อจำกัดในเรื่องของเวลาที่ใช้ในการค้นคืน ซึ่งใช้เวลานานในกรณีที่แฟ้มฐานข้อมูลเสียงมีขนาดใหญ่ ดังนั้นงานวิจัยนี้จึงมุ่งเน้นในการค้นคืนข้อมูลเสียงจากแฟ้มข้อมูลเสียงภาษาไทยขนาดใหญ่ ซึ่งเวลาที่ใช้ในการทำงานเป็นเวลาที่ผู้ใช้ยอมรับได้ โดยมีความแม่นยำอยู่ในระดับดี และเนื่องจากภาษาไทยมีการผันวรรณยุกต์ 5 ระดับเสียงต่างกัน คือ สามัญ เอก โท ตรี และจัตวา ผู้เขียนจึงได้เลือกใช้เสียงวรรณยุกต์ในภาษาไทยนี้เข้ามาช่วยในการแยกคำ ซึ่งวรรณยุกต์ในแต่ละพยางค์ของคำก็จะให้ค่าความถี่มูลฐานต่างกัน และสามารถนำเอาคุณลักษณะพิเศษของเสียงในภาษาไทยนี้ มาใช้ในการค้นหาคำจากข้อคำถามเสียง โดยใช้วิธีวัดระยะทางแบบไดนามิกไทม์วอร์ปปิง เพื่อช่วยเพิ่มความแม่นยำในการเปรียบเทียบ สัญญานเสียงจากข้อคำถามกับเสียงในแฟ้มฐานข้อมูล จากการทดลองพบว่า วิธีดังกล่าวสามารถค้นคืนข้อมูลเสียงได้ถูกต้องคิดเป็น 59% |
URL Website | cuir.car.chula.ac.th |