![]() |
การแปลงกราฟีมภาษาอังกฤษเป็นโฟนีมภาษาไทย |
---|---|
รหัสดีโอไอ | |
Title | การแปลงกราฟีมภาษาอังกฤษเป็นโฟนีมภาษาไทย |
Creator | กฤตนันท์ พิทักษ์ภวัตกุล |
Contributor | อติวงศ์ สุชาโต, โปรดปราน บุณยพุกกณะ, ชัย วุฒิวิวัฒน์ชัย |
Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
Publication Year | 2555 |
Keyword | ภาษาไทย -- หน่วยเสียง, ภาษาอังกฤษ -- การถอดตัวอักษรเป็นภาษาไทย, การสังเคราะห์เสียง, ระบบประมวลผลเสียงพูด, Thai language -- Phonemics, English language -- Transliteration into Thai, Speech synthesis, Speech processing systems |
Abstract | ความเป็นธรรมชาติของเสียงสังเคราะห์เป็นเป้าหมายสำคัญของระบบสังเคราะห์เสียง (Text-to-speech system) ซึ่งกระบวนการสำคัญก็คือการหาคำอ่านของคำที่จะสังเคราะห์เสียง แต่ในระบบสังเคราะห์เสียงภาษาไทยการหาคำอ่านของคำภาษาอังกฤษไม่สามารถหาได้แบบตรงไปตรงมา ดังนั้นเพื่อให้ระบบสังเคราะห์เสียงภาษาไทยสามารถสังเคราะห์เสียงคำภาษาอังกฤษ ที่อาจจะปรากฏร่วมกับคำภาษาไทยได้นั้น จึงเสนอระบบการหาคำอ่านในหน่วยเสียงภาษาไทยจากคำภาษาอังกฤษ ซึ่งประกอบไปด้วย 3 กระบวนการหลัก คือ โมเดลการทำนายหน่วยเสียง กระบวนการประมวลผลหลังจากการทำนายหน่วยเสียง และโมเดลการทำนายเสียงวรรณยุกต์ โดยโมเดลการทำนายหน่วยเสียงใช้อัลกอริทึม ออนไลน์ดิสคริมิเนทีฟเทรนนิงเฟรมเวิร์ค (Online discriminative training framework) ในกระบวนการเรียนรู้ร่วมกับค่าลักษณะสำคัญต่างๆ ดังนี้ บริบท (Context) เอ็นแกรม (ngram) มาร์คอฟออร์เดอร์ (Markov order) ลิเนียร์เชน (Linear-chain) และจอยต์เอ็นแกรม (Joint n-gram) ในขณะที่กระบวนการประมวลผลหลังจากการทำนายหน่วยเสียง จะทำการแก้ไขหน่วยเสียงที่ผิดหลักพยางค์ในภาษาไทย และโมเดลการทำนายเสียงวรรณยุกต์อัลกอริทึมต้นไม้ (Classification and regression tree: CART) ในกระบวนการเรียนรู้ ร่วมกับค่าลักษณะสำคัญต่างๆ ที่เกี่ยวข้องกับหลักภาษาศาสตร์ ผลลัพธ์ความแม่นยำเฉลี่ย ในระดับพยางค์เท่ากับ 76.03%, ความแม่นยำเฉลี่ยในระดับคำเท่ากับ 53.93% และผลลัพธ์ในแง่ความพึงพอใจพบว่า 90.95% เป็นผลลัพธ์ที่ยอมรับได้ |
URL Website | cuir.car.chula.ac.th |