|
การจำแนกประเภทข้อความในภาษาไทยโดยใช้นิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษร |
|---|---|
| รหัสดีโอไอ | |
| Title | การจำแนกประเภทข้อความในภาษาไทยโดยใช้นิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษร |
| Creator | ธนภัทร์ คุ้มสุภา |
| Contributor | พีรพล เวทีกูล |
| Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
| Publication Year | 2559 |
| Keyword | นิวรัลเน็ตเวิร์ค (วิทยาการคอมพิวเตอร์), การประมวลผลข้อความ, Neural networks (Computer science), Text processing (Computer science) |
| Abstract | นิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษรเป็นวิธีการจำแนกประเภทข้อความที่มีประสิทธิภาพ วิธีการนี้ใช้การเรียนรู้ข้อความจากระดับตัวอักษร เมื่อนำมาใช้กับการจำแนกประเภทข้อความในภาษาไทยแล้ว จะทำให้สามารถจำแนกข้อความได้โดยไม่ต้องใช้ขั้นตอนการตัดคำ ทั้งนี้ นิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษรดั้งเดิมนั้นมีการจำกัดข้อความอยู่ที่ 1,014 ตัวอักษร ตัวอักษรส่วนเกินในข้อความตั้งต้นจะถูกตัดออกและไม่ถูกนำไปใช้ ในวิทยานิพนธ์ฉบับนี้จึงได้ทำการปรับปรุงโครงสร้างของนิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษรให้สามารถรองรับข้อมูลความยาวใด ๆ โดยที่ยังคงใช้จำนวนพารามิเตอร์อื่น ๆ คงเดิม ผลการทดลองกับข้อมูลข่าวภาษาไทยแสดงให้เห็นว่า วิธีการที่เสนอไปนั้นสามารถเพิ่มความแม่นยำให้กับการจำแนกได้เมื่อเปรียบเทียบกับวิธีการดั้งเดิม นอกจากนี้ นิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษรที่เสนอนั้นยังให้ความแม่นยำในการจำแนกที่สูงกว่าวิธีการที่ได้รับความนิยมอื่น ๆ เช่น นาอีฟเบย์ แมกซิมัมเอนโทรปี และซัพพอร์ตเวกเตอร์แมชชีน โดยมีเพียงวิธีนิวรอลเน็ตเวิร์กคอนโวลูชันระดับคำเท่านั้น ที่ให้ความแม่นยำมากกว่าประมาณ 0.5% ทั้งนี้ การใช้นิวรอลเน็ตเวิร์กคอนโวลูชันระดับตัวอักษรมีข้อดีคือประสิทธิภาพของของการจำแนกจะไม่ขึ้นอยู่กับประสิทธิภาพของการตัดคำ |
| URL Website | cuir.car.chula.ac.th |