|
การรู้จำชื่อเฉพาะภาษาไทย: การศึกษาชื่อผลิตภัณฑ์ในข่าวเศรษฐกิจ |
|---|---|
| รหัสดีโอไอ | |
| Title | การรู้จำชื่อเฉพาะภาษาไทย: การศึกษาชื่อผลิตภัณฑ์ในข่าวเศรษฐกิจ |
| Creator | ณัฐดาพร เลิศชีวะ |
| Contributor | วิโรจน์ อรุณมานะกุล |
| Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
| Publication Year | 2553 |
| Keyword | ชื่อตราผลิตภัณฑ์, การประมวลผลภาษาธรรมชาติ (คอมพิวเตอร์), Brand name products, Natural language processing (Computer science) |
| Abstract | วิเคราะห์รูปแบบชื่อผลิตภัณฑ์ภาษาไทยที่ปรากฏในข่าวเศรษฐกิจ โดยมีสมมติฐานว่าผลที่ได้จากงานวิจัยจะเป็นประโยชน์ต่อการระบุขอบเขต และประเภทของชื่อผลิตภัณฑ์ในงานการรู้จำชื่อเฉพาะภาษาไทย การวิจัยนี้ได้เก็บรวบรวมชื่อผลิตภัณฑ์ 2,463 ชื่อ จากคลังข้อมูลข่าวเศรษฐกิจภาษาไทย 178,474 คำ ผลการวิจัยแสดงให้เห็นว่า ชื่อผลิตภัณฑ์ภาษาไทยประกอบด้วยองค์ประกอบต่างๆ ดังนี้ คำบอกชนิดผลิตภัณฑ์ คำบ่งบอกชื่อตราสินค้า ชื่อตราสินค้า คำบ่งบอกชื่อประเภทของผลิตภัณฑ์ และชื่อประเภทของผลิตภัณฑ์ โดยที่ชื่อตราสินค้าและชื่อประเภทของผลิตภัณฑ์เป็นองค์ประกอบหลักของชื่อผลิตภัณฑ์ การปรากฏร่วมกันขององค์ประกอบต่างๆ ทำให้เกิดรูปแบบชื่อผลิตภัณฑ์ 32 รูปแบบ ซึ่งแบ่งได้เป็น 4 กลุ่มคือ ชื่อผลิตภัณฑ์ที่ปรากฏแต่คำหลัก (ชื่อตราสินค้าหรือชื่อประเภทของผลิตภัณฑ์) คำหลักปรากฏอยู่ตำแหน่งหน้าสุด คำหลักปรากฏอยู่ที่ตำแหน่งตรงกลาง และคำหลักปรากฏอยู่ตำแหน่งท้ายสุด จากการศึกษาพบว่า ชื่อผลิตภัณฑ์ที่ปรากฏแต่คำหลัก และคำหลักปรากฏอยู่ตำแหน่งท้ายสุดเป็นรูปแบบที่ปรากฏใช้มากที่สุด คือปรากฏพบเป็นจำนวน 43.32% และ 41.41% ตามลำดับ นอกจากนี้การศึกษาเรื่องคำปรากฏร่วมแสดงให้เห็นว่า ผลการศึกษายังไม่สามารถนำไปใช้ระบุตำแหน่งชื่อผลิตภัณฑ์ได้ดีมากนัก เมื่อมีการอ้างถึงชื่อผลิตภัณฑ์เดียวกันสองครั้งในข่าว รูปแบบชื่อผลิตภัณฑ์ที่พบส่วนใหญ่จะเป็นรูปแบบเดียวกัน หรือรูปแบบการลดองค์ประกอบ สำหรับชื่อผลิตภัณฑ์ที่มีการอ้างถึงในข่าวมากกว่าสองครั้ง มักใช้รูปแบบชื่อผลิตภัณฑ์ที่สลับไปมาตามบริบท การระบุประเภทของผลิตภัณฑ์สามารถใช้องค์ประกอบภายนอกหรือองค์ประกอบภายในชื่อผลิตภัณฑ์ ที่ดูเหมือนว่ามีประสิทธิภาพในการระบุประเภทผลิตภัณฑ์ได้มากกว่า องค์ประกอบภายนอกหรือบริบทโดยรอบชื่อผลิตภัณฑ์ |
| URL Website | cuir.car.chula.ac.th |