|
การรู้จำชื่อเฉพาะภาษาไทย : การศึกษาชื่อบุคคล สถานที่ และองค์กร |
|---|---|
| รหัสดีโอไอ | |
| Title | การรู้จำชื่อเฉพาะภาษาไทย : การศึกษาชื่อบุคคล สถานที่ และองค์กร |
| Creator | ศศิวิมล กาลันสีมา |
| Contributor | วิโรจน์ อรุณมานะกุล |
| Publisher | จุฬาลงกรณ์มหาวิทยาลัย |
| Publication Year | 2553 |
| Keyword | ภาษาศาสตร์คอมพิวเตอร์, การประมวลผลภาษาธรรมชาติ (คอมพิวเตอร์), ภาษาไทย -- คำและวลี, การรู้จำอักขระ (คอมพิวเตอร์), Computational linguistics, Natural language processing (Computer science), Thai language -- Word formation, Character recognition |
| Abstract | ศึกษาวิเคราะห์รูปแบบและโครงสร้างของชื่อบุคคล สถานที่ และองค์กร งานวิจัยนี้ใช้คลังข้อมูลขนาด 80,513 คำ เก็บข้อมูลข่าวภาษาไทยจากคลังข้อมูลภาษาไทยแห่งชาติ ประกอบด้วยชื่อบุคคล 762 ชื่อ ชื่อสถานที่ 774 ชื่อ และชื่อองค์กร 1,418 ชื่อ รูปแบบและโครงสร้างของชื่อบุคคลส่วนใหญ่ประกอบด้วยชื่อและนามสกุล (66.54%) ตามด้วยชื่อเพียงอย่างเดียว (33.46%) รูปแบบและโครงสร้างของชื่อสถานที่และชื่อองค์กรมีความซับซ้อนกว่าชื่อบุคคล โครงสร้างของชื่อสถานที่ที่ใช้มากที่สุด ได้แก่ ชื่อสถานที่ที่เกิดจากคำประกอบกันในโครงสร้างความสัมพันธ์แบบชั้นเดียว (50%) และชื่อสถานที่แบบคำเดี่ยว (29.93%) ตามลำดับ โครงสร้างของชื่อองค์กรที่พบมากที่สุด 2 แบบ ได้แก่ ชื่อองค์กรที่เกิดจากคำหลายคำประกอบกันในโครงสร้างความสัมพันธ์แบบหลายชั้นและชั้นเดียวตามลำดับ (28% และ 22.59%) เมื่อมีการใช้ชื่อเฉพาะในบริบทต่อเนื่อง พบว่าชื่อเฉพาะ 34.22% ไม่มีการเปลี่ยนรูป ในขณะที่ 65.78% มีการเปลี่ยนรูปไป การเปลี่ยนรูปที่พบ ได้แก่ การลดองค์ประกอบและการใช้อักษรย่อ คิดเป็น 58.36% และ 33.45% ตามลำดับ ผลการศึกษาการอ้างข้ามประเภท พบการใช้ชื่อองค์กรอ้างถึงสถานที่ 30.93% และชื่อสถานที่อ้างถึงองค์กร 69.07% โดยคำบุพบทและคำกริยาที่ปรากฏในตำแหน่งหน้าหลังของชื่อเฉพาะแบบอ้างข้ามประเภท ไม่มีน้ำหนักในการบ่งชี้การอ้างข้ามประเภท เนื่องจากมีการปรากฏร่วมกับคำอื่นๆ ในคลังข้อมูลเป็นจำนวนมากกว่า |
| URL Website | cuir.car.chula.ac.th |