การรู้จำชื่อเฉพาะภาษาไทย : การศึกษาชื่อบุคคล สถานที่ และองค์กร
รหัสดีโอไอ
Title การรู้จำชื่อเฉพาะภาษาไทย : การศึกษาชื่อบุคคล สถานที่ และองค์กร
Creator ศศิวิมล กาลันสีมา
Contributor วิโรจน์ อรุณมานะกุล
Publisher จุฬาลงกรณ์มหาวิทยาลัย
Publication Year 2553
Keyword ภาษาศาสตร์คอมพิวเตอร์, การประมวลผลภาษาธรรมชาติ (คอมพิวเตอร์), ภาษาไทย -- คำและวลี, การรู้จำอักขระ (คอมพิวเตอร์), Computational linguistics, Natural language processing ‪(Computer science)‬, Thai language -- Word formation, Character recognition
Abstract ศึกษาวิเคราะห์รูปแบบและโครงสร้างของชื่อบุคคล สถานที่ และองค์กร งานวิจัยนี้ใช้คลังข้อมูลขนาด 80,513 คำ เก็บข้อมูลข่าวภาษาไทยจากคลังข้อมูลภาษาไทยแห่งชาติ ประกอบด้วยชื่อบุคคล 762 ชื่อ ชื่อสถานที่ 774 ชื่อ และชื่อองค์กร 1,418 ชื่อ รูปแบบและโครงสร้างของชื่อบุคคลส่วนใหญ่ประกอบด้วยชื่อและนามสกุล (66.54%) ตามด้วยชื่อเพียงอย่างเดียว (33.46%) รูปแบบและโครงสร้างของชื่อสถานที่และชื่อองค์กรมีความซับซ้อนกว่าชื่อบุคคล โครงสร้างของชื่อสถานที่ที่ใช้มากที่สุด ได้แก่ ชื่อสถานที่ที่เกิดจากคำประกอบกันในโครงสร้างความสัมพันธ์แบบชั้นเดียว (50%) และชื่อสถานที่แบบคำเดี่ยว (29.93%) ตามลำดับ โครงสร้างของชื่อองค์กรที่พบมากที่สุด 2 แบบ ได้แก่ ชื่อองค์กรที่เกิดจากคำหลายคำประกอบกันในโครงสร้างความสัมพันธ์แบบหลายชั้นและชั้นเดียวตามลำดับ (28% และ 22.59%) เมื่อมีการใช้ชื่อเฉพาะในบริบทต่อเนื่อง พบว่าชื่อเฉพาะ 34.22% ไม่มีการเปลี่ยนรูป ในขณะที่ 65.78% มีการเปลี่ยนรูปไป การเปลี่ยนรูปที่พบ ได้แก่ การลดองค์ประกอบและการใช้อักษรย่อ คิดเป็น 58.36% และ 33.45% ตามลำดับ ผลการศึกษาการอ้างข้ามประเภท พบการใช้ชื่อองค์กรอ้างถึงสถานที่ 30.93% และชื่อสถานที่อ้างถึงองค์กร 69.07% โดยคำบุพบทและคำกริยาที่ปรากฏในตำแหน่งหน้าหลังของชื่อเฉพาะแบบอ้างข้ามประเภท ไม่มีน้ำหนักในการบ่งชี้การอ้างข้ามประเภท เนื่องจากมีการปรากฏร่วมกับคำอื่นๆ ในคลังข้อมูลเป็นจำนวนมากกว่า
URL Website cuir.car.chula.ac.th
Chulalongkorn University

บรรณานุกรม

EndNote

APA

Chicago

MLA

ดิจิตอลไฟล์

Digital File #1
DOI Smart-Search
สวัสดีค่ะ ยินดีให้บริการสอบถาม และสืบค้นข้อมูลตัวระบุวัตถุดิจิทัล (ดีโอไอ) สำนักการวิจัยแห่งชาติ (วช.) ค่ะ