![]() |
การศึกษาประสิทธิภาพของ Tesseract OCR สำหรับการประมวลผลภาพในการตรวจสอบธุรกรรมทางการเงิน |
---|---|
รหัสดีโอไอ | |
Creator | ก่องกาญจน์ ดุลยไชย |
Title | การศึกษาประสิทธิภาพของ Tesseract OCR สำหรับการประมวลผลภาพในการตรวจสอบธุรกรรมทางการเงิน |
Contributor | ณรงค์เกียรติ นามห้วยทอง, ไตรภาค สิทธิแก้ว, อรรถวิท ชังคมานนท์ และ สมนึก สินธุปวน |
Publisher | มหาวิทยาลัยแม่โจ้ |
Publication Year | 2568 |
Journal Title | วารสารแม่โจ้เทคโนโลยีสารสนเทศและนวัตกรรม |
Journal Vol. | 11 |
Journal No. | 2 |
Page no. | 156 ถึง 171 |
Keyword | Tesseract OCR, การประมวลผลภาพ, Sauvola Threshold, การตรวจสอบธุรกรรมทางการเงิน, ความแม่นยำการรู้จำตัวอักษร |
URL Website | https://mitij.mju.ac.th/ |
Website title | วารสารแม่โจ้เทคโนโลยีสารสนเทศและนวัตกรรม |
ISSN | ISSN 3027-7280 (Online) |
Abstract | งานวิจัยนี้มุ่งพัฒนาประสิทธิภาพของ Tesseract OCR สำหรับการตรวจสอบธุรกรรมทางการเงิน โดยศึกษาและเปรียบเทียบรหัสชุดประมวลผลภาพ 5 รูปแบบ ได้แก่ Image Preprocessor Alpha (IPPA), IPP2, IPP6, IPP7 และ IPP12 (Disintegration, n.d.) การวิจัยดำเนินการผ่านสองขั้นตอนหลัก คือ การทดสอบความแม่นยำบนใบเสร็จการโอนเงินจำนวน 116 รายการ และการประเมินประสิทธิภาพการประมวลผลกับชุดข้อมูล 250, 500, 1,000 และ 1,500 รายการ ผลการศึกษาพบว่ารหัสชุดประมวลผลภาพ IPP12 ซึ่งประกอบด้วยเทคนิค Grayscale, Resize, Contrast และ Sauvola Threshold มีประสิทธิภาพสูงสุด โดยเฉพาะเทคนิค Sauvola Threshold ที่สามารถรวมเทคนิคการประมวลผลอื่นๆ ให้อยู่ในวิธีเดียว การวัดประสิทธิภาพด้วย Confusion Matrix แสดงผลลัพธ์ที่อยู่ในเกณฑ์ที่ยอมรับได้ โดยประกอบด้วย Accuracy 81.03% Precision 82.14% Recall 90.79% และค่าดัชนี F1-Score 86.26% การทดสอบประสิทธิภาพด้วยภาษา GO พบว่าระบบใช้เวลาประมวลผลเฉลี่ย 5.313 วินาที ใช้หน่วยความจำ 0.277 GB และจัดสรรพื้นที่ 5.47M งานวิจัยนี้ชี้ให้เห็นความสำคัญของการเลือกเทคนิคประมวลผลภาพที่เหมาะสมในการเพิ่มประสิทธิภาพการตรวจสอบเอกสารทางการเงิน |