การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง	:	การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย
นักวิจัย	:	ชาญฤทธิ์ สันตินานาเลิศ
คำค้น	:	CHARACTER RECOGNITION , CHARACTER SEGMENTATION , BACKPROPAGATION , NEURAL NETWORKS , ERROR CORRECTION , NON-WORD ERROR , REAL-WORD ERROR
หน่วยงาน	:	ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน	:	-
ปีพิมพ์	:	2542
อ้างอิง	:	http://www.thaithesis.org/detail.php?id=1082542001015
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	วิทยานิพนธ์ฉบับนี้มีวัตถุประสงค์เพื่อออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย เพื่อใช้ในการรู้จำตัวอักษรพิมพ์ในเอกสารภาษาไทยที่พิมพ์จากเครื่องคอมพิวเตอร์ด้วยแบบตัวอักษรมาตราฐานวิทยานิพนธ์ฉบับนี้นำเสนอวิธีการต่างๆ เพื่อใช้ในโปรแกรมโอซีอาร์ภาษาไทยคือ วิธีการประมวลผลภาพ, วิธีการตัดแยกตัวอักษร, วิธีการแยกลักษณะสำคัญของตัวอักษรแบบ เค-แอล ทรานส์ฟอร์ม,วิธีการแยกแยะตัวอักษรแบบแบคพรอพาเกชันนิวรอลเน็ตเวิร์กและวิธีการแก้ไขคำที่สะกดผิดแบบไตรแกรมของประเภทของคำ ขั้นตอนในการทำงานของโปรแกรมโอซีอาร์ภาษาไทยที่พัฒนาขึ้นนี้ประกอบด้วย ขั้นตอนการนำเอกสารเข้าสู่โปรแกรม, ขั้นตอนการประมวลผลภาพ, ขั้นตอนการตัดแยกบรรทัด, ขั้นตอนการตัดแยกตัวอักษร,ขั้นตอนการรู้จักตัวอักษร, ขั้นตอนการแก้ไขผลลัพธ์ที่ได้จากขั้นตอนการรู้จำ, ขั้นตอนการสร้างบรรทัดและขั้นตอนการแก้ไขคำผิด ในวิทยานิพนธ์ฉบับนี้ ได้นำภาพตัวอักษรและภาพของเอกสารที่ได้จากการพิมพ์ด้วยเครื่องพิมพ์เลเซอร์ที่ความละเอียด 600 จุดต่อนิ้ว นำเอกสารมาอ่านผ่านเครื่องสแกนเนอร์ที่ความละเอียด 300จุดต่อนิ้ว ซึ่งประกอบด้วยตัวอักษรแบบ AngsanaUPC, BrowalliaUPC, CordiaUPC,DilleniaUPC, EucrosiaUPC และ FreesiaUPC แต่ละแบบประกอบด้วยตัวอักษรขนาด 14, 16, 18, 20,22, 24, 28 และ 36 จุด โดยในการเรียนรู้นั้นใช้ภาพของตัวอักษรจำนวน 8544 ตัวอักษร และในการทดสอบการรู้จำใช้ภาพของเอกสารจำนวน 48 เอกสาร ซึ่งประกอบด้วยตัวอักษรจำนวน 71832 ตัวอักษร ได้ผลการรู้จำซึ่งยังไม่ได้แก้ไขคำผิดมีความผิดพลาดเฉลี่ยร้อยละ 1.85 ผลการรู้จำหลังจากแก้ไขคำผิดที่ไม่เป็นคำแล้วมีความผิดพลาดเฉลี่ยร้อยละ 1.47 และผลการรู้จำหลังจากแก้ไขคำผิดที่ไม่เป็นคำและคำผิดที่เป็นคำแล้วมีความผิดพลาดเฉลี่ยร้อยละ 1.50
บรรณานุกรม	:	APA Chicago MLA Vancouver ชาญฤทธิ์ สันตินานาเลิศ . (2542). การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ชาญฤทธิ์ สันตินานาเลิศ . 2542. "การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย". กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ชาญฤทธิ์ สันตินานาเลิศ . "การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย." กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2542. Print. ชาญฤทธิ์ สันตินานาเลิศ . การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2542.