การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย

หน่วยงาน จุฬาลงกรณ์มหาวิทยาลัย

รายละเอียด

ชื่อเรื่อง	:	การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย
นักวิจัย	:	ชาญฤทธิ์ สันตินานาเลิศ
คำค้น	:	ภาษาไทย -- ตัวอักษร , การประมวลผลภาพ , นิวรัลเน็ตเวิร์ค (คอมพิวเตอร์) , การรู้จำอักขระ (คอมพิวเตอร์) , แบคพรอพาเกชัน (ปัญญาประดิษฐ์) , การรู้จำอักขระด้วยวิธีการทางแสง
หน่วยงาน	:	จุฬาลงกรณ์มหาวิทยาลัย
ผู้ร่วมงาน	:	บุญเสริม กิจศิริกุล , จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
ปีพิมพ์	:	2542
อ้างอิง	:	9743338721 , http://cuir.car.chula.ac.th/handle/123456789/11679
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	วิทยานิพนธ์ (วท.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2542 วิทยานิพนธ์ฉบับนี้มีวัตถุประสงค์ เพื่อออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย เพื่อใช้ในการรู้จำตัวอักษรพิมพ์ในเอกสารภาษาไทยที่พิมพ์จากเครื่องคอมพิวเตอร์ด้วยแบบตัวอักษรมาตรฐานวิทยานิพนธ์ฉบับนี้นำเสนอวิธีการต่างๆ เพื่อใช้ในโปรแกรมโอซีอาร์ภาษาไทยคือ วิธีการประมวลผลภาพ, วิธีการตัดแยกตัวอักษร, วิธีการแยกลักษณะสำคัญของตัวอักษรแบบ เค-แอล ทรานส์ฟอร์ม, วิธีการแยกแยะตัวอักษรแบบแบคพรอพาเกชันนิวรอลเน็ตเวิร์ก และวิธีการแก้ไขคำที่สะกดผิดแบบไตรแกรมของประเภทของคำ ขั้นตอนในการทำงานของโปรแกรมโอซีอาร์ภาษาไทยที่พัฒนาขึ้นนี้ประกอบด้วย ขั้นตอนการนำเอกสารเข้าสู่โปรแกรม, ขั้นตอนการประมวลผลภาพ, ขั้นตอนการตัดแยกบรรทัด, ขั้นตอนการตัดแยกตัวอักษร, ขั้นตอนการรู้จำตัวอักษร, ขั้นตอนการแก้ไขผลลัพธ์ที่ได้จากขั้นตอนการรู้จำ, ขั้นตอนการสร้างบรรทัดและขั้นตอนการแก้ไขคำผิด ในวิทยานิพนธ์ฉบับนี้ ได้นำภาพตัวอักษรและภาพของเอกสารที่ได้จากการพิมพ์ด้วยเครื่องพิมพ์เลเซอร์ที่ความละเอียด 600 จุดต่อนิ้ว นำเอกสารมาอ่านผ่านเครื่องสแกนเนอร์ที่ความละเอียด 300 จุดต่อนิ้ว ซึ่งประกอบด้วยตัวอักษรแบบ AngsanaUPC, BrowalliaUPC, CordiaUPC, DilleniaUPC, EucrosiaUPC และ FreesiaUPC แต่ละแบบประกอบด้วยตัวอักษรขนาด 14, 16, 18, 20, 22, 24, 28 และ 36 จุด โดยในการเรียนรู้นั้นใช้ภาพของตัวอักษรจำนวน 8544 ตัวอักษร และในการทดสอบการรู้จำใช้ภาพของเอกสารจำนวน 48 เอกสาร ซึ่งประกอบด้วยตัวอักษรจำนวน 71832 ตัวอักษร ได้ผลการรู้จำซึ่งยังไม่ได้แก้ไขคำผิดมีความผิดพลาดเฉลี่ยร้อยละ 1.85 ผลการรู้จำหลังจากแก้ไขคำผิดที่ไม่เป็นคำแล้วมีความผิดพลาดเฉลี่ยร้อยละ 1.47 และผลการรู้จำหลังจากแก้ไขคำผิดที่ไม่เป็นคำและคำผิดที่เป็นคำแล้วมีความผิดพลาดเฉลี่ยร้อยละ 1.50
บรรณานุกรม	:	APA Chicago MLA Vancouver ชาญฤทธิ์ สันตินานาเลิศ . (2542). การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย. กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย. ชาญฤทธิ์ สันตินานาเลิศ . 2542. "การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย". กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย. ชาญฤทธิ์ สันตินานาเลิศ . "การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย." กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย, 2542. Print. ชาญฤทธิ์ สันตินานาเลิศ . การออกแบบและพัฒนาโปรแกรมโอซีอาร์ภาษาไทย. กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย; 2542.