การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง	:	การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย
นักวิจัย	:	ชม กิ้มปาน
คำค้น	:	-
หน่วยงาน	:	ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน	:	-
ปีพิมพ์	:	2529
อ้างอิง	:	http://www.thaithesis.org/detail.php?id=33950
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	วิทยานิพนธ์นี้เสนอวิธีการพัฒนาระบบการจดจำอัตโนมัติ สำหรับเครื่องอ่านอักษรตัวพิมพ์ภาษาไทยในการเตรียมข้อมูล ให้กับคอมพิวเตอร์โดยอัตโนมัติ ในสามขั้นตอนหลักของระบบ การจดจำ ในขั้นตอนของการเปลี่ยนสัญญาณแสงไปเป็นสัญญาณ ไฟฟ้าจะไม่สนใจสำหรับวิทยานิพนธ์นี้ ในขั้นตอนการจัดการล่วงหน้าเพื่อปรับปรุงข้อมูลให้ เหมาะสมสำหรับการทำงาน ในขั้นตอนของการจดจำต่อไปจะ บรรยายเกี่ยวกับเทคนิคในการแยกตัวอักษรภาษาไทยออกจาก ประโยค และเทคนิคสำหรับการลดทอนข้อมูลของแต่ละตัวอักษร ให้น้อยลง เพื่อให้เกิดการประหยัดหน่วยความจำใน คอมพิวเตอร์สำหรับเก็บข้อมูลให้น้อยที่สุดเท่าที่จะเป็นได้ วิทยานิพนธ์นี้จะเน้นหนักในขั้นตอนของการจดจำ เพื่อ ให้ได้วิธีที่ดีที่สุดสำหรับการจดจำรูปแบบอักษรตัวพิมพ์ ภาษาไทย จะเสนอทั้งวิธีการจดจำแบบการซ้อนทับ (Matching Method) และวิธีการแบบวิเคราะห์โครงสร้าง (Structural Analysis Method) สำหรับแบบการซ้อนทับเนื่องจากลักษณะของตัวอักษร พิมพ์ภาษาไทยมีส่วนคล้ายกันมาก และเพื่อให้การจดจำมี ประสิทธิภาพสูง ระบบการจดจำจึงถูกแบ่งออกเป็นสองขั้นตอน ด้วยกัน ในขั้นตอนของการแบ่งกลุ่มตัวอักษร (Rough classification Stage) รูปร่างปลีกย่อยที่ไม่จำเป็น และสัญญาณรบกวนจะถูกกำจัดออกไปโดยการทำตัวอักษรให้เบลอร์ ตัวอักษรที่เบลอร์แล้วจะถูกแบ่งออกเป็นกลุ่ม ๆ เงื่อนไข สำหรับการแบ่งกลุ่มใช้วิธีการวัดค่าสัมประสิทธิของความ เหมือนของแต่ละรูปแบบ แล้วใช้การกระจายแบบคาร์ฮูเนนโลบ (Karhunen Loeve Expansion) หารูปแบบมาตรฐานสำหรับ เก็บไว้เป็นตัวแทนของแต่ละกลุ่ม ในขั้นตอนของการแยกตัว อักษรออกจากกลุ่ม (Fine Classification Stage) มีวิธีการ อยู่สองวิธีสำหรับแยกตัวอักษรออกจากกัน วิธีแรกใช้การ ซ้อนทับเป็นส่วน ๆ (Subpattern Matching) ในการแยกตัว อักษรออกจากกัน วิธีที่สองใช้วิธีการสร้างฟังก์ชั่นการ ตัดสินใจแบบเชิงเส้น (Linear Decision Function) บนระนาบ ของไอเกนเวคเตอร์ที่ได้จากการกระจายแบบคาร์ฮูเนนโลบ สำหรับการแยกตัวอักษรในแต่ละกลุ่มออกจากกัน สำหรับการจดจำแบบวิเคราะห์โครงสร้าง ระบบการจดจำ ก็จะแบ่งออกเป็นสองขั้นตอนด้วยเช่นกันในขั้นตอนของการแบ่ง กลุ่มตัวอักษร เทคนิคการทำตัวอักษรให้บางจะถูกนำมาใช้ เพื่อกำจัดสัญญาณรบกวนและกำจัดลักษณะปลีกย่อยที่ไม่จำเป็น ออกไป ตัวอักษรที่ทำให้บางแล้วจะถูกแบ่งออกเป็นกลุ่ม ๆ โดยใช้ฟังก์ชั่นการตัดสินใจแบบเชิงเส้นที่ยึดหลักความสูง และความกว้างของตัวอักษรเป็นเกณฑ์ในการแบ่งแยกตัวอักษร ออกเป็นกลุ่ม ๆ ในขั้นตอนของการแยกตัวอักษรออกจากกลุ่ม ค่า ความสัมพันธ์ระหว่างจุด ของแต่ละจุดในรูปร่าบงตัว อักษรจะถูกคำนวณออกมา คุณสมบัติทางเรขาคณิตของตัวอักษรที่อยู่ในฟอร์มของ ค่าความสัมพันธ์ระหว่างจุดที่แทนจุดปลาย จุดแยก จุดต่อ เนื่อง และอื่น ๆ จะให้ความแตกต่างระหว่างตัวอักษร ต่าง ๆ ซึ่งคุณสมบัติเหล่านี้จะนำมาใช้ในการแยกตัวอักษร ออกจากกันในแต่ละกลุ่ม การจดจำรูปแบบตัวอักษรตัวพิมพ์ภาษาไทยที่มี ประสิทธิภาพสูง จะได้รับจากการจดจำแบบการซ้อนทับ เพราะ ว่าไม่มีการกำกวมในกระบวนการของการจดจำที่ใช้การกระจาย แบบคาร์ฮูเนนโลบเป็นเครื่องมือ ถึงแม้ว่าการจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทยที่ใช้ คุณสมบัติทางเรขาคณิตของตัวอักษรจะมีความยุ่งยากและต้อง ทำงานหนักในกระบวนการของการจดจำก็ตาม แต่ประสิทธิภาพ ของการจดจำยังสูงพอที่จะสามารถยอมรับได้ในสายงานของการ จดจำรูปแบบตัวอักษร ผลของการจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทยทั้งสองวิธี และทั้งขั้นตอนการแบ่งกลุ่มตัวอักษร และขั้นตอนการแยกตัว อักษรออกจากกลุ่ม จะแสดงให้เห็นอย่างชัดเจนในวิทยานิพนธ์นี้
บรรณานุกรม	:	APA Chicago MLA Vancouver ชม กิ้มปาน . (2529). การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ชม กิ้มปาน . 2529. "การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย". กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ชม กิ้มปาน . "การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย." กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2529. Print. ชม กิ้มปาน . การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2529.