ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย
นักวิจัย : ชม กิ้มปาน
คำค้น : -
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2529
อ้างอิง : http://www.thaithesis.org/detail.php?id=33950
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วิทยานิพนธ์นี้เสนอวิธีการพัฒนาระบบการจดจำอัตโนมัติ สำหรับเครื่องอ่านอักษรตัวพิมพ์ภาษาไทยในการเตรียมข้อมูล ให้กับคอมพิวเตอร์โดยอัตโนมัติ ในสามขั้นตอนหลักของระบบ การจดจำ ในขั้นตอนของการเปลี่ยนสัญญาณแสงไปเป็นสัญญาณ ไฟฟ้าจะไม่สนใจสำหรับวิทยานิพนธ์นี้ ในขั้นตอนการจัดการล่วงหน้าเพื่อปรับปรุงข้อมูลให้ เหมาะสมสำหรับการทำงาน ในขั้นตอนของการจดจำต่อไปจะ บรรยายเกี่ยวกับเทคนิคในการแยกตัวอักษรภาษาไทยออกจาก ประโยค และเทคนิคสำหรับการลดทอนข้อมูลของแต่ละตัวอักษร ให้น้อยลง เพื่อให้เกิดการประหยัดหน่วยความจำใน คอมพิวเตอร์สำหรับเก็บข้อมูลให้น้อยที่สุดเท่าที่จะเป็นได้ วิทยานิพนธ์นี้จะเน้นหนักในขั้นตอนของการจดจำ เพื่อ ให้ได้วิธีที่ดีที่สุดสำหรับการจดจำรูปแบบอักษรตัวพิมพ์ ภาษาไทย จะเสนอทั้งวิธีการจดจำแบบการซ้อนทับ (Matching Method) และวิธีการแบบวิเคราะห์โครงสร้าง (Structural Analysis Method) สำหรับแบบการซ้อนทับเนื่องจากลักษณะของตัวอักษร พิมพ์ภาษาไทยมีส่วนคล้ายกันมาก และเพื่อให้การจดจำมี ประสิทธิภาพสูง ระบบการจดจำจึงถูกแบ่งออกเป็นสองขั้นตอน ด้วยกัน ในขั้นตอนของการแบ่งกลุ่มตัวอักษร (Rough classification Stage) รูปร่างปลีกย่อยที่ไม่จำเป็น และสัญญาณรบกวนจะถูกกำจัดออกไปโดยการทำตัวอักษรให้เบลอร์ ตัวอักษรที่เบลอร์แล้วจะถูกแบ่งออกเป็นกลุ่ม ๆ เงื่อนไข สำหรับการแบ่งกลุ่มใช้วิธีการวัดค่าสัมประสิทธิของความ เหมือนของแต่ละรูปแบบ แล้วใช้การกระจายแบบคาร์ฮูเนนโลบ (Karhunen Loeve Expansion) หารูปแบบมาตรฐานสำหรับ เก็บไว้เป็นตัวแทนของแต่ละกลุ่ม ในขั้นตอนของการแยกตัว อักษรออกจากกลุ่ม (Fine Classification Stage) มีวิธีการ อยู่สองวิธีสำหรับแยกตัวอักษรออกจากกัน วิธีแรกใช้การ ซ้อนทับเป็นส่วน ๆ (Subpattern Matching) ในการแยกตัว อักษรออกจากกัน วิธีที่สองใช้วิธีการสร้างฟังก์ชั่นการ ตัดสินใจแบบเชิงเส้น (Linear Decision Function) บนระนาบ ของไอเกนเวคเตอร์ที่ได้จากการกระจายแบบคาร์ฮูเนนโลบ สำหรับการแยกตัวอักษรในแต่ละกลุ่มออกจากกัน สำหรับการจดจำแบบวิเคราะห์โครงสร้าง ระบบการจดจำ ก็จะแบ่งออกเป็นสองขั้นตอนด้วยเช่นกันในขั้นตอนของการแบ่ง กลุ่มตัวอักษร เทคนิคการทำตัวอักษรให้บางจะถูกนำมาใช้ เพื่อกำจัดสัญญาณรบกวนและกำจัดลักษณะปลีกย่อยที่ไม่จำเป็น ออกไป ตัวอักษรที่ทำให้บางแล้วจะถูกแบ่งออกเป็นกลุ่ม ๆ โดยใช้ฟังก์ชั่นการตัดสินใจแบบเชิงเส้นที่ยึดหลักความสูง และความกว้างของตัวอักษรเป็นเกณฑ์ในการแบ่งแยกตัวอักษร ออกเป็นกลุ่ม ๆ ในขั้นตอนของการแยกตัวอักษรออกจากกลุ่ม ค่า ความสัมพันธ์ระหว่างจุด ของแต่ละจุดในรูปร่าบงตัว อักษรจะถูกคำนวณออกมา คุณสมบัติทางเรขาคณิตของตัวอักษรที่อยู่ในฟอร์มของ ค่าความสัมพันธ์ระหว่างจุดที่แทนจุดปลาย จุดแยก จุดต่อ เนื่อง และอื่น ๆ จะให้ความแตกต่างระหว่างตัวอักษร ต่าง ๆ ซึ่งคุณสมบัติเหล่านี้จะนำมาใช้ในการแยกตัวอักษร ออกจากกันในแต่ละกลุ่ม การจดจำรูปแบบตัวอักษรตัวพิมพ์ภาษาไทยที่มี ประสิทธิภาพสูง จะได้รับจากการจดจำแบบการซ้อนทับ เพราะ ว่าไม่มีการกำกวมในกระบวนการของการจดจำที่ใช้การกระจาย แบบคาร์ฮูเนนโลบเป็นเครื่องมือ ถึงแม้ว่าการจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทยที่ใช้ คุณสมบัติทางเรขาคณิตของตัวอักษรจะมีความยุ่งยากและต้อง ทำงานหนักในกระบวนการของการจดจำก็ตาม แต่ประสิทธิภาพ ของการจดจำยังสูงพอที่จะสามารถยอมรับได้ในสายงานของการ จดจำรูปแบบตัวอักษร ผลของการจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทยทั้งสองวิธี และทั้งขั้นตอนการแบ่งกลุ่มตัวอักษร และขั้นตอนการแยกตัว อักษรออกจากกลุ่ม จะแสดงให้เห็นอย่างชัดเจนในวิทยานิพนธ์นี้

บรรณานุกรม :
ชม กิ้มปาน . (2529). การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
ชม กิ้มปาน . 2529. "การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
ชม กิ้มปาน . "การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2529. Print.
ชม กิ้มปาน . การจดจำรูปแบบอักษรตัวพิมพ์ภาษาไทย. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2529.