| ชื่อเรื่อง | : | การแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข |
| นักวิจัย | : | กัลยา นฤดมกุล |
| คำค้น | : | Generate and Repair Machine Translation , Head-Driven , machine translation , Phrase Structure Grammar , การแปลภาษาด้วยเครื่อง , การแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข |
| หน่วยงาน | : | สำนักงานกองทุนสนับสนุนการวิจัย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2551 |
| อ้างอิง | : | http://elibrary.trf.or.th/project_content.asp?PJID=TRG4580108 , http://research.trf.or.th/node/4101 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | โครงการวิจัยนี้เสนอแนวทางปรับปรุงระบบการแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข เพื่อใช้ในการพัฒนาระบบการแปลภาษาแบบสองทิศทางไเดีและเหมาะสมยิ่งขึ้น (bi-directional translation system ) หน่วยประมวลผลหลักทั้งสามของรบบซึ่งรวมถึง Analysis Lite Machine Translation (ALTM) Translation Candidate Evaluation (TCE) และ Repair and Iterate (RI) ได้ถูทบทวนแก้ไขเพื่อให้มีประสิทธิภาพยิ่งขึ้น โมดูล Word segmentation ได้ถูกเพิ่มเข้าใน ALMT เพื่อตัดคำในวลีหรือในประโยคอินพุท โมดูลนี้จะทำงานเมื่อประโยคอินพุทเป็นภาาษาที่ไม่มีช่องว่างหรือเครื่องหมายใดๆระหว่างคำ เช่น ภาษาไทย จีน และญี่ปุ่น เซตของข้อบังคับ (constraints) สำหรับภาษาอังกฤษและภาษาไทยที่ใช้ใน ALMT ถูกเพิ่มเติมแก้ไขให้ใช้ได้ในกรณีที่เป็นภาษาต้นทางและภาษาปลายทาง ความสัมพีนธ์ระหว่างคำลักษณะนามกับคำนามซึ่งแสดงด้วย word association number ถูกทบทวนแก้ไขเพื่อให้ระบบเลือกคำลักษณธนามได้ถูกต้องยิ่งขึ้น กฏ "not-head schema" ถูกเพิ่มเข้ามาใน TCE เพื่อใช้วิเคราะห์วลีหรือประโยคที่มีคำปฏิเสธอยูด้วย ระบบสามารถวิเคราะห์วลีหรือประโยคที่มีตัวเลขบ่งปริมาณและจำแนกค่าของตัวเลขได้โดยใช้ข้อมูลของตัวเลขที่ระบบสร้างขึ้นเองด้วยกฏ number lexical rule ทันทีที่มีการเรียกใช้ พจนานุกรมสองภาษา (ไทย-อังกฤษ) ที่ใช้ในขั้นตอนการแปลภาษาถูกสร้างขึ้นจากพจนานุกรมภาษาไทยและพจนานุกรมภาษาอังกฤษที่มีอยู่ในระบบ พจนานุกรมสองภาษานี้จะถูกสร้างขึ้นเมื่อระบบถูกเรียกใช้และสร้างเฉพาะข้อมูลของคำที่ปรากฏในวลีหรือประโยคอินพุทเท่านั้น เพื่อแสดงประสิทธิภาพของการแปลภาษาด้วยเครื่องสร้างแบบและแก้ไข ระบบต้นแบบแปลภาษาอังกฤษ-ไทยได้ถูกพัฒนาขึ้นโดยใช้ SWI-Prolog 5.4 กฏไวยากรณ์ของคู่ภาษาได้ถูกพัฒนาตามรูปแบบของ Head-Driven Phrase Structure Grammar และ Attribute Logic Engine และส่วนการติดต่อกับผู้ใช้ได้ถูกพัฒนาโดย XPCE ผลจากการทดสอบพบว่าระบบสามารถสร้างผลการแปลที่สื่อความหมายของประโยคต้นทางได้ถูกต้องเป็นส่วนใหญ่โดยไม่ต้องมีการแก้ไข โครงสร้างของประโยคถูกต้องตามไวยากรณ์ การเลือกใช้คำถูกต้อง ส่วนผลการแปลบางส่วนที่ต้องการแก้ไขนั้น TCE และ RI ทำการแก้ไชโดยใช้กฏไวยากรณ์และพจนารุกรมที่พัฒนาขึ้นในโครงการวิจัยนี้ A new version of Generate and Repair Machine Translation (GRMT) is proposed to make it more suitable for developing bi-directional translation system. Each processing module in GRMT including Analysis Lite Machine Translation (ALMT), Translation Candidate Evaluation (TCE) and Repair and Iterate (RI) was revised. The Word segmentation, which segments the input phrase/sentence into units that can be translated into other languages, is augmented to ALMT. The word segmentation module is activated only if the input string is in the language that has no explicit word boundary delimiters e.g., Thai, Chinese and Japanese. The sets of English and Thai constraints were revised so that the constraints can be applied via ALMT whether they are SL or TL. The classifier relation was re-designed for better selecting the appropriate classifier for each noun. A “not- head schema” is added to TCE to analyze a phrases/sentences containing negation. The system is able to analyze a string, with a quantity specified by a number, and to recognize its value by using information automatically generated by the “number lexical rule” when the system is activated. A bi-lingual dictionary is generated from the built-in SL and TL dictionaries once the translation is requested. Only the information of the words in the input string is generated for a better performance in a larger system. The English-Thai MT prototype has been implemented to illustrate the performance of GRMT. The prototype has been developed and run under SWI-Prolog 5.4. The grammars were developed based on Head-Driven Phrase Structure Grammar and implemented on Attribute Logic Engine. The user interface was developed by using XPCE. This English-Thai MT system was evaluated and it performs in the way we intended. ALMT generated a large number of acceptable translations (grammatically correct, correct word usage and convey the original meaning) without repair. For some translations which require repairing, they are repaired by TCE and RI using the current HPSG based grammars and lexicons developed in this project. |
| บรรณานุกรม | : |
กัลยา นฤดมกุล . (2551). การแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข.
กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย. กัลยา นฤดมกุล . 2551. "การแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข".
กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย. กัลยา นฤดมกุล . "การแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข."
กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย, 2551. Print. กัลยา นฤดมกุล . การแปลภาษาด้วยเครื่องแบบสร้างและแก้ไข. กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย; 2551.
|
