| ชื่อเรื่อง | : | การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม |
| นักวิจัย | : | อัครพล เอกวงศ์อนันต์ |
| คำค้น | : | LANGUAGE IDENTIFICATION |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2548 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=1082548000559 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | วัตถุประสงค์ของการวิจัยครั้งนี้ เพื่อต้องหาสายอักขระเฉพาะสำหรับใช้ในการระบุภาษาของคำโดยใช้คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่นและภาษาฝรั่งเศสและพัฒนาระบบการระบุภาษาของคำไทยและคำทับศัพท์ภาษาต่างประเทศโดยใช้สายอักขระเฉพาะและใช้แบบจำลองเอ็นแกรมขนาด 1-5 แกรม คลังข้อมูลที่ใช้ในงานวิจัยนี้ คือ คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษภาษาญี่ปุ่น ภาษาละ 10,000 คำ และคำทับศัพท์ภาษาฝรั่งเศส 1,000 คำ โดยเก็บจากข้อมูลที่พบในภาษาธรรมชาติซึ่งอาจจะไม่ได้ทับศัพท์ถูกต้องตามเกณฑ์ของราชบัณฑิตยสถานก็ได้ 80%ของคลังข้อมูลถูกนำมาใช้เพื่อหาสายอักขระเฉพาะและสร้างแบบจำลองเอ็นแกรมของแต่ละภาษาในขณะที่อีก 20% ถูกใช้เพื่อการทดสอบระบบแบบต่างๆ สายอักขระเฉพาะที่พบสะท้อนให้เห็นถึงลักษณะเฉพาะของแต่ละภาษาได้ในระดับหนึ่งจึงมีผลให้ระบบที่ใช้สายอักขระเฉพาะในการระบุภาษาสามารถตัดสินภาษาได้ถูกต้อง 50.58%48.71% 54.09% และ 20.40% สำหรับคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่น และฝรั่งเศสตามลำดับ เมื่อใช้แบบจำลองเอ็นแกรมในการระบุภาษา ระบบสามารถระบุภาษาของคำไทย คำทับศัพท์ภาษาอังกฤษ และญี่ปุ่นได้ถูกต้องกว่า 90% แต่ได้เพียงประมาณ 60% สำหรับคำทับศัพท์ฝรั่งเศสผลที่ได้ยืนยันว่าขนาดของข้อมูลการฝึกมีผลต่อการทำงานของระบบระบุภาษาทั้งสองระบบ นอกจากนี้จากผลที่พบว่าระบบที่ใช้แบบจำลอง 3-แกรมให้ผลดีกว่าระบบที่ใช้ขนาดแกรมอื่นๆ ทำให้สรุปได้ว่าขนาดของเอ็นแกรมมีผลต่อการทำงานของระบบการระบุภาษา |
| บรรณานุกรม | : |
อัครพล เอกวงศ์อนันต์ . (2548). การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. อัครพล เอกวงศ์อนันต์ . 2548. "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. อัครพล เอกวงศ์อนันต์ . "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2548. Print. อัครพล เอกวงศ์อนันต์ . การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2548.
|
