| ชื่อเรื่อง | : | การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม |
| นักวิจัย | : | อัครพล เอกวงศ์อนันต์ |
| คำค้น | : | ภาษาไทย -- การถอดตัวอักษร , ภาษาไทย -- การใช้ภาษา , แบบจำลองเอ็นแกรม |
| หน่วยงาน | : | จุฬาลงกรณ์มหาวิทยาลัย |
| ผู้ร่วมงาน | : | วิโรจน์ อรุณมานะกุล , จุฬาลงกรณ์มหาวิทยาลัย. คณะอักษรศาสตร์ |
| ปีพิมพ์ | : | 2548 |
| อ้างอิง | : | 9745323608 , http://cuir.car.chula.ac.th/handle/123456789/8413 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | วิทยานิพนธ์ (อ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2548 วัตถุประสงค์ของการวิจัยครั้งนี้ เพื่อต้องการสายอักขระเฉพาะสำหรับใช้ในการระบุภาษาของคำโดยใช้ คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่นและภาษาฝรั่งเศส และพัฒนาระบบการระบุภาษา ของคำไทยและคำทับศัพท์ภาษาต่างประเทศโดยใช้สายอักขระเฉพาะและใช้แบบจำลองเอ็นแกรมขนาด 1-5 แกรม คลังขลังข้อมูลที่ใช้ในงานวิจัยนี้ คือ คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่น ภาษาละ 10,000 คำ และคำทับศัพท์ภาษาฝรั่งเศส 1,000 คำ โดยเก็บจากข้อมูลที่พบในภาษาธรรมชาติซึ่ง อาจจะไม่ได้ทับศัพท์ถูกต้องตามเกณฑ์ของราชบัณฑิตยสถานก็ได้ 80% ของคลังข้อมูลถูกนำมาใช้เพื่อหา สายอักขระเฉพาะและสร้างแบบจำลองเอ็นแกรมของแต่ละภาษา ในขณะที่อีก 20% ถูกใช้เพื่อการทดสอบ ระบบแบบต่าง ๆ สายอักขระเฉพาะที่พบสะท้อนให้เห็นถึงลักษณะเฉพาะของแต่ละภาษาได้ในระดับหนึ่ง จึงมีผลให้ระบบที่ใช้สายอักขระเฉพาะในการระบุภาษาสามารถตัดสินภาษาได้ถูกต้อง 50.58% 48.71% 54.09% และ 20.40% สำหรับคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่น และ ฝรั่งเศส ตามสำดับ เมื่อใช้ แบบจำลองเอ็นแกรมในการระบุภาษา ระบบสามารถระบุภาษาของคำไทย คำทับศัพท์ภาษาอังกฤษ และ ญี่ปุ่นได้ถูกต้องกว่า 90% แต่ได้เพียงประมาณ 60% สำหรับคำทับศัพท์ฝรั่งเศส ผลที่ได้ยืนยันว่าขนาดของ ข้อมูลการฝึกมีผลต่อการทำงานของระบบการระบุภาษาทั้งสองระบบ นอกจากนี้ จากผลที่พบว่าระบบที่ใช้ แบบจำลอง 3-แกรมให้ผลดีกว่าระบบที่ใช้ขนาดแกรมอื่นๆ ทำให้สรุปได้ว่า ขนาดของเอ็นแกรมมีผลต่อ การทำงานของระบบการระบุภาษา |
| บรรณานุกรม | : |
อัครพล เอกวงศ์อนันต์ . (2548). การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม.
กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย. อัครพล เอกวงศ์อนันต์ . 2548. "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม".
กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย. อัครพล เอกวงศ์อนันต์ . "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม."
กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย, 2548. Print. อัครพล เอกวงศ์อนันต์ . การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม. กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย; 2548.
|
