ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม

หน่วยงาน จุฬาลงกรณ์มหาวิทยาลัย

รายละเอียด

ชื่อเรื่อง : การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม
นักวิจัย : อัครพล เอกวงศ์อนันต์
คำค้น : ภาษาไทย -- การถอดตัวอักษร , ภาษาไทย -- การใช้ภาษา , แบบจำลองเอ็นแกรม
หน่วยงาน : จุฬาลงกรณ์มหาวิทยาลัย
ผู้ร่วมงาน : วิโรจน์ อรุณมานะกุล , จุฬาลงกรณ์มหาวิทยาลัย. คณะอักษรศาสตร์
ปีพิมพ์ : 2548
อ้างอิง : 9745323608 , http://cuir.car.chula.ac.th/handle/123456789/8413
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วิทยานิพนธ์ (อ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2548

วัตถุประสงค์ของการวิจัยครั้งนี้ เพื่อต้องการสายอักขระเฉพาะสำหรับใช้ในการระบุภาษาของคำโดยใช้ คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่นและภาษาฝรั่งเศส และพัฒนาระบบการระบุภาษา ของคำไทยและคำทับศัพท์ภาษาต่างประเทศโดยใช้สายอักขระเฉพาะและใช้แบบจำลองเอ็นแกรมขนาด 1-5 แกรม คลังขลังข้อมูลที่ใช้ในงานวิจัยนี้ คือ คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่น ภาษาละ 10,000 คำ และคำทับศัพท์ภาษาฝรั่งเศส 1,000 คำ โดยเก็บจากข้อมูลที่พบในภาษาธรรมชาติซึ่ง อาจจะไม่ได้ทับศัพท์ถูกต้องตามเกณฑ์ของราชบัณฑิตยสถานก็ได้ 80% ของคลังข้อมูลถูกนำมาใช้เพื่อหา สายอักขระเฉพาะและสร้างแบบจำลองเอ็นแกรมของแต่ละภาษา ในขณะที่อีก 20% ถูกใช้เพื่อการทดสอบ ระบบแบบต่าง ๆ สายอักขระเฉพาะที่พบสะท้อนให้เห็นถึงลักษณะเฉพาะของแต่ละภาษาได้ในระดับหนึ่ง จึงมีผลให้ระบบที่ใช้สายอักขระเฉพาะในการระบุภาษาสามารถตัดสินภาษาได้ถูกต้อง 50.58% 48.71% 54.09% และ 20.40% สำหรับคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่น และ ฝรั่งเศส ตามสำดับ เมื่อใช้ แบบจำลองเอ็นแกรมในการระบุภาษา ระบบสามารถระบุภาษาของคำไทย คำทับศัพท์ภาษาอังกฤษ และ ญี่ปุ่นได้ถูกต้องกว่า 90% แต่ได้เพียงประมาณ 60% สำหรับคำทับศัพท์ฝรั่งเศส ผลที่ได้ยืนยันว่าขนาดของ ข้อมูลการฝึกมีผลต่อการทำงานของระบบการระบุภาษาทั้งสองระบบ นอกจากนี้ จากผลที่พบว่าระบบที่ใช้ แบบจำลอง 3-แกรมให้ผลดีกว่าระบบที่ใช้ขนาดแกรมอื่นๆ ทำให้สรุปได้ว่า ขนาดของเอ็นแกรมมีผลต่อ การทำงานของระบบการระบุภาษา

บรรณานุกรม :
อัครพล เอกวงศ์อนันต์ . (2548). การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม.
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย.
อัครพล เอกวงศ์อนันต์ . 2548. "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม".
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย.
อัครพล เอกวงศ์อนันต์ . "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม."
    กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย, 2548. Print.
อัครพล เอกวงศ์อนันต์ . การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม. กรุงเทพมหานคร : จุฬาลงกรณ์มหาวิทยาลัย; 2548.