ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม
นักวิจัย : อัครพล เอกวงศ์อนันต์
คำค้น : LANGUAGE IDENTIFICATION
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2548
อ้างอิง : http://www.thaithesis.org/detail.php?id=1082548000559
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วัตถุประสงค์ของการวิจัยครั้งนี้ เพื่อต้องหาสายอักขระเฉพาะสำหรับใช้ในการระบุภาษาของคำโดยใช้คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่นและภาษาฝรั่งเศสและพัฒนาระบบการระบุภาษาของคำไทยและคำทับศัพท์ภาษาต่างประเทศโดยใช้สายอักขระเฉพาะและใช้แบบจำลองเอ็นแกรมขนาด 1-5 แกรม คลังข้อมูลที่ใช้ในงานวิจัยนี้ คือ คลังข้อมูลคำไทย คำทับศัพท์ภาษาอังกฤษภาษาญี่ปุ่น ภาษาละ 10,000 คำ และคำทับศัพท์ภาษาฝรั่งเศส 1,000 คำ โดยเก็บจากข้อมูลที่พบในภาษาธรรมชาติซึ่งอาจจะไม่ได้ทับศัพท์ถูกต้องตามเกณฑ์ของราชบัณฑิตยสถานก็ได้ 80%ของคลังข้อมูลถูกนำมาใช้เพื่อหาสายอักขระเฉพาะและสร้างแบบจำลองเอ็นแกรมของแต่ละภาษาในขณะที่อีก 20% ถูกใช้เพื่อการทดสอบระบบแบบต่างๆ สายอักขระเฉพาะที่พบสะท้อนให้เห็นถึงลักษณะเฉพาะของแต่ละภาษาได้ในระดับหนึ่งจึงมีผลให้ระบบที่ใช้สายอักขระเฉพาะในการระบุภาษาสามารถตัดสินภาษาได้ถูกต้อง 50.58%48.71% 54.09% และ 20.40% สำหรับคำไทย คำทับศัพท์ภาษาอังกฤษ ภาษาญี่ปุ่น และฝรั่งเศสตามลำดับ เมื่อใช้แบบจำลองเอ็นแกรมในการระบุภาษา ระบบสามารถระบุภาษาของคำไทย คำทับศัพท์ภาษาอังกฤษ และญี่ปุ่นได้ถูกต้องกว่า 90% แต่ได้เพียงประมาณ 60% สำหรับคำทับศัพท์ฝรั่งเศสผลที่ได้ยืนยันว่าขนาดของข้อมูลการฝึกมีผลต่อการทำงานของระบบระบุภาษาทั้งสองระบบ นอกจากนี้จากผลที่พบว่าระบบที่ใช้แบบจำลอง 3-แกรมให้ผลดีกว่าระบบที่ใช้ขนาดแกรมอื่นๆ ทำให้สรุปได้ว่าขนาดของเอ็นแกรมมีผลต่อการทำงานของระบบการระบุภาษา

บรรณานุกรม :
อัครพล เอกวงศ์อนันต์ . (2548). การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
อัครพล เอกวงศ์อนันต์ . 2548. "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
อัครพล เอกวงศ์อนันต์ . "การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2548. Print.
อัครพล เอกวงศ์อนันต์ . การระบุคำไทยและคำทับศัพท์ด้วยแบบจำลองเอ็นแกรม. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2548.