| ชื่อเรื่อง | : | ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน |
| นักวิจัย | : | วิฑูรย์ กัลยาณวัฒน์ |
| คำค้น | : | INVERTED FILES , RETRIEVAL , THAI |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2540 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=1082540000963 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | วิทยานิพนธ์ฉบับนี้นำเสนอขั้นตอนวิธีการจัดทำดัชนีสำหรับระบบสืบค้นข้อความไทยที่ใช้โครงสร้างแฟ้มข้อมูลแบบผกผัน โดยที่เอกสารต่าง ๆ ที่ได้รับมานั้นสามารถมีคำที่ไม่มีอยู่ในพจนานุกรมของระบบได้ ปัญหานี้เกิดขึ้นจากการเขียนข้อความในภาษาไทยที่ไม่มีตัวกำหนดขอบเขตระหว่างคำ โดยอาศัยพจนานุกรมของระบบ ขั้นตอนวิธีที่นำเสนอนี้หาคำที่ยาวสุดต่าง ๆ ที่มีในพจนานุกรมที่ปรากฎในข้อความ จากนั้นสร้างกราฟที่แทนการติดกันและการทับกันของคำต่าง ๆ ในข้อความ โดยที่เส้นทางที่สั้นสุดในกราฟนี้แทนกลุ่มที่เล็กสุดของคำในข้อความที่เมื่อเลือกแล้วจะลดจำนวนสายอักขระย่อยที่ไม่รู้จักให้ปรากฏขึ้นเป็นจำนวนน้อยที่สุด สายอักขระย่อยเหล่านี้จะถูกเทียบกับพยางค์ต่าง ๆ ในข้อความ โดยการใช้ขั้นตอนวิธีการแบ่งพยางค์แบบใช้กฎ คำต่าง ๆ ที่ได้บนเส้นทางสั้นสุดของกราฟ และพยางค์ต่าง ๆ ที่ได้จากการเทียบกับสายอักขระย่อยที่ไม่เป็นคำที่รู้จัก จะเป็นกลุ่มของคำสำคัญในการจัดทำดัชนีของข้อความที่ได้รับ ผลการทดลองแสดงให้เห็นว่าจำนวนคำสำคัญที่หาได้นั้นลดจากจำนวนคำทั้งหมดที่หาได้จากข้อความประมาณ 72 % |
| บรรณานุกรม | : |
วิฑูรย์ กัลยาณวัฒน์ . (2540). ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วิฑูรย์ กัลยาณวัฒน์ . 2540. "ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วิฑูรย์ กัลยาณวัฒน์ . "ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2540. Print. วิฑูรย์ กัลยาณวัฒน์ . ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2540.
|
