ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน
นักวิจัย : วิฑูรย์ กัลยาณวัฒน์
คำค้น : INVERTED FILES , RETRIEVAL , THAI
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2540
อ้างอิง : http://www.thaithesis.org/detail.php?id=1082540000963
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วิทยานิพนธ์ฉบับนี้นำเสนอขั้นตอนวิธีการจัดทำดัชนีสำหรับระบบสืบค้นข้อความไทยที่ใช้โครงสร้างแฟ้มข้อมูลแบบผกผัน โดยที่เอกสารต่าง ๆ ที่ได้รับมานั้นสามารถมีคำที่ไม่มีอยู่ในพจนานุกรมของระบบได้ ปัญหานี้เกิดขึ้นจากการเขียนข้อความในภาษาไทยที่ไม่มีตัวกำหนดขอบเขตระหว่างคำ โดยอาศัยพจนานุกรมของระบบ ขั้นตอนวิธีที่นำเสนอนี้หาคำที่ยาวสุดต่าง ๆ ที่มีในพจนานุกรมที่ปรากฎในข้อความ จากนั้นสร้างกราฟที่แทนการติดกันและการทับกันของคำต่าง ๆ ในข้อความ โดยที่เส้นทางที่สั้นสุดในกราฟนี้แทนกลุ่มที่เล็กสุดของคำในข้อความที่เมื่อเลือกแล้วจะลดจำนวนสายอักขระย่อยที่ไม่รู้จักให้ปรากฏขึ้นเป็นจำนวนน้อยที่สุด สายอักขระย่อยเหล่านี้จะถูกเทียบกับพยางค์ต่าง ๆ ในข้อความ โดยการใช้ขั้นตอนวิธีการแบ่งพยางค์แบบใช้กฎ คำต่าง ๆ ที่ได้บนเส้นทางสั้นสุดของกราฟ และพยางค์ต่าง ๆ ที่ได้จากการเทียบกับสายอักขระย่อยที่ไม่เป็นคำที่รู้จัก จะเป็นกลุ่มของคำสำคัญในการจัดทำดัชนีของข้อความที่ได้รับ ผลการทดลองแสดงให้เห็นว่าจำนวนคำสำคัญที่หาได้นั้นลดจากจำนวนคำทั้งหมดที่หาได้จากข้อความประมาณ 72 %

บรรณานุกรม :
วิฑูรย์ กัลยาณวัฒน์ . (2540). ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
วิฑูรย์ กัลยาณวัฒน์ . 2540. "ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
วิฑูรย์ กัลยาณวัฒน์ . "ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2540. Print.
วิฑูรย์ กัลยาณวัฒน์ . ระบบการค้นคืนข้อความภาษาไทยโดยใช้แฟ้มข้อมูลผกผัน. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2540.