ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต
นักวิจัย : เปรมิน จินดาวิมลเลิศ
คำค้น : PAT TREE , PAT ARRAY , THAI TEXT RETRIEVAL , TEXTRETRIEVAL
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2539
อ้างอิง : http://www.thaithesis.org/detail.php?id=1082539000591
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วิทยานิพนธ์นี้นำเสนอการพัฒนาระบบค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต เนื่องจากต้นไม้แพ็ตจัดเก็บดรรชนีของสายอักขระแบบกึ่งอนันต์ ที่เรียกว่าซิสตริง ซึ่งคือลำดับย่อยของตัวอักษรต่อเนื่องกันในข้อความ จึงขจัดปัญหาการแบ่งคำในข้อความภาษาไทยที่มักกระทำได้ไม่ถูกต้องสมบูรณ์ ขั้นตอนการสร้างเริ่มแบ่งเอกสารฉบับใหม่ออกเป็นเอกสารฉบับย่อยๆที่มีขนาดแปรตามขนาดของหน่วยความจำหลักที่มีเหลืออยู่ในระบบ จากนั้นตัดซิสตริงที่มีจุดเริ่มต้นที่ไม่ถูกต้องกับหลักภาษาไทยเบื้องต้นออกจากขั้นตอนการจัดเก็บ แล้วสร้างแพ็ตอะเรย์ที่เก็บซิสตริงที่เหลือของแต่ละเอกสารย่อย โดยใช้ต้นไม้แพ็ตเป็นโครงสร้างข้อมูลภายในเมื่อได้แพ็ตอะเรย์ของทุกๆ เอกสารย่อยแล้ว จึงนำแพ็ตอะเรย์เหล่านี้มาผสานเข้าด้วยกันกับแพ็ตอะเรย์เดิมของเอกสารก่อนๆ เป็นแพ็ตอะเรย์ใหม่ที่เก็บดรรชนีของเอกสารฉบับใหม่นั้นด้วย จากนั้นสร้างดรรชนีระดับที่สอง(ที่มีขนาดเพียงพอต่อการจัดเก็บในหน่วยความจำหลัก) สำหรับอ้างอิงข้อมูลในแพ็ตอะเรย์ เพื่อเป็นการเพิ่มประสิทธิภาพการเข้าถึงข้อมูล ขั้นตอนการสร้างที่ได้กล่าวถึงนี้ใช้เวลาการทำงานเป็นO(k(N+n)) โดยที่ k คือจำนวนเอกสารย่อย n คือขนาดของเอกสารฉบับใหม่ที่จะถูกเพิ่ม และ N คือขนาดของแพ็ตอะเรย์ก่อนการเพิ่มเอกสารฉบับใหม่ นอกจากนี้ยังได้แสดงให้เห็นว่าแพ็ตอะเรย์จะมีขนาดที่แปรผันตามขนาดของซิสตริง จากการทดลองกับข้อความภาษาไทยพบว่า อัตราการเพิ่มขนาดของแพ็ตอะเรย์น้อยกว่า 1% เมื่อซิสตริงมีความยาวตั้งแต่ 15 ตัวอักษรเป็นต้นไป

บรรณานุกรม :
เปรมิน จินดาวิมลเลิศ . (2539). ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
เปรมิน จินดาวิมลเลิศ . 2539. "ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
เปรมิน จินดาวิมลเลิศ . "ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2539. Print.
เปรมิน จินดาวิมลเลิศ . ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2539.