| ชื่อเรื่อง | : | ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต |
| นักวิจัย | : | เปรมิน จินดาวิมลเลิศ |
| คำค้น | : | PAT TREE , PAT ARRAY , THAI TEXT RETRIEVAL , TEXTRETRIEVAL |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2539 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=1082539000591 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | วิทยานิพนธ์นี้นำเสนอการพัฒนาระบบค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต เนื่องจากต้นไม้แพ็ตจัดเก็บดรรชนีของสายอักขระแบบกึ่งอนันต์ ที่เรียกว่าซิสตริง ซึ่งคือลำดับย่อยของตัวอักษรต่อเนื่องกันในข้อความ จึงขจัดปัญหาการแบ่งคำในข้อความภาษาไทยที่มักกระทำได้ไม่ถูกต้องสมบูรณ์ ขั้นตอนการสร้างเริ่มแบ่งเอกสารฉบับใหม่ออกเป็นเอกสารฉบับย่อยๆที่มีขนาดแปรตามขนาดของหน่วยความจำหลักที่มีเหลืออยู่ในระบบ จากนั้นตัดซิสตริงที่มีจุดเริ่มต้นที่ไม่ถูกต้องกับหลักภาษาไทยเบื้องต้นออกจากขั้นตอนการจัดเก็บ แล้วสร้างแพ็ตอะเรย์ที่เก็บซิสตริงที่เหลือของแต่ละเอกสารย่อย โดยใช้ต้นไม้แพ็ตเป็นโครงสร้างข้อมูลภายในเมื่อได้แพ็ตอะเรย์ของทุกๆ เอกสารย่อยแล้ว จึงนำแพ็ตอะเรย์เหล่านี้มาผสานเข้าด้วยกันกับแพ็ตอะเรย์เดิมของเอกสารก่อนๆ เป็นแพ็ตอะเรย์ใหม่ที่เก็บดรรชนีของเอกสารฉบับใหม่นั้นด้วย จากนั้นสร้างดรรชนีระดับที่สอง(ที่มีขนาดเพียงพอต่อการจัดเก็บในหน่วยความจำหลัก) สำหรับอ้างอิงข้อมูลในแพ็ตอะเรย์ เพื่อเป็นการเพิ่มประสิทธิภาพการเข้าถึงข้อมูล ขั้นตอนการสร้างที่ได้กล่าวถึงนี้ใช้เวลาการทำงานเป็นO(k(N+n)) โดยที่ k คือจำนวนเอกสารย่อย n คือขนาดของเอกสารฉบับใหม่ที่จะถูกเพิ่ม และ N คือขนาดของแพ็ตอะเรย์ก่อนการเพิ่มเอกสารฉบับใหม่ นอกจากนี้ยังได้แสดงให้เห็นว่าแพ็ตอะเรย์จะมีขนาดที่แปรผันตามขนาดของซิสตริง จากการทดลองกับข้อความภาษาไทยพบว่า อัตราการเพิ่มขนาดของแพ็ตอะเรย์น้อยกว่า 1% เมื่อซิสตริงมีความยาวตั้งแต่ 15 ตัวอักษรเป็นต้นไป |
| บรรณานุกรม | : |
เปรมิน จินดาวิมลเลิศ . (2539). ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. เปรมิน จินดาวิมลเลิศ . 2539. "ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. เปรมิน จินดาวิมลเลิศ . "ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2539. Print. เปรมิน จินดาวิมลเลิศ . ระบบการค้นคืนข้อความภาษาไทยโดยใช้ต้นไม้แพ็ต. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2539.
|
