ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การค้นหาเอกสารที่มีเนื้อความคล้ายกันโดยใช้ตารางคำอภิธาน

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : การค้นหาเอกสารที่มีเนื้อความคล้ายกันโดยใช้ตารางคำอภิธาน
นักวิจัย : ปรัชญา ยอดประสิทธิ์
คำค้น : DOCUMENT , RETRIEVE , ALIGNMENT , RELEVANT , ENGLISH
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2543
อ้างอิง : http://www.thaithesis.org/detail.php?id=44757
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

Document Alignment เป็นเครื่องมือในการค้นหาข้อมูล อยู่ในแขนงหนึ่งของวิชา Information Retrieval โดยการนำเอกสาร (Document) ที่ผู้ใช้สนใจ ซึ่งอาจจะใช้แค่ ส่วนหนึ่งหรือตัวเอกสารทั้งหมดนำมาใช้เป็นโจทย์ (Keyword) ในการค้นหา และค้นคืนเอา เอกสารที่น่าจะเกี่ยวข้อง มาแสดงให้ผู้ใช้เลือกดู ซึ่งการใช้ตัวเอกสารที่สนใจเป็น Keyword ในการค้นหาเอกสารที่ต้องการเช่นนี้ ทำให้ผู้ใช้ไม่ต้องกำหนด Keyword หรือค้น หา Keyword จากเอกสารด้วยตนเอง อีกทั้งยังไม่ต้องป้อน Keyword ที่พ้องความหมายในการ สร้างคำสั่งค้นหา Document Alignment มีส่วนเกี่ยวข้องกับ Document Clustering ซึ่งเป็นการจัดหมวดหมู่ของเอกสารเพื่อใช้ในการจัดเก็บและค้นหาข้อมูล ปัญหาสำคัญที่พบ ร่วมกันคือการค้นหาและเลือกเอา Keyword ที่มีนัยยะสำคัญต่อเอกสารออกมาโดยอัตโนมัติ อย่างไร ซึ่งปัจจุบันมีการนำเสนอแนวทางและวิธีการต่าง ๆ ที่จะเลือกเอา Keyword ที่มี นัยยะสำคัญออกมาจากเอกสารหลายวิธี แต่อย่างไรก็ตามเมื่อมีการวัดประสิทธิผลที่ได้โดยใช้ Precision/Recall มาเป็นเครื่องมือวัดก็ยังได้ผลไม่ดีเพียงพอ สำหรับเอกสารบางประเภท และในงานวิจัยฉบับนี้ได้นำเสนอวิธีการนำ Thesaurus-Like Dictionary เรียกว่า DAEDW (Document Alignment with English Dictionary Wordlist) เข้ามาช่วยในการเลือก Keyword ที่มีนัยยะสำคัญออกมาจากเอกสาร หลังจากได้มีการกลั่นกรองเอาคำหยุด (Stopword) ออกไปแล้ว คำที่เหลือก็จะถูกแบ่งออกเป็นสองกลุ่ม กลุ่มแรกคือกลุ่มคำที่อยู่ในแฟ้มข้อมูล Thesaurus-Like dictionary และกลุ่มที่สองคือคำที่ไม่ปรากฏอยู่แฟ้มข้อมูล ซึ่งมักจะ เป็นชื่อเฉพาะและมักจะเป็น Keyword ที่มีนัยยะสำคัญสูงในเอกสาร นอกจากนั้นแฟ้มข้อมูล Thesaurus- Like Dictionary ยังสามารถเก็บรวบรวมคำศัพท์ที่มีความหมายเดียวกันได้ และ จากการที่ทดสอบด้วยเอกสารตัวอย่างเช่นข่าวและบทความ พบว่า DAEDW สามารถเพิ่มประสิทธิผล ในการค้นคืนเอกสารที่เกี่ยวข้อง เมื่อวัดด้วย Precision/Recall ได้ดี ทำให้ผลที่ได้คือ เอกสารที่ได้มีความเกี่ยวข้องกับเอกสารที่ผู้ใช้ใช้เป็นโจทย์มากขึ้น วิทยานิพนธ์ฉบับนี้ ได้กล่าวถึงรายละเอียดของ DAEDW รวมทั้งการวิเคราะห์การทำให้เป็นผลด้วยคอมพิวเตอร์ ผลการทดลอง การอภิปรายผล รวมทั้งแนวทางในการพัฒนาต่อไป

บรรณานุกรม :
ปรัชญา ยอดประสิทธิ์ . (2543). การค้นหาเอกสารที่มีเนื้อความคล้ายกันโดยใช้ตารางคำอภิธาน.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
ปรัชญา ยอดประสิทธิ์ . 2543. "การค้นหาเอกสารที่มีเนื้อความคล้ายกันโดยใช้ตารางคำอภิธาน".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
ปรัชญา ยอดประสิทธิ์ . "การค้นหาเอกสารที่มีเนื้อความคล้ายกันโดยใช้ตารางคำอภิธาน."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2543. Print.
ปรัชญา ยอดประสิทธิ์ . การค้นหาเอกสารที่มีเนื้อความคล้ายกันโดยใช้ตารางคำอภิธาน. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2543.