| ชื่อเรื่อง | : | การพัฒนาระบบสกัดข้อสนเทศและความรู้จากเอกสารไร้โครงสร้างภาษาไทย |
| นักวิจัย | : | อัศนีย์ ก่อตระกูล , Asanee Kawtrakul |
| คำค้น | : | Information system , Information, computing and communication sciences , Knowledge engineering , ระบบการจัดเก็บและค้นข้อสนเทศ , วิศวกรรมความรู้ , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ , สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์ |
| หน่วยงาน | : | สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2550 |
| อ้างอิง | : | http://www.nstda.or.th/thairesearch/node/817 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | ปัจจุบันเอกสาร บทความ และรายงานแบบไร้โครงสร้างในรูปอิเล็กทรอนิกส์ มีเป็นจำนวนมากและอยู่อย่างกระจัดกระจาย เอกสารเหล่านี้มีแนวโน้มเพิ่มขึ้นอย่างรวดเร็วจนผู้อ่านไม่สามารถติดตามได้ ทันเวลา โดยเฉพาะอย่างยิ่งเอกสารภายในองค์กร ไม่เพียงแต่เป็นแหล่งข้อมูลและข้อสนเทศที่สำคัญ หากยังเป็นที่สะสมความรู้เฉพาะด้านภายในองค์กรที่เก็บเกี่ยวมาจากประสบการณ์ ที่หาไม่ได้จากเอกสารหรือตำราทั่วไป เช่นเอกสารที่เกี่ยวข้องกับปัญหาและการแก้ไขปัญหา หรือ การทำงานกับผลการดำเนินการ การค้นคืนเอกสารโดยวิธีเดิม (full text retrieval) จะให้ผลลัพธ์ที่มีทั้งน้อยเกินไป หากคำค้นไม่ตรงกับคำที่ใช้ในเอกสารซึ่งมีรูปหลากหลายทั้งที่มีความหมายเหมือนกัน (synonym) และ ให้ผลลัพธ์มากเกินไป หากไม่คัดแยกเอกสารที่ไม่มีความสัมพันธ์หรือตรงกับความต้องการของผู้ค้นนั้นออกไป นอกจากนี้ระบบค้นคืนเอกสารในปัจจุบัน ยังให้ผลลัพธ์เฉพาะเอกสารรูปเต็มเท่านั้น ไม่สามารถสรุปใจความสำคัญและความรู้ได้ ทำให้การติดตามข่าวสารที่มีอยู่มากมายต้องใช้เวลาและประมวลผลโดยผู้อ่านเอง อีกทั้งองค์ความรู้ที่อยู่อย่างกระจัดกระจายนั้น ไม่สามารถนำจัดระเบียบความสัมพันธ์ที่สามารถนำมาใช้ประโยชน์ได้อย่างเต็มที่ ดังนั้นระบบสืบค้นเอกสารที่มีประสิทธิภาพ ควรมีคุณสมบัติเพิ่มเติมดังนี้ 1. สามารถสืบค้นเอกสารด้วยเอกสารแทนการใช้คำค้น (Automated Querying) เพื่อค้นหากลุ่มเอกสารที่คล้ายคลึงกันหรือใกล้เคียงกัน ทำให้ผู้ใช้ไม่ต้องกังวลในเรื่องของการสร้างคำค้นตามรูปแบบหรือไวยากรณ์ของระบบ 2. สามารถสกัดเฉพาะข้อสนเทศสำคัญของเอกสารผลลัพธ์ (Information Extraction) ทำให้ผู้ใช้ตัดสินใจเลือกอ่านได้เร็วขึ้น 3. สามารถกำหนดความสัมพันธ์ของเอกสารผลลัพธ์ และจัดเส้นทางหรือความต่อเนื่องของเอกสารได้หลายมุมมอง ทำให้ผู้อ่านเข้าใจและเรียนรู้ได้เร็วขึ้นหรือได้ความรู้มากขึ้น(Multi- viewpoints Knowledge Tracking) เช่น การจัดกลุ่มตามช่วงเวลา ตามสาเหตุของปัญหา ตามวิธีการแก้ปัญหา หรือตามกลุ่มที่ผู้อ่านต้องการ 4. สามารถสร้างแฟ้มเอกสารตามลักษณะของผู้ใช้ (User Profiling) 5. สามารถสร้างลำดับชั้นของเอกสาร (Document Taxonomies) 6' สามารถสรุปความรู้จากเอกสาร (Knowledge Summarization) โครงการวิจัยนี้จึงมีวัตถุประสงค์ ที่จะศึกษาวิจัย พัฒนา และปรับปรุงเทคนิค ด้านวิศวกรรมภาษา (Language Engineering) เช่น การประมวลผลคำอ้างอิง (Anaphora Resolution) การวิเคราะห์วลีแก่น การรู้จำชื่อเฉพาะ การประมวลผลบทความ (Discourse Processing) เป็นต้น และวิศวกรรมความรู้ (Knowledge Engineering) เช่น เทคนิคการสกัดข้อสนเทศและความรู้ การสร้างภาษาและซอฟต์แวร์เครื่องมือเพื่อบริหารจัดการความรู้ และบำรุงรักษาฐานความรอบรู้ เป็นต้น เพื่อนำไปบูรณาการใช้สำหรับพัฒนาระบบสกัดข้อสนเทศและความรู้จากเอกสารภาษาไทยสำหรับองค์กร ที่สามารถ วิเคราะห์ คัดแยก รวบรวมแก่นสำคัญ และเหนี่ยวนำความรู้เฉพาะด้าน ทำให้ผู้อ่านสามารถประหยัดเวลาในการอ่านและติดตามการเคลื่อนไหวของข่าวสาร ได้อย่างต่อเนื่อง และทำให้องค์กรประหยัดเวลาในการบริหารจัดการองค์ความรู้เพื่อใช้ภายในองค์กร รวมทั้งเผยแพร่หรือแลกเปลี่ยนกับหน่วยงานอื่นเพื่อสร้างแหล่งภูมิปัญญาที่ เกิดจากการปฏิบัติงาน ประโยชน์ที่คาดว่าจะได้รับจากโครงการนี้ คือ การพัฒนาเทคโนโลยีและนักวิจัย ด้านวิศวกรรมภาษาและวิศวกรรมความรู้ การสร้างเครือข่ายงานวิจัยที่ขยายวงกว้างขึ้น การนำงานวิจัยสู่การใช้งานจริง ได้แก่ การสร้างระบบต้นแบบในการสกัดข้อสนเทศและสรุปความรู้จากเอกสารไร้โครงสร้าง การสร้างบุคลากรด้านวิจัยทั้งในระดับปริญญาเอก โท และ ตรี ด้านวิศวกรรมภาษาและความรอบรู้ ที่สามารถทำงานแบบต่อยอด โดยมีเป้าหมายใน การจัดตั้งศูนย์วิจัยวิศวกรรมภาษาและการประยุกต์ใช้งานเพื่อทำงานร่วมกัน ระหว่างสถาบันเมื่อสิ้นสุดโครงการ |
| บรรณานุกรม | : |
อัศนีย์ ก่อตระกูล , Asanee Kawtrakul . (2550). การพัฒนาระบบสกัดข้อสนเทศและความรู้จากเอกสารไร้โครงสร้างภาษาไทย.
ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. อัศนีย์ ก่อตระกูล , Asanee Kawtrakul . 2550. "การพัฒนาระบบสกัดข้อสนเทศและความรู้จากเอกสารไร้โครงสร้างภาษาไทย".
ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. อัศนีย์ ก่อตระกูล , Asanee Kawtrakul . "การพัฒนาระบบสกัดข้อสนเทศและความรู้จากเอกสารไร้โครงสร้างภาษาไทย."
ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2550. Print. อัศนีย์ ก่อตระกูล , Asanee Kawtrakul . การพัฒนาระบบสกัดข้อสนเทศและความรู้จากเอกสารไร้โครงสร้างภาษาไทย. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2550.
|
