ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Information extraction from Thai text with unknown phrase boundaries

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Information extraction from Thai text with unknown phrase boundaries
นักวิจัย : Peerasak Intarapaiboon , Ekawit Nantajeewarawat , Thanaruk Theeramunkong
คำค้น : Thai textual phrases , Average length , Extraction rule , Filtering technique , Frame extraction , Information Extraction; , Phrase boundary , Rule application , Rule learning algorithms; Sliding-window , Text document , Unknown boundary
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2552
อ้างอิง : Advances in knowledge discovery and data mining : 13th Pacific-Asia Conference, PAKDD 2009, Bangkok, Thailand, April 27-30, 2009. pp. 525-532 , 3642013066 , 9783642013065 , 03029743 , http://dspace.library.tu.ac.th/handle/3517/4947
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

Using sliding-window rule application and extraction filtering techniques, we propose a framework for extracting semantic frames from Thai textual phrases with unknown boundaries based on patterns of triggering terms. A supervised rule learning algorithm is used for constructing multi-slot extraction rules from hand-tagged training phrases. A filtering module is introduced for predicting rule application across phrase boundaries based on instantiation features of rule internal wildcards. The framework is applied to text documents in three domains with different target-phrase density and average lengths. The experimental results show that the filtering module improves precision and preserves high recall satisfactorily, yielding extraction performance comparable to frame extraction with manually identified phrase boundaries. © Springer-Verlag Berlin Heidelberg 2009.

บรรณานุกรม :
Peerasak Intarapaiboon , Ekawit Nantajeewarawat , Thanaruk Theeramunkong . (2552). Information extraction from Thai text with unknown phrase boundaries.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Peerasak Intarapaiboon , Ekawit Nantajeewarawat , Thanaruk Theeramunkong . 2552. "Information extraction from Thai text with unknown phrase boundaries".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Peerasak Intarapaiboon , Ekawit Nantajeewarawat , Thanaruk Theeramunkong . "Information extraction from Thai text with unknown phrase boundaries."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2552. Print.
Peerasak Intarapaiboon , Ekawit Nantajeewarawat , Thanaruk Theeramunkong . Information extraction from Thai text with unknown phrase boundaries. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2552.