ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

Exploration of document relation quality with consideration of term representation basis, term weighting and association measure

หน่วยงาน สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์

รายละเอียด

ชื่อเรื่อง : Exploration of document relation quality with consideration of term representation basis, term weighting and association measure
นักวิจัย : Nichnan Kittiphattanabawon , Thanaruk Theeramunkong , Ekawit Nantajeewarawat
คำค้น : Association rules , Association Rule Mining , Document Relation , News Relation
หน่วยงาน : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์
ผู้ร่วมงาน : -
ปีพิมพ์ : 2553
อ้างอิง : Intelligence and security informatics : Pacific Asia Workshop, PAISI 2010, Hyderabad, India, June 21, 2010. pp. 126-139 , 3642136001 , 9783642136009 , 0302-9743 , http://dspace.library.tu.ac.th/handle/3517/4543
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : Lecture notes in computer science ; 6122
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

Tracking and relating news articles from several sources can play against misinformation from deceptive news stories since single source can not judge whether the information is a truth or not. Preventing misinformation in a computer system is an interesting research in intelligence and security informatics. For this task, association rule mining has been recently applied due to its performance and scalability. This paper presents an exploration on how term representation basis, term weighting and association measure affect the quality of relations discovered among news articles from several sources. Twenty four combinations initiated by two term representation bases, four term weightings, and three association measures are explored with their results compared to human judgement. A number of evaluations are conducted to compare each combination's performance to the others' with regard to top-k ranks. The experimental results indicate that a combination of bigram (BG), term frequency with inverse document frequency (TFIDF) and confidence (CONF), as well as a combination of BG, TFIDF and conviction (CONV), achieves the best performance to find the related documents by placing them in upper ranks with 0.41% rank-order mismatch on top-50 mined relations. However, a combination of unigram (UG), TFIDF and lift (LIFT) performs the best by locating irrelevant relations in lower ranks (top-1100) with rank-order mismatch of 9.63 %. © 2010 Springer-Verlag.

บรรณานุกรม :
Nichnan Kittiphattanabawon , Thanaruk Theeramunkong , Ekawit Nantajeewarawat . (2553). Exploration of document relation quality with consideration of term representation basis, term weighting and association measure.
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Nichnan Kittiphattanabawon , Thanaruk Theeramunkong , Ekawit Nantajeewarawat . 2553. "Exploration of document relation quality with consideration of term representation basis, term weighting and association measure".
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ .
Nichnan Kittiphattanabawon , Thanaruk Theeramunkong , Ekawit Nantajeewarawat . "Exploration of document relation quality with consideration of term representation basis, term weighting and association measure."
    กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2553. Print.
Nichnan Kittiphattanabawon , Thanaruk Theeramunkong , Ekawit Nantajeewarawat . Exploration of document relation quality with consideration of term representation basis, term weighting and association measure. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2553.