| ชื่อเรื่อง | : | Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition |
| นักวิจัย | : | Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong |
| คำค้น | : | Boosting technique , Ensemble learning , Machine learning , Text mining , Unknown word recognition , Word boundary detection |
| หน่วยงาน | : | สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2555 |
| อ้างอิง | : | Computers & mathematics with applications. 63,6 (2012) pp. 1117-1134 , 0898-1221 , http://dspace.library.tu.ac.th/handle/3517/6518 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | A boosting-based ensemble learning can be used to improve classification accuracy by using multiple classification models constructed to cope with errors obtained from their preceding steps. This paper proposes a method to improve boosting-based ensemble learning with penalty profiles via an application of automatic unknown word recognition in Thai language. Treating a sequential problem as a non-sequential problem, the unknown word recognition is required to include a process to rank a set of generated candidates for a potential unknown word position. To strengthen the recognition process with ensemble classification, the penalty profiles are defined to make it more efficient to construct a succeeding classification model which tends to re-rank a set of ranked candidates into a suitable order. As an evaluation, a number of alternative penalty profiles are introduced and their performances are compared for the task of extracting unknown words from a large Thai medical text. Using the Nave Bayes as the base classifier for ensemble learning, the proposed method with the best setting achieves an accuracy of 90.19%, which is an accuracy gap of 12.88, 10.59, and 6.05 over conventional Nave Bayes, non-ensemble version, and the flat-penalty profile. © 2012 Published by Elsevier Ltd. |
| บรรณานุกรม | : |
Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . (2555). Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition.
กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ . Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . 2555. "Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition".
กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ . Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . "Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition."
กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2555. Print. Jakkrit TeCho , Cholwich Nattee , Thanaruk Theeramunkong . Boosting-based ensemble learning with penalty profiles for automatic Thai unknown word recognition. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2555.
|
