| ชื่อเรื่อง | : | A real-time Thai speech synthesizer on a mobile device |
| นักวิจัย | : | Konlakorn Wongpatikaseree Wongpatikaseree , Arunee Ratikan , Ausdang Thangthai , Ananlada Chotimongkol , Cholwich Nattee |
| คำค้น | : | Telephone systems , Computational linguistics , Database systems , Mobile devices , Natural language processing systems , Personal computers , Portable equipment , Telephone sets , Text-to-speech engines , TTS systems , Unit selection , Word segmentation |
| หน่วยงาน | : | สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2552 |
| อ้างอิง | : | 8th International Symposium on Natural Language Processing, SNLP '09. (2009) Art. No. 5340907, pp. 42-47 , 9781424441389 , http://dspace.library.tu.ac.th/handle/3517/4807 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | Several Thai TTS systems are already available on a resourceful platform such as a personal computer. However, porting these systems to a resource limited device such as a mobile phone is not an easy task. Practical aspects including application size and processing time have to be concerned. In this paper, we aim at developing a Thai speech synthesizer that can produce an output speech in real-time on a mobile device. Our synthesizer is based on Flite, an open source synthesis library developed by Carnegie Mellon University. Flite is suitable for a limited resource device as it is both small and fast. To use Flite as a text-to-speech engine for Thai, many components have to be modified. First, a word segmentation component and a Thai pronunciation dictionary are added to determine word boundaries and the pronunciation of each word in Thai input text. To minimize the resource, a simple word segmentation algorithm, a longest matching, is employed. Next, to handle the tones in Thai, we integrate tones with phones and define a tonal phone set for Thai. Lastly, a small Thai speech database is essential. For this, we transform a unit selection database into a diphone database by selecting only necessary diphones. We conducted an experiment to compare our speech synthesizer with pTalk, an HMM-based speech synthesizer, both in terms of speed and sound quality measured by a subjective listening test. While the quality of our output speech may not be as good as the output from pTalk, our system is much faster and more stable than pTalk. © 2009 IEEE. |
| บรรณานุกรม | : |
Konlakorn Wongpatikaseree Wongpatikaseree , Arunee Ratikan , Ausdang Thangthai , Ananlada Chotimongkol , Cholwich Nattee . (2552). A real-time Thai speech synthesizer on a mobile device.
กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ . Konlakorn Wongpatikaseree Wongpatikaseree , Arunee Ratikan , Ausdang Thangthai , Ananlada Chotimongkol , Cholwich Nattee . 2552. "A real-time Thai speech synthesizer on a mobile device".
กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ . Konlakorn Wongpatikaseree Wongpatikaseree , Arunee Ratikan , Ausdang Thangthai , Ananlada Chotimongkol , Cholwich Nattee . "A real-time Thai speech synthesizer on a mobile device."
กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ , 2552. Print. Konlakorn Wongpatikaseree Wongpatikaseree , Arunee Ratikan , Ausdang Thangthai , Ananlada Chotimongkol , Cholwich Nattee . A real-time Thai speech synthesizer on a mobile device. กรุงเทพมหานคร : สถาบันวิจัยและให้คำปรึกษาแห่ง มหาวิทยาลัยธรรมศาสตร์ ; 2552.
|
