| ชื่อเรื่อง | : | Statistical Parametric Speech Synthesis Using Deep Neural Network |
| นักวิจัย | : | Ge, Mengtian |
| คำค้น | : | Deep Neural Network , Speech Synthesis |
| หน่วยงาน | : | Edinburgh Research Archive, United Kingdom |
| ผู้ร่วมงาน | : | Lu, Heng , King, Simon |
| ปีพิมพ์ | : | 2556 |
| อ้างอิง | : | http://hdl.handle.net/1842/8658 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | In this work, we implement a deep neural network for the text-to-speech system. We have tried different parameter settings for the DNN layers and units, and find that the three-layer DNN works better than the four-layer ones. We also pre-trained the best three-layer system (1000-1000-1000), and both objective and subjective test results show significant improvement in the synthesizing quality after pre-training. The final pre-trained system obtains an average linear spectral pair (LSP) root mean square error (RMSE) of 0.179096, beating the DNN-TTS benchmark of 0.187225. |
| บรรณานุกรม | : |
Ge, Mengtian . (2556). Statistical Parametric Speech Synthesis Using Deep Neural Network.
กรุงเทพมหานคร : Edinburgh Research Archive, United Kingdom . Ge, Mengtian . 2556. "Statistical Parametric Speech Synthesis Using Deep Neural Network".
กรุงเทพมหานคร : Edinburgh Research Archive, United Kingdom . Ge, Mengtian . "Statistical Parametric Speech Synthesis Using Deep Neural Network."
กรุงเทพมหานคร : Edinburgh Research Archive, United Kingdom , 2556. Print. Ge, Mengtian . Statistical Parametric Speech Synthesis Using Deep Neural Network. กรุงเทพมหานคร : Edinburgh Research Archive, United Kingdom ; 2556.
|
