| ชื่อเรื่อง | : | การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล |
| นักวิจัย | : | มีลาภ เรืองรัตนวิชา |
| คำค้น | : | SPEECH COMPRESSION , LPC , CELP , PRE-LTP |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2539 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=1082539000601 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | การวิจัยครั้งนี้มีวัตถุประสงค์หลักในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดซึ่งให้คุณภาพของเสียงพูดในระดับที่สูงเพียงพอสำหรับการประยุกต์ด้านการสื่อสาร หลักการทำงานของโปรแกรมที่พัฒนาขึ้นมีพื้นฐานมาจากวิธีการเข้ารหัสแบบทำนายเชิงเส้น (Linear Predictive Coding - LPC) วิธีการที่ใช้ได้แก่ แอลพีซี10 (LPC10) ซีอีแอลพี (CELP - Code ExcitedLinear Prediction) และ อาร์พีอี-แอลทีพี (RPE-LTP -Residual Pulse Excitation - Linear Prediction) ในขั้นแรกของการวิจัยได้พัฒนาโปรแกรมให้ทำงานอยู่บนคอมพิวเตอร์พีซีและรับข้อมูลเสียงพูดที่อยู่ในแฟ้มข้อมูลเวฟ (wavefile) เป็นข้อมูลเข้า สิ่งที่สนใจศึกษาได้แก่อัตราข้อมูลของรหัสที่ได้หลังการบีบข้อมูล ความซับซ้อนของขั้นตอนวิธี และคุณภาพของสัญญาณเสียงพูดที่ได้ หัวข้อเหล่านี้เป็นหลักเกณฑ์สำคัญในการเลือกวิธีที่เหมาะสมสำหรับการพัฒนาเป็นโปรแกรมบีบข้อมูลเสียงที่ทำงานแบบทันที (real time) ซึ่งจะทำงานบนตัวประมวลผลสัญญาณดิจิตอล ADSP2101 อัตราข้อมูลที่ได้สำหรับวิธีแอลพีซี10 คือ 2.4 Kbps สำหรับวิธีซีอีแอลพีคือ 4.8 Kbpsและสำหรับวิธีอาร์พีอี-แอลทีพีคือ 13 Kbps พบว่าวิธีซีอีแอลพี เป็นวิธีที่มีความซับซ้อนในการทำงานมากที่สุดรองลงมาคือวิธีอาร์พีอี-แอลทีพี ส่วนวิธีแอลพีซี10 มีความซับซ้อนน้อยที่สุด การเปรียบเทียบคุณภาพของเสียงพูดที่ได้ใช้คะแนนความเห็นจากผู้ทดสอบจำนวน 12 ท่าน ตัวอย่างเสียงพูดที่ใช้ในการทดลองเป็นเสียงชายหนึ่งตัวอย่าง และเสียงหญิงหนึ่งตัวอย่าง วิธีแอลพีซี10 ได้คะแนนเฉลี่ย 5.3วิธีซีอีแอลพีได้ 6.7 คะแนน ส่วนวิธีอาร์พีอีแอลทีพีได้คะแนนสูงสุดคือ 8.1 คะแนน ดังนั้นจึงได้เลือกวิธีอาร์พีอี-แอลทีพี ในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดแบบทันทีเนื่องจากมีเป็นวิธีที่ให้คุณภาพของเสียงพูดจัดว่าดีและการทำงานไม่ซับซ้อนมากนัก โปรแกรมดังกล่าวใช้เวลาประมาณ16.3 ms ในการบีบและคลายข้อมูลเสียงต่อหนึ่งเฟรม (frame)ซึ่งมีความยาว 20 ms |
| บรรณานุกรม | : |
มีลาภ เรืองรัตนวิชา . (2539). การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. มีลาภ เรืองรัตนวิชา . 2539. "การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. มีลาภ เรืองรัตนวิชา . "การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2539. Print. มีลาภ เรืองรัตนวิชา . การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2539.
|
