ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล
นักวิจัย : มีลาภ เรืองรัตนวิชา
คำค้น : SPEECH COMPRESSION , LPC , CELP , PRE-LTP
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2539
อ้างอิง : http://www.thaithesis.org/detail.php?id=1082539000601
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

การวิจัยครั้งนี้มีวัตถุประสงค์หลักในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดซึ่งให้คุณภาพของเสียงพูดในระดับที่สูงเพียงพอสำหรับการประยุกต์ด้านการสื่อสาร หลักการทำงานของโปรแกรมที่พัฒนาขึ้นมีพื้นฐานมาจากวิธีการเข้ารหัสแบบทำนายเชิงเส้น (Linear Predictive Coding - LPC) วิธีการที่ใช้ได้แก่ แอลพีซี10 (LPC10) ซีอีแอลพี (CELP - Code ExcitedLinear Prediction) และ อาร์พีอี-แอลทีพี (RPE-LTP -Residual Pulse Excitation - Linear Prediction) ในขั้นแรกของการวิจัยได้พัฒนาโปรแกรมให้ทำงานอยู่บนคอมพิวเตอร์พีซีและรับข้อมูลเสียงพูดที่อยู่ในแฟ้มข้อมูลเวฟ (wavefile) เป็นข้อมูลเข้า สิ่งที่สนใจศึกษาได้แก่อัตราข้อมูลของรหัสที่ได้หลังการบีบข้อมูล ความซับซ้อนของขั้นตอนวิธี และคุณภาพของสัญญาณเสียงพูดที่ได้ หัวข้อเหล่านี้เป็นหลักเกณฑ์สำคัญในการเลือกวิธีที่เหมาะสมสำหรับการพัฒนาเป็นโปรแกรมบีบข้อมูลเสียงที่ทำงานแบบทันที (real time) ซึ่งจะทำงานบนตัวประมวลผลสัญญาณดิจิตอล ADSP2101 อัตราข้อมูลที่ได้สำหรับวิธีแอลพีซี10 คือ 2.4 Kbps สำหรับวิธีซีอีแอลพีคือ 4.8 Kbpsและสำหรับวิธีอาร์พีอี-แอลทีพีคือ 13 Kbps พบว่าวิธีซีอีแอลพี เป็นวิธีที่มีความซับซ้อนในการทำงานมากที่สุดรองลงมาคือวิธีอาร์พีอี-แอลทีพี ส่วนวิธีแอลพีซี10 มีความซับซ้อนน้อยที่สุด การเปรียบเทียบคุณภาพของเสียงพูดที่ได้ใช้คะแนนความเห็นจากผู้ทดสอบจำนวน 12 ท่าน ตัวอย่างเสียงพูดที่ใช้ในการทดลองเป็นเสียงชายหนึ่งตัวอย่าง และเสียงหญิงหนึ่งตัวอย่าง วิธีแอลพีซี10 ได้คะแนนเฉลี่ย 5.3วิธีซีอีแอลพีได้ 6.7 คะแนน ส่วนวิธีอาร์พีอีแอลทีพีได้คะแนนสูงสุดคือ 8.1 คะแนน ดังนั้นจึงได้เลือกวิธีอาร์พีอี-แอลทีพี ในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดแบบทันทีเนื่องจากมีเป็นวิธีที่ให้คุณภาพของเสียงพูดจัดว่าดีและการทำงานไม่ซับซ้อนมากนัก โปรแกรมดังกล่าวใช้เวลาประมาณ16.3 ms ในการบีบและคลายข้อมูลเสียงต่อหนึ่งเฟรม (frame)ซึ่งมีความยาว 20 ms

บรรณานุกรม :
มีลาภ เรืองรัตนวิชา . (2539). การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
มีลาภ เรืองรัตนวิชา . 2539. "การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
มีลาภ เรืองรัตนวิชา . "การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2539. Print.
มีลาภ เรืองรัตนวิชา . การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2539.