การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง	:	การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล
นักวิจัย	:	มีลาภ เรืองรัตนวิชา
คำค้น	:	SPEECH COMPRESSION , LPC , CELP , PRE-LTP
หน่วยงาน	:	ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน	:	-
ปีพิมพ์	:	2539
อ้างอิง	:	http://www.thaithesis.org/detail.php?id=1082539000601
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	การวิจัยครั้งนี้มีวัตถุประสงค์หลักในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดซึ่งให้คุณภาพของเสียงพูดในระดับที่สูงเพียงพอสำหรับการประยุกต์ด้านการสื่อสาร หลักการทำงานของโปรแกรมที่พัฒนาขึ้นมีพื้นฐานมาจากวิธีการเข้ารหัสแบบทำนายเชิงเส้น (Linear Predictive Coding - LPC) วิธีการที่ใช้ได้แก่ แอลพีซี10 (LPC10) ซีอีแอลพี (CELP - Code ExcitedLinear Prediction) และ อาร์พีอี-แอลทีพี (RPE-LTP -Residual Pulse Excitation - Linear Prediction) ในขั้นแรกของการวิจัยได้พัฒนาโปรแกรมให้ทำงานอยู่บนคอมพิวเตอร์พีซีและรับข้อมูลเสียงพูดที่อยู่ในแฟ้มข้อมูลเวฟ (wavefile) เป็นข้อมูลเข้า สิ่งที่สนใจศึกษาได้แก่อัตราข้อมูลของรหัสที่ได้หลังการบีบข้อมูล ความซับซ้อนของขั้นตอนวิธี และคุณภาพของสัญญาณเสียงพูดที่ได้ หัวข้อเหล่านี้เป็นหลักเกณฑ์สำคัญในการเลือกวิธีที่เหมาะสมสำหรับการพัฒนาเป็นโปรแกรมบีบข้อมูลเสียงที่ทำงานแบบทันที (real time) ซึ่งจะทำงานบนตัวประมวลผลสัญญาณดิจิตอล ADSP2101 อัตราข้อมูลที่ได้สำหรับวิธีแอลพีซี10 คือ 2.4 Kbps สำหรับวิธีซีอีแอลพีคือ 4.8 Kbpsและสำหรับวิธีอาร์พีอี-แอลทีพีคือ 13 Kbps พบว่าวิธีซีอีแอลพี เป็นวิธีที่มีความซับซ้อนในการทำงานมากที่สุดรองลงมาคือวิธีอาร์พีอี-แอลทีพี ส่วนวิธีแอลพีซี10 มีความซับซ้อนน้อยที่สุด การเปรียบเทียบคุณภาพของเสียงพูดที่ได้ใช้คะแนนความเห็นจากผู้ทดสอบจำนวน 12 ท่าน ตัวอย่างเสียงพูดที่ใช้ในการทดลองเป็นเสียงชายหนึ่งตัวอย่าง และเสียงหญิงหนึ่งตัวอย่าง วิธีแอลพีซี10 ได้คะแนนเฉลี่ย 5.3วิธีซีอีแอลพีได้ 6.7 คะแนน ส่วนวิธีอาร์พีอีแอลทีพีได้คะแนนสูงสุดคือ 8.1 คะแนน ดังนั้นจึงได้เลือกวิธีอาร์พีอี-แอลทีพี ในการพัฒนาโปรแกรมบีบข้อมูลเสียงพูดแบบทันทีเนื่องจากมีเป็นวิธีที่ให้คุณภาพของเสียงพูดจัดว่าดีและการทำงานไม่ซับซ้อนมากนัก โปรแกรมดังกล่าวใช้เวลาประมาณ16.3 ms ในการบีบและคลายข้อมูลเสียงต่อหนึ่งเฟรม (frame)ซึ่งมีความยาว 20 ms
บรรณานุกรม	:	APA Chicago MLA Vancouver มีลาภ เรืองรัตนวิชา . (2539). การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. มีลาภ เรืองรัตนวิชา . 2539. "การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล". กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. มีลาภ เรืองรัตนวิชา . "การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล." กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2539. Print. มีลาภ เรืองรัตนวิชา . การทำขั้นตอนวิธีบีบข้อมูลเสียงพูดโดยการประมวลผลสัญญาณดิจิตอล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2539.