ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง	:	ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล
นักวิจัย	:	วราภรณ์ พรหมวิอินทร์
คำค้น	:	SPEAKER RECOGNITION , SPEAKER IDENTIFICATION
หน่วยงาน	:	ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน	:	-
ปีพิมพ์	:	2542
อ้างอิง	:	http://www.thaithesis.org/detail.php?id=44168
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	งานวิจัยนี้เป็นการนำเสนอการออกแบบต้นแบบของระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล คือกระบวนการที่ทำการบ่งชี้อย่างอัตโนมัติว่าใครคือผู้พูดโดยใช้การเทียบเคียงรูปแบบเสียง ของผู้พูดทดสอบเข้ากับรูปแบบเสียงของผู้พูดอ้างอิงในฐานข้อมูลซึ่งเป็นการจัดเก็บรูปแบบ เสียงจากกลุ่มผู้พูดที่ระบบรู้จัก ผลลัพธ์ที่ได้จากการตรวจรู้เสียงผู้พูดคือคนที่มีรูป แบบเสียงเข้ากันได้ดีที่สุดกับรูปแบบเสียงของผู้พูดทดสอบ การศึกษาระบบตรวจรู้เสียงพูดนี้ประกอบด้วย 3 ส่วนหลักคือ การสกัดตัวแปรจำเพาะ (feature extraction) การแบ่งส่วน (clustering) และการบ่งชี้ (identification) ในการสกัด ตัวแปรจำเพาะ ขั้นแรกจะตรวจจับเอาเฉพาะสัญญาณที่เป็นเสียงโดยใช้ ZCR (Short-time average zero-crossing rate) แล้วส่งสัญญาณที่ได้เข้า DFT (Discrete Fourier Transform) และทำ การแปลงเป็น PSD (Power spectrum density) จากนั้นค่า PSD จะถูกนำไปเป็นตัวอย่างในแง่ รูปแบบเสียงและถูกนำไปคำนวณหาค่ากระจายของคุณลักษณะเสียงโดยใช้ ML (Maximum likelihood procedure) เพื่อเป็นตัวอย่างในแง่สถิติ นอกเหนือจากนี้เรายังได้พัฒนาการระบุเพศของผู้ พูดโดยศึกษาการหาค่า pitch frequency value ที่สามารถคำนวณได้จากสมการ Auto-Correlation สำหรับการแบ่งส่วนใช้กลยุทธในการค้นหากลุ่มตัวอย่างของผู้พูดที่น่าจะมีรูปแบบเสียง คล้ายกับผู้พูดทดสอบ ขั้นตอนสุดท้ายเราจะใช้การเทียบเคียงรูปแบบเสียงของผู้พูดแต่ละคนใน กลุ่มตัวอย่าง (cohort set) เข้ากับรูปแบบเสียงของผู้พูดทดสอบ และกระบวนการตัดสินใจจะทำ การเลือกคนที่น่าจะใช่มากที่สุดออกมา งานวิจัยนี้ได้พัฒนาบนเครื่องคอมพิวเตอร์ส่วนบุคคล โดยเลือกภาษาไทยเป็นคำที่ใช้ทดสอบ ในสภาพแวดล้อมที่เงียบปราศจากเสียงรบกวน ระบบตรวจรู้เสียงพูดให้ผลถูกต้องสูงถึง 95% ขณะ ที่ผลผิดพลาดจะอยู่ในราว 5% ในแง่ของเวลาในการคำนวณ ระบบสามารถระบุผู้พูดได้ภายใน 30 วินาที ซึ่งก็ถือว่าไม่มากเมื่อเทียบกับสถานะการณ์จริงของคน นอกจากนี้ระบบยังต้องการพื้นที่จัด เก็บฐานข้อมูลน้อย ซึ่งเป็นเหตุผลในแง่ประสิทธิภาพการคำนวณดีขึ้นอีกด้วย
บรรณานุกรม	:	APA Chicago MLA Vancouver วราภรณ์ พรหมวิอินทร์ . (2542). ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วราภรณ์ พรหมวิอินทร์ . 2542. "ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล". กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วราภรณ์ พรหมวิอินทร์ . "ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล." กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2542. Print. วราภรณ์ พรหมวิอินทร์ . ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2542.