| ชื่อเรื่อง | : | ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล |
| นักวิจัย | : | วราภรณ์ พรหมวิอินทร์ |
| คำค้น | : | SPEAKER RECOGNITION , SPEAKER IDENTIFICATION |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2542 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=44168 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | งานวิจัยนี้เป็นการนำเสนอการออกแบบต้นแบบของระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล คือกระบวนการที่ทำการบ่งชี้อย่างอัตโนมัติว่าใครคือผู้พูดโดยใช้การเทียบเคียงรูปแบบเสียง ของผู้พูดทดสอบเข้ากับรูปแบบเสียงของผู้พูดอ้างอิงในฐานข้อมูลซึ่งเป็นการจัดเก็บรูปแบบ เสียงจากกลุ่มผู้พูดที่ระบบรู้จัก ผลลัพธ์ที่ได้จากการตรวจรู้เสียงผู้พูดคือคนที่มีรูป แบบเสียงเข้ากันได้ดีที่สุดกับรูปแบบเสียงของผู้พูดทดสอบ การศึกษาระบบตรวจรู้เสียงพูดนี้ประกอบด้วย 3 ส่วนหลักคือ การสกัดตัวแปรจำเพาะ (feature extraction) การแบ่งส่วน (clustering) และการบ่งชี้ (identification) ในการสกัด ตัวแปรจำเพาะ ขั้นแรกจะตรวจจับเอาเฉพาะสัญญาณที่เป็นเสียงโดยใช้ ZCR (Short-time average zero-crossing rate) แล้วส่งสัญญาณที่ได้เข้า DFT (Discrete Fourier Transform) และทำ การแปลงเป็น PSD (Power spectrum density) จากนั้นค่า PSD จะถูกนำไปเป็นตัวอย่างในแง่ รูปแบบเสียงและถูกนำไปคำนวณหาค่ากระจายของคุณลักษณะเสียงโดยใช้ ML (Maximum likelihood procedure) เพื่อเป็นตัวอย่างในแง่สถิติ นอกเหนือจากนี้เรายังได้พัฒนาการระบุเพศของผู้ พูดโดยศึกษาการหาค่า pitch frequency value ที่สามารถคำนวณได้จากสมการ Auto-Correlation สำหรับการแบ่งส่วนใช้กลยุทธในการค้นหากลุ่มตัวอย่างของผู้พูดที่น่าจะมีรูปแบบเสียง คล้ายกับผู้พูดทดสอบ ขั้นตอนสุดท้ายเราจะใช้การเทียบเคียงรูปแบบเสียงของผู้พูดแต่ละคนใน กลุ่มตัวอย่าง (cohort set) เข้ากับรูปแบบเสียงของผู้พูดทดสอบ และกระบวนการตัดสินใจจะทำ การเลือกคนที่น่าจะใช่มากที่สุดออกมา งานวิจัยนี้ได้พัฒนาบนเครื่องคอมพิวเตอร์ส่วนบุคคล โดยเลือกภาษาไทยเป็นคำที่ใช้ทดสอบ ในสภาพแวดล้อมที่เงียบปราศจากเสียงรบกวน ระบบตรวจรู้เสียงพูดให้ผลถูกต้องสูงถึง 95% ขณะ ที่ผลผิดพลาดจะอยู่ในราว 5% ในแง่ของเวลาในการคำนวณ ระบบสามารถระบุผู้พูดได้ภายใน 30 วินาที ซึ่งก็ถือว่าไม่มากเมื่อเทียบกับสถานะการณ์จริงของคน นอกจากนี้ระบบยังต้องการพื้นที่จัด เก็บฐานข้อมูลน้อย ซึ่งเป็นเหตุผลในแง่ประสิทธิภาพการคำนวณดีขึ้นอีกด้วย |
| บรรณานุกรม | : |
วราภรณ์ พรหมวิอินทร์ . (2542). ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วราภรณ์ พรหมวิอินทร์ . 2542. "ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วราภรณ์ พรหมวิอินทร์ . "ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2542. Print. วราภรณ์ พรหมวิอินทร์ . ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2542.
|
