ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล
นักวิจัย : วราภรณ์ พรหมวิอินทร์
คำค้น : SPEAKER RECOGNITION , SPEAKER IDENTIFICATION
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2542
อ้างอิง : http://www.thaithesis.org/detail.php?id=44168
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

งานวิจัยนี้เป็นการนำเสนอการออกแบบต้นแบบของระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล คือกระบวนการที่ทำการบ่งชี้อย่างอัตโนมัติว่าใครคือผู้พูดโดยใช้การเทียบเคียงรูปแบบเสียง ของผู้พูดทดสอบเข้ากับรูปแบบเสียงของผู้พูดอ้างอิงในฐานข้อมูลซึ่งเป็นการจัดเก็บรูปแบบ เสียงจากกลุ่มผู้พูดที่ระบบรู้จัก ผลลัพธ์ที่ได้จากการตรวจรู้เสียงผู้พูดคือคนที่มีรูป แบบเสียงเข้ากันได้ดีที่สุดกับรูปแบบเสียงของผู้พูดทดสอบ การศึกษาระบบตรวจรู้เสียงพูดนี้ประกอบด้วย 3 ส่วนหลักคือ การสกัดตัวแปรจำเพาะ (feature extraction) การแบ่งส่วน (clustering) และการบ่งชี้ (identification) ในการสกัด ตัวแปรจำเพาะ ขั้นแรกจะตรวจจับเอาเฉพาะสัญญาณที่เป็นเสียงโดยใช้ ZCR (Short-time average zero-crossing rate) แล้วส่งสัญญาณที่ได้เข้า DFT (Discrete Fourier Transform) และทำ การแปลงเป็น PSD (Power spectrum density) จากนั้นค่า PSD จะถูกนำไปเป็นตัวอย่างในแง่ รูปแบบเสียงและถูกนำไปคำนวณหาค่ากระจายของคุณลักษณะเสียงโดยใช้ ML (Maximum likelihood procedure) เพื่อเป็นตัวอย่างในแง่สถิติ นอกเหนือจากนี้เรายังได้พัฒนาการระบุเพศของผู้ พูดโดยศึกษาการหาค่า pitch frequency value ที่สามารถคำนวณได้จากสมการ Auto-Correlation สำหรับการแบ่งส่วนใช้กลยุทธในการค้นหากลุ่มตัวอย่างของผู้พูดที่น่าจะมีรูปแบบเสียง คล้ายกับผู้พูดทดสอบ ขั้นตอนสุดท้ายเราจะใช้การเทียบเคียงรูปแบบเสียงของผู้พูดแต่ละคนใน กลุ่มตัวอย่าง (cohort set) เข้ากับรูปแบบเสียงของผู้พูดทดสอบ และกระบวนการตัดสินใจจะทำ การเลือกคนที่น่าจะใช่มากที่สุดออกมา งานวิจัยนี้ได้พัฒนาบนเครื่องคอมพิวเตอร์ส่วนบุคคล โดยเลือกภาษาไทยเป็นคำที่ใช้ทดสอบ ในสภาพแวดล้อมที่เงียบปราศจากเสียงรบกวน ระบบตรวจรู้เสียงพูดให้ผลถูกต้องสูงถึง 95% ขณะ ที่ผลผิดพลาดจะอยู่ในราว 5% ในแง่ของเวลาในการคำนวณ ระบบสามารถระบุผู้พูดได้ภายใน 30 วินาที ซึ่งก็ถือว่าไม่มากเมื่อเทียบกับสถานะการณ์จริงของคน นอกจากนี้ระบบยังต้องการพื้นที่จัด เก็บฐานข้อมูลน้อย ซึ่งเป็นเหตุผลในแง่ประสิทธิภาพการคำนวณดีขึ้นอีกด้วย

บรรณานุกรม :
วราภรณ์ พรหมวิอินทร์ . (2542). ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
วราภรณ์ พรหมวิอินทร์ . 2542. "ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
วราภรณ์ พรหมวิอินทร์ . "ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2542. Print.
วราภรณ์ พรหมวิอินทร์ . ระบบตรวจรู้เสียงพูดเพื่อระบุตัวบุคคล. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2542.