| ชื่อเรื่อง | : | ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์ |
| นักวิจัย | : | ฐนียา สัตยพานิช |
| คำค้น | : | - |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2546 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=1162546001501 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | งานวิจัยนี้เสนอวิธีการรู้จำเสียงต่อเนื่องภาษาไทยแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์ โดยใช้วิธีการรู้จำที่ไม่มีการแบ่งเสียงต่อเนื่องเป็นพยางค์ อีเมล์เป็นแอพพลิเคชันที่มีคำสั่งงานแบ่งได้เป็น 2 ลักษณะ คือ คำสั่งงานแบบจำกัด และคำสั่งงานแบบไม่จำกัด คำสั่งงานแบบจำกัดเป็นคำสั่งงานหลักของแอพพลิเคชัน เช่น ลบจดหมาย อ่านจดหมาย เป็นต้น คำสั่งงานแบบไม่จำกัดเป็นคำสั่งงานซึ่งขึ้นกับผู้ใช้งาน เช่น อีเมล์แอดเดรส ชื่อไฟล์ เป็นต้น โดยในงานวิจัยนี้ได้กำหนดคำสั่งงานหลักภาษาไทยต่อเนื่องทั้งหมด 23 คำสั่ง เพื่อใช้ทดสอบประสิทธิภาพการรู้จำของระบบ ระบบรู้จำเสียงต่อเนื่องภาษาไทยนี้ประกอบด้วย 6 ส่วน คือ การประมวลผลสัญญาณดิจิตอล การดึงค่าคุณลักษณะสำคัญ เวกเตอร์ครอนไตเซชัน การฝึกฝนระบบ การรู้จำพยางค์ต่อเนื่อง และการรู้จำคำศัพท์ ซึ่งมีกระบวนการทำงานดังนี้ การประมวลผลสัญญาณเบื้องต้น คือการวางกรอบสัญญาณเพื่อเตรียมข้อมูลเสียงให้เหมาะสมกับการดึงค่าคุณลักษณะสำคัญ ค่าคุณลักษณะสำคัญที่นำมาใช้คือ ค่าสัมประสิทธิ์เซปสตรัมบนสเกลเมล และการเปลี่ยนแปลงทางเวลาของสัมประสิทธิ์เซปสตรัมบนสเกลเมล ค่าคุณลักษณะสำคัญที่ได้จากแต่ละกรอบสัญญาณถูกนำมาควอนไตซ์เพื่อเรียนรู้และหาตัวแทนของเสียงในรูปสัญลักษณ์ด้วยหลักการเวกเตอร์ควอนไตเซชัน หลังจากนั้นจึงเริ่มการฝึกฝนระบบตามทฤษฎีแบบจำลองฮิดเด็นมาร์คอฟด้วยสัญลักษณ์ในชุดรหัส แบบจำลองที่ออกแบบอยู่ในระดับพยางค์และมี 3 สถานะ สถานะแรก คือพยัญชนะต้น สถานะที่สองคือสระ และสถานะที่สามคือ ตัวสะกด ในขั้นตอนการรู้จำเสียงต่อเนื่องนั้น งานวิจัยนี้ได้เสนอวิธีการรู้จำแบบไม่มีการตัดแบ่งเสียงโดยนำอัลกอริธึมการสร้างระดับมาประยุกต์ใช้ เพื่อทำหน้าที่ในการกำหนดขอบเขตของพยางค์แต่ละพยางค์ในเสียงต่อเนื่องและนำพยางค์มารู้จำกับแบบจำลองที่ได้ฝึกฝนไว้ จากขั้นตอนนี้จะได้ชุดคำศัพท์ ที่มีความเป็นไปได้ หลังจากนั้นส่วนรู้จำคำศัพท์จะทำหน้าที่เลือกคำศัพท์ที่ถูกต้องที่สุดจากชุดคำศัพท์โดยการคำนวณความน่าจะเป็นที่อาศัยข้อมูลความถี่ของพยางค์จากฐานข้อมูลคำศัพท์ในการพิจารณา จากการทดสอบระบบกับคำสั่งงานหลักซึ่งเป็นเสียงต่อเนื่องทั้งหมด 23 คำสั่ง ที่มีความยาว 1-4 พยางค์ แยกเป็นพยางค์เดี่ยวได้ทั้งหมด 40 พยางค์ พบว่าจำนวนสัมประสิทธิ์เซปสตรัมบนสเกลเมลเท่ากับ 18 ค่า คือจำนวนสัมประสิทธิ์ที่มีค่าน้อยที่สุดที่ยังคงได้อัตราการรู้จำสูงระบบสามารถรู้จำเสียงต่อเนื่องโดยได้อัตราการรู้จำที่ความยาว 4 พยางค์, 3 พยางค์, 2 พยางค์ และ 1 พยางค์เท่ากับ 85.00%, 90.00%, 96.15% และ 97.50% ตามลำดับ และเมื่อทดสอบกับผู้ใช้ทั้งหมด 12 คน ได้อัตราการรู้จำเสียงเฉลี่ยเท่ากับ 87.88% ระบบเริ่มมีอัตราการรู้จำคงที่เมื่อใช้เสียงในการฝึกฝน 9 ครั้ง/พยางค์สำหรับผู้พูดเพศหญิงและ 21 ครั้ง/พยางค์สำหรับผู้พูดเพศชาย |
| บรรณานุกรม | : |
ฐนียา สัตยพานิช . (2546). ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ฐนียา สัตยพานิช . 2546. "ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ฐนียา สัตยพานิช . "ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2546. Print. ฐนียา สัตยพานิช . ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2546.
|
