ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง	:	ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์
นักวิจัย	:	ฐนียา สัตยพานิช
คำค้น	:	-
หน่วยงาน	:	ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน	:	-
ปีพิมพ์	:	2546
อ้างอิง	:	http://www.thaithesis.org/detail.php?id=1162546001501
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	งานวิจัยนี้เสนอวิธีการรู้จำเสียงต่อเนื่องภาษาไทยแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์ โดยใช้วิธีการรู้จำที่ไม่มีการแบ่งเสียงต่อเนื่องเป็นพยางค์ อีเมล์เป็นแอพพลิเคชันที่มีคำสั่งงานแบ่งได้เป็น 2 ลักษณะ คือ คำสั่งงานแบบจำกัด และคำสั่งงานแบบไม่จำกัด คำสั่งงานแบบจำกัดเป็นคำสั่งงานหลักของแอพพลิเคชัน เช่น ลบจดหมาย อ่านจดหมาย เป็นต้น คำสั่งงานแบบไม่จำกัดเป็นคำสั่งงานซึ่งขึ้นกับผู้ใช้งาน เช่น อีเมล์แอดเดรส ชื่อไฟล์ เป็นต้น โดยในงานวิจัยนี้ได้กำหนดคำสั่งงานหลักภาษาไทยต่อเนื่องทั้งหมด 23 คำสั่ง เพื่อใช้ทดสอบประสิทธิภาพการรู้จำของระบบ ระบบรู้จำเสียงต่อเนื่องภาษาไทยนี้ประกอบด้วย 6 ส่วน คือ การประมวลผลสัญญาณดิจิตอล การดึงค่าคุณลักษณะสำคัญ เวกเตอร์ครอนไตเซชัน การฝึกฝนระบบ การรู้จำพยางค์ต่อเนื่อง และการรู้จำคำศัพท์ ซึ่งมีกระบวนการทำงานดังนี้ การประมวลผลสัญญาณเบื้องต้น คือการวางกรอบสัญญาณเพื่อเตรียมข้อมูลเสียงให้เหมาะสมกับการดึงค่าคุณลักษณะสำคัญ ค่าคุณลักษณะสำคัญที่นำมาใช้คือ ค่าสัมประสิทธิ์เซปสตรัมบนสเกลเมล และการเปลี่ยนแปลงทางเวลาของสัมประสิทธิ์เซปสตรัมบนสเกลเมล ค่าคุณลักษณะสำคัญที่ได้จากแต่ละกรอบสัญญาณถูกนำมาควอนไตซ์เพื่อเรียนรู้และหาตัวแทนของเสียงในรูปสัญลักษณ์ด้วยหลักการเวกเตอร์ควอนไตเซชัน หลังจากนั้นจึงเริ่มการฝึกฝนระบบตามทฤษฎีแบบจำลองฮิดเด็นมาร์คอฟด้วยสัญลักษณ์ในชุดรหัส แบบจำลองที่ออกแบบอยู่ในระดับพยางค์และมี 3 สถานะ สถานะแรก คือพยัญชนะต้น สถานะที่สองคือสระ และสถานะที่สามคือ ตัวสะกด ในขั้นตอนการรู้จำเสียงต่อเนื่องนั้น งานวิจัยนี้ได้เสนอวิธีการรู้จำแบบไม่มีการตัดแบ่งเสียงโดยนำอัลกอริธึมการสร้างระดับมาประยุกต์ใช้ เพื่อทำหน้าที่ในการกำหนดขอบเขตของพยางค์แต่ละพยางค์ในเสียงต่อเนื่องและนำพยางค์มารู้จำกับแบบจำลองที่ได้ฝึกฝนไว้ จากขั้นตอนนี้จะได้ชุดคำศัพท์ ที่มีความเป็นไปได้ หลังจากนั้นส่วนรู้จำคำศัพท์จะทำหน้าที่เลือกคำศัพท์ที่ถูกต้องที่สุดจากชุดคำศัพท์โดยการคำนวณความน่าจะเป็นที่อาศัยข้อมูลความถี่ของพยางค์จากฐานข้อมูลคำศัพท์ในการพิจารณา จากการทดสอบระบบกับคำสั่งงานหลักซึ่งเป็นเสียงต่อเนื่องทั้งหมด 23 คำสั่ง ที่มีความยาว 1-4 พยางค์ แยกเป็นพยางค์เดี่ยวได้ทั้งหมด 40 พยางค์ พบว่าจำนวนสัมประสิทธิ์เซปสตรัมบนสเกลเมลเท่ากับ 18 ค่า คือจำนวนสัมประสิทธิ์ที่มีค่าน้อยที่สุดที่ยังคงได้อัตราการรู้จำสูงระบบสามารถรู้จำเสียงต่อเนื่องโดยได้อัตราการรู้จำที่ความยาว 4 พยางค์, 3 พยางค์, 2 พยางค์ และ 1 พยางค์เท่ากับ 85.00%, 90.00%, 96.15% และ 97.50% ตามลำดับ และเมื่อทดสอบกับผู้ใช้ทั้งหมด 12 คน ได้อัตราการรู้จำเสียงเฉลี่ยเท่ากับ 87.88% ระบบเริ่มมีอัตราการรู้จำคงที่เมื่อใช้เสียงในการฝึกฝน 9 ครั้ง/พยางค์สำหรับผู้พูดเพศหญิงและ 21 ครั้ง/พยางค์สำหรับผู้พูดเพศชาย
บรรณานุกรม	:	APA Chicago MLA Vancouver ฐนียา สัตยพานิช . (2546). ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ฐนียา สัตยพานิช . 2546. "ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์". กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. ฐนียา สัตยพานิช . "ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์." กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2546. Print. ฐนียา สัตยพานิช . ระบบรู้จำเสียงภาษาไทยต่อเนื่องแบบเฉพาะบุคคลสำหรับการใช้งานอีเมล์. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2546.