ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

รายงานการวิจัยโครงการพัฒนาระบบประเมินคุณภาพและตรวจสอบความผิดปกติของเสียงพูดแบบอัตโนมัติ

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : รายงานการวิจัยโครงการพัฒนาระบบประเมินคุณภาพและตรวจสอบความผิดปกติของเสียงพูดแบบอัตโนมัติ
นักวิจัย : ประกาศิต กายะสิทธิ์
คำค้น : Speech assessment , Speech error , การประเมินคุณภาพเสียง , การวิเคราะห์ความบกพร่องของเสียงพูด , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2550
อ้างอิง : http://www.nstda.or.th/thairesearch/node/10852
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

"การพูดแบบดีสอาร์เทรีย คือการออกเสียงพูดที่ผิดปกติของผู้พูดที่มีความบกพร่องทางการออกเสียง เช่นผู้พิการทางสมองหรือระบบประสาท ผลการทำวิจัยได้แสดงให้เห็นว่า การพัฒนาระบบการรู้จำเสียงพูดเฉพาะแบบเพื่อความเหมาะสมกับประเภทความพิการของเสียง สามารถเพิ่มประสิทธิภาพการทำงานของระบบการรู้จำได้ อย่างไรก็ตาม เนื่องจากความหลากหลายของประเภทความบกพร่อง และความแตกต่างในระดับของความพิการ ผู้พิการทางเสียงบางกลุ่มหรือบางคนเท่านั้นจึงจะสามารถใช้งานระบบการรู้จำได้อย่างมีประสิทธิภาพ ในขณะที่การพัฒนาระบบเพื่อผู้พูดแต่ละคนเป็นกระบวนการที่ต้องใช้เวลาและกำลังคนในการทำงาน ผลลัพธ์ที่ได้อาจไม่สามารถนำไปใช้งานได้จริงเนื่องจากความรุนแรงของการบกพร่องทางเสียง เพื่อเป็นการประหยัดเวลาและทรัพยากรทั้งทางด้านผู้พัฒนาระบบและตัวผู้พิการเอง ระบบวัดผลเพื่อประเมินระดับความบกพร่องของเสียงและการทำนายระดับความสามารถของผู้พูดในการใช้งานระบบการรู้จำเสียงพูดจึงเป็นสิ่งจำเป็น การวัดความบกพร่องทางเสียงที่ใช้อยู่ในปัจจุบันสามารถแบ่งออกเป็น 2 วิธีการใหญ่ๆ คือการทดสอบความชัดเจนของเสียงพูด (Articulator test) และการทดสอบภาวะฟังความออก (Intelligibility test) ซึ่งทั้งสองวิธีต่างก็ใช้การตัดสินด้วยการฟังเสียงพูดจากผู้ฟัง ซึ่งอาจจะเป็นผู้เชี่ยวชาญทางเสียงในการทดสอบแบบแรก หรือเป็นกลุ่มผู้ฟังที่เป็นคนทั่วไปในแบบที่สอง อย่างไรก็ตามทั้งสองวิธีมีข้อเสียเปรียบร่วมกันคือ (1) ต้องใช้เวลาในการทำการทดสอบ (2) ผลการทดสอบขึ้นอยู่กับผู้ฟังซึ่งอาจแตกต่างกันออกไปในการทดสอบแต่ละครั้ง และ (3) เมื่อพิจารณาในมุมมองของระบบการรู้จำเสียงพูด ผลที่ได้อาจไม่มีความสัมพันธ์โดยตรงกับระดับความถูกต้องของระบบเลย ข้อเสนองานวิจัยฉบับนี้ จะทำการศึกษาวิธีการประเมินระดับความบกพร่องของเสียงพูดแบบใหม่ โดยการวัดค่าความคงที่ของเสียง (speech consistency score) ผ่านค่าดัชนีทางเสียง 2 ค่าคือ ค่าดัชนีความชัดเจนของเสียงพูด (speech clarity index, Ψ) และค่าดัชนีแสดงความสับสนของเสียง (speech confusion index, Ø) ที่มีความสัมพันธ์โดยตรงกับความสามารถในการใช้ระบบการรู้จำเสียงของผู้พูดแต่ละคน การทดสอบความบกพร่องทางเสียงที่เป็นมาตรฐานทั้งสองการทดสอบคือ การทดสอบความชัดเจนของเสียงพูดและการทดสอบภาวะฟังความออก จะถูกใช้ในการเปรียบเทียบการประเมินผล โดยใช้ผลลัพธ์จากระบบการรู้จำเสียงพูด 2 ระบบหลักคือ Hidden Markov Model กับ Artificial Neural Network เป็นผลอ้างอิง การวัดความน่าเชื่อถือของระบบแบ่งออกเป็น 3 แบบคือ (1) การวัดความผิดพลาดแบบ root mean square (2) การหาค่าความสัมพันธ์ร่วม correlation และ (3) การเปรียบเทียบความถูกต้องจากลำดับของผลการรู้จำ ขอบข่ายงานวิจัยและผลลัพธ์ที่ต้องการคือ การหาวิธีการที่เหมาะสมในการวัดค่าดัชนีที่ต้องการ ผลการศึกษาความเป็นไปได้สำหรับการใช้ค่าดัชนีเหล่านั้น ในการประเมินคุณภาพและตรวจสอบความผิดปกติทางเสียง และผลการออกแบบระบบอัตโนมัติเพื่อการประเมินคุณภาพและตรวจสอบความผิดปกติทางเสียง Dysarthria is a term given to a group of speech disorder in which the transmission of messages controlled by the motor movements for speech is interrupted. Our research assumption is that for a certain dysarthric speaker, if his/her familiar communication partner can recognize (or learn to recognize) his/her speech, some modern speech processing techniques (i.e., speech recognition) should be able to learn to recognize those patterns as well. Due to the fact that there is high variety in dysarthric speech, it is impossible to build a general speech recognition system that can recognize all types of dysarthric speech. A system needs to be tailored (or trained) in order to match with individual condition. However, collecting data and training a system is a time-consuming task. Towards this problem, it is necessary to develop a method to preliminarily indicating whether an individual dysarthria could benefit from such technologies or not. Nowadays, there are two common speech assessments based on human-perceptual analysis, namely articulator test and intelligibility test. Although both tests are commonly used in many aspects, they are labor-intensive and subjective to human perception. This research proposes an alternative approach to develop an automatic system for dysarthric speech assessment in terms of modern speech technologies based on speech clarity index (Ψ) and speech confusion index (Ø). The results of the system can be used to indicate a severity of dysarthric speech and also can be applied to predict an outcome from speech recognition system for a speaker. As for performance evaluation of these indicators, the results (incorporated with two well-known speech recognition systems, HMM and ANN) will be compared with the two standard assessments based on three measures, i.e., root-mean-square difference (∆rms), correlation coefficient (R2), and rank-order inconsistency (ROI). Scope of the research and expected outcomes include: (i) The measurement procedures of speech quality indexes, i.e., speech clarity index (Ψ) and speech confusion index (Ø). (ii) The correlations between the results of standard assessments, the proposed indexes, and modern speech recognition system will be studied. (iii) A design of an automated dysarthric speech assessment system"

บรรณานุกรม :
ประกาศิต กายะสิทธิ์ . (2550). รายงานการวิจัยโครงการพัฒนาระบบประเมินคุณภาพและตรวจสอบความผิดปกติของเสียงพูดแบบอัตโนมัติ.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
ประกาศิต กายะสิทธิ์ . 2550. "รายงานการวิจัยโครงการพัฒนาระบบประเมินคุณภาพและตรวจสอบความผิดปกติของเสียงพูดแบบอัตโนมัติ".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
ประกาศิต กายะสิทธิ์ . "รายงานการวิจัยโครงการพัฒนาระบบประเมินคุณภาพและตรวจสอบความผิดปกติของเสียงพูดแบบอัตโนมัติ."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2550. Print.
ประกาศิต กายะสิทธิ์ . รายงานการวิจัยโครงการพัฒนาระบบประเมินคุณภาพและตรวจสอบความผิดปกติของเสียงพูดแบบอัตโนมัติ. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2550.