| ชื่อเรื่อง | : | การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน |
| นักวิจัย | : | วุฒิชัย วิเชียรไชย |
| คำค้น | : | - |
| หน่วยงาน | : | ฐานข้อมูลวิทยานิพนธ์ไทย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2549 |
| อ้างอิง | : | http://www.thaithesis.org/detail.php?id=1222549000026 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | งานวิจัยนี้ เป็นงานวิจัยที่เกี่ยวกับการพัฒนาโปรแกรมกรองคำหยาบในข้อความภาษาไทยโดยแบ่งขั้นตอนการทำงานของโปรแกรมออกเป็นสองขั้นตอนใหญ่ๆ คือ ขั้นตอนแรกเป็นการตัดคำ ขั้นตอนที่สองเป็นการค้นหาและแทนที่คำหยาบด้วยเครื่องหมายดอกจัน ซึ่งนิยามคำหยาบที่ใช้นำมาจากพจนานุกรมฉบับราชบัณฑิตยสถานพ.ศ. 2542 การตัดคำในข้อความภาษาไทย ในงานวิจัยนี้ใช้วิธีตัดคำด้วยพจนานุกรม แบบเทียบข้อความ (String Matching)และเทียบคำที่ยาวที่สุด (Longest Matching) และใช้ตัวแบบทางคณิตศาสตร์ไฟไนท์สเตทแมชชีนด้วยข้อมูลออก(Finite State Machines with Outputs) ในการพัฒนาโปรแกรมค้นหาและแทนที่คำหยาบในข้อความภาษาไทยด้วยเครื่องหมายดอกจัน งานวิจัยนี้ได้ทดสอบประสิทธิภาพ โดยเอกสารจากหนังสือพิมพ์ไทยรัฐ มติชน ข่าวสด และคมชัดลึก จำนวนหนึ่งร้อยคอลัมน์ และข้อความจากเว็บบอร์ดจำนวนเจ็ดร้อยเจ็ดข้อคิดเห็นในแหล่งข้อมูลอินเทอร์เนต พบว่าประสิทธิภาพการแทนที่คำหยาบจริงด้วยเครื่องหมายดอกจันมีความถูกต้อง 99.14% อย่างไรก็ตามยังมีคำหยาบที่ไม่สามารถแทนที่ด้วยเครื่องหมายดอกจัน เนื่องจากการตัดคำในข้อความภาษาไทยยังไม่ถูกต้อง 100% จึงได้เสนอแนวทางปรับปรุงโดยการเพิ่มคำศัพท์ที่ไม่ปรากฏในพจนานุกรมและเพิ่มข้อความพิเศษที่ไม่ปรากฎในพจนานุกรมข้อความพิเศษ เพื่อเพิ่มประสิทธิภาพในการตัดคำและกรองคำหยาบให้สูงยิ่งขึ้น |
| บรรณานุกรม | : |
วุฒิชัย วิเชียรไชย . (2549). การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน.
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วุฒิชัย วิเชียรไชย . 2549. "การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน".
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย. วุฒิชัย วิเชียรไชย . "การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน."
กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2549. Print. วุฒิชัย วิเชียรไชย . การกรองคำหยาบในข้อความภาษาไทยโดยไฟไนท์สเตทแมชชีน. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2549.
|
