ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การประยุกต์ Watershed Segmentation สำหรับการแยกองค์ประกอบภาพเอกสาร

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง : การประยุกต์ Watershed Segmentation สำหรับการแยกองค์ประกอบภาพเอกสาร
นักวิจัย : วงษ์นเรศ ขันธุวาร , นพดล คีรีเพ็ชร , Wongnaret Khantuwan , Noppadon Khiripet
คำค้น : Artificial Intelligence and signal and image processing , Character recognition , Image processing , Information, computing and communication sciences , OCR , Page segmentation , Watershed segmentation , การประมวผลภาพ , การรู้จำอักขระ (คอมพิวเตอร์) , การแยกองค์ประกอบภาพ , ระบบอานตัวอักษรอัตโนมัติ , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ , สาขาเทคโนโลยีสารสนเทศและนิเทศศาสตร์
หน่วยงาน : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน : -
ปีพิมพ์ : 2551
อ้างอิง : http://www.nstda.or.th/thairesearch/node/15058
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

วิธีการ Optical Character Recognition (OCR) ได้ถูกประยุกต์เข้ากับงานด้านต่างๆ อย่างแพร่หลาย แต่อย่างไรก็ตาม การทำงานของระบบ OCR เมื่อภาพเอกสารตั้งต้นมีการจัดหน้าที่ไม่อยู่ในรูปแบบปกติ เช่น การแทรกข้อมูลรูปภาพและแผนภูมิต่างๆ ตลอดจนการจัดหน้ากระดาษแบบหลายคอลัมน์นั้น จำเป็นจะต้องมีขั้นตอนการแบ่งองค์ประกอบภาพเอกสารออกเป็นส่วนย่อยเสียก่อน เพื่อเป็นการกำหนดบริเวณให้กับข้อความแต่ละส่วนภายในเอกสาร และป้องกันความผิดพลาดจากการนำข้อความที่อยู่ต่างคอลัมน์มาต่อเข้าด้วยกัน แต่เนื่องจากวิธีการแยกองค์ประกอบภาพเอกสารที่ได้พัฒนาขึ้นก่อนหน้านี้ยังคงข้อจำกัดที่เกี่ยวกับความเร็วในการประมวลผล อีกทั้งยังเป็นวิธีการที่มีความซับซ้อน งานวิจัยนี้จึงนำเสนอการประยุกต์วิธีประมวลผลภาพแบบ watershed segmentation ในการแยกองค์ประกอบของภาพเอกสารออกเป็นส่วนย่อย ซึ่งมีจุดเด่นคือผลลัพธ์ขององค์ประกอบแต่ละส่วนมีรูปร่างอิสระ ไม่ได้เป็นเพียงรูปสี่เหลี่ยม อีกทั้งยังเป็นการทำงานที่ไม่ขึ้นกับความเอียงของภาพเอกสารตั้งต้น ทำให้การแยกองค์ประกอบมีความยืดหยุ่นสามารถใช้งานได้กับเอกสารที่มีการจัดหน้าแบบต่างๆ ได้อย่างหลากหลาย ซึ่งวิธีการแยกองค์ประกอบภาพด้วย watershed segmentation นั้นไม่ต้องการข้อมูลนำเข้าที่มีความละเอียดสูง ทำให้สามารถย่อขนาดภาพตั้งต้นให้เล็กลงเพื่อการทำงานที่เร็วขึ้นได้อีกด้วย

One problem of the Optical Character Recognition (OCR) task is to recognition nontraditional layout of document images. For example, the images may contain inserted pictures and charts, columns of text, with curve boundary, This poses challenges to page segmentation methods to determine the right boundary of each component. Earlier proposed methods are limited by processing time and complexity. In this paper, we propose the application of the watershed algorithm for page segmentation. This method can decompose the document image into non-rectangular components and is free from the skew angle of the input document image. Moreover, it does not need high resolution input for correct operation.

บรรณานุกรม :
วงษ์นเรศ ขันธุวาร , นพดล คีรีเพ็ชร , Wongnaret Khantuwan , Noppadon Khiripet . (2551). การประยุกต์ Watershed Segmentation สำหรับการแยกองค์ประกอบภาพเอกสาร.
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
วงษ์นเรศ ขันธุวาร , นพดล คีรีเพ็ชร , Wongnaret Khantuwan , Noppadon Khiripet . 2551. "การประยุกต์ Watershed Segmentation สำหรับการแยกองค์ประกอบภาพเอกสาร".
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ.
วงษ์นเรศ ขันธุวาร , นพดล คีรีเพ็ชร , Wongnaret Khantuwan , Noppadon Khiripet . "การประยุกต์ Watershed Segmentation สำหรับการแยกองค์ประกอบภาพเอกสาร."
    ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2551. Print.
วงษ์นเรศ ขันธุวาร , นพดล คีรีเพ็ชร , Wongnaret Khantuwan , Noppadon Khiripet . การประยุกต์ Watershed Segmentation สำหรับการแยกองค์ประกอบภาพเอกสาร. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2551.