ridm@nrct.go.th   ระบบคลังข้อมูลงานวิจัยไทย   รายการโปรดที่คุณเลือกไว้

การสร้างฟรีเควนคอนเซพแลททิสบนฐานข้อมูลขนาดใหญ่

หน่วยงาน ฐานข้อมูลวิทยานิพนธ์ไทย

รายละเอียด

ชื่อเรื่อง : การสร้างฟรีเควนคอนเซพแลททิสบนฐานข้อมูลขนาดใหญ่
นักวิจัย : สุวิชัย แซ่ตั้ง
คำค้น : -
หน่วยงาน : ฐานข้อมูลวิทยานิพนธ์ไทย
ผู้ร่วมงาน : -
ปีพิมพ์ : 2544
อ้างอิง : http://www.thaithesis.org/detail.php?id=29813
ที่มา : -
ความเชี่ยวชาญ : -
ความสัมพันธ์ : -
ขอบเขตของเนื้อหา : -
บทคัดย่อ/คำอธิบาย :

ดาต้าไมน์นิ่ง (Data mining) หรือการสืบค้นความรู้ที่มีประโยชน์และน่าสนใจ จากฐานข้อมูลขนาดใหญ่ (Knowledge Discovery from very large Databases: KDD) เป็นแขนงวิชาใหม่ของวิทยาการคอมพิวเตอร์ที่กำลังได้รับความสนใจอย่างสูงในปัจจุบัน โดยใช้เทคนิคต่าง ๆ ในการวิเคราะห์และดึงความรู้ที่สำคัญจากกลุ่มข้อมูลขนาดใหญ่ เหล่านั้น การแบ่งกลุ่มข้อมูล (Data clustering) เป็นเทคนิคหนึ่งทางด้านดาต้าไมน์นิ่ง โดยแบ่งข้อมูลออกเป็นกลุ่มย่อย ๆ ที่มีลักษณะคล้ายคลึงกัน เราเรียกกลุ่มย่อย ๆ ว่า คลัสเตอร์ (Cluster) โดยอาศัยคุณสมบัติของข้อมูลเองเป็นตัวแบ่งกลุ่ม ทำให้ผู้ใช้ สามารถเข้าใจกลุ่มหรือโครงสร้างของข้อมูลที่เกิดขึ้น ในงานวิจัยนี้ได้นำเสนอแนวคิดใหม่ในการแบ่งกลุ่มข้อมูล โดยนำทฤษฎีแลททิส (Lattice theory) มาใช้ในการแก้ปัญหา ซึ่งแลททิส (Lattice) เป็นโมเดลโครงสร้าง ข้อมูลแบบหนึ่งถูกนำเสนอครั้งแรกโดย Rodolf Wille แนวความคิดคือการเปลี่ยนข้อมูล ที่อยู่ในฐานข้อมูลให้มาอยู่ในรูปของโครงสร้างข้อมูลที่มีความรู้แฝงอยู่ ซึ่งโครงสร้าง ข้อมูลแลททีสแสดงให้เห็นถึงกลุ่มของวัตถุ (Objects) ที่มีคุณสมบัติ (ltems) เหมือนกัน เพราะฉะนั้นการสร้างโครงสร้างข้อมูลแลททิสก็คือการแบ่งกลุ่มข้อมูลนั่นเอง ผมขอนำ เสนอกระบวนการใหม่ที่ใช้ในการสร้างโครงสร้างข้อมูลแลททิส เรียกว่า โคลสเบส โดยที่ กระบวนการใหม่นี้ได้แนวคิดมาจากกระบวนการที่เป็นที่รู้จักทั่วไปคือ กระบวนการโคลส ซึ่งในการค้นหากฎความสัมพันธ์ระหว่างข้อมูล ในการทดลองจับเวลาที่ใช้ในการสร้างโครงสร้างข้อมูลแลททิส เราใช้ฐานข้อมูล สำมะโนครัวประชากรมลรัฐเคนซัส ประเทศสหรัฐอเมริกา จำนวน 100,000 รายการ ซึ่ง เก็บอยู่ในรูปแบบไฟล์ PUMS ผลลัพธ์ที่ได้บ่งบอกถึงกลุ่มของประชากรตามลักษณะเฉพาะ ของแต่ละกลุ่ม เช่น อายุ, รายได้ เป็นต้น ผลการทดลองจะแสดงให้เห็นว่ากระบวนการ โคลสเบสที่ผสมนำเสนอนี้ใช้เวลาในการสร้างน้อยกว่าเมื่อเปรียบเทียบกับกระบวนการ คอนสทรัคชั่นเดนพรุนนิ่งและฟรีเควนไอเท็มคอนสทรัคชั่นซึ่งได้นำทฤษฎีแลททิสมาใช้ เหมือนกัน และเวลาที่ใช้ในการสร้างแลททิสเราสามารถวัดได้ในหน่วยของวินาที

บรรณานุกรม :
สุวิชัย แซ่ตั้ง . (2544). การสร้างฟรีเควนคอนเซพแลททิสบนฐานข้อมูลขนาดใหญ่.
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
สุวิชัย แซ่ตั้ง . 2544. "การสร้างฟรีเควนคอนเซพแลททิสบนฐานข้อมูลขนาดใหญ่".
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย.
สุวิชัย แซ่ตั้ง . "การสร้างฟรีเควนคอนเซพแลททิสบนฐานข้อมูลขนาดใหญ่."
    กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย, 2544. Print.
สุวิชัย แซ่ตั้ง . การสร้างฟรีเควนคอนเซพแลททิสบนฐานข้อมูลขนาดใหญ่. กรุงเทพมหานคร : ฐานข้อมูลวิทยานิพนธ์ไทย; 2544.