การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล

ridm@nrct.go.th ระบบคลังข้อมูลงานวิจัยไทย รายการโปรดที่คุณเลือกไว้

การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล

หน่วยงาน สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ

รายละเอียด

ชื่อเรื่อง	:	การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล
นักวิจัย	:	ธนารักษ์ ธีระมั่นคง
คำค้น	:	การจัดการข้อมูลขนาดใหญ่บนอินเตอร์เน็ต , การประมวลผลภาษาธรรมชาติ , ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ
หน่วยงาน	:	สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
ผู้ร่วมงาน	:	-
ปีพิมพ์	:	2543
อ้างอิง	:	http://www.nstda.or.th/thairesearch/node/20068
ที่มา	:	-
ความเชี่ยวชาญ	:	-
ความสัมพันธ์	:	-
ขอบเขตของเนื้อหา	:	-
บทคัดย่อ/คำอธิบาย	:	ปัจจุบันอินเตอร์เน็ต (Internet) เป้ฯที่ใช้กันแพร่หลายทั่วไป โดยเฉพาะการนำมาใช้ในการเผยแพร่ข้อมูล การทำธุรกรรมบนเครือข่าย การค้นหาข้อมูล เป็นต้น ในประเทศไทยก็เช่นเดียวกัน ข้อมูลต่างๆ มีขนาดใหญ่ขึ้น การขยายตัวของปริมาณข้อมูลเป็นไปอย่างรวดเร็วมาก ซึ่งทำให้เรามีข้อมูลมากมายที่สามารถนำมใช้ได้มากมาก อย่างไรก็ตาม ในอีกด้านหนึ่งการเพิ่มขยายตัวของข้อมูลทำให้เราประสบกับปัญหาการมีขอ้มูลกมากมายจนไม่สามารถนำมาได้ (Information Overload) การวิจัยพัฒนาทางด้านการจัดการข้อมูลขนาดใหญ่บนเครือข่าย จึงเป็นสิ่งที่จำเป็นมาก นอกจากนี้ข้อมูลที่อยู่บนเครือข่าย ส่วนใหญ่อยู่ในรูปแบบของตัวอักษร ซึ่งไม่มีโครงสร้างที่ชัดเจนแต่มีความหมายและสามารถนำมาใช้ประโยชน์ได้ ซึ่งเทคโนโลยที่มีความสำคัญมากในงานวิจัยนี้ก็คือ เทคโนโลยีด้านการประมวลผลภาษาธรรมชาติ ในประเทศไทย ปัจจุบันงานวิจัยและพัฒนาในการประยุกต์นำเทคโนโลยีทางด้านการประมวลผลภาษาธรรมชาติมาใช้ในการจัดการข้อมูลขนาดใหญ่บนอินเตอร์เน็ตยังมีน้อยมาก ทั้งๆ ที่ขอ้มุลภาษาไทย ที่อยู่บนเครือข่าย ก็มีขนาดใหญ่ขึ้นมาก และมีอัตราการขยายตัวสูง ดังนั้นการศึกษาวิธีการจัดการข้อมูลภาษาไทยขนาดใหญ่ และข้อมูลภาษาไทยผสมผสานกับภาษาอื่นเช่น ภาษาอังกฤษซึ่งมีอยู่มากที่สุดในเครือข่ายอินเตอร์เน็ตจึงเป้ฯสิ่งที่สำคัญโครงการนี้มีจุดประสงค์ที่จะพัฒนาเทคโนโลยีพื้นฐานในการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ต ซึ่งจะประกอบด้วยการพัฒนาใน 3 หัวข้อด้วยกันคือ 1.การพัฒนาและสร้างทรัพยากรข้อมูลปละซอฟต์แวร์พื้นฐานบนเครือข่าย 2.การพัฒนาระบบจัดการข้อมูลซึ่งรวมไปถึงระบบทำดัชนีขอ้มูล ระบบจัดหมวดหมู่ข้อมูล ระบบสืบค้นข้อมูล ระบบขุดหาขัอมูล 3.การพัฒนาบุคลากรทางด้านการจัดการข้อมูล การสืบค้นข้อมูล การขุดค้นข้อมูล และศาสตร์โดยรวมคือการประมวลผลภาษาธรรมชาติ โครงการนี้จะเน้นการศึกษาทำระบบประยุกต์ต้นแบบที่ใช้งานได้จริง โดยเฉพาะข้อมูลทางด้านผลิตภัณฑ์ที่โฆษณาบนสื่อินเตอร์เน็ตและข้อมูลที่เกี่ยวกับเภสัชสษสตร์บนเครือข่ายอินเตอร์เน็ต และจะสร้างฐานข้อมูลพื้นฐานของข้อมูลที่อยู่บนเอินเตอร์เน็ต ระบบสืบค้นข้อมูล ระบบขุดหาข้อมูล ซึ่งจะมีประโยชน์ต่อการศึกษาวิจัยในสาขาอื่นๆ และสามารถนำมาพัฒนาไปใช้ในเชิวพาณิชย์ Recently the Internet had grown up and spread over the world, especially World Wid Web (WWW) where there are enormous number of informational documents (data) kept. These documents are created by various people from various societies with varied experience. They are very suedul for many tasks including announcement, ecucation and decision making. On the other hand, we face with the problem of information overload. That is, there are too much information to be able to deal with.While the number of linked computers and growing up, the munber of cocuments inside the Internet is also exponentially scaling up. As the result, finding some needed information becomes a very hard task. This problem motivates reserches on informaiton retrieval using keyword search (e.g., netscape search, wxcite search) and category search (e.g., yahoo search). However, both approaches require the user to view individual document fo fine dout which ones are needed and which ones are not. Although automatic document summarization and document relationship visualization are two promising solutions to help the user fo fasten the viewing process, they are individually applied to solve the problem. To manage large-scaled information, this research will do the following tadks: 1.To develop information resourec and basic tools for processing large-scaled information in the internet 2.To develop systems ot managing data. For example, indexing system, categorization system. information retrieval system and data mining systems 3.To develop human resourec for this area of expertise This project focuses on developing a set of toots or system which are useful in the real situation. As information in the Internet, the areas of interest are education/research, businesss an pharmacy (drug). The output of the project will be very useful for research on natural language processing, artificial intelligence and management Science.
บรรณานุกรม	:	APA Chicago MLA Vancouver ธนารักษ์ ธีระมั่นคง . (2543). การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. ธนารักษ์ ธีระมั่นคง . 2543. "การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล". ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. ธนารักษ์ ธีระมั่นคง . "การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล." ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, 2543. Print. ธนารักษ์ ธีระมั่นคง . การวิจัยพัฒนาทรัพยากรสำหรับการจัดการข้อมูลขนาดใหญ่บนเครือข่ายอินเตอร์เน็ตการสืบค้นข้อมูลและการขุดหาข้อมูล. ปทุมธานี : สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ; 2543.