| ชื่อเรื่อง | : | การตรวจหาอันตรกิริยาแบบอิพิสเตซิสบริสุทธิ์ระหว่างหลายตำแหน่งพันธุกรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่รวมผลการวิเคราะห์อันตรกิริยาระหว่างตำแหน่งพันธุกรรมสองตำแหน่ง |
| นักวิจัย | : | ณชล ไชยรัตนะ |
| คำค้น | : | Attribute Selection , Classification , pattern recognition , Thalassaemia , Type 2 Diabetes Mellitus |
| หน่วยงาน | : | สำนักงานกองทุนสนับสนุนการวิจัย |
| ผู้ร่วมงาน | : | - |
| ปีพิมพ์ | : | 2554 |
| อ้างอิง | : | http://elibrary.trf.or.th/project_content.asp?PJID=RMU5380004 , http://research.trf.or.th/node/6833 |
| ที่มา | : | - |
| ความเชี่ยวชาญ | : | - |
| ความสัมพันธ์ | : | - |
| ขอบเขตของเนื้อหา | : | - |
| บทคัดย่อ/คำอธิบาย | : | รายงานฉบับนี้สนใจโรคพันธุกรรมสองโรคที่สามารถประยุกต์ใช้การรู้จำแบบในการวิเคราะห์ โรคแรกที่สนใจคือโรคเบาหวานชนิดที่สอง 2LOmb ซึ่งทำการคัดเลือกลักษณะประจำโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่รวมผลการวิเคราะห์อันตรกิริยาระหว่างตำแหน่งพันธุกรรมสองตำแหน่งเป็นขั้นตอนวิธีที่พัฒนาขึ้นสำหรับปัญหาแรก ขั้นตอนวิธีประกอบด้วยสี่ขั้นได้แก่ การวิเคราะห์แบบสองตำแหน่งพันธุกรรม การทดสอบการเรียงสับเปลี่ยนเชิงสุ่ม การคำนวณค่าความน่าจะเป็นวงกว้าง และการค้นหาแบบก้าวหน้าเพื่อระบุการรวมการวิเคราะห์แบบสองตำแหน่งที่ดีที่สุด สมรรถนะของ 2LOmb ได้รับการเปรียบเทียบกับสมรรถนะของวิธีการหาความสัมพันธ์ทางพันธุกรรมแบบเซต การคัดเลือกลักษณะประจำแบบอิงสหสัมพันธ์ และเทคนิค ReliefF แบบปรับปรุง ผลการจำลองจากปัญหาอันตรกิริยาหลายตำแหน่งแสดงให้เห็นว่า 2LOmb ให้ค่าผิดพลาดแบบบวกเท็จต่ำ นอกจากนั้น 2LOmb สามารถระบุภาวะพหุสัณฐาน นิวคลีโอไทด์เดี่ยวที่เป็นสาเหตุโรคได้ทั้งหมด ซึ่งชี้ให้เห็นว่า 2LOmb มีกำลังการตรวจจับสูง 2LOmb ได้รับการนำไปประยุกต์ใช้กับข้อมูลโรคเบาหวานชนิดที่สองที่ประกอบด้วย 7,065 ภาวะพหุสัณฐานนิวคลีโอไทด์เดี่ยวจาก 370 ยีน 2LOmb ระบุ 11 ภาวะพหุสัณฐานนิวคลีโอไทด์เดี่ยวจากสี่ยีนที่สัมพันธ์กับโรคเบาหวานชนิดที่สอง โรคที่สองที่สนใจคือโรคธาลัสซีเมีย โดยปัญหาที่สนใจคือการจำแนกคุณสมบัติของเลือดโดยใช้ต้นไม้ตัดสินใจ C4.5 ตัวจำแนกเบย์อย่างง่าย และมัลติเลเยอร์เพอร์เซ็บตรอนสำหรับการคัดกรองโรคธาลัสซีเมีย เป้าหมายคือการจำแนกประเภทความผิดปกติธาลัสซีเมีย 18 กลุ่มซึ่งมีความชุกสูงในประเทศไทยและคนปกติหนึ่งกลุ่มโดยอาศัยข้อมูลจากการตรวจความสมบูรณ์ของเม็ดเลือดและการตรวจชนิดฮีโมโกลบิน ผลการทดลองแสดงให้เห็นว่าได้สมรรถนะการจำแนกสูงสุดซึ่งมีค่าความแม่นเฉลี่ย 93.23% (ค่าเบี่ยงเบนมาตรฐาน 1.67%) และค่าความแม่นเฉลี่ย 92.60% (ค่าเบี่ยงเบนมาตรฐาน 1.75%) จากตัวจำแนกเบย์อย่างง่ายและมัลติเลเยอร์เพอร์เซ็บตรอนตามลำดับเมื่อทำให้ลักษณะประจำมีค่าแบบภินทนะก่อน และผลจากการคัดเลือกลักษณะประจำแบบห่อแสดงให้เห็นว่าค่าความเข้มข้นฮีโมโกลบินซึ่งเป็นลักษณะประจำไม่มีผลต่อสมรรถนะการจำแนก นอกจากนี้สมรรถนะการจำแนกนี้ยังสูงกว่าสมรรถนะการจำแนกที่ได้เมื่อใช้ข้อมูลจากการตรวจชนิดฮีโมโกลบินเป็นข้อมูลเข้าสำหรับตัวจำแนกเพียงอย่างเดียว This report interests in two genetic disease problems that can be tackled using pattern recognition. The first problem covers a genetic association study of type 2 diabetes mellitus (T2D). 2LOmb which performs attribute selection via an omnibus permutation test on ensembles of two-locus analyses is proposed. The algorithm consists of four main steps: two-locus analysis, a permutation test, global p-value determination and a progressive search for the best ensemble. 2LOmb is benchmarked against a set association approach, a correlation-based feature selection technique and a tuned ReliefF technique. The simulation results from multi-locus interaction problems indicate that 2LOmb has a low false-positive error. Moreover, 2LOmb has the best performance in terms of an ability to identify all causative single nucleotide polymorphisms (SNPs), which signifies a high detection power. 2LOmb is subsequently applied to a T2D data set, which contains 7,065 SNPs from 370 genes. The 2LOmb search reveals that 11 SNPs in four genes are associated with T2D. The second problem involves the classification of blood characteristics by a C4.5 decision tree, a naïve Bayes classifier and a multilayer perceptron for thalassaemia screening. The aim is to classify 18 classes of thalassaemia abnormality, which have a high prevalence in Thailand, and one control class by inspecting data characterised by a complete blood count (CBC) and haemoglobin typing. The stratified 10-fold cross-validation results indicate that the best classification performance with average accuracy of 93.23% (standard deviation = 1.67%) and 92.60% (standard deviation = 1.75%) is achieved when the naïve Bayes classifier and the multilayer perceptron are respectively applied to samples which have been pre-processed by attribute discretisation. The results from wrapper attribute selection also suggest that the haemoglobin concentration attribute is redundant. Moreover, the achieved classification performance is significantly higher than that obtained using only haemoglobin typing attributes as classifier inputs. |
| บรรณานุกรม | : |
ณชล ไชยรัตนะ . (2554). การตรวจหาอันตรกิริยาแบบอิพิสเตซิสบริสุทธิ์ระหว่างหลายตำแหน่งพันธุกรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่รวมผลการวิเคราะห์อันตรกิริยาระหว่างตำแหน่งพันธุกรรมสองตำแหน่ง.
กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย. ณชล ไชยรัตนะ . 2554. "การตรวจหาอันตรกิริยาแบบอิพิสเตซิสบริสุทธิ์ระหว่างหลายตำแหน่งพันธุกรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่รวมผลการวิเคราะห์อันตรกิริยาระหว่างตำแหน่งพันธุกรรมสองตำแหน่ง".
กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย. ณชล ไชยรัตนะ . "การตรวจหาอันตรกิริยาแบบอิพิสเตซิสบริสุทธิ์ระหว่างหลายตำแหน่งพันธุกรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่รวมผลการวิเคราะห์อันตรกิริยาระหว่างตำแหน่งพันธุกรรมสองตำแหน่ง."
กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย, 2554. Print. ณชล ไชยรัตนะ . การตรวจหาอันตรกิริยาแบบอิพิสเตซิสบริสุทธิ์ระหว่างหลายตำแหน่งพันธุกรรมโดยการทดสอบการเรียงสับเปลี่ยนเชิงสุ่มที่รวมผลการวิเคราะห์อันตรกิริยาระหว่างตำแหน่งพันธุกรรมสองตำแหน่ง. กรุงเทพมหานคร : สำนักงานกองทุนสนับสนุนการวิจัย; 2554.
|
