Data Mining คือ กระบวนการที่แยกข้อมูล (Extract data) จากฐานข้อมูลขนาดใหญ่ เพื่อให้ได้ข้อมูลที่เกิดประโยชน์แต่เรายังไม่ทราบออกมา โดยเป็นข้อมูลที่มีเหตุผลและหลักฐานที่เชื่อถือได้ อีกทั้งยังสามารถนำไปใช้ได้ ซึ่งเป็นสิ่งสำคัยที่จะช่วยตัดสินใจในการธุรกิจ
Data Mining เป็นกระบวนการที่สำคัญในการทำ Knowlede Discovery in Database ที่เราเรียกสั้นๆว่า KDD ส่วน Data Mining สามารถเรียกสั้นๆ ว่า DM
ขั้นตอนการทำ Data Mining มี 4 ขั้นตอนหลัก
1.Business Object Datermination
เป็นขั้นตอนที่สำคัญในการทำ KDD เนื่องจาก เป็นการกำหนดขอบเขต เป้าหมาย ของการทำ KDD ซึ่งจะมีผลต่อทุกๆ ขั้นตอนของการทำ KDD โดยนักวิเคราะห์ธุรกิจ (Business Analyst) จะต้องกำหนดปัญหาที่เกิดขึ้นในการทำธุรกิจให้ครอบคลุมและชัดเจนรวมทั้งวัตถุประสงค์ด้วย
2.Data Preparation
หน้าที่ของขั้นตอนนี้ คือ จัดการข้อมูลให้สามารถขำเข้าสู่อัลกอริธึมของ Data Mining ได้ เช่นการทำ Data Cleaning,Data Integration ,Data Reduction เป็นต้น ซึ่ง Data Preparation สามารถแบ่งออกเป็น 3 ส่วนได้แก่ Data Selection,Data Preprocessing และ Data Transformation
3.Data Mining
เป็นขั้นตอนการทำ Mining โดยมีกระบวนการในการทำ Data Mining หลายแบบ เช่น Database Segmentation , Predictive Modeling, Link Analysis เป็นต้น แต่ละกระบวนการจะมีอัลกริธึมให้เลือกใช้ เช่น การทำ Database Segmentation อาจใช้อัลกอริธึม K-Mean หรืออาจใช้ Unsupervised Learning Neural Networks เช่น โมเดล Kohonen Neural Net ถ้าเป็นการทำ Predictive Modeling อาจใช้ CART (Classificatio And Regression Tree) หรืออาจใช้ Supervised Learning Neural Network เช่น Backpropagation Neural Net ถ้าเป็นการทำ Link Analysis ซึ่งมีการทำอยู่ 2 ลักษณะ คือ Association Rule Discovery และ Sequential Discovery อาจใช้ Apriori Algorithms
4.Analysis of Results and Knowledge Presentation
เป็นขั้นตอนสุดท้าย สำหรับนักวิเคราะห์ข้อมูลที่จะต้องเก็บผลลัพธ์ของData Mining สรุปความหมายของผลลัพธ์ที่ได้ ซึ่งจะเป็นข้อมูลความรู้ที่เกิดประโยชน์และสามารถนำไปใช้เพื่อช่วยในการตัดสินใจทำงานในลำดับต่อไป
0 ความคิดเห็น:
แสดงความคิดเห็น