Minggu, 12 Juni 2016

DATA MINING









BAB 1
PENDAHULUAN


TUJUAN INSTRUKSIONAL UMUM :
MAHASISWA DAPAT MENGETAHUI dan MEMAHAMI KONSEP DASAR DATA MINING

TUJUAN INSTRUKSIONAL KHUSUS :
         -   MAHASISWA DAPAT MEMAHAMI DEFINISI DATA MINING DAN HUBUNGANNYA DENGAN TEKNOLOGI BASISDATA LAIN SEPERTI DATA WAREHOUSE.
         -  MAHASISWA DAPAT MEMAHAMI LANGKAH-LANGKAH DALAM KNOWLEDGE DISCOVERY IN DATABASE.



Data mining berisi pencarian trend atau pola yang diinginkan dalam Database yang besar untuk membantu pengambilan keputusan di waktu yang akan datang. Harapannya, perangkat data mining mampu mengenali pola-pola ini dalam data dengan masukan yang minimal.Pola-pola ini dikenali oleh perangkat tertentu yang dapatmmberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan teliti,yang mungkin saja menggunakan perangkat pendukung keputusan lainnya.
Data mining berhubungan dengan sub area statistik yang disebut exploratory data analiysis,yang mempunyai tujuan sama dan bersandar pada ukuran statistik. Data mining juga berhubungan erat dengan sub area artificial intelegent yang disbut dengan knowledge discovery dan machine learning.Karakteristik penting dari data mining adalah bahwa volume data sangat besar meskipu ide ide dari area studi yang berhubungan tadi dapat diaplikasikan pada masalah-masalah data mining.
1.1  DEFINISI DATA MINING
Data mining adalah proses yang memperkerjakan satu aatau lebih teknik pembelajaran komputer untuk menganalisis dan mengekstraksi pengetahuan secara otomatis. Definisi lain diantaranya adalah pembelajaan berbasis induksi adalah proses pembentukan definisi konsep yang akan dipelajari.

Data mining merupakan proses iteratif dan interaktif untuk menemukan pola yang sahih,bermanfaat dan dapat dimengerti dalam suatu database yang sangat besar
-          Sahih : Dapat digeneralisasi untuk masa yang akan datang.
-          Baru  : Apa yang sedang tidak diketahui
-          Bermanfaat : Dapat digunakan untuk melakukan suatu tindakan.
-          Iteratif : memerlukan sejumlah proses yang diulang.
-          Interaktif : mmerlukan interaksi manusia dalam proses nya.
-           
1.2  OPERASI DATA MINING
Operasi data mining menurut sifatnya dibedakan menjadi dua, Yaitu bersifat (1) Prediksi untuk menjawab pertanyaan apa dan sesuatu yang bersifat remang-remang atau transparan. Operasi prediksi digunakan untuk validasi hipotesis. (2) penemuan yang bersifat transparan dan untuk menjawab pertanyaan “ mengapa?”.
1.3  GUDANG DATA (DATA WAREHOUSE)
Data warehouse secara bebas dapat didefinisikan sebagai tempat penyimpanan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerfull yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidakkonsistensian dari dari format-format data yang berbeda. Pada data  tersebut kemudian dilakukan proses pembersian untuk proses akurasi dan konsestansi dan engelolanya untuk memudahan dan efisiensi pada query.
1.3.1  KARAKTERISTIK DATA WAREHOUSE
Menurut Bill Inmon, pemilik building the Data warehouse dan ahli yang mendalami konsep data warehouse,yaitu :
-        Subject-oriented : data diorganisasi menurut subyek dari aplikasi.
-      Intergrated : ketika data menempati aplikasi yang terpisah dalam lingkungan operasional,pengkodean data seringkali tidak konsisten.
-    Time-variant : Data warehouse terdiri dari suatu tempat untuk menyimpan data yang berusia 5 sampai 10 tahun atau lebih lama,untuk digunakan sebagai komorasi dan peramalan
-    Non-volatile : Data yang tidak di-updatesesudah mereka memasukkan data warehouse, Tetapi hanya dimuat dan diakses.






1.4 Permasalahan Dalam data mining

Sistem data mining berdasar pada basis data yang menyediakan data mentah dan ini memunculkan permasalahandalam basis daa yang cenderung dinamis, tidak lengkap.
Ber-noise dan besar. Permasalahan lain muncul sebagai akibat dari kcukupan dan relevansi dari informasi yang disimpan.

Basis data sering kali didesain untuk tujuan yang berbeda dari data miiining dan kadangkala properti atau atribut yang akan menyederhanakan pekerjaan pembelanjaran tidak tersedia atau tidak dapat dimintai.

Data yang hilang dapat dibenahi dengan sistem penemuan dalam berbagai cara,seperti:
-          Secara sederhana dengan mengabaikan nilai-nilai yang hilang.
-          Menghilangkan record yang berhubungan.
-          Menebak niai yang hilang dari nilai-nilai yang diketahui.
-          Menebak nilai yang hilang sebagai sebuah nilai khusus.

Data yang mengandung noise dalam dalam penegrtian menjadi tidak teliti merupakan karakteristik.

1.5 Teknik Data mining

Beberapa teknik dan sifat data mining adalah sebagai berikut:
·         Classification : menentukan sebuah record data baru kesalah satu dari beberapa katagori.
·         Clustering : mempartisi data-set menjadi sub-set
·         Assosiationrule : mendetaksi kumpulan atribut.
·         Regression. :

1.6 Tantangan dalam data mining.

Tantangan dalam data mining meliput:
1.      Scalability : besarnya ukuran basis data yang digunakan.
2.      Dimensionality : banyaknya atribut dala data
3.      Complex : data yang komplex dan mempunyai varasi.
4.      Data quality : kualitas data yang akan diproses.

Tidak ada komentar:

Posting Komentar