Data Mining adalah Serangkaian proses untuk menggali nilai tambah berupa
informasi yang selama ini tidak diketahui secara manual dari suatu basisdata
dengan melakukan penggalian pola-pola dari data dengan tujuan untuk
memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan
cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang
terdapat dalam basisdata.
Data mining biasa juga dikenal nama lain seperti : Knowledge
discovery (mining) in databases (KDD), ekstraksi pengetahuan (knowledge
extraction) Analisa data/pola dan kecerdasan bisnis (business intelligence) dan
merupakan alat yang penting untuk memanipulasi data untuk penyajian informasi
sesuai kebutuhan user dengan tujuan untuk membantu dalam analisis koleksi
pengamatan perilaku, secara umum definisi data-mining dapat diartikan sebagai
berikut
- Proses penemuan pola yang
menarik dari data yang tersimpan dalam jumlah besar.
- Ekstraksi dari suatu informasi
yang berguna atau menarik (non-trivial, implisit, sebefumnya belum
diketahui potensial kegunaannya) pola atau pengetahuan dari data yang
disimpan dalam jumfah besar.
- Ekplorasi dari analisa secara
otomatis atau semiotomatis terhadap data-data dalam jumlah besar untuk
mencari pola dan aturan yang berarti.
Konsep Data Mining
Data mining sangat perlu dilakukan
terutama dalam mengelola Data yang sangat besar untuk memudahkan aktifitas
recording suatu transaksi dan untuk proses data warehousing agar dapat
memberikan informasi yang akurat bagi penggunanya.
Alasan utama mengapa data mining sangat menarik perhatian
industri informasi dalam beberapa tahun belakangan ini adalah karena
tersedianya data dalam jumlah yang besar dan semakin besarnya kebutuhan untuk
mengubah data tersebut menjadi informasi dan pengetahuan yang berguna karena
sesuai fokus bidang ilmu ini yaitu melakukan kegiatan mengekstraksi atau
menambang pengetahuan dari data yang berukuran/berjumlah besar, informasi
inilah yang nantinya sangat berguna untuk pengembangan. berikut langkah-langkahnya
:
- Data cleaning (untuk
menghilangkan noise data yang tidak konsisten) Data integration (di mana
sumber data yang terpecah dapat disatukan)
- Data selection (di mana data yang relevan dengan tugas analisis
dikembalikan ke dalam database)
- Data transformation (di
mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang
dengan ringkasan performa atau operasi agresi)
- Knowledge Discovery (proses
esensial di mana metode yang intelejen digunakan untuk mengekstrak pola
data)
- Pattern evolution (untuk mengidentifikasi
pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas
beberapa tindakan yang menarik)
- Knowledge presentation (di mana
gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan
pengetahuan yang telah ditambang kepada user).
Sumber : http://gsbipb.com/
Tidak ada komentar:
Posting Komentar