Association rule mining
adalah suatu prosedur untuk mencari hubungan antar item dalam suatu data
set yang ditentukan.
Data mining adalah suatu proses untuk menemukan suatu interesting
knowladge dari sejumlah data yang ada dalam database sehingga didapatkan suatu
pattern tertentu yang dapat disimpan sebagai knowladge baru. Interesting
knowladge ini biasanya dikenal dengan istilah pattern (pola).
Bentuk Dasar Association Rule
Ada beberapa simbol yang akan membantu untuk menerapkan
association rule, yaitu:
Support count(σ(X)): jumlah transaksi yang memuat itemset
tertentu
Support (s(X->Y)): tingkat intensitas kemunculan gabungan
rule(X U Y) pada association rule pada seluruh data set.
Confidence(c(X->Y)): tingkat intensitas kemunculan item Y
pada transaksi yang memuat X
Rumus support dan confidence:
Kegunaan dari support itu sendiri
adalah untuk mengukur tingkat intensitas kemunculan suatu rule, dimana jika
support yang dimiliki rendah, maka akan besar kemungkinan rendah juga tingkat
keuntungan yang didapatkan dari item-item yang ada pada rule tersebut.
Sedangkan kegunaan dari confidence
adalah untuk mengukur tingkat kebenaran(reability) dari kesimpulan yang diambil
oleh rule yang dibuat. Pada implikasi X->Y, jika nilai confidence rendah
maka kemungkinan munculnya Y yang memuat X semakin rendah pula.
Misalkan kita ambil contoh pada
sebuah minimarket menjual beberapa macam barang(item) sebagai berikut:
Kemudian, pisahkan masing-masing item yang dibeli :
Untuk K1 maka diperoleh:
Untuk K2 :
Untuk K2 diambil yang jumlah frekuensinya 4:
Untuk K3, K3 didapat dari jumlah frekuensi K2 yang jumlah frekuensinya 5 yaitu (corn,bean), (Asparagush,bean) sehingga didapat:
Support dan Confident:
Semoga bermanfaat :)
Tidak ada komentar:
Posting Komentar