Contoh penggunaan decision tree pada data training berkiut :
Dari
data tersebut, kita akan menganalisis seberapa besar kemungkinan orang yang
akan membeli komputer berdasarkan atribut-atribut yang ada.
Dari data di atas diperoleh hasil/urutan sebagai berikut :
Bagaimana cara untuk mendapatkan hasil tersebut atau pemilihan urutan atribut??
Hal yang harus dilakukan adalah menghitung entrophy dan information gain.
- Entrophy : ukuran kemurnian, semakin murni, semakin homogen, semakin rendah nilainya.
- Information Gain : pengurangan entropy disebabkan oleh partisi berdasarkan suatu atribut. Semakin besar info gain atribut itu semakin membuat homogen, semakin bagus.
Rumus untuk menghitung entrophy 2 kelas:
Rumus untuk menghitung entrophy > 2 kelas :
*Info (D) = Entrophy (D) (istilah dibuku J. HAN).
Rumus untuk menghitung information gain :
Nah, itulah langkah dan perhitungan untuk menentukan urutan atribut. Untuk contoh perhitungannya akan dibahas dikesempatan berikutnya.. :D
Tidak ada komentar:
Posting Komentar