Minggu, 05 Mei 2013

Klasifikasi : Decision Tree

Decision tree adalah salah satu metode untuk pengklasifikasian data. Dalam metode ini model dipresentasikan dalam bentuk tree. Metode ini diciptakan oleh Ross Quinlan. 
Contoh penggunaan decision tree pada data training berkiut :


Dari data tersebut, kita akan menganalisis seberapa besar kemungkinan orang yang akan membeli komputer berdasarkan atribut-atribut yang ada.
Dari data di atas diperoleh hasil/urutan sebagai berikut :


Bagaimana cara untuk mendapatkan hasil tersebut atau pemilihan urutan atribut??
Hal yang harus dilakukan adalah menghitung entrophy dan information gain.

  • Entrophy : ukuran kemurnian, semakin murni, semakin homogen, semakin rendah nilainya.
  • Information Gain : pengurangan entropy disebabkan oleh partisi berdasarkan suatu atribut. Semakin besar info gain atribut itu semakin membuat homogen, semakin bagus.
Pilih atribut dengan information gain yang paling besar.
Rumus untuk menghitung entrophy 2 kelas:
Rumus untuk menghitung entrophy > 2 kelas :
*Info (D) = Entrophy (D)  (istilah dibuku J. HAN).

Rumus untuk menghitung information gain :
Nah, itulah langkah dan perhitungan untuk menentukan urutan atribut. Untuk contoh perhitungannya akan dibahas dikesempatan berikutnya.. :D

Tidak ada komentar:

Posting Komentar