DataMining - K Nearest Neigbor

Posted by E-Learning on Tuesday, March 29, 2016

K-Nearest Neigbor merupakan bagian dari datamining, yang sering disingkat dengan KNN. metode KNN adalah metode yang digunakan untuk mencari data terdekat diantara data yang akan dievaluasi dengan K, data terdekatnya dalam data pelatihan. K sendiri adalah parameter untuk mengklasifikasikan objek data pelatihan.

Perhitunngan jarak dilakukan dengan menggunkaan konsep euclidian distance, kemudian jumlah kelas yang paling banyak dengan jarak terdekat tersebut akan menjadi kelas dimana data evaluasi berada.

Alasan menggunakan KNN (K-Nearest Neigbor)?
- Algoritma yang digunakan mudah dan cara penyelesaiannya simple tidak terlalu banyak langkah ataupun tahapannya.

selain memiliki kelebibhan K-NN (K-Nearest Neigbor) juga memiliki kelemahan yaitu :
- Trial dan error, maksudnya dalam memngelola data kita perlu mencoba berkali-kali dengan menentukan parameter dari K sehingga kita mendapatkan hasil yang baik. Tingkat resiko untuk trial dan error ini lebih tinggi, sehingga penentuan K menjadi kelemahan KNN.

Algoritma K-Nearest Neigboard (KNN)
- Menentukan parameter K (jumlah tetangga terdekat)
- Hitung jarak antara data yang akan dievaluasi dengan semua data pelatihan.
- Urutkan berdasarkan Ascending (nilai kecil - nilai besar) dan tentukan jarak terdekat urutkan ke-K
- Pasangkan kelas yang bersesuaian
- Cari jumlah kelas terbanyak dari tetangga terdekat tersebut dan tetapkan kelas tersebut sebagai kelas data yang dievaluasi.

Contoh Perhitungan Penjualan Tiket Pesawat menggunakan KNN disini

DataMining - K Nearest Neigbor

Posted by E-Learning on Tuesday, March 29, 2016

0 comments:

Popular Posts

Labels

Terbaru