Data Mining ( Algoritma K-medoids )


Algoritma k-medoids adalah pengelompokan algoritma yang berhubungan dengan algoritma k-means dan algoritma medoidshift. Kedua algoritma k-means dan k-medoids yang partitional (melanggar dataset ke dalam kelompok) dan kedua upaya untuk meminimalkan jarak antara titik berlabel berada dalam cluster dan titik yang ditunjuk sebagai pusat klaster itu. Berbeda dengan algoritma k -means, k -medoids memilih datapoints sebagai pusat (medoids atau eksemplar) dan bekerja dengan matriks sewenang-wenang dari jarak antara datapoints bukan  l2. Metode ini diusulkan pada tahun 1987 untuk pekerjaan dengan l1 normal dan jarak lainnya.


k-medoid adalah teknik partisi klasik clustering yang mengelompokkan data set dari n objek ke dalam kelompok k dikenal apriori. Sebuah alat yang berguna untuk menentukan k adalah siluet. Hal ini lebih kuat untuk kebisingan dan outlier dibandingkan dengan k -means karena meminimalkan sejumlah dissimilarities berpasangan bukannya jumlah kuadrat jarak Euclidean.

Sebuah medoid dapat didefinisikan sebagai objek cluster yang rata-rata perbedaan untuk semua objek dalam cluster minimal. yaitu merupakan titik paling berlokasi di cluster.

Sumber : https://en.wikipedia.org/wiki/K-medoids

Tahapan K-medoids
1. Inisialisasi: memilih objek k secara acak yang akan berfungsi sebagai 
   medoids.
2. Mengasosiasikan setiap titik data dengan medoid yang paling serupa dengan
   mengguna kan ukuran jarak dan menghitung biaya.
3. Secara acak memilih objek k baru yang akan berfungsi sebagai medoid dan
   menyimpan  salinan dari set asli.
4. Gunakan set medoids baru untuk menghitung ulang biaya.
5. Jika biaya yang baru lebih besar dari pada biaya lama kemudian hentikan
   algoritma  tersebut.
6. Ulangi langkah kedua hingga kelima sampai tidak ada perubahan dalam medoid.

Contoh Excel dari K-medoids (dengan perhitungan manhattan distance) Download

Comments

Post a Comment

Popular Posts