Data Mining ( Algoritma K-medoids )
Algoritma k-medoids adalah pengelompokan algoritma yang berhubungan dengan algoritma k-means dan algoritma medoidshift. Kedua algoritma k-means dan k-medoids yang partitional (melanggar dataset ke dalam kelompok) dan kedua upaya untuk meminimalkan jarak antara titik berlabel berada dalam cluster dan titik yang ditunjuk sebagai pusat klaster itu. Berbeda dengan algoritma k -means, k -medoids memilih datapoints sebagai pusat (medoids atau eksemplar) dan bekerja dengan matriks sewenang-wenang dari jarak antara datapoints bukan l2. Metode ini diusulkan pada tahun 1987 untuk pekerjaan dengan l1 normal dan jarak lainnya.
k-medoid adalah teknik partisi klasik clustering yang mengelompokkan data set dari n objek ke dalam kelompok k dikenal apriori. Sebuah alat yang berguna untuk menentukan k adalah siluet. Hal ini lebih kuat untuk kebisingan dan outlier dibandingkan dengan k -means karena meminimalkan sejumlah dissimilarities berpasangan bukannya jumlah kuadrat jarak Euclidean.
Sebuah medoid dapat didefinisikan sebagai objek cluster yang rata-rata perbedaan untuk semua objek dalam cluster minimal. yaitu merupakan titik paling berlokasi di cluster.
Sumber : https://en.wikipedia.org/wiki/K-medoids
Tahapan K-medoids
1. Inisialisasi: memilih objek k secara acak yang akan berfungsi sebagai medoids. 2. Mengasosiasikan setiap titik data dengan medoid yang paling serupa dengan mengguna kan ukuran jarak dan menghitung biaya. 3. Secara acak memilih objek k baru yang akan berfungsi sebagai medoid dan menyimpan salinan dari set asli. 4. Gunakan set medoids baru untuk menghitung ulang biaya. 5. Jika biaya yang baru lebih besar dari pada biaya lama kemudian hentikan algoritma tersebut. 6. Ulangi langkah kedua hingga kelima sampai tidak ada perubahan dalam medoid.
Contoh Excel dari K-medoids (dengan perhitungan manhattan distance) Download
link downloadnya not found
ReplyDelete