Data Mining (Algoritma K-Means)
K-means merupakan salah satu algoritma clustering. Tujuan algoritma ini yaitu untuk membagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa data tanpa label kelas. Hal ini berbeda dengan supervised learning yang menerima masukan berupa vektor (x1 , y1) , (x2 , y2) , …, (xi , yi), di mana xi merupakan data dari suatu data pelatihan dan yi merupakan label kelas untuk xi.
Pada algoritma pembelajaran ini, komputer mengelompokkan sendiri data-data yang menjadi masukannya tanpa mengetahui terlebih dulu target kelasnya. Pembelajaran ini termasuk dalam unsupervised learning. Masukan yang diterima adalah data atau objek dan k buah kelompok (cluster) yang diinginkan. Algoritma ini akan mengelompokkan data atau objek ke dalam k buah kelompok tersebut. Pada setiap cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut.
K-means ditemukan oleh beberapa orang yaitu Lloyd (1957, 1982), Forgey (1965) , Friedman and Rubin (1967) , and McQueen (1967) [1]. Ide dari clustering pertama kali ditemukan oleh Lloyd pada tahun 1957, namun hal tersebut baru dipublikasi pada tahun 1982. Pada tahun 1965, Forgey juga mempublikasi teknik yang sama sehingga terkadang dikenal sebagai Lloyd-Forgy pada beberapa sumber.
Tahapan K-Means
1. Menentukan Pusat Cluster
2. Perhitungan jarak pusat cluster
3. Pengelompokan Data dan menentukan pusat cluster baru
4. Ulangi langkah ke dua dan tiga hingga pusat cluster baru tidak berubah
Tahapan K-Means
1. Menentukan Pusat Cluster
2. Perhitungan jarak pusat cluster
3. Pengelompokan Data dan menentukan pusat cluster baru
4. Ulangi langkah ke dua dan tiga hingga pusat cluster baru tidak berubah
Untuk lengkapnya bisa lihat dari sumber di bawah ini :
Sumber : https://id.wikipedia.org/wiki/K-means
Contoh Excel K-Means (dengan perhitungan Euclidean distance) Download
Contoh Excel K-Means (dengan perhitungan Euclidean distance) Download
Bisa kirim fileny, ke email albertus.aji911@gmail.com, trimakasih
ReplyDelete