K-Means

K-Means merupakan salah satu metode pengelompokan data non hierarki (sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih cluster. Metode ini mempartisi data ke dalam kelompok sehingga data berkarakteristik berbeda di kelompokkan ke dalam kelompok yang lain. Pengelompokan data dengan metode K-Means secara umum dilakukan dengan algoritma sebagai berikut:

  • Menentukan banyaknya cluster yaitu sebanyak k.
  • Memilih secara acak pusat cluster.
  • Menghitung jarak semua data pengamatan dengan pusat cluster menggunakan rumus jarak euclidean

di mana:

  • Mengalokasikan (menempatkan) data ke dalam salah satu pusat cluster yang memiliki nilai jarak paling dekat.
  • Menentukan pusat klaster baru dari setiap cluster yang sudah terbentuk pada langkah ke-4.
  • Mengulang langkah 3, 4 dan 5 sampai tidak ada lagi anggota suatu cluster yang berpindah ke cluster lain.

Contoh Perhitungan

Berikut ini adalah contoh perhitungan metode K-means.

Tabel 2.1 Objek Pengamatan

No.X1X2
1.11
2.41
3.61
4.12
5.23
6.53
7.25
8.35
9.26
1038
  1. Menentukan banyaknya cluster yaitu sebanyak 2.
  2. Menentukan pusat cluster.

Pusat cluster dipilih secara acak dimana untuk pusat cluster 1 adalah objek pengamatan ke-2 dan pusat cluster 2 adalah objek pengamatan ke-4.

  • Menghitung jarak data pengamatan dengan pusat cluster.
  • Jarak objek pengamatan dengan pusat cluster 1
  • Jarak objek pengamatan dengan pusat cluster 2
  • Mengalokasikan objek pengamatan ke pusat cluster terdekat.

Data hasil perhitungan jarak selanjutnya dialokasikan ke dalam cluster 1 dan cluster 2 yang dapat dilihat pada Tabel 2.2 sebagai berikut:

Tabel 2.2 Hasil Alokasi Objek Pengamatan ke Pusat Cluster Iterasi 1

Objek PengamatanJarak KepusatAlokasi Cluster Ke-
k1k2
1312
203,161
325,101
43,1602
52,831,412
62,244,121
74,473,162
84,123,612
95,394,122
107,076,322

Berdasarkan Tabel 2.2 dapat dilihat bahwa objek pengamatan pertama memiliki jarak terdekat dengan cluster  2 dengan nilai jarak sebesar 1 yang berarti bahwa objek pengamatan pertama masuk ke dalam cluster 2 dan begitu seterusnya.

  • Perhitungan pusat cluster baru

Adapun perhitungan pusat cluster  baru sebagai berikut:

  • Pusat cluster baru ke-1

Tabel 2.3 Pusat Cluster 1 yang Diperbarui

Objek PengamatanX1X2
241
361
653
Rata-Rata51,67
  • Pusat cluster baru ke-2

Tabel 2.4 Pusat Cluster 2 yang Diperbarui

Objek PengamatanX1X2
111
412
523
725
835
926
1038
Rata-Rata24,29

Sehingga pusat cluster terbaru dapat dilihat pada Tabel 2.5 sebagai berikut

Tabel 2.5 Pusat Cluster 1 yang Diperbarui

Pusat ClusterX1X2
151,67
224,29
  • Mengulang kembali langkah ke-3 sampai dengan 5 hingga tidak ada lagi anggota cluster yang berpindah ke cluster lain.

Leave a Reply