Nothing Special   »   [go: up one dir, main page]

47-Article Text-222-1-10-20210913

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 9

SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)

Universitas Nusa Putra, 7 Agustus 2021

PENERAPAN DATA MINING K-MEANS CLUSTERING UNTUK


MENGELOMPOKKAN BERBAGAI JENIS MERK SMARTPHONE
Austin Almayda1) , Sudin Saepudin2)
1, 2)
Program Studi Sistem Informasi, Universitas Nusa Putra
Jl. Raya Cibolang No. 21 Cibolang Kaler, Cisaat, Sukabumi, Jawa Barat 43152
e-mail: Austin.almayda_si18@nusaputra.ac.id1),Sudinsaepudin@nusaputra.ac.id2)

* Korespondensi: e-mail: Sudinsaepudin@nusaputra.ac.id

ABSTRAK
Seiring perkembangannya teknologi, saat ini handphone kian berkembang dari masa ke masa.
Smartphone atau ponsel pintar menjadi salah satu gadget yang kian populer setiap tahunnya. Bahkan, kini
semua orang sudah mulai menjadikan smartphone sebagai salah satu kebutuhan pokok. Mulai dari anak- anak
hingga dewasa. Banyaknya merk dan tipe smartphone murah, menjadi salah satu faktor penunjang mengapa
gadget saat ini begitu populer. Banyaknya pilihan smartphone tidak otomatis memudahkan kita untuk memilih
yang terbaik karena masih minimnya pengetahuan masyarakat tentang spesifikasi smartphone [1].
K-Means clustering bertujuan mengelompokkan data yang ada kedalam beberapa kelompok, dimana
data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan mempunyai karakteristik
yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain,metode ini berusaha untuk
meminimalkan variasi antar data yang ada di dalam suatu cluster dan memaksimalkan variasi dengan data yang
ada di cluster lainnya [2].
Pada penelitian ini akan menggunakan metode k-means clustering, dengan mengambil sampel dari
berbagai merk smartphone. Sehingga akan terbentuk beberapa cluster produk smartphone. Hal ini diharapkan
bisa membantu kelak siapa saja yang akan membeli smartphone.

Kata Kunci: Smartphone, K-means , Cluster

ABSTRACT
Along with the development of technology, nowadays mobile phones are growing from time to
time.Smartphones or smartphones become one of the increasingly popular gadgets every year.In fact, now
everyone has started to make smartphones as one of the basic needs.From children to adults. The number of
brands and types of cheap smartphones, become one of the supporting factors why gadgets today are so
popular.The large selection of smartphones does not automatically make it easy for us to choose the best
because of the lack of public knowledge about smartphone specifications [1].
K-Means clustering aims to group existing data into groups, where data in one group has the same
characteristics as each other and has different characteristics than the data in the other group.In other words,
this method seeks to minimize variations between data in a cluster and maximize variation with existing data in
other clusters [2].
In this study will use the k-means clustering method, by taking samples from various brands of
smartphones.So that there will be formed several clusters of smartphone products. This is expected to help
anyone who will buy a smartphone one day.

Keywords: Smartphone, K-means, Cluster

I. PENDAHULUAN
Persaingan dalam dunia teknologi makin kian meningkat, salah satunya adalah smartphone.
Berbagai jenis smartphone kini tersedia dengan harga juga spesifikasi yang variatif, sehingga konsumen
harus lebih selektif dalam membuat keputusan dalam memilih jenis smartphone. Oleh karena itu,
perusahaan smartphone harus mampu memberikan keunggulan yang berbeda dari merk lainnya,
membuat kebijakan produk dengan memilih barang yang akan diproduksi juga membuat program
penjualan yang ditawarkan semenarik mungkin, untuk menarik minat beli.
Untuk memberikan kemudahan bagi para pembeli dalam memilih smartphone diperlukan suatu
informasi berbagai jenis smartphone dan spesifikasinya. Hal ini akan sangat mudah bila dibentuk suatu
pengelompokkan berbagai jenis smartphone.
241
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

K-Means clustering bertujuan mengelompokkan data yang ada kedalam beberapa kelompok,
dimana data dalam satu kelompok mempunyai karakteristik yang sama satu sama lainnya dan
mempunyai karakteristik yang berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata
lain,metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam suatu cluster dan
memaksimalkan variasi dengan data yang ada di cluster lainnya. [2]
Penelitian ini diharapkan dapat membantu para konsumen dalam memilih merk smartphone
sesuai dengan apa yang diharapkan.

II. TINJAUAN PUSTAKA


A. Clustering
Menurut [3] clustering merupakan suatu metode untuk mencari dan mengelompokkan data
yang memiliki kemiripan karakteristik (similarity) antara satu data dengan data yang lain. Tujuan
utama dari metode clustering adalah pengelompokan sejumlah data atau objek ke dalam cluster
(group) sehingga dalam setiap cluster dapat berisi data yang semirip mungkin. Dalam clustering
metode ini berusaha untuk menempatkan objek yang mirip (jaraknya dekat) dalam satu cluster dan
membuat jarak antar cluster sejauh mungkin. Ini berarti objek dalam satu cluster sangat mirip satu
dengan lain dan berbeda dengan objek dalam cluster-cluster yang lain [3].
Dalam data mining ada dua jenis metode clustering yang digunakan dalam pengelompokan
data, yaitu hierarchical clustering dan non-hierarchical clustering. Metode non-hierarchical
(partitioning) clustering dimulai dengan menentukan terlebih dahulu jumlah cluster yang diinginkan
(dua cluster, tiga cluster, atau lain sebagainya). Setelah jumlah cluster diketahui, baru proses cluster
dilakukan. Metode ini biasa disebut dengan K-Means Clustering [4].
B. Algoritma K-Means
Menurut [5], Algoritma K-Means merupakan Algoritma pengelompokan iteratif yang
melakukan partisi set data ke dalam sejumlah K cluster yang sudah ditetapkan di awal. Algoritma K-
Means sederhana untuk diimplementasikan dan dijalankan, relative cepat, mudah beradaptasi, umum
penggunaannya dalam praktek. Secara historis, K-Means menjadi salah satu algoritma yang paling
penting dalam bidang data mining [6].
Algoritma K-means adalah algoritma yang terbaik dalam algoritma partitional clustering dan
yang paling sering digunakan di antara algoritma clustering lainnya karena kesederhanaan dan
efisiensinya. Kelebihan Algoritma K-means itu sendiri menurut K. Arai and A. R. Barakbah,
merupakan algoritma clustering yang paling sederhana dan umum, hal ini dikarenakan K-means
mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu
komputasi yang relatif cepat dan efisien. Namun, K-means mempunyai kelemahan yang diakibatkan
oleh penentuan pusat awal cluster [7].
Algoritma K-Means dimulai dengan pemilihan secara acak K, K disini merupakan banyaknya
cluster yang ingin dibentuk. Kemudian tetapkan nilai-nilai K secara random, untuk sementara nilai
tersebut menjadi pusat dari cluster atau biasa disebut dengan centroid secara random, mean atau
“means”. Hitung jarak setiap data yang ada terhadap masing-masing centroid menggunakan rumus
Euclidean hingga ditemukan jarak yang paling dekat dari setiap data dengan centroid. Klasifikasikan
setiap data berdasarkan kedekatannya dengan centroid. Lakukan langkah tersebut hingga nilai centroid
tidak berubah [8]. Jarak Euclidean yang dirumuskan sebagai berikut:
𝐷(𝑖, 𝑗) = √(𝑥1𝑗 − 𝑥1𝑖)2 + (𝑥2𝑗 − 𝑥2𝑖)2 + ⋯ + (𝑥𝑘𝑗 − 𝑥𝑘𝑖)2 … (1)
D(i,j) = Jarak data ke i ke pusat cluster j Xki = Data ke i pada atribut data ke k Xkj
= Data ke j pada atribut data ke K

242
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

III. METODOLOGI PENELITIAN


Tahapan-tahapan yang dilakukan dalam penelitian adalah seperti pada gambar dibawah ini:

Gambar.2. Flowchart Algoritma K-Mens

Gambar.2. diatas menunjukan langkah-langkah menentukan clustering dengan metode K-Means


menurut [3] yang terdiri dari beberapa tahapan sebagai berikut:
Kedekatan dua objek ditentukan berdasarkan jarak kedua objek tersebut. Demikian juga
kedekatan suatu data ke cluster tertentu ditentukan jarak antara data ke tiap pusat cluster. Jarak
paling dekat antara satu data dengan satu cluster tertentu akan menentukan suatu data masuk dalam
cluster mana.
Untuk menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan jarak
Euclidean yang dirumuskan sebagai berikut:
i. Tentukan jumlah cluster
ii. Menentukan titik awal cluster secara random
iii. Hitung jarak ke masing-masing centroid
iv. Kelompokkan objek berdasarkan jarak minimum
v. Kembali ke Step 2, apabila masih ada data yang berpindah cluster atau apabila perubahan
nilai centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan nilai
pada objective function yang digunakan di atas nilai threshold yang ditentukan. x1 – x2

Menggunakan Metode Euclidean Distance


𝑑 = √( 𝑥1 − 𝑥2) 2 + (𝑦1 − 𝑦2 )2…(2)
Keterangan :
1. d = Jarak
2. x1 = Koordinat Latitude 1
3. x2 = Koordinat Latitude 2
4. y1 = Koordinat Longtitude1
5. y2 = Koordinat Longitude 2

243
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

Koordinat latitude dan longitude dapat dijadikan variabel guna melakukan perhitungan jarak
antara dua buah titik lokasi apabila dibentangkan garis lurus diantara keduanya (Yulianto,
Ramadiani, & Kridalaksana, 2018).

IV. HASIL DAN PEMBAHASAN


A. Menentukan jumlah Cluster
Data yang dianalisis yaitu data dari 29 merk Smartphone
Tabel.1. Data dari 29 Merk Smartphone

Parameter
No Nama PENYIMPANAN BATERAI
1 Redmi Note 9 128 5020
2 Poco M3 128 6000
Samsung
3 Galaxy M31 128 6000
4 Samsung A12 128 5000
5 Vivo Y30 128 5000
6 Vivo Z1 Pro 128 5000
7 Oppo A74 128 5000
8 Oppo A53 128 5000
Lenovo k5
9 128 4050
Pro
Samsung
10 A21S 128 5000
11 Vivo Y30i 64 5000
12 Realmi Narzo 64 4300
13 Redmi Note 8 64 4000
14 Realmi 6 64 4300
15 Oppo A53 64 5000
Samsung
16 M21 64 6000
17 Redmi 9C 64 5000
18 Samsung A50 64 4000
Infinix Hot 9
19 64 6000
Play
Xiaomi Mi
20 64 4000
A2
21 Samsung A20 64 4000
22 Realmi C2 32 4000
23 Samsung A10 32 3400
Redmi 8A
24 Pro 32 5000
25 Vivo Y91C 32 4030
26 Oppo A11K 32 4230
27 Vivo Y81 32 3260
28 Infinix Hot 8 32 5000
29 Vivo Y12S 32 5000

B. Menentukan titik awal cluster secara random


Berdasarkan data dari tabel diatas maka kita akan menentukan banyaknya cluster
yang dibentuk tiga (k=3). Banyaknya cluster harus lebih kecil dari pada banyaknya data
(k<n).

244
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

Tabel.2. data random


Jumlah Cluster 3
Pusat Cluster (random)
C1 Redmi 8a 32 5000
C2 Redmi note 8 64 4000
C3 POCO M3 128 6000

Inisialisasi centroid dataset pada tabel dataset diatas adalah C1 = {32 , 5000}, C2 =
{64 , 4000} dan C3 = {128 , 6000} . Inisialisasi centroid dapat ditentukan secara manual
ataupun random.
Untuk pengulangan berikutnya (pengulangan ke-1 sampai selesai), centroid baru
dihitung dengan menghitung nilai rata-rata data pada setiap cluster. Jika centroid baru
berbeda dengan centroid sebelumnya, maka proses dilanjutkan ke langkah berikutnya.
Namun jika centroid yang baru dihitung sama dengan centroid sebelumnya, maka proses
clustering selesai.
1. Hitung jarak ke masing-masing centroid dan mengelompokkan objek berdasarkan
jarak minimum
Setelah didapat titik pusat awal cluster, kemudian dilakukan perhitungan jarak
Euclidean, dan mengelompokan berdasarkan jarak terkecil selanjutnya akan di dapat nilai
centroid baru untuk acuan perhitungan berikutnya sampai nilai centroid sebelum dan
sesudah bernilai sama. Perhitungan jarak Euclidean pada iterasi (1),
 Berikut ini beberapa hasil perhitungan jarak Euclidean Distance, Pada titik pusat Cluster 1
(32,5000)
[1] d(x1,c1) = √(𝑎1 − 𝑐1𝑎)2 + √(𝑏1 − 𝑐1𝑏)2 = √(128 − 32) 2 + (5000 − 5000)2 = 98,06120538 [2]
d(x2,c1) = √(𝑎2 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 32) 2 + (6000 − 5000)2 = 1004,597432 [3] d(x3,c1)
= √(𝑎3 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 32) 2 + (6000 − 5000)2 = 1004,597432 [4] d(x4,c1) = √(𝑎4
− 𝑐1𝑎)2 + √(𝑏4 − 𝑐1𝑏)2 = √(128 − 32) 2 + (5000 − 5000)2 = 96
[5] d(x5,c1) = √(𝑎5 − 𝑐1𝑎)2 + √(𝑏5 − 𝑐1𝑏)2 = √(128 − 32) 2 + (5000 − 5000)2 = 96
Lakukan perhitungan yang sama sampai data ke 29

 Berikut ini beberapa hasil perhitungan jarak Euclidean Distance, Pada titik pusat Cluster 2 =
(64, 4000)

[1] d(x1,c1) = √(𝑎1 − 𝑐1𝑎)2 + √(𝑏1 − 𝑐1𝑏)2 = √(128 − 64) 2 + (5000 − 4000)2 = 1022,005871 [2]
d(x2,c1) = √(𝑎2 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 64) 2 + (6000 − 4000)2 = 2001,023738 [3] d(x3,c1)
= √(𝑎3 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 64) 2 + (6000 − 4000)2 = 2001,023738 [4] d(x4,c1) = √(𝑎4
− 𝑐1𝑎)2 + √(𝑏4 − 𝑐1𝑏)2 = √(128 − 64) 2 + (5000 − 4000)2 = 1002,045907 [5] d(x5,c1) = √(𝑎5 − 𝑐1𝑎)2
+ √(𝑏5 − 𝑐1𝑏)2 = √(128 − 64) 2 + (5000 − 4000)2 = 1002,045907
Lakukan perhitungan yang sama sampai data ke 29

 Berikut ini beberapa hasil perhitungan jarak Euclidean Distance, Pada titik pusat Cluster 3 =
(128, 6000)
[1] d(x1,c1) = √(𝑎1 − 𝑐1𝑎)2 + √(𝑏1 − 𝑐1𝑏)2 = √(128 − 128) 2 + (5000 − 6000)2 = 1000
[2] d(x2,c1) = √(𝑎2 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 128) 2 + (6000 − 6000)2 = 0 [3] d(x3,c1) = √(𝑎3
− 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 128) 2 + (6000 − 6000)2 = 0 [4] d(x4,c1) = √(𝑎4 − 𝑐1𝑎)2 + √(𝑏4 −
𝑐1𝑏)2 = √(128 − 128) 2 + (5000 − 6000)2 = 1000
[5] d(x5,c1) = √(𝑎5 − 𝑐1𝑎)2 + √(𝑏5 − 𝑐1𝑏)2 = √(128 − 128) 2 + (5000 − 6000)2 = 1000
Lakukan perhitungan yang sama sampai data ke 29

245
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

Untuk seterusnya, hitung jarak pada setiap baris data, dan hasilnya seperti pada tabel
dibawah.
Tabel.3. Tabel Parameter
Pusat Jarak ke pusat
Clust Cluster Parameter
er Nama PENYIMPANAN BATERAI C1 C2 C3
N Dc1 Dc2 Dc3
1 Redmi Note 9 128 5020 98,06120538 1022,005871 980
2 Poco M3 128 6000 1004,597432 2001,023738 0
Samsung Gal- 1004,597432 2001,023738 0
128
3 axy M31 6000
4 Samsung A12 128 5000 96 1002,045907 1000
5 Vivo Y30 128 5000 96 1002,045907 1000
6 Vivo Z1 Pro 128 5000 96 1002,045907 1000
7 Oppo A74 128 5000 96 1002,045907 1000
8 Oppo A53 128 5000 96 1002,045907 1000
9 Lenovo k5 Pro 128 4050 954,8382062 81,21576202 1950
10 Samsung A21S 128 5000 96 1002,045907 1000
11 Vivo Y30i 64 5000 32 1000 1002,045907
12 Realmi Narzo 64 4300 700,7310468 300 1701,204279
13 Redmi Note 8 64 4000 1000,511869 0 2001,023738
14 Redmi 6 64 4300 700,7310468 300 1701,204279
15 Oppo A53 64 5000 32 1000 1002,045907
16 Samsung M21 64 6000 1000,511869 2000 64
17 Redmi 9C 64 5000 32 1000 1002,045907
18 Samsung A50 64 4000 1000,511869 0 2001,023738
Infinix Hot 9 1000,511869 2000 64
19 64 6000
Play
20 Xiaomi Mi A2 64 4000 1000,511869 0 2001,023738
21 Samsung A20 64 4000 1000,511869 0 2001,023738
22 Realmi C2 32 4000 1000 32 2002,302674
23 Samsung A10 32 3400 1600 600,8527274 2601,771704
24 Redmi 8A Pro 32 5000 0 1000,511869 1004,597432
25 Vivo Y91C 32 4030 970 43,8634244 1972,337699
26 Oppo A11K 32 4230 770 232,2154172 1772,601478
27 Vivo Y81 32 3260 1740 740,6915687 2741,681236
28 Infinix Hot 8 32 5000 0 1000,511869 1004,597432
29 Vivo Y12S 32 5000 0 1000,511869 1004,597432
Pengelompokkan data pada pengulangan ke-1

Tabel.4. Pusat Cluster Baru


Pusat Cluster Baru
N C1 C2 C3
PENYIMPANAN BATERAI PENYIMPANAN BATERAI PENYIMPANAN BATERAI
1 128 5020
2 128 6000
128 6000
3
4 128 5000
5 128 5000
6 128 5000
7 128 5000
8 128 5000
9 128 4050
246
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

10 128 5000
11 64 5000
12 64 4300
13 64 4000
14 64 4300
15 64 5000
16 64 6000
17 64 5000
18 64 4000
19 64 6000
20 64 4000
21 64 4000
22 32 4000
23 32 3400
24 32 5000
25 32 4030
26 32 4230
27 32 3260
28 32 5000
29 32 5000
Pengelompokkan data pada pengulangan ke-1

Kelompokan data sesuai dengan cluster-nya, yaitu data yang memiliki jarak terpendek.
Contoh; Pada tabel diatas, data N = 1 masuk ke dalam cluster 3 karena dc3 < dc2 < dc1,
sedangkan N = 14,15,16 sampai 22 masuk ke dalam cluster 2 karena dc2 < dc3 < dc1.
Setelah mendapatkan label cluster untuk masing-masing data n=1,2,3,4,5 – 29 maka dicari
nilai rata-ratanya dengan menjumlahkan seluruh anggota masing-masing cluster dan dibagi jumlah
anggotanya.

Tabel.5. Perhitungan cluster


Penyimpanan Baterai
C1 91,07692308 5001,538462
C2 56 3964,166667
C3 96 6000
Nilai Rata- Rata Centroid Pada Pengulangan ke-1

Dari Tabel hasil iterasi 1 dapat dilihat centroid baru yang dihasilkan dari iterasi 1 dengan titik
pusat awal tidak sama, maka perlu dilakukan iterasi kedua. Berikut ini beberapa hasil
perhitungan jarak Euclidean pada iterasi ke 2
Berikut ini beberapa hasil perhitungan jarak Euclidean Distance, Pada titik pusat Cluster 1 (91.076, 5001.53)
[1] d(x1,c1) = √(𝑎1 − 𝑐1𝑎)2 + √(𝑏1 − 𝑐1𝑏)2 = √(128 − 91.076) 2 + (5000 − 5001.53)2 = 41,28125497
[2] d(x2,c1) = √(𝑎2 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 91.076) 2 + (6000 − 5001.53)2 = 999,1440123
[3] d(x3,c1) = √(𝑎3 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 91.076) 2 + (6000 − 5001.53)2 = 999,1440123
[4] d(x4,c1) = √(𝑎4 − 𝑐1𝑎)2 + √(𝑏4 − 𝑐1𝑏)2 = √(128 − 91.076) 2 + (5000 − 5001.53)2 = 36,95511431
[5] d(x5,c1) = √(𝑎5 − 𝑐1𝑎)2 + √(𝑏5 − 𝑐1𝑏)2 = √(128 − 91.076) 2 + (5000 − 5001.53)2 = 36,95511431
Lakukan perhitungan yang sama sampai data ke 29
Berikut ini beberapa hasil perhitungan jarak Euclidean Distance, Pada titik pusat Cluster 2 = (56, 3964,16)
[1] d(x1,c1) = √(𝑎1 − 𝑐1𝑎)2 + √(𝑏1 − 𝑐1𝑏)2 = √(128 − 56) 2 + (5000 − 3964,16)2 = 1058,285419
[2]d(x2,c1) = √(𝑎2 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 56) 2 + (6000 − 3964,16)2 = 2037,106124
[3] d(x3,c1) = √(𝑎3 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 56) 2 + (6000 − 3964,16)2 =
2037,106124 [4] d(x4,c1) = √(𝑎4 − 𝑐1𝑎)2 + √(𝑏4 − 𝑐1𝑏)2 = √(128 − 56) 2 + (5000 −
3964,16)2 = 1038,332651 [5] d(x5,c1) = √(𝑎5 − 𝑐1𝑎)2 + √(𝑏5 − 𝑐1𝑏)2 = √(128 − 56) 2 +
247
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

(5000 − 3964,16)2 = 1038,332651


Lakukan perhitungan yang sama sampai data ke 29
Berikut ini beberapa hasil perhitungan jarak Euclidean Distance, Pada titik pusat Cluster 3 = (96, 6000)
[1] d(x1,c1) = √(𝑎1 − 𝑐1𝑎)2 + √(𝑏1 − 𝑐1𝑏)2 = √(128 − 96) 2 + (5000 − 6000) 2 = 980,5223098 [2]
d(x2,c1) = √(𝑎2 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 96) 2 + (6000 − 6000)2 = 32
[3] d(x3,c1) = √(𝑎3 − 𝑐1𝑎)2 + √(𝑏2 − 𝑐1𝑏)2 = √(128 − 96) 2 + (6000 − 6000)2 = 32
[4] d(x4,c1) = √(𝑎4 − 𝑐1𝑎)2 + √(𝑏4 − 𝑐1𝑏)2 = √(128 − 96) 2 + (5000 − 6000)2 = 1000,511869
[5] d(x5,c1) = √(𝑎5 − 𝑐1𝑎)2 + √(𝑏5 − 𝑐1𝑏)2 = √(128 − 96) 2 + (5000 − 6000)2 = 1000,511869
Lakukan perhitungan yang sama sampai data ke 29

Tabel.6. Pusat Cluster Baru


Pusat Cluster baru
C1 C2 C3
N PENYIMPANAN BATERAI PENYIMPANAN BATERAI PENYIMPANAN BATERAI
1 128 5020
2 128 6000
3 128 6000
4 128 5000
5 128 5000
6 128 5000
7 128 5000
8 128 5000
9 128 4050
10 128 5000
11 64 5000
12 64 4300
13 64 4000
14 64 4300
15 64 5000
16 64 6000
17 64 5000
18 64 4000
19 64 6000
20 64 4000
21 64 4000
22 32 4000
23 32 3400
24 32 5000
25 32 4030
26 32 4230
27 32 3260
28 32 5000
29 32 5000
Pengelompokkan data pada pengulangan ke-2

Setelah mendapatkan label cluster untuk masing-masing data n=1,2,3,4,5 – 29 maka


dicari nilai rata-ra- tanya dengan menjumlahkan seluruh anggota masing-masing cluster dan
dibagi jumlah anggotanya.
Tabel.7. Centroid
Penyimpanan Baterai
C1 91,07692308 5001,538462
C2 56 3964,166667
C3 96 6000
Nilai Rata- Rata Centroid Pada Pengulangan ke-2

248
SISMATIK (Seminar Nasional Sistem Informasi dan Manajemen Informatika)
Universitas Nusa Putra, 7 Agustus 2021

Karna Centroid tidak mengalami perubahan,(sama dengan centroid sebelumnya)maka


proses clustering selesai.

Hasil :
Table 4.7 table hasil centroid
N0 Nama Kelompok Cluster 15 Oppo A53 C1
1 Redmi Note 9 C1 16 Samsung M21 C3
2 Poco M3 C3 17 Redmi 9C C1
3 Samsung Galaxy M31 C3 18 Samsung A50 C2
4 Samsung A12 C1 19 Infinix Hot 9 Play C3
5 Vivo Y30 C1 20 Xiaomi Mi A2 C2
6 Vivo Z1 Pro C1 21 Samsung A20 C2
7 Oppo A74 C1 22 Realmi C2 C2
8 Oppo A53 C1 23 Samsung A10 C2
9 Lenovo k5 Pro C2 24 Redmi 8A Pro C1
10 Samsung A21S C1 25 Vivo Y91C C2
11 Vivo Y30i C1 26 Oppo A11K C2
12 Realmi Narzo C2 27 Vivo Y81 C2
13 Redmi Note 8 C2 28 Infinix Hot 8 C1
14 Realmi 6 C2 29 Vivo Y12S C1

V. KESIMPULAN
Berdasarkan penelitian ini didapat kesimpulan sebagai berikut:
1) Telah berhasil dikelompokkan data berbagai jenis smartphone menggunakan algoritma K-means
Clustering menjadi 3 kelompok yaitu untuk kelompok 1 berjumlah 13 data, kelompok 2
berjumlah 12 data, dan kelompok 3 berjumlah 4 data.
2) Terdapat kesamaan Pada anggota C1, yaitu pada baterai yang berkapasitas 5000 Mah Terdapat
kesamaan Pada anggota C2, yaitu pada baterai yang berkapasitas 4000 Mah Terapat kesamaan
Pada anggota C3, yaitu pada baterai yang berkapasitas 6000 Mah
3) Penentuan titik pusat awal (centroid) sangat berpengaruh terhadap jumlah iterasi yang akan
dihitung.
4) Berdasarkan penelitian ini dapat dijadikan acuan dalam memilih smartphone yang tepat dan
sesuai dengan kebutuhan juga keinginan.

DAFTAR PUSTAKA
[1] accesstrade.co.id. (2020). Sejarah Perkembangan Handphone dari Masa ke Masa. Www.Ac-
cesstrade.Co.Id. https://accesstrade.co.id/sejarah-perkembangan-handphone-dari-masa-ke-
masa-1459
[2] Agusta, Y. (2017). Clustering. Wordpress.Com. https://yudiagusta.wordpress.com/clustering/
[3] Santosa, B. (2007). Data Mining: Teknik Pemanfaatan Data untuk Keperluan
Bisnis.Yogyakarta: Graha Ilmu.
[4] Santoso, S. (2010). Statistik Multivariat. Jakarta: Elex Media Komputindo.
[5] Wu, X. and Kumar, V. (2009). The Top Ten Algorithms in Data Mining. London: CRC Press
Taylor & Francis Group.
[6] Prasetyo, Eko. (2014). Data Mining - Mengolah Data Menjadi Informasi menggunakan Matlab.
Yogyakarta: CV. Andi Offset.
[7] Tahta, Budi, dan Ali. 2013. Analisa Perbandingan Metode Hierarchical Clustering, K-means
dan Gabungan Keduanya dalam Custer Data (Studi kasus: Problem Kerja Praktek Jurusan
Teknik Industri ITS). Jurnal Skripsi Teknik Industri ITS. Surabaya: Teknik Industri, Institut
Teknologi Sepuluh Nopember (ITS).
[8] Witten, Ian H. dan Frank, Eibe. 2005. Data Mining Practical Machine Learning Tools and
Tech- niques, Second Edition. Morgan Kaufmann, San Francisco.
249

Anda mungkin juga menyukai