Nothing Special   »   [go: up one dir, main page]

Test

Unduh sebagai pdf atau txt
Unduh sebagai pdf atau txt
Anda di halaman 1dari 4

Tugas:

Tulis 2 metode data mining Clustering dan gambar dan jelaskan cara kerjanya.

Jawaban:
Algoritma Clustering merupakan algoritma yang bekerja dengan cara mengelompokkan
objek-objek data seperti pola, entitas, kejadian, unit, serta hasil observasi ke dalam suatu
cluster tertentu, hal ini diartikan bahwa algoritma clustering merupakan algoritma pemisahan,
pemecahan dan atau segmentasi data ke dalam kelompok tertentu berdasarkan jenis
karakteristik yang disesuaikan. Algoritma clustering memiliki 4 metode di dalamnya, adapun
2 diantara metode algoritma clustering diantaranya adalah sebagai berikut:
1. Metode Partisi, Metode Partisi, metode ini merupakan metode yang mengelompokkan
data ke dalam beberapa cluster atau kelompok sehingga data yang ada di dalam satu
cluster memiliki kemiripan satu sama lain dalam jarak yang dekat dan data antar
cluster juga memiliki perbedaan data yang minim. Adapun rumus dalam perhitungan
metode ini adalah sebagai berikut:

Metode partisi merupakan metode yang melakukan partisi basis data D dari n objek
ke dalam kumpulan cluster k yang ada sehingga jumlah kuadrat yang digunakan
diminimalkan (ci merupakan centroid atau medoid dari cluster Ci). kemudian
masukkan nilai k yang telah tersedia untuk mencari partisi k cluster yang
mengoptimalkan kriteria partisi yang dipilih. Adapun salah satu contoh dari metode
partisi adalah metode k-means yang melakukan pengelompokan data berdasarkan
beberapa prosedur, diantaranya:
● menentukan jumlah cluster.
● mengalokasikan data secara acak ke cluster yang ada.
● menghitung rata – rata setiap cluster dari data yang sudah tergabung.
● alokasikan kembali semua data ke cluster yang terdekat.
● Menghitung kembali rata – rata setiap cluster sampai tidak ada perubahan.
Berikut merupakan tahapan dan contoh dari metode algoritma k-means yang
dijelaskan sebagai berikut, Tahapan algoritma k-mean, berupa:
1. Pilih jumlah klaster k yang diinginkan.
2. Pusat cluster ditetapkan berdasarkan jarak setiap data ke pusat cluster.
3. Proses clustering dimulai dengan mengidentifikasi data yang akan dicluster,
xij (i=1,...,n; j=1,...,m) dengan n adalah jumlah data yang akan dicluster dan m
adalah jumlah variabel.
4. Pada awal iterasi, pusat setiap cluster ditetapkan secara bebas (sembarang), ckj
(k=1,...,K; j=1,...,m).
5. Kemudian dihitung jarak antara setiap data dengan setiap pusat cluster.
6. Untuk melakukan penghitungan jarak data ke-i (Xi) pada pusat cluster ke-k
(Ck), diberi nama (dik), dapat digunakan formula Euclidean, yaitu:

7. Suatu data akan menjadi anggota dari cluster ke-J apabila jarak data tersebut
ke pusat cluster ke-J bernilai paling kecil jika dibandingkan dengan jarak ke
pusat cluster lainnya.
8. Selanjutnya, kelompokkan data-data yang menjadi anggota pada setiap cluster.
9. Nilai pusat cluster yang baru dapat dihitung dengan cara mencari nilai rata-
rata dari data yang menjadi anggota pada cluster tersebut, dengan rumus:

Selanjutnya adalah contoh dari algoritma k-means beserta penjelasannya, berupa:


Adapun penjelasan dari contoh yang telah diberikan diatas adalah sebagai berikut:
a. Partisi objek berubah secara acak menjadi bagian grup k.
b. kemudian dilakukan perbaruan terhadap centroid cluster.
c. Setelahnya menetapkan ulang objek.
d. Proses perulangan dapat dilakukan apabila masih ada yang ingin diubah atau
tidak sesuai. Proses perulangan berupa partisi objek menjadi k subset
nonempty menghitung centroid (miss, titik tengah) untuk setiap partisi yang
ada serta menetapkan objek kepada kluster pusat yang memiliki massa
terdekat sampai tidak ada perubahan di dalamnya.

2. Metode Hirarki
Metode Hirarki merupakan sebuah metode yang melakukan pengelompokkan data
dengan dua atau lebih objek yang mempunyai kesamaan paling dekat, kemudian
diteruskan ke objek lain yang mempunyai kedekatan kedua. Adapun metode hirarki
memiliki 2 metode di dalamnya, yaitu:
a. Agglomerative Nesting (AGNES)
Agglomerative melakukan proses clustering dari jumlah data cluster menjadi
satu kesatuan cluster. Adapun langkah yang dapat dilakukan untuk melakukan
metode ini berupa:
1. Metode yang digunakan berupa tautan tunggal serta matriks
ketidaksamaan.
2. Menggabungkan simpul yang memiliki sedikit perbedaan.
3. Kemudian semua node masuk ke dalam cluster yang sama.

b. Divisive Analysis (DIANA)


Divisive melakukan proses clustering yang sebaliknya yaitu dari satu cluster
menjadi N cluster (jumlah data). Adapun langkah yang dapat dilakukan untuk
melakukan metode ini berupa setiap node membentuk sebuah cluster sendiri,
DIANA sendiri merupakan proses yang memiliki urutan langkah terbalik dari
AGNES.

Anda mungkin juga menyukai