Perbandingan Penerapan Algoritme K-Means dan Fuzzy C-Means untuk Mengelompokkan Data Kinerja Dosen Universitas Islam Bandung

Shavira Siti Rachmasari, Abdul Kudus

Abstract


Abstract. In Data mining, the clustering method is divided into two, namely cluster hierarchies and non-hierarchical clusters. In a hierarchical cluster start grouping with two or more objects that have the closest similarity to, a non-hierarchical cluster starting with the number of clusters first. Among the non-hierarchical cluster methods are the K-Means method and the Fuzzy C-Means (FCM) method. The K-Means method is hard clustering in contrast to FCM which includes fuzzy clustering. Judging from previous studies, these two methods produced the best clusters. This thesis explores the optimal k value using principal component analysis, the final result is 4 clusters. Clustering on the performance data of Bandung Islamic University lecturers for the February 2021 period using the second method resulted in a different number of cluster members. The second comparison is based on the validation of the SI value of the K-Means which is 0.55 while the SI value of the FCM is 0.05. From these results, it shows that the K-Means algorithm is superior to the Fuzzy C-Means algorithm in clustering data on the performance of lecturers at the Islamic University of Bandung. Based on the validation of the cluster that a value closer to 1 has a better cluster quality. The results of the K-Means clustering are in cluster 1 consisting of lecturers who do not have a Sinta accredited journal, cluster 2 consists of lecturers who have a minimum of 5 conference articles, lecturers with Q3 class journals, and do not have a Sinta accredited journal, cluster 3 consists of lecturers who have at least 3 articles, journals / books that are lecturers with Q2 class journals and do not have Sinta accredited journals, and cluster 4 consists of lecturers with the number of articles in S6 class.

Keywords: Clustering, K-Means, Fuzzy C-Means, Silhoutte Index.

Abstrak. Dalam Data Mining metode pengklasteran dibagi menjadi dua yaitu cluster hirarki dan non-hirarki. Pada cluster hirarki memulai pengelompokkan dengan dua atau lebih objek yang mempunyai kesamaan paling dekat sedangkan pada cluster non hirarki justru dimulai dengan penentuan jumlah cluster terlebih dahulu. Diantaranya yang termasuk metode cluster non hirarki adalah metode K-Means dan metode Fuzzy C-Means (FCM). Metode K-Means bersifat hard clustering berbeda dengan FCM yang termasuk fuzzy clustering. Dilihat dari penelitian-penelitian sebelum nya kedua metode ini menghasilkan cluster terbaik. Pada skripsi ini mengeksplorasi nilai k optimal menggunakan analisis komponen utama, didapat hasil akhirnya yaitu 4 cluster.  Pengklasteran pada data kinerja dosen Universitas Islam Bandung pada periode Februari 2021 menggunakan kedua metode tersebut menghasilkan jumlah anggota cluster yang berbeda. Perbandingan kedua metode berdasarkan validasi nilai SI dari K-Means yaitu 0.55 sedangkan nilai SI dari FCM yaitu 0.05. Dari hasil tersebut menunjukkan algoritma K-Means lebih unggul dibandingkan algortima Fuzzy C-Means dalam pengklasteran data kinerja dosen Universitas Islam Bandung. Berdasarkan ketentuan dari validasi cluster bahwa nilai yang lebih mendekati 1 mempunyai kualitas cluster yang semakin baik. Hasil pengklasteran K-Means yaitu pada cluster 1 beranggotakan dosen yang belum memiliki jurnal terakreditasi Sinta, cluster 2 beranggotakan dosen yang memiliki minimal 5 jumlah artikel dikonferensi, dosen dengan jurnal kelas Q3,dan belum memiliki jurnal terakreditasi Sinta, cluster 3 beranggotakan dosen yang memiliki minimal 3 artikel,jurnal,/buku yang dipublikasikan, dosen dengan jurnal kelas Q2 dan belum memiliki jurnal terakreditasi Sinta, dan cluster 4 beranggotakan dosen dengan jumlah artikel di jurnal kelas S6.

Kata Kunci: Pengkasteran, K-Means, Fuzzy C-Means, Silhoutte Index.


Keywords


Pengkasteran, K-Means, Fuzzy C-Means, Silhoutte Index

Full Text:

PDF

References


Cinaroglu, Songul. (2020). Comparison Of Fuzzy C-Means Dan K-Means Pengklasteran Performance: An Application On Household Budget Survey Data. Halaman: 54-62.

Kustini, & Lutfi, E. T. (2009). Algoritme Data Mining. Yogyakarta: Andi Offset.

Sani, Asrul. (2018). Penerapan Metode K-Means Pengklasteran pada Perusahaan.

Aditya, A., Jovian, I., & Sari, B. N. (2020). Implementasi K-Means Pengklasteran Ujian Nasional Sekolah Menengah Pertama Di Indonesia Tahun 2018/2019. Volume 4, No. 1:51-58.

Simbolon, C. L., Kusumastuti, N., & Irawan Beni. (2013). Pengklasteran Lulusan Mahasiswa Matematika FMIPA UNTAN Pontianak Menggunakan Algoritme Fuzzy C-Means. Volume 01, No. 1:21-26.

Mirza, M. F. (2009). Metode Pengklasteran Dengan Algoritme Fuzzy C-Means Untuk Rekomendasi Pemilihan Bidang Keahlian Pada Program Studi Teknik Informatika.

Pradnyana, G. A., Permana, A. A. J. (2018). Sistem Pembagian Kelas Kuliah Mahasiswa Dengan Metode K-Means Dan K-Nearest Neighbords Untuk Meningkatkan Kualitas Pembelajaran. Volume 16, No. 1:59-68.

Handoyo, R., M, R., R., & Nasution, S., M. (2014). Perbandingan Metode Clustering Menggunakan Metode Single Linkage Dan K-Means Pada Pengelompokkan Dokumen. Volume 15, No. 2.

Merliana, N., P., E., Ernawati, & Santoso, A., J. Analisa Penentuan Jumlah Cluster Terbaik Pada Metode K-Means Clustering.

Shihab, Ardhi. 2015/2016. Analisis Multivariat II dengan R. URL : Analisis Multivariat II dengan R - StuDocu. Diakses tanggal 11 Juni 2021.

Mujilahwati, Siti., Wardhani, Retno. (2021). Implementasi Fuzzy C-Means Untuk Clustering Mahasiswa Berdasarkan Nilai Masuk Perguruan Tinggi. Volume 6, No. 1.

Wakhidah, Nur. Clustering Menggunakan K-Means Algorithm

Sari, Kartika. (2020). Analisis Evaluasi Perhitungan Jarak Terhadap Nilai Silhoutte Coefficient pada Algotirma K-Means. (Universitas Sumatera Utama, 2020).

Yulianto Anggi Priliani, Darwis Sutawanir. (2021). Penerapan Metode K-Nearest Neighbors (kNN) pada Bearing. Jurnal Riset Statistika, 1(1), 10-18.




DOI: http://dx.doi.org/10.29313/.v0i0.28917

Flag Counter