Peningkatan Kinerja K-Means dengan Normalisasi Min-Max dan PSO untuk Penentuan Pusat Awal Klaster Terbaik pada Data Pamsimas
Abstract
K- means termasuk kedalam algoritma partisi yang memiliki tujuan untuk membagi data kedalam jumlah klaster yang ditentukan, hasil dari algoritma K means tergantung pada pemilihan pusat klater awal namun permasalahan yang sering terjadi jika pada pemilihan centroid awal yang masih dilakukan secara acak jauh dari solusi maka kemungkinan hasil dari pengelompokan tersebut kurang tepat. Untuk mengatasi masalah tersebut akan menggunakan tahapan preprocessing berupa normalisasi minmax untuk mengatasi skala pengukuran berbeda pada dataset, setelah itu menggunakan algoritma PSO dalam pemilihan centroid awal untuk algoritma K- means, dalam penelitian ini juga dibandingkan pemilihan centroid dengan 3 cara yang pertama sesuai dengan acak, kedua sesuai standar pemerintah untuk nilai kualitas air minum yang tingi, menengah dan rendah kemudian yang ketiga dengan metode yang diusulkan algortima PSO dan kemudian akan diuji dengan Index Davies Bouldin. Hasil pengujian berupa tersebut metode K-means dengan pemilihan centroid awal acak dengan nilai 0,208856082, metode K-means dengan pemilihan centroid sesuai dengan standar pemerintah tentang kondisi SAM sebesar 0,280077, dan terakhir metode pemilihan yang terbaik adalah dengan menggunakan normalisasi minmax K-means PSO dengan nilai 0,177796. Sehingga pengujian data PAMSIMAS menggunakan normalisasi minmax k-means PSO yang didapat bahwa metode tersebut lebih optimal
References
[2] R. M. Alguliyev, R. M. Aliguliyev, and L. V. Sukhostat, “Parallel batch k-means for Big data clustering,” Comput. Ind. Eng., vol. 152, no. July 2020, p. 107023, 2021, doi: 10.1016/j.cie.2020.107023.
[3] Y. Kim, H. Do, and S. B. Kim, “Outer-Points shaver: Robust graph-based clustering via node cutting,” Pattern Recognit., vol. 97, p. 107001, 2020, doi: 10.1016/j.patcog.2019.107001.
[4] L. Brown and A. Engelbrecht, “Set-based Particle Swarm Optimization for Data Clustering,” ACM Int. Conf. Proceeding Ser., pp. 43–49, 2022, doi: 10.1145/3533050.3533057.
[5] K. B, “A Comparative Study on K-Means Clustering and Agglomerative Hierarchical Clustering,” Int. J. Emerg. Trends Eng. Res., vol. 8, no. 5, pp. 1600–1604, 2020, doi: 10.30534/ijeter/2020/20852020.
[6] Y. Abo-Elnaga and S. Nasr, “K-means cluster interactive algorithm-based evolutionary approach for solving bilevel multi-objective programming problems,” Alexandria Eng. J., vol. 61, no. 1, pp. 811–827, 2022, doi: 10.1016/j.aej.2021.04.098.
[7] J. Yang, Y. K. Wang, X. Yao, and C. T. Lin, “Adaptive Initialization Method for K-Means Algorithm,” Front. Artif. Intell., vol. 4, no. November, pp. 1–13, 2021, doi: 10.3389/frai.2021.740817.
[8] E. S. Laber and L. Murtinho, “Optimization of Inter-group Criteria for Clustering with Minimum Size Constraints,” no. 1985, 2024, [Online]. Available: http://arxiv.org/abs/2401.07091
[9] R. Buaton and S. Solikhun, “The Application of Numerical Measure Variations in K-Means Clustering for Grouping Data,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 23, no. 1, pp. 103–112, 2023, doi: 10.30812/matrik.v23i1.3269.
[10] J. P. Jiawei Han, Micheline Kamber, Data mining: Data mining concepts and techniques. 2014. doi: 10.1109/ICMIRA.2013.45.
[11] A. Pangestu and T. Ridwan, “Penerapan Data Mining Menggunakan Algoritma K-Means Pengelompokan Pelanggan Berdasarkan Kubikasi Air Terjual Menggunakan Weka,” JUST IT J. Sist. Informasi, Teknol. Inf. dan Komput., vol. 11, no. 3, pp. 67–71, 2022, [Online]. Available: https://jurnal.umj.ac.id/index.php/just-it/article/view/11591
[12] P. Ardarsa and O. Surinta, “Water Quality Assessment in the Lam Pa Thao Dam, Chaiyaphum, Thailand with K-Means Clustering Algorithm,” Proc. - 2021 Res. Invent. Innov. Congr. Innov. Electr. Electron. RI2C 2021, pp. 35–39, 2021, doi: 10.1109/RI2C51727.2021.9559811.
[13] N. R. Radliya, M. R. Fachrizal, and A. R. Rabbi, “Monitoring Application for Clean Water Access and Clustering using K-Means Algorithm,” IOP Conf. Ser. Mater. Sci. Eng., vol. 662, no. 2, 2019, doi: 10.1088/1757-899X/662/2/022096.
[14] I. N. T. Issue, “ENHANCING COLLABORATION WITH GOVERNMENT AND LOCAL PARTNERS STRENGTHENING WASH SERVICE RESILIENCE TO CLIMATE CHANGE,” vol. 13, no. December 2023, pp. 1–4, 2025.
[15] Ditjen Cipta Karya, “Pamsimas 2022 Pedoman Umum Program Pamsimas,” 2022.
[16] Gudono, “Analisis Data,” 2011.
[17] D. Rajeswari and K. Thangavel, “The Performance of Data Normalization Techniques on Heart Disease Datasets,” Int. J. Adv. Res. Eng. Technol., vol. 11, no. 12, pp. 2350–2357, 2020, doi: 10.34218/IJARET.11.12.2020.222.
[18] A. G. Gad, Particle Swarm Optimization Algorithm and Its Applications: A Systematic Review, vol. 29, no. 5. Springer Netherlands, 2022. doi: 10.1007/s11831-021-09694-4.
Copyright (c) 2025 Domi nikus, Muljono Muljono, Heribertus Himawan

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.







