Peningkatan Kinerja K-Means dengan Normalisasi Min-Max dan PSO untuk Penentuan Pusat Awal Klaster Terbaik pada Data Pamsimas

  • Domi nikus Universitas Dian Nuswantoro
  • Muljono Muljono Universitas Dian Nuswantoro
  • Heribertus Himawan Universitas Dian Nuswantoro

Abstract

K- means termasuk kedalam algoritma partisi yang memiliki tujuan untuk membagi data kedalam jumlah  klaster yang ditentukan, hasil dari algoritma K means tergantung pada pemilihan pusat klater awal  namun permasalahan yang sering terjadi jika pada pemilihan centroid awal yang masih dilakukan secara acak jauh dari solusi maka kemungkinan hasil dari pengelompokan tersebut kurang tepat. Untuk mengatasi masalah tersebut akan menggunakan tahapan preprocessing berupa normalisasi minmax untuk mengatasi skala pengukuran berbeda pada dataset, setelah itu menggunakan algoritma PSO dalam pemilihan centroid awal untuk algoritma K- means, dalam penelitian ini juga dibandingkan pemilihan centroid dengan 3 cara yang pertama sesuai dengan acak, kedua sesuai standar pemerintah untuk nilai kualitas air minum yang tingi, menengah dan rendah kemudian yang ketiga dengan metode yang diusulkan algortima PSO dan kemudian akan diuji dengan Index Davies Bouldin. Hasil pengujian berupa tersebut metode K-means dengan pemilihan centroid awal acak dengan nilai 0,208856082, metode K-means dengan pemilihan centroid sesuai dengan standar pemerintah tentang kondisi SAM  sebesar 0,280077, dan terakhir metode pemilihan yang terbaik adalah dengan menggunakan normalisasi minmax K-means PSO dengan nilai 0,177796. Sehingga pengujian data PAMSIMAS menggunakan normalisasi minmax k-means PSO yang didapat bahwa metode tersebut lebih optimal

References

[1] A. K. Dubey, R. Gupta, and S. Mishra, “Data Stream Clustering for Big Data Sets: A comparative Analysis,” IOP Conf. Ser. Mater. Sci. Eng., vol. 1099, no. 1, p. 12030, 2021, doi: 10.1088/1757-899x/1099/1/012030.
[2] R. M. Alguliyev, R. M. Aliguliyev, and L. V. Sukhostat, “Parallel batch k-means for Big data clustering,” Comput. Ind. Eng., vol. 152, no. July 2020, p. 107023, 2021, doi: 10.1016/j.cie.2020.107023.
[3] Y. Kim, H. Do, and S. B. Kim, “Outer-Points shaver: Robust graph-based clustering via node cutting,” Pattern Recognit., vol. 97, p. 107001, 2020, doi: 10.1016/j.patcog.2019.107001.
[4] L. Brown and A. Engelbrecht, “Set-based Particle Swarm Optimization for Data Clustering,” ACM Int. Conf. Proceeding Ser., pp. 43–49, 2022, doi: 10.1145/3533050.3533057.
[5] K. B, “A Comparative Study on K-Means Clustering and Agglomerative Hierarchical Clustering,” Int. J. Emerg. Trends Eng. Res., vol. 8, no. 5, pp. 1600–1604, 2020, doi: 10.30534/ijeter/2020/20852020.
[6] Y. Abo-Elnaga and S. Nasr, “K-means cluster interactive algorithm-based evolutionary approach for solving bilevel multi-objective programming problems,” Alexandria Eng. J., vol. 61, no. 1, pp. 811–827, 2022, doi: 10.1016/j.aej.2021.04.098.
[7] J. Yang, Y. K. Wang, X. Yao, and C. T. Lin, “Adaptive Initialization Method for K-Means Algorithm,” Front. Artif. Intell., vol. 4, no. November, pp. 1–13, 2021, doi: 10.3389/frai.2021.740817.
[8] E. S. Laber and L. Murtinho, “Optimization of Inter-group Criteria for Clustering with Minimum Size Constraints,” no. 1985, 2024, [Online]. Available: http://arxiv.org/abs/2401.07091
[9] R. Buaton and S. Solikhun, “The Application of Numerical Measure Variations in K-Means Clustering for Grouping Data,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 23, no. 1, pp. 103–112, 2023, doi: 10.30812/matrik.v23i1.3269.
[10] J. P. Jiawei Han, Micheline Kamber, Data mining: Data mining concepts and techniques. 2014. doi: 10.1109/ICMIRA.2013.45.
[11] A. Pangestu and T. Ridwan, “Penerapan Data Mining Menggunakan Algoritma K-Means Pengelompokan Pelanggan Berdasarkan Kubikasi Air Terjual Menggunakan Weka,” JUST IT J. Sist. Informasi, Teknol. Inf. dan Komput., vol. 11, no. 3, pp. 67–71, 2022, [Online]. Available: https://jurnal.umj.ac.id/index.php/just-it/article/view/11591
[12] P. Ardarsa and O. Surinta, “Water Quality Assessment in the Lam Pa Thao Dam, Chaiyaphum, Thailand with K-Means Clustering Algorithm,” Proc. - 2021 Res. Invent. Innov. Congr. Innov. Electr. Electron. RI2C 2021, pp. 35–39, 2021, doi: 10.1109/RI2C51727.2021.9559811.
[13] N. R. Radliya, M. R. Fachrizal, and A. R. Rabbi, “Monitoring Application for Clean Water Access and Clustering using K-Means Algorithm,” IOP Conf. Ser. Mater. Sci. Eng., vol. 662, no. 2, 2019, doi: 10.1088/1757-899X/662/2/022096.
[14] I. N. T. Issue, “ENHANCING COLLABORATION WITH GOVERNMENT AND LOCAL PARTNERS STRENGTHENING WASH SERVICE RESILIENCE TO CLIMATE CHANGE,” vol. 13, no. December 2023, pp. 1–4, 2025.
[15] Ditjen Cipta Karya, “Pamsimas 2022 Pedoman Umum Program Pamsimas,” 2022.
[16] Gudono, “Analisis Data,” 2011.
[17] D. Rajeswari and K. Thangavel, “The Performance of Data Normalization Techniques on Heart Disease Datasets,” Int. J. Adv. Res. Eng. Technol., vol. 11, no. 12, pp. 2350–2357, 2020, doi: 10.34218/IJARET.11.12.2020.222.
[18] A. G. Gad, Particle Swarm Optimization Algorithm and Its Applications: A Systematic Review, vol. 29, no. 5. Springer Netherlands, 2022. doi: 10.1007/s11831-021-09694-4.
Published
2025-07-22
How to Cite
nikus, D., Muljono, M., & Himawan, H. (2025). Peningkatan Kinerja K-Means dengan Normalisasi Min-Max dan PSO untuk Penentuan Pusat Awal Klaster Terbaik pada Data Pamsimas. Dinamik, 30(2), 402-413. https://doi.org/10.35315/dinamik.v30i2.10221
Section
Articles