DATA CLEANSING PADA DATA RUMAH SAKIT
Abstract
Data dari Sistem Informasi Rumah Sakit tidak memiliki indikasi sebagai data yang berkualitas. Hal ini disebut juga dengan data kotor. Data kotor dapat berupa duplikasi data, tidak konsistennya data, dan data kosong. Data kotor ini dikarenakan kesalahan dalam entri data, skema sistem yang tidak berkesinambungan, data yang tumpang tindih dan lain – lain. Sehingga dibutuhkan tahapan Data Cleansing. Data Cleansing digunakan untuk mengubah data kotor menjadi data yang berkualitas yang nantinya data yang berkualitas akan diterapkan dengan tahapan data mining. Untuk itu, dibutuhkan metode yang tepat untuk melakukan proses Data Cleansing. Penelitian ini menerapkan metode metode Duplicate Elimination, Incosistency Detection, dan Handling Missing Entries pada data rumah sakit dan menghasilkan data rumah sakit yang sudah tidak mengalami duplikasi data, tidak konsistennya data dan tidak ada lagi data kosong.
References
[2] E. Rahm and H. H. DO, “Data Cleaning: Problems and Current Approaches,” IEEE Trans. Cloud Comput., vol. 2, no. 1, pp. 1–1, 2014.
[3] A. Riezka, I. Atastina, and K. Maulana, “Latar belakang Pendahuluan Data-Cleaning adalah suatu proses mendeteksi dan memperbaiki ( atau Rumusan masalah Berdasarkan latar belakang diatas ,
permasalahan yang menjadi fokus pada,” 2011.
[4] H. Müller and J. Freytag, “Problems , Methods , and Challenges in Comprehensive Data Cleansing,” pp. 1–23, 2003.
[5] C. C. Aggarwal, Data Mining. New York: Springer, 2015.
[6] G. A. Liebchen, “Data Cleaning Techniques for Software Engineering Data Sets,” PhD Thesis, no. October, 2010.
[7] A. Monge, “An adaptive and efficient algorithm for detecting approximately duplicate database records,” On-line Doc. URL http//citeseer. nj. nec. com/ …, no. August, pp. 0–17, 2000.
[8] C. Ambedkar and V. K. Babu, “Detection of Probe Attacks Using Machine Learning Techniques,” vol. 2, no. 3, pp. 25–29, 2015.
[9] RapidMiner, “About RapidMiner,” 2019. [Online]. Available: https://rapidminer.com/us/.
[10] I. W. S. Wicaksana, Belajar Data Mining dengan Rapid Miner. Jakarta, 2013.
[11] J. J. Tamilselvi and C. B. Gifta, “Handling Duplicate Data in Data Warehouse for Data Mining,” vol. 15, no. 4, pp. 7–15, 2011.