DATA CLEANSING PADA DATA RUMAH SAKIT

  • Ainayya Ghassani Lazuardy
  • Hari Setiaji

Abstract

Data dari Sistem Informasi Rumah Sakit tidak memiliki indikasi sebagai data yang berkualitas. Hal ini disebut juga dengan data kotor. Data kotor dapat berupa duplikasi data, tidak konsistennya data, dan data kosong. Data kotor ini dikarenakan kesalahan dalam entri data, skema sistem yang tidak berkesinambungan, data yang tumpang tindih dan lain – lain. Sehingga dibutuhkan tahapan Data Cleansing. Data Cleansing digunakan untuk mengubah data kotor menjadi data yang berkualitas yang nantinya data yang berkualitas akan diterapkan dengan tahapan data mining. Untuk itu, dibutuhkan metode yang tepat untuk melakukan proses Data Cleansing. Penelitian ini menerapkan metode metode Duplicate Elimination, Incosistency Detection, dan Handling Missing Entries pada data rumah sakit dan menghasilkan data rumah sakit yang sudah tidak mengalami duplikasi data, tidak konsistennya data dan tidak ada lagi data kosong.

References

[1] A. Bustomi, “ARSITEKTUR INFORMASI SISTEM INFORMASI MANAJEMEN RUMAH SAKIT ( SIMRS ),” 2016.
[2] E. Rahm and H. H. DO, “Data Cleaning: Problems and Current Approaches,” IEEE Trans. Cloud Comput., vol. 2, no. 1, pp. 1–1, 2014.
[3] A. Riezka, I. Atastina, and K. Maulana, “Latar belakang Pendahuluan Data-Cleaning adalah suatu proses mendeteksi dan memperbaiki ( atau Rumusan masalah Berdasarkan latar belakang diatas ,
permasalahan yang menjadi fokus pada,” 2011.
[4] H. Müller and J. Freytag, “Problems , Methods , and Challenges in Comprehensive Data Cleansing,” pp. 1–23, 2003.
[5] C. C. Aggarwal, Data Mining. New York: Springer, 2015.
[6] G. A. Liebchen, “Data Cleaning Techniques for Software Engineering Data Sets,” PhD Thesis, no. October, 2010.
[7] A. Monge, “An adaptive and efficient algorithm for detecting approximately duplicate database records,” On-line Doc. URL http//citeseer. nj. nec. com/ …, no. August, pp. 0–17, 2000.
[8] C. Ambedkar and V. K. Babu, “Detection of Probe Attacks Using Machine Learning Techniques,” vol. 2, no. 3, pp. 25–29, 2015.
[9] RapidMiner, “About RapidMiner,” 2019. [Online]. Available: https://rapidminer.com/us/.
[10] I. W. S. Wicaksana, Belajar Data Mining dengan Rapid Miner. Jakarta, 2013.
[11] J. J. Tamilselvi and C. B. Gifta, “Handling Duplicate Data in Data Warehouse for Data Mining,” vol. 15, no. 4, pp. 7–15, 2011.
Published
2019-12-04
How to Cite
Lazuardy, A., & Setiaji, H. (2019). DATA CLEANSING PADA DATA RUMAH SAKIT. SINTAK, 3. Retrieved from https://unisbank.ac.id/ojs/index.php/sintak/article/view/7594
Section
Vol 3 (2019)