IMPLEMENTASI SELEKSI FITUR INFORMATION GAIN RATIO PADA ALGORITMA RANDOM FOREST UNTUK MODEL DATA KLASIFIKASI PEMBAYARAN KULIAH

  • Taghfirul Azhima Yoga Siswa Universitas Muhammadiyah Kalimantan Timur
  • Wawan Joko Pranoto

Abstract

Perguruan tinggi swasta merupakan salah satu lembaga pendidikan dengan pembiayaan operasional utamanya dibebankan kepada mahasiswa melalui Sumbangan Pembangunan Pendidikan (SPP). Oleh karena itu, keterlambatan dari pembayaran SPP tentunya sangat berpengaruh signifikan bagi keberlangsungan aktivitas perguruan tinggi. Salah satu pendekatan data analisis yang bisa dilakukan adalah data mining dengan pemanfaatan algoritma random forest. Random forest merupakan metode yang biasa digunakan untuk menyelesaikan masalah yang berhubungan dengan klasifikasi dan regresi. Penelitian ini bertujuan mengimplementasikan dan mengevaluasi hasil kinerja algoritma random forest melalui pendekatan seleksi fitur information gain ratio dengan pembagian data training sebesar 90% dan data testing sebesar 10% dan dievaluasi menggunakan confusion matrix menggunakan rapidminer. Data yang digunakan dalam penelitian ini berupa data pembayaran SPP mahasiswa pada tahun 2019-2021 yang berasal dari Biro Administrasi Akademik dan Administrasi Keuangan yang berjumlah 12.408 record data. Hasil evaluasi kinerja seleksi fitur information gain ratio pada algoritma random forest menghasilkan nilai akurasi sebesar 78,47%. Atribut yang memiliki pengaruh dalam klasifikasi keterlambatan pembayaran SPP antara lain : fakultas, prodi, angkatan, gender penghasilan ayah, dan penghasilan ibu.

References

[1] Santosa, B., & Umam, A., 2018, Data Mining Dan Big Data Analytics. Penebar Media Pustaka.
[2] Apandi, T. H., Maulana, R. B., Piarna, R., & Vernanda, D. (2019). Menganalisis Kemungkinan Keterlambatan Pembayaran Spp Dengan Algoritma C4.5 (Studi Kasus Politeknik Tedc Bandung). Jurnal Techno Nusa Mandiri, 16(2), 93–98.
[3] Abdullah, R. W., 2019, Sistem Prediksi Keterlambatan Pembayaran SPP Dengan Metode K-Nearest Neighbor (Studi Kasus: SMK AL-Islam Surakarta). Universitas Amikom Yogyakarta.
[4] Istiana, S. R., 2018, Aplikasi Prediksi Pembayaran Bulanan Santri Dengan Menggunakan Algoritma C4.5 (Studi Kasus Pondok Pesantren Assalafi Al Fithrah Meteseh Semarang). Universitas Diponegoro.
[5] Muqorobin, M., Kusrini, K., & Luthfi, E. T., 2019, Optimasi Metode Naive Bayes Dengan Feature Selection Information Gain Untuk Prediksi Keterlambatan Pembayaran Spp Sekolah. Jurnal Ilmiah SINUS, 17(1), 1.
[6] Rianto, M., & Yunis, R., 2021, Analisis Runtun Waktu Untuk Memprediksi Jumlah Mahasiswa Baru Dengan Model Random Forest. Paradigma - Jurnal Komputer dan Informatika, 23(1), 70–74.
[7] Suwardika, G., & Suniantara, I. ketut P. S., 2019, Analisis Random Forest Pada Klasifikasi CART Ketidaktepatan Waktu Kelulusan Mahasiswa Universitas Terbuka. Jurnal Ilmu Matematika dan Terapan, 13(3), 179–186.
[8] Triwidianti, J., Alfian, F. Y. A., & Prasojo, M., 2021, Perbandingan Metode Data Mining Untuk Prediksi Prestasi Siswa Tingkat Pendidikan Menengah Kejuruan Pada Sekolah Menengah Kejuruan Negeri (Smkn 1) Gadingrejo Pringsewu Lampung. Seminar Nasional Hasil Penelitian dan Pengabdian Masyarakat, 126–133.
[9] Linawati, S., Nurdiani, S., Handayani, K., & Latifah., 2020, Prediksi Prestasi Akademik Mahasiswa Menggunakan Random Forest Dan C4.5. JURNAL KHATULISTIWA INFORMATIKA, 8(1), 47–52.
[10] Rosady, F., 2021, Penerapan Seleksi Fitur Information Gain Raiot dan Algoritma Random Forest Untuk Prediksi Kelulusan Mahasiswa Teknik Informatika UIN Suska Riau. Universitas Islam Negeri Sultan Syarif Kasim Riau.
[11] Ghasemi, F., Neysiani, B. S., & Nematbakhsh, N., 2020, Feature selection in pre-diagnosis heart coronary artery disease detection: a heuristic approach for feature selection based on information gain ratio and Gini index. In 2020 6th International Conference on Web Research (ICWR) (pp. 27-32). IEEE.
[12] Lestari, A., 2020, Increasing accuracy of C4. 5 algorithm using information gain ratio and adaboost for classification of chronic kidney disease. Journal of Soft Computing Exploration, 1(1), 32-38.
[13] Fadlan., 2020. Notifikasi Keterlambatan Pembayaran Sumbangan Pembinaan Pendidikan (SPP) Berbasis Android Di SMK N 1 Baso. Institut Agama Islam (IAIN) Bukittinggi.
[14] Hermawati, F.A., 2013, Data Mining. Yogyakarta: Penerbit Andi.
[15] Mardi, Y., 2017, Data Mining: Klasifikasi Menggunakan Algoritma C4. 5. Edik Informatika, 2(2), 213-219.
[16] Wibawa, A. P., 2018, Metode-metode Klasifikasi. In Prosiding SAKTI (Seminar Ilmu Komputer dan Teknologi Informasi) (Vol. 3, No. 1, pp. 134-138).
[17] Primartha, R., 2021. Algoritma Machine Learning. Bandung: Informatika Bandung.
[18] Putra, M.I. 2019. Sistem Rekomendasi Kelayakan Kredit Menggunakan Metode Random Forest pada BRI Kantor Cabang Pelaihari. Universitas Islam Negeri Sunan Ampel.
[19] Liparas, D., Ha, Cohen-Kerner, Y., Moumtzidou, A., Vrochidis, S., & Kompatsiaris, I., 2014, News articles classification using random forests and weighted multimodal features. In Information Retrieval Facility Conference (pp. 63-75). Springer, Cham
[20] Pulungan, A. F., 2019, Analisis Kinerja Bray Curtis Distance, Canberra Distance dan Euclidean Distance pada Algoritma K-Nearest Neighbour. Tersedia di: https://repositori.usu.ac.id/handle/123456789/15051 [Diakses 28 Januari 2022].
Published
2023-07-08
How to Cite
Yoga Siswa, T., & Pranoto, W. (2023). IMPLEMENTASI SELEKSI FITUR INFORMATION GAIN RATIO PADA ALGORITMA RANDOM FOREST UNTUK MODEL DATA KLASIFIKASI PEMBAYARAN KULIAH. Dinamika Informatika : Jurnal Ilmiah Teknologi Informasi, 15(1), 41-49. https://doi.org/10.35315/informatika.v15i1.9465
Section
Articles