PENINGKATAN HASIL SISTEM TEMU KEMBALI INFORMASI BERBASIS PADA KATA MAJEMUK MENGGUNAKAN JACCARD SIMILARITY
Abstract
Kata majemuk gabungan morfem dasar yang kesemuanya berstatus kata dengan pola fonetik, gramatikal, dan semantik tertentu sesuai dengan kaidah bahasa yang bersangkutan. Pola khusus ini membedakannya dari frasa atau kombinasi kata—kombinasi morfem yang bukan kata majemuk. Pembatasan ini berlaku untuk sejumlah dimensi, dan persamaan kosinus paling sering digunakan dalam ruang positif berdimensi tinggi. Misalnya, dalam pencarian informasi dan penambangan teks, setiap istilah secara tidak langsung diberi dimensi yang berbeda, dan dokumen diberi label sebagai vektor, di mana nilai di setiap dimensi sesuai dengan berapa kali istilah tersebut muncul dalam dokumen. Kesamaan cosine kemudian memberikan ukuran yang berguna tentang seberapa mirip dua dokumen dalam hal topik. Pada penelitian ini penggunaan kata majemuk sebagai kata kunci dalam pencarian dokumen menghasilkan dokumen yang lebih tepat. Data yang digunakan sebanyak 15 file. Data yang mengandung kata majemuk sebanyak 10 file. Data 5 dokumen tanpa kata majemuk. Hasil pencarian dengan menggunakan algoritma kesamaan menghasilkan nilai kesamaan yang tinggi, namun 33,3% kata majemuk tidak ada. Dan hasil pencarian dengan nilai kemiripan lebih rendah tetapi mengandung kata majemuk sebesar 66,3%. Sehingga dengan adanya penambahan data berupa kata majemuk di dalam pencarian membuat hasilnya lebih baik.
References
[2] Faradilla, N. A. N. ., Wulandari, R. A. ., Putantri, W. ., & Ulya , C. . (2021). Analisis Kesalahan Berbahasa Bidang Morfologi Pada Portal Berita Online Esensinews.Com. Jurnal Review Pendidikan Dan Pengajaran (JRPP), 4(2), 344–352. https://doi.org/10.31004/jrpp.v4i2.3243
[3] Yumni, N. Z., Chaerunnissa, Hadana, I. N. ., Arimbi, S. D. ., & Utomo, A. P. Y. . (2022). Analisis Kalimat Majemuk dalam Novelet Wayang Tembang Cinta Para Dewi pada Bab “Dendam Abadi Seorang Dewi” Karya Naning Pranoto. JURNAL RISET RUMPUN ILMU BAHASA, 1(1), 71–87. https://doi.org/10.55606/jurribah.v1i1.124
[4] Aisyiah Syiam Octavianti, Fika Uswatun, Sefiyan Eza Nur Hidayat, & Asep Purwo Yudi Utomo. (2022). Analisis Penggunaan Frasa Verba pada Surat Kabar Suara Merdeka yang Berjudul ”Kurikulum Ruh Pembelajaran Tingkat Paling Dasar hingga Bangku Kuliah”: Analysis of the Use of Verb Phrases in Suara Merdeka Newspaper entitled "The Curriculum of the Most Basic Level of Learning Spirit to Lecturers". Jurnal Pendidikan Dan Sastra Inggris, 2(1), 77–85. https://doi.org/10.55606/jupensi.v2i1.190
[5] Lahitani, A. R. (2022). Automated Essay Scoring menggunakan Cosine Similarity pada Penilaian Esai Multi Soal. Jurnal Kajian Ilmiah, 22(2), 107–118. https://doi.org/10.31599/jki.v22i2.1121
[6] Arif Zulvian, S., Prihandan, K., & Ridha, A. A. (2021). Perbandingan Metode MSD dan Cosine Similarity pada Sistem Rekomendasi Item-Based Collaborative Filtering. INTECOMS: Journal of Information Technology and Computer Science, 4(2), 340 - 347. https://doi.org/https://doi.org/10.31539/intecoms.v4i2.2781
[7] N. W. Utami and I. G. J. . Eka Putra, “Text Minig Clustering Untuk Pengelompokan Topik Dokumen Penelitian Menggunakan Algoritma K-Means Dengan Cosine Similarity”, JINTEKS, vol. 4, no. 3, pp. 255-259, Aug. 2022.
[8] Suarnata, I Gede; Sukarsa, I Made; Wibawa, Kadek Suar. Pencocokan Menu Berbasis Keywords pada Chatbot dengan Metode Jaccard. JITTER : Jurnal Ilmiah Teknologi dan Komputer, [S.l.], v. 3, n. 1, p. 786-793, jan. 2022. ISSN 2747-1233. Available at:
[9] Putra, I. M. S., Putu Jhonarendra, & Ni Kadek Dwi Rusjayanthi. (2021). Deteksi Kesamaan Teks Jawaban pada Sistem Test Essay Online dengan Pendekatan Neural Network . Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(6), 1070 - 1082. https://doi.org/10.29207/resti.v5i6.3544
Copyright (c) 2022 Dwi Agus Diartono, Isworo Nugroho, Jeffri Alfa Razaq
This work is licensed under a Creative Commons Attribution 4.0 International License.