REKAYASA SISTEM TEMU KEMBALI INFORMASI DOKUMEN TEKS BERBAHASA JAWA METODE COSINE SIMILARITY DAN RULE BASE STEMMING BAHASA JAWA

  • Fatkhul Amin
  • Eddy Nurraharjo

Abstract

Saat ini penggunaan Bahasa Jawa di Indonesia yang mulai ditinggalkan. Perlunya pelestarian bahasa
jawa dalam bentuk online yang bisa diakses bagi penggunanya sehingga akan mempermudah dalam pencarian
dokumen teks khususnya dokumen bahasa jawa. Sistem Temu Kembali Informasi (STKI) yang ada saat ini
memberikan hasil pencarian dokumen dengan hasil perolehan dokumen dalam jumlah banyak (recall tinggi) dan
akurasi yang rendah (precisionrendah). Tujuan pembuatan STKI menggunakan metode Cosine Similarity dan
Rule Base Stemming Bahasa Jawa agar user mudah dalam melakukan pencarian dokumen teks berbahasa Jawa.
Software STKI dirancang untuk memberikan hasil pencarian dokumen yang memiliki tingkat presisi tinggi,
sehingga user akan mendapatkan hasil pencarian cepat dan akurat. Evaluasi hasil pencarian STKI dilakukan
dengan uji recall dan precision. Studi kasus yang telah dilakukan menggunakan STKI ini didapatkan hasil
sistem mampu melakukan proses preprosesing (tokenisasi, filtering, dan stemming) dan perhitungan Cosine
Similarity dengah hasil mampu melakukan pencarian dokumen teks dan menampilkan hasil pencarian dokumen
teks berbahasa Jawa dengan disertai bobot tiap dokumen beserta letak dokumen. Uji recall dan
precisionmenggunakan analisa persepsi dan STKI menunjukkan hasil pencarian dokumen teks memiliki ratarata
recall = 0,02 dan rata-rata precision = 0,94. STKI yang dibangun memiliki keunggulan mampu melakukan
pencarian dokumen teks bahasa jawa dan hasil pencarian yang akurat (precision = 0,94), serta dilengkapi
dengan bobot dan letak dokumen pada database

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed