KOMPARASI KINERJA ALGORITMA SIMILARITAS INNER PRODUCT FAMILY PADA RULE BASE STEMMERSTUDI KASUS DOKUMEN TEKS BAHASA JAWA

  • Fatkhul Amin universitas stikubank
  • Sugiyamta Sugiyamta universitas stikubank
  • Arif Jananto universitas stikubank
Keywords: Komparasi similaritas, Harmonic Mean, Dice, Kumar hassebrook, Cosine

Abstract

Komparasi Algoritma Similaritas Inner Product Family dilakukan untuk mengetahui efektifitas algoritma dalam menemukan dokumen teks pada studi kasus dokumen teks bahasa jawa.  Dokumen bahasa jawa yang menjadi obyek sejumlah 48.753 kata yang didapatkan dari majalah bahasa jawa penjebar semangad, Joko lodang dan Jaya Baya. Hasil dari komparasi antara metode Harmonic Mean, Dice, Kumar hassebrook, dan Cosine; Dokumen Teks Bahasa Jawa dengan No Dokumen ARI163,  JL112014BD dan LEO31 pada metode  Harmonic Mean, Dice, Kumar-Hassebrook dan Cosine menghasilkan bobot dokumen yang sama yaitu 0.822 (ARI163), 0.411 (JL112014BD) dan 0.111 (LEO31). Dokumen Teks Bahasa Jawa dengan No Dokumen LEO63 pada metode  Harmonic Mean dan Dice menghasilkan bobot dokumen yang sama yaitu 0.263. pada metode Kumar-Hassebrook dan Cosine menghasilkan bobot dokumen yang sama yaitu 0.065.  Metode Harmonic mean dan Dice menghasilkan bobot lebih tinggi yaitu 0.263 dibandingkan dengan metode Kumar-Hassebrook dan Cosine yang menghasilkan bobot 0.065.  Dokumen Teks Bahasa Jawa dengan No Dokumen LEO14 pada metode  Harmonic Mean, Dice dan Kumar-Hassebrook menghasilkan bobot dokumen yang sama yaitu 0.111. pada metode Cosine menghasilkan bobot dokumen 0.104.  Metode Harmonic mean, Dice dan Kumar-Hassebrook menghasilkan bobot lebih tinggi yaitu 0.111 dibandingkan dengan metode Cosine yang menghasilkan bobot 0.104.  Dokumen terambil paling sedikit oleh Metode Cosine yaitu 5 dokumen, Kumar-hassebrook 19 dokumen, Dice 20 dokumen dan Harmonic Mean 29 dokumen

DB Error: Table './ojs/metrics' is marked as crashed and last (automatic?) repair failed