Pencarian Dokumen Teks Lintas Bahasa Indonesia – Inggris Berbasis Corpus

  • Jati Sasongko

Abstract

Pencarian informasi lintas bahasa pada saat sekarang ini sangat diperlukan dengan banyaknya dokumen yang tersedia dari berbagai macam bahasa. Pencarian informasi lintas bahasa berbasis corpus ini dalam pengembangannya memerlukan beberapa tahapan yang dimulai dari pengumpulan data dokumen penghapusan tanda baca, tokenisasi kata, penghapusan kata berdasarkan stopword sampai dengan memasukkan data ke dalam corpus. Pencarian informasi lintas bahasa dapat bekerja dengan baik tergantung dari banyaknya data yang tersedia di dalam corpus, sehingga semakin banyak data di dalam corpus maka semakin baik hasil pencariaannya.
How to Cite
Sasongko, J. (1). Pencarian Dokumen Teks Lintas Bahasa Indonesia – Inggris Berbasis Corpus. Dinamik, 15(2). https://doi.org/10.35315/dinamik.v15i2.118
Section
Articles