Implementasi Stemmer Tala pada Aplikasi Berbasis Web
Abstract
Stemming adalah proses untuk mencari kata dasar pada suatu kata. Pada analisa temu kembali informasi imbuhan merupakan bagian dari informasi yang tidak bermakna, seperti halnya stop word. Sehingga imbuhan harus dihilangkan untuk mempercepat proses pengindekan dan proses query. Proses stemming dapat dilakukan dengan 2 cara yaitu dengan menggunakan kamus dan menggunakan aturan-aturan imbuhan. Untuk mendapatkan tingkat kebenaran hasil yang tinggi biasaya digunakan kamus seperti yang diperkenalkan oleh Nazief dan Adriani, stemmer bahasa melayu oleh Ahmad, Yuso, dan Sembok. tetapi teknik ini membutuhkan waktu komputasi yang tinggi karena ada proses pengambilan data pada database. Sedang untuk aplikasi yang lebih sederhana dan tidak membutuhkan akurasi yang tinggi teknik aturan imbuhan sangat mudah untuk diimplementasikan dan tidak membutuhkan waktu komputasi yang tinggi.
Stemmer tala merupakan adopsi dari algoritma stemmer bahasa inggris terkenal porter stemmer. Stemmer ini menggunakan rule base analisis untuk mencari root sebuah kata. Stemmer ini sama sekali tidak menggunakan kamus sebagai acuan, seperti halnya stemmer ahmad,vega dan jelita. Proses stemming bahasa Indonesia menggunakan algoritma berbasis aturan mempunyai tingkat kesalahan tinggi, sehingga dapat mempengaruhi akurasi hasil akhir. Walaupun demikian performa stemming berbasis aturan relatif stabil dengan jumlah dokumen yang berkembang.
Kata Kunci : Stemming, Stemmer Bahasa Indonesia, Tala