KLASTERING BERITA ONLINE TENTANG BENCANA DENGAN ALGORITMA SINGLE PASS CLUSTERING : Prosiding Seminar Nasional MIPA UNNES Tahun 2012
Abstract
Terlalu banyak untuk menyebut jenis bencana alam yang datang silih berganti menghampiri Indonesia. Volume berita elektronik berbahasa Indonesia tentang bencana alam yang semakin besar merupakan sumber informasi yang berharga. Clustering dokumen teks adalah salah satu operasi pada text mining untuk mengelompokkan dokumen yang memiliki kesamaan isi. Pengelompokan dokumen berita dibutuhkan untuk mempermudah pencarian informasi mengenai suatu bencana tertentu.
Penelitian ini menitik beratkan pada berita on-line, sehingga system harus dapat mengindikasikan apakah dokumen saat ini memuat atau tidak memuat topic bencana sebelum melihat pada dokumen berikutnya. Pendekatan yang dilakukan untuk menyelesaikan masalah menggunakan keterkaitan antar berita ini diukur berdasarkan kemiripan antar dokumen (similarity).
Algoritma ini diuji coba dengan menggunakan sampel berita dari media online. Hasil uji coba menunjukkan bahwa algoritma ini dapat diaplikasikan untuk pengelompokan berita-berita berbahasa Indonesia.
Kata Kunci : Information Retrieval, Stemming, Single Pass Clustering, Cosine Similarity.
Disampaikan di Seminar Nasional MIPA UNNES Tahun 2012