Analisis Sentimen Ulasan Bintang Lima Aplikasi Instagram di Google Play Store menggunakan IndoBERT
Abstract
Instagram merupakan salah satu media sosial paling populer di Indonesia dengan jumlah unduhan dan ulasan yang sangat tinggi di Google Play Store. Penelitian ini dilakukan untuk menganalisis sentimen dari ulasan bintang lima terhadap aplikasi Instagram guna mengkaji lebih lanjut apakah seluruh ulasan dengan rating tertinggi benar-benar mencerminkan sentimen positif. Data dikumpulkan melalui tahap scraping, kemudian dilakukan pembersihan data dengan teknik normalisasi sederhana seperti penghapusan URL, karakter khusus, angka, dan spasi berlebih, serta tahap preprocessing menggunakan metode tokenisasi. Model IndoBERT digunakan sebagai alat klasifikasi untuk mendeteksi sentimen dari setiap ulasan ke dalam tiga kategori: positif, netral, dan negatif. Hasil klasifikasi menunjukkan bahwa 59,7% ulasan tergolong positif, 11,2% netral, dan 29,1% negatif. Model evaluasi dilakukan melalui perbandingan hasil prediksi dengan pelabelan manual dan otomatis yang menghasilkan f1-score sebesar 0,901 untuk sentimen positif, 0,834 untuk negatif, dan 0,449 untuk netral, dengan akurasi keseluruhan sebesar 83,2%. Visualisasi word cloud ditampilkan setelah proses klasifikasi sentimen untuk menggambarkan kata-kata yang dominan di masing-masing kategori. Temuan ini menunjukkan bahwa rating numerik tidak selalu selaras dengan isi ulasan, serta pentingnya analisis sentimen dalam memahami persepsi pengguna secara lebih mendalam.
References
[2] Instagram. Instagram. Google Play 2025. https://play.google.com/store/apps/details?id=com.instagram.android (accessed May 1, 2025).
[3] Praneswara AO, Cahyono N. Analisis Sentimen Ulasan Aplikasi TikTok Shop Seller Center Di Google Playstore Menggunakan Algoritma Naive Bayes. Indonesian Journal of Computer Science 2023;12:3925–40. https://doi.org/10.33022/ijcs.v12i6.3473.
[4] Wahyudi R, Kusumawardana G. Analisis Sentimen Pada Aplikasi Grab Di Google Play Store Menggunakan Support Vector Machine. Jurnal Informatika 2021;8:200–7. https://doi.org/10.31294/ji.v8i2.9681.
[5] Husna L, Prasetyo Utomo PE. Analisis Dan Visualisasi Data Body Performance Menggunakan Tiga Tools Visualisasi. Jurnal Ilmiah Intech : Information Technology Journal of UMUS 2023;5:32–40. https://doi.org/10.46772/intech.v5i1.1167.
[6] Prabowo A, Sanjaya FI. Penerapan Metode Transfer Learning Pada Indobert Untuk Analisis Sentimen Teks Bahasa Jawa Ngoko Lugu. Jurnal Sistem Informasi Dan Sistem Komputer 2024;9:205–17. https://doi.org/10.51717/simkom.v9i2.478.
[7] Nurjoko, Rahardi A. Model Indo-BERT Untuk Identifikasi Sentimen Kekerasan Verbal Di Twitter. Jurnal Teknika 2024;18:583–93. https://doi.org/https://doi.org/10.5281/zenodo.12788184.
[8] Fahrudin TM, Sari ARF, Lisanthoni A, Lestari AAD. Analisis Speech-To-Text Pada Video Mengandung Kata Kasar Dan Ujaran Kebencian Dalam Ceramah Agama Islam Menggunakan Interpretasi Audiens Dan Visualisasi Word Cloud. SKANIKA : Sistem Komputer Dan Teknik Informatika 2022;5:190–202. https://doi.org/10.36080/skanika.v5i2.2942.
[9] Soen GIE, Marlina, Renny. Implementasi Cloud Computing Dengan Google Colaboratory Pada Aplikasi Pengolah Data Zoom Participants. JITU : Journal Informatic Technology And Communication 2022;6:24–30. https://doi.org/10.36596/jitu.v6i1.781.
[10] Satriajati S, Panuntun SB, Pramana S. Implementasi Web Scraping Dalam Pengumpulan Berita Kriminal Pada Masa Pandemi Covid-19. Seminar Nasional Official Statistics 2020: Statistics in the New Normal: A Challenge of Big Data and Official Statistics 2021;2020:300–8. https://doi.org/10.34123/semnasoffstat.v2020i1.578.
[11] Darwis D, Siskawati N, Abidin Z. Penerapan Algoritma Naive Bayes Untuk Analisis Sentimen Review Data Twitter BMKG Nasional. Jurnal Tekno Kompak 2021;15:131–45. https://doi.org/10.33365/jtk.v15i1.744.
[12] Surbakti AQ, Hayami R, Al-Amien J. Analisa Tanggapan Terhadap Psbb Di Indonesia Dengan Algoritma Decision Tree Pada Twitter. Jurnal CoSciTech (Computer Science and Information Technology) 2021;2:91–7. https://doi.org/10.37859/coscitech.v2i2.2851.
[13] Pranata J, Agustian S, Jasril, Haerani E. Penggunaan Model Bahasa IndoBERT Pada Metode Random Forest Untuk Klasifikasi Sentimen Dengan Dataset Terbatas. Building of Informatics, Technology and Science (BITS) 2024;6:1668–76. https://doi.org/10.47065/bits.v6i3.6335.
[14] Saputra AC, Saragih AS, Ronaldo D. Prediksi Emosi Dalam Teks Bahasa Indonesia Menggunakan Model IndoBERT. Jurnal Teknologi Informasi : Jurnal Keilmuan Dan Aplikasi Bidang Teknik Informatika 2025;19:1–15. https://doi.org/10.47111/JTI.
[15] Limbong JJA, Sembiring I, Hartomo KD. Analisis Klasifikasi Sentimen Ulasan Pada E-Commerce Shopee Berbasis Word Cloud Dengan Metode Naive Bayes Dan K-Nearest Neighbor. Jurnal Teknologi Informasi Dan Ilmu Komputer 2022;9:347–55. https://doi.org/10.25126/jtiik.2022924960.
[16] Ramadhan GR, Sugianto CA. Analisis Sentimen Ulasan Aplikasi Dana Di Google Play Store Menggunakan Algoritma Naive Bayes. JATI (Jurnal Mahasiswa Teknik Informatika) 2024;8:9849–57. https://doi.org/10.36040/jati.v8i5.10732.
[17] Face H. mdhugol / indonesia-bert-sentiment-classification. Hugging Face n.d. https://huggingface.co/mdhugol/indonesia-bert-sentiment-classification (accessed May 2, 2025).
Copyright (c) 2025 Jansnio Asher, Eka Putri Rachmawati

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.







