Perbandingan Kinerja Model IndoBERT Base Uncased dan IndoBERTweet untuk Analisis Emosi Komentar YouTube terkait RUU Perampasan Aset
Abstract
Perkembangan media sosial, khususnya YouTube, telah menjadikan komentar pengguna sebagai sumber data yang kaya untuk menganalisis opini dan emosi publik terhadap isu-isu sosial dan kebijakan pemerintah. Salah satu isu yang menarik perhatian adalah Rancangan Undang-Undang (RUU) Perampasan Aset yang memunculkan berbagai respons emosional dari masyarakat. Penelitian ini bertujuan untuk membandingkan kinerja dua model berbasis transformer, yaitu IndoBERT Base Uncased dan IndoBERTweet, dalam melakukan klasifikasi emosi pada komentar YouTube terkait isu tersebut. Data diperoleh melalui scraping menggunakan YouTube Data API v3 dari beberapa kanal berita, kemudian dilakukan tahap preprocessing yang meliputi cleaning, normalisasi teks, dan case folding. Pelabelan emosi dilakukan secara otomatis menggunakan beberapa pretrained model dari Hugging Face dengan kategori emosi yaitu senang, sedih, marah, takut, dan cinta. Dataset kemudian dibagi menjadi data latih dan data uji dengan rasio 80:20. Hasil eksperimen menunjukkan bahwa IndoBERTweet memberikan performa yang lebih baik dibandingkan IndoBERT Base Uncased. IndoBERTweet memperoleh accuracy sebesar 0,80 dengan F1-score macro 0,65, sedangkan IndoBERT Base Uncased memperoleh accuracy sebesar 0,78 dengan F1-score macro 0,61. Hasil ini menunjukkan bahwa IndoBERTweet lebih adaptif dalam menangani teks informal seperti komentar media sosial.
Downloads
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Bima Kaka Bani Adam

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.