Perbandingan Kinerja Model IndoBERT Base Uncased dan IndoBERTweet untuk Analisis Emosi Komentar YouTube terkait RUU Perampasan Aset

Authors

  • Bima Kaka Bani Adam UPN Veteran Jawa Timur

Abstract

Perkembangan media sosial, khususnya YouTube, telah menjadikan komentar pengguna sebagai sumber data yang kaya untuk menganalisis opini dan emosi publik terhadap isu-isu sosial dan kebijakan pemerintah. Salah satu isu yang menarik perhatian adalah Rancangan Undang-Undang (RUU) Perampasan Aset yang memunculkan berbagai respons emosional dari masyarakat. Penelitian ini bertujuan untuk membandingkan kinerja dua model berbasis transformer, yaitu IndoBERT Base Uncased dan IndoBERTweet, dalam melakukan klasifikasi emosi pada komentar YouTube terkait isu tersebut. Data diperoleh melalui scraping menggunakan YouTube Data API v3 dari beberapa kanal berita, kemudian dilakukan tahap preprocessing yang meliputi cleaning, normalisasi teks, dan case folding. Pelabelan emosi dilakukan secara otomatis menggunakan beberapa pretrained model dari Hugging Face dengan kategori emosi yaitu senang, sedih, marah, takut, dan cinta. Dataset kemudian dibagi menjadi data latih dan data uji dengan rasio 80:20. Hasil eksperimen menunjukkan bahwa IndoBERTweet memberikan performa yang lebih baik dibandingkan IndoBERT Base Uncased. IndoBERTweet memperoleh accuracy sebesar 0,80 dengan F1-score macro 0,65, sedangkan IndoBERT Base Uncased memperoleh accuracy sebesar 0,78 dengan F1-score macro 0,61. Hasil ini menunjukkan bahwa IndoBERTweet lebih adaptif dalam menangani teks informal seperti komentar media sosial.

Downloads

Download data is not yet available.

Downloads

Published

2026-05-13