DINDA, Renata Jovita Aurelia (2026) Analisis Komparatif Performa Model Transformer Indobert-Base-P1 Dan Deberta-V3 Base Untuk Klasifikasi Sentimen Komentar Media Sosial Instagram Reels. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.
|
Text
1. COVER.pdf Download (60kB) |
|
|
Text
3. LEMBAR PENGESAHAN 1.pdf Download (414kB) |
|
|
Text
4. LEMBAR PENGESAHAN 2.pdf Download (289kB) |
|
|
Text
5. KATA PENGANTAR.pdf Download (430kB) |
|
|
Text
6. ABSTRAK.pdf Download (7kB) |
|
|
Text
7. ABSTRACT.pdf Download (86kB) |
|
|
Text
8. DAFTAR ISI.pdf Download (27kB) |
|
|
Text
12. BAB 1 PENDAHULUAN.pdf Download (186kB) |
|
|
Text
17. DAFTAR PUSTAKA.pdf Download (239kB) |
Abstract
Analisis sentimen pada komentar media sosial menjadi semakin penting seiring meningkatnya aktivitas digital masyarakat Indonesia. Namun, karakteristik teks media sosial yang cenderung pendek, tidak baku, dan kaya slang menghadirkan
tantangan signifikan dalam proses klasifikasi otomatis. Penelitian ini membandingkan performa dua model Transformer modern, yaitu IndoBERT-basep1 dan DeBERTa-v3-base, dalam mengklasifikasikan sentimen komentar Instagram Reels berbahasa Indonesia. Data yang digunakan terdiri dari 60.000
sampel berlabel untuk pelatihan, 4.461 data untuk validasi, serta 4.461 komentar hasil scraping sebagai test set. Seluruh data melalui tahapan preprocessing berupa lowercasing, normalisasi slang, konversi emoji, penghapusan elemen nonalfanumerik, dan tokenisasi menggunakan tokenizer masing-masing model.
Penelitian ini mengikuti alur kerja yang meliputi pengumpulan data, pembersihan teks, encoding label, tokenisasi, fine-tuning model selama tiga epoch, dan evaluasi menggunakan metrik Accuracy serta F1-Macro yang relevan untuk klasifikasi multikelas dengan potensi ketidakseimbangan distribusi data. Hasil penelitian menunjukkan bahwa IndoBERT-base-p1 memberikan performa terbaik dengan nilai Accuracy sebesar 0,9213 dan F1-Macro sebesar 0,8892 pada test set. Sementara itu, DeBERTa-v3-base memperoleh Accuracy sebesar 0,7848 dan F1Macro 0,6717, yang mengindikasikan bahwa arsitektur disentangled attention belum mampu mengungguli model pra-latih khusus Bahasa Indonesia ketika diterapkan pada teks informal media sosial. Temuan ini menegaskan bahwa model
monolingual lebih adaptif terhadap karakteristik linguistik dan variasi bahasa pengguna Indonesia. Penelitian ini memberikan kontribusi praktis bagi pengembangan sistem analisis sentimen otomatis yang lebih akurat untuk kebutuhan industri digital, pemantauan opini publik, serta optimalisasi strategi komunikasi pada platform media sosial.
Kata Kunci: analisis sentimen, DeBERTa-v3-base, IndoBERT-base-p1, komentar Instagram, model Transformer
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Subjects: | Sciences and Mathemathic |
| Divisions: | Faculty of Science and Mathematics > Department of Statistics |
| Depositing User: | Yemima Laras Sekarsari |
| Date Deposited: | 19 Jan 2026 10:37 |
| Last Modified: | 19 Jan 2026 10:37 |
| URI: | https://eprints2.undip.ac.id/id/eprint/43606 |
Actions (login required)
![]() |
View Item |
