Search for collections on Undip Repository

Analisis Komparatif Performa Model Transformer Indobert-Base-P1 Dan Deberta-V3 Base Untuk Klasifikasi Sentimen Komentar Media Sosial Instagram Reels

DINDA, Renata Jovita Aurelia (2026) Analisis Komparatif Performa Model Transformer Indobert-Base-P1 Dan Deberta-V3 Base Untuk Klasifikasi Sentimen Komentar Media Sosial Instagram Reels. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

[thumbnail of 1. COVER.pdf] Text
1. COVER.pdf

Download (60kB)
[thumbnail of 3. LEMBAR PENGESAHAN 1.pdf] Text
3. LEMBAR PENGESAHAN 1.pdf

Download (414kB)
[thumbnail of 4. LEMBAR PENGESAHAN 2.pdf] Text
4. LEMBAR PENGESAHAN 2.pdf

Download (289kB)
[thumbnail of 5. KATA PENGANTAR.pdf] Text
5. KATA PENGANTAR.pdf

Download (430kB)
[thumbnail of 6. ABSTRAK.pdf] Text
6. ABSTRAK.pdf

Download (7kB)
[thumbnail of 7. ABSTRACT.pdf] Text
7. ABSTRACT.pdf

Download (86kB)
[thumbnail of 8. DAFTAR ISI.pdf] Text
8. DAFTAR ISI.pdf

Download (27kB)
[thumbnail of 12. BAB 1 PENDAHULUAN.pdf] Text
12. BAB 1 PENDAHULUAN.pdf

Download (186kB)
[thumbnail of 17. DAFTAR PUSTAKA.pdf] Text
17. DAFTAR PUSTAKA.pdf

Download (239kB)

Abstract

Analisis sentimen pada komentar media sosial menjadi semakin penting seiring meningkatnya aktivitas digital masyarakat Indonesia. Namun, karakteristik teks media sosial yang cenderung pendek, tidak baku, dan kaya slang menghadirkan
tantangan signifikan dalam proses klasifikasi otomatis. Penelitian ini membandingkan performa dua model Transformer modern, yaitu IndoBERT-basep1 dan DeBERTa-v3-base, dalam mengklasifikasikan sentimen komentar Instagram Reels berbahasa Indonesia. Data yang digunakan terdiri dari 60.000
sampel berlabel untuk pelatihan, 4.461 data untuk validasi, serta 4.461 komentar hasil scraping sebagai test set. Seluruh data melalui tahapan preprocessing berupa lowercasing, normalisasi slang, konversi emoji, penghapusan elemen nonalfanumerik, dan tokenisasi menggunakan tokenizer masing-masing model.
Penelitian ini mengikuti alur kerja yang meliputi pengumpulan data, pembersihan teks, encoding label, tokenisasi, fine-tuning model selama tiga epoch, dan evaluasi menggunakan metrik Accuracy serta F1-Macro yang relevan untuk klasifikasi multikelas dengan potensi ketidakseimbangan distribusi data. Hasil penelitian menunjukkan bahwa IndoBERT-base-p1 memberikan performa terbaik dengan nilai Accuracy sebesar 0,9213 dan F1-Macro sebesar 0,8892 pada test set. Sementara itu, DeBERTa-v3-base memperoleh Accuracy sebesar 0,7848 dan F1Macro 0,6717, yang mengindikasikan bahwa arsitektur disentangled attention belum mampu mengungguli model pra-latih khusus Bahasa Indonesia ketika diterapkan pada teks informal media sosial. Temuan ini menegaskan bahwa model
monolingual lebih adaptif terhadap karakteristik linguistik dan variasi bahasa pengguna Indonesia. Penelitian ini memberikan kontribusi praktis bagi pengembangan sistem analisis sentimen otomatis yang lebih akurat untuk kebutuhan industri digital, pemantauan opini publik, serta optimalisasi strategi komunikasi pada platform media sosial.
Kata Kunci: analisis sentimen, DeBERTa-v3-base, IndoBERT-base-p1, komentar Instagram, model Transformer

Item Type: Thesis (Undergraduate)
Subjects: Sciences and Mathemathic
Divisions: Faculty of Science and Mathematics > Department of Statistics
Depositing User: Yemima Laras Sekarsari
Date Deposited: 19 Jan 2026 10:37
Last Modified: 19 Jan 2026 10:37
URI: https://eprints2.undip.ac.id/id/eprint/43606

Actions (login required)

View Item View Item