SUNIA, Bernardo Nandaniar (2026) Perbandingan TF-IDF dan SBERT dengan Logistik Regression untuk Aspect Sentiment Classification pada Ulasan E-commerce (Studi Kasus : Aplikasi Shopee). Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.
|
Text
1. COVER.pdf Download (73kB) |
|
|
Text
2. HALAMAN PERNYATAAN KEASLIAN SKRIPSI.pdf Download (156kB) |
|
|
Text
3. HALAMAN PENGESAHAN.pdf Download (474kB) |
|
|
Text
4. KATA PENGANTAR.pdf Download (86kB) |
|
|
Text
6. ABSTRAK.pdf Download (116kB) |
|
|
Text
7. ABSTRACT.pdf Download (95kB) |
|
|
Text
8. DAFTAR ISI.pdf Download (179kB) |
|
|
Text
11. BAB I PENDAHULUAN.pdf Download (210kB) |
|
|
Text
16. DAFTAR PUSTAKA.pdf Download (181kB) |
Abstract
Perkembangan pesat e-commerce di Indonesia menghasilkan volume besar ulasan pengguna
yang memuat opini terhadap berbagai aspek layanan. Namun, analisis sentimen tradisional
yang memprediksi polaritas keseluruhan ulasan tidak memadai karena satu ulasan sering
memuat sentimen berbeda untuk aspek berbeda, sehingga diperlukan Aspect-Based
Sentiment Analysis (ABSA) yang dapat mengklasifikasikan sentimen untuk setiap aspek
secara terpisah. Penelitian ini membandingkan dua paradigma representasi teks, yaitu Term
Frequency-Inverse Document Frequency (TF-IDF) sebagai representasi sparse berbasis
frekuensi kata dan Sentence Bidirectional Encoder Representations from Transformers
(SBERT) sebagai representasi dense berbasis konteks semantik, yang masing-masing
dipasangkan dengan Logistic Regression sebagai classifier untuk subtugas ABSA yaitu
Aspect Sentiment Classification (ASC) pada ulasan aplikasi Shopee. Proses penelitian
dimulai dengan pengumpulan data melalui web scraping yang menghasilkan 1.000 ulasan,
dilanjutkan dengan aspect discovery menggunakan hierarchical clustering dan manual
review untuk mengidentifikasi tujuh aspek yaitu Aplikasi, Pengiriman, Produk, Harga,
Pembayaran, Layanan Pelanggan, dan Penjual. Selanjutnya, dilakukan targeted scrapping
dengan keywords hasil aspect discovery dengan treshold 100 ulasan per-aspek. Dari ulasan
yang didapat, dilakukan anotasi manual oleh tiga anotator dengan inter-annotator agreement
tinggi (Fleiss Kappa > 0,9), preprocessing data, serta pemodelan dengan optimasi
hyperparameter melalui grid search menggunakan stratified 5-fold cross-validation pada
dua skenario yaitu hyperparameter terbaik per-aspek dan hyperparameter universal.
Evaluasi dilakukan menggunakan metrik akurasi, precision, recall, F1-score, ROC-AUC,
dan PR-AUC pada test set, serta uji signifikansi statistik dengan McNemar Test. Hasil
menunjukkan bahwa SBERT memberikan keunggulan konsisten dibandingkan TF-IDF pada
test set di seluruh kombinasi berdasarkan hasil McNemar Test (0,9444 vs 0,9130). Hal ini
mengonfirmasi bahwa ulasan e-commerce Indonesia cenderung lebih context-driven dengan
representasi contextual embedding yang lebih sesuai untuk menangkap konteks ulasan.
Kata kunci : Aspect-Based Sentiment Analysis, TF-IDF, SBERT, Logistic Regression, E
commerce, Ulasan Shopee, Representasi Teks
| Item Type: | Thesis (Undergraduate) |
|---|---|
| Subjects: | Sciences and Mathemathic |
| Divisions: | Faculty of Science and Mathematics > Department of Informatics |
| Depositing User: | Yemima Laras Sekarsari |
| Date Deposited: | 31 Mar 2026 11:18 |
| Last Modified: | 31 Mar 2026 11:18 |
| URI: | https://eprints2.undip.ac.id/id/eprint/48145 |
Actions (login required)
![]() |
View Item |
