Search for collections on Undip Repository

Perbandingan TF-IDF dan SBERT dengan Logistik Regression untuk Aspect Sentiment Classification pada Ulasan E-commerce (Studi Kasus : Aplikasi Shopee)

SUNIA, Bernardo Nandaniar (2026) Perbandingan TF-IDF dan SBERT dengan Logistik Regression untuk Aspect Sentiment Classification pada Ulasan E-commerce (Studi Kasus : Aplikasi Shopee). Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

[thumbnail of 1. COVER.pdf] Text
1. COVER.pdf

Download (73kB)
[thumbnail of 2. HALAMAN PERNYATAAN KEASLIAN SKRIPSI.pdf] Text
2. HALAMAN PERNYATAAN KEASLIAN SKRIPSI.pdf

Download (156kB)
[thumbnail of 3. HALAMAN PENGESAHAN.pdf] Text
3. HALAMAN PENGESAHAN.pdf

Download (474kB)
[thumbnail of 4. KATA PENGANTAR.pdf] Text
4. KATA PENGANTAR.pdf

Download (86kB)
[thumbnail of 6. ABSTRAK.pdf] Text
6. ABSTRAK.pdf

Download (116kB)
[thumbnail of 7. ABSTRACT.pdf] Text
7. ABSTRACT.pdf

Download (95kB)
[thumbnail of 8. DAFTAR ISI.pdf] Text
8. DAFTAR ISI.pdf

Download (179kB)
[thumbnail of 11. BAB I PENDAHULUAN.pdf] Text
11. BAB I PENDAHULUAN.pdf

Download (210kB)
[thumbnail of 16. DAFTAR PUSTAKA.pdf] Text
16. DAFTAR PUSTAKA.pdf

Download (181kB)

Abstract

Perkembangan pesat e-commerce di Indonesia menghasilkan volume besar ulasan pengguna
yang memuat opini terhadap berbagai aspek layanan. Namun, analisis sentimen tradisional
yang memprediksi polaritas keseluruhan ulasan tidak memadai karena satu ulasan sering
memuat sentimen berbeda untuk aspek berbeda, sehingga diperlukan Aspect-Based
Sentiment Analysis (ABSA) yang dapat mengklasifikasikan sentimen untuk setiap aspek
secara terpisah. Penelitian ini membandingkan dua paradigma representasi teks, yaitu Term
Frequency-Inverse Document Frequency (TF-IDF) sebagai representasi sparse berbasis
frekuensi kata dan Sentence Bidirectional Encoder Representations from Transformers
(SBERT) sebagai representasi dense berbasis konteks semantik, yang masing-masing
dipasangkan dengan Logistic Regression sebagai classifier untuk subtugas ABSA yaitu
Aspect Sentiment Classification (ASC) pada ulasan aplikasi Shopee. Proses penelitian
dimulai dengan pengumpulan data melalui web scraping yang menghasilkan 1.000 ulasan,
dilanjutkan dengan aspect discovery menggunakan hierarchical clustering dan manual
review untuk mengidentifikasi tujuh aspek yaitu Aplikasi, Pengiriman, Produk, Harga,
Pembayaran, Layanan Pelanggan, dan Penjual. Selanjutnya, dilakukan targeted scrapping
dengan keywords hasil aspect discovery dengan treshold 100 ulasan per-aspek. Dari ulasan
yang didapat, dilakukan anotasi manual oleh tiga anotator dengan inter-annotator agreement
tinggi (Fleiss Kappa > 0,9), preprocessing data, serta pemodelan dengan optimasi
hyperparameter melalui grid search menggunakan stratified 5-fold cross-validation pada
dua skenario yaitu hyperparameter terbaik per-aspek dan hyperparameter universal.
Evaluasi dilakukan menggunakan metrik akurasi, precision, recall, F1-score, ROC-AUC,
dan PR-AUC pada test set, serta uji signifikansi statistik dengan McNemar Test. Hasil
menunjukkan bahwa SBERT memberikan keunggulan konsisten dibandingkan TF-IDF pada
test set di seluruh kombinasi berdasarkan hasil McNemar Test (0,9444 vs 0,9130). Hal ini
mengonfirmasi bahwa ulasan e-commerce Indonesia cenderung lebih context-driven dengan
representasi contextual embedding yang lebih sesuai untuk menangkap konteks ulasan.
Kata kunci : Aspect-Based Sentiment Analysis, TF-IDF, SBERT, Logistic Regression, E
commerce, Ulasan Shopee, Representasi Teks

Item Type: Thesis (Undergraduate)
Subjects: Sciences and Mathemathic
Divisions: Faculty of Science and Mathematics > Department of Informatics
Depositing User: Yemima Laras Sekarsari
Date Deposited: 31 Mar 2026 11:18
Last Modified: 31 Mar 2026 11:18
URI: https://eprints2.undip.ac.id/id/eprint/48145

Actions (login required)

View Item View Item