Search for collections on Undip Repository

Perbandingan Ekstraksi Fitur BoW dan TF-IDF pada Analisis Sentimen Ulasan Pengguna Halodoc Menggunakan Metode Support Vector Machine

AMANDA, Zhafira (2025) Perbandingan Ekstraksi Fitur BoW dan TF-IDF pada Analisis Sentimen Ulasan Pengguna Halodoc Menggunakan Metode Support Vector Machine. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

[thumbnail of 1. COVER.pdf] Text
1. COVER.pdf

Download (159kB)
[thumbnail of 3. HALAMAN PENGESAHAN.pdf] Text
3. HALAMAN PENGESAHAN.pdf

Download (566kB)
[thumbnail of 4. KATA PENGANTAR.pdf] Text
4. KATA PENGANTAR.pdf

Download (142kB)
[thumbnail of 5. HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI.pdf] Text
5. HALAMAN PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI.pdf

Download (654kB)
[thumbnail of 6. ABSTRAK.pdf] Text
6. ABSTRAK.pdf

Download (137kB)
[thumbnail of 7. DAFTAR ISI.pdf] Text
7. DAFTAR ISI.pdf

Download (133kB)
[thumbnail of 8. DAFTAR TABEL.pdf] Text
8. DAFTAR TABEL.pdf

Download (124kB)
[thumbnail of 10. BAB I PENDAHULUAN.pdf] Text
10. BAB I PENDAHULUAN.pdf

Download (165kB)

Abstract

ABSTRAK
Halodoc merupakan aplikasi layanan kesehatan digital yang ada di Indonesia, sehingga
penting untuk memahami persepsi pengguna melalui analisis sentimen. Penelitian ini
bertujuan untuk menganalisis ulasan pengguna di Google Play Store menggunakan metode
Support Vector Machine (SVM). Dua pendekatan ekstraksi fitur, yaitu Bag of Words (BoW)
dan Term Frequency-Inverse Document Frequency (TF-IDF) digunakan untuk
merepresentasikan data teks ke dalam bentuk numerik. Data ulasan dikategorikan menjadi
sentimen positif dan negatif setelah melalui tahapan pra-pemrosesan yang mencakup
pembersihan data, normalisasi huruf, tokenisasi, penghapusan stopword, dan stemming.
Model diuji dengan berbagai nilai parameter C pada kernel linear untuk menemukan
parameter terbaik. Hasil pengujian menunjukkan bahwa metode TF-IDF memberikan
performa terbaik dengan akurasi 85%, presisi 86%, dan F1-score 86%, sedangkan BoW
mencapai akurasi 84%, presisi 82%, dan F1-score 85%. Namun, BoW unggul dalam recall
sebesar 88%, dibandingkan TF-IDF yang mencapai 86%, menunjukkan keunggulannya
dalam mendeteksi ulasan positif. Penelitian ini membuktikan bahwa pemilihan metode
ekstraksi fitur dan teknik pra-pemrosesan data yang sesuai memiliki dampak terhadap
peningkatan performa model klasifikasi sentimen.
Kata kunci : Analisis Sentimen, Support Vector Machine , Halodoc, BoW, TF-IDF

Item Type: Thesis (Undergraduate)
Subjects: Sciences and Mathemathic
Divisions: Faculty of Science and Mathematics > Department of Informatics
Depositing User: Yemima Laras Sekarsari
Date Deposited: 30 Oct 2025 03:20
Last Modified: 30 Oct 2025 03:20
URI: https://eprints2.undip.ac.id/id/eprint/40451

Actions (login required)

View Item View Item