Klasifikasi Berita Palsu Berbahasa Indonesia Menggunakan Metode BERT - CNN

PUTRA, Abe Randa (2024) Klasifikasi Berita Palsu Berbahasa Indonesia Menggunakan Metode BERT - CNN. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

	Text 1. Cover.pdf Download (37kB)
	Text 2. Halaman Pernyataan Keaslian Skripsi.pdf Download (100kB)
	Text 3. Halaman Pengesahan.pdf Download (125kB)
	Text 4. Kata Pengantar.pdf Download (209kB)
	Text 6. Abstrak.pdf Download (11kB)
	Text 7. Abstract.pdf Download (8kB)
	Text 8. Daftar Isi.pdf Download (106kB)
	Text 11. BAB I PENDAHULUAN.pdf Download (29kB)

Abstract

Kemudahan akses informasi melalui media sosial dalam era digital memudahkan masyarakat
untuk memperoleh dan bertukar informasi. Namun, hal ini juga menyebabkan meningkatnya
penyebaran berita palsu (hoax) yang dapat menyesatkan atau memanipulasi opini publik.
Penanganan berita palsu melalui literasi media dan edukasi telah dilakukan, namun hal ini
memerlukan waktu dan sumber daya yang besar. Sementara itu, deteksi berita palsu secara
manual oleh ahli sangat mahal dan memakan waktu. Oleh karena itu, penerapan machine
learning dipilih untuk menangani masalah ini dengan cepat dan efisien. Berbagai penelitian
sebelumnya telah menggunakan metode classical machine learning untuk deteksi berita
palsu, namun metode ini memiliki keterbatasan dalam representasi kata dan pemahaman
konteks. Model deep learning seperti Convolutional Neural Network (CNN) dan Long Short
Term Network (LSTM) menunjukkan hasil yang lebih baik, terutama saat menggunakan
Bidirectional Encoder Representations from Transformers (BERT) sebagai representasi
teks. Penelitian ini bertujuan untuk mengatasi masalah klasifikasi berita palsu berbahasa
Indonesia dengan memanfaatkan model BERT-CNN. Dataset yang digunakan merupakan
data hasil scraping dari website detik.com dan turnbackhoax.id dengan jumlah 14.794 data.
Model BERT-CNN dilatih dan diuji dengan empat skenario untuk mendapatkan metode
pengolahan data dan parameter terbaik. Model mencapai kinerja optimal dengan
menggunakan oversampling dataset, pembagian data latih dan data uji dengan rasio 70/30,
serta dilatih dengan learning rate 0,00001 dan dropout rate 0,5. Model mendapatkan hasil
akurasi 0,9798, precision 1, recall 0,9798, dan f1-score 0,9897 untuk prediksi berita palsu
dan akurasi 1, precision 0,8746, recall 1, dan f1-score 0,9331 untuk prediksi berita asli.
Kata kunci : Klasifikasi berita palsu berbahasa Indonesia, representasi teks, Bidirectional
Encoder Representations from Transformers, Convolutional Neural Network.

Item Type:	Thesis (Undergraduate)
Subjects:	Sciences and Mathemathic
Divisions:	Faculty of Science and Mathematics > Department of Informatics
Depositing User:	Yemima Laras Sekarsari
Date Deposited:	09 Feb 2026 10:49
Last Modified:	09 Feb 2026 10:49
URI:	https://eprints2.undip.ac.id/id/eprint/44849

Actions (login required)

View Item

Search for collections on Undip Repository