Search for collections on Undip Repository

Implementasi Algoritma Random Forest Untuk Menentukan Variabel Yang Berpengaruh Pada Klasifikasi Tingkat Pengangguran Terbuka Di Indonesia

LISDA, Zafira Julia (2025) Implementasi Algoritma Random Forest Untuk Menentukan Variabel Yang Berpengaruh Pada Klasifikasi Tingkat Pengangguran Terbuka Di Indonesia. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

[thumbnail of 1. Cover.pdf] Text
1. Cover.pdf

Download (120kB)
[thumbnail of 3. Halaman Pengesahan I.pdf] Text
3. Halaman Pengesahan I.pdf

Download (338kB)
[thumbnail of 4. Halaman Pengesahan II.pdf] Text
4. Halaman Pengesahan II.pdf

Download (315kB)
[thumbnail of 5. Kata Pengantar.pdf] Text
5. Kata Pengantar.pdf
Restricted to Repository staff only

Download (126kB) | Request a copy
[thumbnail of 6. Abstrak.pdf] Text
6. Abstrak.pdf

Download (149kB)
[thumbnail of 7. Abstract.pdf] Text
7. Abstract.pdf

Download (110kB)
[thumbnail of 8. Daftar Isi.pdf] Text
8. Daftar Isi.pdf

Download (170kB)
[thumbnail of 12. BAB I.pdf] Text
12. BAB I.pdf

Download (239kB)

Abstract

ABSTRAK
Pengangguran merupakan masalah kompleks di negara berkembang
seperti Indonesia yang berdampak pada pertumbuhan ekonomi dan kesejahteraan
sosial. Tingkat Pengangguran Terbuka (TPT) menjadi indikator kunci untuk
menilai kondisi ketenagakerjaan suatu wilayah. Penelitian ini bertujuan
mengimplementasikan algoritma Random Forest untuk membangun model
klasifikasi TPT di setiap provinsi di Indonesia ke dalam kategori rendah, sedang,
atau tinggi, serta mengidentifikasi faktor-faktor paling berpengaruh dalam
mengklasifikasikan TPT. Data sekunder dari Badan Pusat Statistik (BPS) tahun
2015-2024, yang terdiri dari 340 observasi, diolah melalui beberapa tahapan.
Tahapan pre-processing, penanganan data tidak seimbang dengan Synthetic
Minority Oversampling Technique (SMOTE) sehingga data menjadi 701
observasi, dan hyperparameter tuning menggunakan Grid Search dengan validasi
silang 5-fold untuk mendapatkan parameter model terbaik. Model dievaluasi
menggunakan metrik accuracy, precision, dan recall. Hasil penelitian
menunjukkan bahwa model Random Forest dengan proporsi data latih 90% dan
data uji 10% memberikan kinerja terbaik, mencapai accuracy 92,75%, precision
92,8%, dan recall 92,7%. Analisis feature importance mengindikasikan bahwa
persentase penduduk miskin adalah variabel paling berpengaruh terhadap
klasifikasi TPT, dengan kontribusi sebesar 19,64%.
Kata Kunci: Tingkat Pengangguran Terbuka, Klasifikasi, Random Forest,
Feature Importance

Item Type: Thesis (Undergraduate)
Subjects: Sciences and Mathemathic
Divisions: Faculty of Science and Mathematics > Department of Statistics
Depositing User: Yemima Laras Sekarsari
Date Deposited: 08 Oct 2025 08:19
Last Modified: 08 Oct 2025 08:19
URI: https://eprints2.undip.ac.id/id/eprint/39722

Actions (login required)

View Item View Item