Search for collections on Undip Repository

Stacking Ensemble Classifier Berbasis Support Vector Machine, Random Forest, dan AdaBoost dengan SMOTE pada Klasifikasi IPM di Pulau Jawa Indonesia

NUGRAHA, Chistian Aria (2026) Stacking Ensemble Classifier Berbasis Support Vector Machine, Random Forest, dan AdaBoost dengan SMOTE pada Klasifikasi IPM di Pulau Jawa Indonesia. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

[thumbnail of 1. COVER.pdf] Text
1. COVER.pdf

Download (187kB)
[thumbnail of 3. HALAMAN PENGESAHAN I.pdf] Text
3. HALAMAN PENGESAHAN I.pdf

Download (396kB)
[thumbnail of 4. HALAMAN PENGESAHAN II.pdf] Text
4. HALAMAN PENGESAHAN II.pdf

Download (529kB)
[thumbnail of 5. KATA PENGANTAR.pdf] Text
5. KATA PENGANTAR.pdf

Download (189kB)
[thumbnail of 6. ABSTRAK.pdf] Text
6. ABSTRAK.pdf

Download (176kB)
[thumbnail of 7. ABSTRACT.pdf] Text
7. ABSTRACT.pdf

Download (145kB)
[thumbnail of 8. DAFTAR ISI.pdf] Text
8. DAFTAR ISI.pdf

Download (190kB)
[thumbnail of 12. BAB I PENDAHULUAN.pdf] Text
12. BAB I PENDAHULUAN.pdf

Download (247kB)
[thumbnail of 17. DAFTAR PUSTAKA.pdf] Text
17. DAFTAR PUSTAKA.pdf

Download (206kB)

Abstract

Penelitian ini merupakan kajian penerapan metode machine learning untuk
mengklasifikasikan tingkat Indeks Pembangunan Manusia (IPM) kabupaten/kota di
Pulau Jawa tahun 2024 menggunakan Support Vector Machine (SVM), Random
Forest, AdaBoost, dan Stacking Ensemble. Data yang digunakan merupakan data
sekunder dari Badan Pusat Statistik yang mencakup variabel ekonomi, pendidikan,
dan kesehatan, dengan pembagian data latih sebesar 70% dan data uji sebesar 30%.
Ketidakseimbangan kelas ditangani menggunakan Synthetic Minority Over
sampling Technique (SMOTE), sedangkan penentuan hyperparameter dilakukan
dengan GridSearchCV. Evaluasi kinerja model menggunakan accuracy dan F1
Score. Hasil penelitian menunjukkan bahwa SMOTE mampu memperbaiki
distribusi kelas sehingga meningkatkan kemampuan model dalam mengenali kelas
minoritas. Model SVM menghasilkan kinerja terbaik dengan accuracy sebesar 0,91
dan F1-Score sebesar 0,87, diikuti Random Forest dan Stacking Ensemble dengan
accuracy sebesar 0,88 dan F1-Score sebesar 0,85, serta AdaBoost dengan accuracy
sebesar 0,85 dan F1-Score sebesar 0,84. Analisis SHAP menunjukkan bahwa
variabel UMK, pengeluaran per kapita, dan akses sanitasi layak memiliki kontribusi
terbesar terhadap klasifikasi IPM. Hasil penelitian menunjukkan bahwa metode
machine learning efektif digunakan dalam klasifikasi IPM.
Kata Kunci: Indeks Pembangunan Manusia (IPM), Klasifikasi, Ensemble
Learning, Stacking, Random Forest, SVM, AdaBoost, SMOTE, GridSearchCV,
SHAP.

Item Type: Thesis (Undergraduate)
Subjects: Sciences and Mathemathic
Divisions: Faculty of Science and Mathematics > Department of Statistics
Depositing User: Yemima Laras Sekarsari
Date Deposited: 07 May 2026 03:12
Last Modified: 07 May 2026 03:12
URI: https://eprints2.undip.ac.id/id/eprint/50548

Actions (login required)

View Item View Item