Search for collections on Undip Repository

Klasifikasi Status Pasien Tuberkulosis dengan Gradient Boosting dan Eksplorasinya menggunakan SHAP dan LIME

KALTSUM, Salsabila Qonita (2026) Klasifikasi Status Pasien Tuberkulosis dengan Gradient Boosting dan Eksplorasinya menggunakan SHAP dan LIME. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

[thumbnail of 1. COVER.pdf] Text
1. COVER.pdf

Download (165kB)
[thumbnail of 3. HALAMAN PENGESAHAN I.pdf] Text
3. HALAMAN PENGESAHAN I.pdf

Download (180kB)
[thumbnail of 4. HALAMAN PENGESAHAN II.pdf] Text
4. HALAMAN PENGESAHAN II.pdf

Download (136kB)
[thumbnail of 5. KATA PENGANTAR.pdf] Text
5. KATA PENGANTAR.pdf

Download (229kB)
[thumbnail of 6. ABSTRAK.pdf] Text
6. ABSTRAK.pdf

Download (227kB)
[thumbnail of 7. ABSTRACT.pdf] Text
7. ABSTRACT.pdf

Download (228kB)
[thumbnail of 8. DAFTAR ISI.pdf] Text
8. DAFTAR ISI.pdf

Download (247kB)
[thumbnail of 12. BAB I PENDAHULUAN.pdf] Text
12. BAB I PENDAHULUAN.pdf

Download (271kB)
[thumbnail of 17. DAFTAR PUSTAKA.pdf] Text
17. DAFTAR PUSTAKA.pdf

Download (241kB)

Abstract

Tuberkulosis (TBC) merupakan salah satu penyakit infeksi paru yang dapat menyerang semua kelompok usia, mulai dari anak-anak hingga lanjut usia, dan prevalensinya masih tinggi di Indonesia. Penyakit ini disebabkan oleh Mycobacterium tuberculosis dan ditandai dengan gejala khas seperti batuk
berdahak berkepanjangan lebih dari dua minggu, kadang disertai darah, penurunan berat badan, hilang nafsu makan, serta sesak napas. Penelitian ini bertujuan membangun dan mengevaluasi model klasifikasi TBC menggunakan algoritma
Gradient Boosting berbasis data klinis pasien di Puskesmas Gayamsari. Data yang digunakan terdiri dari 255 observasi pasien dengan dua kelas klasifikasi, yaitu TBC Positif dan TBC Negatif. Faktor-faktor yang digunakan dalam proses klasifikasi
meliputi jenis kelamin, umur, demam, penurunan berat badan, hilang nafsu makan, sesak napas, sakit dada, kondisi lemas, lama batuk, dan jenis batuk. Dataset dibagi menjadi data latih dan data uji dengan rasio 80:20. Proses pemodelan mencakup
optimasi hyperparameter menggunakan Grid Search dan Optimization Using Treestructured Parzen Estimator (OPTUNA). Evaluasi model dilakukan menggunakan confusion matrix dan ROC-AUC. Algoritma Gradient Boosting dipilih karena kemampuannya dalam menangani hubungan nonlinier antar variabel pada data klinis. Interpretasi model dilakukan menggunakan metode SHapley Additive exPlanations (SHAP) untuk mengidentifikasi kontribusi global variabel dan Local
Interpretable Model-Agnostic Explanations (LIME) untuk penjelasan lokal pada satu observasi pasien. Hasil penelitian menunjukkan bahwa model Gradient Boosting menghasilkan F1-score awal sebesar 96%, kemudian setelah dilakukan
optimasi hyperparameter menggunakan Grid Search dan OPTUNA, nilai F1-score menjadi 95% pada kedua metode dikarenakan parameter awal model baseline telah memberikan kinerja yang optimal. Analisis SHAP menunjukkan bahwa variabel lama batuk, umur, hilang nafsu makan, dan penurunan berat badan merupakan faktor yang memberikan kontribusi terbesar dalam proses klasifikasi TBC. Temuan ini menunjukkan bahwa penggunaan algoritma Gradient Boosting yang dikombinasikan dengan metode interpretabilitas SHAP dan LIME mampu menghasilkan model klasifikasi yang akurat dan mudah dipahami, sehingga berpotensi mendukung pengambilan keputusan klinis dalam proses diagnosis TBC.
Kata Kunci: Tuberkolosis, Gradient Boosting, Hyperparameter Optimization, SHAP, LIME, Klasifikasi Klinis

Item Type: Thesis (Undergraduate)
Subjects: Sciences and Mathemathic
Divisions: Faculty of Science and Mathematics > Department of Statistics
Depositing User: Yemima Laras Sekarsari
Date Deposited: 20 Feb 2026 02:32
Last Modified: 20 Feb 2026 02:32
URI: https://eprints2.undip.ac.id/id/eprint/45585

Actions (login required)

View Item View Item