OPTIMASI MODEL MACHINE LEARNING UNTUK PREDIKSI RESPONS OBAT KANKER PAYUDARA BERBASIS PROTEOMIK DAN GRAF MOLEKULER

ACHMAD, Fawwaz (2026) OPTIMASI MODEL MACHINE LEARNING UNTUK PREDIKSI RESPONS OBAT KANKER PAYUDARA BERBASIS PROTEOMIK DAN GRAF MOLEKULER. Undergraduate thesis, UNDIP: Fakultas Sains dan Matematika.

	Text 1. Cover.pdf Download (99kB)
	Text 3. Halaman Pengesahan I.pdf Download (72kB)
	Text 4. Halaman Pengesahan II.pdf Download (294kB)
	Text 5. Kata Pengantar.pdf Download (453kB)
	Text 6. Abstrak.pdf Download (160kB)
	Text 7. Abstract.pdf Download (108kB)
	Text 8. Daftar Isi.pdf Download (208kB)
	Text 12. Bab I Pendahuluan.pdf Download (236kB)
	Text 17. Daftar Pustaka.pdf Download (170kB)

Abstract

Pengobatan presisi untuk kanker payudara memerlukan model prediktif yang akurat guna mengatasi heterogenitas respons pasien terhadap terapi standar. Salah satu pendekatan potensial untuk menangkap variabilitas tersebut adalah penggunaan
profil molekuler. Data proteomik telah terbukti memiliki nilai prediktif yang tinggi, namun penentuan arsitektur machine learning yang paling optimal untuk memanfaatkannya masih menjadi tantangan. Penelitian ini bertujuan untuk mengoptimasi arsitektur model prediksi respons obat dengan membandingkan efektivitas metode representasi fitur obat klasik dan modern. Evaluasi komparatif dilakukan terhadap sepuluh arsitektur model yang merupakan kombinasi dari dua
metode ekstraksi fitur (Morgan Fingerprint dan Graph Neural Network) dengan lima algoritma machine learning (LightGBM, XGBoost, Random Forest, SVM, dan MLP). Dataset terdiri dari 47 cell line kanker payudara dan 239 obat yang divalidasi menggunakan metode Group Shuffle Split (80:20) untuk mencegah kebocoran data. Kinerja model diukur menggunakan metrik utama Area Under Precision-Recall Curve (AUPRC). Hasil eksperimen menunjukkan bahwa algoritma berbasis boosting (LightGBM dan XGBoost) secara konsisten mengungguli algoritma lainnya. Representasi fitur berbasis graf (GNN) terbukti
memberikan informasi topologi yang lebih informatif dibandingkan Morgan Fingerprint pada model berbasis pohon. Arsitektur model paling optimal yang ditemukan adalah kombinasi fitur GNN dengan algoritma XGBoost, yang mencapai skor AUPRC tertinggi sebesar 0,9844. Temuan tersebut menegaskan bahwa integrasi representasi molekuler berbasis graf dengan algoritma XGBoost merupakan strategi yang efektif untuk meningkatkan akurasi pemodelan farmakogenomik pada data proteomik.
Kata Kunci: Prediksi Respons Obat, Kanker Payudara, Proteomik, Farmakogenomik, Group Shuffle Split, Machine Learning, Graph Neural Network.

Item Type:	Thesis (Undergraduate)
Subjects:	Sciences and Mathemathic
Divisions:	Faculty of Science and Mathematics > Department of Statistics
Depositing User:	Yemima Laras Sekarsari
Date Deposited:	31 Dec 2025 06:30
Last Modified:	31 Dec 2025 06:30
URI:	https://eprints2.undip.ac.id/id/eprint/43179

Actions (login required)

View Item

Search for collections on Undip Repository