Deteksi Bias dalam Model Machine Learning untuk Prediksi Penyakit CardiovascularMenggunakan DALEX

Authors

  • Setio Basuki Universitas Muhammadiyah Malang Author
  • Ali Mokhtar Universitas Muhammadiyah Malang Author

Abstract

Penelitian ini bertujuan untukdeteksi potensi biaspada model machine learning (ML)untukdataset medis penyakit cardiovascular.Penelitian ini didasarkan pada fakta dimana ML telah banyak diadopsi untuk berbagai macamskenario prediksi, termasuk pada bidang medis. Mengingat bahwa bidang medis merupakan bidangyang critical karena berkaitan dengan manusia, maka penerapan ML perlu akurat danfair.Tahapan penelitian ini dimulai dari identifikasi datamedis penyakit cardiovascularyang paling popular di Kaggle, identifikasi protected attribute seperti jeniskelamin, usia, etnis, ras,dsb., pembangunan modelklasifikasiML menggunakan Random Forest, identifikasi potensi bias pada setiap dataset medis.Deteksi bias dilakukan berbasisModel Agnostic Language for Exploration and Explanation (DALEX) dengan terlebih dahulu mengidentifikasiprotected attribute seperti jenis kelamin, usia, ras, etnis, dsb.Hasil pengujianmengungkap bahwawalaupun menghasilkan akurasi klasifikasi yang tinggi, bahkan mencapai 98% seperti pada dataset MIMIC-III dan Heart Diseases,masihditemukan atribut yang berpotensi bias.Bias ini muncul umumnya pada atribut yang terkait denganjenis kelamin dan usia. Dari 11 dataset cardiovascular,terdapatdua dataset yang tidak berpotensibias yaitu Heart Diseased dan Cardiovascular Risk Factor.Hasil penelitian ini menguatkan bahwa penggunaan ML dalam bidang medis, khususnya penyakit cardiovascular,perlu mempertimbangkan aspekfairnesspada model MLagar hasil prediksi yang dihasilkan dapat dipertanggung jawababkan

Downloads

Published

2025-08-26