Coronary artery disease (CAD) is the leading cause of death worldwide, necessitating early detection methods that are non-invasive, cost-effective, and reliable. In this study, the effectiveness of various machine learning (ML) models in predicting CAD was evaluated, with a focus on addressing class imbalance using the Synthetic Minority Oversampling Technique (SMOTE). The Framingham CAD dataset was utilized, and SMOTE was applied with different k-values to balance the data, examining the impact on prediction performance. Eight significant features—age, diaBP, glucose, heart rate, sysBP, totChol, cigsPerDay, and BMI—were determined during preprocessing and used for further analysis. Among the models tested, the StackingC classifier demonstrated superior performance, achieving an accuracy of 95.81%, sensitivity of 95.9%, specificity of 95.7%, and an AUROC of 99.2% for k=1. These findings highlight the potential of the StackingC model as a robust tool for CAD prediction, offering a promising non-invasive method for early diagnosis.
Machine learning coronary artery disease prediction class imbalance SMOTE stackingC classifier.
Koroner arter hastalığı (KAH) dünya çapında önde gelen ölüm nedenidir ve bu nedenle invaziv olmayan, maliyet etkin ve güvenilir erken tespit yöntemlerine ihtiyaç duyulmaktadır. Bu çalışmada, KAH'nın tahmininde çeşitli makine öğrenimi (ML) modellerinin etkinliği değerlendirildi ve Sınıf Dengesizliğinin Üstesinden Gelme Yöntemi (SMOTE) kullanılarak sınıf dengesizliğine odaklanıldı. Framingham KAH veri seti kullanılarak SMOTE, verileri dengelemek için farklı k-değerleri ile uygulandı ve tahmin performansına etkisi incelendi. Ön işleme sırasında belirlenen sekiz önemli özellik—yaş, diyastolik kan basıncı (diaBP), glukoz, kalp hızı, sistolik kan basıncı (sysBP), toplam kolesterol (totChol), günlük sigara sayısı (cigsPerDay) ve vücut kitle indeksi (BMI)—daha ileri analizler için kullanıldı. Test edilen modeller arasında, StackingC sınıflandırıcısı üstün performans göstererek k=1 için %95.81 doğruluk, %95.9 duyarlılık, %95.7 özgüllük ve %99.2 AUROC elde etti. Bu bulgular, StackingC modelinin KAH tahmininde sağlam bir araç olarak potansiyelini vurgulamakta ve erken teşhis için umut verici invaziv olmayan bir yöntem sunmaktadır.
Makine öğrenmesi koroner arter hastalığı tahmini sınıf dengesizliği SMOTE stackingC sınıflandırıcı
Primary Language | English |
---|---|
Subjects | Machine Learning (Other) |
Journal Section | Articles |
Authors | |
Early Pub Date | December 23, 2024 |
Publication Date | |
Submission Date | August 12, 2024 |
Acceptance Date | October 24, 2024 |
Published in Issue | Year 2024 Volume: 15 Issue: 4 |