SARS-CoV-2’nin ortaya çıkışı, etkili tanı araçlarının geliştirilmesine yönelik bilimsel çalışmalarda artışa yol açmıştır. Salgının kontrol altına alınabilmesi için doğru teşhis büyük önem taşımakta olup, yapay zeka (YZ) tabanlı yöntemler bu alanda umut vadetmektedir. Bu çalışmada, COVID-19’un kan değerlerinden, özellikle de Van Yüzüncü Yıl Üniversitesi Dursun Odabaş Tıp Merkezi’nden elde edilen hemogram test sonuçlarından, makine öğrenmesi (ML) teknikleri ile tahmin edilmesi amaçlanmıştır. Çeşitli ML algoritmaları test edilmiş ve en yüksek doğruluk oranı Rastgele Orman (Random Forest) yöntemiyle elde edilmiştir. Modelin performansı, optimizasyon süreciyle daha da artırılmış; bu süreçte Genetik Algoritma (GA) en etkili yöntem olarak öne çıkmıştır. Modelin kararlarını etkileyen temel özellikleri belirleyerek yorumlanabilirliği artırmak amacıyla SHAP analizi uygulanmıştır. Değerlendirilen üç veri seti arasında, en yüksek doğruluk oranı (%91,56) Veri Seti 3’te elde edilmiştir. Optimizasyon sonrası Veri Seti 2 dengeli bir performansla %85,09 doğruluk oranına ulaşırken, Veri Seti 1’de doğruluk %65,02’ye yükselmiş ancak duyarlılık (recall) düşüktür. GA ile optimize edilen model, 0.9467 AUC değerine ulaşarak güçlü bir sınıflandırma başarısı göstermiştir. Bu bulgular, hastalık tespitinde YZ destekli modellerin etkinliğini ve sağlık sistemlerini daha hızlı ve doğru teşhis imkânı sunarak destekleme potansiyelini ortaya koymaktadır. Gelecek çalışmalarda, farklı modelleme stratejileri ve derin öğrenme tekniklerinin entegrasyonuyla tanı doğruluğunun daha da artırılması hedeflenmektedir.
Hemogram COVID-19 Rastgele orman Genetik algoritma SHAP analizi
FYD-2024-10802
The emergence of SARS-CoV-2 has led to increased scientific focus on developing effective diagnostic tools. Accurate detection is crucial for controlling the outbreak, and artificial intelligence (AI)-based methods have shown promise. This study uses machine learning (ML) techniques to predict COVID-19 from blood values, specifically, hemogram test results obtained from Van Yuzuncu Yil University Dursun Odabas Medical Center. Various ML algorithms were tested, with the Random Forest method achieving the highest accuracy. Model performance was further improved through optimization, where the Genetic Algorithm (GA) proved most effective. SHAP analysis was employed to enhance the interpretability of the predictions by identifying key features influencing the model’s decisions. Among the three evaluated datasets, Dataset 3 achieved the highest accuracy (91.56%). Dataset 2, after optimization, reached 85.09% accuracy with balanced performance, while Dataset 1 saw improved accuracy (65.02%) but lower recall. The GA-optimized model reached an AUC of 0.9467, indicating strong classification capability. These findings highlight the effectiveness of AI-driven models in disease detection and their potential to support healthcare systems by enabling faster and more accurate diagnosis. Future efforts will focus on integrating different modeling strategies and deep learning techniques to further improve diagnostic accuracy.
Hemogram COVID-19 Random forest Genetic algorithm SHAP analysis
Van Yuzuncu Yil University Scientific Research Projects Coordination Unit
FYD-2024-10802
| Birincil Dil | İngilizce |
|---|---|
| Konular | Bilgi Modelleme, Yönetim ve Ontolojiler, Bilgi Sistemleri Geliştirme Metodolojileri ve Uygulamaları, Biyomedikal Tanı |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Proje Numarası | FYD-2024-10802 |
| Gönderilme Tarihi | 19 Haziran 2025 |
| Kabul Tarihi | 4 Kasım 2025 |
| Yayımlanma Tarihi | 30 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 14 Sayı: 4 |
Bu eser Creative Commons Atıf-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.