SARS-CoV-2’nin ortaya çıkışı, etkili tanı araçlarının geliştirilmesine yönelik bilimsel çalışmalarda artışa yol açmıştır. Salgının kontrol altına alınabilmesi için doğru teşhis büyük önem taşımakta olup, yapay zeka (YZ) tabanlı yöntemler bu alanda umut vadetmektedir. Bu çalışmada, COVID-19’un kan değerlerinden, özellikle de Van Yüzüncü Yıl Üniversitesi Dursun Odabaş Tıp Merkezi’nden elde edilen hemogram test sonuçlarından, makine öğrenmesi (ML) teknikleri ile tahmin edilmesi amaçlanmıştır. Çeşitli ML algoritmaları test edilmiş ve en yüksek doğruluk oranı Rastgele Orman (Random Forest) yöntemiyle elde edilmiştir. Modelin performansı, optimizasyon süreciyle daha da artırılmış; bu süreçte Genetik Algoritma (GA) en etkili yöntem olarak öne çıkmıştır. Modelin kararlarını etkileyen temel özellikleri belirleyerek yorumlanabilirliği artırmak amacıyla SHAP analizi uygulanmıştır. Değerlendirilen üç veri seti arasında, en yüksek doğruluk oranı (%91,56) Veri Seti 3’te elde edilmiştir. Optimizasyon sonrası Veri Seti 2 dengeli bir performansla %85,09 doğruluk oranına ulaşırken, Veri Seti 1’de doğruluk %65,02’ye yükselmiş ancak duyarlılık (recall) düşüktür. GA ile optimize edilen model, 0.9467 AUC değerine ulaşarak güçlü bir sınıflandırma başarısı göstermiştir. Bu bulgular, hastalık tespitinde YZ destekli modellerin etkinliğini ve sağlık sistemlerini daha hızlı ve doğru teşhis imkânı sunarak destekleme potansiyelini ortaya koymaktadır. Gelecek çalışmalarda, farklı modelleme stratejileri ve derin öğrenme tekniklerinin entegrasyonuyla tanı doğruluğunun daha da artırılması hedeflenmektedir.
FYD-2024-10802
The emergence of SARS-CoV-2 has led to increased scientific focus on developing effective diagnostic tools. Accurate detection is crucial for controlling the outbreak, and artificial intelligence (AI)-based methods have shown promise. This study uses machine learning (ML) techniques to predict COVID-19 from blood values, specifically, hemogram test results obtained from Van Yuzuncu Yil University Dursun Odabas Medical Center. Various ML algorithms were tested, with the Random Forest method achieving the highest accuracy. Model performance was further improved through optimization, where the Genetic Algorithm (GA) proved most effective. SHAP analysis was employed to enhance the interpretability of the predictions by identifying key features influencing the model’s decisions. Among the three evaluated datasets, Dataset 3 achieved the highest accuracy (91.56%). Dataset 2, after optimization, reached 85.09% accuracy with balanced performance, while Dataset 1 saw improved accuracy (65.02%) but lower recall. The GA-optimized model reached an AUC of 0.9467, indicating strong classification capability. These findings highlight the effectiveness of AI-driven models in disease detection and their potential to support healthcare systems by enabling faster and more accurate diagnosis. Future efforts will focus on integrating different modeling strategies and deep learning techniques to further improve diagnostic accuracy.
Van Yuzuncu Yil University Scientific Research Projects Coordination Unit
FYD-2024-10802
| Primary Language | English |
|---|---|
| Subjects | Information Modelling, Management and Ontologies, Information Systems Development Methodologies and Practice, Biomedical Diagnosis |
| Journal Section | Research Article |
| Authors | |
| Project Number | FYD-2024-10802 |
| Submission Date | June 19, 2025 |
| Acceptance Date | November 4, 2025 |
| Publication Date | December 30, 2025 |
| Published in Issue | Year 2025 Volume: 14 Issue: 4 |
This work is licensed under the Creative Commons Attribution-Non-Commercial-Non-Derivable 4.0 International License.