Identifying regional epidemic risks is of great importance for protecting public health, planning healthcare services, and effectively managing resource allocation. Due to their potential for rapid spread, epidemic diseases pose serious health and economic risks, especially in regions with high population density. In this study, machine learning techniques were used to conduct a province-based epidemic risk analysis of Turkey and to map the risk levels. The dataset used in the study was created by integrating demographic, geographic, healthcare infrastructure, and transportation data obtained from Turkish Statistical Institute (TUIK), Google Cloud Console, and Wikipedia. During the data preparation process, missing data imputation, scaling, and numerical conversion of categorical variables were applied. Feature importance ranking was determined using the Random Forest algorithm, and the analysis process was optimized by selecting the most influential variables. Logistic Regression (LR), Random Forest (RF), Support Vector Machines (SVM), Naive Bayes (NB), and XGBoost (XGB) algorithms were used for epidemic risk prediction. The performance of the algorithms was compared by analyzing accuracy, ROC curve, AUC score, and confusion matrix. According to the results obtained, the XGB algorithm showed the best performance with 98% accuracy. RF and SVM achieved successful results with 96% accuracy. The NB algorithm provided the advantage of fast prediction with an accuracy of 92%. The algorithm with the lowest accuracy was LR, with 88%. The geographical distribution of risk levels was visualized, and a province-based epidemic risk map of Turkey was created. In addition, the spread of the epidemic was modeled through simulations. This study aims to provide a data-driven approach to decision-makers for the prediction and mapping of health risk levels. In the future, the focus may shift toward real-time data integration, advanced simulation models, and deep learning techniques.
Epidemic risk analysis Machine Learning Population Density Simulation
Bölgesel salgın risklerinin belirlenmesi, halk sağlığını koruma, sağlık hizmetlerini planlama ve kaynak tahsisinin etkin yönetimi açısından büyük önem taşımaktadır. Salgın hastalıklar, hızlı yayılma potansiyelleri nedeniyle özellikle nüfus yoğunluğu yüksek bölgelerde ciddi sağlık ve ekonomik riskler oluşturmaktadır. Bu çalışmada, Türkiye’nin il bazlı salgın risk analizini gerçekleştirmek ve risk seviyelerini haritalandırmak amacıyla makine öğrenimi teknikleri kullanılmıştır. Çalışmada kullanılan veri seti, Türkiye İstatistik Kurumu (TÜİK), Google Cloud Console ve Wikipedia’dan elde edilen demografik, coğrafi, sağlık altyapısı ve ulaşım verilerinin entegrasyonu ile oluşturulmuştur. Veri hazırlık sürecinde eksik veri tamamlama, ölçeklendirme ve kategorik değişkenlerin sayısal hale getirilmesi işlemleri uygulanmıştır. Öznitelik önem sıralaması, Rastgele Orman algoritması kullanılarak belirlenmiş ve en etkili değişkenler seçilerek analiz süreci optimize edilmiştir. Salgın risk tahmini için Lojistik Regresyon (LR), Rastgele Orman (RO), Destek Vektör Makineleri (DVM), Naive Bayes (NB) ve XGBoost (XGB) algoritmaları kullanılmıştır. Algoritmaların performansı doğruluk oranı, ROC eğrisi, AUC skoru ve karışıklık matrisi analiz edilerek karşılaştırılmıştır. Elde edilen sonuçlara göre, XGB algoritması %98 doğruluk oranı ile en iyi performansı sergilemiştir. RO ve DVM %96 doğruluk oranı ile başarılı sonuçlar elde etmiştir. NB algoritması %92 doğruluk oranına sahip olup hızlı tahminleme avantajı sağlamıştır. En düşük doğruluk oranına sahip algoritmalar ise %88 doğruluk ile LR olmuştur. Risk seviyelerinin coğrafi dağılımı görselleştirilmiştir ve Türkiye'nin il bazında salgın risk haritası oluşturulmuştur. Ayrıca, salgın yayılımı simülasyonlarla modellenmiştir. Bu çalışma, sağlık risk seviyelerinin tahmini ve haritalandırılması açısından karar alıcılara veri odaklı bir yaklaşım sunmayı amaçlamaktadır. Gelecekte, gerçek zamanlı veri entegrasyonu, ileri seviye simülasyon modelleri ve derin öğrenme teknikleri üzerine yoğunlaşılabilir.
Salgın risk analizi Nüfus yoğunluğu Simülasyon Makine öğrenimi
| Birincil Dil | Türkçe |
|---|---|
| Konular | Bilgisayar Yazılımı, Yazılım Mühendisliği (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Erken Görünüm Tarihi | 27 Kasım 2025 |
| Yayımlanma Tarihi | 27 Kasım 2025 |
| Gönderilme Tarihi | 24 Nisan 2025 |
| Kabul Tarihi | 29 Ağustos 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 15 Sayı: 4 |