Covid-19 virus is one of the most important problems affecting our health and life today. It is considered that the effect of this virus for a normal patient continues approximately one month. Turkey's Health Ministry declared that the daily cases of death, recovering patient, tests and the number of seriously ill and these cases aimed to evuluate on a monthly basis the progress of virüs. In our research were used to announced between March 2020 and March 2021 the data set twelf montly. This data set was analysed with the Random Forest algorithmn, which is one of the machine learning classification methods. As a result of the analysis, the method was tested with precision, recall, score F and AUC-ROC performance criteria. In addition, the importance of the variables used for the model was evaluated. As a result of the analysis, the accuracy (OOB) of our model was found to be 83%. Performance criteria were found to have an precision rate of 90%, a recall rate of 89%, an F score of 89%, and an area under the curve (AUC-ROC) of 99%. While the most important variable for the accuracy of the model was the daily healing number, the most important variable in determining the grade was the Daily Healing Number.
Covid-19. Turkey Machine learning Random forest Classification methods
Covid-19 virüsü günümüzde sağlığımızı ve yaşamımızı etkileyen en önemli sorunların başındadır. Bu virüsün normal bir hastada etkisinin yaklaşık olarak bir ay sürdüğü düşünülmektedir. Buradan yola çıkarak Türkiye Sağlık Bakanlığının açıkladığı günlük vakalar, vefatlar, iyileşenler, testler ve ağır hasta sayıları verilerinden yola çıkarak aylık bir değerlendirme yaparak virüsün aylık olarak seyrinin değerlendirilmesi amaçlandı. Araştırmada Mart 2020 ile Mart 2021 arasında açıklanan 12 aylık veri seti kullanıldı. Bu veri seti Makine Öğrenmesi sınıflandırma yöntemlerinden Random Forest algoritması ile analiz edildi. Analiz sonucunda yöntem kesinlik, duyarlılık, F ölçüsü ve AUC-ROC performans ölçütleri ile sınandı. Ayrıca kullanılan değişkenlerin model için önemi değerlendirildi. Yapılan analizler sonucunda modelin doğruluğu (OOB) ise %83 olarak bulundu. Performans ölçütleri de kesinlik oranı %90, duyarlılık oranı %89, F ölçüsü %89 ve eğrinin altında kalan alan (AUC-ROC) %99 olarak bulundu. Modelinin doğruluğu için en önemli değişken günlük iyileşen sayısı iken şınıf belirlemedeki en önemli değişken günlük iyileşen sayısı olarak belirlendi.
Covid-19 Türkiye Makine öğrenmesi Rasgele orman Sınıflandırma yöntemleri
Birincil Dil | Türkçe |
---|---|
Konular | Yapay Zeka (Diğer) |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Yayımlanma Tarihi | 18 Ağustos 2021 |
Yayımlandığı Sayı | Yıl 2021 Cilt: 1 Sayı: 2 |