The coronavirus first appeared in Wuhan, China in December 2019 and was declared as a pandemic by the World Health Organization on March 11, 2020. In order to control the number of cases, many countries have taken various measures such as quarantine, curfew and closing social areas for a while. Prediction data can be used in logistics, procurement, hospital personnel and supplies planning and vaccination scenarios. In the confirmed case estimate; in the literature, there are studies that use many methods such as machine learning, compartmental model, and time series analysis in confirmed case prediction. In this study, various machine learning models have been generated to estimate future cases using the number of confirmed cases in the United States. The predictions made using Python and R programming language were made with Prophet, Polynomial Regression, ARIMA, Linear Regression and Random Forest models. The performances of the data estimated by the test data are evaluated using the mean absolute percent error (MAPE), root mean square deviation (RMSE) and mean absolute error (MAE). As a result, the algorithm that gives the best estimates based on the MAPE error metric was found as Polynomial Regression.
Koronavirüs, 2019 yılının Aralık ayında ilk olarak Çin’in Wuhan kentinde ortaya çıkmış ve 11 Mart 2020’de Dünya Sağlık Örgütü tarafından pandemi olarak ilan edilmiştir. Vaka sayılarını kontrol altına almak için pek çok ülke karantina, sokağa çıkma yasağı ve sosyal alanların bir süreliğine kapatılması gibi çeşitli önlemler almıştır. Doğrulanmış vaka tahminlemesi pandemide olası planlamalar için büyük önem taşımaktadır. Gelecek verilerinin gerçeğe en yakın bir şekilde tahminlenmesi; pandemi döneminde lojistik, tedarik, hastane personel ve malzeme planlaması için kullanılabileceği gibi aşılama senaryolarında da girdi olarak kullanılabilir. Literatürde doğrulanmış vaka tahmininde makine öğrenmesi, bölmeli model, zaman serisi analizi gibi pek çok yöntem kullanarak tahminleme yapılan çalışmalar vardır. Bu çalışmada, Amerika Birleşik Devletleri’ndeki doğrulanmış vaka sayılarını kullanarak gelecek günlerdeki vaka tahminlerini çeşitli makine öğrenmesi modelleri yapılmıştır. Python ve R programlama dili kullanılarak yapılan tahminlemeler Prophet, Polinom Regresyon, ARIMA, Doğrusal Regresyon ve Random Forest modelleri ile yapılmıştır. Test verisiyle tahmin edilen verilerin performansları ortalama mutlak yüzde hatası (MAPE), ortalama karekök sapması (RMSE) ve ortalama mutlak hata (MAE) kullanılarak değerlendirilmiştir. Sonuç olarak, MAPE hata metriği baz alınarak en iyi tahminleri veren algoritma Polinom Regresyon olarak bulunmuştur.
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | January 31, 2021 |
Published in Issue | Year 2021 |