Koronavirüs hastalığı (COVID-19) , tüm dünyada milyonlarca insana bulaşmış ve birçok insanın ölümüne sebep olmuştur. Bu hastalığı taşıyan kişilerin en kısa sürede tespit edilmesi, hastalığın yayılmasına engel olmaktadır. Hastalık tespiti için PCR (Polymerase Chain Reaction) testleri yapılmaktadır. Bu testleri sonuçları %100 doğrulukta olmamaktadır. Ayrıca test sonuçlarının öğrenilmesi bazı durumlarda birkaç gün zaman alabilmektedir. Hastalık şüphesiyle sağlık kuruluşlarına başvuran kişilerin COVID-19 hastalık teşhisi farklı hastalık belirtilerinin varlığı kullanılarak gerçekleşebilmektedir. Bu çalışmada, Adaboost ve Naive Bayes denetimli makine öğrenme algoritması kullanılarak COVID-19 Surveillance veri seti içindeki hastaların COVID-19 teşhis tahminleri gerçekleştirilmiştir. Makine öğrenmesi algoritmaları kullanılarak önceden var olan verilerden tecrübe kazanarak yeni veriler hakkında tahminler yapılabilmektedir. Bu çalışmada, COVID-19 hastalık teşhis tahminlerinde, uluslararası hastalık kodlarıyla belirtilen veriler kullanılmıştır. Veri setindeki hastaların gösterdiği belirtiler öznitelik bilgisi olarak kullanılmıştır. Öznitelik verileri makine öğrenme algoritmalarına uygun olması için ikili formatta kullanılmıştır. Bu çalışmada elde sonuçlara göre Naive Bayes algoritmasıyla %85, Adaboost algoritmasıyla %100 doğrulukta sınıflandırma tahmini gerçekleştirilmiştir.
Makine Öğrenmesi Veri Madenciliği Naive Bayes AdaBoost Sınıflandırma COVID-19
Coronavirus disease (COVID-19) has infected millions of people all over the world and caused the death of many people. Identifying people with this disease as soon as possible is an important factor to prevent the disease from spreading. For disease detection, PCR (Polymerase Chain Reaction) tests performed. The results of tests always cannot give 100% accurate. In addition, obtaining information about test results sometimes may take a few days. Regarding the persons who applied to health institutions with suspicion of that illness, the diagnosis of COVID-19 disease takes place with the emergence of different disease symptoms. In this study, diagnostic estimates made for patients in the COVID-19 Surveillance dataset implementing Adaboost and Naive Bayes machine learning (ML) algorithm. It is possible to make predictions about new data by gaining experience from pre-existing data by means of using ML algorithms. In dataset determined within international disease codes for COVID-19 disease diagnosis estimates. Symptoms of patients used as attribute data in the dataset and used in binary format to be suitable for machine learning algorithms. According to the results obtained in this study, the classification forecast made with 85% accuracy with the Naive Bayes algorithm and 100% with the Adaboost algorithm.
Machine Learning Data Mining Naive Bayes AdaBoost Classification COVID-19
Birincil Dil | İngilizce |
---|---|
Konular | Bilgisayar Yazılımı |
Bölüm | Araştırma Makaleleri \ Research Articles |
Yazarlar | |
Yayımlanma Tarihi | 30 Aralık 2022 |
Gönderilme Tarihi | 31 Temmuz 2021 |
Kabul Tarihi | 24 Temmuz 2022 |
Yayımlandığı Sayı | Yıl 2022 Cilt: 10 Sayı: 4 |