Kapsamı: Günümüzde hızla artan düzenli/düzensiz farklı
alanlardaki büyük verilerin yorumlanması, sınıflandırılması,
depolanması ve ayıklanarak tekrar işe yarar hale getirilmesi,
üzerinde yoğun çalışılan konuların arasındadır. Sağlık
alanındaki büyük verilerin doğru yorumlanması ise hızlı ve
doğru teşhis konulmasını sağladığından hayati öneme sahiptir.
Projede sağlık verilerinin yorumlanabileceği makine
öğrenme yöntemleri, Canine parvovirüsü enfeksiyonun özelinde
uygulanmıştır. CPV klinik bulgulara dayanılarak teşhis
konulabilirken; diğer enfeksiyonlardan ayırt edilebilmesi
için ise laboratuvar bulguları ile desteklenmesi gerekir. CPV,
yavru köpeklerde ölümle sonuçlanabilen, kanlı ishalle seyreden
diğer enfeksiyonlardan ayırt edilebilmesi için doğru
teşhis hayati önem taşır. Bu sebeple, virüsün etkilenebileceği
diğer verilerle beraber incelenmesi yapılarak, en doğru kararın
alma yöntemleri karşılaştırılarak değerlendirilmiştir.
Amaç: Çalışmada, halk arasında delibaş hastalığı olarak
bilinen, köpeklerin en önemli enfeksiyöz etkenlerinden birisi
olarak kabul edilen CPV farklı parametreleri açısından En
Yakın komşu Algoritması (KNN), Rastgele Orman (RF), Lojistik
Regresyon ve NaiveBayes sınıflandırma algoritmaları
kullanarak yorumlamayı hedeflemiştir.
Sonuç/Bulgular: Toplam doğruluk değerleri incelendiğinde
anlamsız değişken modelde çıkarıldığında lojistik regresyon
ve RF yöntemlerinde doğruluk oranları düşmüştür. RF
yöntemi Platelets,Trombosit (PLT) değişkeni modelde iken
en iyi tahminleri yapmıştır. Bu değişkeni modelden çıkarmak
istemediğimiz durumlarda bize çok verimli sonuçlar verebilmektedir.
KNN yöntemi değişken sayısı azaldığında daha iyi
sonuçlar vermektedir. Özellikle veri boyutu arttığında makine
öğrenmesi yöntemi daha iyi performans ile daha verimli
sonuçlar verdiği gözlemlenmiştir.
Büyük veri Veri Madenciliği Sağlıkta Büyük veri Tahmin Algoritmaları Canine Parvovirüsü (CPV)
Scopa: Nowadays, the interpretation, classification, storage and extraction
of big data in different fields, which are rapidly increasing in regular
and irregular areas, and making them useful again are among the subjects
that are intensively studied. The correct interpretation of big data in
the field of health is of vital importance as it enables fast and accurate
diagnosis. In the project, machine learning methods that can interpret health
data have been applied specifically to Canine parvovirus infection.
While CPV can be diagnosed based on clinical findings, it needs to be
supported by laboratory findings to distinguish it from other infections.
Correct diagnosis is vital to distinguish CPV from other infections with
bloody diarrhoea, which can result in death in puppies. For this reason,
by analysing the virus together with other data that may be affected by
the virus, the methods of making the most accurate decision were compared
and evaluated.
Purpose: In this study, it was aimed to interpret CPV, which is considered
to be one of the most important infectious agents of dogs, popularly
known as mad-head disease, using K-NearestNeighbour (KNN),
RandomForest (RF), Logistic Regression and NaiveBayes classification
algorithms in terms of different parameters. When the total accuracy values
were examined, the accuracy rates decreased in logistic regression
and RF methods when the insignificant variable was removed in the model.
Result: RF method made the best predictions when Platelets, Platelet
(PLT) variable was in the model.In cases where we do not want
to remove this variable from the model, it can give us very efficient results.
KNN method gives better results when the number of variables
decreases. Especially when the data size increases, it has been observed
that the machine learning method gives more efficient results with better
performance.
Primary Language | Turkish |
---|---|
Subjects | Knowledge Representation and Reasoning |
Journal Section | Research Article |
Authors | |
Publication Date | December 31, 2022 |
Published in Issue | Year 2022 Volume: 2 Issue: 3 |