Araştırma Makalesi

Veri Madenciliği İle Kalp Hastalığı Teşhisi

1 Nisan 2020
PDF İndir
EN TR

Veri Madenciliği İle Kalp Hastalığı Teşhisi

Öz

Gelişen ve değişen çevre koşulları, sınırların kalkması ile küreselleşen dünya, farklı pazarlama ve ar-ge (araştırma geliştirme) yöntemleri “veri”nin değil “bilgi”nin önemini her geçen gün daha da artacak şekilde ortaya koymaktadır. İnternetin yaygınlaşması ve kolaylaşması ar-ge ekiplerinin “bilgi”ye erişmelerini zorlaştırmaktadır. İnternette arama motorları kullanılarak yapılan araştırmalar çoğu zaman istenilenden farklı bir şekilde sonuçlanmaktadır. Büyük bir perakendecinin, fatura bilgilerinden müşteri eğilimlerini belirleyip ona göre pazarlama taktikleri üretebilmesi, rakiplerinin önüne geçmesini sağlayacaktır. Verilen örneklere dikkat edilirse, “veri”nin “bilgi”ye dönüşme işleminin vurgulandığı görülecektir. Veri madenciliği, büyük ölçekli veriler arasından bilgiye ulaşma, bilgiyi madenleme işidir. Ya da bir anlamda büyük veri yığınları içerisinden gelecek ile ilgili tahminde bulunabilmemizi sağlayabilecek bağıntıların bilgisayar programı kullanarak aranmasıdır. Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır. Veri madenciliği sürecinin çeşitli aşamalarında; istatistiksel yöntemler, bellek tabanlı yöntemler, genetik algoritmalar, yapay sinir ağları ve karar ağaçları gibi algoritmalar kullanılabilmektedir. Kalp hastalıkları (kardiyovasküler hastalıklar) bugün dünyanın en yaygın hastalıklarından biridir. Küresel ölçekte kardiyovasküler hastalıkların uzun süre bir numaralı ölüm nedeni olmaya devam edeceği tahmin edilmektedir. Gelişmiş batı ülkelerindeki kardiyovasküler hastalık ölümleri gelişmekte olan ülkelere göre azalma eğilimi göstermektedir. Dünyadaki ölüm oranlarındaki pozitif faktör, kardiyovasküler hastalıklar açısından büyük ölçüde önlenebilir olmalarıdır. Bu nedenle, kalp hastalığı tanısı alan hastaların verilerine dayanarak, metin madenciliği ve algoritmalar kullanılarak kalp-öncesi hastalığı tahmin etmek için çalışma yapılmıştır. Bu çalışma veri madenciliğinin büyük veri setlerinin incelenmesi üzerinde ne kadar büyük bir öneme ve yere sahip olduğunu göstermek için yapılmıştır. Yüzlerce bilginin bulunduğu kalp veri setinden, WEKA programı kullanılarak, çeşitli algoritmalar uygulayarak kişilere kalp hastalığı teşhisi koyma çalışması yapılmıştır. Kalp hastalığının kesin tanısı ve hastalık şiddetinin saptanması için çeşitli uygulamalar ve yöntemler vardır. Bu çalışmada, daha ucuz ve daha etkili bir yaklaşım sağlayabilecek veri madenciliğinin kullanımı incelenmiştir. Bu çalışmada sınıflandırma yöntemleri ve doğru sınıflandırma oranları ile elde edilen sonuçlar karşılaştırılmıştır. Gerekli hesaplamaları ve modelleri elde etmek için ZeroR, OneR, Naive Bayes, J48 Karar Ağacı, Rastgele Orman, Çoklu Algılayıcılar, k-en yakın komşu (k-Nearest Neighbour - k-NN), Lojistik Regresyon, destek vektör makinesi (Support Vector Machine - SVM) gibi sınıflandırma algoritmaları, Weka programında uygulanmıştır. Uygulamanın sonucu olarak kalp hastalığı teşhisinde en iyi sonuçu veren algoritma tespit edilmeye çalışılmıştır. Veri madenciliği algoritmaları ile kalp hastalığını belirleyen birçok farklı çalışma vardır. Ancak yaptığımız incelemelerde, veri setine 9 farklı algoritma uygulayan bir çalışmaya rastlanmamıştır ve bu çerçevede bu çalışma ilk kez bu kadar çok algoritmanın kullanıldığı çalışma olacaktır.

Anahtar Kelimeler

Kaynakça

  1. W.J. Frawley, G. Piatetsky-Shapiro, Knowledge Discovery in Databases: An Overview. The AAAI/MIT Press, 1996.
  2. D. Wood, G. De Backer, O. Faergeman, I. Graham, G. Mancia, K. Pyörälä, Prevention of coronary heart disease in clinical practice: recommendations of the Second Joint Task Force of European and other Societies on Coronary Prevention. Atherosclerosis, 140 (1998) 199– 270.
  3. J. Soni, U. Ansari, D. Sharma, S. Soni, Predictive Data Mining for Medical Diagnosis: An Overview of Heart Disease Prediction, International Journal of Computer Applications, 17 (2011) 43-48.
  4. C.S. Dangare, S.S. Apte, Improved Study of Heart Disease Prediction System using Data Mining Classification Techniques, International Journal of Computer Applications, 47 (2012) 44-48.
  5. R. Alizadehsani, J. Habibi, M.J. Hosseini, H. Mashayekhi, R. Boghrati, A. Ghandeharioun, B. Bahadorian, Z.A. Sani, A data mining approach for diagnosis of coronary artery disease, computer methods and programsin biomedicine, 111 (2013) 52-61.
  6. A. Rajkumar, G.S. Reena, Diagnosis Of Heart Disease Using Datamining Algorithm, 10 (2010) 38-43.
  7. J. Nahar, T. Imam, K. S. Tickle, Y.P. Chen, Computational intelligence for heart disease diagnosis: A medical knowledge driven approach, Expert Systems with Applications, 40 (2013) 96-104.
  8. Y. Xing, J. Wang, Z. Zhao, Y. Gao, Combination data mining methods with new medical data to predicting outcome of Coronary Heart Disease, International Conference on Convergence Information Technology, 2007.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

1 Nisan 2020

Gönderilme Tarihi

15 Mart 2020

Kabul Tarihi

27 Mart 2020

Yayımlandığı Sayı

Yıl 2020

Kaynak Göster

APA
Taşçı, M. E., & Şamlı, R. (2020). Veri Madenciliği İle Kalp Hastalığı Teşhisi. Avrupa Bilim ve Teknoloji Dergisi, 88-95. https://doi.org/10.31590/ejosat.araconf12

Cited By