Yıl 2011, Cilt 2 , Sayı 5, Sayfalar 1 - 7 2011-09-01

Tıp ve Sağlık Hizmetlerinde Veri Madenciliği Çalışmaları: Kanser Teşhisine Yönelik Bir Ön Çalışma
Data Mining Studies in Medical and Healthcare: A Preliminary Study for Cancer Diagnosis

Sabri Serkan GÜLLÜOĞLU [1]


Bilgiye sahip olmanın ve onu kullanmanın önemli olduğu günümüzde güçler dengesi bilgi üzerine yoğunlaşmaktadır. Çeşitli kaynaklardan ve yöntemlerle toplanan bilgilerin belirli bir disiplin ve sistem dâhilinde analiz edilmesi sonucunda ortaya çıkan sonuçlar, ekonomik, siyasi ve teknolojik alanlarda kullanılmaktadır. Bilgiyi zamanında ve doğru olarak kullananlar istedikleri sonuca kestirmeden ve süratli bir biçimde ulaşmaktadırlar. Veri madenciliği ile eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilgi çıkarılabilir. Veri madenciliği kendi başına bir çözüm değil çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli bilgileri sağlamaya yarayan bir araçtır. Bilgi kaynağının yanı sıra, bilginin doğruluğu da önemli bir sorundur. Bir bilginin veya daha somut ifadeyle mesela bir rakamın doğru olup olmadığı nasıl anlaşılmaktadır? Bilginin doğruluğu konusunda iki kriter vardır. Aynı sonucu işaret eden verilerin yoğun olması bilginin doğru olduğu yönündeki ilk kriterdir. Bir değer ne kadar yoğunsa o kadar inandırıcı olmaktadır. Ne kadar güçlü bir ilişki olduğu tespit edilirse, o kadar doğruluğuna hükmedilebilir. Hangi miktarda verinin toplanması gerektiği ayrı bir sorundur. Veri miktarı, kullanılan metoda bakılmaksızın çalışmanın amacına göre belirlenmektedir. Gün geçtikçe çoğalan veri yığınlarından anlamlı ve faydalı bilgiye ulaşabilmek için “veri madenciliği” başlığı altında yöntemler geliştirilmeye başlanmıştır. Tanımlanan problem için en uygun modelin bulunabilmesi, olabildiğince çok sayıda modelin kurularak denenmesi ile mümkündür. Bu nedenle veri hazırlama ve model kurma aşamaları, en iyi olduğu düşünülen modele varılıncaya kadar yinelenen bir süreçtir. Çalışmanın amacı Tıp alanında uygulanması düşünülen veri madenciliğe çalışmalarına örnek teşkil etmesi açısından bir plan çıkarmaktır. Bu hususta bakıldığında çalışmanın amacı geliştirilecek yöntembilim ile saklı olan ve bilinmeyen bilgilere ulaşmaktır. Bunun için farklı tipteki veriler sınıflandırılacak, eğitilecek yeni veriler test edilecek ve yordama yapılacaktır. Böylece kaynaktan hedefe giden süreçte hedef karar vermede etkilenecektir. Bu şekilde çıkarılmak istenen bilgiye ulaşılmış olacaktır.
Bilgiye sahip olmanın ve onu kullanmanın önemli olduğu günümüzde güçler dengesi bilgi üzerine yoğunlaşmaktadır. Çeşitli kaynaklardan ve yöntemlerle toplanan bilgilerin belirli bir disiplin ve sistem dâhilinde analiz edilmesi sonucunda ortaya çıkan sonuçlar, ekonomik, siyasi ve teknolojik alanlarda kullanılmaktadır. Bilgiyi zamanında ve doğru olarak kullananlar istedikleri sonuca kestirmeden ve süratli bir biçimde ulaşmaktadırlar. Veri madenciliği ile eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilgi çıkarılabilir. Veri madenciliği kendi başına bir çözüm değil çözüme ulaşmak için verilecek karar sürecini destekleyen, problemi çözmek için gerekli bilgileri sağlamaya yarayan bir araçtır. Bilgi kaynağının yanı sıra, bilginin doğruluğu da önemli bir sorundur. Bir bilginin veya daha somut ifadeyle mesela bir rakamın doğru olup olmadığı nasıl anlaşılmaktadır? Bilginin doğruluğu konusunda iki kriter vardır. Aynı sonucu işaret eden verilerin yoğun olması bilginin doğru olduğu yönündeki ilk kriterdir. Bir değer ne kadar yoğunsa o kadar inandırıcı olmaktadır. Ne kadar güçlü bir ilişki olduğu tespit edilirse, o kadar doğruluğuna hükmedilebilir. Hangi miktarda verinin toplanması gerektiği ayrı bir sorundur. Veri miktarı, kullanılan metoda bakılmaksızın çalışmanın amacına göre belirlenmektedir. Gün geçtikçe çoğalan veri yığınlarından anlamlı ve faydalı bilgiye ulaşabilmek için “veri madenciliği” başlığı altında yöntemler geliştirilmeye başlanmıştır. Tanımlanan problem için en uygun modelin bulunabilmesi, olabildiğince çok sayıda modelin kurularak denenmesi ile mümkündür. Bu nedenle veri hazırlama ve model kurma aşamaları, en iyi olduğu düşünülen modele varılıncaya kadar yinelenen bir süreçtir. Çalışmanın amacı Tıp alanında uygulanması düşünülen veri madenciliğe çalışmalarına örnek teşkil etmesi açısından bir plan çıkarmaktır. Bu hususta bakıldığında çalışmanın amacı geliştirilecek yöntembilim ile saklı olan ve bilinmeyen bilgilere ulaşmaktır. Bunun için farklı tipteki veriler sınıflandırılacak, eğitilecek yeni veriler test edilecek ve yordama yapılacaktır. Böylece kaynaktan hedefe giden süreçte hedef karar vermede etkilenecektir. Bu şekilde çıkarılmak istenen bilgiye ulaşılmış olacaktır.
  • [1] Cabena P., Hadjinia P. n, Stadler R., Verhees J., Zanasi A.,(1997) “Discovering Data Mining: From Concept To Implemantation”, Prentice Hall PTR, Upper Saddle River, New Jersey, 195, USA.
  • [2] Carino., C., Jia., Y., Lambert., B., West., P., Yu., C., (2005)“Mining Officially Unrecognized Side Effects of Drugs by Combining Web Search and Machine Learning”, CIKM’05, Bremen, Germany.
  • [3] Chen., Y., ve Wu., S., (2003)“Exploring Out-Patient Behaviors in Claim Database: A Case Study Using Association Rules”, AMIA Symposium Proceedings.
  • [4]Nagadevara., V., (2006)“Application of Neural Prediction Models in Healthcare”.
  • [5] Obenshain K. M.,(2004) “Application of Data Mining Techniques To Healthcare”, Data Infect Control Hosp Epidemiol, 25, 690–695, DOI: 10.1086/502460.
  • [6] Prather J. C., Lobach D. F., Goodwin L. K., Hales J. W., Hage M. L., Hammond W. E., (1997).“Medical Data Mining: Knowledge Discovery In A Clinical Data Warehouse”, Proc AMIA Annu Fall Symp. 101–105.
  • [7] Rebholz-Schuhmann,D. , Kirsch,H. ,Arregui,M. , Gaudan,S. , Riethoven,M. ,Stoehr,P. (2007). EBIMed--text crunching to gather facts for proteins from Medline, Bioinformatics 23 (2):e237-44
  • [8] Zhong N.. – Zhou L., (1999). “Methodologies for Knowledge Discovery and Data Mining” : Third Pacific-Asia Conference, Pakdd-99, Beijing, China, Proceedings
Birincil Dil tr
Konular Fen
Bölüm Research Article
Yazarlar

Yazar: Sabri Serkan GÜLLÜOĞLU
Kurum: İstanbul Arel Üniversitesi, Mühendislik Mimarlık Fakültesi

Tarihler

Başvuru Tarihi : 1 Eylül 2011
Kabul Tarihi : 24 Haziran 2021
Yayımlanma Tarihi : 1 Eylül 2011

APA Güllüoğlu, S . (2011). Tıp ve Sağlık Hizmetlerinde Veri Madenciliği Çalışmaları: Kanser Teşhisine Yönelik Bir Ön Çalışma . AJIT-e: Bilişim Teknolojileri Online Dergisi , 2 (5) , 1-7 . DOI: 10.5824/1309-1581.2011.4.005.x