Öz
Günümüz bilgi çağında en güncel makine öğrenme yöntemlerinden birisi veri madenciliğidir. Her geçen gün bilgisayar sistemlerinin kapasitelerinin artıyor olması daha büyük miktarlarda verilerin saklanabilmesine imkân vermektedir. Artan veri miktarlarının etkin bir şekilde kullanılmasının en büyük çözümü veri madenciliğidir. Bu sebeple büyük miktardaki verileri işleyebilen teknikleri kullanabilmek günümüzde büyük önem kazanmaktadır. Veri madenciliği bu gibi durumlarda kullanılan, büyük miktardaki veri setlerinde saklı durumda bulunan örüntü ve eğilimleri keşfetme işlemidir. Veriler tek başına değersiz olabilirler ancak işlenip bilgiye dönüştürüldüğünde anlam kazanmaktadırlar. Bu kapsamda veri madenciliği birçok alanda olduğu gibi tıp alanında da kullanılmaktadır. Bu çalışmada Dünya Sağlık Örgütü'nün verilerine göre en yaygın kanser türlerinden olan akciğer kanseri teşhisinin daha hassas yapılabilmesineyönelik bir çalışma yapılmıştır. Çoğu kanser vakası hastalığın son evrelerinde teşhis edilebilmekte ve tedaviler bu evreden sonra çoğu zaman cevap verememekte ve hasta kayıpları yaşanmaktadır. Bu sebeple, diğer kanser türlerinde olduğu gibi, akciğer kanserinin de erken tanısı hayati önem taşımaktadır. Bu çalışmada, akciğer kanserinin erken tanısına katkıda bulunabilmek amaçlanmıştır. Genel olarak hastalara hastalık belirtileri doğrultusunda akciğer kanseri olup olmadıklarına dair teşhis konulmaktadır. Bu çalışma ile sağlık veritabanında mevcut olan, önceden teşhisi konulmuş vakaların anonim verileri kullanılarak, WEKA veri madenciliği yazılımında hangi algoritmanın bu alanda daha başarılı olabileceğine dair bir çalışma yapılmıştır.