Breast cancer is increasingly common and is reaching an alarming level. If the disease is not diagnosed, it significantly increases the risk of death. When diagnosed at a late stage, the only precaution is often the removal of limbs. An effective method for early diagnosis could be a successful precursor. This paper focuses on evaluating successful machine learning techniques for automatic diagnosis in breast cancer detection. Additionally, the effectiveness of certain features of the original Wisconsin breast cancer dataset is examined to achieve accurate predictions with less computational load. For this purpose, various machine learning algorithms were applied to the dataset, and the best-performing algorithms were identified. To achieve more accurate predictions, preprocessing was applied to the dataset to identify effective features. Based on initial findings, NB, SVM, J48, and k-NN classification algorithms, as well as k-means and hierarchical clustering algorithms, were used in this study. The performance of the algorithms in disease diagnosis was analyzed using metrics such as accuracy, ROC values, and confusion matrices. Performance metrics indicate that the best result was obtained with the NB technique. The metrics of the analyzed models show that the kernel functions used in data evaluation play a significant role in diagnosis. Supervised algorithms applied to the Wisconsin dataset provided reliable results. It is considered that integrating successful algorithms in breast cancer diagnosis as a software tool into analysis devices used in the healthcare system could be a good precursor for early diagnosis and awareness.
automatic diagnosis in breast cancer precursor design machine learning techniques wisconsin dataset
Meme kanseri giderek daha sık görülmekte ve endişe verici bir boyuta ulaştığı ifade edilmektedir. Hastalık teşhis edilmezse ölüm riskini önemli ölçüde artırmaktadır. Son aşamada teşhis edildiğinde, tedbir olarak uzuvların alınması gerekmektedir. Erken teşhis için başarılı bir yöntem öncü olabilir. Bu makalenin odak noktası, meme kanseri teşhisinde başarılı makine öğrenimi tekniklerinin otomatik tanı için değerlendirilmesidir. Ayrıca, orijinal Wisconsin meme kanseri veri setine ait belirli özelliklerin etkinliği kontrol edilerek daha az işlem yükü ile başarılı tahminler araştırılmaktadır. Bu amaçla veri setine çeşitli makine öğrenimi algoritmaları uygulanmış ve en iyi performans gösteren algoritmalar belirlenmiştir. Daha başarılı bir tahmin için veri setine ön işlem uygulanarak etkin özellikler tespit edilmiştir. İlk bulgulardan yola çıkarak bu çalışmada, NB, DVM, J48 ve k-NN sınıflandırma algoritmaları ile k-means ve hiyerarşik kümeleme algoritmaları kullanılmıştır. Algoritmaların hastalık tanısındaki performansları doğruluk, ROC değerleri ve karmaşıklık matrisi metrikleriyle analiz edilmiştir. Performans metrikleri, en iyi sonucun NB tekniği ile elde edildiğini göstermektedir. Analiz edilen modellerin metrikleri, verilerin değerlendirilmesinde kullanılan çekirdek fonksiyonlarının tanıda önemli rol oynadığını göstermektedir. Wisconsin veri setine uygulanan denetimli algoritmalar güvenilir sonuçlar vermiştir. Meme kanseri teşhisinde başarılı olan algoritmaların sağlık sisteminde kullanılan analiz cihazlarına bir yazılım aracı olarak entegre edilmeleri, erken tanı ve farkındalık için iyi bir öncü olabileceği değerlendirilmektedir.
Primary Language | Turkish |
---|---|
Subjects | Decision Support and Group Support Systems, Machine Learning (Other), Data Mining and Knowledge Discovery |
Journal Section | Articles |
Authors | |
Publication Date | January 31, 2025 |
Submission Date | August 14, 2024 |
Acceptance Date | November 5, 2024 |
Published in Issue | Year 2025 Volume: 18 Issue: 1 |