Cervical cancer is one of the most common types of cancer in women. The way to reduce the number of deaths due to this type of cancer is early diagnosis. Machine learning and data mining techniques are used to assist doctors while early diagnosing the disease. In this study, a new method exploiting correlation-based feature selection (CFS), genetic algorithm (GA) and random forests (RF) techniques is proposed for the diagnosis of cervical cancer. The performance of the proposed method consisting of three stages: data preprocessing, feature selection and classification has been tested using classification accuracy, precision, recall, and F-measure metrics. In the sequel, the performance results are compared with the conventional machine learning techniques and the existing studies in the literature. It can be seen from the experimental results that the proposed method is effective and can be used as an auxiliary tool by doctors in diagnosing cervical cancer early.
Cervical Cancer Diagnosis Correlation-based Feature Selection Genetic Search Random Forests Machine Learning Data Mining
Rahim ağzı kanseri kadınlarda en sık görülen kanser türlerinden biridir. Bu kanser türü nedeniyle gerçekleşecek ölümlerin sayısını azaltmanın yolu erken teşhistir. Hastalığı erken teşhis ederken doktorlara yardımcı olmak için makine öğrenmesi ve veri madenciliği teknikleri kullanılmaktadır. Bu çalışmada rahim ağzı kanseri teşhisi için korelasyon temelli özellik seçimi (correlation-based feature selection-CFS), genetik algoritma (genetic algorithm-GA) ve rastgele ormanlar (random forests-RF) tekniklerinden yararlanan yeni bir yöntem önerilmiştir. Veri önişleme, özellik seçimi ve sınıflandırma olmak üzere üç aşamadan oluşan yöntemin performansı; sınıflandırma doğruluğu, kesinlik, duyarlılık ve F-ölçütü metrikleri kullanılarak test edilmiştir. Ardından performans sonuçları klasik makine öğrenmesi teknikleri ve literatürde var olan çalışmalarla karşılaştırılmıştır. Deneysel sonuçlardan önerilen yöntemin etkili olduğu ve rahim ağzı kanserini erken teşhis etmede doktorlar tarafından yardımcı bir araç olarak kullanılabileceği görülmektedir.
Rahim Ağzı Kanseri Teşhisi Korelasyon Temelli Özellik Seçimi Genetik Arama Rastgele Ormanlar Makine Öğrenmesi Veri Madenciliği
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | August 31, 2020 |
Published in Issue | Year 2020 |