K-means clustering is commonly used for data clustering, but it suffers from limitations such as being prone to local optima and slow convergence, particularly when handling large medical files. The literature recommends employing metaheuristic algorithms in clustering studies to address these issues. This study aims to accurately diagnose diseases in four medical datasets (Dermatology, Diabetes, Parkinson's, and Thyroid) and increase the rate of correct diagnosis of diseases. We utilized optimization algorithms to assign weights to input parameters determining diseases in these datasets, thereby improving clustering performance. Our proposed model incorporates the Crow Search Algorithm, Tree Seed Algorithm, and Harris Hawks Optimization algorithms in a hybrid structure with K-means. We conducted statistical evaluations using performance metrics. The results indicate that the Harris Hawks Optimization algorithm achieved the highest accuracy (%97.19) in the Dermatology dataset, followed by the Crow Search Algorithm (%96.29) in the Thyroid dataset, and the Tree Seed Algorithm (%95.32) in the Dermatology dataset. This study offers significant benefits, including reduced staff workload, lower test costs, improved accuracy rates, and faster test results for detecting various diseases in medical datasets.
K-means clustering metaheuristic algorithms disease diagnosis optimization decision support systems
K-Means kümeleme, veri kümeleme için yaygın olarak kullanılan bir yöntemdir. Ancak özellikle büyük tıbbi verilerle çalışırken yerel optimuma takılmak ve yavaş yakınsama gibi sorunlarla karşılaşılabilir. Literatürde bu tür sorunları ele almak için kümeleme çalışmalarında metasezgisel algoritmaların kullanılmasının önerildiği görülmektedir. Bu çalışma, dört farklı tıbbi veri kümesi üzerinde (Dermatoloji, Diyabet, Parkinson ve Tiroid) hastalıkların doğru teşhisini koymayı ve hastalıkların doğru teşhis oranını artırmayı amaçlamaktadır. Bu veri kümelerindeki hastalıkları belirleyen girdi parametrelerine ağırlık atamak için optimizasyon algoritmalarını kullandık ve sonuç olarak kümeleme performansını artırdık. Önerilen modelimiz, Karga Arama Algoritması, Ağaç Tohum Algoritması ve Harris Hawks Optimizasyon algoritmalarını K-Means ile hibrit bir yapıda birleştirmektedir. Performans metrikleri kullanarak istatistiksel değerlendirmeler yaptık. Sonuçlar, Harris Hawks Optimizasyon algoritmasının Dermatoloji veri kümesinde en yüksek doğruluk oranını (%97.19) elde ettiğini göstermektedir. Ayrıca Tiroid veri kümesinde Karga Arama Algoritması (%96.29) ve Dermatoloji veri kümesinde Ağaç Tohum Algoritması (%95.32) ile başarılı teşhisler elde edildi. Bu çalışma, tıbbi veri kümelerinde çeşitli hastalıkları tespit etmek için daha az personel iş yükü, daha düşük test maliyetleri, gelişmiş doğruluk oranları ve daha hızlı test sonuçları gibi önemli faydalar sunmaktadır.
K-means kümeleme metasezgisel algoritmalar hastalık teşhisi optimizasyon karar destek sistemleri
Primary Language | English |
---|---|
Subjects | Computer Software |
Journal Section | Research Articles |
Authors | |
Early Pub Date | March 29, 2024 |
Publication Date | April 30, 2024 |
Submission Date | September 16, 2023 |
Acceptance Date | March 9, 2024 |
Published in Issue | Year 2024 Volume: 10 Issue: 1 |