Nörolojik bir bozukluk olan Parkinson hastalığı (PH), hastaların ve bakımlarından sorumlu kişilerin hayatlarını olumsuz olarak etkilemektedir. Kişinin klinik özelliklerinin incelenmesi ile erken tanısı oldukça zor olan PH, konuşma ses kayıtları kullanılarak teşhis edilebilmektedir. Fakat ses kayıtlarının makine öğrenmesi teknikleri aracılığı ile değerlendirilmesinden elde edilen modellerin tutarsız performans sonuçları, bu modellerin hekimlerin teşhis koymasında yardımcı olarak kullanılabilirliğini sınırlamaktadır. Yapılan çalışmada 23’ü Parkinson hastası olan toplam 31 kişiden elde edilen ve 195 ses verisinden oluşan bir veri tabanı kullanılmıştır. Veri tabanındaki her bir konuşma sesinden elde edilen 22 adet öznitelik ile bu seslerin makine öğrenmesi aracılığıyla hasta ve sağlıklı olarak sınıflandırılması gerçekleştirilmiştir. Bu sınıflandırma işleminde eğitim ve test aşamasında kullanılacak verilerin rastgele olarak sırası ile 90/10, 80/20, 70/30, 50/50 ve 30/70 olmak üzere farklı oranlarda bölünmesi sağlamıştır. Ayrıca her bir ayırma oranı, eğitim aşamasında 10 katmanlı çapraz doğrulama, 5 katmanlı çapraz doğrulama, ayırarak doğrulama ve yeniden ikame doğrulaması yöntemleri kullanılarak değerlendirilmiştir. Bununla beraber kuadratik diskriminant, destek vektör makineleri, toplu torbalı ağaç, k-en yakın komşuluk ve sinir ağları sınıflandırıcıları kullanılarak sınıflandırma işlemi gerçekleştirilmiştir. Veri ayırmadaki rastgeleliğin ve tutarlı sonuçların elde edilmesi için tüm işlemler 10 defa tekrar edilmiştir. Yöntemlerin başarımlarının karşılaştırılmasında doğruluk, duyarlılık, özgüllük, kesinlik ve F1 skoru metrikleri aracılığı ile sonuçların ortalama ve standart sapma değerleri hesaplanmıştır. Sonuç olarak 80/20 ayırma oranı ve 10 katmanlı çapraz doğrulama kullanan k-en yakın komşuluk sınıflandırıcısına ait %95.64±3.21 test doğruluğu değeri, karşılaştırılan yöntemler içerisinde en başarılı yöntem olarak tespit edilmiştir. Dolayısıyla sadece sınıflandırıcılara ait mevcut parametrelerin etkileri analiz edilerek çok daha başarılı sonuçların elde edilebileceği görülmüştür.
çapraz doğrulama makine öğrenmesi sınıflandırma tekrarlı eğitim/test ayrımı
Parkinson’s disease (PD), a neurological disorder, negatively affects the lives of patients and their caregivers. PD, which is very difficult to diagnose early by examining the clinical characteristics of the person, can be diagnosed using voice recordings. However, the inconsistent performance results of the models obtained from the evaluation of voice recordings through machine learning techniques limit the usability of these models to aid in diagnosing physicians. This study used a database of 195 voice data obtained from 31 individuals, 23 of whom have PD. The classification of the voices as healthy or patient was based on the 22 features in the database. The split ratios 90/10, 80/20, 70/30, 50/50 and 30/70 were used to select the training and test phase data, respectively. In addition, each split ratio was evaluated using 10-fold cross-validation, 5-fold cross-validation, holdout validation and resubstitution validation methods in the training phase, which is the initial process that will directly affect the other classification procedures. In addition, the classification process was performed using quadratic discriminant analysis, support vector machine, ensemble bagged tree, k-nearest neighbours and neural network classifiers. All procedures were repeated 10 times to ensure consistency of results and randomisation of split ratios. As a result, the k-nearest neighbours classifier with 80/20 splitting ratio and 10-fold cross-validation was determined to be the most successful among the compared methods with 95.64±3.21% accuracy. Therefore, it can be seen that much more successful results can be obtained by analysing only the effects of the existing parameters of the classifiers.
Classification cross-validation machine learning repeated train/test splitting
Birincil Dil | İngilizce |
---|---|
Konular | Biyomedikal Tanı, Biyomekanik Mühendisliği |
Bölüm | Research Article |
Yazarlar | |
Yayımlanma Tarihi | 23 Temmuz 2024 |
Gönderilme Tarihi | 15 Mayıs 2024 |
Kabul Tarihi | 31 Mayıs 2024 |
Yayımlandığı Sayı | Yıl 2024 Cilt: 14 Sayı: 2 |