In this study, the performance of different deep learning architectures is comparatively analyzed for the classification of ear pathologies based on otoscopic images. The dataset included four basic classes: chronic otitis media, ear wax obstruction, myringosclerosis and normal ear structure. The images were normalized at 224×224-pixel resolution and made suitable for the model, and classification was performed using CNN, CNN-LSTM, DenseNet121, ResNet50 and EfficientNet architectures. During the training and validation phases, performance metrics such as accuracy, F1 score, precision, recall and loss values were calculated, and the class discrimination power of the models was evaluated with ROC curves and complexity matrices. According to the results, CNN+LSTM and DenseNet121 architectures showed the best performance with over 94% accuracy and high F1 score in both training and validation sets. Some transfer learning-based architectures such as EfficientNet and ResNet50 showed low generalization performance. This study demonstrates the effectiveness of deep learning-based models for computerized diagnosis of intra-ear diseases and provides an important basis for decision support systems to be developed in this field.
Deep Learning Ear Diseases Otoscopic Images Image Classification
Bu çalışmada, otoskopik görüntülere dayalı kulak patolojilerinin sınıflandırılması için farklı derin öğrenme mimarilerinin performansı karşılaştırmalı olarak analiz edilmiştir. Veri kümesi dört temel sınıf içermektedir: kronik otitis media, kulak kiri tıkanıklığı, miringoskleroz ve normal kulak yapısı. Görüntüler 224×224 piksel çözünürlükte normalize edilerek modele uygun hale getirilmiş ve sınıflandırma CNN, CNN-LSTM, DenseNet121, ResNet50 ve EfficientNet mimarileri kullanılarak gerçekleştirilmiştir. Eğitim ve doğrulama aşamalarında doğruluk, F1 skoru, kesinlik, geri çağırma ve kayıp değerleri gibi performans metrikleri hesaplanmış, modellerin sınıf ayırt etme gücü ROC eğrileri ve karmaşıklık matrisleri ile değerlendirilmiştir. Sonuçlara göre, CNN+LSTM ve DenseNet121 mimarileri hem eğitim hem de doğrulama setlerinde %94'ün üzerinde doğruluk ve yüksek F1 skoru ile en iyi performansı göstermiştir. EfficientNet ve ResNet50 gibi bazı transfer öğrenme tabanlı mimariler düşük genelleme performansı göstermiştir. Bu çalışma, kulak içi hastalıkların bilgisayarlı teşhisi için derin öğrenme tabanlı modellerin etkinliğini göstermekte ve bu alanda geliştirilecek karar destek sistemleri için önemli bir temel sağlamaktadır.
Derin Öğrenme Kulak Hastalıkları Otoskopik Görüntüler Görüntü Sınıflandırma
| Birincil Dil | İngilizce |
|---|---|
| Konular | Bilgisayar Yazılımı |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 16 Mayıs 2025 |
| Kabul Tarihi | 14 Haziran 2025 |
| Yayımlanma Tarihi | 30 Haziran 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 9 Sayı: 1 |