Diabetic Retinopathy (DR) is a serious and common complication of diabetes affecting the retinal vessels. As the disease progresses, microaneurysms, hemorrhages, and edema develop in the retinal tissue. If left untreated, it can lead to vision loss and blindness in advanced stages. Therefore, early detection and diagnosis of DR is of great clinical importance. In this study, we evaluated the comparative performance of different Convolutional Neural Network (CCN) and Transformer-based deep learning architectures using retinal images obtained from the Kaggle APTOS 2019 Blindness Detection Competition. The performance of the models is examined in detail in the context of the effects of the applied advanced preprocessing and data augmentation strategies. ESA-based architectures such as ResNet18, EfficientNetB4, VGG16, and DenseNet121, and Transformer-based models such as Swin Transformer were used in the experiments. All models were trained using 5-fold cross-validation, and their performances were compared. The findings revealed that data augmentation techniques significantly increased the accuracy of DR classification. Furthermore, the Swin Transformer model exhibited the highest performance with 85.00% accuracy and 91.37% QWK (Quadratic Weighted Kappa), and Transformer-based models performed better in DR classification compared to traditional ESA-based models.
Convolutional neural networks Data augmentation Deep learning Diabetic retinopathy Image processing Transformer architectures
Scientific Research Projects
Diyabetik Retinopati (DR), diyabet hastalığının retina damarlarını etkileyen ciddi ve yaygın bir komplikasyondur. Hastalığın ilerlemesiyle retina dokusunda mikro anevrizmalar, kanamalar ve ödem gelişmekte; tedavi edilmediği takdirde ileri evrelerde görme kaybı ve körlüğe yol açabilmektedir. Bu nedenle DR’nin erken evrede tespiti ve teşhisi klinik açıdan büyük önem taşımaktadır. Bu çalışmada, Kaggle APTOS 2019 Körlük Tespiti yarışmasından elde edilen retina görüntüleri kullanılarak farklı Evrişimli Sinir Ağı (ESA) ve Transformer (Dönüşüm) tabanlı derin öğrenme mimarilerinin karşılaştırmalı olarak performansı değerlendirilmiştir. Modellerin performansları, uygulanan gelişmiş ön işleme ve veri artırma stratejilerinin etkileri bağlamında detaylı olarak incelenmiştir. Deneylerde ResNet18, EfficientNetB4, VGG16 ve DenseNet121 gibi ESA tabanlı mimariler ile Swin Transformer gibi Transformer tabanlı modeller kullanılmıştır. Tüm modeller, 5-katlı çapraz doğrulama yöntemi ile eğitilmiş ve performansları karşılaştırılmıştır. Elde edilen bulgular, veri artırma tekniklerinin DR sınıflandırma başarısını istatistiksel olarak anlamlı düzeyde artırdığını ortaya koymuştur. Ayrıca, Swin Transformer modeli %85.00 doğruluk ve %91.37 QWK (Quadratic Weighted Kappa) ile en yüksek performansı sergilemiş ve Transformer tabanlı modellerin geleneksel ESA tabanlı modellere kıyasla DR sınıflandırmasında daha iyi performans sergilediğini göstermiştir.
Derin öğrenme Diyabetik retinopati Evrişimli sinir ağları Görüntü işleme Transformer tabanlı mimariler Veri artırma
BAP
| Birincil Dil | Türkçe |
|---|---|
| Konular | Yazılım Mühendisliği (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 19 Ağustos 2024 |
| Kabul Tarihi | 22 Eylül 2025 |
| Yayımlanma Tarihi | 15 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 15 Sayı: 4 |
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.