The single image super resolution problem has been extensively studied in the literature using various deep learning-based techniques. Super resolution based on deep convolutional networks has become a rapidly growing area of interest with many practical applications. However, the first studies based on deep learning were based on convolutional neural networks and peak signal-to-noise ratio (PSNR) oriented. Thanks to the models developed based on generative adversarial networks (GAN) in recent years, it has been determined as the main objective to increase the visual quality; however, this is not seen when the image quality metrics are examined. In this study, both mean square error and perceptual loss values were used for the network loss used during the training of the network. Also, the combination of three different training datasets was used as a new training dataset. As a result of these factors, both the visual quality has been increased and a significant increase has been achieved in the image quality metric values. In addition, batch normalization layers are not included in the network architecture and the training speed of the deep network architecture is increased by using the skip connection technique. The success performance of the proposed model was compared with the state-of-the-art models in the literature. Here, the peak signal to noise ratio (PSNR) and structural similarity index measure (SSIM) values were calculated and evaluated separately for three different test data sets commonly used in the literature. When the obtained results are evaluated, it is seen that the proposed model is more successful than other models and generates higher quality images. When all the findings are evaluated, it is seen that the proposed model is a more efficient model in terms of both success and training speed compared to state-of-the-art models.
Super resolution Deep learning Image quality metrics New training dataset
Tek görüntü süper çözünürlük problemi, literatürde çeşitli derin öğrenme tabanlı teknikler kullanılarak kapsamlı çalışmalar yapılmıştır. Derin evrişimli ağlar tabanlı süper çözünürlük, çok sayıda pratik uygulama ile beraber hızla büyüyen bir ilgi alanı haline gelmiştir. Bununla birlikte derin öğrenme tabanlı ilk çalışmalar evrişimli sinir ağları tabanlı olup, tepe sinyal gürültü oranı odaklı çalışmalardır. Son yıllardaki çekişmeli üretici ağlar tabanlı geliştirilen modeller sayesinde görsel kaliteyi artırmak esas amaç olarak belirlenmiştir; fakat bu durum görüntü kalite metrikleri incelendiğinde görülmemektedir. Bu çalışmada ise ağın eğitimi sırasında kullanılan ağ kaybı için hem ortalama kare hata hem de algısal kayıp değerlerinden faydalanılmıştır. Ayrıca, üç farklı eğitim veri setinin birleşimi yeni bir eğitim veri seti olarak kullanılmıştır. Bu etmenlerin sonucunda hem görsel kalite artırılmış hem de görüntü kalite metrik değerlerinde ciddi bir artış yakalanmıştır. Ek olarak, yığın normalleştirme katmanları ağ mimarisine dahil edilmemiş ve bağlantı atlama tekniği kullanılarak derin ağ mimarisinin eğitim hızı artırılmıştır. Önerilen modelin başarı performansı literatürde yer alan önemli modeller ile karşılaştırılmıştır. Burada, tepe sinyal gürültü oranı ve yapısal benzerlik indeksi değerleri literatürde yaygın kullanılan üç farklı test veri seti için ayrı ayrı hesaplanmış ve değerlendirilmiştir. Elde edilen sonuçlar değerlendirildiğinde önerilen modelin diğer modellere göre daha başarılı olduğu ve daha kaliteli görüntüler oluşturduğu görülmektedir. Tüm bulgular değerlendirildiğinde önerilen modelin diğer modellere kıyasla hem başarı hem de eğitim hızı bakımından daha verimli bir model olduğu görülmektedir.
Süper çözünürlük Derin öğrenme Görüntü kalite metrikleri Yeni eğitim veri seti
Birincil Dil | Türkçe |
---|---|
Konular | Yapay Zeka |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Erken Görünüm Tarihi | 27 Aralık 2022 |
Yayımlanma Tarihi | 15 Mart 2023 |
Gönderilme Tarihi | 3 Ekim 2022 |
Yayımlandığı Sayı | Yıl 2023 Cilt: 6 Sayı: 1 |
Journal
of Intelligent Systems: Theory and Applications