Çekişmeli üretici ağ ile ölçeklenebilir görüntü oluşturma ve süper çözünürlük
Öz
Çekişmeli eğitimin derin öğrenme konusundaki ileri gelen araştırmacılar tarafından son 10 yılın en heyecan verici konularından biri olarak ilan edilmesi ile birlikte birçok araştırmacı, Üretici Çekişmeli Ağı (GAN) üzerine yoğunlaşmıştır. Bu gelişmeler ile birlikte Otokodlayıcı (AE) olarak daha önceden bilinen modelin varyasyonel versiyonu olan Varyasyonel Otokodlayıcı (VAE) ile birlikte Otokodlayıcı modeller yeniden önem kazanmıştır. GAN modellerinin bazı kısıtlamaları, çıkarım mekanizması gibi bazı eksiklikleri, GAN ve VAE hibrit modellerini ortaya çıkmıştır. Bu gelişmelerin etkisiyle, bu çalışmada da bir GAN ve VAE hibrit modeline odaklanılmıştır. Sentetik görüntüler ile istenen çözünürlükte elde edebilmek üzere, Kompozisyonel Örüntü Üreten Ağlar (CPPN) ile GAN ve VAE modelleri bir arada kullanılmıştır. Bu çalışmada, VAE / GAN olarak adlandırılmış bir hibrit modelinde kullanılan objektif fonksiyonu önerilen model ile bir araya getirilmiştir. Deney çalışmalarında model performansının değerlendirmek üzere VAE / CPGAN olarak adlandırdığımız model, temel modelleriyle (GAN, VAE ve VAE / GAN) karşılaştırılmıştır. Bu amaçla, önerilen modelin el yazısı görüntülerinden oluşan popüler veri kümesi üzerinde gerçekleştirilen eğitim ile gerçekçi ve süper çözünürlüklü ölçeklenebilir sentetik görüntüler oluşturmadaki başarısı gösterilmiştir.
Anahtar Kelimeler
Kaynakça
- Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y., Generative adversarial nets, Advances in neural information processing systems, 2014.
- Goodfellow, I. J., Jonathon S., Christian S., Explaining and harnessing adversarial examples, arXiv preprint arXiv:1412.6572, 2014.
- Gauthier, J., Conditional generative adversarial nets for convolutional face generation, Class Project for Stanford CS231N: Convolutional Neural Networks for Visual Recognition, Winter semester, 2014:5, 2014.
- Radford, A., Metz, L., Chintala. S., Unsupervised representation learning with deep convolutional generative adversarial networks, arXiv preprint arXiv:1511.06434, 2015.
- Reed, S., Akata, Z., Yan, X., Logeswaran, L., Schiele, B., Lee, H., Generative adversarial text to image synthesis. In Proceedings of The 33rd International Conference on Machine Learning, 2016.
- Zhang, H., Xu, T., Li, H., Zhang, S., Wang, X., Huang, X. and Metaxas, D.N., Stackgan: Text to photo-realistic image synthesis with stacked generative adversarial networks, In Proceedings of the IEEE International Conference on Computer Vision, 5907-5915, 2017.
- Yeh, R.A., Chen, C., Yian Lim, T., Schwing, A.G., Hasegawa-Johnson, M. and Do, M.N., Semantic image inpainting with deep generative models, In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 5485-5493, 2017.
- Iizuka, S., Simo-Serra, E. and Ishikawa, H., Globally and locally consistent image completion, ACM Transactions on Graphics (ToG), 36(4), 2017.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
25 Aralık 2019
Gönderilme Tarihi
4 Temmuz 2019
Kabul Tarihi
15 Kasım 2019
Yayımlandığı Sayı
Yıl 2020 Cilt: 35 Sayı: 2
Cited By
Classification of Environmental Sounds With Deep Learning
Advances in Artificial Intelligence Research
https://doi.org/10.54569/aair.1017801Sentinel -2 Uydu Görüntüleri için Evrişimli Otokodlayıcı Sinir Ağı ile Süper Çözünürlük Yaklaşımı
Turkish Journal of Remote Sensing and GIS
https://doi.org/10.48123/rsgis.1254716