EN
TR
DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım
Öz
Işığın değişkenliği, arka plan karmaşası, şiddetli bulanıklık, tutarsız çözünürlük ve farklı ölçekli derinlik gibi birçok faktörden dolayı doğal görüntülerde karakter tanıma oldukça zor problemdir. Bu özelliklerin yanı sıra sokak görünüm fotoğraflarında doğa olaylarının da etkisiyle karakterlerde ve sayılarda bozulmalara rastlanır. Sokak görünümlerinden kapı numaralarını tespit etmek ve okumak, doğal sahne metni tanıma kategorisine giren bir bilgisayar görme problemidir. Evrişimsel sinir ağı (convolutional neural network - CNN) modeli görüntü analizlerinde en sık kullanılan derin öğrenme (deep learning - DL) yöntemlerinden biridir. Bu çalışmada, ilk olarak doğal görüntülerinde kapı numarası bulunan görüntülerden karakter okumak için CNN temelli DL yöntemi uygulanmıştır. Ancak, özellikle görüntüde birden fazla kapı numarasının olduğu veya derinliklerin çok değişken olduğu durumlarda yeterince başarılı sonuçlar elde edilememiştir. DL yönteminin doğruluğunu artırmak aynı zamanda doğal görüntülerin oluşturduğu veri boyutunu azaltmak için farklı iki adet CNN modeli kullanan yeni bir yaklaşım DDL (deep in deep learning) önerilmiştir. Önerilen DDL yaklaşımının performansı, Kayseri Büyükşehir Belediyesi (KBB) Yeşilhisar ilçesinin 2019 yılına ait GPS konum bilgisiyle fotoğrafı çekilen 35 adet mahallenin bina sokak görüntülerinden oluşan 113 GB (gigabayt) boyuta sahip 17.618 adet görüntü içeren gerçek veriler kullanılarak, DL yaklaşımının performansıyla karşılaştırılmıştır. Deneysel sonuçlar, önerilen DDL yaklaşımının DL yaklaşımına göre daha doğru sonuçlar ürettiğini ve daha az depolama alanı kullandığını göstermektedir.
Anahtar Kelimeler
Teşekkür
Kayseri Büyükşehir Belediyesi'ne Yeşilhisar ilçesinin 2019 yılına ait koordinatlı ve içerisinde kapı numarası içeren görüntüleri paylaştığı için teşekkür ederiz.
Kaynakça
- Batuk, F., Öztürk, D., Emem, O., Türkiye Ulusal Konumsal Veri Altyapısı İçin Temel Veriler. Jeodezi ve Jeoinformasyon Dergisi, (96), 3-12, 2007.
- Goodfellow, I. J., Bulatov, Y., Ibarz, J., Arnoud, S., Shet, V., Multi-digit number recognition from street view imagery using deep convolutional neural networks, arXiv preprint arXiv:1312.6082, 2013.
- Türk, T., Adres Kayıt Sistemi ile Kent Bilgi Sistemlerinin Bütünleştirilmesi, Jeodezi ve Jeoinformasyon Dergisi, (99), 13-22, 2008.
- Anguelov, D., Dulong, C., Filip, D., Frueh, C., Lafon, S., Lyon, R., ... Weaver, J., Google street view: Capturing the world at street level, Computer, 43(6), 32-38, 2010.
- Bayram, F., Derin öğrenme tabanlı otomatik plaka tanıma, Politeknik Dergisi, 23(4), 955-960, 2020.
- Zuo, L. Q., Sun, H. M., Mao, Q. C., Qi, R., Jia, R. S., Natural scene text recognition based on encoder-decoder framework, IEEE Access, 7, 62616-62623, 2019.
- Aktaş, A., Doğan, B., Demi̇r, Ö., Derin öğrenme yöntemleri ile dokunsal parke yüzeyi tespiti, Journal of the Faculty of Engineering and Architecture of Gazi University, 35 (3), 1685-1700, 2020.
- Perez, L., Wang, J., The effectiveness of data augmentation in image classification using deep learning, arXiv preprint arXiv:1712.04621, 2017.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
28 Şubat 2022
Gönderilme Tarihi
2 Nisan 2021
Kabul Tarihi
21 Ağustos 2021
Yayımlandığı Sayı
Yıl 2022 Cilt: 37 Sayı: 2
APA
Taşyürek, M., & Öztürk, C. (2022). DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 37(2), 843-856. https://doi.org/10.17341/gazimmfd.908332
AMA
1.Taşyürek M, Öztürk C. DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım. GUMMFD. 2022;37(2):843-856. doi:10.17341/gazimmfd.908332
Chicago
Taşyürek, Murat, ve Celal Öztürk. 2022. “DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37 (2): 843-56. https://doi.org/10.17341/gazimmfd.908332.
EndNote
Taşyürek M, Öztürk C (01 Şubat 2022) DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37 2 843–856.
IEEE
[1]M. Taşyürek ve C. Öztürk, “DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım”, GUMMFD, c. 37, sy 2, ss. 843–856, Şub. 2022, doi: 10.17341/gazimmfd.908332.
ISNAD
Taşyürek, Murat - Öztürk, Celal. “DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37/2 (01 Şubat 2022): 843-856. https://doi.org/10.17341/gazimmfd.908332.
JAMA
1.Taşyürek M, Öztürk C. DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım. GUMMFD. 2022;37:843–856.
MLA
Taşyürek, Murat, ve Celal Öztürk. “DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 37, sy 2, Şubat 2022, ss. 843-56, doi:10.17341/gazimmfd.908332.
Vancouver
1.Murat Taşyürek, Celal Öztürk. DDL: Çoklu kapı numarası tespit etme ve kümeleme için derin öğrenme tabanlı yeni bir yaklaşım. GUMMFD. 01 Şubat 2022;37(2):843-56. doi:10.17341/gazimmfd.908332
Cited By
RT-Droid: a novel approach for real-time android application analysis with transfer learning-based CNN models
Journal of Real-Time Image Processing
https://doi.org/10.1007/s11554-023-01311-wDSHFS: a new hybrid approach that detects structures with their spatial location from large volume satellite images using CNN, GeoServer and TileCache
Neural Computing and Applications
https://doi.org/10.1007/s00521-023-09092-w