Araştırma Makalesi

Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi

Cilt: 37 Sayı: 1 10 Kasım 2021
PDF İndir
EN TR

Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi

Öz

Her alanda dijitalleşmenin sonucunda veri miktarı gün geçtikçe büyük miktarda artmaktadır. Bu verilerin insan gücüyle anlamlandırılması için yapay zeka, makine öğrenmesi ve derin öğrenme gibi insan davranışlarını taklit eden bilgisayar sistemleri tercih edilmektedir. Makine öğrenmesinin alt dalı olan derin öğrenme yüz tanıma, ses tanıma, nesne tanıma, otomotiv, savunma, sağlık, eğlence ve pazarlama sektörleri gibi çok fazla alanda kullanılmaktadır ve son dönemlerde birçok probleme çözüm niteliği taşımaktadır. Metin tanıma çalışmaları da derin öğrenme alanında ele alınan bir problemdir. Derin öğrenme özellik çıkarımı ve dönüşümü için birçok işlem adımı kullanır. Özelliklerin ve temsillerinin öğrenilmesine dayanan bu yapı, öğrenme işleminde hiyerarşik bir yapı ile ele alınır. Metin görüntüleri üzerinde yazı ve karakter tabanlı yapılan işlemlerde de özelliklerin çıkarımı ve temsili için derin öğrenme algoritmaları başarısı yapılan çalışmalar ile ortaya konulmaktadır. Derin öğrenme mimarilerinden Evrişimli Sinir Ağı, parametrelerin paylaşımı ve boyut azaltması özellikleri ile metin görüntülerinin analiz edilmesinde ileri beslemeli bir ağdan daha iyidir. Tekrarlayan Sinir Ağı mimarisinin zaman serisine bağlı veriler üzerindeki başarısı, metin görüntülerinden karakter tespiti için Evrişimli Sinir Ağı mimarisi ile başarılı sonuçlar ortaya koymaktadır. Sinir ağlarını eğitmek için kullanılan bir kayıp fonksiyonu olan Bağlantıcı Geçici Sınıflandırma, girdi verildiğinde hizalanmış verilere gerek duymadan veri etiketlemek için olasılık oluşturabilmektedir. Böylece, metin görüntüleri üzerinde karakterlerin doğru tespit edilmesini sağlamaktadır. Bu çalışmada, Evrişimli Sinir Ağının görüntü üzerindeki öznitelik tespit başarısı ile bir Tekrarlayan Sinir Ağı mimarisi olan İki Yönlü Uzun-Kısa Süreli Belleğin geçmiş ve gelecek bağlamları göz önüne alarak karakterlerin tespitindeki başarısı, Bağlantıcı Geçici Sınıflandırma ile birleştirilerek Evrişimli Tekrarlayan Sinir Ağı mimarisi oluşturulmuştur. Synth90k veri seti kullanılarak oluşturulan 50.000 görüntü verisinin % 90'ı eğitim, % 10'u test veri seti olarak belirlenmiştir. Evrişimli Tekrarlayan Sinir Ağı kullanılarak tasarlanan ağın karakter tespiti için doğruluk oranı %90 olarak elde edilmiştir. Metin görüntüleri üzerinde başarılı bir şekilde tespit edilen bu karakterin uygun metni ortaya çıkarmadaki başarısı ile mobil tabanlı yönlendirme uygulamasında kullanılması hedeflenmektedir.

Anahtar Kelimeler

Kaynakça

  1. 1. Comlek R., Akbas B., Shen J., Sutchiewcharn N., Wen A. Şeker, B. Diri, H. H. Balık, “Derin Öğrenme Yöntemleri ve Uygulamaları Hakkında Bir İnceleme”, Gazi Mühendislik Bilimleri Dergisi 2017, 3(3): 47-64.
  2. 2. J. Deng, W. Dong, R. Socher, L. Li, Kai Li and Li Fei-Fei, "ImageNet: A large-scale hierarchical image database," 2009 IEEE Conference on Computer Vision and Pattern Recognition, Miami, FL, 2009, pp. 248-255, doi: 10.1109/CVPR.2009.5206848.
  3. 3. E. Grefenstette, P. Blunsom, N. de Freitas, and K. M. Hermann, ―A Deep Architecture for Semantic Parsing, Apr. 2014.
  4. 4. Y. Kim, “Convolutional Neural Networks for Sentence Classification”, Aug. 2014.
  5. 5. A. Graves and N. Jaitly, ―Towards End-To-End bluSpeech Recognition with Recurrent Neural Networks., in ICML, 2014, pp. 1764–1772.
  6. 6. A. Karpathy and L. Fei-Fei, ―Deep VisualSemantic Alignments for Generating Image Descriptions, in CVPR, 2015, pp. 3128–3137.
  7. 7. Salouhou Aoudou, “El Yazısı Karakter Tanıma ve Resim Sınıflandırmada Derin Öğrenme Yaklaşımları”, Fatih Sultan Mehmet Vakıf Üniversitesi, Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, Yayımlanmamış Yüksek Lisans Tezi, 2019.
  8. 8. Hamad K., Kaya M. A Detailed Analysis of Optical Character Recognition Technology. International Journal of Applied Mathematics Electronics and Computers. 2016; (Special Issue-1): 244-249.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

10 Kasım 2021

Gönderilme Tarihi

22 Ocak 2021

Kabul Tarihi

1 Mayıs 2021

Yayımlandığı Sayı

Yıl 2022 Cilt: 37 Sayı: 1

Kaynak Göster

APA
Aydın Atasoy, N., & Somuncu, E. (2021). Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 37(1), 17-28. https://doi.org/10.17341/gazimmfd.866552
AMA
1.Aydın Atasoy N, Somuncu E. Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi. GUMMFD. 2021;37(1):17-28. doi:10.17341/gazimmfd.866552
Chicago
Aydın Atasoy, Nesrin, ve Ebru Somuncu. 2021. “Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37 (1): 17-28. https://doi.org/10.17341/gazimmfd.866552.
EndNote
Aydın Atasoy N, Somuncu E (01 Kasım 2021) Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37 1 17–28.
IEEE
[1]N. Aydın Atasoy ve E. Somuncu, “Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi”, GUMMFD, c. 37, sy 1, ss. 17–28, Kas. 2021, doi: 10.17341/gazimmfd.866552.
ISNAD
Aydın Atasoy, Nesrin - Somuncu, Ebru. “Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 37/1 (01 Kasım 2021): 17-28. https://doi.org/10.17341/gazimmfd.866552.
JAMA
1.Aydın Atasoy N, Somuncu E. Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi. GUMMFD. 2021;37:17–28.
MLA
Aydın Atasoy, Nesrin, ve Ebru Somuncu. “Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 37, sy 1, Kasım 2021, ss. 17-28, doi:10.17341/gazimmfd.866552.
Vancouver
1.Nesrin Aydın Atasoy, Ebru Somuncu. Evrişimli tekrarlayan sinir ağı ile metin görüntüleri üzerinde karakter tanıma uygulaması gerçekleştirilmesi. GUMMFD. 01 Kasım 2021;37(1):17-28. doi:10.17341/gazimmfd.866552

Cited By