Araştırma Makalesi

Türkçe dilinde görüntü altyazısı: veritabanı ve model

Cilt: 35 Sayı: 4 21 Temmuz 2020
PDF İndir
TR EN

Türkçe dilinde görüntü altyazısı: veritabanı ve model

Öz

Otomatik görüntü altyazısı, yapay zekânın hem bilgisayarla görme hem de doğal dil işleme alanlarını kapsayan bir konudur. Makine çevirisi alanındaki gelişmelerden ilham alan ve bu alanda başarılı sonuçlar veren kodlayıcı-kod çözücü tekniği, şu anda İngilizce görüntü altyazısı konusunda kullanılan mevcut yöntemlerden biridir. Bu çalışmada, Türkçe dili için otomatik görüntü altyazısı oluşturan bir model sunulmaktadır. Bu çalışma, verilen görüntülerin özelliklerini çıkarmaktan sorumlu olan bir CNN kodlayıcıyı, altyazı oluşturmaktan sorumlu olan bir RNN kod çözücüsü ile birleştirilerek, Türkçe MS COCO veri tabanını üzerinde Türkçe görüntü altyazısı kodlayıcı-kod çözücü modelini test etmektedir. Üretken modelin performansı yeni oluşturulan veri tabanında hem BLEU, METEOR, ROUGE ve CIDEr gibi en yaygın değerlendirme ölçütleri hem de insan tabanlı yöntemler kullanılarak değerlendirilmiştir. Sonuçlar, önerilen modelin performansının hem niteliksel hem de niceliksel olarak tatmin edici olduğunu göstermektedir. Çalışma sonunda hazırlanan, herkesin kullanımına açık bir Web uygulaması uygulaması[1] sayesinde Türkçe dili için MS COCO görüntülerine ait Türkçe girişlerin yapıldığı bir ortam kullanıcıya sunulmuştur. Tüm görüntüler tamamlandığında, Türkçe’ye özgü ve karşılaştırmalı çalışmaların yapıldığı bir veri kümesi tamamlanmış olacaktır.




[1] http://mscococontributor.herokuapp.com/website/



Anahtar Kelimeler

Kaynakça

  1. Yang, Y., Teo, C.L., Daume, H. ve Aloimono, Y., Corpus-Guided Sentence Generation of Natural Images, Conference on Empirical Methods in Natural Language Processing, Edinburgh - United Kingdom, 444–454, July 27 - 31, 2011.
  2. Mitchell, M., Dodge, J., Goyal, A., Yamaguchi, K., Stratos, K., Han, X., Mensch, A., Berg, A. Berg, H. ve Daume, H., Generating Image Descriptions from Computer Vision Detections, 13th Conference of the European Chapter of the Association for Computational Linguistics, Avignon - France, 747–756, April 2012.
  3. Kulkarni, G., Premraj, V., Ordonez, V., Dhar, S., Li, S., Choi, Y., Berg, A.C. ve Berg, T. L., Baby talk: Understanding and Generating Simple Image Descriptions, IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(12), 2891–2903, 2013.
  4. Ushiku, Y., Yamaguchi, M., Mukuta, Y. ve Harada, T., Common Subspace for Model and Similarity: Phrase Learning for Caption Generation from Images, IEEE International Conference on Computer Vision, Washington DC - USA, 2668–2676, December 07-13, 2015.
  5. Ordonez, V., Kulkarni, G. ve Berg, T.L., Im2text: Describing Images Using 1 Million Captioned Photographs, Advances in Neural Information Processing Systems 24, 1143—1151, 2011.
  6. Gupta, A., Verma, Y. ve Jawahar., C.V., Choosing Linguistics over Vision to Describe Images, AAAI Conference on Artificial Intelligence, Toronto - Canada, 606-612, July 22-26, 2012.
  7. Farhadi, A. ve Sadeghi, M. A., Phrasal Recognition, IEEE Transactions on Pattern Analysis and Machine Intelligence 35(12), 2854–2865, 2013.Mason, R. ve Charniak, E., Nonparametric Method for Data-Driven Image Captioning, 52nd Annual Meeting of the Association for Computational Linguistics, Baltimore - Maryland, 592–598, June, 2014.
  8. Kuznetsova, P., Ordonez, V., Berg, T. ve Choi, Y., Tree talk: Composition and Compression of Trees for Image Descriptions, Transaction of Association for Computational Linguistics, 2 (10), 351–362, 2014.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

21 Temmuz 2020

Gönderilme Tarihi

26 Temmuz 2019

Kabul Tarihi

17 Mayıs 2020

Yayımlandığı Sayı

Yıl 2020 Cilt: 35 Sayı: 4

Kaynak Göster

APA
Battini Sonmez, E., Yıldız, T., Yılmaz, B. D., & Demir, A. E. (2020). Türkçe dilinde görüntü altyazısı: veritabanı ve model. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 35(4), 2089-2100. https://doi.org/10.17341/gazimmfd.597089
AMA
1.Battini Sonmez E, Yıldız T, Yılmaz BD, Demir AE. Türkçe dilinde görüntü altyazısı: veritabanı ve model. GUMMFD. 2020;35(4):2089-2100. doi:10.17341/gazimmfd.597089
Chicago
Battini Sonmez, Elena, Tuğba Yıldız, Berk Dursun Yılmaz, ve Ali Emre Demir. 2020. “Türkçe dilinde görüntü altyazısı: veritabanı ve model”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 35 (4): 2089-2100. https://doi.org/10.17341/gazimmfd.597089.
EndNote
Battini Sonmez E, Yıldız T, Yılmaz BD, Demir AE (01 Temmuz 2020) Türkçe dilinde görüntü altyazısı: veritabanı ve model. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 35 4 2089–2100.
IEEE
[1]E. Battini Sonmez, T. Yıldız, B. D. Yılmaz, ve A. E. Demir, “Türkçe dilinde görüntü altyazısı: veritabanı ve model”, GUMMFD, c. 35, sy 4, ss. 2089–2100, Tem. 2020, doi: 10.17341/gazimmfd.597089.
ISNAD
Battini Sonmez, Elena - Yıldız, Tuğba - Yılmaz, Berk Dursun - Demir, Ali Emre. “Türkçe dilinde görüntü altyazısı: veritabanı ve model”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 35/4 (01 Temmuz 2020): 2089-2100. https://doi.org/10.17341/gazimmfd.597089.
JAMA
1.Battini Sonmez E, Yıldız T, Yılmaz BD, Demir AE. Türkçe dilinde görüntü altyazısı: veritabanı ve model. GUMMFD. 2020;35:2089–2100.
MLA
Battini Sonmez, Elena, vd. “Türkçe dilinde görüntü altyazısı: veritabanı ve model”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 35, sy 4, Temmuz 2020, ss. 2089-00, doi:10.17341/gazimmfd.597089.
Vancouver
1.Elena Battini Sonmez, Tuğba Yıldız, Berk Dursun Yılmaz, Ali Emre Demir. Türkçe dilinde görüntü altyazısı: veritabanı ve model. GUMMFD. 01 Temmuz 2020;35(4):2089-100. doi:10.17341/gazimmfd.597089

Cited By