Araştırma Makalesi

Video Altyazılama için Önceden Eğitilmiş 3B-CNN'lerden Yararlanma

Sayı: 53 15 Şubat 2024
PDF İndir
TR EN

Video Altyazılama için Önceden Eğitilmiş 3B-CNN'lerden Yararlanma

Öz

Video altyazılama, hem dilbilgisel hem de anlamsal olarak doğru açıklamalar oluşturmayı amaçlayan bir görsel anlama görevidir. Video altyazılamadaki ana zorluklardan biri, videolardaki karmaşık dinamikleri yakalamaktır. Bu çalışma bu zorluğu aşmak için önceden eğitilmiş 3B Evrişimli Sinir Ağlarını (3D-CNNs) kullanmaktadır. Bu ağlar bu tür dinamikleri modellemede özellikle etkilidir, böylece videoların bağlamsal anlayışını artırır. Önerilen yaklaşım, video altyazılama için yaygın olarak tanınan bir ölçüt olan Microsoft Araştırma Video Açıklama (MSVD) veri seti üzerinde değerlendirildi. Performansı değerlendirmek için BLEU-1’den BLEU-4’e, CIDEr, ROUGE-L, METEOR ve SPICE de dahil olmak üzere standart metrikler kullandık. Sonuçlar, tüm bu metriklerde önemli iyileşmeler göstererek, önceden eğitilmiş 3D-CNN’lerin video altyazılama doğruluğunu artırdığını vurgulamaktadır.

Anahtar Kelimeler

Kaynakça

  1. Akosman, Ş. A., Öktem, M., Moral, Ö. T., & Kılıç, V. (2021). Deep Learning-based Semantic Segmentation for Crack Detection on Marbles. 2021 29th Signal Processing and Communications Applications Conference (SIU),
  2. Amaresh, M., & Chitrakala, S. (2019). Video captioning using deep learning: an overview of methods, datasets and metrics. 2019 International Conference on Communication and Signal Processing (ICCSP),
  3. Anderson, P., Fernando, B., Johnson, M., & Gould, S. (2016). Spice: Semantic propositional image caption evaluation. European Conference on Computer Vision (ECCV),
  4. Aydın, S., Çaylı, Ö., Kılıç, V., & Onan, A. (2022). Sequence-to-sequence video captioning with residual connected gated recurrent units. Avrupa Bilim ve Teknoloji Dergisi(35), 380-386.
  5. Banerjee, S., & Lavie, A. (2005). METEOR: An automatic metric for MT evaluation with improved correlation with human judgments. ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for Machine Translation and/or Summarization,
  6. Baraldi, L., Grana, C., & Cucchiara, R. (2017). Hierarchical boundary-aware neural encoder for video captioning. Conference on Computer Vision and Pattern Recognition (CVPR),
  7. Baran, M., Moral, Ö. T., & Kılıç, V. (2021). Akıllı telefonlar için birleştirme modeli tabanlı görüntü altyazılama. Avrupa Bilim ve Teknoloji Dergisi(26), 191-196.
  8. Chen, D., & Dolan, W. B. (2011). Collecting highly parallel data for paraphrase evaluation. Proceedings of the 49th annual meeting of the association for computational linguistics: human language technologies,

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Görüşü , Örüntü Tanıma , Video İşleme , Doğal Dil İşleme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

6 Şubat 2024

Yayımlanma Tarihi

15 Şubat 2024

Gönderilme Tarihi

6 Ekim 2023

Kabul Tarihi

19 Kasım 2023

Yayımlandığı Sayı

Yıl 2024 Sayı: 53

Kaynak Göster

APA
Fetiler, B., Çaylı, Ö., & Kılıç, V. (2024). Video Altyazılama için Önceden Eğitilmiş 3B-CNN’lerden Yararlanma. Avrupa Bilim ve Teknoloji Dergisi, 53, 58-63. https://izlik.org/JA63GK83AG