Araştırma Makalesi

TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ

Cilt: 24 Sayı: 48 18 Aralık 2025
PDF İndir
TR EN

TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ

Öz

Dijital medyanın yaygınlaşmasıyla görüntü ve video içeriklerinin analizi önem kazanmıştır. Ancak, Türkçe alt yazı sınıflandırması, dilin yapısal zorlukları ve sınırlı veri kümeleri nedeniyle büyük bir araştırma sorunu oluşturmaktadır. Bu sorunu ele almak için TasvirEt, Flickr30k ve MS COCO veri kümeleri birleştirilerek 114.566 görüntü ve 588.867 Türkçe alt yazı içeren ImCapTR veri kümesi oluşturulmuştur. Önerilen TRimCapS sisteminde, alt yazılar TF-IDF, CountVectorizer ve GloVe ile vektörleştirilmiş, K-Means ve Latent Dirichlet Allocation kullanılarak kategorize edilmiştir. Özellik seçimi bilgi kazancı, ki-kare, Fisher skoru, karşılıklı bilgi ve temel bileşenler analizi yöntemleriyle gerçekleştirilmiştir. Çeşitli makine öğrenimi ve derin öğrenme modelleriyle yapılan sınıflandırma deneylerinde, CountVectorizer ve BERT kombinasyonu %98,84 doğruluk oranı ile en iyi sonucu vermiştir. Bilgi kazancı ve temel bileşenler analizi, diğer yöntemlere göre daha yüksek performans göstermiştir. Bu çalışma, Türkçe alt yazı sınıflandırması konusunda en kapsamlı deney sonuçlarını sunan ve oluşturulan veri kümesini araştırmacıların erişimine açan ilk çalışmadır.

Anahtar Kelimeler

Kaynakça

  1. Akın, A. A., & Akın, M. D. (2007). Zemberek, an open source NLP framework for Turkic languages. Structure, 10(2007), 1–5.
  2. Andrearczyk, V., & Müller, H. (2018). Deep multimodal classification of image types in biomedical journal figures. In Experimental IR Meets Multilinguality, Multimodality, and Interaction: 9th International Conference of the CLEF Association, CLEF 2018 (3-14). Springer.
  3. Anjoletto Ferreira, L., De Rizzo Meneghetti, D., & Santos, P. E. (2020). CAPTION: Correction by analyses, POS-tagging and interpretation of objects using only nouns. arXiv preprint arXiv:2010.00839.
  4. Bharne, S., & Bhaladhare, P. (2024). Enhancing user profile authenticity through automatic image caption generation using a bootstrapping language–image pre-training model. Engineering Proceedings, 59(1), 182.
  5. Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent Dirichlet allocation. Journal of Machine Learning Research, 3(Jan), 993–1022.
  6. Bro, R., & Smilde, A. K. (2014). Principal component analysis. Analytical Methods, 6(9), 2812–2831.
  7. Budak, H. (2018). Özellik seçim yöntemleri ve yeni bir yaklaşım. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 22, 21–31.
  8. Cao, Y., Li, W., Li, J., Yuan, Y., & Hershcovich, D. (2024). Exploring visual culture awareness in GPT-4V: A comprehensive probing. arXiv preprint arXiv:2402.06015.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Derin Öğrenme, Doğal Dil İşleme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

9 Aralık 2025

Yayımlanma Tarihi

18 Aralık 2025

Gönderilme Tarihi

8 Şubat 2025

Kabul Tarihi

11 Temmuz 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 24 Sayı: 48

Kaynak Göster

APA
Pınar, M., Yılmaz, E., Çıplak, Z., & Altınel Girgin, A. B. (2025). TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 24(48), 438-464. https://doi.org/10.55071/ticaretfbd.1635443
AMA
1.Pınar M, Yılmaz E, Çıplak Z, Altınel Girgin AB. TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi. 2025;24(48):438-464. doi:10.55071/ticaretfbd.1635443
Chicago
Pınar, Merve, Esra Yılmaz, Zeki Çıplak, ve Ayşe Berna Altınel Girgin. 2025. “TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ”. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi 24 (48): 438-64. https://doi.org/10.55071/ticaretfbd.1635443.
EndNote
Pınar M, Yılmaz E, Çıplak Z, Altınel Girgin AB (01 Aralık 2025) TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi 24 48 438–464.
IEEE
[1]M. Pınar, E. Yılmaz, Z. Çıplak, ve A. B. Altınel Girgin, “TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ”, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, c. 24, sy 48, ss. 438–464, Ara. 2025, doi: 10.55071/ticaretfbd.1635443.
ISNAD
Pınar, Merve - Yılmaz, Esra - Çıplak, Zeki - Altınel Girgin, Ayşe Berna. “TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ”. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi 24/48 (01 Aralık 2025): 438-464. https://doi.org/10.55071/ticaretfbd.1635443.
JAMA
1.Pınar M, Yılmaz E, Çıplak Z, Altınel Girgin AB. TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi. 2025;24:438–464.
MLA
Pınar, Merve, vd. “TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ”. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, c. 24, sy 48, Aralık 2025, ss. 438-64, doi:10.55071/ticaretfbd.1635443.
Vancouver
1.Merve Pınar, Esra Yılmaz, Zeki Çıplak, Ayşe Berna Altınel Girgin. TRimCapS: MAKİNE ÖĞRENMESİ İLE TÜRKÇE DİLİNDEKİ GÖRÜNTÜ ALT YAZILARINI SINIFLANDIRMA SİSTEMİ. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi. 01 Aralık 2025;24(48):438-64. doi:10.55071/ticaretfbd.1635443