Araştırma Makalesi

Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme

Cilt: 39 Sayı: 1 21 Ağustos 2023
PDF İndir
TR

Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme

Öz

Günümüzde, büyük veri içinden istenilen bilgiyi kapsayan doğru içeriklere kısa sürede ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait başlıkların bu ihtiyacı karşılamada olumlu bir etkisi bulunmaktadır. Ancak yanıltıcı başlıklar olması durumunda bu bir dezavantaja dönüşebilmektedir. Bu çalışmada, güncel doğal dil işleme ve derin öğrenme teknolojilerini kullanarak Türkçe metinleri en iyi özetler biçimde ve daha yönlendirici Türkçe başlıkların üretilmesi amaçlanmaktadır. Çalışmada yaklaşık 52.000 Türkçe haber metni ve başlığını içeren bir derlem kullanılmıştır. Derlemdeki haber metinleri ve başlıkları modelin doğru eğitilebilmesi için bazı ön işlemlerden geçirilmiştir. Daha insansı ve özgün sonuçlar elde etmek amacıyla genel ve soyut özetleme teknikleri çözüm yöntemleri olarak tercih edilmiştir. Eğitim modeli olarak, 2017 yılında yayınlanan ve doğal dil işleme alanında en son teknoloji olarak kabul edilen transformatör mimarisi tabanlı kodlayıcı-kod çözücü derin öğrenme mimarisi kullanılmıştır. Bu model, derin öğrenme kütüphanelerinden TensorFlow ve Keras kullanılarak geliştirilmiştir. Derin öğrenme çalışmalarında yüksek sistem gereksinimlerini karşılayan Google Colab aracılığı ile 20 ve 25 dönem eğitilerek sonuç üretilmiştir. Eğitim süresi toplam 3.5 saat gibi kısa bir sürede tamamlanmıştır. Eğitilen model, 20 ve 25 eğitim dönemi sonunda sırayla 75% ve 85% oranında eğitim başarımı elde etmiştir. Eğitimde kullanılan veri kümesinin tamamı, eğitilen model ile tekrar üretilmiştir. Bu deneyde başarı ölçütleri olarak, genellikle özetleme görevlerinde tercih edilen ROUGE-1 metriği, BLEU ve ikisinin harmonik ortalaması olan F1 skoru tercih edilmiştir. ROUGE-1, BLEU ve F1 skoru, 20 eğitim dönemi sonunda sırayla %59, %54 ve %55 iken, 25 eğitim dönemi sonunda sırayla %77, %70 ve %73 olarak ölçülmüştür. Transformatör mimarisinin başlık üretme probleminde kullanımının, bu alandaki mevcut çalışmalarda kullanılan derlemlere kıyasla daha az eğitim içeriğiyle çözüm üretebildiği ve diğer derin öğrenme mimarileri ile yapılan çalışmalara göre dilbilgisel ve anlamsal olarak daha başarılı sonuçlar elde edildiği gözlemlenmiştir.

Anahtar Kelimeler

Kaynakça

  1. Edmunson, H. P., New Methods in Automatic Extracting, In J. ACM, Volume 16 (2), 264-285, 1969.
  2. Luhn, H.P., The Automatic Creation of Literature Abstracts, In IBM J. Res. Dev., Volume 2 (2), 159-165, 1958.
  3. Erkan, G., Radev, D.R., LexRank: Graph-based Lexical Centrality as Salience in Text Summarization, In Journal Of Artificial Intelligence Research (JAIR), Volume 22, 457-479, 2004.
  4. Lopyrev, K., Generating News Headlines with Recurrent Neural Networks, arXiv preprint arXiv:1512.01712, 2015.
  5. Takase, S., Suzuki, J., Okazaki, N., Hirao, T., Nagata, M., Neural Headline Generation on Abstract Meaning Representation, In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing (EMNLP), Austin-Texas-A.B.D, 1054–1059, 1-5 Kasım, 2016.
  6. Tan, J., Wan, X., Xiao, J., From Neural Sentence Summarization to Headline Generation: A Coarse-to-Fine Approach, In Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence (IJCAI), Melbourne-Avustralya, 4109-4115, 19-25 Ağustos, 2017.
  7. Murao, K., Kobayashi, K., Kobayashi, H., Yatsuka, T., Masuyama, T., Higurashi, T., Tabuchi, Y., A Case Study on Neural Headline Generation for Editing Support, In Proceedings of the 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT), Volume 2, Minneapolis-Minnesota-A.B.D, 73-82, 2-7 Haziran, 2019.
  8. Gu, X., Mao, Y., Han, J., Liu, J., Yu, H., Wu, Y., Yu, C., Finnie, D., Zhai, J. & Zukoski, N., Generating Representative Headlines for News Stories, In Proceedings of the The Web Conference 2020 (WWW ‘20), Taipei-Tayvan, 1773-1784, 20-24 Nisan, 2000.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

11 Ağustos 2023

Yayımlanma Tarihi

21 Ağustos 2023

Gönderilme Tarihi

6 Temmuz 2021

Kabul Tarihi

16 Mart 2023

Yayımlandığı Sayı

Yıl 2024 Cilt: 39 Sayı: 1

Kaynak Göster

APA
Karaca, A., & Aydın, Ö. (2023). Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 39(1), 485-496. https://doi.org/10.17341/gazimmfd.963240
AMA
1.Karaca A, Aydın Ö. Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. GUMMFD. 2023;39(1):485-496. doi:10.17341/gazimmfd.963240
Chicago
Karaca, Abdulkadir, ve Özlem Aydın. 2023. “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 39 (1): 485-96. https://doi.org/10.17341/gazimmfd.963240.
EndNote
Karaca A, Aydın Ö (01 Ağustos 2023) Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 39 1 485–496.
IEEE
[1]A. Karaca ve Ö. Aydın, “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme”, GUMMFD, c. 39, sy 1, ss. 485–496, Ağu. 2023, doi: 10.17341/gazimmfd.963240.
ISNAD
Karaca, Abdulkadir - Aydın, Özlem. “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 39/1 (01 Ağustos 2023): 485-496. https://doi.org/10.17341/gazimmfd.963240.
JAMA
1.Karaca A, Aydın Ö. Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. GUMMFD. 2023;39:485–496.
MLA
Karaca, Abdulkadir, ve Özlem Aydın. “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 39, sy 1, Ağustos 2023, ss. 485-96, doi:10.17341/gazimmfd.963240.
Vancouver
1.Abdulkadir Karaca, Özlem Aydın. Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. GUMMFD. 01 Ağustos 2023;39(1):485-96. doi:10.17341/gazimmfd.963240

Cited By