Araştırma Makalesi
BibTex RIS Kaynak Göster
Yıl 2024, , 485 - 496, 21.08.2023
https://doi.org/10.17341/gazimmfd.963240

Öz

Kaynakça

  • Edmunson, H. P., New Methods in Automatic Extracting, In J. ACM, Volume 16 (2), 264-285, 1969.
  • Luhn, H.P., The Automatic Creation of Literature Abstracts, In IBM J. Res. Dev., Volume 2 (2), 159-165, 1958.
  • Erkan, G., Radev, D.R., LexRank: Graph-based Lexical Centrality as Salience in Text Summarization, In Journal Of Artificial Intelligence Research (JAIR), Volume 22, 457-479, 2004.
  • Lopyrev, K., Generating News Headlines with Recurrent Neural Networks, arXiv preprint arXiv:1512.01712, 2015.
  • Takase, S., Suzuki, J., Okazaki, N., Hirao, T., Nagata, M., Neural Headline Generation on Abstract Meaning Representation, In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing (EMNLP), Austin-Texas-A.B.D, 1054–1059, 1-5 Kasım, 2016.
  • Tan, J., Wan, X., Xiao, J., From Neural Sentence Summarization to Headline Generation: A Coarse-to-Fine Approach, In Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence (IJCAI), Melbourne-Avustralya, 4109-4115, 19-25 Ağustos, 2017.
  • Murao, K., Kobayashi, K., Kobayashi, H., Yatsuka, T., Masuyama, T., Higurashi, T., Tabuchi, Y., A Case Study on Neural Headline Generation for Editing Support, In Proceedings of the 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT), Volume 2, Minneapolis-Minnesota-A.B.D, 73-82, 2-7 Haziran, 2019.
  • Gu, X., Mao, Y., Han, J., Liu, J., Yu, H., Wu, Y., Yu, C., Finnie, D., Zhai, J. & Zukoski, N., Generating Representative Headlines for News Stories, In Proceedings of the The Web Conference 2020 (WWW ‘20), Taipei-Tayvan, 1773-1784, 20-24 Nisan, 2000.
  • Karakoç, E., Yılmaz, B., Deep Learning Based Abstractive Turkish News Summarization, In Proceedings of the 27th Signal Processing and Communications Applications Conference (SIU), Sivas-Türkiye, 1-4, 24-26 Nisan, 2019.
  • Chollet, F., Uygulamalı Derin Öğrenme, Python ile Derin Öğrenme, Editör: Kuyumcu, B., Buzdağı Yayınevi, Ankara, Türkiye,123-360, 2017.
  • Şen, M.U., Yanıkoğlu, B., Document classification of SuDer Turkish News Corpora, In Proceedings of the 26th Signal Processing and Communications Applications Conference (SIU), İzmir-Türkiye, 1-4, 2-5 Mayıs, 2018.
  • Nekic, M. Automatic Text Summarization. https://www.youtube.com/watch?v=d0OXm0dRZ4. Yayın tarihi Haziran 27, 2019. Erişim Tarihi Mayıs 15, 2020.
  • Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L., Polosukhin, I., Attention is All You Need, In Proceedings of the 31st International Conference on Neural Information Processing Systems (NIPS), Long Beach-California-A.B.D, 6000-6010, 4-9 Aralık, 2017.
  • Goodfellow, I., Bengio, Y., Courville, A., Derin Ağlar: Modern Pratikler, Derin Öğrenme, Editör: Aksoy, B., Kurt, F., Çelik, V., Buzdağı Yayınevi, Ankara, Türkiye, 163-488, 2018.
  • Zhang, A., Lipton, Z.C., Li, M., Smola, A.J. Dive into Deep Learning. https://d2l.ai/d2l-en.pdf. Yayın tarihi Kasım 6, 2020. Erişim tarihi Ocak 10, 2021.
  • Kaiser, Ł. Attention is all you need; Attentional Neural Network Models | Łukasz Kaiser | Masterclass. https://www.youtube.com/watch?v=rBCqOTEfxvg. Yayın tarihi Ekim 4, 2017. Erişim tarihi Şubat 10, 2021.
  • Wheelan, C., Merkezi Limit Teoremi, Çıplak İstatistik, Editör: Kaya, Ö., Buzdağı Yayınevi, Ankara, Türkiye, 201-223, 2020.
  • NVIDIA. Data Sheet: Tesla P100. https://images.nvidia.com/content/tesla/pdf/nvidia-tesla-p100-PCIe-datasheet.pdf. Yayın tarihi Ekim 4, 2016. Erişim tarihi Mart 1, 2021.
  • Özkan, C., İnternet Tabanlı Türkçe Metinler İçin Otomatik Özetleme Tekniği, Yüksek Lisans Tezi, T.C. Maltepe Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul, Türkiye, 2019.
  • Google LLC. Python ROUGE Implementation. https://pypi.org/project/rouge-score. Yayın tarihi Haziran 12, 2020. Erişim tarihi Ocak 10, 2021.

Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme

Yıl 2024, , 485 - 496, 21.08.2023
https://doi.org/10.17341/gazimmfd.963240

Öz

Günümüzde, büyük veri içinden istenilen bilgiyi kapsayan doğru içeriklere kısa sürede ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait başlıkların bu ihtiyacı karşılamada olumlu bir etkisi bulunmaktadır. Ancak yanıltıcı başlıklar olması durumunda bu bir dezavantaja dönüşebilmektedir. Bu çalışmada, güncel doğal dil işleme ve derin öğrenme teknolojilerini kullanarak Türkçe metinleri en iyi özetler biçimde ve daha yönlendirici Türkçe başlıkların üretilmesi amaçlanmaktadır.

Çalışmada yaklaşık 52.000 Türkçe haber metni ve başlığını içeren bir derlem kullanılmıştır. Derlemdeki haber metinleri ve başlıkları modelin doğru eğitilebilmesi için bazı ön işlemlerden geçirilmiştir. Daha insansı ve özgün sonuçlar elde etmek amacıyla genel ve soyut özetleme teknikleri çözüm yöntemleri olarak tercih edilmiştir. Eğitim modeli olarak, 2017 yılında yayınlanan ve doğal dil işleme alanında en son teknoloji olarak kabul edilen transformatör mimarisi tabanlı kodlayıcı-kod çözücü derin öğrenme mimarisi kullanılmıştır. Bu model, derin öğrenme kütüphanelerinden TensorFlow ve Keras kullanılarak geliştirilmiştir. Derin öğrenme çalışmalarında yüksek sistem gereksinimlerini karşılayan Google Colab aracılığı ile 20 ve 25 dönem eğitilerek sonuç üretilmiştir. Eğitim süresi toplam 3.5 saat gibi kısa bir sürede tamamlanmıştır.

Eğitilen model, 20 ve 25 eğitim dönemi sonunda sırayla 75% ve 85% oranında eğitim başarımı elde etmiştir. Eğitimde kullanılan veri kümesinin tamamı, eğitilen model ile tekrar üretilmiştir. Bu deneyde başarı ölçütleri olarak, genellikle özetleme görevlerinde tercih edilen ROUGE-1 metriği, BLEU ve ikisinin harmonik ortalaması olan F1 skoru tercih edilmiştir. ROUGE-1, BLEU ve F1 skoru, 20 eğitim dönemi sonunda sırayla %59, %54 ve %55 iken, 25 eğitim dönemi sonunda sırayla %77, %70 ve %73 olarak ölçülmüştür.

Transformatör mimarisinin başlık üretme probleminde kullanımının, bu alandaki mevcut çalışmalarda kullanılan derlemlere kıyasla daha az eğitim içeriğiyle çözüm üretebildiği ve diğer derin öğrenme mimarileri ile yapılan çalışmalara göre dilbilgisel ve anlamsal olarak daha başarılı sonuçlar elde edildiği gözlemlenmiştir.

Kaynakça

  • Edmunson, H. P., New Methods in Automatic Extracting, In J. ACM, Volume 16 (2), 264-285, 1969.
  • Luhn, H.P., The Automatic Creation of Literature Abstracts, In IBM J. Res. Dev., Volume 2 (2), 159-165, 1958.
  • Erkan, G., Radev, D.R., LexRank: Graph-based Lexical Centrality as Salience in Text Summarization, In Journal Of Artificial Intelligence Research (JAIR), Volume 22, 457-479, 2004.
  • Lopyrev, K., Generating News Headlines with Recurrent Neural Networks, arXiv preprint arXiv:1512.01712, 2015.
  • Takase, S., Suzuki, J., Okazaki, N., Hirao, T., Nagata, M., Neural Headline Generation on Abstract Meaning Representation, In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing (EMNLP), Austin-Texas-A.B.D, 1054–1059, 1-5 Kasım, 2016.
  • Tan, J., Wan, X., Xiao, J., From Neural Sentence Summarization to Headline Generation: A Coarse-to-Fine Approach, In Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence (IJCAI), Melbourne-Avustralya, 4109-4115, 19-25 Ağustos, 2017.
  • Murao, K., Kobayashi, K., Kobayashi, H., Yatsuka, T., Masuyama, T., Higurashi, T., Tabuchi, Y., A Case Study on Neural Headline Generation for Editing Support, In Proceedings of the 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT), Volume 2, Minneapolis-Minnesota-A.B.D, 73-82, 2-7 Haziran, 2019.
  • Gu, X., Mao, Y., Han, J., Liu, J., Yu, H., Wu, Y., Yu, C., Finnie, D., Zhai, J. & Zukoski, N., Generating Representative Headlines for News Stories, In Proceedings of the The Web Conference 2020 (WWW ‘20), Taipei-Tayvan, 1773-1784, 20-24 Nisan, 2000.
  • Karakoç, E., Yılmaz, B., Deep Learning Based Abstractive Turkish News Summarization, In Proceedings of the 27th Signal Processing and Communications Applications Conference (SIU), Sivas-Türkiye, 1-4, 24-26 Nisan, 2019.
  • Chollet, F., Uygulamalı Derin Öğrenme, Python ile Derin Öğrenme, Editör: Kuyumcu, B., Buzdağı Yayınevi, Ankara, Türkiye,123-360, 2017.
  • Şen, M.U., Yanıkoğlu, B., Document classification of SuDer Turkish News Corpora, In Proceedings of the 26th Signal Processing and Communications Applications Conference (SIU), İzmir-Türkiye, 1-4, 2-5 Mayıs, 2018.
  • Nekic, M. Automatic Text Summarization. https://www.youtube.com/watch?v=d0OXm0dRZ4. Yayın tarihi Haziran 27, 2019. Erişim Tarihi Mayıs 15, 2020.
  • Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A.N., Kaiser, L., Polosukhin, I., Attention is All You Need, In Proceedings of the 31st International Conference on Neural Information Processing Systems (NIPS), Long Beach-California-A.B.D, 6000-6010, 4-9 Aralık, 2017.
  • Goodfellow, I., Bengio, Y., Courville, A., Derin Ağlar: Modern Pratikler, Derin Öğrenme, Editör: Aksoy, B., Kurt, F., Çelik, V., Buzdağı Yayınevi, Ankara, Türkiye, 163-488, 2018.
  • Zhang, A., Lipton, Z.C., Li, M., Smola, A.J. Dive into Deep Learning. https://d2l.ai/d2l-en.pdf. Yayın tarihi Kasım 6, 2020. Erişim tarihi Ocak 10, 2021.
  • Kaiser, Ł. Attention is all you need; Attentional Neural Network Models | Łukasz Kaiser | Masterclass. https://www.youtube.com/watch?v=rBCqOTEfxvg. Yayın tarihi Ekim 4, 2017. Erişim tarihi Şubat 10, 2021.
  • Wheelan, C., Merkezi Limit Teoremi, Çıplak İstatistik, Editör: Kaya, Ö., Buzdağı Yayınevi, Ankara, Türkiye, 201-223, 2020.
  • NVIDIA. Data Sheet: Tesla P100. https://images.nvidia.com/content/tesla/pdf/nvidia-tesla-p100-PCIe-datasheet.pdf. Yayın tarihi Ekim 4, 2016. Erişim tarihi Mart 1, 2021.
  • Özkan, C., İnternet Tabanlı Türkçe Metinler İçin Otomatik Özetleme Tekniği, Yüksek Lisans Tezi, T.C. Maltepe Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul, Türkiye, 2019.
  • Google LLC. Python ROUGE Implementation. https://pypi.org/project/rouge-score. Yayın tarihi Haziran 12, 2020. Erişim tarihi Ocak 10, 2021.
Toplam 20 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Makaleler
Yazarlar

Abdulkadir Karaca 0000-0003-1737-5944

Özlem Aydın 0000-0002-6401-4183

Erken Görünüm Tarihi 11 Ağustos 2023
Yayımlanma Tarihi 21 Ağustos 2023
Gönderilme Tarihi 6 Temmuz 2021
Kabul Tarihi 16 Mart 2023
Yayımlandığı Sayı Yıl 2024

Kaynak Göster

APA Karaca, A., & Aydın, Ö. (2023). Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 39(1), 485-496. https://doi.org/10.17341/gazimmfd.963240
AMA Karaca A, Aydın Ö. Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. GUMMFD. Ağustos 2023;39(1):485-496. doi:10.17341/gazimmfd.963240
Chicago Karaca, Abdulkadir, ve Özlem Aydın. “Transformatör Mimarisi Tabanlı Derin öğrenme yöntemi Ile Türkçe Haber Metinlerine başlık üretme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 39, sy. 1 (Ağustos 2023): 485-96. https://doi.org/10.17341/gazimmfd.963240.
EndNote Karaca A, Aydın Ö (01 Ağustos 2023) Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 39 1 485–496.
IEEE A. Karaca ve Ö. Aydın, “Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme”, GUMMFD, c. 39, sy. 1, ss. 485–496, 2023, doi: 10.17341/gazimmfd.963240.
ISNAD Karaca, Abdulkadir - Aydın, Özlem. “Transformatör Mimarisi Tabanlı Derin öğrenme yöntemi Ile Türkçe Haber Metinlerine başlık üretme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 39/1 (Ağustos 2023), 485-496. https://doi.org/10.17341/gazimmfd.963240.
JAMA Karaca A, Aydın Ö. Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. GUMMFD. 2023;39:485–496.
MLA Karaca, Abdulkadir ve Özlem Aydın. “Transformatör Mimarisi Tabanlı Derin öğrenme yöntemi Ile Türkçe Haber Metinlerine başlık üretme”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 39, sy. 1, 2023, ss. 485-96, doi:10.17341/gazimmfd.963240.
Vancouver Karaca A, Aydın Ö. Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme. GUMMFD. 2023;39(1):485-96.