Research Article

Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması

Volume: 17 Number: 1 June 11, 2024
TR EN

Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması

Abstract

Günümüzde internet ortamında metne dayalı veri çok hızlı bir şekilde artış göstermektedir ve bu büyük veri içinden istenilen bilgiyi barındıran doğru içeriklere ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait anahtar sözcüklerin bilinmesi bu ihtiyacı karşılamada olumlu bir etki sağlayabilmektedir. Bu çalışmada, doğal dil işleme ve derin öğrenme modelleri ile Türkçe metinleri temsil eden anahtar sözcüklerin belirlenmesi amaçlanmıştır. Veri kümesi olarak Türkçe Etiketli Metin Derlemi ve Metin Özetleme-Anahtar Kelime Çıkarma Veri Kümesi birlikte kullanılmıştır. Derin öğrenme modeli olarak çalışmada iki farklı model ortaya konmuştur. İlk olarak Uzun Ömürlü Kısa Dönem Belleği ( LSTM) katmanlı bir Diziden Diziye (Seq2Seq) model tasarlanmıştır. Diğer model ise BERT (Transformatörler ile İki Yönlü Kodlayıcı Temsilleri) ile oluşturulmuş Seq2Seq bir modeldir. LSTM katmanlı Seq2seq modelin başarı değerlendirmesinde ROUGE-1 ölçütünde 0,38 F-1 değerine ulaşılmıştır. BERT tabanlı Seq2Seq modelde ROUGE-1 ölçütünde 0,399 F-1 değeri elde edilmiştir. Sonuç olarak dönüştürücü mimarisini temel alan BERT tabanlı Seq2Seq modelin, LSTM tabanlı Seq2seq modele görece daha başarılı olduğu gözlemlenmiştir.

Keywords

References

  1. Hashemzahde, B. Ve ark., Improving keyword extraction in multilingual texts, Int J Electric Comput Eng, 2020, 10:5909-5916.
  2. Papagiannopoulou, E., Tsoumakas, G., A review of keyphrase extraction, CoRR, 2019.
  3. Witten, I. H., Paynter, G. W., Frank E., Gutwin, C., NevillManning, C. G., Kea: Practical Automatic Keyphrase Extraction, In Proceedings of the 4th ACM Conf. of the Digital Libraries, 1999, Berkeley, CA, USA.
  4. Turney, P., Learning algorithms for keyphrase extraction, Information Retrieval, 2000, 2:303–336.
  5. Zhang, Q., Wang, Y., Gong, Y., Keyphrase extraction using deep recurrent neural networks on Twitter, In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, 2016, Austin, Texas, pp. 836–845.
  6. Zhang, Y., Yang, F., Xiao, W., Deep keyphrase generation with a convolutional sequence to sequence model, In Proceedings of the 4th International Conference on Systems and Informatics, Hangzhou, 2017, China, pp. 1477–1485.
  7. Chen, W., Gao, Y., Zhang, J., King, I., Lyu, M. R., Title-guided encoding for keyphrase generation, In Proceedings of AAAI Conference on Artificial Intelligence, 2019, pp. 6268–6275.
  8. Mihalcea, R., Tarau, P., TextRank: Bringing order into text, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP '04), 2004, Barcelona, Spain, pp. 404-411.

Details

Primary Language

Turkish

Subjects

Information Systems (Other)

Journal Section

Research Article

Early Pub Date

March 18, 2024

Publication Date

June 11, 2024

Submission Date

April 18, 2023

Acceptance Date

July 18, 2023

Published in Issue

Year 2024 Volume: 17 Number: 1

APA
Aydın, Ö., & Kantarcı, H. (2024). Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 17(1), 9-18. https://doi.org/10.54525/bbmd.1454220
AMA
1.Aydın Ö, Kantarcı H. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2024;17(1):9-18. doi:10.54525/bbmd.1454220
Chicago
Aydın, Özlem, and Hüsein Kantarcı. 2024. “Türkçe Anahtar Sözcük Çıkarımında LSTM Ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri Ve Mühendisliği Dergisi 17 (1): 9-18. https://doi.org/10.54525/bbmd.1454220.
EndNote
Aydın Ö, Kantarcı H (June 1, 2024) Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17 1 9–18.
IEEE
[1]Ö. Aydın and H. Kantarcı, “Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması”, Bilgisayar Bilimleri ve Mühendisliği Dergisi, vol. 17, no. 1, pp. 9–18, June 2024, doi: 10.54525/bbmd.1454220.
ISNAD
Aydın, Özlem - Kantarcı, Hüsein. “Türkçe Anahtar Sözcük Çıkarımında LSTM Ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17/1 (June 1, 2024): 9-18. https://doi.org/10.54525/bbmd.1454220.
JAMA
1.Aydın Ö, Kantarcı H. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2024;17:9–18.
MLA
Aydın, Özlem, and Hüsein Kantarcı. “Türkçe Anahtar Sözcük Çıkarımında LSTM Ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri Ve Mühendisliği Dergisi, vol. 17, no. 1, June 2024, pp. 9-18, doi:10.54525/bbmd.1454220.
Vancouver
1.Özlem Aydın, Hüsein Kantarcı. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2024 Jun. 1;17(1):9-18. doi:10.54525/bbmd.1454220

Cited By