TR
EN
Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması
Abstract
Günümüzde internet ortamında metne dayalı veri çok hızlı bir şekilde artış göstermektedir ve bu büyük veri içinden istenilen bilgiyi barındıran doğru içeriklere ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait anahtar sözcüklerin bilinmesi bu ihtiyacı karşılamada olumlu bir etki sağlayabilmektedir. Bu çalışmada, doğal dil işleme ve derin öğrenme modelleri ile Türkçe metinleri temsil eden anahtar sözcüklerin belirlenmesi amaçlanmıştır. Veri kümesi olarak Türkçe Etiketli Metin Derlemi ve Metin Özetleme-Anahtar Kelime Çıkarma Veri Kümesi birlikte kullanılmıştır. Derin öğrenme modeli olarak çalışmada iki farklı model ortaya konmuştur. İlk olarak Uzun Ömürlü Kısa Dönem Belleği ( LSTM) katmanlı bir Diziden Diziye (Seq2Seq) model tasarlanmıştır. Diğer model ise BERT (Transformatörler ile İki Yönlü Kodlayıcı Temsilleri) ile oluşturulmuş Seq2Seq bir modeldir. LSTM katmanlı Seq2seq modelin başarı değerlendirmesinde ROUGE-1 ölçütünde 0,38 F-1 değerine ulaşılmıştır. BERT tabanlı Seq2Seq modelde ROUGE-1 ölçütünde 0,399 F-1 değeri elde edilmiştir. Sonuç olarak dönüştürücü mimarisini temel alan BERT tabanlı Seq2Seq modelin, LSTM tabanlı Seq2seq modele görece daha başarılı olduğu gözlemlenmiştir.
Keywords
References
- Hashemzahde, B. Ve ark., Improving keyword extraction in multilingual texts, Int J Electric Comput Eng, 2020, 10:5909-5916.
- Papagiannopoulou, E., Tsoumakas, G., A review of keyphrase extraction, CoRR, 2019.
- Witten, I. H., Paynter, G. W., Frank E., Gutwin, C., NevillManning, C. G., Kea: Practical Automatic Keyphrase Extraction, In Proceedings of the 4th ACM Conf. of the Digital Libraries, 1999, Berkeley, CA, USA.
- Turney, P., Learning algorithms for keyphrase extraction, Information Retrieval, 2000, 2:303–336.
- Zhang, Q., Wang, Y., Gong, Y., Keyphrase extraction using deep recurrent neural networks on Twitter, In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, 2016, Austin, Texas, pp. 836–845.
- Zhang, Y., Yang, F., Xiao, W., Deep keyphrase generation with a convolutional sequence to sequence model, In Proceedings of the 4th International Conference on Systems and Informatics, Hangzhou, 2017, China, pp. 1477–1485.
- Chen, W., Gao, Y., Zhang, J., King, I., Lyu, M. R., Title-guided encoding for keyphrase generation, In Proceedings of AAAI Conference on Artificial Intelligence, 2019, pp. 6268–6275.
- Mihalcea, R., Tarau, P., TextRank: Bringing order into text, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP '04), 2004, Barcelona, Spain, pp. 404-411.
Details
Primary Language
Turkish
Subjects
Information Systems (Other)
Journal Section
Research Article
Early Pub Date
March 18, 2024
Publication Date
June 11, 2024
Submission Date
April 18, 2023
Acceptance Date
July 18, 2023
Published in Issue
Year 2024 Volume: 17 Number: 1
APA
Aydın, Ö., & Kantarcı, H. (2024). Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 17(1), 9-18. https://doi.org/10.54525/bbmd.1454220
AMA
1.Aydın Ö, Kantarcı H. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2024;17(1):9-18. doi:10.54525/bbmd.1454220
Chicago
Aydın, Özlem, and Hüsein Kantarcı. 2024. “Türkçe Anahtar Sözcük Çıkarımında LSTM Ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri Ve Mühendisliği Dergisi 17 (1): 9-18. https://doi.org/10.54525/bbmd.1454220.
EndNote
Aydın Ö, Kantarcı H (June 1, 2024) Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17 1 9–18.
IEEE
[1]Ö. Aydın and H. Kantarcı, “Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması”, Bilgisayar Bilimleri ve Mühendisliği Dergisi, vol. 17, no. 1, pp. 9–18, June 2024, doi: 10.54525/bbmd.1454220.
ISNAD
Aydın, Özlem - Kantarcı, Hüsein. “Türkçe Anahtar Sözcük Çıkarımında LSTM Ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17/1 (June 1, 2024): 9-18. https://doi.org/10.54525/bbmd.1454220.
JAMA
1.Aydın Ö, Kantarcı H. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2024;17:9–18.
MLA
Aydın, Özlem, and Hüsein Kantarcı. “Türkçe Anahtar Sözcük Çıkarımında LSTM Ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri Ve Mühendisliği Dergisi, vol. 17, no. 1, June 2024, pp. 9-18, doi:10.54525/bbmd.1454220.
Vancouver
1.Özlem Aydın, Hüsein Kantarcı. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi. 2024 Jun. 1;17(1):9-18. doi:10.54525/bbmd.1454220
Cited By
Classification and Analysis of Employee Feedback with Deep Learning Algorithms
Sakarya University Journal of Computer and Information Sciences
https://doi.org/10.35377/saucis...1627619Multi-Class News Classification with BERT, DistilBERT, RoBERTa, and ELECTRA Natural Language Processing Models
Düzce Üniversitesi Bilim ve Teknoloji Dergisi
https://doi.org/10.29130/dubited.1737003A Systematic Approach to Key Phrase Extraction for Turkish: Adapting Embedding-Based Models
IEEE Access
https://doi.org/10.1109/ACCESS.2026.3662520Türkçe ve İngilizce Anahtar Kelime Üretimi İçin Özgün Veri Seti Oluşturulması ve Büyük Dil Modellerine İnce Ayar Uygulanması
Bilgisayar Bilimleri ve Mühendisliği Dergisi
https://doi.org/10.54525/bbmd.1838196