Araştırma Makalesi

Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması

Cilt: 17 Sayı: 1 11 Haziran 2024
PDF İndir
TR EN

Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması

Öz

Günümüzde internet ortamında metne dayalı veri çok hızlı bir şekilde artış göstermektedir ve bu büyük veri içinden istenilen bilgiyi barındıran doğru içeriklere ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait anahtar sözcüklerin bilinmesi bu ihtiyacı karşılamada olumlu bir etki sağlayabilmektedir. Bu çalışmada, doğal dil işleme ve derin öğrenme modelleri ile Türkçe metinleri temsil eden anahtar sözcüklerin belirlenmesi amaçlanmıştır. Veri kümesi olarak Türkçe Etiketli Metin Derlemi ve Metin Özetleme-Anahtar Kelime Çıkarma Veri Kümesi birlikte kullanılmıştır. Derin öğrenme modeli olarak çalışmada iki farklı model ortaya konmuştur. İlk olarak Uzun Ömürlü Kısa Dönem Belleği ( LSTM) katmanlı bir Diziden Diziye (Seq2Seq) model tasarlanmıştır. Diğer model ise BERT (Transformatörler ile İki Yönlü Kodlayıcı Temsilleri) ile oluşturulmuş Seq2Seq bir modeldir. LSTM katmanlı Seq2seq modelin başarı değerlendirmesinde ROUGE-1 ölçütünde 0,38 F-1 değerine ulaşılmıştır. BERT tabanlı Seq2Seq modelde ROUGE-1 ölçütünde 0,399 F-1 değeri elde edilmiştir. Sonuç olarak dönüştürücü mimarisini temel alan BERT tabanlı Seq2Seq modelin, LSTM tabanlı Seq2seq modele görece daha başarılı olduğu gözlemlenmiştir.

Anahtar Kelimeler

Kaynakça

  1. Hashemzahde, B. Ve ark., Improving keyword extraction in multilingual texts, Int J Electric Comput Eng, 2020, 10:5909-5916.
  2. Papagiannopoulou, E., Tsoumakas, G., A review of keyphrase extraction, CoRR, 2019.
  3. Witten, I. H., Paynter, G. W., Frank E., Gutwin, C., NevillManning, C. G., Kea: Practical Automatic Keyphrase Extraction, In Proceedings of the 4th ACM Conf. of the Digital Libraries, 1999, Berkeley, CA, USA.
  4. Turney, P., Learning algorithms for keyphrase extraction, Information Retrieval, 2000, 2:303–336.
  5. Zhang, Q., Wang, Y., Gong, Y., Keyphrase extraction using deep recurrent neural networks on Twitter, In Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, 2016, Austin, Texas, pp. 836–845.
  6. Zhang, Y., Yang, F., Xiao, W., Deep keyphrase generation with a convolutional sequence to sequence model, In Proceedings of the 4th International Conference on Systems and Informatics, Hangzhou, 2017, China, pp. 1477–1485.
  7. Chen, W., Gao, Y., Zhang, J., King, I., Lyu, M. R., Title-guided encoding for keyphrase generation, In Proceedings of AAAI Conference on Artificial Intelligence, 2019, pp. 6268–6275.
  8. Mihalcea, R., Tarau, P., TextRank: Bringing order into text, Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing (EMNLP '04), 2004, Barcelona, Spain, pp. 404-411.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgi Sistemleri (Diğer)

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

18 Mart 2024

Yayımlanma Tarihi

11 Haziran 2024

Gönderilme Tarihi

18 Nisan 2023

Kabul Tarihi

18 Temmuz 2023

Yayımlandığı Sayı

Yıl 2024 Cilt: 17 Sayı: 1

Kaynak Göster

APA
Aydın, Ö., & Kantarcı, H. (2024). Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi, 17(1), 9-18. https://doi.org/10.54525/bbmd.1454220
AMA
1.Aydın Ö, Kantarcı H. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. bbmd. 2024;17(1):9-18. doi:10.54525/bbmd.1454220
Chicago
Aydın, Özlem, ve Hüsein Kantarcı. 2024. “Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17 (1): 9-18. https://doi.org/10.54525/bbmd.1454220.
EndNote
Aydın Ö, Kantarcı H (01 Haziran 2024) Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17 1 9–18.
IEEE
[1]Ö. Aydın ve H. Kantarcı, “Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması”, bbmd, c. 17, sy 1, ss. 9–18, Haz. 2024, doi: 10.54525/bbmd.1454220.
ISNAD
Aydın, Özlem - Kantarcı, Hüsein. “Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri ve Mühendisliği Dergisi 17/1 (01 Haziran 2024): 9-18. https://doi.org/10.54525/bbmd.1454220.
JAMA
1.Aydın Ö, Kantarcı H. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. bbmd. 2024;17:9–18.
MLA
Aydın, Özlem, ve Hüsein Kantarcı. “Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması”. Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 17, sy 1, Haziran 2024, ss. 9-18, doi:10.54525/bbmd.1454220.
Vancouver
1.Özlem Aydın, Hüsein Kantarcı. Türkçe Anahtar Sözcük Çıkarımında LSTM ve BERT Tabanlı Modellerin Karşılaştırılması. bbmd. 01 Haziran 2024;17(1):9-18. doi:10.54525/bbmd.1454220

Cited By