Araştırma Makalesi

BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi

Cilt: 14 Sayı: 3 15 Eylül 2024
PDF İndir
TR EN

BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi

Öz

Günümüzde, derin öğrenme tekniklerinin yaratıcı metin oluşturma süreçlerine entegrasyonu, araştırmacılar ve yazılım geliştiriciler arasında yaygın olarak kullanılmaktadır. Derin öğrenme, büyük veri setleri üzerinde karmaşık bilgileri öğrenme yeteneği ile bilinir ve bu özellik, dil anlama ve metin üretme konularında önemli avantajlar sunar. Çalışmanın amacı Bidirectional Long Short-Term Memory (BiLSTM) derin öğrenme mimarisi temelinde uzun bir metindeki ifadelerin eğitilerek yeni bir özet metnin türetilmesidir. Bu amaç doğrultusunda Türkçe dilinde yazılmış farklı uzunlukta ve türdeki (Roman, Kişisel Gelişim) iki doküman veriseti olarak kullanılmış, veri setindeki metinler veri temizleme, tokenizasyon ve vektörleştirme gibi bir dizi önişlemden geçirilmiştir. Çalışma, BiLSTM'nin yanı sıra LSTM, GRU, BiGRU ve CNN gibi diğer derin öğrenme mimarilerini de değerlendirmiş ve BiLSTM modelinin iki farklı kitap türünde ve farklı kelime sayılarında (1.000, 2.000 ve 5.000 kelime) en yüksek METEOR, BLEU ve ROGUE skorlarına sahip olduğunu ortaya koymuştur. Bu bulgular, BiLSTM’nin metin özetleme ve metin üretme için diğer modellere göre daha başarılı sonuçlar ürettiğini göstermektedir. BiLSTM kullanarak belli bir roman veya kişisel gelişim kitabından yaratıcı ve özgün metinler türetme yöntemi araştırmacılar ve yazılım geliştiriciler için ilham verici bir kaynak olup, önerilen yöntemin farklı metin türleri için de uygulanabileceği öngörülmektedir. Bu sayede, metin özetleme ve üretme süreçlerinde BiLSTM mimarisinin başarılı sonuçlar ürettiği gösterilmiştir.

Anahtar Kelimeler

BiLSTM, Doğal dil işleme, Metin üretme, Derin öğrenme

Etik Beyan

Yapılan çalışmada araştırma ve yayın etiğine uyulmuştur.

Kaynakça

  1. Babüroğlu, B., Tekerek, A., & Tekerek, M. (2019). Türkçe İçin Derin Öğrenme Tabanlı Doğal Dil İşleme Modeli Geliştirilmesi. 13th International Computer and Instructional Technology Symposium
  2. Banerjee, S. and Lavie, A. (2005). METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments. In Proceedings of the ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for Machine Translation and/or Summarization, pages 65–72, Ann Arbor, Michigan. Association for Computational Linguistics.
  3. Bayer, M., Kaufhold, M.-A., Buchhold, B., Keller, M., Dallmeyer, J., Reuter, C. (2022). Data augmentation in natural language processing: a novel text generation approach for long and short text classifiers. International Journal of Machine Learning and Cybernetics, 14(3), 135-150. https://doi.org/10.1007/s13042-022-01553-3
  4. Chakraborty, S., Banik, J., Addhya, S., & Chatterjee, D. (2020). Study of Dependency on number of LSTM units for Character based Text Generation models. 2020 International Conference on Computer Science, Engineering and Applications (ICCSEA).
  5. Cui, P., Wang, X., Pei, J., & Zhu, W. (2018). A Survey on Network Embedding. IEEE Transactions on Knowledge and Data Engineering, 31(5), 833-852. https://doi.org/10.1109/TKDE.2018.2849727
  6. Dey, R., Salem F. M. (2017). Gate-variants of Gated Recurrent Unit (GRU) neural networks. Midwest Symposium on Circuits and Systems, 1597-1600. https://doi.org/10.1109/MWSCAS.2017.8053243
  7. Erhandi, B., Çallı, F. (2020). Derin Özetleme ile Metin Özetleme. 3rd International Conference on Data Science and Applications (ICONDATA’20).
  8. Fagin, R., Kumar, R., Sivakumar, D. (2003). Comparing Top k Lists. SIAM Journal on Discrete Mathematics 17(1), 134-160. https://doi.org/10.1137/S0895480102412856
  9. Fang, T., Jaggi, M., & Argyraki, K. (2017). Generating Steganographic Text with LSTMs. https://doi.org/10.48550/arXiv.1705.10742
  10. Fatima, N., Imran, A. S., Kastrati, Z., Daudpota, S. M., & Soomro, A. (2021). A Systematic Literature Review on Text Generation Using Deep Neural Network Models. 2021 IEEE International Conference on Bioinformatics and Biomedicine (BIBM).

Kaynak Göster

APA
Şahin, O., & Yayla, R. (2024). BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi. Karadeniz Fen Bilimleri Dergisi, 14(3), 1096-1119. https://doi.org/10.31466/kfbd.1423022
AMA
1.Şahin O, Yayla R. BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi. KFBD. 2024;14(3):1096-1119. doi:10.31466/kfbd.1423022
Chicago
Şahin, Onur, ve Rıdvan Yayla. 2024. “BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi”. Karadeniz Fen Bilimleri Dergisi 14 (3): 1096-1119. https://doi.org/10.31466/kfbd.1423022.
EndNote
Şahin O, Yayla R (01 Eylül 2024) BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi. Karadeniz Fen Bilimleri Dergisi 14 3 1096–1119.
IEEE
[1]O. Şahin ve R. Yayla, “BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi”, KFBD, c. 14, sy 3, ss. 1096–1119, Eyl. 2024, doi: 10.31466/kfbd.1423022.
ISNAD
Şahin, Onur - Yayla, Rıdvan. “BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi”. Karadeniz Fen Bilimleri Dergisi 14/3 (01 Eylül 2024): 1096-1119. https://doi.org/10.31466/kfbd.1423022.
JAMA
1.Şahin O, Yayla R. BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi. KFBD. 2024;14:1096–1119.
MLA
Şahin, Onur, ve Rıdvan Yayla. “BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi”. Karadeniz Fen Bilimleri Dergisi, c. 14, sy 3, Eylül 2024, ss. 1096-19, doi:10.31466/kfbd.1423022.
Vancouver
1.Onur Şahin, Rıdvan Yayla. BiLSTM Derin Öğrenme Yöntemi ile Uzun Metinlerden Yeni Özet Metinlerin Türetilmesi. KFBD. 01 Eylül 2024;14(3):1096-119. doi:10.31466/kfbd.1423022