Günümüzde, doküman özetleme için önerilen birçok model olmasına rağmen hikâye kitaplarını ele alan özetleme modelleri sınırlıdır. Bu problemi ele almak için yeni bir transformatör tabanlı özetleme modeli önerilmiştir. Önerilen model, KeyBERT, DistilBERT-NER, TF-IDF ve BART modelinden oluşmaktadır. KeyBERT ve TF-IDF, anahtar kelimeler çıkarılması için kullanılmıştır. DistilBERT-NER ise hikâye kitaplarından varlık isimleri çıkarımı için kullanılmıştır. Varlık isimleriyle bu anahtar kelimeler birleştirilerek İngilizce hikâye kitapları için transformatör tabanlı bir özetleme modeli oluşturulmuştur. Önerilen model, ince ayar yapılarak eğitilmiş T5, BART ve PEGASUS modelleriyle karşılaştırılmış ve sonuçlar insanlar tarafından değerlendirilmiştir. Deneysel sonuçlar, önerilen modelin temel yöntemlere kıyasla Rouge-L - F1 değeriyle hikâye özetlemede daha yüksek değerlere ulaştığı gözlemlenmiştir.
Recently, although there are many proposed models for document summarization, summarization models for storybooks are limited. To address this problem, a new transformer-based summarization model is proposed. The proposed model consists of KeyBERT, DistilBERT-NER, TF-IDF and BART. KeyBERT and TF-IDF are used for keyword extraction. DistilBERT-NER was used to extract entity names from storybooks. By combining these keywords with entity names, a transformer-based summarization model for English storybooks was created. The proposed model is compared with the fine-tuned T5, BART and PEGASUS models and the results are evaluated by humans. The experimental results show that the proposed model achieves higher values of Rouge-L - F1 in story summarization compared to the baseline methods.
Text summarization Abstractive method KeyBERT DistilBERT TF-IDF.
Birincil Dil | Türkçe |
---|---|
Konular | Doğal Dil İşleme |
Bölüm | MBD |
Yazarlar | |
Yayımlanma Tarihi | 27 Mart 2025 |
Gönderilme Tarihi | 10 Aralık 2024 |
Kabul Tarihi | 13 Mart 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 37 Sayı: 1 |