The deployment of large language models in translation has increased substantially in recent years, yet their performance on literary texts, particularly poetry translation, remains contested. This study compares a Retrieval-Augmented Generation (RAG) based translation system against vanilla GPT-4o when translating classical Turkish Sufi poetry. Using Talât Sait Halman’s translations of Yunus Emre as reference corpus, the evaluation employed BLEU, METEOR, and ROUGE metrics across a test set of twenty-one poems. Results demonstrate statistically significant improvements across all metrics: 408 percent improvement in BLEU scores, 93 percent in METEOR, and 90 percent in ROUGE. Qualitative analysis revealed that the RAG system achieved perfect or near-perfect scores when retrieving appropriate reference translations from the vector database, though both systems struggled with mystical content and figurative language. These findings suggest that context-aware retrieval mechanisms can substantially enhance literary translation quality and offer a valuable assistive tool that could be integrated into translators’ workflows.
Retrieval-Augmented Generation RAG large language models translation quality evaluation BLEU METEOR machine translation
Büyük dil modellerinin çeviri alanındaki kullanımı son yıllarda belirgin bir artış göstermiştir; ancak bu sistemlerin edebi metinlerde, özellikle şiir çevirisinde sergilediği performans tartışmalı olmaya devam etmektedir. Bu çalışma, Erişim Destekli Üretim (Retrieval-Augmented Generation) (RAG) tabanlı bir çeviri sisteminin klasik Türk şiiri çevirisindeki performansını standart GPT-4o modeliyle karşılaştırmaktadır. Araştırma verisi olarak Yunus Emre şiirlerinin Talât Sait Halman tarafından yapılmış İngilizce çevirileri kullanılmış, değerlendirme BLEU, METEOR ve ROUGE metrikleri aracılığıyla gerçekleştirilmiştir. Yirmi bir şiirden oluşan test seti üzerinde yapılan analizler, RAG sisteminin tüm metriklerde istatistiksel olarak anlamlı üstünlük sağladığını ortaya koymaktadır. BLEU skorlarında %408, METEOR’da %93 ve ROUGE’da %90 iyileşme gözlemlenmiştir. Nitel analiz, RAG sisteminin vektör veri tabanından uygun referans çevirileri eriştiğinde mükemmel veya mükemmele yakın skorlar elde ettiğini, ancak her iki sistemin de mistik içerik ve mecazi dil karşısında zorlandığını göstermiştir. Bulgular, bağlam duyarlı erişim mekanizmalarının edebi çeviri kalitesini önemli ölçüde artırabileceğini ve bu yaklaşımın çevirmenlerin iş akışlarına entegre edilebilecek değerli bir yardımcı araç sunduğunu ortaya koymaktadır.
Erişim Destekli Üretim RAG büyük dil modelleri çeviri kalitesi değerlendirmesi BLEU METEOR makine çevirisi
| Primary Language | Turkish |
|---|---|
| Subjects | Translation and Interpretation Studies |
| Journal Section | Research Article |
| Authors | |
| Submission Date | January 13, 2026 |
| Acceptance Date | February 22, 2026 |
| Publication Date | February 24, 2026 |
| IZ | https://izlik.org/JA67PA29BX |
| Published in Issue | Year 2026 Volume: 4 Issue: 1 |