EN
TR
Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi
Öz
Son zamanlarda, büyük dil modelleri (LLM) birçok doğal dil işleme görevinde oldukça popüler hale gelmiştir. Türkçe gibi düşük seviyeli dillerde LLM'ler üzerine daha az çalışma vardır. Bu nedenle, Türkçe soru-cevap görevi için BERT, ALBERT, DistilBERT, mDeBERTa ve mT5 LLM'lerinin başarısı analiz edilmiştir. Karşılaştırma SQuAD veri setinin Türkçe versiyonu veri seti olarak kullanılmıştır. Bu LLM'lerin ince ayar yapılarak eğitilmesi sonucunda, mDeBERTa %74.50 doğruluk ile en başarılı model olmuştur. Ayrıca, bu modellerin cevap olasılığına eşik değerinin etkisi ve LLM'lerin tahmin edilen ve gerçekleşen cevapları arasındaki anlamsal benzerlik incelenmiştir. Eşik değerinin etkisi analiz edildiğinde, LLM'lerin doğruluk değerinde %0.13'e kadar bir doğruluk artışı gözlenmiştir. Anlamsal benzerliğin LLM'ler üzerindeki etkisi analiz edildiğinde ise doğruluk değerinin %0.7 ile %6.59 arasında arttığı ve en başarılı modelin %79.09 ile mDeBERTa olduğu gösterilmiştir. Sonuç olarak, LLM'ler için eşik değeri ve anlamsal benzerliğin analiz edilmesinin olumlu bir etkiye sahip olduğunu göstermektedir.
Anahtar Kelimeler
Kaynakça
- 1. Karanikolas, N., Manga, E., Samaridi, N., Tousidou, E., Vassilakopoulos, M., Large language models versus natural language understanding and generation, In Proceedings of the 27th Pan-Hellenic Conference on Progress in Computing and Informatics, 278-290, 2023.
- 2. Dwivedi S.K., Singh V., Research and reviews in question answering system, Procedia Technology, 10, 417–424, 2013.
- 3. Agarwal A., Sachdeva N., Yadav R.K., Udandarao V., Mittal V., Gupta A., Mathur A., Eduqa: Educational domain question answering system using conceptual network mapping, ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing – Proceedings, 2019-May, 8137–8141, 2019.
- 4. Jin D., Pan E., Oufattole N., Weng W.H., Fang H., Szolovits P., What disease does this patient have? a large-scale open domain question answering dataset from medical exams, Applied Sciences 2021, 11, 6421, 2021.
- 5. Etezadi R., Shamsfard M., The state of the art in open domain complex question answering: a survey, Applied Intelligence, 53, 4124–4144, 2023.
- 6. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L., Polosukhin I., Attention is all you need, Advances in Neural Information Processing Systems, 2017-December, 5999–6009, 2017.
- 7. Devlin J., Chang M.W., Lee K., Toutanova K., Bert: Pre-training of deep bidirectional transformers for language understanding, NAACL HLT 2019-2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies Proceedings of the Conference, 1, 4171–4186, 2018.
- 8. Improving language understanding with unsupervised learning-OpenAI. https://openai.com/index/language-unsupervised/. Erişim tarihi Temmuz 20, 2024.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Derin Öğrenme, Doğal Dil İşleme, Konuşma Üretimi
Bölüm
Araştırma Makalesi
Yazarlar
Erken Görünüm Tarihi
4 Haziran 2025
Yayımlanma Tarihi
21 Ağustos 2025
Gönderilme Tarihi
24 Ağustos 2024
Kabul Tarihi
1 Şubat 2025
Yayımlandığı Sayı
Yıl 2025 Cilt: 40 Sayı: 3
APA
Güven, Z. A. (2025). Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 40(3), 1787-1796. https://doi.org/10.17341/gazimmfd.1538022
AMA
1.Güven ZA. Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. GUMMFD. 2025;40(3):1787-1796. doi:10.17341/gazimmfd.1538022
Chicago
Güven, Zekeriya Anıl. 2025. “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 40 (3): 1787-96. https://doi.org/10.17341/gazimmfd.1538022.
EndNote
Güven ZA (01 Ağustos 2025) Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 40 3 1787–1796.
IEEE
[1]Z. A. Güven, “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”, GUMMFD, c. 40, sy 3, ss. 1787–1796, Ağu. 2025, doi: 10.17341/gazimmfd.1538022.
ISNAD
Güven, Zekeriya Anıl. “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 40/3 (01 Ağustos 2025): 1787-1796. https://doi.org/10.17341/gazimmfd.1538022.
JAMA
1.Güven ZA. Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. GUMMFD. 2025;40:1787–1796.
MLA
Güven, Zekeriya Anıl. “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 40, sy 3, Ağustos 2025, ss. 1787-96, doi:10.17341/gazimmfd.1538022.
Vancouver
1.Zekeriya Anıl Güven. Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. GUMMFD. 01 Ağustos 2025;40(3):1787-96. doi:10.17341/gazimmfd.1538022