Araştırma Makalesi

Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi

Cilt: 40 Sayı: 3 21 Ağustos 2025
PDF İndir
EN TR

Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi

Öz

Son zamanlarda, büyük dil modelleri (LLM) birçok doğal dil işleme görevinde oldukça popüler hale gelmiştir. Türkçe gibi düşük seviyeli dillerde LLM'ler üzerine daha az çalışma vardır. Bu nedenle, Türkçe soru-cevap görevi için BERT, ALBERT, DistilBERT, mDeBERTa ve mT5 LLM'lerinin başarısı analiz edilmiştir. Karşılaştırma SQuAD veri setinin Türkçe versiyonu veri seti olarak kullanılmıştır. Bu LLM'lerin ince ayar yapılarak eğitilmesi sonucunda, mDeBERTa %74.50 doğruluk ile en başarılı model olmuştur. Ayrıca, bu modellerin cevap olasılığına eşik değerinin etkisi ve LLM'lerin tahmin edilen ve gerçekleşen cevapları arasındaki anlamsal benzerlik incelenmiştir. Eşik değerinin etkisi analiz edildiğinde, LLM'lerin doğruluk değerinde %0.13'e kadar bir doğruluk artışı gözlenmiştir. Anlamsal benzerliğin LLM'ler üzerindeki etkisi analiz edildiğinde ise doğruluk değerinin %0.7 ile %6.59 arasında arttığı ve en başarılı modelin %79.09 ile mDeBERTa olduğu gösterilmiştir. Sonuç olarak, LLM'ler için eşik değeri ve anlamsal benzerliğin analiz edilmesinin olumlu bir etkiye sahip olduğunu göstermektedir.

Anahtar Kelimeler

Kaynakça

  1. 1. Karanikolas, N., Manga, E., Samaridi, N., Tousidou, E., Vassilakopoulos, M., Large language models versus natural language understanding and generation, In Proceedings of the 27th Pan-Hellenic Conference on Progress in Computing and Informatics, 278-290, 2023.
  2. 2. Dwivedi S.K., Singh V., Research and reviews in question answering system, Procedia Technology, 10, 417–424, 2013.
  3. 3. Agarwal A., Sachdeva N., Yadav R.K., Udandarao V., Mittal V., Gupta A., Mathur A., Eduqa: Educational domain question answering system using conceptual network mapping, ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing – Proceedings, 2019-May, 8137–8141, 2019.
  4. 4. Jin D., Pan E., Oufattole N., Weng W.H., Fang H., Szolovits P., What disease does this patient have? a large-scale open domain question answering dataset from medical exams, Applied Sciences 2021, 11, 6421, 2021.
  5. 5. Etezadi R., Shamsfard M., The state of the art in open domain complex question answering: a survey, Applied Intelligence, 53, 4124–4144, 2023.
  6. 6. Vaswani A., Shazeer N., Parmar N., Uszkoreit J., Jones L., Gomez A.N., Kaiser L., Polosukhin I., Attention is all you need, Advances in Neural Information Processing Systems, 2017-December, 5999–6009, 2017.
  7. 7. Devlin J., Chang M.W., Lee K., Toutanova K., Bert: Pre-training of deep bidirectional transformers for language understanding, NAACL HLT 2019-2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies Proceedings of the Conference, 1, 4171–4186, 2018.
  8. 8. Improving language understanding with unsupervised learning-OpenAI. https://openai.com/index/language-unsupervised/. Erişim tarihi Temmuz 20, 2024.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Derin Öğrenme, Doğal Dil İşleme, Konuşma Üretimi

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

4 Haziran 2025

Yayımlanma Tarihi

21 Ağustos 2025

Gönderilme Tarihi

24 Ağustos 2024

Kabul Tarihi

1 Şubat 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 40 Sayı: 3

Kaynak Göster

APA
Güven, Z. A. (2025). Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 40(3), 1787-1796. https://doi.org/10.17341/gazimmfd.1538022
AMA
1.Güven ZA. Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. GUMMFD. 2025;40(3):1787-1796. doi:10.17341/gazimmfd.1538022
Chicago
Güven, Zekeriya Anıl. 2025. “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 40 (3): 1787-96. https://doi.org/10.17341/gazimmfd.1538022.
EndNote
Güven ZA (01 Ağustos 2025) Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 40 3 1787–1796.
IEEE
[1]Z. A. Güven, “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”, GUMMFD, c. 40, sy 3, ss. 1787–1796, Ağu. 2025, doi: 10.17341/gazimmfd.1538022.
ISNAD
Güven, Zekeriya Anıl. “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 40/3 (01 Ağustos 2025): 1787-1796. https://doi.org/10.17341/gazimmfd.1538022.
JAMA
1.Güven ZA. Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. GUMMFD. 2025;40:1787–1796.
MLA
Güven, Zekeriya Anıl. “Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi”. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, c. 40, sy 3, Ağustos 2025, ss. 1787-96, doi:10.17341/gazimmfd.1538022.
Vancouver
1.Zekeriya Anıl Güven. Türkçe soru cevaplama için büyük dil modelleri üzerinde geniş ölçekli etki analizi. GUMMFD. 01 Ağustos 2025;40(3):1787-96. doi:10.17341/gazimmfd.1538022