Araştırma Makalesi

Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme

Cilt: 8 Sayı: 2 24 Aralık 2025
PDF İndir
TR EN

Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme

Öz

Bu çalışma, Türkçe bir büyük dil modeline (Trendyol/Trendyol-LLM-7b-chat-dpo-v1.0) uygulanan yalnızca ağırlık nicemlemesi (INT8 ve INT4) yöntemlerinin model doğruluğu, üretim kalitesi ve sistem düzeyi verimlilik üzerindeki etkilerini kapsamlı biçimde incelemektedir. Nicemlenmemiş BFLOAT16 sürümü temel alınarak, aynı modelin INT8 ve INT4 biçimlerinde nicemlenmiş karşılıkları Türkçeye uyarlanmış GLUE-benzeri sınıflandırma görevlerinde ve üretim odaklı özetleme görevlerinde değerlendirilmiştir. Elde edilen bulgular, nicemlemenin görev türüne bağlı olmakla birlikte çoğu durumda sınırlı düzeyde performans kaybına yol açtığını; buna karşılık belirgin bellek tasarrufu ve dağıtım kolaylığı sağladığını göstermektedir. Sonuçlar doğruluk, hız ve bellek kullanımı arasındaki kaçınılmaz dengelemelere (trade-off) dikkat çekmektedir. Özellikle INT4 nicemleme, kaynak kısıtlı ortamlarda bellek verimliliği ile kabul edilebilir doğruluk arasında dengeli bir çözüm sunarken; INT8 nicemleme bazı sınıflandırma görevlerinde yüksek doğruluğu koruyabilmekte, ancak belirli yazılım veya donanım yapılandırmalarında hız açısından dezavantaj oluşturabilmektedir. Genel olarak bulgular, Türkçe büyük dil modellerinin saha koşullarında dağıtımı açısından nicemleme yöntemlerinin uygulanabilir ve etkili bir optimizasyon stratejisi olduğunu ortaya koymaktadır. Bu çalışma, Türkçe LLM ekosisteminde görev-duyarlı nicemleme stratejilerinin geliştirilmesi ve uygulanmasına yönelik somut ilkeler sunarak, gelecekteki model verimliliği çalışmalarına anlamlı bir katkı sağlamaktadır.

Anahtar Kelimeler

Kaynakça

  1. [1]. T. Brown vd., “Language Models are Few-Shot Learners”, içinde Advances in Neural Information Processing Systems, Curran Associates, Inc., 2020, ss. 1877-1901. Erişim: 27 Temmuz 2025. [Çevrimiçi]. Erişim adresi: https://proceedings.neurips.cc/paper_files/paper/2020/hash/1457c0d6bfcb4967418bfb8ac142f64a-Abstract.html
  2. [2]. A. Vaswani vd., “Attention is All you Need”, içinde Advances in Neural Information Processing Systems, Curran Associates, Inc., 2017. Erişim: 27 Temmuz 2025. [Çevrimiçi]. Erişim adresi: https://proceedings.neurips.cc/paper/2017/hash/3f5ee243547dee91fbd053c1c4a845aa-Abstract.html
  3. [3]. J. Lin, J. Tang, H. Tang, S. Yang, G. Xiao, ve S. Han, “AWQ: Activation-aware Weight Quantization for On-Device LLM Compression and Acceleration”, GetMobile: Mobile Comp. and Comm., c. 28, sy 4, ss. 12-17, Oca. 2025, doi: 10.1145/3714983.3714987.
  4. [4]. Z. Liu vd., “LLM-QAT: Data-Free Quantization Aware Training for Large Language Models”, 29 Mayıs 2023, arXiv: arXiv:2305.17888. doi: 10.48550/arXiv.2305.17888.
  5. [5]. Z. Liu vd., “SpinQuant: LLM quantization with learned rotations”, 20 Şubat 2025, arXiv: arXiv:2405.16406. doi: 10.48550/arXiv.2405.16406.
  6. [6]. Y. Zhao vd., “Atom: Low-Bit Quantization for Efficient and Accurate LLM Serving”, Proceedings of Machine Learning and Systems, c. 6, ss. 196-209, May. 2024.
  7. [7]. S. Dong, W. Cheng, J. Qin, ve W. Wang, “QAQ: Quality Adaptive Quantization for LLM KV Cache”, 12 Nisan 2024, arXiv: arXiv:2403.04643. doi: 10.48550/arXiv.2403.04643.
  8. [8]. J. Lang, Z. Guo, ve S. Huang, “A Comprehensive Study on Quantization Techniques for Large Language Models”, 30 Ekim 2024, arXiv: arXiv:2411.02530. doi: 10.48550/arXiv.2411.02530.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Doğal Dil İşleme

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

24 Aralık 2025

Gönderilme Tarihi

6 Aralık 2025

Kabul Tarihi

21 Aralık 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 8 Sayı: 2

Kaynak Göster

APA
Bayram, C., Turan, C. A., Kürkçüoğlu, F., & Altıntaş, V. (2025). Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme. Veri Bilimi, 8(2), 70-80. https://izlik.org/JA77KD25EM
AMA
1.Bayram C, Turan CA, Kürkçüoğlu F, Altıntaş V. Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme. Veri Bilim Derg. 2025;8(2):70-80. https://izlik.org/JA77KD25EM
Chicago
Bayram, Cengizhan, Cevdet Ahmet Turan, Ferhat Kürkçüoğlu, ve Volkan Altıntaş. 2025. “Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme”. Veri Bilimi 8 (2): 70-80. https://izlik.org/JA77KD25EM.
EndNote
Bayram C, Turan CA, Kürkçüoğlu F, Altıntaş V (01 Aralık 2025) Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme. Veri Bilimi 8 2 70–80.
IEEE
[1]C. Bayram, C. A. Turan, F. Kürkçüoğlu, ve V. Altıntaş, “Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme”, Veri Bilim Derg, c. 8, sy 2, ss. 70–80, Ara. 2025, [çevrimiçi]. Erişim adresi: https://izlik.org/JA77KD25EM
ISNAD
Bayram, Cengizhan - Turan, Cevdet Ahmet - Kürkçüoğlu, Ferhat - Altıntaş, Volkan. “Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme”. Veri Bilimi 8/2 (01 Aralık 2025): 70-80. https://izlik.org/JA77KD25EM.
JAMA
1.Bayram C, Turan CA, Kürkçüoğlu F, Altıntaş V. Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme. Veri Bilim Derg. 2025;8:70–80.
MLA
Bayram, Cengizhan, vd. “Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme”. Veri Bilimi, c. 8, sy 2, Aralık 2025, ss. 70-80, https://izlik.org/JA77KD25EM.
Vancouver
1.Cengizhan Bayram, Cevdet Ahmet Turan, Ferhat Kürkçüoğlu, Volkan Altıntaş. Türkçe LLM’lerde Nicemleme Dengelemesi: Doğruluk, Hız ve Bellek Kullanımı Üzerine Bir Değerlendirme. Veri Bilim Derg [Internet]. 01 Aralık 2025;8(2):70-8. Erişim adresi: https://izlik.org/JA77KD25EM