@article{article_1755684, title={Tıbbi Akıl Yürütme için Gemma 3 Modellerinin CoT Destekli SFT ve GRPO ile İncelenmesi}, journal={Çukurova Üniversitesi Mühendislik Fakültesi Dergisi}, volume={40}, pages={593–606}, year={2025}, DOI={10.21605/cukurovaumfd.1755684}, author={İşeri, İsmail and Yıldırım, Alper and Öztorun, Alihan and Tuna, Tuğba and Turan, Arda}, keywords={Büyük Dil Modelleri (LLM), Tıbbi Akıl Yürütme, Düşünce Zinciri (CoT), Grup Göreli Politika Optimizasyonu (GRPO)}, abstract={Bu çalışmada, Gemma 3 1B ve Gemma 4B büyük dil modellerinin tıbbi alandaki karmaşık akıl yürütme yeteneklerinin geliştirilmesi ve değerlendirilmesi amaçlanmıştır. Bu kapsamda, SFT (Gözetimli İnce Ayar) ve GRPO (Grup Göreli Politika Optimizasyonu) gibi eğitim stratejilerinin Gemma 3 1B ve Gemma 4B modelleri üzerindeki performansı incelenmiştir. Temel modellerin değerlendirilmesi sürecinde, SFT ile Düşünce Zinciri (CoT) formatının öğretilmesi ve GRPO ile akıl yürütmenin rafine edilmesi adımlarını içeren çok aşamalı bir yaklaşım izlenmiştir. GPT-4.1 hakem modeliyle yapılan değerlendirmeler sonucunda, model performansının belirgin şekilde artırıldığı gösterilmiştir. SFT ve GRPO eğitimleriyle modelin mantıksal olarak tutarlı bir akıl yürütme süreci oluşturma becerisinin (Mantık Yürütme Doğruluğu’nun %26’dan %31’e yükseltilmesiyle) başarıyla geliştirildiği ortaya konmuştur. Bu durum, modelin cevapları ezberlemek yerine nasıl düşüneceğinin öğrenildiğini kanıtlamaktadır.}, number={3}, publisher={Çukurova Üniversitesi}, organization={TÜBİTAK}