Araştırma Makalesi

Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri

Sayı: Advanced Online Publication Erken Görünüm Tarihi: 25 Nisan 2026
PDF İndir
TR EN

Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri

Öz

Arka Plan—Hukuk alanında yapay zekânın, hem mevcut kurumlara entegre edilen destekleyici sistemler hem de tamamen yapay zekâ merkezli yeni nesil hukuk teknolojisi girişimleri şeklinde geliştiği görülmektedir. Ancak Türkiye özelinde hukuk teknolojileri alanındaki çalışmaların dünya literatürüne kıyasla oldukça sınırlı olduğu görülmektedir. Bu sınırlılık, Türkçenin eklemeli yapısının NLP uygulamaları için karmaşık dilbilimsel zorluklar oluşturmasıyla ilişkilendirilmektedir. Suç türü sınıflandırması hem hukuki araştırma süreçlerini hızlandırmak hem de benzer davaların tespitini kolaylaştırmak açısından kritik bir rol oynamaktadır. Amaç—Bu çalışmanın amacı, açık kaynaklı Türkçe ceza davası karar metinlerini kullanarak klasik makine öğrenmesi ve derin öğrenme tabanlı modellerin Türkçe hukuk terminolojisi üzerindeki performanslarını karşılaştırmalı olarak analiz etmek ve otomatik metin sınıflandırması için en uygun modeli belirlemektir. Ayrıca analizler sonucunda en yüksek başarımı gösteren model kullanılarak gerçek zamanlı bir sınıflandırma sistemi geliştirip ve sistemin uygulanabilirliği test edilmektir. Yöntem— Web kazıma kullanılarak Ceza Dairesi karar metinlerinden oluşan ve yedi farklı suç türünü içeren bir veri seti oluşturulmuştur. Veri seti oluşturulurken ilk olarak web sitesinden çekilen metinler incelenmiş ve yalnızca suç türü bilgisi içerenler filtrelenmiştir. Ardından, suç türleri belirlenerek bunlara göre metinler etiketlenmiştir. Anlamsal olarak benzer olan bazı sınıflar birleştirilmiştir. Son aşamada etiketli veri seti temizlenmiş, metinlerin içerisinde yer alan etiket bilgileri çıkarılmış ve çok kısa olan metinler veri setinden kaldırılmıştır. Oluşturulan nihai veri seti, yedi farklı yapay öğrenme modeli kullanılarak eğitilmiştir. Bu modeller; TF-IDF + Naive Bayes, TF-IDF + Logistic Regression, TF-IDF + SVM, FastText + SVM, FastText + BiLSTM, BERT, RoBERTa ve DistilBERT’tir. Model performansları doğruluk ve F1-skor ölçütleri kullanılarak karşılaştırılmıştır. Elde edilen sonuçlara göre en yüksek doğruluğu sağlayan FastText + SVM modeli ile üretken yapay zeka tabanlı GPT-4o-mini modeli, eğitim veri kümesinde yer almayan veriler üzerinde gerçek zamanlı olarak test edilmiştir. Bulgular—Geleneksel makine öğrenmesi yöntemlerinden TF-IDF + SVM, %95.71 F1 skoru ile en yüksek performansı elde etmiştir. SVM'in, TF-IDF gibi terim sıklığına dayalı özellik çıkarma yöntemi karar metinlerinde sıkça yer alan ve ayırt edici gücü yüksek anahtar kelimelerin etkili biçimde temsil etmesi sayesinde derin öğrenme modellerini geride bırakmıştır. Gerçek zamanlı test aşamasında eğitilmiş TF-IDF + SVM modeli ile az örnekli öğrenme yaklaşımı kullanılan GPT-4o-mini modeli eğitim veri kümesinde yer almayan veriler üzerinde karşılaştırılmıştır. İki yaklaşım da %85.71 doğruluk ile eşdeğer performans sergilemiştir. Ancak TFIDF + SVM milisaniyeler içinde yanıt üretirken, LLM tabanlı sistemlerin yanıt süresinin daha uzun olması ve API maliyetleri, gerçek zamanlı, büyük ölçekli uygulamalar açısından önemli bir farklılık olarak öne çıkmıştır. Sonuç—Yapay öğrenme modelleri kullanılarak yapılan sınıflandırmalarda TF-IDF + SVM yönteminin, Türk dava karar metinlerindeki suç türlerini sınıflandırmada etkili olduğu gözlemlenmiştir. Bu yöntem, yapay zeka destekli hukuk sistemlerinde karar destek mekanizmalarına entegre edilebilir. Gelecekteki çalışmalar, Türk hukuk dava metinlerini kullanarak daha büyük veri setleri üzerinde ve daha geniş suç türlerini kapsayan sınıflandırma yaklaşımlarını araştırabilir.

Anahtar Kelimeler

Kaynakça

  1. [1] R. Susskind, Tomorrow’s lawyers: An introduction to your future, Third Edition, Oxford, United Kingdom, Oxford University Press, 2023.
  2. [2] K. D. Ashley, Artificial intelligence and legal analytics: new tools for law practice in the digital age, Cambridge, United Kingdom, Cambridge University Press, 2017.
  3. [3] I. Chalkidis, M. Fergadiotis, P. Malakasiotis, N. Aletras, I. Androutsopoulos, "LEGAL-BERT: The Muppets straight out of Law School", Findings of the Association for Computational Linguistics: EMNLP, Editors: T. Cohn, Y. He, Y. Liu, (Online), Association for Computational Linguistics, 2020, 2898-2904.
  4. [4] Harvey, “Harvey | Generative AI for Professional Services”, https://www.harvey.ai/ (20.12.2025).
  5. [5] LexisNexis, “Lexis+AI”, https://www.lexisnexis.com/en-int/ products/lexis-plus-ai (20.12.2025).
  6. [6] Thomson Reuters, “Westlaw Edge”, https://legal.thomsonreuters. com/en/products/westlaw-edge (20.12.2025).
  7. [7] DoNotPay, “DoNotPay - Your AI Consumer Champion”, https://donotpay.com/ (20.12.2025).
  8. [8] ROSS Intelligence, “ROSS Intelligence - Legal Tech Corner”, https://blog.rossintelligence.com/ (20.12.2025).

Ayrıntılar

Birincil Dil

Türkçe

Konular

Doğal Dil İşleme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

25 Nisan 2026

Yayımlanma Tarihi

-

Gönderilme Tarihi

21 Ocak 2026

Kabul Tarihi

31 Mart 2026

Yayımlandığı Sayı

Yıl 2026 Sayı: Advanced Online Publication

Kaynak Göster

APA
Çetin, E., Kaya, İ., & Göz, F. (2026). Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, Advanced Online Publication. https://doi.org/10.65206/pajes.1868918
AMA
1.Çetin E, Kaya İ, Göz F. Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi. 2026;(Advanced Online Publication). doi:10.65206/pajes.1868918
Chicago
Çetin, Eda, İlayda Kaya, ve Furkan Göz. 2026. “Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri”. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, sy Advanced Online Publication. https://doi.org/10.65206/pajes.1868918.
EndNote
Çetin E, Kaya İ, Göz F (01 Nisan 2026) Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Advanced Online Publication
IEEE
[1]E. Çetin, İ. Kaya, ve F. Göz, “Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri”, Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, sy Advanced Online Publication, Nis. 2026, doi: 10.65206/pajes.1868918.
ISNAD
Çetin, Eda - Kaya, İlayda - Göz, Furkan. “Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri”. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi. Advanced Online Publication (01 Nisan 2026). https://doi.org/10.65206/pajes.1868918.
JAMA
1.Çetin E, Kaya İ, Göz F. Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi. 2026. doi:10.65206/pajes.1868918.
MLA
Çetin, Eda, vd. “Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri”. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, sy Advanced Online Publication, Nisan 2026, doi:10.65206/pajes.1868918.
Vancouver
1.Eda Çetin, İlayda Kaya, Furkan Göz. Türkçe Hukuk Metinlerinin Sınıflandırılması: Gözetimli Öğrenme ve Büyük Dil Modelleri. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi. 01 Nisan 2026;(Advanced Online Publication). doi:10.65206/pajes.1868918