Yapay zekânın bir kolu olan doğal dil işleme, metin verilerinin üretilmesine, sınıflandırılmasına ve işlenmesine imkân verir. Doğal dil işleme alanlarından metin sınıflandırma, metinlerden anlamlı bilgiler çıkarılmasında önemli bir yere sahiptir. Bu çalışmada literatürde farklı diller için başarılı sınıflandırma performansı gösteren derin öğrenme modelleri kullanılarak Türkçe haber metinleri üzerinde sınıflandırma işlemi gerçekleştirilmiş ve elde edilen sonuçlar karşılaştırılmıştır. Kullanılan veri seti yaklaşık 25 bin Türkçe haber metninden oluşmaktadır. Veri setinde bulunan metinler farklı derin öğrenme mimarileri ve transformer modeller ile önceden belirlenmiş haber kategorilerine göre sınıflandırılmışlardır. Çalışma sonucunda, BERT mimarisi ile %92,40 doğruluk oranı ile en yüksek performansı sergilediği, hiyerarşik LSTM üzerine dikkat mekanizması eklenerek geliştirilen H-LSTM-ATT modelinin %91,52 doğruluk ile dikkat çekici bir başarı sağladığı, en düşük doğruluk oranının ise derin 2D CNN modelinde (%89,35) elde edildiği görülmüştür. Özellikle transformer modellerinin ve dikkat mekanizması eklenmiş hibrit derin öğrenme mimarilerinin Türkçe metin sınıflandırma görevlerinde diğer modellere kıyasla daha başarılı olduğu sonucuna varılmıştır.
Derin öğrenme Hibrit modeller Hiyerarşik modeller Dikkat mekanizması Türkçe metin sınıflandırma Transformer
Natural language processing, a branch of artificial intelligence, enables the generation, classification, and processing of text data. Text classification, a branch of natural language processing, plays a crucial role in extracting meaningful information from texts. In this study, classification was performed on Turkish news texts using deep learning models that have demonstrated successful classification performance for different languages in the literature, and the results were compared. The dataset used consisted of approximately 25,000 Turkish news texts. Before classification, the texts were normalized through data preprocessing steps and vectorized using the GloVe word representation method. Text classification was then performed using the designed deep learning models As a result of the study, it was seen that the BERT architecture exhibited the highest performance with an accuracy rate of 92.40%, the H-LSTM-ATT model, developed by adding attention mechanism on hierarchical LSTM, achieved a remarkable success with an accuracy of 91.52%, and the lowest accuracy rate was obtained in the deep 2D CNN model (89.35%). It has been concluded that especially transformer architectures and hybrid deep learning models with added attention mechanism are more successful than other models in Turkish text classification tasks.
Deep learning Hybrid models Hierarchical models Attention mechanism Transformer Turkish text classification
| Primary Language | Turkish |
|---|---|
| Subjects | Decision Support and Group Support Systems |
| Journal Section | Review Article |
| Authors | |
| Submission Date | May 29, 2025 |
| Acceptance Date | October 9, 2025 |
| Early Pub Date | December 16, 2025 |
| Publication Date | December 22, 2025 |
| Published in Issue | Year 2025 Volume: 18 Issue: 2 |