Türkçe metin sınıflandırması ve ilişkisel analiz, dilin karmaşık yapısını anlamada ve doğal dil işleme süreçlerini geliştirmede kritik bir rol oynar. Bu çalışma, Türkçe metinlerin sınıflandırılması ve aralarındaki ilişkilerin derinlemesine analiz edilmesine odaklanmaktadır. Çalışmanın amacı, Türkçe'nin zengin morfolojik yapısını ve metinler arası ilişkileri etkin bir şekilde ele alarak, bu yapıyı yansıtan ileri düzey bir sınıflandırma modeli geliştirmektir. TRT-Haber web sayfasından elde edilen veri kümesi üzerinde graf tabanlı derin öğrenme teknikleri kullanılarak, yüksek performanslı bir model oluşturulmuştur. Metinlerin semantik vektör gösterimleri için BERT (BertTurk) modeli kullanılmış ve metinler arası ilişkileri gösteren kenar komşuluk matrisleri ile birleştirilmiştir. Bu veriler, graf sinir ağı (GNN) tabanlı sınıflandırma modeline beslenmiştir. Elde edilen sonuçlar, GNN modelinin %97.93 doğruluk oranı ile metinleri sınıflandırabildiğini ve ilişkisel yapıları başarıyla çözümleyebildiğini göstermektedir. Bu bulgular, metin sınıflandırması ve ilişkisel analizde graf tabanlı yaklaşımların etkinliğini ve potansiyelini ortaya koyarak, Türkçe metinlerin daha iyi anlaşılmasını ve işlenmesini sağlayacak yenilikçi yöntemlerin geliştirilmesine katkı sağlamaktadır.
Text classification and relational analysis in Turkish play a critical role in understanding the language's complex structure and enhancing natural language processing (NLP) procedures. This study focuses on the classification of Turkish texts and the in-depth analysis of the relationships between them. The aim of the study is to develop an advanced classification model that effectively captures the rich morphological structure of Turkish and the intertextual relationships. Using a dataset obtained from the TRT-Haber website, graph-based deep learning techniques were employed to create a high-performance model. The BERT (BertTurk) model was used for semantic vector representations of texts, and adjacency matrices representing intertextual relationships were integrated. These data were then fed into a graph neural network (GNN) based classification model. The results demonstrate that the GNN model can classify texts with a remarkable accuracy rate of 97.93% and successfully resolve relational structures. These findings highlight the effectiveness and potential of graph-based approaches in text classification and relational analysis, contributing to the development of innovative methods for better understanding and processing Turkish texts.
Primary Language | Turkish |
---|---|
Subjects | Deep Learning, Natural Language Processing |
Journal Section | Research Article |
Authors | |
Early Pub Date | October 13, 2024 |
Publication Date | |
Submission Date | January 21, 2024 |
Acceptance Date | September 5, 2024 |
Published in Issue | Year 2024 EARLY VIEW |
This work is licensed under Creative Commons Attribution-ShareAlike 4.0 International.