Türkçe metin sınıflandırması ve ilişkisel analiz, dilin karmaşık yapısını anlamada ve doğal dil işleme süreçlerini geliştirmede kritik bir rol oynar. Bu çalışma, Türkçe metinlerin sınıflandırılması ve aralarındaki ilişkilerin derinlemesine analiz edilmesine odaklanmaktadır. Çalışmanın amacı, Türkçe'nin zengin morfolojik yapısını ve metinler arası ilişkileri etkin bir şekilde ele alarak, bu yapıyı yansıtan ileri düzey bir sınıflandırma modeli geliştirmektir. TRT-Haber web sayfasından elde edilen veri kümesi üzerinde graf tabanlı derin öğrenme teknikleri kullanılarak, yüksek performanslı bir model oluşturulmuştur. Metinlerin semantik vektör gösterimleri için BERT (BertTurk) modeli kullanılmış ve metinler arası ilişkileri gösteren kenar komşuluk matrisleri ile birleştirilmiştir. Bu veriler, graf sinir ağı (GNN) tabanlı sınıflandırma modeline beslenmiştir. Elde edilen sonuçlar, GNN modelinin %97.93 doğruluk oranı ile metinleri sınıflandırabildiğini ve ilişkisel yapıları başarıyla çözümleyebildiğini göstermektedir. Bu bulgular, metin sınıflandırması ve ilişkisel analizde graf tabanlı yaklaşımların etkinliğini ve potansiyelini ortaya koyarak, Türkçe metinlerin daha iyi anlaşılmasını ve işlenmesini sağlayacak yenilikçi yöntemlerin geliştirilmesine katkı sağlamaktadır.
Türkçe doğal dil işleme İlişkisel metin sınıflandırma Derin öğrenme Graf sinir ağları
Text classification and relational analysis in Turkish play a critical role in understanding the language's complex structure and enhancing natural language processing (NLP) procedures. This study focuses on the classification of Turkish texts and the in-depth analysis of the relationships between them. The aim of the study is to develop an advanced classification model that effectively captures the rich morphological structure of Turkish and the intertextual relationships. Using a dataset obtained from the TRT-Haber website, graph-based deep learning techniques were employed to create a high-performance model. The BERT (BertTurk) model was used for semantic vector representations of texts, and adjacency matrices representing intertextual relationships were integrated. These data were then fed into a graph neural network (GNN) based classification model. The results demonstrate that the GNN model can classify texts with a remarkable accuracy rate of 97.93% and successfully resolve relational structures. These findings highlight the effectiveness and potential of graph-based approaches in text classification and relational analysis, contributing to the development of innovative methods for better understanding and processing Turkish texts.
Turkish NLP Relational text classification Deep learning Graph neural networks
Birincil Dil | Türkçe |
---|---|
Konular | Derin Öğrenme, Doğal Dil İşleme |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Erken Görünüm Tarihi | 13 Ekim 2024 |
Yayımlanma Tarihi | |
Gönderilme Tarihi | 21 Ocak 2024 |
Kabul Tarihi | 5 Eylül 2024 |
Yayımlandığı Sayı | Yıl 2024 ERKEN GÖRÜNÜM |
Bu eser Creative Commons Atıf-AynıLisanslaPaylaş 4.0 Uluslararası ile lisanslanmıştır.