Semantic networks are kind of datasets used for natural language processing. Distance measurement for semantic networks, which are generally based on graph structure, is a vital requirement for semantic analysis on concepts. Centrality measures can be used for calculating semantic distance between concepts in a semantic network. In this paper, we evaluated graph centrality algorithms including PageRank, HITS and Betweenness Centrality on a semantic network which was created from a Turkish dictionary. Centrality measures special to these algorithms are used to calculate semantic distance between synonym pairs in the semantic network. And we used a simple centrality method beside other three popular centrality algorithms to find out the most accurate and cost-effective method on our semantic network. Working on a bipartite model of the network which increases the complexity of implementation for centrality algorithms and performing calculations on a semantic network that can be expanded with new nodes and edges in periods of time are two major challenges to overcome. Considering all these conditions, results from each algorithm are compared to pick out an optimal method for the semantic network we created.
Betweenness Centrality HITS HITS PageRank PageRank Semantic Distance Semantic Networks
Tübitak
215E256
This study is a part of the research programme with project number 215E256, which is financed by the Scientific and Technological Research Council of Turkey (TUBITAK).
Anlamsal ağlar, doğal dil işleme için kullanılan graf tabanlı veri kümeleridir. Anlamsal ağlarda mesafe ölçümü ise, kavramların ağ içinde ilişkiler ile birbirine bağlılığının anlamsal analizi için çok önemli bir yere sahiptir. Bağlantılılık ölçümleriyle elde edilen değerler, anlamsal ağlardaki kavramlar arasındaki mesafe hesaplamaları için kullanılabilinir. Bu çalışmada, PageRank, HITS ve Arasındalık Merkeziliği graf bağlantılılık algoritmaları, Türkçe sözlükteki kavramlardan oluşturulan anlamsal ağ üzerinde uygulanmış ve elde edilen değerler ile anlamsal ağdaki eş anlamlı sözcükler arasındaki mesafe hesaplanmıştır. Bu üç önemli graf bağlantılılık algoritmaları, bu çalışmada kullanılan anlamsal ağ için tasarlanmış olan temel bir bağlantılılık yöntemiyle karşılaştırılmıştır. İki parçalı graf tasarımı ile oluşturulmuş olan Türkçe Sözlük anlamsal ağı üzerinde geleneksel graf bağlantılılık algoritmalarının uygulanması daha karmaşık hale gelmektedir. Uygulama esnasında gereken işleme zamanının arttırması, ayrıca ağa eklenecek olan yeni kavramlar ve bağlantılar ağın tekrar anlamsal mesafe için hesaplamalara ihtiyaç duyması, bağlantılılık algoritmalarının karşılaştığı iki önemli sorundur. Bu sorunlar ve anlamsal ağın iki parçalı graf yapısı göz önüne alındığında, her bir algoritma ile elde edilen sonuçlar karşılaştırılmış ve tasarlanan anlamsal ağ için en verimli yöntem bulunmaya çalışılmıştır.
Arasındalık Merkeziliği HITS PageRank Anlamsal Mesafe Anlamsal Ağlar
215E256
Birincil Dil | İngilizce |
---|---|
Konular | Matematik |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Proje Numarası | 215E256 |
Yayımlanma Tarihi | 31 Aralık 2020 |
Yayımlandığı Sayı | Yıl 2020 Cilt: 1 Sayı: 2 |
Lapseki MYO Uygulamalı Araştırmalar Dergisi ücretsizdir. Yayınlanacak makaleler için herhangi bir ücret talep edilmez