Araştırma Makalesi
BibTex RIS Kaynak Göster

A Comparison of Graph Centrality Algorithms For Semantic Distance

Yıl 2020, Cilt: 1 Sayı: 2, 61 - 70, 31.12.2020

Öz

Semantic networks are kind of datasets used for natural language processing. Distance measurement for semantic networks, which are generally based on graph structure, is a vital requirement for semantic analysis on concepts. Centrality measures can be used for calculating semantic distance between concepts in a semantic network. In this paper, we evaluated graph centrality algorithms including PageRank, HITS and Betweenness Centrality on a semantic network which was created from a Turkish dictionary. Centrality measures special to these algorithms are used to calculate semantic distance between synonym pairs in the semantic network. And we used a simple centrality method beside other three popular centrality algorithms to find out the most accurate and cost-effective method on our semantic network. Working on a bipartite model of the network which increases the complexity of implementation for centrality algorithms and performing calculations on a semantic network that can be expanded with new nodes and edges in periods of time are two major challenges to overcome. Considering all these conditions, results from each algorithm are compared to pick out an optimal method for the semantic network we created.

Destekleyen Kurum

Tübitak

Proje Numarası

215E256

Teşekkür

This study is a part of the research programme with project number 215E256, which is financed by the Scientific and Technological Research Council of Turkey (TUBITAK).

Kaynakça

  • Brin, S., Page, L., 1998. The anatomy of a large-scale hypertextual web search engine.
  • Freeman, L. C., 1977. A set of measures of centrality based on betweenness. Sociometry, 35-41.
  • Kleinberg, J. M., Kumar, R., Raghavan, P., Rajagopalan, S., Tomkins, A. S. 1999. The web as a graph: measurements, models, and methods. In International Computing and Combinatorics Conference (pp. 1-17). Springer, Berlin, Heidelberg.
  • Miller, G. A., 1995. WordNet: a lexical database for English. Communications of the ACM, 38(11), 39-41.
  • Li, W., Liu, C. C., Zhang, T., Li, H., Waterman, M. S., Zhou, X. J., 2011. Integrative analysis of many weighted co-expression networks using tensor computation. PLoS Comput Biol, 7(6), e1001106.
  • Turan, E., Orhan, U., 2018. Building a Turkish Semantic Network and Connecting Synonym Senses Bidirectionally. In 2018 Innovations in Intelligent Systems and Applications (INISTA) (pp. 1-6). IEEE.
  • Veronis, J., Ide, N., 1990. Word sense disambiguation with very large neural networks extracted from machine readable dictionaries. In COLNG 1990 Volume 2: Papers presented to the 13th International Conference on Computational Linguistics.

Graf Merkezilik Algoritmalarının Anlamsal Mesafe İçin Karşılaştırılmaları

Yıl 2020, Cilt: 1 Sayı: 2, 61 - 70, 31.12.2020

Öz

Anlamsal ağlar, doğal dil işleme için kullanılan graf tabanlı veri kümeleridir. Anlamsal ağlarda mesafe ölçümü ise, kavramların ağ içinde ilişkiler ile birbirine bağlılığının anlamsal analizi için çok önemli bir yere sahiptir. Bağlantılılık ölçümleriyle elde edilen değerler, anlamsal ağlardaki kavramlar arasındaki mesafe hesaplamaları için kullanılabilinir. Bu çalışmada, PageRank, HITS ve Arasındalık Merkeziliği graf bağlantılılık algoritmaları, Türkçe sözlükteki kavramlardan oluşturulan anlamsal ağ üzerinde uygulanmış ve elde edilen değerler ile anlamsal ağdaki eş anlamlı sözcükler arasındaki mesafe hesaplanmıştır. Bu üç önemli graf bağlantılılık algoritmaları, bu çalışmada kullanılan anlamsal ağ için tasarlanmış olan temel bir bağlantılılık yöntemiyle karşılaştırılmıştır. İki parçalı graf tasarımı ile oluşturulmuş olan Türkçe Sözlük anlamsal ağı üzerinde geleneksel graf bağlantılılık algoritmalarının uygulanması daha karmaşık hale gelmektedir. Uygulama esnasında gereken işleme zamanının arttırması, ayrıca ağa eklenecek olan yeni kavramlar ve bağlantılar ağın tekrar anlamsal mesafe için hesaplamalara ihtiyaç duyması, bağlantılılık algoritmalarının karşılaştığı iki önemli sorundur. Bu sorunlar ve anlamsal ağın iki parçalı graf yapısı göz önüne alındığında, her bir algoritma ile elde edilen sonuçlar karşılaştırılmış ve tasarlanan anlamsal ağ için en verimli yöntem bulunmaya çalışılmıştır.

Proje Numarası

215E256

Kaynakça

  • Brin, S., Page, L., 1998. The anatomy of a large-scale hypertextual web search engine.
  • Freeman, L. C., 1977. A set of measures of centrality based on betweenness. Sociometry, 35-41.
  • Kleinberg, J. M., Kumar, R., Raghavan, P., Rajagopalan, S., Tomkins, A. S. 1999. The web as a graph: measurements, models, and methods. In International Computing and Combinatorics Conference (pp. 1-17). Springer, Berlin, Heidelberg.
  • Miller, G. A., 1995. WordNet: a lexical database for English. Communications of the ACM, 38(11), 39-41.
  • Li, W., Liu, C. C., Zhang, T., Li, H., Waterman, M. S., Zhou, X. J., 2011. Integrative analysis of many weighted co-expression networks using tensor computation. PLoS Comput Biol, 7(6), e1001106.
  • Turan, E., Orhan, U., 2018. Building a Turkish Semantic Network and Connecting Synonym Senses Bidirectionally. In 2018 Innovations in Intelligent Systems and Applications (INISTA) (pp. 1-6). IEEE.
  • Veronis, J., Ide, N., 1990. Word sense disambiguation with very large neural networks extracted from machine readable dictionaries. In COLNG 1990 Volume 2: Papers presented to the 13th International Conference on Computational Linguistics.
Toplam 7 adet kaynakça vardır.

Ayrıntılar

Birincil Dil İngilizce
Konular Matematik
Bölüm Araştırma Makaleleri
Yazarlar

Erhan Turan Bu kişi benim 0000-0002-2953-2698

Enis Arslan 0000-0002-2609-3925

Çağatay Tülü Bu kişi benim 0000-0002-4462-3707

Umut Orhan 0000-0003-1882-6567

Proje Numarası 215E256
Yayımlanma Tarihi 31 Aralık 2020
Yayımlandığı Sayı Yıl 2020 Cilt: 1 Sayı: 2

Kaynak Göster

APA Turan, E., Arslan, E., Tülü, Ç., Orhan, U. (2020). A Comparison of Graph Centrality Algorithms For Semantic Distance. Lapseki Meslek Yüksekokulu Uygulamalı Araştırmalar Dergisi, 1(2), 61-70.

Lapseki MYO Uygulamalı Araştırmalar Dergisi ücretsizdir. Yayınlanacak makaleler için herhangi bir ücret talep edilmez