Serbest Sırada Birliktelik İstatistiklerinin Kullanımıyla Türkçe'nin Biçimbirimsel Belirsizliği'nin Giderilmesi
Abstract
Bu makalede, Türkçe gibi biçimsel olarak karmaşık yapıda olan dillerde sıklıkla karşılaşılan biçimbirimsel belirsizlik problemi için bir çözüm önerilmiştir. Genellikle, bu tipte bir problemin çözümü için bir cümledeki muhtemel kelime sıralarından uygun olanın seçilmesi için bilgiyi maksimuma çıkaran istatistiksel yöntemler uygulanmaktadır. Olasılıkların hesaplanması ve uygun sıranın seçilmesi için tercih edilecek metot uygulanacak dilin doğasına bağlıdır. Cümlelerde geçen kelimelerin madde başlarının oluşturduğu bir anlamsal çizgeden elde edilen birliktelik istatistikleri kullanılarak alternatifler arasından uygun olan kelime sıra dizilimi seçilmektedir. Bu çizge ağının belirsizlik içermeyen serbest sıralı karakteri istatistiklerin bağımsız olarak hesaplanmasında oldukça faydalıdır. Olasılıksal değerler Naive Bayes (NB) yöntemi kullanılarak elde edilmekte ve her kelime sıraları arasından uygun olanının, Viterbi algoritmasından esinlenilerek, maksimumu seçilmektedir.
Keywords
Birliktelik,Biçimbirimsel belirsizlik,Naive Bayes,Viterbi algoritması
Kaynakça
- Ballesteros, L. and Croft, W.B., 1998. August. Resolving ambiguity for cross-language retrieval. In Proceedings of the 21st annual international ACM SIGIR conference on Research and development in information retrieval (pp. 64-71). ACM.
- Beluga, S., Meštrović, A. and Martinčić-Ipšić, S., 2015. An overview of graph-based keyword extraction methods and approaches. Journal of information and organizational sciences, 39 (1), pp.1-20.
- Borge-Holthoefer, J. and Arenas, A., 2010. Semantic networks: Structure and dynamics. Entropy, 12 (5), pp.1264-1302.
- Duque, A., Stevenson, M., Martinez-Romo, J. and Araujo, L., 2018. Co-occurrence graphs for word sense disambiguation in the biomedical domain. Artificial intelligence in medicine.
- Eryiğit, G., 2012. Biçimbilimsel Çözümleme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 5 (2).
- Fan, X., Wang, J., Pu, X., Zhou, L. and Lv, B., 2011. On graph-based name disambiguation. Journal of Data and Information Quality (JDIQ), 2 (2), p.10.
- Hessami, E., Mahmoudi, J. and Jadidinejad, A.H., 2011. Unsupervised graph-based word sense disambiguation using the lexical relation of WordNet. Int. J. Comput. Sci. Issues (IJCSI).
- Lahiri, S., Choudhury, S.R. and Caragea, C., 2014. Keyword and keyphrase extraction using centrality measures on collocation networks. arXiv preprint arXiv:1401.6571.
- Litvak, M., Last, M., Aizenman, H., Gobits, I. and Kandel, A., 2011. DegExt—A language-independent graph-based keyphrase extractor. In Advances in Intelligent Web Mastering–3 (pp. 121-130). Springer, Berlin, Heidelberg.
- Martinez-Romo, J., Araujo, L., Borge-Holthoefer, J., Arenas, A., Capitán, J.A. and Cuesta, J.A., 2011. Disentangling categorical relationships through a graph of co-occurrences. Physical Review E, 84 (4), p.046108.