TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE

Cilt: 7 Sayı: 2 21 Aralık 2014
  • Olzhas Makhambetov
  • Aibek Makazhanov
  • Zhandos Yessenbayev
  • Islam Sabyrgaliyev
  • Anuar Sharafudinov
PDF İndir
EN

TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE

Öz

We propose a method for complete morphological analysis of Kazakh language that accounts for both inflectional and derivational morphology. Our method is data-driven and does not require manually generated rules, which makes it convenient for analyzing agglutinative languages. The intuition behind our approach is to label morphemes with so called transition labels, i.e. labels that encode grammatical functions of morphemes as transitions between corresponding POS, and use transitivity to ease the analysis. We evaluate our method on a fair-sized sample of real data and report encouraging results.

Kaynakça

  1. [1] D. Elworthy, “Tagset design and inflected languages,” in In EACL SIGDAT workshop iFrom Texts to Tags: Issues in Multilingual Language Analysis, 1995, pp. 1–10.
  2. [2] J. Hana and A. Feldman, “A positional tag set for Russian,” Proceedings of LREC-10. Malta, 2010.
  3. [3] K. Koskenniemi, “A general computational model for word-form recognition and production,” in Proceedings of the 10th international conference on Computational linguistics. ACL, 1984, pp. 178–181. [4] K. Oflazer and C. Güzey, “Spelling correction in agglutinative languages.” in ANLP, 1994, pp. 194–195.
  4. [5] H. Sak, T. Güngor, and M. Saraçlar, “A stochastic finite-state morphological parser for Turkish,” in Proceedings of the ACL-IJCNLP 2009 Conference. Stroudsburg, PA, USA: ACL, 2009, pp. 273–276.
  5. [6] M. Hulden, “Foma: a finite-state compiler and library.” in EACL (Demos), A. Lascarides, C. Gardent, and J. Nivre, Eds. ACL, 2009, pp. 29–32.
  6. [7] K. Linden, M. Silfverberg, E. Axelson, S. Hardwick, and T. Pirinen, HFST-Framework for Compiling and Applying Morphologies, ser. Communications in Computer and Information Science, 2011, vol. Vol. 100, pp. 67–85.
  7. [8] D. Z. Hakkani-Tur, K. Oflazer, and G. Tur, “Statistical morphological disambiguation for agglutinative languages.” Computers and the Humanities, vol. 36, no. 4, pp. 381–410, 2002.
  8. [9] J. Hajič, P. Krbec, P. Pavel Květoň, K. Oliva, and V. Petkevič, “Serial combination of rules and statistics: A case study in czech tagging,” in Proceedings of the 39th Annual Meeting on ACL. Stroudsburg, PA, USA: ACL, 2001, pp. 268–275.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

-

Yazarlar

Olzhas Makhambetov Bu kişi benim

Aibek Makazhanov Bu kişi benim

Zhandos Yessenbayev Bu kişi benim

Islam Sabyrgaliyev Bu kişi benim

Anuar Sharafudinov Bu kişi benim

Yayımlanma Tarihi

21 Aralık 2014

Gönderilme Tarihi

24 Haziran 2016

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2014 Cilt: 7 Sayı: 2

Kaynak Göster

APA
Makhambetov, O., Makazhanov, A., Yessenbayev, Z., Sabyrgaliyev, I., & Sharafudinov, A. (2014). TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 7(2), 31-36. https://izlik.org/JA74NL53GJ
AMA
1.Makhambetov O, Makazhanov A, Yessenbayev Z, Sabyrgaliyev I, Sharafudinov A. TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE. TBV-BBMD. 2014;7(2):31-36. https://izlik.org/JA74NL53GJ
Chicago
Makhambetov, Olzhas, Aibek Makazhanov, Zhandos Yessenbayev, Islam Sabyrgaliyev, ve Anuar Sharafudinov. 2014. “TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 7 (2): 31-36. https://izlik.org/JA74NL53GJ.
EndNote
Makhambetov O, Makazhanov A, Yessenbayev Z, Sabyrgaliyev I, Sharafudinov A (01 Aralık 2014) TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 7 2 31–36.
IEEE
[1]O. Makhambetov, A. Makazhanov, Z. Yessenbayev, I. Sabyrgaliyev, ve A. Sharafudinov, “TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE”, TBV-BBMD, c. 7, sy 2, ss. 31–36, Ara. 2014, [çevrimiçi]. Erişim adresi: https://izlik.org/JA74NL53GJ
ISNAD
Makhambetov, Olzhas - Makazhanov, Aibek - Yessenbayev, Zhandos - Sabyrgaliyev, Islam - Sharafudinov, Anuar. “TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 7/2 (01 Aralık 2014): 31-36. https://izlik.org/JA74NL53GJ.
JAMA
1.Makhambetov O, Makazhanov A, Yessenbayev Z, Sabyrgaliyev I, Sharafudinov A. TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE. TBV-BBMD. 2014;7:31–36.
MLA
Makhambetov, Olzhas, vd. “TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 7, sy 2, Aralık 2014, ss. 31-36, https://izlik.org/JA74NL53GJ.
Vancouver
1.Olzhas Makhambetov, Aibek Makazhanov, Zhandos Yessenbayev, Islam Sabyrgaliyev, Anuar Sharafudinov. TOWARDS A DATA-DRIVEN MORPHOLOGICAL ANALYSIS OF KAZAKH LANGUAGE. TBV-BBMD [Internet]. 01 Aralık 2014;7(2):31-6. Erişim adresi: https://izlik.org/JA74NL53GJ

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.