A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH

Cilt: 7 Sayı: 2 21 Aralık 2014
  • Kübra Adalı
  • A. Cüneyd Tantuğ
PDF İndir
EN

A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH

Öz

In this paper, we presented a noun phrase chunker for Turkish as an agglutinative language. For finding noun phrases in Turkish sentences, we propose a rule based model which includes preprocessing part and a unit that applies the local grammatical rules to the output of the dependency parser. To the best of our knowledge, our model gives the first results on noun phrase chunking of Turkish sentences that is expected to find not only the basic noun phrase sentences but also the complex noun phrases including the relative clauses. We believe that on that sense, our model will be a good reference for future studies in this domain. We tested our model both on manually annotated data and the output version of the dependency parser. Our model gives the results with annotated data for full match 66.15\% and the partial match 76.79\% (for F1 results). Using output of the dependency parser, the results are 47.91\% and 60.75\% for F1 results accordingly (for F1 results)

Kaynakça

  1. Masayuki Asahara, Chooi Ling Goh, Xiaojie Wang, and Yuji Matsumoto. 2003. Combining segmenter and chunker for chinese word segmentation. In Pro- ceedings of the Second SIGHAN Workshop on Chinese Language Processing - Volume 17, SIGHAN’03, pages 144–147, Stroudsburg, PA, USA. Association for Computational Linguistics.
  2. Nart B. Atalay, Kemal Oflazer, Bilge Say, and Informatics Inst. 2003. The annotation process in the turkish treebank. In Proc. of the 4th Intern. EACL Workshop on Linguistically Interpreteted Corpora (LINC).
  3. Michaela Atterer and David Schlangen. 2009.Rubisc: A robust unification-based incremental semantic chunker. In Proceedings of the 2Nd Workshop on Semantic Representation of Spoken Language, SRSL’09, pages 66–73, Stroudsburg, PA, USA. Association for Computational Linguistics.
  4. Claire Cardie and David Pierce. 1998. Errordriven pruning of treebank grammars for base noun phrase identification. In Proceedings of the 17th International Conference on Computational Linguistics - Volume 1, COLING’98, pages 218–224, Stroudsburg, PA, USA. Association for Computational Linguistics.
  5. Kenneth Ward Church. 1988. A stochastic parts program and noun phrase parser for unrestricted text. In Proceedings of the Second Conference on Applied Natural Language Processing, ANLC’88, pages 136–143,Stroudsburg, PA, USA. Association for Computational Linguistics.
  6. V. Dhanalakshmi, P. Padmavathy, M. Anand Kumar, K. P. Soman, and S. Rajendran. 2009. Chunker for tamil. In ARTCom, pages 436–438. IEEE Computer Society.
  7. Ilknur Durgar El-Kahlout and Ahmet Afsin Akin.2013. Turkish constituent chunking with morphological and contextual features. In CICLing (1), pages 270–281.
  8. Gülşen Eryiğit, Tugay Ilbay, and Ozan Arkan Can.2011. Multiword expressions in statistical dependency parsing. In Proceedings of the Second Work- shop on Statistical Parsing of Morphologically Rich Languages ( IWPT 12th International Conference on Parsing Technologies), pages 45–55, Dublin, Ireland, October. Association for Computational Linguistics.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

-

Yazarlar

Kübra Adalı Bu kişi benim

A. Cüneyd Tantuğ Bu kişi benim

Yayımlanma Tarihi

21 Aralık 2014

Gönderilme Tarihi

24 Haziran 2016

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2014 Cilt: 7 Sayı: 2

Kaynak Göster

APA
Adalı, K., & Tantuğ, A. C. (2014). A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 7(2), 17-25. https://izlik.org/JA89LM49FP
AMA
1.Adalı K, Tantuğ AC. A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH. TBV-BBMD. 2014;7(2):17-25. https://izlik.org/JA89LM49FP
Chicago
Adalı, Kübra, ve A. Cüneyd Tantuğ. 2014. “A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 7 (2): 17-25. https://izlik.org/JA89LM49FP.
EndNote
Adalı K, Tantuğ AC (01 Aralık 2014) A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 7 2 17–25.
IEEE
[1]K. Adalı ve A. C. Tantuğ, “A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH”, TBV-BBMD, c. 7, sy 2, ss. 17–25, Ara. 2014, [çevrimiçi]. Erişim adresi: https://izlik.org/JA89LM49FP
ISNAD
Adalı, Kübra - Tantuğ, A. Cüneyd. “A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 7/2 (01 Aralık 2014): 17-25. https://izlik.org/JA89LM49FP.
JAMA
1.Adalı K, Tantuğ AC. A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH. TBV-BBMD. 2014;7:17–25.
MLA
Adalı, Kübra, ve A. Cüneyd Tantuğ. “A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, c. 7, sy 2, Aralık 2014, ss. 17-25, https://izlik.org/JA89LM49FP.
Vancouver
1.Kübra Adalı, A. Cüneyd Tantuğ. A RULE BASED NOUN PHRASE CHUNKER FOR TURKISH. TBV-BBMD [Internet]. 01 Aralık 2014;7(2):17-25. Erişim adresi: https://izlik.org/JA89LM49FP

https://i.creativecommons.org/l/by-nc/4.0Makale Kabulü

 

Çevrimiçi makale yüklemesi yapmak için kullanıcı kayıt/girişini kullanınız.

Dergiye gönderilen makalelerin kabul süreci şu aşamalardan oluşmaktadır:

1.       Gönderilen her makale ilk aşamada en az iki hakeme gönderilmektedir.

2.       Hakem ataması, dergi editörleri tarafından yapılmaktadır. Derginin hakem havuzunda yaklaşık 200 hakem bulunmaktadır ve bu hakemler ilgi alanlarına göre sınıflandırılmıştır. Her hakeme ilgilendiği konuda makale gönderilmektedir. Hakem seçimi menfaat çatışmasına neden olmayacak biçimde yapılmaktadır.

3.       Hakemlere gönderilen makalelerde yazar adları kapatılmaktadır.

4.       Hakemlere bir makalenin nasıl değerlendirileceği açıklanmaktadır ve aşağıda görülen değerlendirme formunu doldurmaları istenmektedir.

5.       İki hakemin olumlu görüş bildirdiği makaleler editörler tarafından benzerlik incelemesinden geçirilir. Makalelerdeki benzerliğin %25’ten küçük olması beklenir.

6.       Tüm aşamaları geçmiş olan bir bildiri dil ve sunuş açısından editör tarafından incelenir ve gerekli düzeltme ve iyileştirmeler yapılır. Gerekirse yazarlara durum bildirilir.

 88x31.png   Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.