TÜRKÇE İÇİN ARDIŞIK ŞARTLI RASTGELE ALANLARLA BAĞLILIK AYRIŞTIRMA
Öz
Sekans etiketleme bir giriş dizisine karşılık bir çıkış dizisinin üretimidir. Giriş ve çıkış dizisinin içeriklerine göre doğal dil işlemenin birçok konusu (varlık isim tanıma, makine çevirisi, morfolojik analiz, cümleleri öğelerine ayırma vb.) sekans etiketleme olarak tanımlanabilir.
Bağlılık ayrıştırması, bir cümle içerisindeki sözcükler arasındaki ilişkilerin ve ilişki türlerinin belirlenmesidir ve bir cümlenin anlamsal analizinin yapılabilmesi için şarttır. Bağlılık ayrıştırması sekans etiketleme problemi olarak tanımlandığında iki çıkış dizisinin (ilişki türü, ilişkili kelime) birden üretilmesi gerekmektedir.
Bizim önerimiz, özellikle Sekans etiketleme problemlerinin çözümünde sıklıkla kullanılan Şartlı Rastgele Alanların bağlılık ayrıştırması problemi içinde kullanılabilir olduğudur. Ancak Şartlı Rastgele Alanlar tek çıkış üreten bir yöntemdir. Bu zorluğu aşabilmek için iki çıkışlı (Bağlılık Türü ve Bağlanılan Kelime) bir problem olan Bağlılık Ayrıştırması iki parçaya bölünerek çözülmüştür. Ardından elde edilen sonuçlar birleştirilerek sistemin çıktısı olarak verilmiştir. Gerçekleştirilen bu çalışma ile Türkçe için en yüksek bağlılık ayrıştırması sonuçlarına ulaşılmıştır.
Anahtar Kelimeler
Kaynakça
- Tesnière, L., (1959). Introduction A la Syntaxe Structurale, Klincksieck, Paris.
- Graham N., NLP Programming Tutorial-Dependency Parsing, http://www.phontron.com/slides/nlp-programming-en-11-depend.pdf, 25 Kasım 2013.
- Bilgin,M.,(2015). Ardışık Şartlı Rastgele Alanlarla Sekans Etiketleme, Doktora Tezi, Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü, İstanbul.
- Buchholz, S. ve Marsi, E., (2006). "CoNLL-X Shared Task on Multilingual Dependency Parsing", Computational Natural Language Learning (CoNLL), 8-9 June 2006, New York.
- Chen, W., Zhang, Y. ve Isahara, H., (2007). "A Two-Stage Parser for Multilingual Dependency Parsing", Computational Natural Language Learning (CoNLL), 28-30 June 2007, Prague.
- Ambati, B.R., Samar,H., Sambhav,J., Sharma ,D.M. ve Sangal, R. , (2010). "Two Methods to Incorporate Local Morphosyntactic Features in Hindi Dependency Parsing", Statistical Parsing of Morphologically Rich Languages (SPMRL), 5 June 2010 , Los Angeles.
- Cer, D., Marneffe, M.C., Jurafsky, D. ve Manning, C.D., (2010). "Parsing to Stanford Dependencies: Trade-offs Between Speed and Accuracy", Language Resources and Evaluation (LREC), 19-21 May 2010, Malta.
- Eryiğit,G., İlbay,T. ve Can, O.A., (2011). "Multiword Expressions in Statistical Dependency Parsing", Statistical Parsing of Morphologically Rich Languages (SPMRL), 6 October 2011, Dublin.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
-
Yayımlanma Tarihi
13 Haziran 2017
Gönderilme Tarihi
4 Mart 2016
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2017 Cilt: 32 Sayı: 2