Morphological analysing is one of the main issues in natural language processing and which is base for morphological disambiguation, syntactic parsing and machine translation systems. Two level morphology is known as the first general model for the analysis and generation of morphologically complex languages. This paper gives a detailed two level morphological analysis of Uzbek via Nuve Studio morphological analyser. Nuve is an open source library for morphological analysis. Nuve Studio is developed for this study, which is available on www.nuvestudio.com. In the implementation, 30.000 words are used as root word lexicon. The ortographic rules of contemporary Uzbek (in new Latin alphabet) are encoded using 26 two level rules. Morphotactics of Uzbek word structures have been encoded as finite state machines for verbal and nominal paradigm. Phonological and morphological special cases, limitations and exceptions are given with examples. This study will be pioneering study for Uzbek language processing and morphology based machine translation between Uzbek and other Turkic languages which have a lot in common from lexical, morphological and syntactic aspects.
Uzbek Morphology Natural Language Processing Computational Linguistics Morphological Analysis Orthographic Rules
Biçimbilimsel (morfolojik) belirsizlik giderme, sözdizimsel ayrıştırma ve makine çeviri sistemlerinin temelini oluşturan morfolojik analiz, doğal dil işlemedeki ana konulardan birisidir. İki düzeyli morfoloji, biçimbilimsel olarak karmaşık dillerin analizi ve üretimi için ilk genel model olarak bilinir. Bu makalede, Özbekçe’nin iki düzeyli morfolojik analizi, Nuve biçimbilimsel çözümleyici ile ayrıntılı olarak sunulmaktadır. Nuve, biçimbilimsel analiz için kullanılan açık kaynak kodlu bir kütüphanedir. Nuve Studio, www.nuvestudio.com internet adresinden erişilebilmekte olup, bu çalışma için geliştirilmiştir. Uygulama aşamasında, 30.000 kelime, kök kelime sözlüğü olarak kullanılmıştır. Çağdaş Özbekçe (yeni latin alfabesiyle) 26 iki düzeyli yazım (ortografik) kuralı ile tanımlanmıştır. Özbekçe kelime yapılarının biçim dizgeleri (morfotaktikleri) fiil ve isim paradigmaları için sonlu durum makineleri ile gösterilmiştir. Fonolojik ve morfolojik özel durumlar, kısıtlamalar ve istisnalar örneklerle verilmiştir. Bu çalışma, sözcüksel, morfolojik ve sözdizimsel açıdan birçok ortak yönü bulunan Özbekçe ile diğer Türk dilleri arasında, Özbekçe dil işleme ve morfoloji tabanlı makine çevirisi için öncü bir çalışma olacaktır.
Özbek Morfolojisi Doğal Dil İşleme Hesaplamalı Dilbilim Morfolojik Analiz Ortografik Kurallar
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | MBD |
Yazarlar | |
Yayımlanma Tarihi | 20 Mart 2022 |
Gönderilme Tarihi | 15 Aralık 2021 |
Yayımlandığı Sayı | Yıl 2022 |