The goal in this paper is to present Dervaze, which is utilized in translation of Ottoman Turkish to Modern Turkish and vice versa through morphological analysis. As of today in the dictionary there are spellings of more than 72600 Ottoman Turkish words. It is planned to store all Ottoman Turkish vocabulary in the dictionary. Dervaze underpins the translation facilities between historical Ottoman texts to Modern Turkish. The translation tool analyses the suffix and roots of Turkish words, then renders these separately in the target language. Such a technique is preferred because the most roots are irregular in Ottoman Turkish and there is no one to one mapping between these two orthographies. The primary objective in the dictionary is to translate XIX. and XX. century texts of Ottoman Turkish. Our initial sources are 1856 Redhouse Lexicon and Belviranlı's spelling dictionary which relies on 1928 Spelling Committee's decisions. Various word lists available on the Internet are also added despite their poor quality to identify spelling variations. Spelling variations are especially important in Turkish origin words in Ottoman language, as there are no fixed spelling rules for them. It is required to list them in their entirety, as the one of the aspects of the dictionary is to provide a basis for an Optical / Intelligent Character Recognition system for the Ottoman language. As the OCR facilities become available we plan to extend the dictionary with all the primary sources automatically. Going back from XIX. century documents, we plan to include all vocabulary of Ottoman Turkish in the dictionary.
Lexicography dictionary-making computer-assisted translation optical character recognition Ottoman Turkish
Bu çalışmanın amacı elektronik imla kılavuzu Dervaze'yi ve Osmanlıca metinleri Türkçeye, Türkçesini Osmanlıcaya çeviren morfolojik çeviri aracını tanıtmaktır. Dervaze'de Osmanlı Türkçesine ait 72600 adet kelime yer almaktadır. Bu kılavuzun Osmanlı Türkçesi döneminin tüm söz varlığını barındırması planlanmaktadır. Dervaze aynı zamanda Osmanlıca metinleri günümüze kazandırmak için hazırladığımız çeviri programına da işlerlik kazandırmaktadır. Çeviri aracı Türkçe bir kelimenin morfolojik analizini yaparak, kök ve eklerini bulmakta, daha sonra bu kök ve ekleri ayrı ayrı Osmanlıcaya çevirmektedir. Türkçe ve Osmanlıca arasındaki yazım kuralları tam olarak birbirine çevrilemediği için bu yol tercih edilmiştir. Amaç Osmanlı Türkçesinin XIX. ve XX. yüzyıl metinlerini çevirmek olduğu için imla kılavuzunun kaynakları da bu yönde belirlenmiştir. 1856 yılında yayımlanan Redhouse sözlüğü ve Belviranlı’nın 1928 İmla Encümeni'nin kurallarına dayanan imla kılavuzu tercih edilmiş, İnternet'te bulunan çeşitli kelime listeleri de imla varyasyonlarını belirtmek amacıyla kullanılmıştır. İmla varyasyonları özellikle Osmanlı Türkçesinin imla kuralları çok net belirlenmemiş Türkçe unsurlarında önem kazanmaktadır. Bunların elektronik olarak tanınması ancak listelenmesiyle mümkündür ve bu nedenle tüm imla varyasyonları sözlük maddelerine dahil edilmiştir. Oluşturduğumuz sistemin Optik Karakter Tanıma özellikleri kullanıma girdikçe, dönemin tüm kelimeleri kaynaklardan taranacak ve farklı imlalar da kılavuzda yer alacaktır. XIX. yüzyıldan geriye doğru sürecek bir kaynak taramasıyla, Osmanlı Türkçesinin söz varlığının tamamını kayda geçirmeyi hedeflemekteyiz.
Sözlükbilim sözlük hazırlama bilgisayar destekli çeviri optik karakter tanıma Osmanlı Türkçesi
Birincil Dil | Türkçe |
---|---|
Konular | Türk Dili ve Edebiyatı (Diğer) |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Yayımlanma Tarihi | 30 Eylül 2017 |
Yayımlandığı Sayı | Yıl 2017 Cilt: 5 Sayı: 3 |