This study aims to to examine the dialects of a highly endangered language spoken in Iran, namely Khalaj Turkic, on the basis of the Levenshtein Distance Algorithm (LUA), which is one of the quantitative dialect measurement techniques in the relevant literature. LUA, an algorithm being frequently used in computer programming, is basically an algorithm developed to determine the distance of binary codes by deletion, addition, and reversal (Levenshtein, 1966). The cost of the algorithm is a numerical value, and this numerical value gives the number or cost of operations to make one of the two items look like the other. The lower the numerical value means that the similarity occurs with fewer changes. If the value is high, it means that the transaction cost of the similarity between items is high and the binary code is far from each other at the rate of numerical value. Doerfer (1998) classifies the Khalaj Turkic dialects into seven on a directional basis: (i) western, (ii) northern, (iii) northeastern, (iv) southern, (v) central, (vi) central eastern, and (vii) basic dialect. This study examined the lexical basis of the dialect differences on an algorithmic basis. As a result, dialectal differences pertaining to phonological distances were revealed and thus the rate of congruence with the classification of Doerfer was compared.
Khalaj Turkic Levenshtein Distance Algorithm Dialect Binary Code
Bu çalışmanın temel amacı İran’da konuşulan ve yok olma tehlikesi altında bulunan Halaç Türkçesi ağızlarını niceliksel ağız ölçüm tekniklerinden Levenshtein Uzaklık Algoritması (LUA) temelinde incelemektir. Bilgisayar programlamasında sıklıkla kullanılan bir algoritma olan LUA temel olarak ikili kodların (binary codes) silme, ekleme ve tersinim ile birbirlerine olan uzaklığının saptanabilmesi için geliştirilmiş bir algoritmadır (Levenshtein, 1966). Algoritmanın sonucu bir sayısal değerdir ve bu sayısal değer iki sözcükten birinin diğerine benzeşmesi için yapılması gereken işlem sayısını veya maliyetini vermektedir. Sayısal değerin düşük olması daha az değişiklikle benzeşmenin gerçekleşeceği anlamına gelmektedir. Değerin büyük olması ise sözcükler arasındaki benzeşimin işlem maliyetinin fazla olduğu ve söz konusu ikili kodun sayısal değer oranında birbirlerinden uzak olduğunu ifade etmektedir. Doerfer (1998), Halaç Türkçesinin ağızlarını yön temelli olarak yediye ayırmıştır: (i) batı, (ii) kuzey, (iii) kuzeydoğu, (iv) güney, (v) merkez, (vi) merkezi doğu ve (vii) temel ağız. Bu çalışma sonucunda ağız farklarının sözcüksel bağlamı algoritmik temelde incelenmiş ve ağız farklarını oluşturduğu belirlenen sözcüklerin sesbilgisel uzaklıklarının Halaç dil ekolojisi içerisindeki dağılımı saptanmıştır. Sonuç olarak ise üç ağzın Doerfer’in sınıflandırma ölçeğiyle uyuşma oranı belirlenmiş ve istatistiksel olarak anlamlı olup olmadığı saptanmıştır.
Halaç Türkçesi Levenshtein Uzaklık Algoritması Ağız İkili Kod
Metni okuyup özellikle ses bilgisi bağlamında geri-dönüt sağlayan Dr. Sinem Sonsaat-Hegelheimer'a teşekkürlerimi sunarım.
Birincil Dil | Türkçe |
---|---|
Konular | Dilbilim |
Bölüm | Dilbilim |
Yazarlar | |
Yayımlanma Tarihi | 1 Haziran 2021 |
Gönderilme Tarihi | 15 Mart 2021 |
Yayımlandığı Sayı | Yıl 2021 |