Bu çalışmanın temel amacı Oğuz grubu yazı dillerinin birbirlerine karşı fonetik uzaklıklarını tespit etmektir. Çalışmada fonetik uzaklıkların tespiti için bilgisayarlı dil bilim alanında sıkça kullanılan niceliksel ölçüm tekniklerinden Levenshtein uzaklık algoritması kullanılmıştır. Bu bağlamda, çalışmanın Türkiye’deki lehçe bilim araştırmalarında kullanılabilecek bir yöntemi tanıtarak ilgili alanda yeni değerlendirmelerin yapılması adına katkı sunması hedeflenmektedir.
Vladimir Levenshtein tarafından geliştirilen ve birçok alanda kullanılan Levenshtein uzaklık algoritması, bir sözcük dizisini diğerine dönüştürürken kullanılabilecek ekleme, çıkarma ve yer değiştirme işlemlerinden matematiksel olarak en az işlem gerektiren sayısal değeri tespit etmede kullanılan bir algoritmadır. Levenshtein uzaklık algoritması, lehçe bilim çalışmalarında ilk olarak Brett Kessler tarafından kullanılmıştır. Bu çalışmadaki ilk denemenin başarılı olmasının ardından birçok lehçe bilimcinin algoritmaya ilgisi artmış, aynı yöntemle birçok dil değişkesinin fonetik uzaklığını ele alan çalışmalar yapılmıştır.
Bu çalışmada Türkiye Türkçesi, Azerbaycan Türkçesi, Türkmen Türkçesinin birbirlerine fonetik uzaklığı Levenshtein uzaklık algoritması ile ölçülecektir. Çalışmanın genellenebilir sonuçlar vermesi adına Türkçe Sıklık Sözlüğü’ne göre en sık kullanılan 40 fiil ve 13 tematik başlıktan (hayvan, beden, yiyecek, giyim, ulaşım, aile, madde, zaman, spor, tabiat, hava, meslek ve renk) 216 adet isim olmak üzere toplam 256 Türkçe madde başı sözcük belirlenmiştir. Sözcükler hedef dillere ana dili konuşurları tarafından tercüme edilmiştir. Sözcükler, ana dili konuşurlarına seslettirilmiş ve sözcük telaffuzları uluslararası fonetik alfabeye aktarılmıştır. Kaynak dilden her sözcük ile hedef dildeki karşılığı LUA ile hesaplanarak sözcüklerin fonetik uzaklıkları tespit edilmişir. Örnek setindeki tüm sözcük çiftlerine bu işlem uygulandıktan sonra hesaplanan ortalama değer temel alınarak Oğuz grubu Türk yazı dillerinin birbirlerine olan ortalama fonetik uzaklığı hesaplanmıştır.
Oğuz grubu yazı dilleri Levenshtein uzaklık algoritması fonetik uzaklık Türkiye Türkçesi Türkmen Türkçesi Azerbaycan Türkçesi
YOK
This study aims to determine the phonetic distances of the written languages of the Oghuz Turkic group. To determine phonetic distances, Levenshtein distance algorithm, which is one of the quantitative measurement techniques frequently used in the field of computational linguistics, will be used. In this context, by introducing a method that can be used in dialectology studies in Turkey, it is aimed that the study will contribute to making new evaluations in the related field.
Levenshtein distance algorithm, which was developed by Levenshtein (1966) and has been used in different fields, is a string metric for measuring the difference between two sequences. The main working principle of the algorithm is to determine the numerical value that requires the least mathematical operation from one of the operations-insertion, deletion, substitution-that must be used when converting one string to another. Levenshtein distance algorithm was first used by Brett Kessler in dialectology studies. After the success of the first attempt in Kessler (1995), many dialectologists' interest in the algorithm has increased, and many studies on phonetic distance between different language varieties have been carried out.
In this study, the phonetic distance of Turkey Turkish, Azerbaijan Turkish and Turkmen Turkish will be measured by using Levenstein distance algorithm. In order for the study to yield generalizable results a list consisting of the most frequently used 40 verbs and 216 nouns from 13 thematic titles (animal, body, food, clothing, transportation, family, material, time, sports, nature, weather, job and color) will be prepared. After having the list translated into the target languages by native speakers, the words will be transcribed in IPA. Phonetic distance between each words from the source language and its equivalent in the target language will be calculated. After applying this process to all word pairs in the list, the average phonetic distance between Oghuz Turkic languages will be calculated.
Oghuz Group Turkic Languages Levenshtein Distance Algorithm Phonetic Distance Linguistic Distance
Birincil Dil | Türkçe |
---|---|
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 31 Mayıs 2023 |
Gönderilme Tarihi | 14 Kasım 2022 |
Yayımlandığı Sayı | Yıl 2023 |
Asya Studies dergisinde yer alan eserler Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.