Research Article
BibTex RIS Cite

ALGORITHMIC DISTANCE OF KHALAJ TURKIC DIALECTS: AN ANALYTICAL NOTE ON LEVENSHTEIN DISTANCE ALGORITHM

Year 2021, Volume: 6 Issue: 1, 247 - 267, 01.06.2021
https://doi.org/10.32321/cutad.897079

Abstract

This study aims to to examine the dialects of a highly endangered language spoken in Iran, namely Khalaj Turkic, on the basis of the Levenshtein Distance Algorithm (LUA), which is one of the quantitative dialect measurement techniques in the relevant literature. LUA, an algorithm being frequently used in computer programming, is basically an algorithm developed to determine the distance of binary codes by deletion, addition, and reversal (Levenshtein, 1966). The cost of the algorithm is a numerical value, and this numerical value gives the number or cost of operations to make one of the two items look like the other. The lower the numerical value means that the similarity occurs with fewer changes. If the value is high, it means that the transaction cost of the similarity between items is high and the binary code is far from each other at the rate of numerical value. Doerfer (1998) classifies the Khalaj Turkic dialects into seven on a directional basis: (i) western, (ii) northern, (iii) northeastern, (iv) southern, (v) central, (vi) central eastern, and (vii) basic dialect. This study examined the lexical basis of the dialect differences on an algorithmic basis. As a result, dialectal differences pertaining to phonological distances were revealed and thus the rate of congruence with the classification of Doerfer was compared.

References

  • Bolognesi, R. and Heeringa, W. (2002). De invloed van dominante talen op het lexicon en de fonologie van Sardische dialecten. D. Bakker, T. Sanders, R. Schoonen ve P. van der Wijst (Eds). Gramma/TTT: Tijdschrift voor taalwetenschap (45–84). Nijmegen: Nijmegen University Press.
  • Bosnalı, S. (2016). The Khalaj people and their languages. Tehlikedeki Türk Dilleri II A-Örnek Çalışmalar 1, 1-74 (S. Eker ve Ü. Ç. Şavk, Haz.), Astana: Uluslararası Türk Akademisi ve Hoca Ahmet Yesevi Uluslararası Türk-Kazak Üniversitesi.
  • Doerfer, G. (1971). Khalaj materials. Bloomington: Indiana University Publications.
  • Doerfer, G. (1987). Lexik uns sprachgeographie des Chaladsch. Wiesbaden: Wiesbaden: Otto Harrassowitz Verlag.
  • Doerfer, G. (1988). Grammatik des Chaladsch. Wiesbaden: Wiesbaden: Otto Harrassowitz Verlag.
  • Doerfer, G. (1998). Turkic languages of Iran. (L. Johanson ve É. Á. Csató, Haz.) Turkic Languages (273-282). London and New York: Routledge.
  • Dorian, N. C. (Ed.) (1989). Investigating obsolescence: studies in language contraction and death. Cambridge: Cambridge University Press.
  • Dressler, W. (1972). On the phonology of language death. P. M. Peranteau, J. N. Levi and G. C. Phares (Eds.), Papers from the Eighth Regional Meeting of the Chicago Linguistics Society (448-457). Chicago: Chicago Linguistic Society.
  • Ercilasun, A. B. ve Akkoyunlu, Z. (2014). Kâşgarlı Mahmûd Dîvânu Lugâti’t-Türk giriş-metin-çeviri-notlar-dizin. Ankara: Türk Dil Kurumu Yayınları.
  • Gooskens, C. ve Heeringa, W. (2004). Perceptive evaluation of Levenshtein dialect distance measurements using Norwegian dialect data. Language Variation and Change, 16(3), 189–207.
  • Heeringa, W. (2004). Measuring dialect pronunciation differences using Levenshtein distance. Unpublished PhD Thesis. Groningen: University of Groningen.
  • Jamrasi, A. A. (2016). Causes of Khalaj Turkish assimilation in Iran (N. İsmail ve C. Karini, Çev.) (S. Eker ve Ü. Ç. Şavk, Haz.). Tehlikedeki Türk Dilleri III Disiplinlerarası Yaklaşımlar Cilt 4 (233-252). Astana: Uluslararası Türk Akademisi ve Hoca Ahmet Yesevi Uluslararası Türk-Kazak Üniversitesi.
  • Levenshtein, V. I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Soviet Physics Doklady, 10 (8), 707-710.
  • Nerbonne, J. (2015). Various variation aggregates in the LAMSAS South. Pages. M. Picone ve C. Davis (Eds). New Perspectives on Language Variety in the South: Historical and Contemporary Approaches. (LAVIS III) (369–382). Tuscaloosa: University of Alabama Press.
  • Nerbonne, J. and Siedle, Ch. (2005). Dialektklassifikation auf der grundlage aggregierter ausspracheunterschiede. Zeitschrift f¨ur Dialektologie und Linguistik, 72(2), 129–147.
  • Nerbonne, J. and Wieling, M. (2018). Statistics for aggregate variationist analyses (Ch. Boberg, J. Nerbonne ve D. Watt Eds.). The Handbook of Dialectology (400-414). Hoboken, NJ: John Wiley & Sons.
  • Nerbonne, J., Heeringa, W., van den Hout, E., van de Kooi, P., Otten, S. and van de Vis, W. (1996). Phonetic distances between Dutch dialects (G. Durieux, W. Daelemans ve S. Gillis Eds.). CLIN VI: Proc. of the Sixth CLIN Meeting (185–202). Antwerp: Centre for Dutch Language and Speech (UIA).
  • O’Shannessy, C. (2011). Language contact and change in endangered languages (P. K. Austin ve J. Sallabank, Eds.). The Cambridge Handbook of Endangered Languages (78-99). Cambridge: Cambridge University Press.
  • Osenova, P., Heeringa, W. and Nerbonne, J. (2009). A quantitative analysis of Bulgarian dialect pronunciation. Zeitschrift für Slavische Philologie, 66(2), 425–458.
  • Ölmez, M. (1995). Halaçlar ve Halaçça, Çağdaş Türk Dili, 84, 15-22.
  • Palosaari, N. and Campbell, L. (2011). Structural aspects of language endangerment (P. K. Austin ve J. Sallabank, Eds.). The Cambridge Handbook of Endangered Languages (100-119). Cambridge: Cambridge University Press.
  • Ragagnin, E. (2020). Major and minor Turkic language islands in Iran with a special focus on Khalaj. Iranian Studies, 53(3-4), 573-588.
  • Rahimi, M. (2020). Dil canlılığı bağlamında Halaç Türklerinin durumu. Modern Türklük Araştırmaları Dergisi. 17(2), 131-145.
  • Ščerbak, A. M. (1997). Xaladžckij jazyk [Khalaj language]. E. R. Tenišev (Ed.). Tjurkskie jazyki [Turkic Languages]. Jazyki mira [Languages of the World] (in Russian) 2 (470–476). Moscow: Indrik.
  • Tekin, T. (1989). Türk dili diyalektlerinin yeni bir tasnifi. Erdem, 5(13), 141-168.
  • Tekin, T. (1995). Türk dillerinde birincil uzun ünlüler. Ankara: Simurg Yayınları.
  • Wieling, M., Heeringa, W. and Nerbonne, J. (2007). An aggregate analysis of pronunciation in the Goeman-Taeldeman-van Reenen-Project data. Taal en Tongval, 59(1), 84–116.

HALAÇ TÜRKÇESİ AĞIZLARININ ALGORİTMİK UZAKLIĞI: LEVENSHTEIN UZAKLIK ALGORİTMASI TABANLI BİR ÇÖZÜMLEME

Year 2021, Volume: 6 Issue: 1, 247 - 267, 01.06.2021
https://doi.org/10.32321/cutad.897079

Abstract

Bu çalışmanın temel amacı İran’da konuşulan ve yok olma tehlikesi altında bulunan Halaç Türkçesi ağızlarını niceliksel ağız ölçüm tekniklerinden Levenshtein Uzaklık Algoritması (LUA) temelinde incelemektir. Bilgisayar programlamasında sıklıkla kullanılan bir algoritma olan LUA temel olarak ikili kodların (binary codes) silme, ekleme ve tersinim ile birbirlerine olan uzaklığının saptanabilmesi için geliştirilmiş bir algoritmadır (Levenshtein, 1966). Algoritmanın sonucu bir sayısal değerdir ve bu sayısal değer iki sözcükten birinin diğerine benzeşmesi için yapılması gereken işlem sayısını veya maliyetini vermektedir. Sayısal değerin düşük olması daha az değişiklikle benzeşmenin gerçekleşeceği anlamına gelmektedir. Değerin büyük olması ise sözcükler arasındaki benzeşimin işlem maliyetinin fazla olduğu ve söz konusu ikili kodun sayısal değer oranında birbirlerinden uzak olduğunu ifade etmektedir. Doerfer (1998), Halaç Türkçesinin ağızlarını yön temelli olarak yediye ayırmıştır: (i) batı, (ii) kuzey, (iii) kuzeydoğu, (iv) güney, (v) merkez, (vi) merkezi doğu ve (vii) temel ağız. Bu çalışma sonucunda ağız farklarının sözcüksel bağlamı algoritmik temelde incelenmiş ve ağız farklarını oluşturduğu belirlenen sözcüklerin sesbilgisel uzaklıklarının Halaç dil ekolojisi içerisindeki dağılımı saptanmıştır. Sonuç olarak ise üç ağzın Doerfer’in sınıflandırma ölçeğiyle uyuşma oranı belirlenmiş ve istatistiksel olarak anlamlı olup olmadığı saptanmıştır.

Thanks

Metni okuyup özellikle ses bilgisi bağlamında geri-dönüt sağlayan Dr. Sinem Sonsaat-Hegelheimer'a teşekkürlerimi sunarım.

References

  • Bolognesi, R. and Heeringa, W. (2002). De invloed van dominante talen op het lexicon en de fonologie van Sardische dialecten. D. Bakker, T. Sanders, R. Schoonen ve P. van der Wijst (Eds). Gramma/TTT: Tijdschrift voor taalwetenschap (45–84). Nijmegen: Nijmegen University Press.
  • Bosnalı, S. (2016). The Khalaj people and their languages. Tehlikedeki Türk Dilleri II A-Örnek Çalışmalar 1, 1-74 (S. Eker ve Ü. Ç. Şavk, Haz.), Astana: Uluslararası Türk Akademisi ve Hoca Ahmet Yesevi Uluslararası Türk-Kazak Üniversitesi.
  • Doerfer, G. (1971). Khalaj materials. Bloomington: Indiana University Publications.
  • Doerfer, G. (1987). Lexik uns sprachgeographie des Chaladsch. Wiesbaden: Wiesbaden: Otto Harrassowitz Verlag.
  • Doerfer, G. (1988). Grammatik des Chaladsch. Wiesbaden: Wiesbaden: Otto Harrassowitz Verlag.
  • Doerfer, G. (1998). Turkic languages of Iran. (L. Johanson ve É. Á. Csató, Haz.) Turkic Languages (273-282). London and New York: Routledge.
  • Dorian, N. C. (Ed.) (1989). Investigating obsolescence: studies in language contraction and death. Cambridge: Cambridge University Press.
  • Dressler, W. (1972). On the phonology of language death. P. M. Peranteau, J. N. Levi and G. C. Phares (Eds.), Papers from the Eighth Regional Meeting of the Chicago Linguistics Society (448-457). Chicago: Chicago Linguistic Society.
  • Ercilasun, A. B. ve Akkoyunlu, Z. (2014). Kâşgarlı Mahmûd Dîvânu Lugâti’t-Türk giriş-metin-çeviri-notlar-dizin. Ankara: Türk Dil Kurumu Yayınları.
  • Gooskens, C. ve Heeringa, W. (2004). Perceptive evaluation of Levenshtein dialect distance measurements using Norwegian dialect data. Language Variation and Change, 16(3), 189–207.
  • Heeringa, W. (2004). Measuring dialect pronunciation differences using Levenshtein distance. Unpublished PhD Thesis. Groningen: University of Groningen.
  • Jamrasi, A. A. (2016). Causes of Khalaj Turkish assimilation in Iran (N. İsmail ve C. Karini, Çev.) (S. Eker ve Ü. Ç. Şavk, Haz.). Tehlikedeki Türk Dilleri III Disiplinlerarası Yaklaşımlar Cilt 4 (233-252). Astana: Uluslararası Türk Akademisi ve Hoca Ahmet Yesevi Uluslararası Türk-Kazak Üniversitesi.
  • Levenshtein, V. I. (1966). Binary codes capable of correcting deletions, insertions, and reversals. Soviet Physics Doklady, 10 (8), 707-710.
  • Nerbonne, J. (2015). Various variation aggregates in the LAMSAS South. Pages. M. Picone ve C. Davis (Eds). New Perspectives on Language Variety in the South: Historical and Contemporary Approaches. (LAVIS III) (369–382). Tuscaloosa: University of Alabama Press.
  • Nerbonne, J. and Siedle, Ch. (2005). Dialektklassifikation auf der grundlage aggregierter ausspracheunterschiede. Zeitschrift f¨ur Dialektologie und Linguistik, 72(2), 129–147.
  • Nerbonne, J. and Wieling, M. (2018). Statistics for aggregate variationist analyses (Ch. Boberg, J. Nerbonne ve D. Watt Eds.). The Handbook of Dialectology (400-414). Hoboken, NJ: John Wiley & Sons.
  • Nerbonne, J., Heeringa, W., van den Hout, E., van de Kooi, P., Otten, S. and van de Vis, W. (1996). Phonetic distances between Dutch dialects (G. Durieux, W. Daelemans ve S. Gillis Eds.). CLIN VI: Proc. of the Sixth CLIN Meeting (185–202). Antwerp: Centre for Dutch Language and Speech (UIA).
  • O’Shannessy, C. (2011). Language contact and change in endangered languages (P. K. Austin ve J. Sallabank, Eds.). The Cambridge Handbook of Endangered Languages (78-99). Cambridge: Cambridge University Press.
  • Osenova, P., Heeringa, W. and Nerbonne, J. (2009). A quantitative analysis of Bulgarian dialect pronunciation. Zeitschrift für Slavische Philologie, 66(2), 425–458.
  • Ölmez, M. (1995). Halaçlar ve Halaçça, Çağdaş Türk Dili, 84, 15-22.
  • Palosaari, N. and Campbell, L. (2011). Structural aspects of language endangerment (P. K. Austin ve J. Sallabank, Eds.). The Cambridge Handbook of Endangered Languages (100-119). Cambridge: Cambridge University Press.
  • Ragagnin, E. (2020). Major and minor Turkic language islands in Iran with a special focus on Khalaj. Iranian Studies, 53(3-4), 573-588.
  • Rahimi, M. (2020). Dil canlılığı bağlamında Halaç Türklerinin durumu. Modern Türklük Araştırmaları Dergisi. 17(2), 131-145.
  • Ščerbak, A. M. (1997). Xaladžckij jazyk [Khalaj language]. E. R. Tenišev (Ed.). Tjurkskie jazyki [Turkic Languages]. Jazyki mira [Languages of the World] (in Russian) 2 (470–476). Moscow: Indrik.
  • Tekin, T. (1989). Türk dili diyalektlerinin yeni bir tasnifi. Erdem, 5(13), 141-168.
  • Tekin, T. (1995). Türk dillerinde birincil uzun ünlüler. Ankara: Simurg Yayınları.
  • Wieling, M., Heeringa, W. and Nerbonne, J. (2007). An aggregate analysis of pronunciation in the Goeman-Taeldeman-van Reenen-Project data. Taal en Tongval, 59(1), 84–116.
There are 27 citations in total.

Details

Primary Language Turkish
Subjects Linguistics
Journal Section Linguistics
Authors

Mehmet Akkuş 0000-0002-9604-1418

Publication Date June 1, 2021
Submission Date March 15, 2021
Published in Issue Year 2021 Volume: 6 Issue: 1

Cite

APA Akkuş, M. (2021). HALAÇ TÜRKÇESİ AĞIZLARININ ALGORİTMİK UZAKLIĞI: LEVENSHTEIN UZAKLIK ALGORİTMASI TABANLI BİR ÇÖZÜMLEME. Çukurova Üniversitesi Türkoloji Araştırmaları Dergisi, 6(1), 247-267. https://doi.org/10.32321/cutad.897079