Metin madenciliği açısından Dede Korkut Kitabı söz varlığının bazı özellikleri

Bekir Tahir Tahiroğlu

doi:10.29000/rumelide.948370

Research Article

Metin madenciliği açısından Dede Korkut Kitabı söz varlığının bazı özellikleri

Year 2021, Issue: 23, 319 - 338, 21.06.2021

Bekir Tahir Tahiroğlu

https://doi.org/10.29000/rumelide.948370

Abstract

Dede Korkut Kitabı, Türk dili ve tarihinin önemli yapıtları arasında yer almaktadır. Dede Korkut Kitabı’nın söz varlığı dönemin kültür ve dil özelliklerinin ortaya çıkarılması bakımından da önemli veriler içerir. Tarihsel metinlerin sayısallaştırılmalarıyla hazırlanacak derlemlerin dilbilgisel özelliklere yeni bakış açıları getirmesi yanında dile ait eskiden yeniye söz varlığı değişmelerini de yansıtması, bilgisayar destekli yöntemlerin daha özgül biçimde söz varlığına dair özelliklerin ayrıntılı çıkarımını gerekli kılmaktadır. Dilbilimde söz varlığı incelemeleri çeşitli yöntemlerle yapılabilmekte son yıllarda ise metin ve metin derlemleri temelinde hesaplamalı bir biçimde yeni yöntem ve tekniklerle ele alınabilmektedir. Metin madenciliği temelde yapılandırılmamış bir veri görünümü sunan metinlerden çeşitli örüntülerin elde edilmesi, sınıflandırılması ve makine öğrenmesi tekniklerinin de kullanıldığı yeni gelişen alanlar arasında bulunmaktadır. Çalışmada genel olarak veri madenciliği ve metin madenciliği terimlerinin farklı yönleri ele alınmış ve metin madenciliği bakımından Dede Korkut Kitabı’nın Dresden nüshası esas alınarak nüshadaki bütün sözcüklere ait genel metin istatistikleri, ilk 100 sözcüğün sıklığı, eşdizim ve sözcük ağlarının metin madenciliğinde kullanılan yazılımlar aracılığıyla genel olarak çıkarımları amaçlanmıştır. Sayısallaştırılan metin yazılımların hesaplama modüllerinde yer alan varsayılan istatistik değerleriyle işlenmiş ve elde edilen veriler görsel sonuçlarla da gösterilmiştir. Elde edilen ilk bulgularda 12 hikâyeden oluşan metinde demek, söylemek kavramlarını yansıtan sözcüklerin hem sözcük ağı oluşturmada hem de tekil olarak sıklık listesinde önde gelen sözcükler olduğu görülmüştür. Sonuç olarak, çalışmanın ilk bulgularından hareketle Dede Korkut Kitabı’nın metin madenciliği teknikleriyle daha ayrıntılı söz varlığı ve kavramsal analizinin yapılabileceği ve farklı örüntülerin bulunabileceği düşünülmektedir.

Keywords

Dede Korkut Kitabı, Söz varlığı, metin madenciliği, sıklık, eşdizim, sözcük ağı.

References

Akbıyık, A. (2019). Sosyal Bilimlerde Metin Madenciliği. Sakarya: Sakarya.
Aksan, D. (2018). Türkçenin Sözvarlığı (2nd ed.). Ankara: Bilgi.
Altunkaynak, B. (2019). Veri Madenciliği Yöntemleri ve R Uygulamaları (2. baskı). Ankara: Seçkin.
Anandarajan, M., Hill, C., ve Nolan, T. (2019). Practical Text Analytics: Maximizing the Value of Text Data. Advances in Analytics and Data Science: Vol. 2. Cham: Springer International.
Çitgez, M. (2018). Dede Korkut Hikâyeleri’nin Söz Varlığı, Basılmamış Doktora tezi, T.C. Ardahan Üniversitesi Sosyal Bilimler Enstitüsü
Danowski, J. A. (2013). WORDij version 3.0: Semantic network analysis software. Chicago: University of Illinois at Chicago.Ergin, M. (1994). Dede Korkut Kitabı I. Ankara: Türk Dil Kurumu.
Günay, D. (2018). Sözcükbilime Giriş (2. baskı). İstanbul: Papatya.
Gürsoy, U. T. Ş. (2009). Veri Madenciliği ve Bilgi Keşfi. Ankara: Pegem Akademi.
İmer, K., Kocaman, A., & Özsoy, A. S. (2011). Dilbilim sözlüğü (1. basım). Etiler İstanbul: Boğaziçi Üniversitesi.
Karaağaç, G. (2013). Dil bilimi terimleri sözlüğü (Birinci baskı: Ankara, 2013 Şubat). Atatürk Kültür, Dil ve Tarih Yüksek Kurumu Türk Dil Kurumu Yayınları: 1066. Ankara: Türk Dil Kurumu.
Korkmaz, Z. (1998). Dede Korkut Hikayelerinde Dil-Üslup Bağlantısı. TDAY Belleten, 46, 101–112.
Oğuzlar, A. (2011). Temel Metin Madenciliği. Bursa: DORA Basım-Yayın Dağıtım.
Özkan, Y. (2008). Veri Madenciliği Yöntemleri. İstanbul: Papatya. Scott, M. (2016). WordSmith Tools version 7, Stroud: Lexical Analysis Software.
Silahtaroğlu, G. (2008). Kavram ve Algoritmalarıyla Temel Veri Madenciliği. İstanbul: Papatya.
Vardar, B. (1998). Açıklamalı Dilbilim Terimleri Sözlüğü. İstanbul: ABC.
WordStat 8.0, https://provalisresearch.com/products/content-analysis-software/, (Erişim tarihi: 14.02.2021)

Some features of The Book Of Dede Qorkut vocabulary in terms of text mining

Year 2021, Issue: 23, 319 - 338, 21.06.2021

Bekir Tahir Tahiroğlu

https://doi.org/10.29000/rumelide.948370

Abstract

The Book of Dede Qorqut is one of the most important works of Turkish language and history. The vocabulary of The Book of Dede Qorkut also reveals important results in terms of revealing the cultural and linguistic characteristics of its period. The fact that the corpora prepared by digitizing the historical texts bring new perspectives to the grammatical features as well as reflect the changes of vocabulary from old to new, necessitates the detailed inference of more specific vocabulary features of computer-aided methods. Analysis of the vocabulary in linguistics can be carry out by various methods, while in recent years, it can be handled with new methods and techniques in a computational fashion based on text and text collections. In general, different aspects of data mining and text mining terms were discussed in the study and general text statistics of all words in the copy text, frequency of the first 100 words, collocation and lexical networks were generally inferred through software used in text mining, based on the Dresden copy of The Book of Dede Qorkut terms of text mining. Digitized text is processed with the default statistical values contained in the software's calculation modules, and the resulting visual results are presented. In the first findings, it was found that words reflecting the concepts of saying in the text consisting of 12 stories were the leading words in both the word network visualisation and the frequency list. As a result, based on the initial findings of this study, it is believed that a more detailed vocabulary spesific feature and conceptual analysis of The Book of Dede Qorkut can be done using text mining techniques, and thus different patterns can be found.

Keywords

The Book of Dede Qorkut, Vocabulary, text mining, frequency, collocation, word network

References

Akbıyık, A. (2019). Sosyal Bilimlerde Metin Madenciliği. Sakarya: Sakarya.
Aksan, D. (2018). Türkçenin Sözvarlığı (2nd ed.). Ankara: Bilgi.
Altunkaynak, B. (2019). Veri Madenciliği Yöntemleri ve R Uygulamaları (2. baskı). Ankara: Seçkin.
Anandarajan, M., Hill, C., ve Nolan, T. (2019). Practical Text Analytics: Maximizing the Value of Text Data. Advances in Analytics and Data Science: Vol. 2. Cham: Springer International.
Çitgez, M. (2018). Dede Korkut Hikâyeleri’nin Söz Varlığı, Basılmamış Doktora tezi, T.C. Ardahan Üniversitesi Sosyal Bilimler Enstitüsü
Danowski, J. A. (2013). WORDij version 3.0: Semantic network analysis software. Chicago: University of Illinois at Chicago.Ergin, M. (1994). Dede Korkut Kitabı I. Ankara: Türk Dil Kurumu.
Günay, D. (2018). Sözcükbilime Giriş (2. baskı). İstanbul: Papatya.
Gürsoy, U. T. Ş. (2009). Veri Madenciliği ve Bilgi Keşfi. Ankara: Pegem Akademi.
İmer, K., Kocaman, A., & Özsoy, A. S. (2011). Dilbilim sözlüğü (1. basım). Etiler İstanbul: Boğaziçi Üniversitesi.
Karaağaç, G. (2013). Dil bilimi terimleri sözlüğü (Birinci baskı: Ankara, 2013 Şubat). Atatürk Kültür, Dil ve Tarih Yüksek Kurumu Türk Dil Kurumu Yayınları: 1066. Ankara: Türk Dil Kurumu.
Korkmaz, Z. (1998). Dede Korkut Hikayelerinde Dil-Üslup Bağlantısı. TDAY Belleten, 46, 101–112.
Oğuzlar, A. (2011). Temel Metin Madenciliği. Bursa: DORA Basım-Yayın Dağıtım.
Özkan, Y. (2008). Veri Madenciliği Yöntemleri. İstanbul: Papatya. Scott, M. (2016). WordSmith Tools version 7, Stroud: Lexical Analysis Software.
Silahtaroğlu, G. (2008). Kavram ve Algoritmalarıyla Temel Veri Madenciliği. İstanbul: Papatya.
Vardar, B. (1998). Açıklamalı Dilbilim Terimleri Sözlüğü. İstanbul: ABC.
WordStat 8.0, https://provalisresearch.com/products/content-analysis-software/, (Erişim tarihi: 14.02.2021)

There are 16 citations in total.

Details

Primary Language	Turkish
Subjects	Linguistics
Journal Section	Turkish language, culture and literature
Authors	Bekir Tahir Tahiroğlu This is me 0000-0002-7956-3257
Publication Date	June 21, 2021
Published in Issue	Year 2021 Issue: 23

Cite

APA	Tahiroğlu, B. T. (2021). Metin madenciliği açısından Dede Korkut Kitabı söz varlığının bazı özellikleri. RumeliDE Dil Ve Edebiyat Araştırmaları Dergisi(23), 319-338. https://doi.org/10.29000/rumelide.948370

Download Cover Image

Article Files

Full Text