Research Article

Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi

Number: Ö12 July 23, 2023
  • Yasemin Kubilay *
  • Meriç Güven

Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi

Abstract

Son yıllarda bilişim teknolojileri alanındaki gelişmelere bağlı olarak dilleri, bilgisayarlı dilbilim ve doğal dil işleme (DDİ) yöntemleriyle incelemek, çözümlemek ve yapılandırılmış verilere dönüştürmek olanaklı hâle gelmiştir. Türkçenin tarihî dönemleri ile ilgili eş dizimlilik, birliktelik kullanımı, semantik prozodi ve semantik harita çalışmalarının azlığı bizi bu konuları hesaplamalı perspektifle inceleyen bir çalışma yapmaya sevk etmiştir. Araştırmamızda tarihî Türkçe ile yazılmış eserlerde de semantik ağları görüntülemek için münasip kelime hazinesinin mevcut olduğu görülmüştür. İki veya daha çok kelimenin alışkanlıktan kaynaklanan birlikte kullanımları şeklinde tanımlanan eş dizimlilik kavramına göre, bazı kelimeler yalnızca belirli sözcüklerle kullanılma temayülü gösterir. Birlikte sıkça kullanılan kelimeler zamanla aynı çağrışım özelliklerini kazanır, anlam ve biçim bakımından kalıplaşır. Bir biçime eş dizimlilikleri tarafından aşılanan kalıcı istikrarlı anlam aurası ise semantik prozodi olarak tanımlanır. Bu anlam aurası, incelememiz sırasında somut bir şekilde karşımıza çıkmıştır. Çalışmamızda seçilen her kavramın Python programlama dilinde, GraphViz Kütüphanesi ile oluşturulan semantik haritası üzerinde anlam aurası gösterilmiştir. Ayrıca “eş dizimli” ögeleri tespit etmek üzere makine öğrenmesinin bir alanı olan DDİ yöntemlerinden kelime yerleştirme (word embedding/vectorization) ile metin madenciliğinde, makine öğrenmede ve DDİ tekniklerinde yararlanılan GloVe kütüphanesi kullanılarak hazırladığımız yazılım ve Tensor Flow Kelime Yerleştirme Projektörü yazılımı kullanılmıştır. Metinler, bilgisayar ortamına düz metin dosyası (.txt) olarak aktarılmış, metinlerdeki eş dizimli kelime varlığı yazılımlara işlenmiş ve Log-likehood, MI değeri, T-skoru, Dice coefficient değeri gibi farklı istatistik analizleri ile de eş dizimlilikler incelenmiştir. Metinlerdeki eş dizimliliklere ait istatistikleri, kelime sıklıkları, vektörel temsillerinin DDİ’de kullanılan yazılımlar aracılığıyla genel olarak çıkarımları amaçlanmıştır. Sayısallaştırılan metin istatistikî değerleriyle işlenmiş ve ulaşılan veriler görsel olarak gösterilmiştir. Araştırmamız, özellikle Türkçenin tarihî dönem eserlerinin daha iyi anlaşılmasına katkı sağlayacak; eş dizimli yapıların tespiti sayesinde tarihî metinlerde satır arası sözcüklerin anlamlandırılması, anlam auralarının keşfi kolaylıkla yapılabilecektir. Gelişen bilgisayar teknolojileri sayesinde yeni yazılımlar ile anlam haritalarının, sözcüklerin vektörel şemalarının ve anlam auralarının somut gösterimi sağlanacaktır.

Keywords

References

  1. Adalı, E. Türkçe Doğal Dil İşleme. Akçağ Yayınları, 2021.
  2. Adalar, D. Anadili Olarak Arapça ve Türkçenin Öğretiminde Kullanılan Metinlerin Karşılaştırılması: Bir Eş Dizimsel Çözümleme Örneği, Ankara Üniversitesi Sosyal Bilimler Enstitüsü, Doğu Dilleri ve Edebiyatları Anabilim Dalı, Yüksek Lisans Tezi, 2004.
  3. Aksan, Y. ve Y. Yaldır. Türkçe Sözvarlığının Nicel Betimlemesi, ed. Ç. Sağın Şimşek ve Ç. Hatipoğlu. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. ODTÜ Basım İşliği, 2011.
  4. Alsarray, M. Türkçe Ulusal Derlemi’nde Yüksek Sıklıkta Kullanılan Adların Eş Dizimliliği, Yıldırım Beyazıt Üniversitesi Sosyal Bilimler Enstitüsü Dilbilim Anabilim Dalı, Yüksek Lisans Tezi, 2015.
  5. Ayabakan, M. Türkçe Sözlükte Eş Dizimli Ögelerin Sunumu ve Görünümleri, Ankara Üniversitesi Sosyal Bilimler Enstitüsü Dilbilim Anabilim Dalı, Yüksek Lisans Tezi, 2015.
  6. Ayverdi, İ. Misalli Büyük Türkçe Sözlük. Kubbealtı Neşriyatı, 2020.
  7. Dönmez, İ. ve E. Adalı. “Türkçe Tümce Çözümlemede Vektör Yaklaşımı.” Afyon Kocatepe Üniversitesi Fen ve Mühendislik Bilimleri Dergisi, no.15, 2015, ss. 1-11.
  8. Girgin, M. Süheyl ü Nev-Bahâr’daki Fiillerin Eş Dizim Sözlüğü, Kütahya Dumlupınar Üniversitesi Lisansüstü Eğitim Enstitüsü Türk Dili ve Edebiyatı Anabilim Dalı, Yüksek Lisans Tezi, 2022.

Details

Primary Language

Turkish

Subjects

Old Turkic Language (Orhon, Uyghur, Karahan)

Journal Section

Research Article

Authors

Yasemin Kubilay * This is me
0000-0003-1478-7062
Türkiye

Meriç Güven This is me
0000-0003-2533-5272
Türkiye

Publication Date

July 23, 2023

Submission Date

June 21, 2023

Acceptance Date

July 20, 2023

Published in Issue

Year 2023 Number: Ö12

APA
Kubilay, Y., & Güven, M. (2023). Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE Dil Ve Edebiyat Araştırmaları Dergisi, Ö12, 24-36. https://doi.org/10.29000/rumelide.1330375
AMA
1.Kubilay Y, Güven M. Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE. 2023;(Ö12):24-36. doi:10.29000/rumelide.1330375
Chicago
Kubilay, Yasemin, and Meriç Güven. 2023. “Tarihî Türkçe Metinlerin Doğal Dil Işleme Yöntemleri Ile Incelenmesi”. RumeliDE Dil Ve Edebiyat Araştırmaları Dergisi, no. Ö12: 24-36. https://doi.org/10.29000/rumelide.1330375.
EndNote
Kubilay Y, Güven M (July 1, 2023) Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi Ö12 24–36.
IEEE
[1]Y. Kubilay and M. Güven, “Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi”, RumeliDE, no. Ö12, pp. 24–36, July 2023, doi: 10.29000/rumelide.1330375.
ISNAD
Kubilay, Yasemin - Güven, Meriç. “Tarihî Türkçe Metinlerin Doğal Dil Işleme Yöntemleri Ile Incelenmesi”. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi. Ö12 (July 1, 2023): 24-36. https://doi.org/10.29000/rumelide.1330375.
JAMA
1.Kubilay Y, Güven M. Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE. 2023;:24–36.
MLA
Kubilay, Yasemin, and Meriç Güven. “Tarihî Türkçe Metinlerin Doğal Dil Işleme Yöntemleri Ile Incelenmesi”. RumeliDE Dil Ve Edebiyat Araştırmaları Dergisi, no. Ö12, July 2023, pp. 24-36, doi:10.29000/rumelide.1330375.
Vancouver
1.Yasemin Kubilay, Meriç Güven. Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE. 2023 Jul. 1;(Ö12):24-36. doi:10.29000/rumelide.1330375