Araştırma Makalesi

Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi

Sayı: Ö12 23 Temmuz 2023
  • Yasemin Kubilay *
  • Meriç Güven
PDF İndir

Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi

Öz

Son yıllarda bilişim teknolojileri alanındaki gelişmelere bağlı olarak dilleri, bilgisayarlı dilbilim ve doğal dil işleme (DDİ) yöntemleriyle incelemek, çözümlemek ve yapılandırılmış verilere dönüştürmek olanaklı hâle gelmiştir. Türkçenin tarihî dönemleri ile ilgili eş dizimlilik, birliktelik kullanımı, semantik prozodi ve semantik harita çalışmalarının azlığı bizi bu konuları hesaplamalı perspektifle inceleyen bir çalışma yapmaya sevk etmiştir. Araştırmamızda tarihî Türkçe ile yazılmış eserlerde de semantik ağları görüntülemek için münasip kelime hazinesinin mevcut olduğu görülmüştür. İki veya daha çok kelimenin alışkanlıktan kaynaklanan birlikte kullanımları şeklinde tanımlanan eş dizimlilik kavramına göre, bazı kelimeler yalnızca belirli sözcüklerle kullanılma temayülü gösterir. Birlikte sıkça kullanılan kelimeler zamanla aynı çağrışım özelliklerini kazanır, anlam ve biçim bakımından kalıplaşır. Bir biçime eş dizimlilikleri tarafından aşılanan kalıcı istikrarlı anlam aurası ise semantik prozodi olarak tanımlanır. Bu anlam aurası, incelememiz sırasında somut bir şekilde karşımıza çıkmıştır. Çalışmamızda seçilen her kavramın Python programlama dilinde, GraphViz Kütüphanesi ile oluşturulan semantik haritası üzerinde anlam aurası gösterilmiştir. Ayrıca “eş dizimli” ögeleri tespit etmek üzere makine öğrenmesinin bir alanı olan DDİ yöntemlerinden kelime yerleştirme (word embedding/vectorization) ile metin madenciliğinde, makine öğrenmede ve DDİ tekniklerinde yararlanılan GloVe kütüphanesi kullanılarak hazırladığımız yazılım ve Tensor Flow Kelime Yerleştirme Projektörü yazılımı kullanılmıştır. Metinler, bilgisayar ortamına düz metin dosyası (.txt) olarak aktarılmış, metinlerdeki eş dizimli kelime varlığı yazılımlara işlenmiş ve Log-likehood, MI değeri, T-skoru, Dice coefficient değeri gibi farklı istatistik analizleri ile de eş dizimlilikler incelenmiştir. Metinlerdeki eş dizimliliklere ait istatistikleri, kelime sıklıkları, vektörel temsillerinin DDİ’de kullanılan yazılımlar aracılığıyla genel olarak çıkarımları amaçlanmıştır. Sayısallaştırılan metin istatistikî değerleriyle işlenmiş ve ulaşılan veriler görsel olarak gösterilmiştir. Araştırmamız, özellikle Türkçenin tarihî dönem eserlerinin daha iyi anlaşılmasına katkı sağlayacak; eş dizimli yapıların tespiti sayesinde tarihî metinlerde satır arası sözcüklerin anlamlandırılması, anlam auralarının keşfi kolaylıkla yapılabilecektir. Gelişen bilgisayar teknolojileri sayesinde yeni yazılımlar ile anlam haritalarının, sözcüklerin vektörel şemalarının ve anlam auralarının somut gösterimi sağlanacaktır.

Anahtar Kelimeler

Kaynakça

  1. Adalı, E. Türkçe Doğal Dil İşleme. Akçağ Yayınları, 2021.
  2. Adalar, D. Anadili Olarak Arapça ve Türkçenin Öğretiminde Kullanılan Metinlerin Karşılaştırılması: Bir Eş Dizimsel Çözümleme Örneği, Ankara Üniversitesi Sosyal Bilimler Enstitüsü, Doğu Dilleri ve Edebiyatları Anabilim Dalı, Yüksek Lisans Tezi, 2004.
  3. Aksan, Y. ve Y. Yaldır. Türkçe Sözvarlığının Nicel Betimlemesi, ed. Ç. Sağın Şimşek ve Ç. Hatipoğlu. 24. Ulusal Dilbilim Kurultayı Bildiri Kitabı. ODTÜ Basım İşliği, 2011.
  4. Alsarray, M. Türkçe Ulusal Derlemi’nde Yüksek Sıklıkta Kullanılan Adların Eş Dizimliliği, Yıldırım Beyazıt Üniversitesi Sosyal Bilimler Enstitüsü Dilbilim Anabilim Dalı, Yüksek Lisans Tezi, 2015.
  5. Ayabakan, M. Türkçe Sözlükte Eş Dizimli Ögelerin Sunumu ve Görünümleri, Ankara Üniversitesi Sosyal Bilimler Enstitüsü Dilbilim Anabilim Dalı, Yüksek Lisans Tezi, 2015.
  6. Ayverdi, İ. Misalli Büyük Türkçe Sözlük. Kubbealtı Neşriyatı, 2020.
  7. Dönmez, İ. ve E. Adalı. “Türkçe Tümce Çözümlemede Vektör Yaklaşımı.” Afyon Kocatepe Üniversitesi Fen ve Mühendislik Bilimleri Dergisi, no.15, 2015, ss. 1-11.
  8. Girgin, M. Süheyl ü Nev-Bahâr’daki Fiillerin Eş Dizim Sözlüğü, Kütahya Dumlupınar Üniversitesi Lisansüstü Eğitim Enstitüsü Türk Dili ve Edebiyatı Anabilim Dalı, Yüksek Lisans Tezi, 2022.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Eski Türk Dili (Orhun, Uygur, Karahanlı)

Bölüm

Araştırma Makalesi

Yazarlar

Yasemin Kubilay * Bu kişi benim
0000-0003-1478-7062
Türkiye

Yayımlanma Tarihi

23 Temmuz 2023

Gönderilme Tarihi

21 Haziran 2023

Kabul Tarihi

20 Temmuz 2023

Yayımlandığı Sayı

Yıl 2023 Sayı: Ö12

Kaynak Göster

APA
Kubilay, Y., & Güven, M. (2023). Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi, Ö12, 24-36. https://doi.org/10.29000/rumelide.1330375
AMA
1.Kubilay Y, Güven M. Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE. 2023;(Ö12):24-36. doi:10.29000/rumelide.1330375
Chicago
Kubilay, Yasemin, ve Meriç Güven. 2023. “Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi”. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi, sy Ö12: 24-36. https://doi.org/10.29000/rumelide.1330375.
EndNote
Kubilay Y, Güven M (01 Temmuz 2023) Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi Ö12 24–36.
IEEE
[1]Y. Kubilay ve M. Güven, “Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi”, RumeliDE, sy Ö12, ss. 24–36, Tem. 2023, doi: 10.29000/rumelide.1330375.
ISNAD
Kubilay, Yasemin - Güven, Meriç. “Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi”. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi. Ö12 (01 Temmuz 2023): 24-36. https://doi.org/10.29000/rumelide.1330375.
JAMA
1.Kubilay Y, Güven M. Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE. 2023;:24–36.
MLA
Kubilay, Yasemin, ve Meriç Güven. “Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi”. RumeliDE Dil ve Edebiyat Araştırmaları Dergisi, sy Ö12, Temmuz 2023, ss. 24-36, doi:10.29000/rumelide.1330375.
Vancouver
1.Yasemin Kubilay, Meriç Güven. Tarihî Türkçe metinlerin doğal dil işleme yöntemleri ile incelenmesi. RumeliDE. 01 Temmuz 2023;(Ö12):24-36. doi:10.29000/rumelide.1330375