Son yıllarda bilişim teknolojileri alanındaki gelişmelere bağlı olarak dilleri, bilgisayarlı dilbilim ve doğal dil işleme (DDİ) yöntemleriyle incelemek, çözümlemek ve yapılandırılmış verilere dönüştürmek olanaklı hâle gelmiştir. Türkçenin tarihî dönemleri ile ilgili eş dizimlilik, birliktelik kullanımı, semantik prozodi ve semantik harita çalışmalarının azlığı bizi bu konuları hesaplamalı perspektifle inceleyen bir çalışma yapmaya sevk etmiştir. Araştırmamızda tarihî Türkçe ile yazılmış eserlerde de semantik ağları görüntülemek için münasip kelime hazinesinin mevcut olduğu görülmüştür. İki veya daha çok kelimenin alışkanlıktan kaynaklanan birlikte kullanımları şeklinde tanımlanan eş dizimlilik kavramına göre, bazı kelimeler yalnızca belirli sözcüklerle kullanılma temayülü gösterir. Birlikte sıkça kullanılan kelimeler zamanla aynı çağrışım özelliklerini kazanır, anlam ve biçim bakımından kalıplaşır. Bir biçime eş dizimlilikleri tarafından aşılanan kalıcı istikrarlı anlam aurası ise semantik prozodi olarak tanımlanır. Bu anlam aurası, incelememiz sırasında somut bir şekilde karşımıza çıkmıştır. Çalışmamızda seçilen her kavramın Python programlama dilinde, GraphViz Kütüphanesi ile oluşturulan semantik haritası üzerinde anlam aurası gösterilmiştir. Ayrıca “eş dizimli” ögeleri tespit etmek üzere makine öğrenmesinin bir alanı olan DDİ yöntemlerinden kelime yerleştirme (word embedding/vectorization) ile metin madenciliğinde, makine öğrenmede ve DDİ tekniklerinde yararlanılan GloVe kütüphanesi kullanılarak hazırladığımız yazılım ve Tensor Flow Kelime Yerleştirme Projektörü yazılımı kullanılmıştır. Metinler, bilgisayar ortamına düz metin dosyası (.txt) olarak aktarılmış, metinlerdeki eş dizimli kelime varlığı yazılımlara işlenmiş ve Log-likehood, MI değeri, T-skoru, Dice coefficient değeri gibi farklı istatistik analizleri ile de eş dizimlilikler incelenmiştir. Metinlerdeki eş dizimliliklere ait istatistikleri, kelime sıklıkları, vektörel temsillerinin DDİ’de kullanılan yazılımlar aracılığıyla genel olarak çıkarımları amaçlanmıştır. Sayısallaştırılan metin istatistikî değerleriyle işlenmiş ve ulaşılan veriler görsel olarak gösterilmiştir. Araştırmamız, özellikle Türkçenin tarihî dönem eserlerinin daha iyi anlaşılmasına katkı sağlayacak; eş dizimli yapıların tespiti sayesinde tarihî metinlerde satır arası sözcüklerin anlamlandırılması, anlam auralarının keşfi kolaylıkla yapılabilecektir. Gelişen bilgisayar teknolojileri sayesinde yeni yazılımlar ile anlam haritalarının, sözcüklerin vektörel şemalarının ve anlam auralarının somut gösterimi sağlanacaktır.
Primary Language | Turkish |
---|---|
Subjects | Old Turkic Language (Orhon, Uyghur, Karahan) |
Journal Section | Turkish language, culture and literature |
Authors | |
Publication Date | July 23, 2023 |
Published in Issue | Year 2023 Issue: Ö12 |