Araştırma Makalesi

OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ

Cilt: 14 Sayı: 1 20 Mart 2026
PDF İndir
TR EN

OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ

Öz

Bu çalışma, Osmanlıca metinlerin istatistiksel özelliklerini ve kelime dağılımlarını inceleyerek doğal dil işleme (DDİ) araştırmalarına katkı sağlamayı amaçlamaktadır. Osmanlıca, Arap alfabesine dayalı yapısı ve yoğun Arapça ile Farsça etkileri nedeniyle dil işleme süreçlerinde zorluklar sunmaktadır. Çalışmada, Osmanlıca metinlerden oluşturulan bir derlem kullanılarak kelime, harf ve harf grubu dağılımları detaylı olarak analiz edilmiştir. Derlemde, yaklaşık 2,34 milyon kelime, 5,7 milyon harf grubu ve 14 milyon harf içeren kapsamlı bir söz varlığı ortaya konmuştur. Derlem üzerinde yapılan istatistiksel analizler sonucunda, Osmanlıcada ortalama kelime uzunluğunun 3 ile 7 harf arasında yoğunlaştığı tespit edilmiştir. Çalışma, Osmanlıcanın nicel olarak belgelenmesine katkı sağlamanın yanı sıra, OCR, HTR ve alfabe çevirisi gibi uygulamalara yönelik dil modeli geliştirme süreçlerinde kullanılabilecek nitelikli bir kaynak sunmaktadır. Elde edilen bulgular, tarihi metinlerin dijitalleştirilmesi, otomatik işlenmesi ve kültürel mirasın korunması açısından da önemli bir temel teşkil etmektedir.

Anahtar Kelimeler

Kaynakça

  1. Agan, C., & Diri, B., Türkçe Derlemler İçin Söz Dizimsel Görselleştirme ve Sorgulama Aracı, Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, cilt 9, no. 1, pp. 1-10, 2016.
  2. Aksan, Y., et al., Construction of the Turkish National Corpus (TNC), Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), İstanbul, 2012.
  3. Becker, D. & Riaz, K., A Study in Urdu Corpus Construction, COLING-02: The 3rd Workshop on Asian Language Resources and International Standardization, https://aclanthology.org/W02-1201.pdf, 2002.
  4. Çöltekin, Ç., A Corpus of Turkish Offensive Language on Social Media, Proceedings of the Twelfth Language Resources and Evaluation Conference, Marseille, 2020.
  5. Dalkılıç, G. & Çebi, Y., Türkçe Külliyat Oluşturulması Ve Türkçe Metinlerde Kullanılan Kelimelerin Uzunluk Dağılımlarının Belirlenmesi, Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, cilt 5, no. 1, pp. 1-7, 2003.
  6. Dalkılıç, G. & Çebi, Y., Zipf’s Law and Mandelbrot’s Constants for Turkish Language Using Turkish Corpus (TurCo), Advances in Information Systems. ADVIS, Berlin, 2004.
  7. Demirhan, U. U. & Aksan, M., Türkçede Eylemlerin Derlem-Temelli Değerlik Sözlüğünün Oluşturulması: Yöntembilimsel Bir Çalışma, Dil Ve Edebiyat Dergisi, cilt 19, no. 1, pp. 61-88, 2023.
  8. Dölek İ. & Kurt A. A deep learning model for Ottoman OCR. Concurrency Computat Pract Exper. 2022; 34(20):e6937. doi:10.1002/cpe.6937

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Yazılımı

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

20 Mart 2026

Gönderilme Tarihi

19 Temmuz 2025

Kabul Tarihi

5 Şubat 2026

Yayımlandığı Sayı

Yıl 2026 Cilt: 14 Sayı: 1

Kaynak Göster

APA
Dölek, İ., & Kurt, A. (2026). OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ. Mühendislik Bilimleri ve Tasarım Dergisi, 14(1), 33-44. https://doi.org/10.21923/jesd.1746365
AMA
1.Dölek İ, Kurt A. OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ. MBTD. 2026;14(1):33-44. doi:10.21923/jesd.1746365
Chicago
Dölek, İshak, ve Atakan Kurt. 2026. “OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ”. Mühendislik Bilimleri ve Tasarım Dergisi 14 (1): 33-44. https://doi.org/10.21923/jesd.1746365.
EndNote
Dölek İ, Kurt A (01 Mart 2026) OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ. Mühendislik Bilimleri ve Tasarım Dergisi 14 1 33–44.
IEEE
[1]İ. Dölek ve A. Kurt, “OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ”, MBTD, c. 14, sy 1, ss. 33–44, Mar. 2026, doi: 10.21923/jesd.1746365.
ISNAD
Dölek, İshak - Kurt, Atakan. “OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ”. Mühendislik Bilimleri ve Tasarım Dergisi 14/1 (01 Mart 2026): 33-44. https://doi.org/10.21923/jesd.1746365.
JAMA
1.Dölek İ, Kurt A. OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ. MBTD. 2026;14:33–44.
MLA
Dölek, İshak, ve Atakan Kurt. “OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ”. Mühendislik Bilimleri ve Tasarım Dergisi, c. 14, sy 1, Mart 2026, ss. 33-44, doi:10.21923/jesd.1746365.
Vancouver
1.İshak Dölek, Atakan Kurt. OSMANLICA DERLEM VE KELİMELERİN UZUNLUK DAĞILIMININ ANALİZİ. MBTD. 01 Mart 2026;14(1):33-44. doi:10.21923/jesd.1746365