TR
EN
Osmanlıcadan Türkçeye Uçtan Uca Aktarım
Öz
Bu makalede Osmanlıca Dokümanların Modern Türkçeye Uçtan Uca aktarımı adlı proje sunulmuştur. Devlet arşivleri, kütüphaneleri ve özel koleksiyonlarda milyonlarca Osmanlıca doküman bulunmaktadır. Bunların Modern Türkçeye elle aktarımı mümkün değildir. Osmanlica.com adresinde kullanıma açılan bu projede Osmanlıca dokümanların Türkçe 3 adımda aktarımı yapılmaktadır: (i) Osmanlıca karakter tanıma (OCR) (ii) Osmanlıca-Türkçe Alfabe Çevrisi (iii) Osmanlıca-Türkçe Çeviri. Bildiğimiz kadarıyla, bu proje Osmanlıca-Türkçe aktarım sürecinin üç adımını da çözmeyi hedefleyen ilk projedir. Bu adımların her biri NLP ve Derin Öğrenmede teknik ve bilimsel olarak karmaşık ve kaynak gerektiren problemlerdir. Birinci adımda doküman görüntüleri OCR ile Osmanlı alfabesinde düz metine dönüştürülür. İkinci adımda Arap-tabanlı Osmanlı alfabesindeki bu metin bir alfabe çevrisi sistemiyle Latin-tabanlı Türk alfabesine dönüştürülür. Türk alfabesindeki metin her ne kadar okunabilir olsa da çok sayıda Arapça ve Farsça kelime ve yapı barındırdığı için henüz anlaşılabilir değildir. Üçüncü adım bu metin makine çevirisi ile Modern Türkçeye aktarılır. Birinci adımda geliştirilen CRNN tabanlı OCR modeli 21 sayfalık bir veri setinde test edilmiş ve %96 karakter tanıma doğruluk oranı üretmiştir. İkinci adımda geliştirilen alfabe çeviri sistemi 7500 kelimelik bir veri setiyle test edilmiş ve %98 kelime çeviri doğruluk oranı üretmiştir. Üçüncü adım için kelime grubu tabanlı bir makine çeviri sistemi geliştirilmiş ve testlerine başlanmıştır. Bu projenin önemli bir sosyal, kültürel ve bilimsel probleme katkı sağladığı için değerli bir çalışma olduğunu düşünüyoruz.
Anahtar Kelimeler
Kaynakça
- [1] M. ERGİN, “Osmanlıca Dersleri”, İstanbul: Boğaziçi yayınları, 2020.
- [2] S. Kirmizialtin ve D. Wrisley, “Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print”, Archive arXiv preprint arXiv:2011.01139, 2020. https://arxiv.org/abs/2011.01139
- [3] M. Mohd, F. Qamar, I. Al-Sheikh and R. Salah, “Quranic Optical Text Recognition Using Deep Learning Models”, IEEE Access, vol. 9, pp. 38318-38330, 2021, doi: 10.1109/ACCESS.2021.3064019.
- [4] Miletos OCR [Çevrimiçi]. Erişim: www.miletos.com
- [5] IRCICA [Çevrimiçi]. Erişim: library.ircica.org.
- [6] I. Dolek and A. Kurt, "Ottoman OCR: Printed Naskh Font," 2021 International Conference on INnovations in Intelligent SysTems and Applications (INISTA), 2021, pp. 1-5, doi: 10.1109/INISTA52262.2021.9548616.
- [7] A. Kurt, and E. F. Bilgin. “The Outline of an Ottoman-to-Turkish Automatic Machine Transliteration System” First Workshop on Language Resources and Technologies for Turkic Languages. 2012.
- [8] J. Korkut, “Morphology and Lexicon-Based Machine Translation of Ottoman Turkish to Modern Turkish”, Princeton University, Princeton, NJ, USA, 2019.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Yapay Zeka
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
29 Haziran 2022
Gönderilme Tarihi
3 Ocak 2022
Kabul Tarihi
14 Ocak 2022
Yayımlandığı Sayı
Yıl 2022 Cilt: 3 Sayı: 1
APA
Dölek, İ., & Kurt, A. (2022). Osmanlıcadan Türkçeye Uçtan Uca Aktarım. Journal of Smart Systems Research, 3(1), 1-10. https://izlik.org/JA43PT44UY
AMA
1.Dölek İ, Kurt A. Osmanlıcadan Türkçeye Uçtan Uca Aktarım. JoinSSR. 2022;3(1):1-10. https://izlik.org/JA43PT44UY
Chicago
Dölek, İshak, ve Atakan Kurt. 2022. “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”. Journal of Smart Systems Research 3 (1): 1-10. https://izlik.org/JA43PT44UY.
EndNote
Dölek İ, Kurt A (01 Haziran 2022) Osmanlıcadan Türkçeye Uçtan Uca Aktarım. Journal of Smart Systems Research 3 1 1–10.
IEEE
[1]İ. Dölek ve A. Kurt, “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”, JoinSSR, c. 3, sy 1, ss. 1–10, Haz. 2022, [çevrimiçi]. Erişim adresi: https://izlik.org/JA43PT44UY
ISNAD
Dölek, İshak - Kurt, Atakan. “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”. Journal of Smart Systems Research 3/1 (01 Haziran 2022): 1-10. https://izlik.org/JA43PT44UY.
JAMA
1.Dölek İ, Kurt A. Osmanlıcadan Türkçeye Uçtan Uca Aktarım. JoinSSR. 2022;3:1–10.
MLA
Dölek, İshak, ve Atakan Kurt. “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”. Journal of Smart Systems Research, c. 3, sy 1, Haziran 2022, ss. 1-10, https://izlik.org/JA43PT44UY.
Vancouver
1.İshak Dölek, Atakan Kurt. Osmanlıcadan Türkçeye Uçtan Uca Aktarım. JoinSSR [Internet]. 01 Haziran 2022;3(1):1-10. Erişim adresi: https://izlik.org/JA43PT44UY