TR
EN
Osmanlıcadan Türkçeye Uçtan Uca Aktarım
Abstract
Bu makalede Osmanlıca Dokümanların Modern Türkçeye Uçtan Uca aktarımı adlı proje sunulmuştur. Devlet arşivleri, kütüphaneleri ve özel koleksiyonlarda milyonlarca Osmanlıca doküman bulunmaktadır. Bunların Modern Türkçeye elle aktarımı mümkün değildir. Osmanlica.com adresinde kullanıma açılan bu projede Osmanlıca dokümanların Türkçe 3 adımda aktarımı yapılmaktadır: (i) Osmanlıca karakter tanıma (OCR) (ii) Osmanlıca-Türkçe Alfabe Çevrisi (iii) Osmanlıca-Türkçe Çeviri. Bildiğimiz kadarıyla, bu proje Osmanlıca-Türkçe aktarım sürecinin üç adımını da çözmeyi hedefleyen ilk projedir. Bu adımların her biri NLP ve Derin Öğrenmede teknik ve bilimsel olarak karmaşık ve kaynak gerektiren problemlerdir. Birinci adımda doküman görüntüleri OCR ile Osmanlı alfabesinde düz metine dönüştürülür. İkinci adımda Arap-tabanlı Osmanlı alfabesindeki bu metin bir alfabe çevrisi sistemiyle Latin-tabanlı Türk alfabesine dönüştürülür. Türk alfabesindeki metin her ne kadar okunabilir olsa da çok sayıda Arapça ve Farsça kelime ve yapı barındırdığı için henüz anlaşılabilir değildir. Üçüncü adım bu metin makine çevirisi ile Modern Türkçeye aktarılır. Birinci adımda geliştirilen CRNN tabanlı OCR modeli 21 sayfalık bir veri setinde test edilmiş ve %96 karakter tanıma doğruluk oranı üretmiştir. İkinci adımda geliştirilen alfabe çeviri sistemi 7500 kelimelik bir veri setiyle test edilmiş ve %98 kelime çeviri doğruluk oranı üretmiştir. Üçüncü adım için kelime grubu tabanlı bir makine çeviri sistemi geliştirilmiş ve testlerine başlanmıştır. Bu projenin önemli bir sosyal, kültürel ve bilimsel probleme katkı sağladığı için değerli bir çalışma olduğunu düşünüyoruz.
Keywords
References
- [1] M. ERGİN, “Osmanlıca Dersleri”, İstanbul: Boğaziçi yayınları, 2020.
- [2] S. Kirmizialtin ve D. Wrisley, “Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print”, Archive arXiv preprint arXiv:2011.01139, 2020. https://arxiv.org/abs/2011.01139
- [3] M. Mohd, F. Qamar, I. Al-Sheikh and R. Salah, “Quranic Optical Text Recognition Using Deep Learning Models”, IEEE Access, vol. 9, pp. 38318-38330, 2021, doi: 10.1109/ACCESS.2021.3064019.
- [4] Miletos OCR [Çevrimiçi]. Erişim: www.miletos.com
- [5] IRCICA [Çevrimiçi]. Erişim: library.ircica.org.
- [6] I. Dolek and A. Kurt, "Ottoman OCR: Printed Naskh Font," 2021 International Conference on INnovations in Intelligent SysTems and Applications (INISTA), 2021, pp. 1-5, doi: 10.1109/INISTA52262.2021.9548616.
- [7] A. Kurt, and E. F. Bilgin. “The Outline of an Ottoman-to-Turkish Automatic Machine Transliteration System” First Workshop on Language Resources and Technologies for Turkic Languages. 2012.
- [8] J. Korkut, “Morphology and Lexicon-Based Machine Translation of Ottoman Turkish to Modern Turkish”, Princeton University, Princeton, NJ, USA, 2019.
Details
Primary Language
Turkish
Subjects
Artificial Intelligence
Journal Section
Research Article
Publication Date
June 29, 2022
Submission Date
January 3, 2022
Acceptance Date
January 14, 2022
Published in Issue
Year 2022 Volume: 3 Number: 1
APA
Dölek, İ., & Kurt, A. (2022). Osmanlıcadan Türkçeye Uçtan Uca Aktarım. Journal of Smart Systems Research, 3(1), 1-10. https://izlik.org/JA43PT44UY
AMA
1.Dölek İ, Kurt A. Osmanlıcadan Türkçeye Uçtan Uca Aktarım. JoinSSR. 2022;3(1):1-10. https://izlik.org/JA43PT44UY
Chicago
Dölek, İshak, and Atakan Kurt. 2022. “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”. Journal of Smart Systems Research 3 (1): 1-10. https://izlik.org/JA43PT44UY.
EndNote
Dölek İ, Kurt A (June 1, 2022) Osmanlıcadan Türkçeye Uçtan Uca Aktarım. Journal of Smart Systems Research 3 1 1–10.
IEEE
[1]İ. Dölek and A. Kurt, “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”, JoinSSR, vol. 3, no. 1, pp. 1–10, June 2022, [Online]. Available: https://izlik.org/JA43PT44UY
ISNAD
Dölek, İshak - Kurt, Atakan. “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”. Journal of Smart Systems Research 3/1 (June 1, 2022): 1-10. https://izlik.org/JA43PT44UY.
JAMA
1.Dölek İ, Kurt A. Osmanlıcadan Türkçeye Uçtan Uca Aktarım. JoinSSR. 2022;3:1–10.
MLA
Dölek, İshak, and Atakan Kurt. “Osmanlıcadan Türkçeye Uçtan Uca Aktarım”. Journal of Smart Systems Research, vol. 3, no. 1, June 2022, pp. 1-10, https://izlik.org/JA43PT44UY.
Vancouver
1.İshak Dölek, Atakan Kurt. Osmanlıcadan Türkçeye Uçtan Uca Aktarım. JoinSSR [Internet]. 2022 Jun. 1;3(1):1-10. Available from: https://izlik.org/JA43PT44UY