Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme
Öz
Bu çalışma, günümüz dijital beşerî bilimler çalışmalarında giderek önem kazanan el yazısı metin tanıma (HTR) teknolojilerinin, Arapça kaleme alınan yazma eserlerin dijitalleştirilme süreçlerindeki uygulanabilirliğini konu edinmektedir. Bilhassa Osmanlı bürokrasisi ve ilmiye sınıfının hâkim yazı karakteri olan rika hattıyla kaleme alınmış külliyatın makine tarafından okunabilir hale gelmesi; ilahiyat, tarih ve edebiyat alanlarındaki araştırmalar için önemli bir potansiyel oluşturmaktadır. Ancak rika hattının süratli yazıma dayalı yapısı, harflerdeki noktaların ihmali ve dikey istiflerin yoğunluğu, standart fontlar üzerine eğitilmiş mevcut optik karakter tanıma algoritmaları için ciddi bir engel teşkil etmekte ve bu hat türünün mevcut teknolojilerle ne düzeyde okunabileceği sorusunu gündeme getirmektedir. Araştırmanın kapsamını, Niyâzî-i Mısrî’nin Tefsîru’l-Fâtiha risâlesinin Bursa İnebey Yazma Eser Kütüphanesi’ndeki 5240 numaralı nüshası (vr. 18b) ve bu nüsha üzerinde test edilen dört farklı web tabanlı HTR aracı (Zinki.ai, Calfa.fr, i2OCR.com, OCR.space) oluşturmaktadır. Çalışmanın temel amacı, kodlama bilgisine sahip olmayan araştırmacıların erişimine açık olan web tabanlı araçların, rika hattındaki performans düzeylerini, sınırlarını ve hata tipolojilerini uygulamalı verilerle ortaya koymaktır. Ayrıca çalışma, ayet ve hadis iktibaslarına sahip Tefsîru’l-Fâtiha örneği üzerinden, HTR araçlarının yazma eser metinlerindeki bağlamsal okuma yetkinliğini de sınamaktadır. Bu doğrultuda tarafımızca hazırlanan referans metin ile araçların ürettiği ham çıktılar karşılaştırılmış; Levenshtein Mesafesi algoritması kullanılarak karakter hata oranı (CER) ve kelime hata oranı (WER) değerleri hesaplanmış ve elde edilen veriler görsel farklılık analiziyle (diff) desteklenmiştir. Araştırma sonucunda, geleneksel OCR motorlarının ve genel amaçlı modellerin rika hattında başarısız olduğu, buna karşın bağlamsal öğrenme yeteneğine sahip Zinki.ai platformunun %92,04 doğruluk oranıyla nispeten kullanılabilir düzeyde performans sergilediği tespit edilmiştir. Elde edilen bulgular, HTR araçlarının araştırmacılar için dijital bir asistan rolü üstlenebileceğini; ancak kusursuz sonuç için insan kontrolü gerektiren bir çalışma modelinin zorunlu olduğunu göstermektedir.
Anahtar Kelimeler
Tefsir, Dijital Beşerî Bilimler, Optik Karakter Tanıma (OCR), El Yazısı Metin Tanıma (HTR), Yapay Zekâ.
Analysis of Handwritten Text Recognition (HTR) Technologies for Arabic Manuscripts: A Review of Web-Based Tools
Öz
This study examines the applicability of Handwritten Text Recognition (HTR) technologies, which are gaining increasing importance in contemporary digital humanities studies, to the digitization processes of manuscripts penned in Arabic. Specifically, rendering the corpus written in the Rika (Ruq‘ah) script—the dominant writing style of the Ottoman bureaucracy and the scholarly (ilmiye) class—into a machine-readable format holds significant potential for research in Theology, History, and Literature. However, the cursive nature of the Rika script based on rapid writing, the omission of diacritical dots, and the density of vertical stacking pose significant challenges for current Optical Character Recognition (OCR) algorithms trained on standard fonts, thereby raising the question of the extent to which this script type can be deciphered by existing technologies. The scope of the research comprises the Tefsîru’l-Fâtiha treatise by Niyâzî-i Mısrî, specifically folio 18b of copy number 5240 housed in the Bursa İnebey Manuscript Library, and four different web-based HTR tools (Zinki.ai, Calfa.fr, i2OCR.com, OCR.space) tested on this manuscript. The primary objective of the study is to demonstrate, through empirical data, the performance levels, limitations, and error typologies of web-based tools accessible to researchers lacking coding expertise when applied to the Rika script. Furthermore, through the example of Tefsîru’l-Fâtiha, which contains citations of Qur’anic verses and Hadiths, the study questions the contextual reading proficiency of HTR tools within manuscript texts. Accordingly, the reference text (Ground Truth) prepared by us was compared with the raw outputs produced by the tools; Character Error Rate (CER) and Word Error Rate (WER) values were calculated using the Levenshtein Distance algorithm, and the obtained data were supported by visual difference analysis (diff). The research concludes that traditional OCR engines and general-purpose models fail to recognize the Rika script effectively, whereas the Zinki.ai platform, which possesses contextual learning capabilities, demonstrated a viable performance level with an accuracy rate of 92.04%. The findings suggest that while HTR technologies can serve as a “digital assistant” for researchers, a workflow requiring human supervision (human-in-the-loop) is essential for achieving flawless results.
Anahtar Kelimeler
Tafsir, Digital Humanities, Optical Character Recognition (OCR), Handwritten Text Recognition (HTR), Artificial Intelligence.