Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme

Abdulcabbar Adıgüzel

doi:10.52637/kiid.1854450

TR EN

Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme

Öz

Bu çalışma, günümüz dijital beşerî bilimler çalışmalarında giderek önem kazanan el yazısı metin tanıma (HTR) teknolojilerinin, Arapça kaleme alınan yazma eserlerin dijitalleştirilme süreçlerindeki uygulanabilirliğini konu edinmektedir. Bilhassa Osmanlı bürokrasisi ve ilmiye sınıfının hâkim yazı karakteri olan rika hattıyla kaleme alınmış külliyatın makine tarafından okunabilir hale gelmesi; ilahiyat, tarih ve edebiyat alanlarındaki araştırmalar için önemli bir potansiyel oluşturmaktadır. Ancak rika hattının süratli yazıma dayalı yapısı, harflerdeki noktaların ihmali ve dikey istiflerin yoğunluğu, standart fontlar üzerine eğitilmiş mevcut optik karakter tanıma algoritmaları için ciddi bir engel teşkil etmekte ve bu hat türünün mevcut teknolojilerle ne düzeyde okunabileceği sorusunu gündeme getirmektedir. Araştırmanın kapsamını, Niyâzî-i Mısrî’nin Tefsîru’l-Fâtiha risâlesinin Bursa İnebey Yazma Eser Kütüphanesi’ndeki 5240 numaralı nüshası (vr. 18b) ve bu nüsha üzerinde test edilen dört farklı web tabanlı HTR aracı (Zinki.ai, Calfa.fr, i2OCR.com, OCR.space) oluşturmaktadır. Çalışmanın temel amacı, kodlama bilgisine sahip olmayan araştırmacıların erişimine açık olan web tabanlı araçların, rika hattındaki performans düzeylerini, sınırlarını ve hata tipolojilerini uygulamalı verilerle ortaya koymaktır. Ayrıca çalışma, ayet ve hadis iktibaslarına sahip Tefsîru’l-Fâtiha örneği üzerinden, HTR araçlarının yazma eser metinlerindeki bağlamsal okuma yetkinliğini de sınamaktadır. Bu doğrultuda tarafımızca hazırlanan referans metin ile araçların ürettiği ham çıktılar karşılaştırılmış; Levenshtein Mesafesi algoritması kullanılarak karakter hata oranı (CER) ve kelime hata oranı (WER) değerleri hesaplanmış ve elde edilen veriler görsel farklılık analiziyle (diff) desteklenmiştir. Araştırma sonucunda, geleneksel OCR motorlarının ve genel amaçlı modellerin rika hattında başarısız olduğu, buna karşın bağlamsal öğrenme yeteneğine sahip Zinki.ai platformunun %92,04 doğruluk oranıyla nispeten kullanılabilir düzeyde performans sergilediği tespit edilmiştir. Elde edilen bulgular, HTR araçlarının araştırmacılar için dijital bir asistan rolü üstlenebileceğini; ancak kusursuz sonuç için insan kontrolü gerektiren bir çalışma modelinin zorunlu olduğunu göstermektedir.

Anahtar Kelimeler

Tefsir, Dijital Beşerî Bilimler, Optik Karakter Tanıma (OCR), El Yazısı Metin Tanıma (HTR), Yapay Zekâ.

Analysis of Handwritten Text Recognition (HTR) Technologies for Arabic Manuscripts: A Review of Web-Based Tools

Öz

This study examines the applicability of Handwritten Text Recognition (HTR) technologies, which are gaining increasing importance in contemporary digital humanities studies, to the digitization processes of manuscripts penned in Arabic. Specifically, rendering the corpus written in the Rika (Ruq‘ah) script—the dominant writing style of the Ottoman bureaucracy and the scholarly (ilmiye) class—into a machine-readable format holds significant potential for research in Theology, History, and Literature. However, the cursive nature of the Rika script based on rapid writing, the omission of diacritical dots, and the density of vertical stacking pose significant challenges for current Optical Character Recognition (OCR) algorithms trained on standard fonts, thereby raising the question of the extent to which this script type can be deciphered by existing technologies. The scope of the research comprises the Tefsîru’l-Fâtiha treatise by Niyâzî-i Mısrî, specifically folio 18b of copy number 5240 housed in the Bursa İnebey Manuscript Library, and four different web-based HTR tools (Zinki.ai, Calfa.fr, i2OCR.com, OCR.space) tested on this manuscript. The primary objective of the study is to demonstrate, through empirical data, the performance levels, limitations, and error typologies of web-based tools accessible to researchers lacking coding expertise when applied to the Rika script. Furthermore, through the example of Tefsîru’l-Fâtiha, which contains citations of Qur’anic verses and Hadiths, the study questions the contextual reading proficiency of HTR tools within manuscript texts. Accordingly, the reference text (Ground Truth) prepared by us was compared with the raw outputs produced by the tools; Character Error Rate (CER) and Word Error Rate (WER) values were calculated using the Levenshtein Distance algorithm, and the obtained data were supported by visual difference analysis (diff). The research concludes that traditional OCR engines and general-purpose models fail to recognize the Rika script effectively, whereas the Zinki.ai platform, which possesses contextual learning capabilities, demonstrated a viable performance level with an accuracy rate of 92.04%. The findings suggest that while HTR technologies can serve as a “digital assistant” for researchers, a workflow requiring human supervision (human-in-the-loop) is essential for achieving flawless results.

Anahtar Kelimeler

Tafsir, Digital Humanities, Optical Character Recognition (OCR), Handwritten Text Recognition (HTR), Artificial Intelligence.

Öz

Kaynakça

Aladağ, Fatma. “Dijital Beşerî Bilimler ve Türkiye Araştırmaları: Bir Literatür Değerlendirmesi”. Türkiye Araştırmaları Literatür Dergisi 18/36 (2020), 773-796.
Al-Hourani, Ahmad Shahdeh. Preprocessing and Segmentation of Handwritten Arabic Documents for Writer-Independent Automatic Recognition. Amman: el-Câmiatü’l-Ürdüniyye, Külliyyetü’d-Dirâsâti’l-Ulyâ, Yüksek Lisans Tezi, 2017.
Aljishi, Feras vd. “A Comparative Study of Four Handwritten Text Recognition Models in Arabic Script”. Ingénierie des Systèmes d’Information 29/6 (Aralık 2024), 2243-2250.
Al-Jubouri, Mohammed Anas Hussein. Offline Arabic Handwritten Isolated Character Recognition System Using Support vector Machine and Neural Network. Amman: Middle East University, Faculty of Information Technology, Yüksek Lisans Tezi, 2017.
Bhatia, Gagan vd. “Qalam: A Multimodal LLM for Arabic Optical Character and Handwriting Recognition”. Proceedings of the Second Arabic Natural Language Processing Conference, 210-224. Bangkok: Association for Computational Linguistics, 2024.
Bilgin Tasdemir, Esma F. vd. “Automatic Transcription of Ottoman Documents Using Deep Learning”. Document Analysis Systems. ed. A. Antonacopoulos vd. 1-15. Cham: Springer, 2024.
Calfa – Vision & Language. “About Calfa” Erişim 31 Aralık 2025. https://calfa.fr/
Çakır, Ege – Ergüven, Eren – Uğur, Yunus. “Gemini 3.0 (Düşünebilen) Modeli ile Osmanlıca OCR/HTR (Otomatik Transkripsiyon) Testi”. Zenodo (Aralık 2025). Erişim 15 Nisan 2026. https://zenodo.org/records/18019479.
Çelik, Ahmet Faruk – Erden, Salih. “Literatürdeki Aidiyet Hatalarının Tespitinde Dijital Analiz Yöntemlerinin Kullanımı: Çatalcalı’nın Fetvalarının Karaçelebizâde’ye Nispeti Üzerine Bir Araştırma”. Şırnak Üniversitesi İlahiyat Fakültesi Dergisi 36 (Haziran 2025), 164-186. https://doi.org/10.35415/sirnakifd.1611229
Haldar, Rishin – Mukhopadhyay, Debajyoti. “Levenshtein Distance Technique in Dictionary Lookup Methods: An Improved Approach”. arXiv (Ocak 2011). Erişim 31 Aralık 2025. https://doi.org/10.48550/arXiv.1101.1232

i2OCR – Free Online OCR. “Free Online OCR Tool – Extract Text from Images & PDFs”. Erişim 31 Aralık 2025. https://www.i2OCR.com/
Karayiğit, Rahime. “Dijitalleştirme Çalışmalarında El Yazması Metinlerin Yapay Zekâ Yardımıyla Deşifre Edilmesi: eScriptorium Programı Örneği”. İslam Araştırmaları Dergisi 53 (2025), 189-197.
Kiessling, Benjamin vd. “Important New Developments in Arabographic Optical Character Recognition (OCR)”. Al-Uṣūr al-Wusṭā 25 (2017), 1-13.
Kirmizialtin, Suphan – Wrisley, David Joseph. “Automated Transcription of Non-Latin Script Periodicals: A Case Study in the Ottoman Turkish Print Archive”. Digital Humanities Quarterly 16/2 (2022). Erişim 31 Aralık 2025. https://web.archive.org/web/20230928110700/ http://www.digitalhumanities.org/dhq/vol/16/2/000577/000577.html
Legiest, Wouter vd. “Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell”. IACR Cryptology ePrint Archive 12 (2025), 1-32.
Levenshtein Distance Calculator – Python Implementation. “Project description”. Erişim 31 Aralık 2025. https://pypi.org/project/python-Levenshtein/
Muehlberger, Guenter vd. “Transforming Scholarship in the Archives Through Handwritten Text Recognition: Transkribus as a Case Study”. Journal of Documentation 75/5 (2019), 954-976. doi:10.1108/JD-07-2018-0114
Niyâzî-i Mısrî. Tefsîru’l-Fâtiha. Bursa: İnebey Yazma Eser Kütüphanesi, Genel Koleksiyon, 5240, 18b-20b. https://portal.yek.gov.tr/works/detail/30734
Nockels, Joe vd. “Understanding the Application of Handwritten Text Recognition Technology in Heritage Contexts: a Systematic Review of Transkribus in Published Research”. Archival Science 22 (2022), 367-392. https://doi.org/10.1007/s10502-022-09397-0
OCR.space – Free OCR API. “Free OCR API and Online OCR”. Erişim 31 Aralık 2025. https://ocr.space/
Saeed, Mehreen vd. “Muharaf: Manuscripts of Handwritten Arabic Dataset for Cursive Text Recognition”. Advances in Neural Information Processing Systems 37 (NeurIPS 2024), 1-28. Vancouver: Curran Associates, Inc., 2024. https://arxiv.org/abs/2406.09630
Saraçoğlu, Tuba Nur. “Dijital Beşerî Bilimler Bağlamında İlahiyat/İslâmî İlimler”. İslam Tetkikleri Dergisi 12/2 (2022), 845-891. https://doi.org/10.26650/iuitd.2022.1123964
Savant, Sarah Bowen vd. “KITAB: Knowledge, Information Technology, and the Arabic Book”. Erişim 31 Aralık 2025. http://kitab-project.org
Stokes, Peter A. vd. “The eScriptorium VRE for Manuscript Cultures”. Classics@ Journal 19 (2021). Erişim 31 Aralık 2025. https://classics-at.chs.harvard.edu/classics18-stokes-kiessling-stokl-ben-ezra-tissot-gargem
Thérouin, Vincent vd. “Décrire la calligraphie en caractères arabes: Enjeux et méthodologies pour la constitution d’une base de données pour le projet CallFront”. Revue des mondes musulmans et de la Méditerranée 156 (2024), 115-153. https://doi.org/10.4000/130ft
Transkribus – READ-COOP SCE. “AI Text Recognition”. Erişim 31 Aralık 2025. https://www.transkribus.org/
Uzan, Sare – Dölek, İshak. “Osmanlıca-Türkçe Uçtan Uca Aktarım Sistemi-Osmanlica.com Projesinin Türk Dili ve Edebiyatı Alanına Katkıları”. Fırat Üniversitesi Sosyal Bilimler Dergisi 35/3 (2025), 907-924. https://doi.org/10.18069/firatsbed.1570398
Ünal Şahin, Ayşenur Elif. “Dijital Beşerî Bilimlerin Kur’an El Yazmalarına Uygulanabilirliği: Yöntemler, Uygulamalar ve Karşılaşılan Sorunlar”. Tefsir Araştırmaları Dergisi 9/1 (Nisan 2025), 214-231. https://doi.org/10.31121/tader.1643718
Vidal-Gorène, Chahan vd. “Enhancing Arabic Maghribi Handwritten Text Recognition with RASAM 2: A Comprehensive Dataset and Benchmarking”. Computational Humanities Research Conference (CHR 2024), 200-216. Aarhus: CEUR Workshop Proceedings, 2024.
Zinki.ai – Arabic Handwriting Recognition. “Product”. Erişim 31 Aralık 2025. https://zinki.ai/

Ayrıntılar

Birincil Dil

Türkçe

Konular

Tefsir

Bölüm

Araştırma Makalesi

Yazarlar

Abdulcabbar Adıgüzel ^*
0000-0001-5027-8615
Türkiye

Yayımlanma Tarihi

20 Haziran 2026

Gönderilme Tarihi

2 Ocak 2026

Kabul Tarihi

30 Mayıs 2026

Yayımlandığı Sayı

Yıl 2026 Cilt: 9 Sayı: Özel Sayı

DOI

https://doi.org/10.52637/kiid.1854450

IZ

https://izlik.org/JA24YG94JX

APA

Adıgüzel, A. (2026). Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme. Kocatepe İslami İlimler Dergisi, 9(Özel Sayı), 162-182. https://doi.org/10.52637/kiid.1854450

AMA

1.Adıgüzel A. Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme. Kocatepe İslami İlimler Dergisi. 2026;9(Özel Sayı):162-182. doi:10.52637/kiid.1854450

Chicago

Adıgüzel, Abdulcabbar. 2026. “Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme”. Kocatepe İslami İlimler Dergisi 9 (Özel Sayı): 162-82. https://doi.org/10.52637/kiid.1854450.

EndNote

Adıgüzel A (01 Haziran 2026) Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme. Kocatepe İslami İlimler Dergisi 9 Özel Sayı 162–182.

IEEE

[1]A. Adıgüzel, “Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme”, Kocatepe İslami İlimler Dergisi, c. 9, sy Özel Sayı, ss. 162–182, Haz. 2026, doi: 10.52637/kiid.1854450.

ISNAD

Adıgüzel, Abdulcabbar. “Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme”. Kocatepe İslami İlimler Dergisi 9/Özel Sayı (01 Haziran 2026): 162-182. https://doi.org/10.52637/kiid.1854450.

JAMA

1.Adıgüzel A. Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme. Kocatepe İslami İlimler Dergisi. 2026;9:162–182.

MLA

Adıgüzel, Abdulcabbar. “Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme”. Kocatepe İslami İlimler Dergisi, c. 9, sy Özel Sayı, Haziran 2026, ss. 162-8, doi:10.52637/kiid.1854450.

Vancouver

1.Abdulcabbar Adıgüzel. Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme. Kocatepe İslami İlimler Dergisi. 01 Haziran 2026;9(Özel Sayı):162-8. doi:10.52637/kiid.1854450

Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.

Arapça Yazma Eserlerde Metin Tanıma (HTR) Teknolojilerinin Analizi: Web Tabanlı Araçlar Üzerine Bir İnceleme

Öz

Anahtar Kelimeler

Analysis of Handwritten Text Recognition (HTR) Technologies for Arabic Manuscripts: A Review of Web-Based Tools

Öz

Anahtar Kelimeler

Öz

Kaynakça

Ayrıntılar

Birincil Dil

Konular

Bölüm

Yazarlar

Yayımlanma Tarihi

Gönderilme Tarihi

Kabul Tarihi

Yayımlandığı Sayı

DOI

IZ

Kaynak Göster