Dijitalleştirme, fiziksel ortamda bulunan bilgi kaynaklarının taranıp makine dili ile okunabilmesi, veri tabanlarına aktarılabilmesi, işlenebilmesi ve saklanabilmesi amacıyla sayısal kodlara dönüştürülmesi işlemidir. Dijitalleştirme sayesinde okuyucuya, zamana ve mekâna bağlı olmadan araştırma imkânı sunulurken, bilgi merkezlerine ise bilgi kaynaklarının uzun süreli saklanması ve korunması konusunda fırsatlar sunulmaktadır. Bu çalışmada, Dijital Tarım Kütüphanesinde gerçekleştirilen dijitalleştirme projesi üzerinden optik karakter tanımlama doğrulama başarısı ölçülmektedir. Çalışmada, dijitalleştirme ve optik karakter tanımlama hakkında bilgi verilerek, dijitalleştirilen bilgi kaynaklarından seçilen örneklemler üzerinden optik karakter doğrulama oranı hesaplanmıştır. 2018-2019 yılları arasında dijitalleştirilen 7 bin bilgi kaynağının kelime hata oranı hesaplaması sonucunda, dijitalleştirme projesinde OCR (Optical Character Recognition) kelime doğrulama oranı %98 olarak tespit edilmiştir. Ayrıca, dijitalleştirme projelerinde karakter tanımanın kalite kontrol koşulları arasında yer almamasının sebep olacağı eksiklikleri ortadan kaldırmak amacıyla; ilgili proje kapsamında yürütülen faaliyetlerin yanında geliştirilen kalite kontrol yöntemi ve yazılımının, diğer projelere de örnek teşkil edecek şekilde paylaşılması amaçlanmaktadır.
OCR Optik Karakter Tanımlama OCR Doğruluğu Dijitalleştirme Dijitalleştirme Teknolojisi Dijital Tarım Kütüphanesi
Digitization is the process of scanning information sources in the physical environment and converting them into numerical codes so that they can be read with machine language, transferred to databases, processed and stored. Thanks to digitization, the reader is provided with the opportunity to research independently of time and space, while information centers are provided with opportunities for long-term storage and protection of information resources. In this study, the optical character identification verification success is measured through the digitization project carried out in the Digital Agriculture Library. In the study, information about digitization and optical character identification is provided, and the optical character verification rate is calculated over the samples selected from the digitized information sources. As a result of the word error rate calculation of the information sources digitized between 2018-2019, the OCR word verification rate in the digitization project was determined to be as 98%. In addition, in order to eliminate the deficiencies that will be caused by the fact that character recognition is not included among the quality control conditions in digitization projects; It is aimed to share the quality control method and software developed in addition to the activities carried out within the scope of the relevant project as an example for other projects.
OCR Optical Character Recognition OCR Accuracy Digitization Digitization Technology Digital Agriculture Library
Birincil Dil | Türkçe |
---|---|
Konular | Arşiv, Dijital Küratörlük ve Koruma, Kütüphane Çalışmaları |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 30 Temmuz 2025 |
Gönderilme Tarihi | 14 Temmuz 2025 |
Kabul Tarihi | 17 Temmuz 2025 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 16 Sayı: 2 |
Ankara Üniversitesi Sosyal Bilimler Dergisi Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY-NC) ile lisanslanmıştır.