Araştırma Makalesi

Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Cilt: 10 Sayı: 4 15 Aralık 2020
PDF İndir
EN TR

Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Öz

Görüntü formatındaki belgelerin içinden karakterlerin veya verilerinin tekrar metin biçimine dönüştürülmesi büyük zaman ve iş gücü kaybı demektir. Günümüzde doküman işlemlerinde, işlem maliyetlerini düşürmek ve verimlilik oranlarını arttırmak istenilmektedir. Okutulacak belgeler üzerinde farklı yazı stilleri, yazı boyutları ve yazı biçimleri olabilmektedir. Ayrıca el yazısı notları da olabilmektedir. Bilgisayar ortamında hazırlanan ve bilinen yazı stilleriyle oluşturulan karakter değerlerinin tekrar düzenlenebilir metin formatına dönüştürme başarısı daha yüksektir ancak el yazısı karakterlerinin dönüştürme başarısı daha düşüktür. Tesseract kütüphanesinin eğitim verilerinin yeterli olmaması sebebiyle bazı yazı biçimlerinde başarı oranı düşük olabilmektedir. Bu çalışmada; OCR teknolojisi için kullanılan Tesseract kütüphanesi yardımıyla farklı yazı stilleri üzerinde, farklı yazı biçimleri uygulanarak, alfabetik karakter ve rakam okutulması gerçekleştirilmiş ve okuma başarı kıyaslaması yapılmıştır. Times New Roman, Calibri ve Arial yazı stilleri üzerinde normal, kalın ve eğik yazı biçimleri uygulanan örnekler kullanılmıştır. Ayrıca Tesseract kütüphanesi kullanımı öncesi, görüntü üzerinde Error Diffusion (Hata Yayılımı) algoritmaları ile iyileştirmeler yapılarak okuma oranları karşılaştırılmıştır. Böylece OCR tanıma yönteminin başarısını arttıran, ön işlem algoritmasının bulunması amaçlanmıştır. Elde edilen değerlere göre; belge üzerinde ön işlem olarak, Floyd Steinberg hata dağılım algoritması kullanımından sonra Tesseract kütüphanesinin daha doğru okuma yaptığı görülmüştür.

Anahtar Kelimeler

Destekleyen Kurum

Dumlupınar Üniversitesi

Kaynakça

  1. ABBYY, 2020. Abbyy Ürünleri, https://www.abbyy.com/tr-tr/finereader/ (Erişim Tarihi:30.03 2020).
  2. Bakshi A, Patel AK, 2018. A Novel Error Diffusion Algorithm for Halftoning Greyscale Image Using Pull Based Method. International Conference on Communication and Signal Processing (ICCSP’18), 3-5 April 2018, Chennai.
  3. Caca Labs, 2013. Error Diffussion, http://caca.zoy.org/study/part3.html (Erişim Tarihi:20.03.2020).
  4. Floyd RW, Steinberg L, 1976. An Adaptive Algorithm for Spatial Grey Scale. Proceedings of the Society of Information Display, 17(2): 75-77.
  5. Fung YH, Chan YH, 2009. A Multiscale Error Diffusion Algorithm for Green Noise Digital Halftoning. 17th European Signal Processing Conference (EUSIPCO 2009), August 24-28 2009, Glasgow.
  6. Gider Ç, Albayrak SV, 2018. Identifing of Alphanumerical Codes in Promotional products by Using of Deep Neural Network. 2018 3rd International Conference on Computer Science and Engineering (UBMK 2018),20-23 Sept. 2018, Sarajevo.
  7. GitHub Inc, 2020. Tesseract OCR,https://github.com/tesseract-ocr/tesseract (Erişim Tarihi:05.05.2020).
  8. Gupta A, Khandelwal V, Agarwal N, Gupta A, 2009. Five Neighbor Stochastic Error Diffusion for Digital Halftoning, 2nd IEEE International Conference on Computer Science and Information Technology, 8-11 Aug. 2009, Beijing.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Yazılımı

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

15 Aralık 2020

Gönderilme Tarihi

5 Nisan 2020

Kabul Tarihi

27 Mayıs 2020

Yayımlandığı Sayı

Yıl 2020 Cilt: 10 Sayı: 4

Kaynak Göster

APA
Çelik, A. (2020). Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology, 10(4), 2328-2340. https://doi.org/10.21597/jist.714810
AMA
1.Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Iğdır Üniv. Fen Bil Enst. Der. 2020;10(4):2328-2340. doi:10.21597/jist.714810
Chicago
Çelik, Ahmet. 2020. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10 (4): 2328-40. https://doi.org/10.21597/jist.714810.
EndNote
Çelik A (01 Aralık 2020) Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology 10 4 2328–2340.
IEEE
[1]A. Çelik, “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”, Iğdır Üniv. Fen Bil Enst. Der., c. 10, sy 4, ss. 2328–2340, Ara. 2020, doi: 10.21597/jist.714810.
ISNAD
Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10/4 (01 Aralık 2020): 2328-2340. https://doi.org/10.21597/jist.714810.
JAMA
1.Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Iğdır Üniv. Fen Bil Enst. Der. 2020;10:2328–2340.
MLA
Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology, c. 10, sy 4, Aralık 2020, ss. 2328-40, doi:10.21597/jist.714810.
Vancouver
1.Ahmet Çelik. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Iğdır Üniv. Fen Bil Enst. Der. 01 Aralık 2020;10(4):2328-40. doi:10.21597/jist.714810

Cited By