Research Article

Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Volume: 10 Number: 4 December 15, 2020
EN TR

Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Abstract

Görüntü formatındaki belgelerin içinden karakterlerin veya verilerinin tekrar metin biçimine dönüştürülmesi büyük zaman ve iş gücü kaybı demektir. Günümüzde doküman işlemlerinde, işlem maliyetlerini düşürmek ve verimlilik oranlarını arttırmak istenilmektedir. Okutulacak belgeler üzerinde farklı yazı stilleri, yazı boyutları ve yazı biçimleri olabilmektedir. Ayrıca el yazısı notları da olabilmektedir. Bilgisayar ortamında hazırlanan ve bilinen yazı stilleriyle oluşturulan karakter değerlerinin tekrar düzenlenebilir metin formatına dönüştürme başarısı daha yüksektir ancak el yazısı karakterlerinin dönüştürme başarısı daha düşüktür. Tesseract kütüphanesinin eğitim verilerinin yeterli olmaması sebebiyle bazı yazı biçimlerinde başarı oranı düşük olabilmektedir. Bu çalışmada; OCR teknolojisi için kullanılan Tesseract kütüphanesi yardımıyla farklı yazı stilleri üzerinde, farklı yazı biçimleri uygulanarak, alfabetik karakter ve rakam okutulması gerçekleştirilmiş ve okuma başarı kıyaslaması yapılmıştır. Times New Roman, Calibri ve Arial yazı stilleri üzerinde normal, kalın ve eğik yazı biçimleri uygulanan örnekler kullanılmıştır. Ayrıca Tesseract kütüphanesi kullanımı öncesi, görüntü üzerinde Error Diffusion (Hata Yayılımı) algoritmaları ile iyileştirmeler yapılarak okuma oranları karşılaştırılmıştır. Böylece OCR tanıma yönteminin başarısını arttıran, ön işlem algoritmasının bulunması amaçlanmıştır. Elde edilen değerlere göre; belge üzerinde ön işlem olarak, Floyd Steinberg hata dağılım algoritması kullanımından sonra Tesseract kütüphanesinin daha doğru okuma yaptığı görülmüştür.

Keywords

Supporting Institution

Dumlupınar Üniversitesi

References

  1. ABBYY, 2020. Abbyy Ürünleri, https://www.abbyy.com/tr-tr/finereader/ (Erişim Tarihi:30.03 2020).
  2. Bakshi A, Patel AK, 2018. A Novel Error Diffusion Algorithm for Halftoning Greyscale Image Using Pull Based Method. International Conference on Communication and Signal Processing (ICCSP’18), 3-5 April 2018, Chennai.
  3. Caca Labs, 2013. Error Diffussion, http://caca.zoy.org/study/part3.html (Erişim Tarihi:20.03.2020).
  4. Floyd RW, Steinberg L, 1976. An Adaptive Algorithm for Spatial Grey Scale. Proceedings of the Society of Information Display, 17(2): 75-77.
  5. Fung YH, Chan YH, 2009. A Multiscale Error Diffusion Algorithm for Green Noise Digital Halftoning. 17th European Signal Processing Conference (EUSIPCO 2009), August 24-28 2009, Glasgow.
  6. Gider Ç, Albayrak SV, 2018. Identifing of Alphanumerical Codes in Promotional products by Using of Deep Neural Network. 2018 3rd International Conference on Computer Science and Engineering (UBMK 2018),20-23 Sept. 2018, Sarajevo.
  7. GitHub Inc, 2020. Tesseract OCR,https://github.com/tesseract-ocr/tesseract (Erişim Tarihi:05.05.2020).
  8. Gupta A, Khandelwal V, Agarwal N, Gupta A, 2009. Five Neighbor Stochastic Error Diffusion for Digital Halftoning, 2nd IEEE International Conference on Computer Science and Information Technology, 8-11 Aug. 2009, Beijing.

Details

Primary Language

Turkish

Subjects

Computer Software

Journal Section

Research Article

Publication Date

December 15, 2020

Submission Date

April 5, 2020

Acceptance Date

May 27, 2020

Published in Issue

Year 2020 Volume: 10 Number: 4

APA
Çelik, A. (2020). Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology, 10(4), 2328-2340. https://doi.org/10.21597/jist.714810
AMA
1.Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. J. Inst. Sci. and Tech. 2020;10(4):2328-2340. doi:10.21597/jist.714810
Chicago
Çelik, Ahmet. 2020. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10 (4): 2328-40. https://doi.org/10.21597/jist.714810.
EndNote
Çelik A (December 1, 2020) Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology 10 4 2328–2340.
IEEE
[1]A. Çelik, “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”, J. Inst. Sci. and Tech., vol. 10, no. 4, pp. 2328–2340, Dec. 2020, doi: 10.21597/jist.714810.
ISNAD
Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10/4 (December 1, 2020): 2328-2340. https://doi.org/10.21597/jist.714810.
JAMA
1.Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. J. Inst. Sci. and Tech. 2020;10:2328–2340.
MLA
Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology, vol. 10, no. 4, Dec. 2020, pp. 2328-40, doi:10.21597/jist.714810.
Vancouver
1.Ahmet Çelik. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. J. Inst. Sci. and Tech. 2020 Dec. 1;10(4):2328-40. doi:10.21597/jist.714810

Cited By