Research Article
BibTex RIS Cite

Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Year 2020, Volume: 10 Issue: 4, 2328 - 2340, 15.12.2020
https://doi.org/10.21597/jist.714810

Abstract

Görüntü formatındaki belgelerin içinden karakterlerin veya verilerinin tekrar metin biçimine dönüştürülmesi büyük zaman ve iş gücü kaybı demektir. Günümüzde doküman işlemlerinde, işlem maliyetlerini düşürmek ve verimlilik oranlarını arttırmak istenilmektedir. Okutulacak belgeler üzerinde farklı yazı stilleri, yazı boyutları ve yazı biçimleri olabilmektedir. Ayrıca el yazısı notları da olabilmektedir. Bilgisayar ortamında hazırlanan ve bilinen yazı stilleriyle oluşturulan karakter değerlerinin tekrar düzenlenebilir metin formatına dönüştürme başarısı daha yüksektir ancak el yazısı karakterlerinin dönüştürme başarısı daha düşüktür. Tesseract kütüphanesinin eğitim verilerinin yeterli olmaması sebebiyle bazı yazı biçimlerinde başarı oranı düşük olabilmektedir. Bu çalışmada; OCR teknolojisi için kullanılan Tesseract kütüphanesi yardımıyla farklı yazı stilleri üzerinde, farklı yazı biçimleri uygulanarak, alfabetik karakter ve rakam okutulması gerçekleştirilmiş ve okuma başarı kıyaslaması yapılmıştır. Times New Roman, Calibri ve Arial yazı stilleri üzerinde normal, kalın ve eğik yazı biçimleri uygulanan örnekler kullanılmıştır. Ayrıca Tesseract kütüphanesi kullanımı öncesi, görüntü üzerinde Error Diffusion (Hata Yayılımı) algoritmaları ile iyileştirmeler yapılarak okuma oranları karşılaştırılmıştır. Böylece OCR tanıma yönteminin başarısını arttıran, ön işlem algoritmasının bulunması amaçlanmıştır. Elde edilen değerlere göre; belge üzerinde ön işlem olarak, Floyd Steinberg hata dağılım algoritması kullanımından sonra Tesseract kütüphanesinin daha doğru okuma yaptığı görülmüştür.

Supporting Institution

Dumlupınar Üniversitesi

References

  • ABBYY, 2020. Abbyy Ürünleri, https://www.abbyy.com/tr-tr/finereader/ (Erişim Tarihi:30.03 2020).
  • Bakshi A, Patel AK, 2018. A Novel Error Diffusion Algorithm for Halftoning Greyscale Image Using Pull Based Method. International Conference on Communication and Signal Processing (ICCSP’18), 3-5 April 2018, Chennai.
  • Caca Labs, 2013. Error Diffussion, http://caca.zoy.org/study/part3.html (Erişim Tarihi:20.03.2020).
  • Floyd RW, Steinberg L, 1976. An Adaptive Algorithm for Spatial Grey Scale. Proceedings of the Society of Information Display, 17(2): 75-77.
  • Fung YH, Chan YH, 2009. A Multiscale Error Diffusion Algorithm for Green Noise Digital Halftoning. 17th European Signal Processing Conference (EUSIPCO 2009), August 24-28 2009, Glasgow.
  • Gider Ç, Albayrak SV, 2018. Identifing of Alphanumerical Codes in Promotional products by Using of Deep Neural Network. 2018 3rd International Conference on Computer Science and Engineering (UBMK 2018),20-23 Sept. 2018, Sarajevo.
  • GitHub Inc, 2020. Tesseract OCR,https://github.com/tesseract-ocr/tesseract (Erişim Tarihi:05.05.2020).
  • Gupta A, Khandelwal V, Agarwal N, Gupta A, 2009. Five Neighbor Stochastic Error Diffusion for Digital Halftoning, 2nd IEEE International Conference on Computer Science and Information Technology, 8-11 Aug. 2009, Beijing.
  • GOCR, 2020. Open Source Character Recognition, https://www-e.ovgu.de/jschulen/ocr/index.html (Erişim Tarihi:30.03 2020).
  • Jarvis JF, Judice CN, Ninke WH, 1976. A Survey of Techniques for the Display of Continuous Tone Pictures on Bi-level Displays. Computer Graphics and Image Processing, 5(1): 13–40.
  • ,Koyun A, Afşin E, 2017. Derin Öğrenme ile İki Boyutlu Optik Karakter Tanıma, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 10(2):11-14.
  • Kutlu H, Yazan E, 2014. OCR API’leri ve Gerek Zamanlı OCR Uygulaması. XVI. Akademik Bilişim Konferans (AB 2014), 5-7 Şubat 2014, Mersin.
  • Misra I, Deshpande A, Narayanan PJ, 2011. Hybrid Implementation of Error Diffusion Dithering. 18th International Conference on High Performance Computing, 18-21 December 2011, Bangalore.
  • Mithe R, Indalkar S, Divekar N, 2013. Optical Character Recognition, International Journal of Recent Technology and Engineering, 2(1):72-75.
  • Oki Electric Industry, 2020. OKI opne up your Dreams, https://www.oki.com(Erişim Tarihi:30.03.2020).
  • Panda NR, Sahoo AK, Kumar S, 2015. A Negative Multiscale Error Diffusion Technique for Digital Halftoning. 2015 International Conference on Pervasive Computing (ICPC), 8-10 Jan. 2015, Pune.
  • Patel C, Patel A, Patel D, 2012. Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study, International Journal of Computer Applications, 55(2):50-56.
  • Saray T, Çetinkaya A, 2017. Okatan A. Optik Karakter Tanma Yöntemi ile Otomatik Tabela Okuyucu. Uluslararası Bilgisayar Bilimleri ve Mühendisliği Konferansı(UBMK'17), 5-8 October 2017, Antalya.
  • Shiau J, Fan Z, 1994. Method for Quantization Gray Level Pixel Data with Extended Distribution Set. U.S. patent Xerox Corporation, No:5,353,127,s.1-7, Stamford, US.
  • Smith R, 2007. An Overview of the Tesseract OCR Engine. Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), 23-26 September 2007, Parana.
  • Stucki P, 2012. MECCA- a multiple error correcting computation algorithm for bi-level image hard copy reproduction. Research report RZ1060, IBM Research Laboratory, Zurich, Switzerland.
  • Tong X, Evans DA, 1996. A Statistical Approach to Automatic OCR Error Correction in Context. Fourth Workshop on Very Large Corpora(WVLC-96), 5-9 August 1996, Copenhagen..

Performance Comparison of Error Diffusion Algorithms in Optical Character Recognition

Year 2020, Volume: 10 Issue: 4, 2328 - 2340, 15.12.2020
https://doi.org/10.21597/jist.714810

Abstract

Converting characters or data to text through image formats means loss of time and labor. Today, It is desired to reduce transaction costs and increase efficiency rates in document transactions. For reading have been different writing styles, font sizes and writing formats on the documents. Computer-generated prepared character conversion and known writing style with success back into editable text format, the success of the conversion value higher then handwritten characters. The biggest step for reading in character, separating of characters from background. Due to the lack training data of the Tesseract library, the success rate, lows in some writing formats. In this study, reading alphabetical character and numbers was performed with the help of Tesseract library used for OCR technology and was made on different writing styles by applying different writing styles reading success comparison. Samples using normal, bold and italic writing formats were used on Times New Roman, Calibri and Arial font styles. Also on the image before using Tesseract library, Error Diffusion algorithms were compared with read rates by making improvements. Thus, it is aimed to find a pre-processing algorithm that increases the success of the OCR recognition method. According to the obtained values; As a pretreatment on the document, it was observed that the Tesseract library made a more accurate reading after using the Floyd Steinberg error distribution algorithm.

References

  • ABBYY, 2020. Abbyy Ürünleri, https://www.abbyy.com/tr-tr/finereader/ (Erişim Tarihi:30.03 2020).
  • Bakshi A, Patel AK, 2018. A Novel Error Diffusion Algorithm for Halftoning Greyscale Image Using Pull Based Method. International Conference on Communication and Signal Processing (ICCSP’18), 3-5 April 2018, Chennai.
  • Caca Labs, 2013. Error Diffussion, http://caca.zoy.org/study/part3.html (Erişim Tarihi:20.03.2020).
  • Floyd RW, Steinberg L, 1976. An Adaptive Algorithm for Spatial Grey Scale. Proceedings of the Society of Information Display, 17(2): 75-77.
  • Fung YH, Chan YH, 2009. A Multiscale Error Diffusion Algorithm for Green Noise Digital Halftoning. 17th European Signal Processing Conference (EUSIPCO 2009), August 24-28 2009, Glasgow.
  • Gider Ç, Albayrak SV, 2018. Identifing of Alphanumerical Codes in Promotional products by Using of Deep Neural Network. 2018 3rd International Conference on Computer Science and Engineering (UBMK 2018),20-23 Sept. 2018, Sarajevo.
  • GitHub Inc, 2020. Tesseract OCR,https://github.com/tesseract-ocr/tesseract (Erişim Tarihi:05.05.2020).
  • Gupta A, Khandelwal V, Agarwal N, Gupta A, 2009. Five Neighbor Stochastic Error Diffusion for Digital Halftoning, 2nd IEEE International Conference on Computer Science and Information Technology, 8-11 Aug. 2009, Beijing.
  • GOCR, 2020. Open Source Character Recognition, https://www-e.ovgu.de/jschulen/ocr/index.html (Erişim Tarihi:30.03 2020).
  • Jarvis JF, Judice CN, Ninke WH, 1976. A Survey of Techniques for the Display of Continuous Tone Pictures on Bi-level Displays. Computer Graphics and Image Processing, 5(1): 13–40.
  • ,Koyun A, Afşin E, 2017. Derin Öğrenme ile İki Boyutlu Optik Karakter Tanıma, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 10(2):11-14.
  • Kutlu H, Yazan E, 2014. OCR API’leri ve Gerek Zamanlı OCR Uygulaması. XVI. Akademik Bilişim Konferans (AB 2014), 5-7 Şubat 2014, Mersin.
  • Misra I, Deshpande A, Narayanan PJ, 2011. Hybrid Implementation of Error Diffusion Dithering. 18th International Conference on High Performance Computing, 18-21 December 2011, Bangalore.
  • Mithe R, Indalkar S, Divekar N, 2013. Optical Character Recognition, International Journal of Recent Technology and Engineering, 2(1):72-75.
  • Oki Electric Industry, 2020. OKI opne up your Dreams, https://www.oki.com(Erişim Tarihi:30.03.2020).
  • Panda NR, Sahoo AK, Kumar S, 2015. A Negative Multiscale Error Diffusion Technique for Digital Halftoning. 2015 International Conference on Pervasive Computing (ICPC), 8-10 Jan. 2015, Pune.
  • Patel C, Patel A, Patel D, 2012. Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study, International Journal of Computer Applications, 55(2):50-56.
  • Saray T, Çetinkaya A, 2017. Okatan A. Optik Karakter Tanma Yöntemi ile Otomatik Tabela Okuyucu. Uluslararası Bilgisayar Bilimleri ve Mühendisliği Konferansı(UBMK'17), 5-8 October 2017, Antalya.
  • Shiau J, Fan Z, 1994. Method for Quantization Gray Level Pixel Data with Extended Distribution Set. U.S. patent Xerox Corporation, No:5,353,127,s.1-7, Stamford, US.
  • Smith R, 2007. An Overview of the Tesseract OCR Engine. Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), 23-26 September 2007, Parana.
  • Stucki P, 2012. MECCA- a multiple error correcting computation algorithm for bi-level image hard copy reproduction. Research report RZ1060, IBM Research Laboratory, Zurich, Switzerland.
  • Tong X, Evans DA, 1996. A Statistical Approach to Automatic OCR Error Correction in Context. Fourth Workshop on Very Large Corpora(WVLC-96), 5-9 August 1996, Copenhagen..
There are 22 citations in total.

Details

Primary Language Turkish
Subjects Computer Software
Journal Section Bilgisayar Mühendisliği / Computer Engineering
Authors

Ahmet Çelik 0000-0002-6288-3182

Publication Date December 15, 2020
Submission Date April 5, 2020
Acceptance Date May 27, 2020
Published in Issue Year 2020 Volume: 10 Issue: 4

Cite

APA Çelik, A. (2020). Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology, 10(4), 2328-2340. https://doi.org/10.21597/jist.714810
AMA Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. J. Inst. Sci. and Tech. December 2020;10(4):2328-2340. doi:10.21597/jist.714810
Chicago Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10, no. 4 (December 2020): 2328-40. https://doi.org/10.21597/jist.714810.
EndNote Çelik A (December 1, 2020) Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology 10 4 2328–2340.
IEEE A. Çelik, “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”, J. Inst. Sci. and Tech., vol. 10, no. 4, pp. 2328–2340, 2020, doi: 10.21597/jist.714810.
ISNAD Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10/4 (December 2020), 2328-2340. https://doi.org/10.21597/jist.714810.
JAMA Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. J. Inst. Sci. and Tech. 2020;10:2328–2340.
MLA Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology, vol. 10, no. 4, 2020, pp. 2328-40, doi:10.21597/jist.714810.
Vancouver Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. J. Inst. Sci. and Tech. 2020;10(4):2328-40.