Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Ahmet Çelik

doi:10.21597/jist.714810

Araştırma Makalesi

Performance Comparison of Error Diffusion Algorithms in Optical Character Recognition

Yıl 2020, Cilt: 10 Sayı: 4, 2328 - 2340, 15.12.2020

Ahmet Çelik

https://doi.org/10.21597/jist.714810

Cited By: 1

Öz

Converting characters or data to text through image formats means loss of time and labor. Today, It is desired to reduce transaction costs and increase efficiency rates in document transactions. For reading have been different writing styles, font sizes and writing formats on the documents. Computer-generated prepared character conversion and known writing style with success back into editable text format, the success of the conversion value higher then handwritten characters. The biggest step for reading in character, separating of characters from background. Due to the lack training data of the Tesseract library, the success rate, lows in some writing formats. In this study, reading alphabetical character and numbers was performed with the help of Tesseract library used for OCR technology and was made on different writing styles by applying different writing styles reading success comparison. Samples using normal, bold and italic writing formats were used on Times New Roman, Calibri and Arial font styles. Also on the image before using Tesseract library, Error Diffusion algorithms were compared with read rates by making improvements. Thus, it is aimed to find a pre-processing algorithm that increases the success of the OCR recognition method. According to the obtained values; As a pretreatment on the document, it was observed that the Tesseract library made a more accurate reading after using the Floyd Steinberg error distribution algorithm.

Anahtar Kelimeler

Optical character recognition , Tesseract , image processing , error diffusion , machine learning

Kaynakça

ABBYY, 2020. Abbyy Ürünleri, https://www.abbyy.com/tr-tr/finereader/ (Erişim Tarihi:30.03 2020).
Bakshi A, Patel AK, 2018. A Novel Error Diffusion Algorithm for Halftoning Greyscale Image Using Pull Based Method. International Conference on Communication and Signal Processing (ICCSP’18), 3-5 April 2018, Chennai.
Caca Labs, 2013. Error Diffussion, http://caca.zoy.org/study/part3.html (Erişim Tarihi:20.03.2020).
Floyd RW, Steinberg L, 1976. An Adaptive Algorithm for Spatial Grey Scale. Proceedings of the Society of Information Display, 17(2): 75-77.
Fung YH, Chan YH, 2009. A Multiscale Error Diffusion Algorithm for Green Noise Digital Halftoning. 17th European Signal Processing Conference (EUSIPCO 2009), August 24-28 2009, Glasgow.
Gider Ç, Albayrak SV, 2018. Identifing of Alphanumerical Codes in Promotional products by Using of Deep Neural Network. 2018 3rd International Conference on Computer Science and Engineering (UBMK 2018),20-23 Sept. 2018, Sarajevo.
GitHub Inc, 2020. Tesseract OCR,https://github.com/tesseract-ocr/tesseract (Erişim Tarihi:05.05.2020).
Gupta A, Khandelwal V, Agarwal N, Gupta A, 2009. Five Neighbor Stochastic Error Diffusion for Digital Halftoning, 2nd IEEE International Conference on Computer Science and Information Technology, 8-11 Aug. 2009, Beijing.
GOCR, 2020. Open Source Character Recognition, https://www-e.ovgu.de/jschulen/ocr/index.html (Erişim Tarihi:30.03 2020).
Jarvis JF, Judice CN, Ninke WH, 1976. A Survey of Techniques for the Display of Continuous Tone Pictures on Bi-level Displays. Computer Graphics and Image Processing, 5(1): 13–40.
,Koyun A, Afşin E, 2017. Derin Öğrenme ile İki Boyutlu Optik Karakter Tanıma, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 10(2):11-14.
Kutlu H, Yazan E, 2014. OCR API’leri ve Gerek Zamanlı OCR Uygulaması. XVI. Akademik Bilişim Konferans (AB 2014), 5-7 Şubat 2014, Mersin.
Misra I, Deshpande A, Narayanan PJ, 2011. Hybrid Implementation of Error Diffusion Dithering. 18th International Conference on High Performance Computing, 18-21 December 2011, Bangalore.
Mithe R, Indalkar S, Divekar N, 2013. Optical Character Recognition, International Journal of Recent Technology and Engineering, 2(1):72-75.
Oki Electric Industry, 2020. OKI opne up your Dreams, https://www.oki.com(Erişim Tarihi:30.03.2020).
Panda NR, Sahoo AK, Kumar S, 2015. A Negative Multiscale Error Diffusion Technique for Digital Halftoning. 2015 International Conference on Pervasive Computing (ICPC), 8-10 Jan. 2015, Pune.
Patel C, Patel A, Patel D, 2012. Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study, International Journal of Computer Applications, 55(2):50-56.
Saray T, Çetinkaya A, 2017. Okatan A. Optik Karakter Tanma Yöntemi ile Otomatik Tabela Okuyucu. Uluslararası Bilgisayar Bilimleri ve Mühendisliği Konferansı(UBMK'17), 5-8 October 2017, Antalya.
Shiau J, Fan Z, 1994. Method for Quantization Gray Level Pixel Data with Extended Distribution Set. U.S. patent Xerox Corporation, No:5,353,127,s.1-7, Stamford, US.
Smith R, 2007. An Overview of the Tesseract OCR Engine. Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), 23-26 September 2007, Parana.
Stucki P, 2012. MECCA- a multiple error correcting computation algorithm for bi-level image hard copy reproduction. Research report RZ1060, IBM Research Laboratory, Zurich, Switzerland.
Tong X, Evans DA, 1996. A Statistical Approach to Automatic OCR Error Correction in Context. Fourth Workshop on Very Large Corpora(WVLC-96), 5-9 August 1996, Copenhagen..

Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması

Yıl 2020, Cilt: 10 Sayı: 4, 2328 - 2340, 15.12.2020

Ahmet Çelik

https://doi.org/10.21597/jist.714810

Cited By: 1

Öz

Görüntü formatındaki belgelerin içinden karakterlerin veya verilerinin tekrar metin biçimine dönüştürülmesi büyük zaman ve iş gücü kaybı demektir. Günümüzde doküman işlemlerinde, işlem maliyetlerini düşürmek ve verimlilik oranlarını arttırmak istenilmektedir. Okutulacak belgeler üzerinde farklı yazı stilleri, yazı boyutları ve yazı biçimleri olabilmektedir. Ayrıca el yazısı notları da olabilmektedir. Bilgisayar ortamında hazırlanan ve bilinen yazı stilleriyle oluşturulan karakter değerlerinin tekrar düzenlenebilir metin formatına dönüştürme başarısı daha yüksektir ancak el yazısı karakterlerinin dönüştürme başarısı daha düşüktür. Tesseract kütüphanesinin eğitim verilerinin yeterli olmaması sebebiyle bazı yazı biçimlerinde başarı oranı düşük olabilmektedir. Bu çalışmada; OCR teknolojisi için kullanılan Tesseract kütüphanesi yardımıyla farklı yazı stilleri üzerinde, farklı yazı biçimleri uygulanarak, alfabetik karakter ve rakam okutulması gerçekleştirilmiş ve okuma başarı kıyaslaması yapılmıştır. Times New Roman, Calibri ve Arial yazı stilleri üzerinde normal, kalın ve eğik yazı biçimleri uygulanan örnekler kullanılmıştır. Ayrıca Tesseract kütüphanesi kullanımı öncesi, görüntü üzerinde Error Diffusion (Hata Yayılımı) algoritmaları ile iyileştirmeler yapılarak okuma oranları karşılaştırılmıştır. Böylece OCR tanıma yönteminin başarısını arttıran, ön işlem algoritmasının bulunması amaçlanmıştır. Elde edilen değerlere göre; belge üzerinde ön işlem olarak, Floyd Steinberg hata dağılım algoritması kullanımından sonra Tesseract kütüphanesinin daha doğru okuma yaptığı görülmüştür.

Anahtar Kelimeler

Optik karakter tanıma , , Tesseract , görüntü işleme , hata yayılımı , makine öğrenmesi

Destekleyen Kurum

Dumlupınar Üniversitesi

Kaynakça

ABBYY, 2020. Abbyy Ürünleri, https://www.abbyy.com/tr-tr/finereader/ (Erişim Tarihi:30.03 2020).
Bakshi A, Patel AK, 2018. A Novel Error Diffusion Algorithm for Halftoning Greyscale Image Using Pull Based Method. International Conference on Communication and Signal Processing (ICCSP’18), 3-5 April 2018, Chennai.
Caca Labs, 2013. Error Diffussion, http://caca.zoy.org/study/part3.html (Erişim Tarihi:20.03.2020).
Floyd RW, Steinberg L, 1976. An Adaptive Algorithm for Spatial Grey Scale. Proceedings of the Society of Information Display, 17(2): 75-77.
Fung YH, Chan YH, 2009. A Multiscale Error Diffusion Algorithm for Green Noise Digital Halftoning. 17th European Signal Processing Conference (EUSIPCO 2009), August 24-28 2009, Glasgow.
Gider Ç, Albayrak SV, 2018. Identifing of Alphanumerical Codes in Promotional products by Using of Deep Neural Network. 2018 3rd International Conference on Computer Science and Engineering (UBMK 2018),20-23 Sept. 2018, Sarajevo.
GitHub Inc, 2020. Tesseract OCR,https://github.com/tesseract-ocr/tesseract (Erişim Tarihi:05.05.2020).
Gupta A, Khandelwal V, Agarwal N, Gupta A, 2009. Five Neighbor Stochastic Error Diffusion for Digital Halftoning, 2nd IEEE International Conference on Computer Science and Information Technology, 8-11 Aug. 2009, Beijing.
GOCR, 2020. Open Source Character Recognition, https://www-e.ovgu.de/jschulen/ocr/index.html (Erişim Tarihi:30.03 2020).
Jarvis JF, Judice CN, Ninke WH, 1976. A Survey of Techniques for the Display of Continuous Tone Pictures on Bi-level Displays. Computer Graphics and Image Processing, 5(1): 13–40.
,Koyun A, Afşin E, 2017. Derin Öğrenme ile İki Boyutlu Optik Karakter Tanıma, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 10(2):11-14.
Kutlu H, Yazan E, 2014. OCR API’leri ve Gerek Zamanlı OCR Uygulaması. XVI. Akademik Bilişim Konferans (AB 2014), 5-7 Şubat 2014, Mersin.
Misra I, Deshpande A, Narayanan PJ, 2011. Hybrid Implementation of Error Diffusion Dithering. 18th International Conference on High Performance Computing, 18-21 December 2011, Bangalore.
Mithe R, Indalkar S, Divekar N, 2013. Optical Character Recognition, International Journal of Recent Technology and Engineering, 2(1):72-75.
Oki Electric Industry, 2020. OKI opne up your Dreams, https://www.oki.com(Erişim Tarihi:30.03.2020).
Panda NR, Sahoo AK, Kumar S, 2015. A Negative Multiscale Error Diffusion Technique for Digital Halftoning. 2015 International Conference on Pervasive Computing (ICPC), 8-10 Jan. 2015, Pune.
Patel C, Patel A, Patel D, 2012. Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study, International Journal of Computer Applications, 55(2):50-56.
Saray T, Çetinkaya A, 2017. Okatan A. Optik Karakter Tanma Yöntemi ile Otomatik Tabela Okuyucu. Uluslararası Bilgisayar Bilimleri ve Mühendisliği Konferansı(UBMK'17), 5-8 October 2017, Antalya.
Shiau J, Fan Z, 1994. Method for Quantization Gray Level Pixel Data with Extended Distribution Set. U.S. patent Xerox Corporation, No:5,353,127,s.1-7, Stamford, US.
Smith R, 2007. An Overview of the Tesseract OCR Engine. Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), 23-26 September 2007, Parana.
Stucki P, 2012. MECCA- a multiple error correcting computation algorithm for bi-level image hard copy reproduction. Research report RZ1060, IBM Research Laboratory, Zurich, Switzerland.
Tong X, Evans DA, 1996. A Statistical Approach to Automatic OCR Error Correction in Context. Fourth Workshop on Very Large Corpora(WVLC-96), 5-9 August 1996, Copenhagen..

Toplam 22 adet kaynakça vardır.

Ayrıntılar

Birincil Dil	Türkçe
Konular	Bilgisayar Yazılımı
Bölüm	Bilgisayar Mühendisliği / Computer Engineering
Yazarlar	Ahmet Çelik 0000-0002-6288-3182
Yayımlanma Tarihi	15 Aralık 2020
Gönderilme Tarihi	5 Nisan 2020
Kabul Tarihi	27 Mayıs 2020
Yayımlandığı Sayı	Yıl 2020 Cilt: 10 Sayı: 4

Kaynak Göster

APA	Çelik, A. (2020). Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology, 10(4), 2328-2340. https://doi.org/10.21597/jist.714810
AMA	Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Iğdır Üniv. Fen Bil Enst. Der. Aralık 2020;10(4):2328-2340. doi:10.21597/jist.714810
Chicago	Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10, sy. 4 (Aralık 2020): 2328-40. https://doi.org/10.21597/jist.714810.
EndNote	Çelik A (01 Aralık 2020) Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Journal of the Institute of Science and Technology 10 4 2328–2340.
IEEE	A. Çelik, “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”, Iğdır Üniv. Fen Bil Enst. Der., c. 10, sy. 4, ss. 2328–2340, 2020, doi: 10.21597/jist.714810.
ISNAD	Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology 10/4 (Aralık2020), 2328-2340. https://doi.org/10.21597/jist.714810.
JAMA	Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Iğdır Üniv. Fen Bil Enst. Der. 2020;10:2328–2340.
MLA	Çelik, Ahmet. “Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması”. Journal of the Institute of Science and Technology, c. 10, sy. 4, 2020, ss. 2328-40, doi:10.21597/jist.714810.
Vancouver	Çelik A. Optik Karakter Tanımada Hata Yayılım Algoritmalarının Performans Kıyaslaması. Iğdır Üniv. Fen Bil Enst. Der. 2020;10(4):2328-40.

Cited By

Otsu ve Ridler-Calvard Görüntü İşleme Yöntemlerinin Zatürre Tespitinde Kullanılması

Muş Alparslan Üniversitesi Fen Bilimleri Dergisi

https://doi.org/10.18586/msufbd.1068587

Makale Dosyaları

Tam Metin