Research Article

Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması

Volume: 6 Number: 1 April 30, 2021
TR EN

Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması

Abstract

Basılı belge ya da görüntülerdeki karakterlerin okunarak, düzenlenebilir metinler haline getirilmesi Optik Karakter Tanıma (OKT) yöntemleriyle gerçekleştirilmektedir. Karakter tanıma yöntemlerinin temelinde görüntü işleme basamakları vardır. İlk olarak basılı belgelerin veya görüntülerin bir kamera ya da tarayıcı yardımıyla sayısal ortama aktarılması gerekmektedir. Ancak belge görüntülerinin elde edilirken ışık, gölge ve arka plan gibi çevresel parametrelere dikkat edilmediğinde karakter tanıma zor olmaktadır. Ayrıca yine belge ya da görüntülerin, eğik olarak sayısal ortama aktarılmasıyla, karakterlerde meydana gelen eğiklikler, el yazısıyla karakterlerde oluşan eğiklikler ya da italik (eğik) biçimli karakterlerdeki eğiklikler OKT tanıma başarısını olumsuz etkilemektedir. Günümüzde birçok açık ya da kapalı kaynak kodlu OKT yazılım uygulaması vardır. Tesseract en yaygın kullanılan ve karakter tanıma başarısı yüksek olan açık kaynak kodlu yazılımdır. Bu çalışmada, açık kaynak kodlu Tesseract karakter tanıma yazılımının eğik karakter tanıma başarısını arttırmaya yönelik, bir görüntü işleme yöntemi geliştirilmiştir. Geliştirilen yöntem, Dithering (Titreşim) görüntü işleme algoritmasının 4x1 boyutlu yatay biçime dönüştürülmesiyle elde edilmiştir. Yapılan testlerde, Arial ve Times New Roman yazı stillerinin eğik biçimli karakterleri kullanılmıştır. Birbirine benzeyen 429 karakter üzerinde yapılan test sonucunda, geliştirilen yöntemin %33’e varan oranlarda, Tesseract yazılımının başarısını arttırdığı görülmüştür.

Keywords

References

  1. [1] Patel, C., Patel, A., Patel, D., “Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study”, International Journal of Computer Applications, 2012, 55(10), 50-56.
  2. [2] Shahreza, S.S., Shalmani, M.T.M., Shahreza, M.H.S., “Preparing Persian/Arabic Scanned Images for OCR”, 2nd International Conference on Information & Communication Technologies, Damascus, Syria, 2006.
  3. [3] Shen, M., Lei, H., “Improving OCR Performance with Background Image Elimination”, 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD), Zhangjiajie, China, 2015.
  4. [4] Kessi, L., Lebourgeois, F., Garcia, C., “An Efficient New PDE-based Characters Reconstruction After Graphics Removal”, 15th International Conference on Frontiers in Handwriting Recognition (ICFHR), Shenzhen, China, 2016.
  5. [5] Sharma, P., Sharma, S., “Image Processing based Degraded Camera Captured Document Enhancement for Improved OCR Accuracy”, 6th International Conference - Cloud System and Big Data Engineering (Confluence), Noida, India, 2016.
  6. [6] Chan, W. T., Lo, T. Y., Tso, C. P., Sim, K. S., “A Method in Applying OCR in Processing of Thermal Images”, 2011 IEEE International Conference on Signal and Image Processing Applications (ICSIPA), Kuala Lumpur, Malaysia, 2011.
  7. [7] Sharma, P., Sharma, S., Priambada, S., Widyantoro, D. H., “Levensthein Distance as a Post-Process to Improve the Performance of OCR in Written Road Signs”, 6’th International Conference - Cloud System and Big Data Engineering (Confluence), Noida, India, 2016.
  8. [8] Saray, T., Çetinkaya, A., Okatan, A., “Optik Karakter Tanıma Yöntemi ile Otomatik Tabela Okuyucu”, International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey, 2017.

Details

Primary Language

Turkish

Subjects

Computer Software

Journal Section

Research Article

Publication Date

April 30, 2021

Submission Date

November 28, 2020

Acceptance Date

February 25, 2021

Published in Issue

Year 2021 Volume: 6 Number: 1

APA
Çelik, A. (2021). Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi, 6(1), 1-11. https://doi.org/10.46578/humder.720001
AMA
1.Çelik A. Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi. 2021;6(1):1-11. doi:10.46578/humder.720001
Chicago
Çelik, Ahmet. 2021. “Eğik Karakter Tanıma Başarısını Arttırmak Için Yeni Bir Yöntemin Kullanılması”. Harran Üniversitesi Mühendislik Dergisi 6 (1): 1-11. https://doi.org/10.46578/humder.720001.
EndNote
Çelik A (April 1, 2021) Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi 6 1 1–11.
IEEE
[1]A. Çelik, “Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması”, Harran Üniversitesi Mühendislik Dergisi, vol. 6, no. 1, pp. 1–11, Apr. 2021, doi: 10.46578/humder.720001.
ISNAD
Çelik, Ahmet. “Eğik Karakter Tanıma Başarısını Arttırmak Için Yeni Bir Yöntemin Kullanılması”. Harran Üniversitesi Mühendislik Dergisi 6/1 (April 1, 2021): 1-11. https://doi.org/10.46578/humder.720001.
JAMA
1.Çelik A. Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi. 2021;6:1–11.
MLA
Çelik, Ahmet. “Eğik Karakter Tanıma Başarısını Arttırmak Için Yeni Bir Yöntemin Kullanılması”. Harran Üniversitesi Mühendislik Dergisi, vol. 6, no. 1, Apr. 2021, pp. 1-11, doi:10.46578/humder.720001.
Vancouver
1.Ahmet Çelik. Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi. 2021 Apr. 1;6(1):1-11. doi:10.46578/humder.720001

Cited By