Araştırma Makalesi

Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması

Cilt: 6 Sayı: 1 30 Nisan 2021
PDF İndir
TR EN

Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması

Öz

Basılı belge ya da görüntülerdeki karakterlerin okunarak, düzenlenebilir metinler haline getirilmesi Optik Karakter Tanıma (OKT) yöntemleriyle gerçekleştirilmektedir. Karakter tanıma yöntemlerinin temelinde görüntü işleme basamakları vardır. İlk olarak basılı belgelerin veya görüntülerin bir kamera ya da tarayıcı yardımıyla sayısal ortama aktarılması gerekmektedir. Ancak belge görüntülerinin elde edilirken ışık, gölge ve arka plan gibi çevresel parametrelere dikkat edilmediğinde karakter tanıma zor olmaktadır. Ayrıca yine belge ya da görüntülerin, eğik olarak sayısal ortama aktarılmasıyla, karakterlerde meydana gelen eğiklikler, el yazısıyla karakterlerde oluşan eğiklikler ya da italik (eğik) biçimli karakterlerdeki eğiklikler OKT tanıma başarısını olumsuz etkilemektedir. Günümüzde birçok açık ya da kapalı kaynak kodlu OKT yazılım uygulaması vardır. Tesseract en yaygın kullanılan ve karakter tanıma başarısı yüksek olan açık kaynak kodlu yazılımdır. Bu çalışmada, açık kaynak kodlu Tesseract karakter tanıma yazılımının eğik karakter tanıma başarısını arttırmaya yönelik, bir görüntü işleme yöntemi geliştirilmiştir. Geliştirilen yöntem, Dithering (Titreşim) görüntü işleme algoritmasının 4x1 boyutlu yatay biçime dönüştürülmesiyle elde edilmiştir. Yapılan testlerde, Arial ve Times New Roman yazı stillerinin eğik biçimli karakterleri kullanılmıştır. Birbirine benzeyen 429 karakter üzerinde yapılan test sonucunda, geliştirilen yöntemin %33’e varan oranlarda, Tesseract yazılımının başarısını arttırdığı görülmüştür.

Anahtar Kelimeler

Kaynakça

  1. [1] Patel, C., Patel, A., Patel, D., “Optical Character Recognition by Open Source OCR Tool Tesseract: A Case Study”, International Journal of Computer Applications, 2012, 55(10), 50-56.
  2. [2] Shahreza, S.S., Shalmani, M.T.M., Shahreza, M.H.S., “Preparing Persian/Arabic Scanned Images for OCR”, 2nd International Conference on Information & Communication Technologies, Damascus, Syria, 2006.
  3. [3] Shen, M., Lei, H., “Improving OCR Performance with Background Image Elimination”, 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD), Zhangjiajie, China, 2015.
  4. [4] Kessi, L., Lebourgeois, F., Garcia, C., “An Efficient New PDE-based Characters Reconstruction After Graphics Removal”, 15th International Conference on Frontiers in Handwriting Recognition (ICFHR), Shenzhen, China, 2016.
  5. [5] Sharma, P., Sharma, S., “Image Processing based Degraded Camera Captured Document Enhancement for Improved OCR Accuracy”, 6th International Conference - Cloud System and Big Data Engineering (Confluence), Noida, India, 2016.
  6. [6] Chan, W. T., Lo, T. Y., Tso, C. P., Sim, K. S., “A Method in Applying OCR in Processing of Thermal Images”, 2011 IEEE International Conference on Signal and Image Processing Applications (ICSIPA), Kuala Lumpur, Malaysia, 2011.
  7. [7] Sharma, P., Sharma, S., Priambada, S., Widyantoro, D. H., “Levensthein Distance as a Post-Process to Improve the Performance of OCR in Written Road Signs”, 6’th International Conference - Cloud System and Big Data Engineering (Confluence), Noida, India, 2016.
  8. [8] Saray, T., Çetinkaya, A., Okatan, A., “Optik Karakter Tanıma Yöntemi ile Otomatik Tabela Okuyucu”, International Conference on Computer Science and Engineering (UBMK), Antalya, Turkey, 2017.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Yazılımı

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

30 Nisan 2021

Gönderilme Tarihi

28 Kasım 2020

Kabul Tarihi

25 Şubat 2021

Yayımlandığı Sayı

Yıl 2021 Cilt: 6 Sayı: 1

Kaynak Göster

APA
Çelik, A. (2021). Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi, 6(1), 1-11. https://doi.org/10.46578/humder.720001
AMA
1.Çelik A. Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. HUMDER. 2021;6(1):1-11. doi:10.46578/humder.720001
Chicago
Çelik, Ahmet. 2021. “Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması”. Harran Üniversitesi Mühendislik Dergisi 6 (1): 1-11. https://doi.org/10.46578/humder.720001.
EndNote
Çelik A (01 Nisan 2021) Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. Harran Üniversitesi Mühendislik Dergisi 6 1 1–11.
IEEE
[1]A. Çelik, “Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması”, HUMDER, c. 6, sy 1, ss. 1–11, Nis. 2021, doi: 10.46578/humder.720001.
ISNAD
Çelik, Ahmet. “Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması”. Harran Üniversitesi Mühendislik Dergisi 6/1 (01 Nisan 2021): 1-11. https://doi.org/10.46578/humder.720001.
JAMA
1.Çelik A. Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. HUMDER. 2021;6:1–11.
MLA
Çelik, Ahmet. “Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması”. Harran Üniversitesi Mühendislik Dergisi, c. 6, sy 1, Nisan 2021, ss. 1-11, doi:10.46578/humder.720001.
Vancouver
1.Ahmet Çelik. Eğik Karakter Tanıma Başarısını Arttırmak için Yeni Bir Yöntemin Kullanılması. HUMDER. 01 Nisan 2021;6(1):1-11. doi:10.46578/humder.720001

Cited By