El yazısı metin tanıma, çoğunlukla değişken yazı stilleri ve yazıların yer aldığı koşulsuz ortamlar nedeniyle hala zorlu bir problem olarak karşımıza çıkmaktadır. Literatürdeki çalışmalar, el yazısı örneklerin bulunduğu ortamların genellikle herhangi bir koşula sahip olmaması sebebiyle odaklandıkları el yazısı örneklerine ve ortamlarına göre özelleşmiştir. Bu yüzden farklı yazı tipleri ve ortamlar üzerinde uygulanabilirlikleri düşüktür. Önerilen çalışma, koşulsuz ortamlarda bulunan el yazısı Türkiye Cumhuriyeti Kimlik Numarası’nın (TCKN) tanınmasını hedeflemektedir. TCKN, her Türkiye vatandaşına verilen benzersiz bir kişisel kimlik numarasıdır. TCKN içerisindeki tek bir rakamı yanlış tahmin etmek bütün numaranın yanlış okunmasına yol açacağı için her rakamı doğru tahmin etmek oldukça önemlidir. Önerdiğimiz teknik, dokümanda TCKN yakalama, TCKN içerisinde rakam yakalama ve yakalanan rakamın sınıflandırılması olarak üç ana başlığa ayrılmaktadır. Rakam sınıflandırma aşamasında yakalanan rakamlar bir oto kodlayıcı yardımıyla taslak rakama dönüştürülürken oto kodlayıcıdan elde edilen özniteliklerle sınıflandırılmaktadırlar. Bu işlem, el yazısı rakamların sınıflarına ait en iyi temsile benzemesine çalışarak daha başarılı ayrışmalarını sağlamaktadır. Yapılan deneylerde oto kodlayıcı ile taslağa dönüştürme metodunun sınıflandırma başarımını önemli ölçüde artırdığı görülmüştür.
Handwritten text recognition is still a challenging problem, mostly due to the variable writing styles and unconditional environments in which handwritten text appears. The studies in the literature are specialised to the handwriting samples and environments they focus on, as the environments in which handwritten samples are found are usually unconditioned. Therefore, their applicability to different handwriting types and environments is low. The proposed work aims to recognise the handwritten Turkish Republic Identity Number (TCKN) in unconditional environments. TCKN is a unique personal identification number given to every citizen of Turkey. It is very important to guess each digit correctly, since guessing a single digit in the TCKN will lead to misreading the whole number. Our proposed technique is divided into three main parts: capturing the TCKN in the document, capturing the digit in the TCKN and classifying the captured digit. In the digit classification stage, the captured digits are converted into draft digits with the help of an autoencoder and classified with the attributes obtained from the autoencoder. This process ensures more successful discrimination of handwritten digits by trying to resemble the best representation of their class. In the experiments, it has been observed that the autoencoder to draft conversion method significantly improves the classification performance.
Birincil Dil | Türkçe |
---|---|
Konular | Bilgisayar Yazılımı, Yazılım Mühendisliği (Diğer) |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 15 Mart 2025 |
Gönderilme Tarihi | 7 Mart 2024 |
Kabul Tarihi | 27 Eylül 2024 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 15 Sayı: 1 |
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.