SÜPERPİKSEL TABANLI SATIR BÖLÜTLEME
Öz
Satır bölütleme tarihi doküman analizi uygulamalarının en temel aşamalarından birisidir. Satır bölütleme başarısı, daha sonraki doküman analizi yöntemlerinin başarısını doğrudan etkilemektedir. Matbu belgelerde kayıpsız satır bölütleme işlemi kolaylıkla yapılabilmektedir. Ancak, el yazımı belgeler için satır bölütleme işlemi metin satırlarının eğik, eğri, dalgalı olması, satırlar arası boşlukların darlığı, örtüşen ve temas eden bileşenlerden dolayı hala zorlayıcı bir problemdir. Bu çalışmada, el yazımı dokümanlar için süperpiksel tabanlı yeni bir satır bölütleme yöntemi önerilmiştir. Yöntem ardışık satırları bölütleyebilen en güvenli sınırın elde edilmesini hedeflemektedir. Önerilen yöntem 853 adet Çince el yazımı doküman imgesi içeren HIT-MW veri seti üzerinde uygulanmıştır. Veri setinin en önemli özelliği eğik, temas eden ve örtüşen satır davranışlarına sahip imgelerden oluşmasıdır. Önerilen yöntem ile % 98.03 tespit oranı, % 97.66 tanıma doğruluğu elde edilmiş ve yöntemin başarısı literatürde bulunan diğer yöntemlerle karşılaştırılmıştır. Elde edilen sonuçlar ışığında önerilen yöntemin el yazımı metinlerde satır bölütleme uygulamalarındaki başarısı ve potansiyeli ortaya konmuştur.
Anahtar Kelimeler
Kaynakça
- Adiguzel, H., Sahin, E., Duygulu, P., 2012. A Hybrid Approach for Line Segmentation in Handwritten Documents. In Frontiers in Handwriting Recognition (ICFHR), 2012 International Conference on (pp. 503-508). IEEE.
- Alaei, A., Pal, U., Nagabhushan, P., 2011. A New Scheme for Unconstrained Handwritten Text-Line Segmentation. Pattern Recognition, 44(4), 917-928.
- Arivazhagan, M., Srinivasan, H., Srihari, S. (2007, January). A statistical approach to line segmentation in handwritten documents. In Document Recognition and Retrieval XIV (Vol. 6500, p. 65000T). International Society for Optics and Photonics.
- Ataer, E., Duygulu, P., 2006. Retrieval of Ottoman Documents. In Proceedings of the 8th ACM International Workshop on Multimedia Information Retrieval (MIR '06). ACM, New York, NY, USA, 155-162.
- Du, X., Pan, W., Bui, T. D. (2009). Text line segmentation in handwritten documents using Mumford–Shah model. Pattern Recognition, 42(12), 3136-3145.
- Fulkerson, B., Vedaldi, A., Soatto, S. (2009, September). Class segmentation and object localization with superpixel neighborhoods. In Computer Vision, 2009 IEEE 12th International Conference on (pp. 670-677). IEEE.
- Han, X., Yao, H., Zhong, G. (2017, February). Handwritten text line segmentation by spectral clustering. In Eighth International Conference on Graphic and Image Processing (ICGIP 2016) (Vol. 10225, p. 102251A). International Society for Optics and Photonics.
- He, X., Zemel, R. S., Ray, D. (2006, May). Learning and incorporating top-down cues in image segmentation. In European conference on computer vision (pp. 338-351). Springer, Berlin, Heidelberg.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Bilgisayar Yazılımı, Elektrik Mühendisliği
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
19 Aralık 2019
Gönderilme Tarihi
31 Ocak 2019
Kabul Tarihi
16 Haziran 2019
Yayımlandığı Sayı
Yıl 2019 Cilt: 7 Sayı: 4