Örüntü
tanıma psikolojiden biyometriye, biyoenformatikten gen ifadelerinin
analizine, trafikten hesaplamalı finansa kadar birçok alanda
kullanılmaktadır. Optik Karakter Tanıma da bu alanlardan bir
tanesidir. Kamu ve özel birçok firma, arşivlerindeki klasörlenmiş
verilerini taratarak dijital hale getirmekte ve bunun için emek
yoğun çalışmalar yapmaktadır. Ancak resim olarak
dijitalleştirilen bu verilerin içerik olarak aranması ve işlenmesi
ancak operatörlerin manuel olarak taranan resim verisine meta veri
eklemesi ile kısmi olarak gerçekleşmektedir. Bu çalışmada,
resim olarak taranarak (eng. scan) ve dijital hale getirilen büyük
miktarlardaki bu dokümanlar üzerinde içerik bazlı figür
aramaları mümkün kılan bir mimari geliştirdik.
Kullanıcı, bazı anahtar kelimelerle arama yaparak dijital
dökümanlardaki ilgili figürleri başlıklarıyla beraber
görüntüleyebilmektedir.
Sistemin
yapılabilirlik ve başarımı farklı veri setleri üzerinde test
edilmiş,
başarılı
sonuçlar
elde
edilmiştir.
Pattern recognition is used in many areas, from psychology to biometrics, analysis of gene expressions from bioinformatics, from traffic to finance calculated. Optical Character Recognition is also one of these areas. Many public and private firms digitize their archived data and make labor-intensive studies for this purpose. However, the retrieval and processing of these data, which are digitized as images, is only partially realized by adding metadata to the manually scanned image data. In this work, we developed an architecture that makes contentbased figure searches possible on these scanned documents in large quantities. The user can search with some keywords and display related figures in digital documents with their captions. The feasibility and performance of the system have been tested on different data sets and successful results have been obtained.
Document digitization Figure/picture detection Caption detection Content based search MongoDB
Primary Language | Turkish |
---|---|
Subjects | Engineering |
Journal Section | Articles |
Authors | |
Publication Date | January 31, 2018 |
Published in Issue | Year 2018 |