Görüntü işlemede önemli bir görev olan görüntü gürültü azaltma, devam eden araştırmalara rağmen sürekli olarak zorluklarla karşılaşmaktadır. Bu araştırmada veri kümesi, bazıları taranmış veya dijitalleştirilmiş belgelerden oluşan 60 kamu kaynağından 20.000 görüntünün çıkarılmasıyla oluşturulmuştur. Her görüntü en az bir düz metin, resim, tablo veya matematiksel ifade içerip içermediğine bakılarak kontrol edildi. Görüntülere rastgele siyah ve beyaz pikseller, Gauss bulanıklığı, gri alanlar, benek gürültüsü, rastgele yönlü çizgiler, Poisson gürültüsü ve tuz ve biber gürültüsü gibi yaygın gürültüler uygulanmıştır. Test setini oluşturmak için, yedi gürültü türü, 3500 görüntüden oluşan dengeli bir test seti oluşturmak üzere veri setinden çıkarılan 500 görüntüye ayrı ayrı eklenmiştir. Veri kümesi, eğitim ve test kümesi oranı 5:1 olan 23.000 görüntüden oluşmaktadır. DenoiseU-Net modelimiz özellikle gürültülü taranmış belgelerin kurtarılmasını hedeflemekte ve tablolar, resimler, matematiksel denklemler ve metin gibi çeşitli içerik türlerinde başarılı olmaktadır. Deneysel sonuçlar, DenoiseU-Net'in test setindeki ortalama kesinlik, geri çağırma ve F1-skorunun sırasıyla %99.36, %99.59 ve %99.48 olduğunu göstermektedir. Bu değerlendirme sonuçlarına ek olarak, görüntülerin kalitesini belirtmek için yaygın olarak kullanılan parametreler olan ortalama SSIM ve PSNR değerleri sırasıyla 0.9657 ve 40.28 dB olarak elde edilmiştir. Genel sonuçlara göre, önerilen DenoiseU-Net yöntemi üstün performans sergilemektedir.
Belge kurtarma taranmış belge belge görüntüsü gürültü giderme gürültülü görüntüler derin öğrenme yapısal benzerlik indeksi
Image denoising, a crucial task in image processing, has consistently faced challenges despite ongoing research efforts. In this research, the dataset was created by extracting 20,000 images from 60 public sources, some of scanned or digitized documents. Each image was checked to see if it contained at least one plain text, image, table or mathematical expression. Common noises such as random black and white pixels, Gaussian blur, gray areas, speckle noise, random directional lines, Poisson noise and salt and pepper noise were applied to the images. To create the test set, the seven types of noise were individually added to 500 images excluded from the dataset to create a balanced test set of 3500 images. The dataset consists of 23,000 images with a training and test set ratio of 5:1. In particular, our DenoiseU-Net model targets the recovery of noisy scanned documents and achieves capability on various content types such as tables, images, mathematical equations, and text. Experimental results show that the average precision, recall and F1-score of DenoiseU-Net on the test set are 99.36%, 99.59% and 99.48%, respectively. In addition to these evaluation results, the average SSIM and PSNR values, which are commonly used parameters to indicate the quality of the images, were obtained as 0.9657 and 40.28 dB, respectively. From overall results, proposed DenoiseU-Net method shows the superior performance.
Document recovery scanned document document image denoising noisy images deep learning structural similarity index
| Primary Language | English |
|---|---|
| Subjects | Computer Software |
| Journal Section | Articles |
| Authors | |
| Early Pub Date | November 13, 2025 |
| Publication Date | November 14, 2025 |
| Submission Date | January 28, 2025 |
| Acceptance Date | June 14, 2025 |
| Published in Issue | Year 2025 Volume: 25 Issue: 6 |
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.