Scatter plot is one of the well-known charts and is frequently embedded in different types of documents such as articles, books, and dissertations. However, the information given in the scatter plots can’t be directly noticed by visually impaired individuals, because they are usually in an image format, and so they are not naturally readable by machines. To solve this problem, this paper proposes a system that can extract visual properties from scatter plot images using deep learning and image processing techniques. It is the first study that automatically classifies scatter plots in terms of two aspects: degree of correlation (strong or weak) and types of correlation (positive, negative, or neutral). In the experimental studies, alternative convolutional neural network (CNN) architectures were compared on both synthetic and real-world datasets in terms of accuracy, including Residual Networks (ResNet), Alex Networks (AlexNet), and Visual Geometry Group (VGG) Networks. The experimental results showed that the proposed system successfully (93.90%) classified scatter plot images to help visually impaired users understand the information given in the graph.
Scatter plots Image classification Deep learning Machine learning
Dağılım grafiği, iyi bilinen grafiklerden biridir ve makaleler, kitaplar, raporlar gibi birçok farklı türdeki dokümanlarda sıklıkla kullanılmaktadır. Ancak, dağılım grafikleri genellikle görüntü biçiminde olduğu için grafiklerde verilen bilgiler görme engelli kişiler tarafından fark edilemez, yani esasen makine tarafından okunabilir değillerdir. Bu sorunu çözmek için, bu makale, derin öğrenme ve görüntü işleme tekniklerini kullanarak, dağılım grafiği görüntülerinden görsel özellikleri çıkartabilen bir sistem önermektedir. Dağılım grafiklerini iki açıdan otomatik olarak sınıflandıran ilk çalışmadır: korelasyon derecesi (güçlü veya zayıf) ve korelasyon türleri (pozitif, negatif veya nötr). Deneysel çalışmalarda, Artık Ağlar (ResNet), Alex Ağları (AlexNet) ve Görsel Geometri Grubu (VGG) Ağları gibi alternatif evrişimsel sinir ağı (CNN) mimarileri hem sentetik hem de gerçek dünya veri setlerinde doğruluk açısından karşılaştırılmıştır. Deneysel sonuçlar, önerilen sistemin başarılı bir şekilde (%93,90) dağılım grafiği görüntülerini sınıflandırarak görme engelli kullanıcıların grafikte verilen bilgileri anlamalarına yardımcı olduğunu göstermiştir.
Dağılım grafikleri Görüntü sınıflandırma Derin öğrenme Makine öğrenmesi
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Araştırma Makalesi |
Yazarlar | |
Yayımlanma Tarihi | 16 Mayıs 2022 |
Yayımlandığı Sayı | Yıl 2022 |
Dokuz Eylül Üniversitesi, Mühendislik Fakültesi Dekanlığı Tınaztepe Yerleşkesi, Adatepe Mah. Doğuş Cad. No: 207-I / 35390 Buca-İZMİR.