Araştırma Makalesi

Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması

Cilt: 4 Sayı: 2 31 Aralık 2025
PDF İndir
TR EN

Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması

Öz

Giriş ve Hedefler Endüstriyel görüntü analizinde kusur tespiti ve sınıflandırma görevleri için derin öğrenme modellerinin performanslarının karşılaştırılması önem taşımaktadır. Bu çalışmada, Google/ViT-Base-Patch16-224-in21k (Vision Transformer) ve Microsoft/Swin-Tiny-Patch4-Window7-224 (Swin Transformer) modellerinin ahşap yüzey kusurlarındaki başarımları incelenmiştir. Yöntemler MVTec Ahşap Veri Seti kullanılarak her iki modelin performansı değerlendirilmiş, eğitim ve test aşamalarında standart görüntü işleme protokolleri uygulanmıştır. Bulgular Google/ViT modeli %9 doğruluk değeri ile en yüksek performansı gösterirken, Microsoft/Swin modeli %95 doğruluk sağlamaktadır. Her iki model de özellikle çatlak ve düğüm kusurlarında %90'ın üzerinde başarı elde etmiştir. Sonuçlar Çalışma, Vision Transformer tabanlı modellerin endüstriyel kusur tespitinde etkin olduğunu kanıtlamıştır. Performansın daha da artırılması için veri çeşitliliğinin artırılması ve hibrit model yaklaşımları önerilmektedir.

Anahtar Kelimeler

Kaynakça

  1. R. Norlander, J. Grahn, A. Maki. “Wooden knot detection using convnet transfer learning”. Image Analysis: 19th Scandinavian Conference, SCIA 2015, Proceedings, Springer International Publishing, 263–274, 2015. DOI: 10.1007/978-3-319-19665-7_22
  2. W. Pölzleitner, G. Schwingshakl. “Real-time surface grading of profiled wooden boards”. Industrial Metrology, 2(3–4), 283–298, 1992. DOI: 10.1016/0921-5956(92)80008-H
  3. Z. F. Qiu. “A simple machine vision system for improving the edging and trimming operations performed in hardwood sawmills”. Ph.D. Dissertation, Virginia Tech, 1996.
  4. D. L. Schmoldt, P. Li, A. L. Abbott. “Machine vision using artificial neural networks with local 3D neighbourhoods”. Computers and Electronics in Agriculture, 16 (3), 255–271, 1997. DOI: 10.1016/S0168-1699(97)00002-1
  5. D. Qi,, P. Zhang, X. Jin, X. Zhang. “Study on wood image edge detection based on Hopfield neural network”. 2010 IEEE International Conference on Information and Automation, 1942–1946, 2010. DOI: 10.1109/ICINFA.2010.5512014
  6. X. Ji, H. Guo, M. Hu. “Features extraction and classification of wood defect based on HU invariant moment and wavelet moment and BP neural network”. Proceedings of the 12th International Symposium on Visual Information Communication and Interaction, 1–5, 2019. DOI: 10.1145/3356422.3356459
  7. H. Mu, M. Zhang, D. Qi, S. Guan, H. Ni. “Wood defects recognition based on fuzzy BP neural network”. International Journal of Smart Home, 9, 143–152, 2015. DOI: 10.14257/ijsh.2015.9.5.14
  8. J. C. Hermanson, A. C. Wiedenhoeft. “A brief review of machine vision in the context of automated wood identification systems”. IAWA Journal, 32(2), 233–250, 2011. DOI: 10.1163/22941932-90000054

Ayrıntılar

Birincil Dil

Türkçe

Konular

Derin Öğrenme, Yapay Görme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

29 Aralık 2025

Yayımlanma Tarihi

31 Aralık 2025

Gönderilme Tarihi

16 Ekim 2025

Kabul Tarihi

17 Kasım 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 4 Sayı: 2

Kaynak Göster

APA
Kılıç, K. (2025). Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması. Bozok Journal of Engineering and Architecture, 4(2), 1-12. https://doi.org/10.70700/bjea.1805120
AMA
1.Kılıç K. Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması. BJEA. 2025;4(2):1-12. doi:10.70700/bjea.1805120
Chicago
Kılıç, Kenan. 2025. “Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması”. Bozok Journal of Engineering and Architecture 4 (2): 1-12. https://doi.org/10.70700/bjea.1805120.
EndNote
Kılıç K (01 Aralık 2025) Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması. Bozok Journal of Engineering and Architecture 4 2 1–12.
IEEE
[1]K. Kılıç, “Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması”, BJEA, c. 4, sy 2, ss. 1–12, Ara. 2025, doi: 10.70700/bjea.1805120.
ISNAD
Kılıç, Kenan. “Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması”. Bozok Journal of Engineering and Architecture 4/2 (01 Aralık 2025): 1-12. https://doi.org/10.70700/bjea.1805120.
JAMA
1.Kılıç K. Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması. BJEA. 2025;4:1–12.
MLA
Kılıç, Kenan. “Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması”. Bozok Journal of Engineering and Architecture, c. 4, sy 2, Aralık 2025, ss. 1-12, doi:10.70700/bjea.1805120.
Vancouver
1.Kenan Kılıç. Vision Transformer (ViT) ile MVTec Ahşap Verisinde Kusurlu ve Kusursuz Görüntülerin Sınıflandırılması. BJEA. 01 Aralık 2025;4(2):1-12. doi:10.70700/bjea.1805120