In this study, a novel integration of PushPull-Convolutional Layers into the YOLOv11 object detection model is proposed to enhance robustness against diverse image corruptions. The PushPull-Conv layer is designed based on biological mechanisms of the primary visual cortex, where complementary push and pull kernels are utilized to improve selectivity by amplifying relevant stimuli and suppressing irrelevant noise. The initial convolutional layer of YOLOv11 is replaced by this modification, and performance is evaluated on the COCO dataset across 15 corruption types (e.g., noise, blur, weather, digital artifacts) with five severity levels. Improved robustness metrics are achieved by the PushPull-enhanced YOLOv11 compared to the baseline. Detection performance under challenging conditions, including brightness variation, motion blur, and contrast changes, is enhanced. A link is established between biologically inspired design and deep learning, positioning PushPull-YOLO as a promising solution for real-time object detection in dynamic environments, with potential extensions to segmentation and keypoint detection.
Bu çalışmada, YOLOv11 nesne tespit modeline PushPull Konvolüsyon Katmanlarının özgün bir entegrasyonu önerilerek görüntü bozulmalarına karşı dayanıklılığın artırılması amaçlanmıştır. PushPull-Conv katmanı, birincil görsel korteksin biyolojik mekanizmalarından esinlenerek tasarlanmış ve tamamlayıcı push ve pull çekirdekleri kullanılarak ilgili uyaranların güçlendirilmesi ve ilgisiz gürültünün bastırılması yoluyla seçiciliğin artırılması sağlanmıştır. YOLOv11’in ilk konvolüsyon katmanı bu değişiklik ile değiştirilmiş ve performans, COCO veri kümesi üzerinde 15 farklı bozulma türü (ör. gürültü, bulanıklık, hava koşulları ve dijital bozulmalar) ve beş şiddet düzeyinde değerlendirilmiştir. PushPull ile güçlendirilmiş YOLOv11’in, temel modele kıyasla üstün dayanıklılık metrikleri elde ettiği gösterilmiştir. Parlaklık değişimi, hareket bulanıklığı ve kontrast farklılıkları gibi zorlu koşullar altında tespit performansı iyileştirilmiştir. Biyolojik esinli tasarım ile derin öğrenme arasında bir bağlantı kurulmuş ve PushPull-YOLO’nun dinamik ortamlarda gerçek zamanlı nesne tespiti için umut verici bir çözüm sunduğu ortaya konulmuştur. Ayrıca yöntemin gelecekte segmentasyon ve anahtar nokta tespiti gibi diğer bilgisayarla görme görevlerine de uygulanabileceği düşünülmektedir.
Primary Language | English |
---|---|
Subjects | Deep Learning |
Journal Section | Research Articles |
Authors | |
Early Pub Date | July 7, 2025 |
Publication Date | July 15, 2025 |
Submission Date | March 21, 2025 |
Acceptance Date | June 24, 2025 |
Published in Issue | Year 2025 Volume: 14 Issue: 3 |