Video Görüntülerinde Şiddet İçeren Aktivitelerin Lstm Ağı İle Tespiti
Öz
Bilgisayarlı
görü alanında hareket tanıma gerek RGB videolar, gerekse derinlik haritaları
üzerinde fazlasıyla çalışılmış bir konu olmakla beraber; şiddet içeren
hareketlerin tespiti göreli olarak az çalışılmış bir alandır. Gelişmekte olan
teknoloji ve internet ağı sayesinde, büyük miktarlarda video verisine kolayca
erişilebilmektedir. Bu sayede, birçok şiddet içerikli video da kolayca
erişilebilir hale gelmiştir. Şiddet içeren sahnelere sahip videoların
etiketlenmesi, güvenlik ve içerik tabanlı video arama sistemleri için
önemlidir. Güvenlik kamera sistemleri genellikle şiddeti ve uygunsuz
hareketleri tespit etmek için elverişsizdir. Büyük ölçekli bir güvenlik kamera
sistemi için, bir operatörün tüm kameraları aynı anda izlemesi imkânsızdır. Öte
yandan, video akışı sitelerine yüklenen videoları kontrol edebilen otomatik
video değerlendirme ve etiketleme sistemleri için de giderek artan bir ihtiyaç
bulunmaktadır. Bu nedenlerden ötürü şiddet tespiti daha da önem kazanan bir
konu haline gelişmiştir. Bu çalışmada video görüntüleri üzerinde Transfer Öğrenme ve Long Short Term Memory (LSTM)
ağı tabanlı bir yöntem önerilmiştir. Doğrudan RGB görüntülerinden, optik akış
degerlerinin ve RGB çerçeve serilerinin
türevi hesaplanarak elde edilen hız görüntülerinden GoogleNet kullanılarak derin öznitelikler elde
edilmiştir. Elde edilen derin öznitelik serileri LSTM ağına girdi olarak
verilmiştir. Önerilen yöntem literatürde
bu tarz çalışmaların test edilmesinde yaygın olarak kullanılan Hockey Fight ve
Violent Flow veri kümeleri ile test edilmiştir. Deney sonuçları literatürdeki
çalışmalarla karşılaştırılabilir düzeydedir.
Anahtar Kelimeler
Kaynakça
- [1]Nam, J., Alghoniemy, M., Tewfik, A.H., 1998. Audio-visual content-based violent scene characterization, Image Processing, 1998. ICIP 98. Proceedings. 1998 International Conference on. IEEE, pp. 353-357.
- [2] Clarin, C., Dionisio, J., Echavez, M., Naval, P., 2005. DOVE: Detection of movie violence using motion intensity analysis on skin and blood. PCSC 6, 150-156.
- [3] Gong, Y., Wang, W., Jiang, S., Huang, Q., Gao, W., 2008. Detecting violent scenes in movies by auditory and visual cues, Pacific-Rim Conference on Multimedia. Springer, pp. 317-326.
- [4] Kooij, J.F., Liem, M., Krijnders, J.D., Andringa, T.C., Gavrila, D.M., 2016. Multi-modal human aggression detection. Computer Vision and Image Understanding 144, 106-120.
- [5] Lin, J., Wang, W., 2009. Weakly-supervised violence detection in movies with audio and video based co-training, Pacific-Rim Conference on Multimedia. Springer, pp. 930-935.
- [6] Hassner, T., Itcher, Y., Kliper-Gross, O., 2012. Violent flows: Real-time detection of violent crowd behavior, Computer Vision and Pattern Recognition Workshops (CVPRW), 2012 IEEE Computer Society Conference on. IEEE, pp. 1-6.
- [7] Lloyd, K., Marshall, D., Moore, S.C., Rosin, P.L., 2016. Detecting Violent Crowds using Temporal Analysis of GLCM Texture. arXiv preprint arXiv:1605.05106.
- [8] Boiman, O., Irani, M., 2007. Detecting irregularities in images and in video. Int J Comput Vision 74, 17-31.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
20 Eylül 2019
Gönderilme Tarihi
29 Ağustos 2018
Kabul Tarihi
17 Haziran 2019
Yayımlandığı Sayı
Yıl 2019 Cilt: 21 Sayı: 63