Research Article

Video Duygu Analizi

Number: Ejosat Ek Özel Sayı (HORA) February 28, 2021
  • Emre Arığ *
  • Metin Turan
TR EN

Video Duygu Analizi

Öz

Bu çalışmada, videodaki görüntülerden tespit edilen insan yüzleri üzerinde CNN derin öğrenme modeli ile duygu analizi yapılmıştır. Bu analize ait sonuçlar saniye saniye kayıt edilerek bir duygu analizi grafiği çıkarılmıştır. Çalışma 3 ana safhadan oluşmaktadır. İlki CNN modeli için gerekli duygu yüklü görsellerin bulunup etiketlenmesi, ikincisi duygu analizi yapabilecek bir CNN derin öğrenme modelinin oluşturulması ve üçüncüsü de videolardan yüz görüntülerinin tespit edilmesidir. Eğitim veri seti oluşturmak amacıyla, seçilen 61 adet filmden binlerce yüz fotoğrafı analiz edilmiştir. Bunların arasında Bay Evet, Karabasan, Yaralı Yüz, Yedi Yaşam gibi farklı duyguların ağırlıklı olduğu filmler bulunmaktadır. İlk olarak 7 duygu türü için yüzler toplanmıştır. Bu duygular bıkkınlık, korku, mutluluk, sakinlik, şaşkınlık, sinirlilik ve üzgünlüktür. Yüz tespiti kısmında Haarcascade tekniği kullanılmıştır. Tespit edilen yüzlerin duygulara göre etiketlenmesinde, Amazon webservisi olan Face Recognition’dan yardım alınmıştır. Çalışmada, 50 bin civarı yüz örneklemi elde edilmiştir. Ancak daha sonra yapılan kontrollerde Haarcascade ile bulunmuş görüntüler arasında yüz olmayan birçok görsel tespit edilerek çıkarılmıştır. Ayrıca, Amazon web servisinden dönen duygu analizlerinde %40 civarında yanlış duygu tespiti olduğu belirlenerek, eğitim veri setinden çıkarılmıştır. Tüm veri seti temizleme çalışmaları sonucunda 7 duygu için etiketlenmiş 20 bin fotoğraf elde edilmiştir. Derin öğrenme sonucu, yapılan sınamalarda en çok karıştırılan 4 duygudan 2’sinin bıkkınlık ve şaşkınlık olduğu gözlemlenmiştir. Bıkkınlık sakinlikle, şaşkınlık ise korku yüz ifadeleri ile karışmaktadır. Elimizde kalan 5 duygu ile yapılan analizde, önerilen model ile %60’lık doğruluk değerine ulaşılmıştır. Videodan yüzleri çıkarıp modele gönderen ve bu sonuçlar ile bir duygu analizi grafiği çıkaran yazılımda, yüz tespitinin daha doğru olması için gerçek zamanlı analizde Haarcascade yöntemi yerine bir DNN modeli kullanılmıştır.

Anahtar Kelimeler

References

  1. OpenCV. 2017. http://www.opencv.org (Erişim Tarihi: 8.7.2017).
  2. D. C. Cirean, U. Meier, J. Masci, and L. M. Gambardella, Flexible, High Performance Convolutional Neural Networks for Image Classification, in Proceedings of the Twenty-Second international joint conference on Artificial Intelligence, pp. 1237–1242, 2012.
  3. P. Viola and M. Jones, “Rapid object detection using a boosted cascade of simple features,” Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on, vol: 1, pp.:I-511I518, 2001
  4. R. Hussin, M.R. Juhari, N.W. Kang, R.C. Ismail and A. Kamarudin, “Digital image processing techniques for object detection from complex background image”. Procedia Engineering, vol:41, pp:340-344, 2012
  5. Bradski G., Kaehler A. 2008. Learning OpenCV, O’Reilly Media Inc., USA .
  6. Tuncer Ergin, Convolutional Neural Network (ConvNet yada CNN) nedir, nasıl çalışır?, https://medium.com/@tuncerergin/convolutional-neural-network-convnet-yada-cnn-nedir-nasil-calisir-97a0f5d34cad
  7. Görüntü İşleme Teknikleri ile 3B Yüz Tanıma , Maltepe Üniversitesi Fen Bilimleri Enstitüsü, 2019
  8. Romero M., Pears N., “Landmark localisation in 3D face data”, 6th IEEE International Conference on Advanced Video and Signal Based Surveillance, AVSS 2009, s.73–78, 2009.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Research Article

Authors

Emre Arığ * This is me
0000-0003-3645-8761
Türkiye

Publication Date

February 28, 2021

Submission Date

June 30, 2020

Acceptance Date

February 28, 2021

Published in Issue

Year 2021 Number: Ejosat Ek Özel Sayı (HORA)

APA
Arığ, E., & Turan, M. (2021). Video Duygu Analizi. Avrupa Bilim Ve Teknoloji Dergisi, Ejosat Ek Özel Sayı (HORA), 34-41. https://doi.org/10.31590/ejosat.1115837