Otomatik yüz duygu tanıma, diğer adıyla yüz duygu tanıma (FER), bilgisayar görme ve yapay zeka alanlarında devam eden çalışmaların temel bir özelliğidir. FER'in temel amacı, mutluluk, üzüntü, öfke, korku, tiksinti, şaşkınlık ve tarafsızlık gibi duyguları tanımaktır. Bu inceleme makalesi, 11 popüler FER veri seti, yani CK+, FER-2013, JAFFE, SAVEE, AffectNet, KDEF, RAF-DB, RAVDESS, RFD, Oulu-Casia NIR & VIS ve SFEW 2.0 arasında kapsamlı bir karşılaştırma sunmaktadır. Karşılaştırma, veri kümesi boyutları, duygu sınıfları, veri türleri, katılımcıların yaş aralıkları ve duygu dağılımı gibi bir dizi ölçüt üzerinden gerçekleştirilmiştir. Çalışma, bu tür veri kümelerinde klasik yöntemlerin (ör. SVM, HOG) doğruluğunu, yeni derin öğrenme modellerinin (ör. CNN, LSTM) doğruluğuyla karşılaştırmaktadır. Laboratuvar ortamında mükemmel doğruluk elde edilmiştir (ör. CK+ üzerinde SCNN ile %99,68), ancak gerçek dünyada zorluklar devam etmektedir (ör. SFEW 2.0 üzerinde CNN ile %61,29). Çalışma, bunun temel zorluklarını, yani duyguların çarpıklığı, demografik önyargılar ve gerçek dünyadaki heterojenliği açıklamaktadır. Çalışma, mevcut veri kümelerinin ve yaklaşımların eksikliklerinden bahsetmekte ve veri kümelerinin çeşitliliğinin artırılması, çok modlu füzyon ve kültürel olarak uyarlanabilir model oluşturma açısından gelecekteki araştırma yönlerini önermektedir. Alan incelemesi, FER'in bilimsel temelini ve uygulama kapsamını güçlendirmekte ve araştırmacılar ve uygulayıcılar için kapsamlı bir kılavuz sunmaya çalışmaktadır.
AffectNet evrişimli sinir ağları (CNN) derin öğrenme duygu tanıma yüz duygu tanıma (FER) insan-bilgisayar etkileşimi JAFFE makine öğrenimi SFEW görsel veri kümeleri
Automatic face emotion recognition, which is otherwise referred to as facial emotion recognition (FER), is a basic feature of ongoing work in computer vision and AI. The principal aim of FER is the emotion recognition involving happiness, sadness, anger, fear, disgust, surprise and neutrality. This review paper presents a comprehensive comparison between 11 popular FER datasets, i.e., CK+, FER-2013, JAFFE, SAVEE, AffectNet, KDEF, RAF-DB, RAVDESS, RFD, Oulu-Casia NIR & VIS and SFEW 2.0. The comparison is conducted across a range of metrics including dataset sizes, emotion classes, data types, age ranges of participants, and emotion distribution. The study contrasts the accuracy of classical methods (e.g., SVM, HOG) against newer deep learning models (e.g., CNN, LSTM) on such datasets, with excellent lab accuracy (e.g., 99.68% with SCNN on CK+) and continued difficulty in the real world (e.g., 61.29% with CNN on SFEW 2.0). The study explains the key challenges thereof, i.e., the skewness of emotions, demographic biases and heterogeneity in the real world. The study mentions shortcomings of existing datasets and approaches, and suggests future research directions in terms of diversity addition of datasets, multimodal fusion, and culturally adaptive model building. Field review strengthens the scientific basis and scope of application of FER and attempts to provide a comprehensive guidebook for researchers and practitioners.
AffectNet convolutional neural networks (CNN) deep learning emotion recognition facial emotion recognition (FER) human–computer interaction JAFFE machine learning SFEW visual datasets
| Birincil Dil | İngilizce |
|---|---|
| Konular | Veri Mühendisliği ve Veri Bilimi |
| Bölüm | Derleme |
| Yazarlar | |
| Gönderilme Tarihi | 23 Eylül 2025 |
| Kabul Tarihi | 17 Ekim 2025 |
| Erken Görünüm Tarihi | 16 Aralık 2025 |
| Yayımlanma Tarihi | 30 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 3 Sayı: 2 |