Araştırma Makalesi

Duygu tanımada akustik verilerle derin öğrenme modellerinin karşılaştırılması: LSTM ve DenseNet üzerine bir inceleme

Cilt: 16 Sayı: 1 26 Mart 2025
PDF İndir

Duygu tanımada akustik verilerle derin öğrenme modellerinin karşılaştırılması: LSTM ve DenseNet üzerine bir inceleme

Öz

Ses tanıma teknolojileri, insan-makine etkileşiminde önemli bir rol oynamakta olup, özellikle duygu tanıma sistemleri bu alandaki en kritik uygulamalardan biridir. İnsan davranışlarının daha iyi analiz edilmesi ve çeşitli alanlarda daha duyarlı sistemlerin geliştirilmesi amacıyla kullanılmaktadır. Bu çalışma, sesli duygu tanıma alanında iki farklı derin öğrenme modeli olan Uzun Kısa Süreli Bellek (LSTM) ve Dense modellerini karşılaştırmayı amaçlamaktadır. Ses verileri üzerinde daha etkili duygu tanıma performansı elde edebilmek için farklı derin öğrenme yöntemlerinin nasıl sonuçlar verdiği incelenmiştir. Çalışmada, Emotion Speech Dataset (ESD) kullanılmış ve her iki modelin genel doğruluk oranları karşılaştırılmıştır. Araştırma sonuçları F1-Score kriterine göre, LSTM modelinin %92 genel doğruluk oranına ulaştığı, DenseNet modelinin ise %88 genel doğruluk oranı sağladığı gözlemlenmiştir. Bu bulgular, zamansal verilerle çalışmada başarılı olan LSTM modelinin, duygu tanıma açısından daha üstün performans sergilediğini göstermektedir.

Anahtar Kelimeler

Kaynakça

  1. [1] Feinberg, TE, Rifkin A, Schaffer C, Walker E. “Facial discrimination and emotional recognition in schizophrenia and affective disorders”. Archives of general psychiatry, 43(3), 276-279, 1986.
  2. [2] Kamble K, Sengupta J. “A comprehensive survey on emotion recognition based on electroencephalograph (EEG) signals”. Multimedia Tools and Applications, 82(18), 27269-27304, 2023.
  3. [3] Cevik F, Kilimci ZH. “Derin öğrenme yöntemleri ve kelime yerleştirme modelleri kullanılarak Parkinson hastalığının duygu analiziyle değerlendirilmesi”. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 27(2), 151-161,2020.
  4. [4] Zhao J, Mao X, Chen L. “Speech emotion recognition using deep 1D & 2D CNN LSTM networks”. Biomedical signal processing and control, 47, 312-323, 2019.
  5. [5] Saxena A, Khanna A, Gupta D. “Emotion recognition and detection methods: A comprehensive survey”. Journal of Artificial Intelligence and Systems, 2(1), 53-79, 2020.
  6. [6] Durahim AO, Setirek,ÇA, Özel BB, Kebapçı H. “Türkçe şarkılar için şarkı sözleri üzerinden müzik duygu sınıflandırması”. Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi, 24(2), 292-301,2018.
  7. [7] Nonis F, Dagnes N, Marcolin F, Vezzetti E. “3D approaches and challenges in facial expression recognition algorithms-a literature review”. Applied Sciences, 9(18), 3904, 2019.
  8. [8] Vasdev D, Gupta V, Shubham S, Chaudhary A, Jain N, Salimi M, Ahmadian A.” Periapical dental X-ray image classification using deep neural networks”. Annals of Operations Research, 2022.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Ses İşleme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

26 Mart 2025

Yayımlanma Tarihi

26 Mart 2025

Gönderilme Tarihi

31 Ekim 2024

Kabul Tarihi

2 Şubat 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 16 Sayı: 1

Kaynak Göster

IEEE
[1]B. İşler ve F. R. Kiliç, “Duygu tanımada akustik verilerle derin öğrenme modellerinin karşılaştırılması: LSTM ve DenseNet üzerine bir inceleme”, DÜMF MD, c. 16, sy 1, ss. 59–67, Mar. 2025, doi: 10.24012/dumf.1576811.
DUJE tarafından yayınlanan tüm makaleler, Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır. Bu, orijinal eser ve kaynağın uygun şekilde belirtilmesi koşuluyla, herkesin eseri kopyalamasına, yeniden dağıtmasına, yeniden düzenlemesine, iletmesine ve uyarlamasına izin verir. 24456