Research Article

Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti

Volume: 12 Number: 4 September 29, 2021

Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti

Abstract

Konuşmada duygu tanıma İngilizce adıyla Speech emotion recognition (SER), duyguların konuşma sinyalleri aracılığıyla tanınması işlemidir. İnsanlar, iletişiminin doğal bir parçası olarak bu işlemi verimli bir şekilde yerine getirebilse de programlanabilir cihazlar kullanarak duygu tanıma işlemi hali hazırda devam eden bir çalışma alanıdır. Makinelerin de duyguları algılaması, onların insan gibi görünmesini ve davranmasını sağlayacağından dolayı, konuşmada duygu tanıma, insan-bilgisayar etkileşiminin gelişmesinde önemli bir rol oynar. Geçtiğimiz on yıl içerisinde çeşitli SER teknikleri geliştirilmiştir, ancak sorun henüz tam olarak çözülmemiştir. Bu makale, Evrişimsel Sinir Ağı (Convolutional neural networks -CNN) ve Uzun-Kısa Süreli Bellek (Long Short Term Memory-LSTM) olmak üzere iki derin öğrenme mimarisinin birleşimine dayanan bir konuşmada duygu tanıma tekniği önermektedir. CNN lokal öznitelik seçiminde etkinliğini gösterirken, LSTM büyük metinlerin sıralı işlenmesinde büyük başarı göstermiştir. Önerilen Evrişimsel LSTM (Convolutional LSTM – Co-LSTM) yaklaşımı, insan-makine iletişiminde etkili bir otomatik duygu algılama yöntemi oluşturmayı amaçlamaktadır. İlk olarak, Mel Frekansı Kepstrum Katsayıları (Mel Frequency Cepstral Coefficient- MFCC) kullanılarak önerilen yöntemde konuşma sinyalinden bir görüntüsel öznitelikler matrisi çıkarılır ve ardından bu matris bir boyuta indigenir. Sonrasında modelin eğitimi için öznitelik seçme ve sınıflandırma yöntemi olarak Co-LSTM kullanılır. Deneysel analizler, konuşmanın sekiz duygusunun tamamının RAVDESS (Ryerson Audio-Visual Database of Emotional Speech and Song) ve TESS (Toronto Emotional Speech Set) veri tabanlarından sınıflandırılması üzerine yapılmıştır. MFCC Spektrogram öznitelikleri kullanılarak Co-LSTM ile %86,7 doğruluk oranı elde edilmiştir. Elde edilen sonuçlar, önceki çalışmalar ve diğer iyi bilinen sınıflandırıcılarla karşılaştırıldığında önerilen algoritmanın etkinliğini ikna edici bir şekilde kanıtlamaktadır.

Keywords

References

  1. [1] “United Nations Educational, Scientific, and Cultural Organization. (2019). I’d blush if I could: closing gender divides in digital skills through education,” 2)., (Programme Document GEN/2019/EQUALS/1 REV. [Online]. Available: http://unesdoc.unesco.org/images/0021/002170/217073e.pdf.
  2. [2] K. Venkataramanan and H. R. Rajamohan, “Emotion Recognition from Speech,” SpringerBriefs Speech Technol., pp. 31–32, Dec. 2019.
  3. [3] L. B. Krithika and G. G. Lakshmi Priya, “Student Emotion Recognition System (SERS) for e-learning Improvement Based on Learner Concentration Metric,” Procedia Comput. Sci., vol. 85, pp. 767–776, Jan. 2016, doi: 10.1016/J.PROCS.2016.05.264.
  4. [4] A. E. Wells, L. M. Hunnikin, D. P. Ash, and S. H. M. van Goozen, “Improving emotion recognition is associated with subsequent mental health and well-being in children with severe behavioural problems,” Eur. Child Adolesc. Psychiatry 2020, vol. 1, pp. 1–9, Sep. 2020, doi: 10.1007/S00787-020-01652-Y.
  5. [5] J. R. I. Coleman, K. J. Lester, R. Keers, M. R. Munafò, G. Breen, and T. C. Eley, “Genome-wide association study of facial emotion recognition in children and association with polygenic risk for mental health disorders,” Am. J. Med. Genet. Part B Neuropsychiatr. Genet., vol. 174, no. 7, pp. 701–711, Oct. 2017, doi: 10.1002/AJMG.B.32558.
  6. [6] M. Bebawy, S. Anwar, and M. Milanova, “Active Shape Model vs. Deep Learning for Facial Emotion Recognition in Security,” Lect. Notes Comput. Sci. (including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), vol. 10183 LNAI, pp. 1–11, 2016, doi: 10.1007/978-3-319-59259-6_1.
  7. [7] H. Aouani and Y. Ben Ayed, “Speech Emotion Recognition with deep learning,” Procedia Comput. Sci., vol. 176, pp. 251–260, Jan. 2020, doi: 10.1016/J.PROCS.2020.08.027.
  8. [8] B. Kratzwald, S. Ilić, M. Kraus, S. Feuerriegel, and H. Prendinger, “Deep learning for affective computing: Text-based emotion recognition in decision support,” Decis. Support Syst., vol. 115, pp. 24–35, Nov. 2018, doi: 10.1016/J.DSS.2018.09.002.

Details

Primary Language

Turkish

Subjects

-

Journal Section

Research Article

Publication Date

September 29, 2021

Submission Date

July 5, 2021

Acceptance Date

September 18, 2021

Published in Issue

Year 2021 Volume: 12 Number: 4

APA
Öztürk, Ö. F., & Pashaei, E. (2021). Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, 12(4), 581-589. https://doi.org/10.24012/dumf.1001914
AMA
1.Öztürk ÖF, Pashaei E. Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti. DUJE. 2021;12(4):581-589. doi:10.24012/dumf.1001914
Chicago
Öztürk, Ömer Faruk, and Elham Pashaei. 2021. “Konuşmalardaki Duygunun Evrişimsel LSTM Modeli Ile Tespiti”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12 (4): 581-89. https://doi.org/10.24012/dumf.1001914.
EndNote
Öztürk ÖF, Pashaei E (September 1, 2021) Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12 4 581–589.
IEEE
[1]Ö. F. Öztürk and E. Pashaei, “Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti”, DUJE, vol. 12, no. 4, pp. 581–589, Sept. 2021, doi: 10.24012/dumf.1001914.
ISNAD
Öztürk, Ömer Faruk - Pashaei, Elham. “Konuşmalardaki Duygunun Evrişimsel LSTM Modeli Ile Tespiti”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi 12/4 (September 1, 2021): 581-589. https://doi.org/10.24012/dumf.1001914.
JAMA
1.Öztürk ÖF, Pashaei E. Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti. DUJE. 2021;12:581–589.
MLA
Öztürk, Ömer Faruk, and Elham Pashaei. “Konuşmalardaki Duygunun Evrişimsel LSTM Modeli Ile Tespiti”. Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi, vol. 12, no. 4, Sept. 2021, pp. 581-9, doi:10.24012/dumf.1001914.
Vancouver
1.Ömer Faruk Öztürk, Elham Pashaei. Konuşmalardaki duygunun evrişimsel LSTM modeli ile tespiti. DUJE. 2021 Sep. 1;12(4):581-9. doi:10.24012/dumf.1001914

Cited By