In our age, we are bombarded with multimedia content daily. Although, face-to-face communication always outgrows the potential factors of healthy assessment of our peers through recorded content or live media interaction, (be it text, video, images, speech) new approaches to render us able to understand and discern between emotions of our peers on multimedia content are getting more and more popular and more complex. Two robust topics in this regard are generally named as sentiment analysis and emotion detection. The advent and exponential growth of social networks and for instance, the employment of speech bots have made it a necessity to particularly address the problem of healthy emotion recognition outside face-to-face, everyday conversations or interactions. Machines’ capability to perform the set of tasks through Machine Learning approaches, namely consisting of detecting, expressing and understanding emotions is collectively known as, as in humans, emotional intelligence. Different modes of input as human behaviour like those taken from audio, image, video sources and signal interpretations processed through Electro-encephalography (EEG), related brain wave measurements are used in emotion recognition. My study aim is intended to be the examination and review of recent study approaches in Emotion Detection in Speech, possibly establishing links or differences between recent study publishes because each study paper focuses on a single or set of Machine Learning approaches which are employed in Emotion Detection in Speech. This paper tries to examine various relevant researches involving methods of Machine Learning which were studied and tested under these researches respective to Speech Emotion Recognition (SER). Effectiveness of the involved methods and databases are discussed while commenting on the studies and expressed in the form of their findings. Improvements throughout these studies are, though not chronologically, compared using simple tables which show independent accuracies of several Machine Learning classifier combinations.
speech emotion recognition emotion detection in speech machine learning classifier machine learning approaches
Çağımızda her gün multimedya içerik bombardımanına tutuluyoruz. Yüz yüze iletişim; kayıtlı içerik veya canlı medya etkileşimi (metin, video, görüntü, konuşma) yoluyla akranlarımızın sağlıklı değerlendirilmesinin potansiyel faktörlerini her zaman aşsa da, duyguları anlamamızı ve ayırt etmemizi sağlayan yeni yaklaşımlar multimedya içeriği konusunda giderek daha popüler ve daha karmaşık hale geliyor. Bu konu dahilinde iki güçlü başlık genel olarak duygu analizi ve duygu tespiti olarak adlandırılmaktadır. Sosyal ağların gelişi ve katlanarak büyümesi ve örneğin konuşma botlarının kullanılması, özellikle yüz yüze, günlük konuşmalar veya etkileşimler dışında sağlıklı duygu tanıma sorununun ele alınmasını bir gereklilik haline getirdi. Makinelerin, duyguları algılama, ifade etme ve anlamadan oluşan, Makine Öğrenmesi yaklaşımları aracılığıyla bir dizi görevi yerine getirme yeteneği, insanlarda olduğu gibi topluca duygusal zeka olarak bilinir. Duygu tanımada ses, görüntü, video kaynakları ve Elektro-ensefalografi (EEG) ile işlenen sinyal yorumlarından alınan insan davranışının farklı girdi modları, ilgili beyin dalgası ölçümleri kullanılmaktadır. Çalışma amacım, Konuşmada Duygu Algılama alanındaki son çalışma yaklaşımlarının incelenmesi ve gözden geçirilmesi, muhtemelen son çalışma yayınları arasında bağlantılar veya farklılıklar kurulmasıdır çünkü her çalışma makalesi Konuşmada Duygu Algılamada kullanılan tek bir veya bir dizi Makine Öğrenimi yaklaşımına odaklanır. Bu makale, Konuşma Duygusu Tanıma (SER) ile ilgili bu çalışmalar kapsamında incelenen ve test edilen Makine Öğrenmesi yöntemlerini içeren çeşitli ilgili araştırmaları gözden geçirmektedir. Çalışmalar hakkında yorum yapılırken ilgili yöntemlerin ve veri tabanlarının etkinliği tartışılmaktadır ve bulguları ifade edilmektedir. Bu çalışmalar boyunca yapılan iyileştirmeler, kronolojik olarak olmasa da, çeşitli Makine Öğrenmesi sınıflandırıcı kombinasyonlarının bağımsız doğruluklarını gösteren basit tablolar kullanılarak karşılaştırılmıştır.
speech emotion recognition emotion detection in speech machine learning classifier machine learning approaches
Ankara Bilim Üniversitesi
Prof. Dr. Nergiz Çağıltay'a çalışmama motivasyon katkısı sağladığı için teşekkür ederim.
Primary Language | English |
---|---|
Subjects | Artificial Intelligence |
Journal Section | Research Article |
Authors | |
Publication Date | December 31, 2023 |
Published in Issue | Year 2023 Volume: 03 Issue: 02 |
The journal "Researcher: Social Sciences Studies" (RSSS), which started its publication life in 2013, continues its activities under the name of "Researcher" as of August 2020, under Ankara Bilim University.
It is an internationally indexed, nationally refereed, scientific and electronic journal that publishes original research articles aiming to contribute to the fields of Engineering and Science in 2021 and beyond.
The journal is published twice a year, except for special issues.
Candidate articles submitted for publication in the journal can be written in Turkish and English. Articles submitted to the journal must not have been previously published in another journal or sent to another journal for publication.