Research Article

EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli

Volume: 16 Number: 3 August 31, 2025
TR EN

EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli

Abstract

Konuşma, insanlar arasındaki iletişimin en temel ve etkili yolu olarak değerlendirilmektedir. İnsanlar konuşma yolu ile duygu, düşünce ve bilgilerini paylaşmakta, ilişkilerini güçlendirmekte ve toplumsal bağlarını pekiştirmektedir. Konuşma sırasında karşıdaki kişinin duygu durumunun anlaşılması, empati kurarak daha etkili ve anlamlı bir iletişim sağlamak için önemlidir. Günümüzde telefon gibi araçlarla yapılan uzaktan konuşmalarda ifade edilen duygu tonlarının anlaşılması için konuşma duygu tanıma yöntemlerinden sıklıkla faydalanılmaktadır. Konuşma duygu tanıma müşteri hizmetleri, sağlık, eğitim, eğlence ve akıllı sistemler gibi birçok alanda kullanılmaktadır. Konuşma duygu tanımada sinyal işleme, istatistiksel analiz ve biyometrik teknikler gibi yöntemler kullanılırken, son zamanlarda derin öğrenme yöntemleri de yaygınlaşmıştır. Bu çalışmada konuşma duygu tanıma için evrişimsel sinir ağları kullanılarak U-Net tabanlı özgün derin öğrenme modeli önerilmiştir. Önerilen modelin hiper-parametre optimizasyonları için Bayesian optimizasyon yönteminden faydalanılmıştır. Önerilen model Türkçe, İngilizce, Arapça ve Bangla dillerinden dört farklı veri ile analiz edilmiştir. Önerilen model ile farklı veri setlerinde %56,55 ile %99,71 arasında doğruluk hesaplanmıştır.

Keywords

References

  1. Ahmad, J., Muhammad, K., Kwon, S., Baik, S. W., & Rho, S. (2016). Dempster-Shafer Fusion Based Gender Recognition for Speech Analysis Applications. 2016 International Conference on Platform Technology and Service (PlatCon), 1–4. https://doi.org/10.1109/PlatCon.2016.7456788
  2. Allen, J. B., & Rabiner, L. R. (1977). A unified approach to short-time Fourier analysis and synthesis. Proceedings of the IEEE, 65(11), 1558–1564. Proceedings of the IEEE. https://doi.org/10.1109/PROC.1977.10770
  3. Alsabhan, W. (2023). Human–Computer Interaction with a Real-Time Speech Emotion Recognition with Ensembling Techniques 1D Convolution Neural Network and Attention. Sensors, 23(3), Article 3. https://doi.org/10.3390/s23031386
  4. Altamimi, M., & Alayba, A. M. (2023). ANAD: Arabic news article dataset. Data in Brief, 50, 109460. https://doi.org/10.1016/j.dib.2023.109460
  5. Anvarjon, T., Mustaqeem, & Kwon, S. (2020). Deep-Net: A Lightweight CNN-Based Speech Emotion Recognition System Using Deep Frequency Features. Sensors, 20(18), Article 18. https://doi.org/10.3390/s20185212
  6. Aziz, S., Arif, N. H., Ahbab, S., Ahmed, S., Ahmed, T., & Kabir, Md. H. (2023). Improved Speech Emotion Recognition in Bengali Language using Deep Learning. 2023 26th International Conference on Computer and Information Technology (ICCIT), 1–6. https://doi.org/10.1109/ICCIT60459.2023.10441053
  7. Canpolat, S. F., Ormanoğlu, Z., & Zeyrek, D. (2020). Turkish Emotion Voice Database (TurEV-DB). In D. Beermann, L. Besacier, S. Sakti, & C. Soria (Eds.), Proceedings of the 1st Joint Workshop on Spoken Language Technologies for Under-resourced languages (SLTU) and Collaboration and Computing for Under-Resourced Languages (CCURL) (pp. 368–375). European Language Resources association. https://aclanthology.org/2020.sltu-1.52
  8. Das, R. K., Islam, N., Ahmed, Md. R., Islam, S., Shatabda, S., & Islam, A. K. M. M. (2022). BanglaSER: A speech emotion recognition dataset for the Bangla language. Data in Brief, 42, 108091. https://doi.org/10.1016/j.dib.2022.108091

Details

Primary Language

Turkish

Subjects

Speech Recognition

Journal Section

Research Article

Publication Date

August 31, 2025

Submission Date

February 3, 2025

Acceptance Date

June 2, 2025

Published in Issue

Year 2025 Volume: 16 Number: 3

APA
Görmez, Y. (2025). EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli. AJIT-E: Academic Journal of Information Technology, 16(3), 232-250. https://doi.org/10.5824/ajite.2025.03.003.x
AMA
1.Görmez Y. EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli. AJIT-e: Academic Journal of Information Technology. 2025;16(3):232-250. doi:10.5824/ajite.2025.03.003.x
Chicago
Görmez, Yasin. 2025. “EmotionUnet: Konuşma Duygu Tanıma Için U-Net Tabanlı Özgün Derin Öğrenme Modeli”. AJIT-E: Academic Journal of Information Technology 16 (3): 232-50. https://doi.org/10.5824/ajite.2025.03.003.x.
EndNote
Görmez Y (August 1, 2025) EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli. AJIT-e: Academic Journal of Information Technology 16 3 232–250.
IEEE
[1]Y. Görmez, “EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli”, AJIT-e: Academic Journal of Information Technology, vol. 16, no. 3, pp. 232–250, Aug. 2025, doi: 10.5824/ajite.2025.03.003.x.
ISNAD
Görmez, Yasin. “EmotionUnet: Konuşma Duygu Tanıma Için U-Net Tabanlı Özgün Derin Öğrenme Modeli”. AJIT-e: Academic Journal of Information Technology 16/3 (August 1, 2025): 232-250. https://doi.org/10.5824/ajite.2025.03.003.x.
JAMA
1.Görmez Y. EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli. AJIT-e: Academic Journal of Information Technology. 2025;16:232–250.
MLA
Görmez, Yasin. “EmotionUnet: Konuşma Duygu Tanıma Için U-Net Tabanlı Özgün Derin Öğrenme Modeli”. AJIT-E: Academic Journal of Information Technology, vol. 16, no. 3, Aug. 2025, pp. 232-50, doi:10.5824/ajite.2025.03.003.x.
Vancouver
1.Yasin Görmez. EmotionUnet: Konuşma Duygu Tanıma için U-Net Tabanlı Özgün Derin Öğrenme Modeli. AJIT-e: Academic Journal of Information Technology. 2025 Aug. 1;16(3):232-50. doi:10.5824/ajite.2025.03.003.x