Araştırma Makalesi

Duygusal Konuşma Tanımada Yapay Veri Kullanımı

Cilt: 27 Sayı: 81 29 Eylül 2025
PDF İndir
EN TR

Duygusal Konuşma Tanımada Yapay Veri Kullanımı

Öz

Bu çalışma, Türkçe konuşmalarda duygu tanıma performansını geliştirmek üzere veri artırma tekniklerinin rolünü incelemekte ve BUEMODB ile ITUDB veri kümelerini temel almaktadır. Konuşmaların sessiz bölümlerin kaldırılması ve ses sinyallerinin normalizasyonu ile gerçekleştirilen ön işleme aşamasının ardından, ses verileri mel spektrogramlara dönüştürülmüş, altı öznitelik seti çıkarılmış ve yedi farklı denetimli öğrenme algoritması kullanılarak temel sınıflandırma yapılmıştır. İlk deneyler sonucunda BUEMODB veri seti için %56,3, ITUDB veri seti için %65,2 F1 skoru elde edilmiştir. Sonraki deneylerde, veri artırma teknikleri kullanılarak eğitim verisi beş kat büyütülmüştür. Bu kapsamda Gürültü Ekleme ve Ses Tonu Değiştirme gibi ses dönüşümlerinin yanı sıra Yakınlaştırma ve Yükseklik Kaydırma gibi görüntü dönüşümleri uygulanmıştır. Ses bazlı tekniklerle veri artırıldığında sınıflandırma başarısı iyileşmiş, Hava Emilimi ve Zaman Ölçekleme kombinasyonu ile F1 skorları BUEMODB için %57,6’ya, ITUDB için %71,3’e çıkmıştır. Görüntü bazlı veri artırma teknikleri daha da yüksek performans göstererek BUEMODB için %60,0’lık, ITUDB için %73,2’lik F1 skorları sağlamıştır. Son olarak, en iyi sonuç veren ses ve görüntü dönüşümlerini birleştiren hibrit bir yaklaşım denenmiştir. Bu yöntemle BUEMODB için %59,7, ITUDB için %75,1 F1 skoruna ulaşılmış ve temel performansa göre yaklaşık %10’luk bir artış kaydedilmiştir. Bulgular, özellikle görüntü ve hibrit tabanlı veri artırma tekniklerinin dikkatlice seçilmesi halinde duygu tanıma doğruluğunun önemli ölçüde yükseltilebileceğini göstermiştir.

Anahtar Kelimeler

Kaynakça

  1. Malik, M., Malik, M.K., Mehmood, K. 2021. Automatic Speech Recognition: a Survey, Multimedia Tools Applications, Cilt 80, s. 9411–9457. DOI: 10.1007/s11042-020-10073-7
  2. Cai, Z., Yang, Y., Li, M. 2023. Cross-lingual Multi-speaker Speech Synthesis with Limited Bilingual Training Data, Computer Speech and Language, Cilt 77, s. 101427. DOI: 10.1016/j.csl.2022.101427
  3. Sharma, R., Govind, D., Mishra, J. 2024. Milestones in Speaker Recognition, Artificial Intelligence Review, Cilt 57, 58. DOI: 10.1007/s10462-023-10688-w
  4. Maiti, S., Ueda, Y., Watanabe, S., Zhang, C. 2022. EEND-SS: Joint End-to-End Neural Speaker Diarization and Speech Separation for Flexible Number of Speakers. IEEE Spoken Language Technology Workshop (SLT), s. 480-487. DOI: 10.1109/SLT54892.2023.10022924
  5. Mehrabian, A. 1968. Communication without Words, Psychology Today, Cilt 2, No. 4, s. 53-56.
  6. Plaza, M., Kazala, R., Koruba, Z., Kozlowski, M., Lucińska, M., Sitek, K., Spyrka, J. 2022. Emotion Recognition Method for Call/Contact Centre Systems, Applied Sciences, Cilt 12, No. 21, s. 10951. DOI: 10.3390/app12211095
  7. Bahreini, K., Nadolski, R., Westera, W. 2016. Towards Real-time Speech Emotion Recognition for Affective e-learning, Education and Information Technologies, Cilt 21, s. 1367–1386. DOI: 10.1007/s10639-015-9388-2
  8. Li, H.-C., Pan, T., Lee, M.-H., Chiu, H.-W. 2021. Make Patient Consultation Warmer: A Clinical Application for Speech Emotion Recognition, Applied Sciences, Cilt 11, s. 4782. DOI: 10.3390/app11114782

Ayrıntılar

Birincil Dil

Türkçe

Konular

Performans Değerlendirmesi, İletişim Mühendisliği (Diğer)

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

25 Eylül 2025

Yayımlanma Tarihi

29 Eylül 2025

Gönderilme Tarihi

24 Eylül 2024

Kabul Tarihi

16 Kasım 2024

Yayımlandığı Sayı

Yıl 2025 Cilt: 27 Sayı: 81

Kaynak Göster

APA
Avcı, U. (2025). Duygusal Konuşma Tanımada Yapay Veri Kullanımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, 27(81), 359-375. https://doi.org/10.21205/deufmd.2025278104
AMA
1.Avcı U. Duygusal Konuşma Tanımada Yapay Veri Kullanımı. DEUFMD. 2025;27(81):359-375. doi:10.21205/deufmd.2025278104
Chicago
Avcı, Umut. 2025. “Duygusal Konuşma Tanımada Yapay Veri Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 27 (81): 359-75. https://doi.org/10.21205/deufmd.2025278104.
EndNote
Avcı U (01 Eylül 2025) Duygusal Konuşma Tanımada Yapay Veri Kullanımı. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 27 81 359–375.
IEEE
[1]U. Avcı, “Duygusal Konuşma Tanımada Yapay Veri Kullanımı”, DEUFMD, c. 27, sy 81, ss. 359–375, Eyl. 2025, doi: 10.21205/deufmd.2025278104.
ISNAD
Avcı, Umut. “Duygusal Konuşma Tanımada Yapay Veri Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi 27/81 (01 Eylül 2025): 359-375. https://doi.org/10.21205/deufmd.2025278104.
JAMA
1.Avcı U. Duygusal Konuşma Tanımada Yapay Veri Kullanımı. DEUFMD. 2025;27:359–375.
MLA
Avcı, Umut. “Duygusal Konuşma Tanımada Yapay Veri Kullanımı”. Dokuz Eylül Üniversitesi Mühendislik Fakültesi Fen ve Mühendislik Dergisi, c. 27, sy 81, Eylül 2025, ss. 359-75, doi:10.21205/deufmd.2025278104.
Vancouver
1.Umut Avcı. Duygusal Konuşma Tanımada Yapay Veri Kullanımı. DEUFMD. 01 Eylül 2025;27(81):359-75. doi:10.21205/deufmd.2025278104

Bu dergi, Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı (CC BY-NC 4.0) altında lisanslanmıştır.

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJmaWxlIiwicGF0aCI6IjliNTAvMDBjMi8xZmIxLzY5MjZmZDIyOGE1NzgyLjA3MzU5MTk2LnBuZyIsImV4cCI6MTc2NDE2OTE1Nywibm9uY2UiOiJhZDRmNjNlNzdhOWYwOWQ4YTNjNGVmNGIxOTFlZWViNyJ9.4Dxgc9mc-p4Tyti8NTU5pxEfGUWeuJud1fPWxu2mUy8