Ses tanıma teknolojileri, insan-makine etkileşiminde önemli bir rol oynamakta olup, özellikle duygu tanıma sistemleri bu alandaki en kritik uygulamalardan biridir. İnsan davranışlarının daha iyi analiz edilmesi ve çeşitli alanlarda daha duyarlı sistemlerin geliştirilmesi amacıyla kullanılmaktadır. Bu çalışma, sesli duygu tanıma alanında iki farklı derin öğrenme modeli olan Uzun Kısa Süreli Bellek (LSTM) ve Dense modellerini karşılaştırmayı amaçlamaktadır. Ses verileri üzerinde daha etkili duygu tanıma performansı elde edebilmek için farklı derin öğrenme yöntemlerinin nasıl sonuçlar verdiği incelenmiştir. Çalışmada, Emotion Speech Dataset (ESD) kullanılmış ve her iki modelin genel doğruluk oranları karşılaştırılmıştır. Araştırma sonuçları F1-Score kriterine göre, LSTM modelinin %92 genel doğruluk oranına ulaştığı, DenseNet modelinin ise %88 genel doğruluk oranı sağladığı gözlemlenmiştir. Bu bulgular, zamansal verilerle çalışmada başarılı olan LSTM modelinin, duygu tanıma açısından daha üstün performans sergilediğini göstermektedir.
Primary Language | Turkish |
---|---|
Subjects | Audio Processing |
Journal Section | Articles |
Authors | |
Early Pub Date | March 26, 2025 |
Publication Date | |
Submission Date | October 31, 2024 |
Acceptance Date | February 2, 2025 |
Published in Issue | Year 2025 Volume: 16 Issue: 1 |