Bu makalede, literatürdeki bazı konuşma aktivite dedektörleri (VAD) değişen akustik gürültü koşullarına göre dayanıklılık performanslarını etkileyen faktörleri ölçmek amacıyla incelenmiş ve değişen gürültü koşullarına göre doğru tespit oranlarındaki değişimleri test edilerek ölçülmüştür. Bu kapsamda, VAD metotlarındaki karar aşamasında kullanılan eşik değerin sabit yada uyarlamalı olması, analiz penceresinin kısa yada uzun olması, birden fazla özellik vektörünün birlikte kullanımı gibi durumların sonuç performansa etkisi değerlendirilmiş ve karşılaştırmalı olarak analiz edilmiştir. Bu makalede incelenen dört farklı VAD dedektörünün üçü, karar sonucu üretirken kısa süreli analiz penceresi içerisindeki özellik vektörlerini kullanmakta iken, biri uzun vadeli spektral vektörlerin ölçüm sonucuna göre karar üretmektedir. Yine VAD detektörlerinin ikisi karar aşamasında sabit eşik kullanırken, diğer ikisi gürültüye göre uyarlamalı eşik kullanmaktadır. Analiz edilen VAD'lerin etkinliği, onları hem farklı akustik koşullar altında değerlendirmek ve hemde literatürde yer almış olan bir test verisi üzerinde test edebilmek için NOIZEUS corpus üzerinde test edilmiştir. Analiz edilen VAD'lerin testi sırasında, restoran, araba, sokak veya istasyon gibi [15-0dB] arasında çevresel arka plan gürültülerine sahip farklı türde giriş gürültülü konuşma sinyalleri test edilmiştir. Testler objektif test ölçüm metotları kullanılarak yapılmış ve herbir VAD metodunun tespit doğruluk oranı ölçülmüştür. Sonuçlar, herbir yöntemin, olumsuz çevresel koşullarda farklı dayanıklılık performansı verdiğini göstermiştir.
konuşma aktivite algılama konuşma analizi arkaplan gürültüsü uç nokta tespiti sinyal-gürültü oranı
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 21 Haziran 2022 |
Gönderilme Tarihi | 6 Aralık 2020 |
Kabul Tarihi | 12 Şubat 2022 |
Yayımlandığı Sayı | Yıl 2023 |