This study investigates the effects of audio processing and filtering strategies to enhance the performance of speech recognition systems in noisy environments. The focus is on the Short-Time Fourier Transform (STFT) operations applied to noisy audio files and noise reduction procedures. While STFT operations form the basis for detecting noise and analyzing the speech signal in the frequency domain, noise reduction steps involve threshold-based masking and convolution operations. The results obtained demonstrate a significant improvement in speech recognition accuracy in noisy environments through audio processing and filtering strategies. A detailed analysis of the graphs provides guidance for evaluating the effectiveness of noise reduction procedures and serves as a roadmap for future research. This study emphasizes the critical importance of audio processing and filtering strategies in improving the performance of speech recognition systems in noisy environments, laying a foundation for future studies.
Audio processing Speech recognition Short-Time Fourier Transform (STFT) Noise reduction CNN
Bu çalışma, gürültülü ortamlarda konuşma tanıma sistemlerinin performansını artırmak için ses işleme ve filtreleme stratejilerinin etkilerini araştırmaktadır. Odak noktası, gürültülü ses dosyalarına uygulanan Kısa Süreli Fourier Dönüşümü (STFT) işlemleri ve gürültü azaltma prosedürleridir. STFT işlemleri, gürültüyü tespit etme ve konuşma sinyalini frekans alanında analiz etme temelini oluştururken, gürültü azaltma adımları eşik tabanlı maskeleme ve konvolüsyon işlemlerini içermektedir. Elde edilen sonuçlar, gürültülü ortamlarda ses tanıma doğruluğunda önemli bir iyileşme sağladığını göstermektedir. Grafiklerin detaylı analizi, gürültü azaltma prosedürlerinin etkinliğini değerlendirmek için rehberlik sağlar ve gelecek araştırmalar için bir yol haritası görevi görür. Bu çalışma, gürültülü ortamlarda konuşma tanıma sistemlerinin performansını artırmada ses işleme ve filtreleme derin öğrenme ve CNN stratejilerinin kritik önemini vurgulayarak, gelecek çalışmalar için bir temel oluşturur.
Ses işleme Konuşma tanıma Kısa Süreli Fourier Dönüşümü (STFT) Gürültü azaltma CNN
Birincil Dil | İngilizce |
---|---|
Konular | Derin Öğrenme, Makine Öğrenme (Diğer) |
Bölüm | Araştırma Makaleleri (RESEARCH ARTICLES) |
Yazarlar | |
Erken Görünüm Tarihi | 15 Ocak 2025 |
Yayımlanma Tarihi | 17 Ocak 2025 |
Gönderilme Tarihi | 22 Mart 2024 |
Kabul Tarihi | 29 Ağustos 2024 |
Yayımlandığı Sayı | Yıl 2025 Cilt: 8 Sayı: 1 |
* Uluslararası Hakemli Dergi (International Peer Reviewed Journal)
* Yazar/yazarlardan hiçbir şekilde MAKALE BASIM ÜCRETİ vb. şeyler istenmemektedir (Free submission and publication).
* Yılda Ocak, Mart, Haziran, Eylül ve Aralık'ta olmak üzere 5 sayı yayınlanmaktadır (Published 5 times a year)
* Dergide, Türkçe ve İngilizce makaleler basılmaktadır.
*Dergi açık erişimli bir dergidir.
Bu web sitesi Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.