This study investigates the effects of audio processing and filtering strategies to enhance the performance of speech recognition systems in noisy environments. The focus is on the Short-Time Fourier Transform (STFT) operations applied to noisy audio files and noise reduction procedures. While STFT operations form the basis for detecting noise and analyzing the speech signal in the frequency domain, noise reduction steps involve threshold-based masking and convolution operations. The results obtained demonstrate a significant improvement in speech recognition accuracy in noisy environments through audio processing and filtering strategies. A detailed analysis of the graphs provides guidance for evaluating the effectiveness of noise reduction procedures and serves as a roadmap for future research. This study emphasizes the critical importance of audio processing and filtering strategies in improving the performance of speech recognition systems in noisy environments, laying a foundation for future studies.
Audio processing Speech recognition Short-Time Fourier Transform (STFT) Noise reduction CNN
Bu çalışma, gürültülü ortamlarda konuşma tanıma sistemlerinin performansını artırmak için ses işleme ve filtreleme stratejilerinin etkilerini araştırmaktadır. Odak noktası, gürültülü ses dosyalarına uygulanan Kısa Süreli Fourier Dönüşümü (STFT) işlemleri ve gürültü azaltma prosedürleridir. STFT işlemleri, gürültüyü tespit etme ve konuşma sinyalini frekans alanında analiz etme temelini oluştururken, gürültü azaltma adımları eşik tabanlı maskeleme ve konvolüsyon işlemlerini içermektedir. Elde edilen sonuçlar, gürültülü ortamlarda ses tanıma doğruluğunda önemli bir iyileşme sağladığını göstermektedir. Grafiklerin detaylı analizi, gürültü azaltma prosedürlerinin etkinliğini değerlendirmek için rehberlik sağlar ve gelecek araştırmalar için bir yol haritası görevi görür. Bu çalışma, gürültülü ortamlarda konuşma tanıma sistemlerinin performansını artırmada ses işleme ve filtreleme derin öğrenme ve CNN stratejilerinin kritik önemini vurgulayarak, gelecek çalışmalar için bir temel oluşturur.
Primary Language | English |
---|---|
Subjects | Deep Learning, Machine Learning (Other) |
Journal Section | RESEARCH ARTICLES |
Authors | |
Early Pub Date | January 15, 2025 |
Publication Date | January 17, 2025 |
Submission Date | March 22, 2024 |
Acceptance Date | August 29, 2024 |
Published in Issue | Year 2025 Volume: 8 Issue: 1 |
*This journal is an international refereed journal
*Our journal does not charge any article processing fees over publication process.
* This journal is online publishes 5 issues per year (January, March, June, September, December)
*This journal published in Turkish and English as open access.
* This work is licensed under a Creative Commons Attribution 4.0 International License.