Bu makale, tehlikeli Ses Olayı Algılama (SED) ile ilgili araştırmanın sonuçlarını bildirmektedir. Araba kazalarını ve çığlıkları tespit etmek için Derin Sinir Ağlarını (DNN) kullandık. Güvenlik için sesli izleme uygulamalarının bu sesleri algılaması beklenir. Bu seslerin çevrim dışı (kayıtlı) veriler üzerinden tespiti konusunda birçok araştırma yapılmıştır ancak bu seslerin çevrim içi tespiti önemlidir. Araştırmamızın, kayıtlı veriler üzerinde tespit ve aynı veriler üzerinde çevrimiçi tespit yapıp sonuçları karşılaştırmamıza katkısı vardır. Çevrimiçi tespit sırasında, gözetim uygulamaları için tehlikeli SED uygulamak isteyen uygulayıcılara yardımcı olacak bazı önemli noktaları fark ettik. Testlerimiz, uzak hoparlör tanımada (DSR) karşılaşılan sorunların tehlikeli SED'de de görüldüğünü göstermektedir. SED ile ilgili mevcut araştırmalar, genellikle model geliştirme sırasında arka plan gürültüsünü hesaba katar. Çevrimiçi testlerimiz, yankılanmanın performansı önemli ölçüde düşürebileceğini gösteriyor. Çevrimiçi testlerin sonuçları olarak, gerçek dünya uygulamalarında kullanım için tehlikeli bir SED geliştirme modeli için bazı önerilerde bulunuyoruz.
This paper reports the results of the research on hazardous Sound Event Detection (SED). We used Deep Neural Networks (DNN) to detect car crashes and screams. These are the two of the hazardous sound events on which studies are done for detection. We have selected these sounds because detection of these sounds and early warning can save lives. The research made on hazardous sound events are generally on recorded data. In this paper we wanted to show that there is a difference between recorded data and online (playing) data. At the end if an audio surveillance algorithm would be used in real time, to test it with online data was also an important part of the development. In this research we have developed an online detection environment which consists of a database, automatic audio playing and receiving software, detection software and automatic evaluating software. Our tests show that the reverberation degrades performance significantly. Current research on SED usually only takes into account background noise which is inserted artificially during model development. The results we have found during these online tests are the same as the ones we encountered during far field speaker recognition.
Primary Language | English |
---|---|
Subjects | Artificial Intelligence |
Journal Section | Research Article |
Authors | |
Publication Date | July 31, 2022 |
Published in Issue | Year 2022 Volume: 02 Issue: 01 |
The journal "Researcher: Social Sciences Studies" (RSSS), which started its publication life in 2013, continues its activities under the name of "Researcher" as of August 2020, under Ankara Bilim University.
It is an internationally indexed, nationally refereed, scientific and electronic journal that publishes original research articles aiming to contribute to the fields of Engineering and Science in 2021 and beyond.
The journal is published twice a year, except for special issues.
Candidate articles submitted for publication in the journal can be written in Turkish and English. Articles submitted to the journal must not have been previously published in another journal or sent to another journal for publication.