TR
EN
ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI
Abstract
Çevresel faaliyetlerin sonuçlarını tahmin edebilecek ve aynı zamanda bu faaliyetlerin ortamı hakkında bilgi edinile bilinmesi için ses verisinin kullanılması çok önemlidir. Kentlerde meydana gelen gürültü kirliliği, güvenlik sistemleri, sağlık hizmetleri ve yerel hizmetler gibi faaliyetlerin işleyişini ve temel bilgilerini elde etmek için ses verisinden faydalanılmaktadır. Bu anlamda Çevresel Seslerin Sınıflandırması (ÇSS) kritik önem kazanmaktadır. Artan veri miktarı ve çözümlemedeki zaman kısıtlamalarından dolayı anlık otomatik olarak seslerin tanımlanmasını sağlayan yeni ve güçlü yapay zekâ yöntemlerine ihtiyaç duyulmaktadır. Bu sebeple yapılan çalışmada iki farklı ÇSS veri setinin sınıflandırılması için yeni bir yötem önerilmiştir. Bu yöntemde ilk olarak sesler görüntü formatına çevrilmiştir. Daha sonra görüntü formatındaki bu sesler için özgün Evrişimsel Sinir Ağları (ESA) modelleri tasarlanmıştır. Her bir veri seti için özgün olarak tasarlanan birden fazla ESA modelleri içerisinden en yüksek doğruluk oranına sahip ESA modelleri elde edilmiştir. Bu veri setleri sırasıyla ESC10 ve UrbanSound8K veri setleridir. Bu veri setlerindeki ses kayıtları 32x32x3 ve 224x224x3 boyutuna sahip görüntü formatına çevrilmiştir. Böylelikle toplamda 4 farklı görüntü formatında veri seti elde edilmiştir. Bu veri setlerini sınıflandırılması için geliştirilen özgün ESA modelleri sırasıyla, ESC10_ESA32, ESC10_ESA224, URBANSOUND8K_ESA32 ve URBANSOUND8K_ESA224 olarak isimlendirilmiştir. Bu modeller veri setleri üzerinde 10-Kat Çapraz Doğrulama yapılarak eğitilmiştir. Elde edilen sonuçlarda, ESC10_ESA32, ESC10_ESA224, URBANSOUND8K_ESA32 ve URBANSOUND8K_ESA224 modellerinin ortalama doğruluk oranları sırasıyla %80,75, %82,25, %88,60 ve %84,33 olarak elde edilmiştir. Elde edilen sonuçlar aynı veri setleri üzerinde literatürde yapılan diğer temel çalışmalarla karşılaştırıldığında önerilen modellerin daha iyi sonuçlar elde ettiği görülmüştür.
Keywords
References
- [1] S. Chu, S. Narayanan, and C.-C. J. Kuo, "Environmental sound recognition with time–frequency audio features," IEEE Transactions on Audio, Speech, and Language Processing, vol. 17, pp. 1142- 1158, 2009.
- [2] F. Demir, M. Turkoglu, M. Aslan, and A. Sengur, "A new pyramidal concatenated CNN approach for environmental sound classification," Applied Acoustics, vol. 170, p. 107520, 2020.
- [3] P. Aumond, C. Lavandier, C. Ribeiro, E. G. Boix, K. Kambona, E. D’Hondt, et al., "A study of the accuracy of mobile technology for measuring urban noise pollution in large scale participatory sensing campaigns," Applied Acoustics, vol. 117, pp. 219-226, 2017.
- [4] J. Cao, M. Cao, J. Wang, C. Yin, D. Wang, and P.-P. Vidal, "Urban noise recognition with convolutional neural network," Multimedia Tools and Applications, vol. 78, pp. 29021-29041, 2019.
- [5] R. Radhakrishnan, A. Divakaran, and A. Smaragdis, "Audio analysis for surveillance applications," in IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2005., 2005, pp. 158-161.
- [6] M. Crocco, M. Cristani, A. Trucco, and V. Murino, "Audio surveillance: A systematic review," ACM Computing Surveys (CSUR), vol. 48, pp. 1-46, 2016.
- [7] P. Laffitte, Y. Wang, D. Sodoyer, and L. Girin, "Assessing the performances of different neural network architectures for the detection of screams and shouts in public transportation," Expert systems with applications, vol. 117, pp. 29-41, 2019.
- [8] H. Li, S. Ishikawa, Q. Zhao, M. Ebana, H. Yamamoto, and J. Huang, "Robot navigation and sound based position identification," in 2007 IEEE International Conference on Systems, Man and Cybernetics, 2007, pp. 2449-2454.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
June 1, 2023
Submission Date
November 9, 2022
Acceptance Date
March 16, 2023
Published in Issue
Year 2023 Volume: 11 Number: 2
APA
Dinçer, Y., & İnik, Ö. (2023). ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI. Konya Journal of Engineering Sciences, 11(2), 468-490. https://doi.org/10.36306/konjes.1201558
AMA
1.Dinçer Y, İnik Ö. ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI. KONJES. 2023;11(2):468-490. doi:10.36306/konjes.1201558
Chicago
Dinçer, Yalçın, and Özkan İnik. 2023. “ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI”. Konya Journal of Engineering Sciences 11 (2): 468-90. https://doi.org/10.36306/konjes.1201558.
EndNote
Dinçer Y, İnik Ö (June 1, 2023) ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI. Konya Journal of Engineering Sciences 11 2 468–490.
IEEE
[1]Y. Dinçer and Ö. İnik, “ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI”, KONJES, vol. 11, no. 2, pp. 468–490, June 2023, doi: 10.36306/konjes.1201558.
ISNAD
Dinçer, Yalçın - İnik, Özkan. “ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI”. Konya Journal of Engineering Sciences 11/2 (June 1, 2023): 468-490. https://doi.org/10.36306/konjes.1201558.
JAMA
1.Dinçer Y, İnik Ö. ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI. KONJES. 2023;11:468–490.
MLA
Dinçer, Yalçın, and Özkan İnik. “ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI”. Konya Journal of Engineering Sciences, vol. 11, no. 2, June 2023, pp. 468-90, doi:10.36306/konjes.1201558.
Vancouver
1.Yalçın Dinçer, Özkan İnik. ÇEVRESEL SESLERİN EVRİŞİMSEL SİNİR AĞLARI İLE SINIFLANDIRILMASI. KONJES. 2023 Jun. 1;11(2):468-90. doi:10.36306/konjes.1201558
Cited By
An effective DNN-based Approach for Detecting Energy Theft in Smart Grids through User Consumption Patterns
Türk Doğa ve Fen Dergisi
https://doi.org/10.46810/tdfd.1383065Toplu Ulaşım Sistemlerinde Verimliliğin Artırılması Amacıyla Makine Öğrenmesi Yöntemlerinden Yararlanılması
Journal of the Institute of Science and Technology
https://doi.org/10.21597/jist.1401532