EN
TR
Bebek Ağlamalarının Makine Öğrenmesi Yöntemleriyle Sınıflandırılması
Öz
Bu çalışmada bebek ağlama seslerinden yararlanılarak, bebeklerin ihtiyaçlarını belirleyebilmek ve herhangi bir hastalığa maruz olup olmadıklarını öğrenmek için çeşitli makine öğrenmesi yöntemleri kullanılmıştır. Bebek ağlama sesleri için iki farklı veri kümesinden yararlanılmıştır. Veri kümeleri eğitim, öğrenme ve test aşamalarından geçtikten sonra ağlama türünün bulunması hedeflenmiştir. Ağlama seslerinin özniteliklerini çıkarmak için Mel Frekans Kepstrum Katsayıları (MFCC) ve Doğrusal Öngörü Kepstrum Katsayıları (LPCC) yöntemleri karşılaştırılmış ve MFCC yönteminin doğruluğu arttırmada LPCC’ye göre daha etkili olduğu bulunmuştur. Öznitelikleri çıkarılan ses sinyallerinin sınıflandırılma aşamasında makine öğrenme algoritmalarından k-En Yakın Komşuluk (k-NN) algoritması, Çok Katmanlı Algılayıcılar, Karar Ağacı ve Rastgele Orman algoritmaları kullanılmış ve başarı oranları karşılaştırılmıştır. Sonuçta MFCC ve Çok Katmanlı Algılayıcılar yöntemi kullanılarak %93 başarı oranı bulunmuştur.
Anahtar Kelimeler
References
- Ahmed, M. C. and Koçer, H. E. (2019). Turkish Speech recognition using Mel-frequency cepstral coefficients(MFCC) and Hidden Markov Model (HMM). Veri Bilimi Dergisi, 2(2), 39-44.
- Bănică, I.-A., Cucu, H., Buzo, A., Burileanu, D. and Burileanu, C. (2016). Baby cry recognition in real-world conditions. 2016 39th International Conference on Telecommunications and Signal Processing (TSP), 315-318. Vienna. doi:10.1109/TSP.2016.7760887
- Başbuğ, A. M. (2019). Ses olayı tanıma ve akustik sahne geri getirimi. Yüksek Lisans Tezi, Başkent Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
- Breiman, L. (2001). Random Forests. Machine Learning, 45, 5-32. doi:https://doi.org/10.1023/A:1010933404324 Bütüner, R. (2020). Yapay zeka yöntemleri ile bebek seslerinin tahmin edilmesi. Journal of Information Systems and Management Research, 2(1), 32-41.
- Büyükarıkan, U. (2020). Finansal performansa etki eden finansal değişkenlerin CHAID karar ağacıyla belirlenmesi: tekstil sektörü örneği. Aydın İktisat Fakültesi Dergisi, 5(1), 1-10.
- Dehak, N., Kenny, P., Dehak, R., Dumouchel, P. and Ouellet, P. (2011). Front-End Factor Analysis for Speaker Verification. IEEE Transactions on Audio, Speech, and Language Processing, 19(4), 788-798. doi:10.1109/TASL.2010.2064307
- Eray, O. (2008). Destek vektör makineleri ile ses tanıma uygulaması. Yüksek Lisans Tezi, Pamukkale Üniversitesi Fen Bilimleri Enstitüsü, Denizli.
- Garcia, J. O. and Reyes Garcia, C. A. (2003). Mel-frequency cepstrum coefficients extraction from infant cry for classification of normal and pathological cry with feed-forward neural networks. Proceedings of the International Joint Conference on Neural Networks, 3140-3145. Portland. doi:10.1109/IJCNN.2003.1224074
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
November 30, 2021
Submission Date
August 9, 2021
Acceptance Date
November 10, 2021
Published in Issue
Year 2021 Number: 27
APA
Kop, B. Ş., & Bayındır, L. (2021). Bebek Ağlamalarının Makine Öğrenmesi Yöntemleriyle Sınıflandırılması. Avrupa Bilim Ve Teknoloji Dergisi, 27, 784-791. https://doi.org/10.31590/ejosat.979526
Cited By
A Modified MFCC-Based Deep Learning Method for Emotion Classification from Speech
International Advanced Researches and Engineering Journal
https://doi.org/10.35860/iarej.1373333