Research Article
BibTex RIS Cite

Classification of Infant Cries with Machine Learning Methods

Year 2021, Issue: 27, 784 - 791, 30.11.2021
https://doi.org/10.31590/ejosat.979526

Abstract

In this study, various machine learning methods were used to determine the needs of babies and to find out whether they were exposed to any disease by making use of baby crying sounds. Two different data sets were used for baby crying sounds. It is aimed to find the type of crying after the data sets go through the training, learning and testing stages. Mel Frequency Cepstral Coefficients (MFCC) and Linear Prediction Cepstral Coefficients (LPCC) methods were compared to extract the attributes of crying sounds, and the MFCC method was found to be more effective than LPCC in increasing accuracy. In the classification phase of the audio signals whose attributes were extracted, k-Nearest Neighborhood (k-NN) algorithm, Multilayer Perceptron, Decision Tree and Random Forest algorithms from machine learning algorithms were used and success rates were compared. As a result, a 93% success rate was found using MFCC and Multilayer Perceptron.

References

  • Ahmed, M. C. and Koçer, H. E. (2019). Turkish Speech recognition using Mel-frequency cepstral coefficients(MFCC) and Hidden Markov Model (HMM). Veri Bilimi Dergisi, 2(2), 39-44.
  • Bănică, I.-A., Cucu, H., Buzo, A., Burileanu, D. and Burileanu, C. (2016). Baby cry recognition in real-world conditions. 2016 39th International Conference on Telecommunications and Signal Processing (TSP), 315-318. Vienna. doi:10.1109/TSP.2016.7760887
  • Başbuğ, A. M. (2019). Ses olayı tanıma ve akustik sahne geri getirimi. Yüksek Lisans Tezi, Başkent Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Breiman, L. (2001). Random Forests. Machine Learning, 45, 5-32. doi:https://doi.org/10.1023/A:1010933404324 Bütüner, R. (2020). Yapay zeka yöntemleri ile bebek seslerinin tahmin edilmesi. Journal of Information Systems and Management Research, 2(1), 32-41.
  • Büyükarıkan, U. (2020). Finansal performansa etki eden finansal değişkenlerin CHAID karar ağacıyla belirlenmesi: tekstil sektörü örneği. Aydın İktisat Fakültesi Dergisi, 5(1), 1-10.
  • Dehak, N., Kenny, P., Dehak, R., Dumouchel, P. and Ouellet, P. (2011). Front-End Factor Analysis for Speaker Verification. IEEE Transactions on Audio, Speech, and Language Processing, 19(4), 788-798. doi:10.1109/TASL.2010.2064307
  • Eray, O. (2008). Destek vektör makineleri ile ses tanıma uygulaması. Yüksek Lisans Tezi, Pamukkale Üniversitesi Fen Bilimleri Enstitüsü, Denizli.
  • Garcia, J. O. and Reyes Garcia, C. A. (2003). Mel-frequency cepstrum coefficients extraction from infant cry for classification of normal and pathological cry with feed-forward neural networks. Proceedings of the International Joint Conference on Neural Networks, 3140-3145. Portland. doi:10.1109/IJCNN.2003.1224074
  • Güldal, H. ve Çakıcı, Y. (2017). Ders yönetim sistemi yazılımı kullanıcı etkileşimlerinin sınıflandırma algoritmaları ile analizi. Atatürk Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 21(4), 1355-1367.
  • Karasartova, S. (2011). Metinden bağımsız konuşmacı tanıma sistemlerinin incelenmesi ve gerçekleştirilmesi. Yüksek Lisans Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Kaynar, O., Görmez, Y., Yildiz, M. ve Albayrak, A. (2016). Makine öğrenmesi yöntemleri ile duygu analizi. International Artificial Intelligence and Data Processing Symposium, 234-241. Malatya.
  • Lavner, Y., Cohen, R., Ruinskiy, D. and IJzerman, H. (2016). Baby cry detection in domestic environment using deep learning. 2016 IEEE International Conference on the Science of Electrical Engineering (ICSEE), 1-5. Eilat. doi:10.1109/ICSEE.2016.7806117
  • Myakala, P. R., Nalumachu, R., Sharma, S. and Mittal, V. K. (2017). An intelligent system for infant cry detection and information in real time. 2017 Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos (ACIIW), 141-146. San Antonio. doi:10.1109/ACIIW.2017.8272604
  • Pal, P., Iyer, A. N. and Yantorno, R. E. (2006). Emotion detection from infant facial expressions and cries., 721-724. Toulouse. doi:10.1109/ICASSP.2006.1660444
  • Patil, M. S. and Kamerikar, U. A. (2018). Cause estimation of neonatal cry using raspberry pi. International Journal of Applied Engineering Research, 13(12), 10722-10726.
  • Reyes-Galaviz, O. F. and Reyes-Garcia, C. A. (2004). A system for the processing of infant cry to recognize pathologies in recently born babies with neural networks. 9th International Conference on Speech and Computer. St. Petersburg.
  • Reyes-García, C. A. (2006). Baby Chillanto Database. Mexican National Institute of Author Rights (INDAUTOR).
  • Rodriguez-Galiano, V. F., Ghimire, B., Rogan, J., Chica-Olmo, M. and Rigol-Sanchez, J. P. (2012). An assessment of the effectiveness of a random forest classifier for land-cover classification. ISPRS Journal of Photogrammetry and Remote Sensing, 67(0924-2716), 93-104. doi:10.1016/j.isprsjprs.2011.11.002
  • Saha, B., Purkait, P. K., Mukherjee, J., Majumdar, A. K., Majumdar, B. and Singh, A. K. (2013). An embedded system for automatic classification of neonatal cry. 2013 IEEE Point-of-Care Healthcare Technologies (PHT), 248-251. Bangalore. doi:10.1109/PHT.2013.6461331
  • Zabidi, A., Khuan, L. Y., Mansor, W., Yassin, I. M. and Sahak, R. (2010). Classification of infant cries with asphyxia using multilayer perceptron neural network. 2010 Second International Conference on Computer Engineering and Applications, 204-208. Bali. doi:10.1109/ICCEA.2010.47

Bebek Ağlamalarının Makine Öğrenmesi Yöntemleriyle Sınıflandırılması

Year 2021, Issue: 27, 784 - 791, 30.11.2021
https://doi.org/10.31590/ejosat.979526

Abstract

Bu çalışmada bebek ağlama seslerinden yararlanılarak, bebeklerin ihtiyaçlarını belirleyebilmek ve herhangi bir hastalığa maruz olup olmadıklarını öğrenmek için çeşitli makine öğrenmesi yöntemleri kullanılmıştır. Bebek ağlama sesleri için iki farklı veri kümesinden yararlanılmıştır. Veri kümeleri eğitim, öğrenme ve test aşamalarından geçtikten sonra ağlama türünün bulunması hedeflenmiştir. Ağlama seslerinin özniteliklerini çıkarmak için Mel Frekans Kepstrum Katsayıları (MFCC) ve Doğrusal Öngörü Kepstrum Katsayıları (LPCC) yöntemleri karşılaştırılmış ve MFCC yönteminin doğruluğu arttırmada LPCC’ye göre daha etkili olduğu bulunmuştur. Öznitelikleri çıkarılan ses sinyallerinin sınıflandırılma aşamasında makine öğrenme algoritmalarından k-En Yakın Komşuluk (k-NN) algoritması, Çok Katmanlı Algılayıcılar, Karar Ağacı ve Rastgele Orman algoritmaları kullanılmış ve başarı oranları karşılaştırılmıştır. Sonuçta MFCC ve Çok Katmanlı Algılayıcılar yöntemi kullanılarak %93 başarı oranı bulunmuştur.

References

  • Ahmed, M. C. and Koçer, H. E. (2019). Turkish Speech recognition using Mel-frequency cepstral coefficients(MFCC) and Hidden Markov Model (HMM). Veri Bilimi Dergisi, 2(2), 39-44.
  • Bănică, I.-A., Cucu, H., Buzo, A., Burileanu, D. and Burileanu, C. (2016). Baby cry recognition in real-world conditions. 2016 39th International Conference on Telecommunications and Signal Processing (TSP), 315-318. Vienna. doi:10.1109/TSP.2016.7760887
  • Başbuğ, A. M. (2019). Ses olayı tanıma ve akustik sahne geri getirimi. Yüksek Lisans Tezi, Başkent Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Breiman, L. (2001). Random Forests. Machine Learning, 45, 5-32. doi:https://doi.org/10.1023/A:1010933404324 Bütüner, R. (2020). Yapay zeka yöntemleri ile bebek seslerinin tahmin edilmesi. Journal of Information Systems and Management Research, 2(1), 32-41.
  • Büyükarıkan, U. (2020). Finansal performansa etki eden finansal değişkenlerin CHAID karar ağacıyla belirlenmesi: tekstil sektörü örneği. Aydın İktisat Fakültesi Dergisi, 5(1), 1-10.
  • Dehak, N., Kenny, P., Dehak, R., Dumouchel, P. and Ouellet, P. (2011). Front-End Factor Analysis for Speaker Verification. IEEE Transactions on Audio, Speech, and Language Processing, 19(4), 788-798. doi:10.1109/TASL.2010.2064307
  • Eray, O. (2008). Destek vektör makineleri ile ses tanıma uygulaması. Yüksek Lisans Tezi, Pamukkale Üniversitesi Fen Bilimleri Enstitüsü, Denizli.
  • Garcia, J. O. and Reyes Garcia, C. A. (2003). Mel-frequency cepstrum coefficients extraction from infant cry for classification of normal and pathological cry with feed-forward neural networks. Proceedings of the International Joint Conference on Neural Networks, 3140-3145. Portland. doi:10.1109/IJCNN.2003.1224074
  • Güldal, H. ve Çakıcı, Y. (2017). Ders yönetim sistemi yazılımı kullanıcı etkileşimlerinin sınıflandırma algoritmaları ile analizi. Atatürk Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 21(4), 1355-1367.
  • Karasartova, S. (2011). Metinden bağımsız konuşmacı tanıma sistemlerinin incelenmesi ve gerçekleştirilmesi. Yüksek Lisans Tezi, Ankara Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Kaynar, O., Görmez, Y., Yildiz, M. ve Albayrak, A. (2016). Makine öğrenmesi yöntemleri ile duygu analizi. International Artificial Intelligence and Data Processing Symposium, 234-241. Malatya.
  • Lavner, Y., Cohen, R., Ruinskiy, D. and IJzerman, H. (2016). Baby cry detection in domestic environment using deep learning. 2016 IEEE International Conference on the Science of Electrical Engineering (ICSEE), 1-5. Eilat. doi:10.1109/ICSEE.2016.7806117
  • Myakala, P. R., Nalumachu, R., Sharma, S. and Mittal, V. K. (2017). An intelligent system for infant cry detection and information in real time. 2017 Seventh International Conference on Affective Computing and Intelligent Interaction Workshops and Demos (ACIIW), 141-146. San Antonio. doi:10.1109/ACIIW.2017.8272604
  • Pal, P., Iyer, A. N. and Yantorno, R. E. (2006). Emotion detection from infant facial expressions and cries., 721-724. Toulouse. doi:10.1109/ICASSP.2006.1660444
  • Patil, M. S. and Kamerikar, U. A. (2018). Cause estimation of neonatal cry using raspberry pi. International Journal of Applied Engineering Research, 13(12), 10722-10726.
  • Reyes-Galaviz, O. F. and Reyes-Garcia, C. A. (2004). A system for the processing of infant cry to recognize pathologies in recently born babies with neural networks. 9th International Conference on Speech and Computer. St. Petersburg.
  • Reyes-García, C. A. (2006). Baby Chillanto Database. Mexican National Institute of Author Rights (INDAUTOR).
  • Rodriguez-Galiano, V. F., Ghimire, B., Rogan, J., Chica-Olmo, M. and Rigol-Sanchez, J. P. (2012). An assessment of the effectiveness of a random forest classifier for land-cover classification. ISPRS Journal of Photogrammetry and Remote Sensing, 67(0924-2716), 93-104. doi:10.1016/j.isprsjprs.2011.11.002
  • Saha, B., Purkait, P. K., Mukherjee, J., Majumdar, A. K., Majumdar, B. and Singh, A. K. (2013). An embedded system for automatic classification of neonatal cry. 2013 IEEE Point-of-Care Healthcare Technologies (PHT), 248-251. Bangalore. doi:10.1109/PHT.2013.6461331
  • Zabidi, A., Khuan, L. Y., Mansor, W., Yassin, I. M. and Sahak, R. (2010). Classification of infant cries with asphyxia using multilayer perceptron neural network. 2010 Second International Conference on Computer Engineering and Applications, 204-208. Bali. doi:10.1109/ICCEA.2010.47
There are 20 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Articles
Authors

Bengisu Şeyda Kop 0000-0002-0716-6455

Levent Bayındır 0000-0001-7318-5884

Early Pub Date July 29, 2021
Publication Date November 30, 2021
Published in Issue Year 2021 Issue: 27

Cite

APA Kop, B. Ş., & Bayındır, L. (2021). Bebek Ağlamalarının Makine Öğrenmesi Yöntemleriyle Sınıflandırılması. Avrupa Bilim Ve Teknoloji Dergisi(27), 784-791. https://doi.org/10.31590/ejosat.979526