KONUŞMACI YAŞ VE CİNSİYETİNİN GKM SÜPERVEKTÖRLERİNE DAYALI BİR DVM SINIFLANDIRICISI İLE BELİRLENMESİ
Öz
Bu çalışmada, özellikle konuşmacı doğrulama sistemlerinde yaygın olarak kullanılan GKM süpervektörlerine dayalı DVM yaklaşımı, konuşmacıların yaş ve/veya cinsiyetlerine göre sınıflandırılması problemine uyarlanmıştır. Çalışmada ayrıca farklı sayıda GKM bileşeniyle oluşturulan yaş ve cinsiyet modelleri, farklı uzunlukta konuşmalarla test edilerek konuşma süresinin ve GKM bileşen sayısının başarıya etkisi de araştırılmıştır. Bu amaçla konuşmaların ses içermeyen bölümleri enerjiye dayalı olarak atıldıktan sonra kalan sesli bölümlerden çıkarılan Mel-Frekanslı Kepstrum Katsayıları (MFCC) kullanılarak üç kategoride testler yapılmıştır. Bu testlerde en yüksek sınıflandırma başarıları 16 sn’lik konuşmaların 64 bileşenli GKM’lerle modellenmesi sonucunda elde edilmiştir. Bu oranlar cinsiyet kategorisinde (çocuk, bayan, erkek) %92.42, yaş kategorisinde (çocuk, genç, yetişkin, yaşlı) %60.1 ve yaş-cinsiyet kategorisinde ise %60.02 olarak ölçülmüştür.
Anahtar Kelimeler
Kaynakça
- Neti, C., and S. Roukos. "Phone-context specific gender-dependent acoustic-models for continuous speech recognition." Automatic Speech Recognition and Understanding, 1997. Proceedings., 1997 IEEE Workshop on. IEEE, 1997.
- Schuller, B., Steidl, S., Batliner, A., Burkhardt, F., Devillers, L., Müller, C. A., & Narayanan, S. S. (2010, September). The INTERSPEECH 2010 paralinguistic challenge. In INTERSPEECH (pp. 2794-2797).
- Mysak, Edward D. "Pitch and duration characteristics of older males." Journal of Speech & Hearing Research (1959).
- Metze, Florian, et al. "Comparison of four approaches to age and gender recognition for telephone applications." Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. IEEE International Conference on. Vol. 4. IEEE, 2007.
- Li, Ming, Kyu J. Han, and Shrikanth Narayanan. "Automatic speaker age and gender recognition using acoustic and prosodic level information fusion."Computer Speech & Language 27.1 (2013): 151-167.
- van Heerden, Charl, et al. "Combining regression and classification methods for improving automatic speaker age recognition." Acoustics Speech and Signal Processing (ICASSP), 2010 IEEE International Conference on. IEEE, 2010.
- Meinedo, Hugo, and Isabel Trancoso. "Age and gender classification using fusion of acoustic and prosodic features." INTERSPEECH. 2010.
- Bocklet, T., Stemmer, G., Zeissler, V., & Nöth, E. (2010). Age and gender recognition based on multiple systems-early vs. late fusion. In INTERSPEECH(pp. 2830-2833).
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
-
Yayımlanma Tarihi
6 Eylül 2016
Gönderilme Tarihi
26 Kasım 2014
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2016 Cilt: 31 Sayı: 3
Cited By
Konuşmacı Cinsiyetinin Tespitinde Değişik Normalizasyon Tekniklerinin Kıyaslanması
Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi
https://doi.org/10.31200/makuubd.410625Spermiogram Görüntülerinden Hareket Belirleme Yöntemleri ile Aktif Sperm Sayısının Tahmini
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.460524Speech-to-Gender Recognition Based on Machine Learning Algorithms
International Journal of Applied Mathematics Electronics and Computers
https://doi.org/10.18100/ijamec.1221455