Research Article

MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri

Volume: 11 Number: 1 March 1, 2021
TR EN

MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri

Abstract

Konuşmacıların yaş ve cinsiyet gruplarının otomatik olarak belirlenmesi önemli bir araştırma konusudur ve başta çağrı merkezleri olmak üzere birçok alanda farklı amaçlarla kullanılmaktadır. Bu çalışmada Mel Frekansı Kepstrum Katsayılarına (MFKK) eklenen logaritmik enerji ve delta parametrelerinin otomatik yaş ve cinsiyet tanıma üzerindeki etkileri araştırılmıştır. Konuşma sinyallerinden çıkarılan MFKK öznitelikleri, Gauss Karışım Modeli (GKM) süpervektörlerine dönüştürüldükten sonra Destek Vektör Makinesine (DVM) uygulanmış ve gerçekleştirilen optimizasyon süreci sonunda konuşmacıların yaş ve cinsiyet gruplarına karar verilmiştir. Çalışmada MFKK’ya eklenen parametrelerin yanı sıra MFKK sayısının ve GKM bileşen sayısının başarı üzerindeki etkileri de araştırılmıştır. MFKK sayısı 8 ile 20, GKM bileşen sayısı ise 32 ile 256 arasında değiştirilerek sistem üzerinde testler yapılmıştır. aGender veritabanının geliştirme bölümündeki 299 konuşmacının 1388 konuşması ile yapılan testlerde en yüksek sınıflandırma oranı, 12 kepstral katsayıya logaritmik enerji, delta ve delta-delta parametrelerinin eklenmesi sonucunda %60.23 olarak hesaplanmıştır. Çalışmada optimum GKM bileşen sayısı 128 olarak belirlenirken, logaritmik enerji, delta ve delta-delta parametrelerinin başarı üzerindeki etkileri sırasıyla %1.17, %3.24 ve %4.61 olarak saptanmıştır.

Keywords

References

  1. Bahari MH, McLaren M, van Leeuwen DA, 2014. Speaker age estimation using i-vectors. Engineering Applications of Artificial Intelligence, 34: 99-108.
  2. Bocklet T, Maier A, Bauer JG, Burkhardt F, Noth E, 2008. Age and gender recognition for telephone applications based on gmm supervectors and support vector machines. In 2008 IEEE International Conference on Acoustics, Speech and Signal Processing, Las Vegas, 31 March-4 April, 2008, pp: 1605-1608.
  3. Campbell, WM, Sturim DE, Reynolds DA, 2006. Support vector machines using GMM supervectors for speaker verification. IEEE signal processing letters, 13(5): 308-311.
  4. Choukri M,Wu S, 2019. Age and Gender Classification for Permission Control of Mobile Devices in Tracking Systems. In International Conference on Artificial Intelligence for Communications and Networks, Harbin, May 25-26, 2019, pp: 318-324.
  5. Dempster A, Laird N, Rubin D, 1977. Maximum likelihood from incomplete data via the EM algorithm, J. Roy. Stat. Soc. 39:1–38.
  6. Dhonde SB, Chaudhari A, Jagade SM, 2017. Integration of mel-frequency cepstral coefficients with log energy and temporal derivatives for text-independent speaker identification. In Proceedings of the International Conference on Data Engineering and Communication Technology, 2017: pp: 791-797
  7. Ertam F, 2019. An effective gender recognition approach using voice data via deeper LSTM networks. Applied Acoustics, 156: 351-358.
  8. Fang SH, Tsao Y, Hsiao MJ, Chen JY, Lai YH, Lin FC, Wang CT, 2019. Detection of pathological voice using cepstrum vectors: A deep learning approach. Journal of Voice, 33(5): 634-641.

Details

Primary Language

Turkish

Subjects

Computer Software

Journal Section

Research Article

Publication Date

March 1, 2021

Submission Date

July 23, 2020

Acceptance Date

November 4, 2020

Published in Issue

Year 2021 Volume: 11 Number: 1

APA
Yücesoy, E. (2021). MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri. Journal of the Institute of Science and Technology, 11(1), 32-43. https://doi.org/10.21597/jist.772804
AMA
1.Yücesoy E. MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri. J. Inst. Sci. and Tech. 2021;11(1):32-43. doi:10.21597/jist.772804
Chicago
Yücesoy, Ergün. 2021. “MFKK Özniteliklerine Eklenen Logaritmik Enerji Ve Delta Parametrelerinin Yaş Ve Cinsiyet Sınıflandırma Üzerindeki Etkileri”. Journal of the Institute of Science and Technology 11 (1): 32-43. https://doi.org/10.21597/jist.772804.
EndNote
Yücesoy E (March 1, 2021) MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri. Journal of the Institute of Science and Technology 11 1 32–43.
IEEE
[1]E. Yücesoy, “MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri”, J. Inst. Sci. and Tech., vol. 11, no. 1, pp. 32–43, Mar. 2021, doi: 10.21597/jist.772804.
ISNAD
Yücesoy, Ergün. “MFKK Özniteliklerine Eklenen Logaritmik Enerji Ve Delta Parametrelerinin Yaş Ve Cinsiyet Sınıflandırma Üzerindeki Etkileri”. Journal of the Institute of Science and Technology 11/1 (March 1, 2021): 32-43. https://doi.org/10.21597/jist.772804.
JAMA
1.Yücesoy E. MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri. J. Inst. Sci. and Tech. 2021;11:32–43.
MLA
Yücesoy, Ergün. “MFKK Özniteliklerine Eklenen Logaritmik Enerji Ve Delta Parametrelerinin Yaş Ve Cinsiyet Sınıflandırma Üzerindeki Etkileri”. Journal of the Institute of Science and Technology, vol. 11, no. 1, Mar. 2021, pp. 32-43, doi:10.21597/jist.772804.
Vancouver
1.Ergün Yücesoy. MFKK Özniteliklerine Eklenen Logaritmik Enerji ve Delta Parametrelerinin Yaş ve Cinsiyet Sınıflandırma Üzerindeki Etkileri. J. Inst. Sci. and Tech. 2021 Mar. 1;11(1):32-43. doi:10.21597/jist.772804

Cited By