BibTex RIS Kaynak Göster

Effects Of Background Data Duration On Speaker Verification Performance

Yıl 2013, Cilt: 18 Sayı: 1, 111 - 119, 01.04.2013

Öz

Gauss karışım modeli genel arka plan modeli (GKM-GAM) ve vektör nicemleme genel arka plan modeli (VN-GAM) konuşmacı doğrulamada sık kullanılan iki yöntemdir. Genellikle GAM modeli fazla sayıda farklı konuşmacının bulunduğu bir kümeden seçilen saatlerce uzunluktaki ses işaretleri kullanılarak eğitilir. Bu çalışmada, GAM modelinin eğitiminde kullanılan veri miktarının metinden bağımsız konuşmacı doğrulama performansına etkisi incelenmektedir. NIST 2002 konuşmacı tanıma değerlendirme veritabanı ile GKM-GAM ve VN-GAM yöntemleri kullanılarak yapılan deneysel çalışmalar arka plan modelini eğitmek için kullanılan veri miktarının konuşmacı tanıma performansına çok fazla etkisinin olmadığı görülmüştür

Kaynakça

  • Campbell, W., Sturim, D. E., Reynolds, D. A., Support Vector Machines Using GMM Supervectors for Speaker Verification, IEEE Signal Processing Letters, Vol. 13, No. 5, pp. 308–311, May 2006.
  • Dehak, N., Kenny, P., Dehak, R., Dumouchel, P and Ouellet, P. (2011) Front-End Factor Analysis for Speaker Verification, IEEE Transactions on Audio, Speech and Language Processing, 19(4), 788-798.
  • Hanilçi, C. and Ertaş, F. (2011) Comparison of the impact of some Minkowski metrics on VQ/GMM based speaker recognition, Computers & Electrical Engineering, 37(1), 41-56.
  • Hautamäki, V., Kinnunen, T., Kärkkäinen, I., Tuononen, M., Saastamoinen, J. and Fränti, P. (2008) Maximum a Posteriori Estimation of the Centroid Model for Speaker Verification, IEEE Signal Processing Letters, 15: 162--165.
  • Kenny, P., Boulianne, G., Ouellet, P. and Dumouchel, P. (2007) Joint factor analysis versus eigenchannels in speaker recognition, IEEE Transactions on Audio, Speech and Language Processing, 15 (4), 1435-1447.
  • Kinnunen, T., Saastamoinen, J., Hautamäki, V., Vinni, M. and Fränti, P. (2009) Comparative Evaluation of Maximum a Posteriori Vector Quantization and Gaussian Mixture Models in Speaker Verification, Pattern Recognition Letters, 30(4): 341--347.
  • Kinnunen, T. and Li, H. (2011) An Overview of Text-Independent Speaker Recognition: from Features to Supervectors, Speech Communication 52(1), 12--40.
  • NIST, (2001). http://www.itl.nist.gov/iad/mig/tests/sre/2002/index.html, Retrieved: July 2012, Subject: NIST 2002 SRE Evaluation Plan
  • NIST, (2002). http://www.itl.nist.gov/iad/mig/tests/sre/2001/index.html,  Retrieved: July 2012, Subject: NIST 2001 SRE Evaluation Plan
  • Reynolds, D. A., Quatieri, T. F. and Dunn, R. B. (2000) Speaker Verification Using Adapted Gaussian Mixture Models, Digital Signal Processing, 10(1-3), 19-41.
  • Makale 01.11.2012 tarihinde alınmış, 20.12.2012 tarihinde düzeltilmiş, 21.12.2012 tarihinde
  • kabul edilmiştir.  

Arkaplan Veri Süresinin Konuşmacı Doğrulama Performansına Etkisi

Yıl 2013, Cilt: 18 Sayı: 1, 111 - 119, 01.04.2013

Öz

Gaussian mixture models with universal background model (GMM-UBM) and vector quantization with universal background model (VQ-UBM) are the two well-known classifiers used for speaker verification. Generally, UBM is trained with many hours of speech from a large pool of different speakers. In this study, we analyze the effect of data duration used to train UBM on text-independent speaker verification performance using GMM-UBM and VQ-UBM modeling techniques. Experiments carried out NIST 2002 speaker recognition evaluation (SRE) corpus show that background data duration to train UBM has small impact on recognition performance for GMM-UBM and VQ-UBM classifiers

Kaynakça

  • Campbell, W., Sturim, D. E., Reynolds, D. A., Support Vector Machines Using GMM Supervectors for Speaker Verification, IEEE Signal Processing Letters, Vol. 13, No. 5, pp. 308–311, May 2006.
  • Dehak, N., Kenny, P., Dehak, R., Dumouchel, P and Ouellet, P. (2011) Front-End Factor Analysis for Speaker Verification, IEEE Transactions on Audio, Speech and Language Processing, 19(4), 788-798.
  • Hanilçi, C. and Ertaş, F. (2011) Comparison of the impact of some Minkowski metrics on VQ/GMM based speaker recognition, Computers & Electrical Engineering, 37(1), 41-56.
  • Hautamäki, V., Kinnunen, T., Kärkkäinen, I., Tuononen, M., Saastamoinen, J. and Fränti, P. (2008) Maximum a Posteriori Estimation of the Centroid Model for Speaker Verification, IEEE Signal Processing Letters, 15: 162--165.
  • Kenny, P., Boulianne, G., Ouellet, P. and Dumouchel, P. (2007) Joint factor analysis versus eigenchannels in speaker recognition, IEEE Transactions on Audio, Speech and Language Processing, 15 (4), 1435-1447.
  • Kinnunen, T., Saastamoinen, J., Hautamäki, V., Vinni, M. and Fränti, P. (2009) Comparative Evaluation of Maximum a Posteriori Vector Quantization and Gaussian Mixture Models in Speaker Verification, Pattern Recognition Letters, 30(4): 341--347.
  • Kinnunen, T. and Li, H. (2011) An Overview of Text-Independent Speaker Recognition: from Features to Supervectors, Speech Communication 52(1), 12--40.
  • NIST, (2001). http://www.itl.nist.gov/iad/mig/tests/sre/2002/index.html, Retrieved: July 2012, Subject: NIST 2002 SRE Evaluation Plan
  • NIST, (2002). http://www.itl.nist.gov/iad/mig/tests/sre/2001/index.html,  Retrieved: July 2012, Subject: NIST 2001 SRE Evaluation Plan
  • Reynolds, D. A., Quatieri, T. F. and Dunn, R. B. (2000) Speaker Verification Using Adapted Gaussian Mixture Models, Digital Signal Processing, 10(1-3), 19-41.
  • Makale 01.11.2012 tarihinde alınmış, 20.12.2012 tarihinde düzeltilmiş, 21.12.2012 tarihinde
  • kabul edilmiştir.  
Toplam 12 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Bölüm Araştırma Makaleleri
Yazarlar

Cemal Hanilçi Bu kişi benim

Figen Ertaş Bu kişi benim

Yayımlanma Tarihi 1 Nisan 2013
Gönderilme Tarihi 19 Aralık 2014
Yayımlandığı Sayı Yıl 2013 Cilt: 18 Sayı: 1

Kaynak Göster

APA Hanilçi, C., & Ertaş, F. (2013). Effects Of Background Data Duration On Speaker Verification Performance. Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 18(1), 111-119. https://doi.org/10.17482/uujfe.97355
AMA Hanilçi C, Ertaş F. Effects Of Background Data Duration On Speaker Verification Performance. UUJFE. Nisan 2013;18(1):111-119. doi:10.17482/uujfe.97355
Chicago Hanilçi, Cemal, ve Figen Ertaş. “Effects Of Background Data Duration On Speaker Verification Performance”. Uludağ Üniversitesi Mühendislik Fakültesi Dergisi 18, sy. 1 (Nisan 2013): 111-19. https://doi.org/10.17482/uujfe.97355.
EndNote Hanilçi C, Ertaş F (01 Nisan 2013) Effects Of Background Data Duration On Speaker Verification Performance. Uludağ Üniversitesi Mühendislik Fakültesi Dergisi 18 1 111–119.
IEEE C. Hanilçi ve F. Ertaş, “Effects Of Background Data Duration On Speaker Verification Performance”, UUJFE, c. 18, sy. 1, ss. 111–119, 2013, doi: 10.17482/uujfe.97355.
ISNAD Hanilçi, Cemal - Ertaş, Figen. “Effects Of Background Data Duration On Speaker Verification Performance”. Uludağ Üniversitesi Mühendislik Fakültesi Dergisi 18/1 (Nisan 2013), 111-119. https://doi.org/10.17482/uujfe.97355.
JAMA Hanilçi C, Ertaş F. Effects Of Background Data Duration On Speaker Verification Performance. UUJFE. 2013;18:111–119.
MLA Hanilçi, Cemal ve Figen Ertaş. “Effects Of Background Data Duration On Speaker Verification Performance”. Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, c. 18, sy. 1, 2013, ss. 111-9, doi:10.17482/uujfe.97355.
Vancouver Hanilçi C, Ertaş F. Effects Of Background Data Duration On Speaker Verification Performance. UUJFE. 2013;18(1):111-9.

DUYURU:

30.03.2021- Nisan 2021 (26/1) sayımızdan itibaren TR-Dizin yeni kuralları gereği, dergimizde basılacak makalelerde, ilk gönderim aşamasında Telif Hakkı Formu yanısıra, Çıkar Çatışması Bildirim Formu ve Yazar Katkısı Bildirim Formu da tüm yazarlarca imzalanarak gönderilmelidir. Yayınlanacak makalelerde de makale metni içinde "Çıkar Çatışması" ve "Yazar Katkısı" bölümleri yer alacaktır. İlk gönderim aşamasında doldurulması gereken yeni formlara "Yazım Kuralları" ve "Makale Gönderim Süreci" sayfalarımızdan ulaşılabilir. (Değerlendirme süreci bu tarihten önce tamamlanıp basımı bekleyen makalelerin yanısıra değerlendirme süreci devam eden makaleler için, yazarlar tarafından ilgili formlar doldurularak sisteme yüklenmelidir).  Makale şablonları da, bu değişiklik doğrultusunda güncellenmiştir. Tüm yazarlarımıza önemle duyurulur.

Bursa Uludağ Üniversitesi, Mühendislik Fakültesi Dekanlığı, Görükle Kampüsü, Nilüfer, 16059 Bursa. Tel: (224) 294 1907, Faks: (224) 294 1903, e-posta: mmfd@uludag.edu.tr