Speaker recognition can be considered as a subset of the more general area known as pattern recognition, which may be viewed basically in three stages as: feature selection and extraction, classification, and pattern matching. Extensive research in the past has been directed towards finding effective speech characteristics for speaker recognition. But, so far, no feature set is found to be known to allow perfect discrimination for all conditions. As the performance of features depends on the nature of application, the selection of salient features is a key step in the recognition process. In this paper, we present a general view of speech features and well known classifiers originally developed for text-independent speaker recognition systems. A comparative discussion on choice of suitable speech features and classification techniques is also given.
Konuşmacı tanıma; özellik seçip elde etme, sınıflandırma ve örüntü karşılaştırma olarak üç aşamadan oluşan örüntü tanıma olarak bilinen genel bir alanın, bir alt kümesi olarak düşünülebilir. Geçmişten bu yana, konuşmacı tanımaya elverişli ses karakteristiklerinin bulunması yönünde yoğun çalışmalar yapılmış olmasına rağmen, henüz tüm şartlar için mükemmel ayırt etmeye yarayan bir özellik kümesi bulunamamıştır. Dolayısı ile, özelliklerin sistem başarımına etkisi uygulamanın tipine bağlı olduğundan, has özelliklerin seçimi tanıma işleminin en önemli basamağını oluşturmaktadır. Bu makalede, ses özellikleri ve daha çok metinden bağımsız konuşmacı tanıma için geliştirilmiş en çok bilinen sınıflandırma tekniklerine genel bir bakış verilmiştir. Ayrıca, uygun ses özellikleri ve sınıflayıcıların seçimleri karşılaştırmalı olarak tartışılmıştır.
Özellik Sınıflandırma Doğrusal öngörülü kodlama Gizli Markov modeli Karma Gaussian modeli
Birincil Dil | Türkçe |
---|---|
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 1 Ocak 2001 |
Yayımlandığı Sayı | Yıl 2001 Cilt: 7 Sayı: 1 |