Kişi tanıma sistemleri biyometrik verilerin güvenli bir şekilde iletimini, tasarımını, sınıflandırılmasını gerekli kılmaktadır. Ayrıca konuşmacıların cinsiyeti belirlenerek biyometrik ses işlemlerinde daha başarılı sonuçlar elde edilebilir. Bu çalışmada Almanca ses biçim ve özelliklerine bakılarak konuşmacının cinsiyetinin otomatik olarak tanınması için bir sistem tasarlanması amaçlanmıştır. 50 erkek ve 50 kadından Almanca farklı uzunlukta kelime ve cümle olarak yaklaşık 2658 ses örneği alınmıştır. Bu ses örnekleri tek kelime olduğu gibi birden fazla kelime de içermektedir. Ses örneklerinin öznitelikleri MFCC (Mel Frequency Cepstral Coefficients) kullanılarak elde edilmiştir. Elde edilen ses örneklerinin öznitelik vektörleri Saklı Markov Modelleri(Hidden Markov Models-HMM) , Dinamik Zaman Bükmesi (Dynamic Time Warping-DTW) ve Gauss Mixture Models (Gauss Karışım Modeli-GMM) yöntemleri ile eğitilmiştir. Test aşamasında ise eğitilen ses örneklerine bakılarak verilen ses örneğinin cinsiyeti belirlenmeye çalışılmıştır. Ayrıca çalışmada kullanılan tüm sınıflandırma algoritmalarının sonuçları ve performansları karşılaştırılmalı olarak sunulmuştur.
Anahtar Kelimeler: Konuşmacı Cinsiyeti Tanıma Sistemi; Dinamik Zaman Bükmesi; Saklı Markov Modeli.
Journal Section | Articles |
---|---|
Authors | |
Publication Date | May 31, 2016 |
Submission Date | April 5, 2016 |
Published in Issue | Year 2016 Volume: 4 Issue: 2 |