Ağızlar ait oldukları
dilden bazı özellikler bakımından ayrılan ve ülkenin belli bir bölgesine özgü
olan konuşma biçimleridir. Ağızlara özgü karakteristiklerin elde edilmesi ve
bunlar kullanılarak ağızların tanınması, konuşma işleme alanında popüler
konular arasındadır. Özellikle, büyük ölçekli konuşma tanıma sistemlerinin
başarımlarını arttırmak için konuşmanın ağzının öncelikli olarak belirlenmesi
istenmektedir. Diller/ağızlar birbirinden tonlama, vurgu ve ritim gibi prozodik
özelliklerle ayrılır. Bu algısal özellikler fiziksel düzeyde sırasıyla perde,
enerji ve sürenin ölçülmesiyle elde edilmektedir. Son yıllarda, derin sinir
ağlarının popüler hale gelmesiyle birlikte Uzun Kısa-Dönem Bellekli (LSTM)
sinir ağları dizi sınıflandırma ve dil modelleme problemlerinde sıklıkla
kullanılmaktadır. LSTM sinir ağları, uzun dönemli bağlam bilgisini modellemede
başarılıdır. Bu çalışmada prozodik özellikler kullanılarak LSTM sinir ağları
ile Türkçe ağız tanıma yapılmıştır. Burada LSTM sinir ağları hem dizi
sınıflandırıcı hem de dil modelleyici olarak kullanılmıştır. Önerilen
yöntemlerin Ankara, Alanya, Kıbrıs ve Trabzon ağızlarından oluşan Türkçe veri
kümesi üzerinde %78,7 doğruluk oranı verdiği gözlenmiştir.
Türkçe ağız tanıma uzun kısa-dönem bellekli sinir ağları prozodi dil modeli legendre polinomları
Primary Language | Turkish |
---|---|
Journal Section | Makaleler |
Authors | |
Publication Date | October 25, 2019 |
Submission Date | August 15, 2018 |
Acceptance Date | December 15, 2018 |
Published in Issue | Year 2020 Volume: 35 Issue: 1 |