Konuşma tanıma teknolojisi konuşmanın otomatik olarak
metne dönüştürülmesini sağlamaktadır. Bu konuda yapılmış önceki çalışmalar,
teknolojinin belli bir olgunluğa ulaşmasını ve pek çok farklı alanda
kullanılmasını sağlamıştır. Son zamanlarda akıllı telefon, tablet gibi mobil
uygulamaların kullanımında görülen hızlı artış konuşma tanıma teknolojisinin
mobil platformlara uyarlanmasını önemli hale getirmiştir. Bu çalışmada mobil
platformlar için yüksek başarım ile çalışan Türkçe bir konuşma tanıma
sisteminin gerçekleştirilmesi hedeflenmiştir. Bu amaçla farklı akıllı
telefonlardan alınmış kayıtlardan oluşan yeni bir ses veri tabanı
oluşturulmuştur. Sistemin performansı üç farklı konuşma tanıma uygulaması
kullanılarak ölçülmüştür. i) Televizyon kumanda uygulaması, ii) Sesli mesaj
uygulaması, iii) Genel metin yazdırma uygulaması. Yaptığımız testlerde tanıma
performansının televizyon kumanda uygulaması için %95’in üzerinde olduğu
görülmüştür. Sesli mesaj ve genel metin yazdırma uygulamalarında yaklaşık %40
ve %60 başarım oranları elde edilmiştir.
The aim of speech recognition is to recognize human
speech and convert it to written text. Past works in speech recognition
technology leaded to significant improvements and this ensured the use of the
technology in various practical applications. Recently, the demand for mobile
applications has significantly increased when the smart phones and tablets have
been introduced to the market. As a result, the adaptation of speech
recognition to mobile devices has been an important issue since the technology
has many applications in these devices. In this study, we aim to develop a
Turkish speech recognition system for mobile devices. For this purpose, we
collected a new database that includes recordings from various different
speakers and smart phones. The performance of this system is tested using three
speech recognition applications; i) Television control ii) Short message iii) General
text dictation. In the experiments, we achieved 95% recognition performance in
the grammar based television control application. The performance in short
message and general text dictation applications are approximately %40 and %60,
respectively.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 30 Nisan 2018 |
Yayımlandığı Sayı | Yıl 2018 Cilt: 24 Sayı: 2 |