Derleme

Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu

Cilt: 7 Sayı: 4 24 Aralık 2019
PDF İndir
TR

Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu

Öz

İnsanlar arasındaki en önemli iletişim yöntemi olan konuşmanın, bilgisayarlar tarafından tanınması önemli bir çalışma alanıdır. Bu araştırma alanında farklı diller temel alınarak birçok çalışma gerçekleştirilmiştir. Literatürdeki çalışmalar konuşma tanıma teknolojilerinin başarımının artmasında önemli rol oynamıştır. Bu çalışmada konuşma tanıma ile ilgili bir literatür taraması sunulmuş ve farklı dillerde bu araştırma alanında kaydedilen ilerlemeler tartışılmıştır. Konuşma tanıma sistemlerinde kullanılan veri setleri, özellik çıkarma yaklaşımları, konuşma tanıma yöntemleri ve performans değerlendirme ölçütleri incelenerek konuşma tanımanın gelişimi ve bu alandaki zorluklara odaklanılmıştır. Konuşma tanıma alanında son zamanlarda yapılan çalışmaların olumsuz koşullara (çevre gürültüsü, konuşmacıda ve dilde değişkenlik) karşı çok daha güçlü yöntemler geliştirmeye odaklandığı izlenmiştir. Bu nedenle araştırma alanı olarak genişleyen olumsuz koşullardaki konuşma tanıma ile ilgili yakın geçmişteki gelişmelere yönelik genel bir bakış açısı sunulmuştur. Böylelikle olumsuz koşullar altında gerçekleştirilen konuşma tanımadaki tıkanıklık ve zorlukları aşabilmek için kullanılabilecek yöntemleri seçmede yardımcı olunması amaçlanmıştır.  Ayrıca Türkçe konuşma tanımada kullanılan ve iyi bilinen yöntemler karşılaştırılmıştır. Türkçe konuşma tanımanın zorluğu ve bu zorlukların üstesinden gelebilmek için kullanılabilecek uygun yöntemler irdelenmiştir. Buna bağlı olarak da Türkçe konuşma tanımanın gelecekteki rotasına ilişkin bir değerlendirme ortaya konulmuştur.

Anahtar Kelimeler

Kaynakça

  1. [1] R. K. Moore, PRESENCE: A human-inspired architecture for speech-based human-machine interaction. IEEE Trans. Comput., vol. 56, no. 9, pp. (2007), 1176–1188.
  2. [2] M. Ghorbel, M. Haariz, B. Grandjean, and M. Mokhtari, Toward a generic human machine interface for assistive robots: The AMOR project. 2005 IEEE 9th Int. Conf. Rehabil. Robot., vol. 2005, pp. 168–172, 2005.
  3. [3] A. A. M. Abushariah, T. S. Gunawan, O. O. Khalifa, and M. A. M. Abushariah, English digits speech recognition system based on Hidden Markov Models. Int. Conf. Comput. Commun. Eng., no. May, pp. 1–5, 2010.
  4. [4] C. Kurian and K. Balakrishnan, Speech recognition of Malayalam numbers. World Congr. Nat. Biol. Inspired Comput. NABIC 2009 - Proc., pp. 1475–1479, 2009.
  5. [5] E. C. Paraiso and J. P. A. Barthès, An intelligent speech interface for personal assistants in R&D projects. Expert Syst. Appl., vol. 31, no. 4, pp. (2006), 673–683.
  6. [6] C. Busso et al., Analysis of emotion recognition using facial expressions, speech and multimodal information. 6th Int. Conf. Multimodal interfaces - ICMI ’04, p. 205, 2004.
  7. [7] E. S. Myakotnykh and R. A. Thompson, Adaptive speech quality management in voice-over-IP communications’. 5th Adv. Int. Conf. Telecommun. AICT 2009, no. 978, pp. 64–71, 2009.
  8. [8] Q. Xiao, Biometrics-technology, application, challenge, and computational intelligence solutions’. Comput. Intell. Mag., vol. 2, no. 2, pp. 5–10, 2007.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Derleme

Yayımlanma Tarihi

24 Aralık 2019

Gönderilme Tarihi

8 Mayıs 2019

Kabul Tarihi

6 Ekim 2019

Yayımlandığı Sayı

Yıl 2019 Cilt: 7 Sayı: 4

Kaynak Göster

APA
Oyucu, S., Sever, H., & Polat, H. (2019). Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji, 7(4), 834-854. https://doi.org/10.29109/gujsc.562111

                                     16168      16167     16166     21432        logo.png   


    e-ISSN:2147-9526