Review

Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu

Volume: 7 Number: 4 December 24, 2019
TR

Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu

Abstract

İnsanlar arasındaki en önemli iletişim yöntemi olan konuşmanın, bilgisayarlar tarafından tanınması önemli bir çalışma alanıdır. Bu araştırma alanında farklı diller temel alınarak birçok çalışma gerçekleştirilmiştir. Literatürdeki çalışmalar konuşma tanıma teknolojilerinin başarımının artmasında önemli rol oynamıştır. Bu çalışmada konuşma tanıma ile ilgili bir literatür taraması sunulmuş ve farklı dillerde bu araştırma alanında kaydedilen ilerlemeler tartışılmıştır. Konuşma tanıma sistemlerinde kullanılan veri setleri, özellik çıkarma yaklaşımları, konuşma tanıma yöntemleri ve performans değerlendirme ölçütleri incelenerek konuşma tanımanın gelişimi ve bu alandaki zorluklara odaklanılmıştır. Konuşma tanıma alanında son zamanlarda yapılan çalışmaların olumsuz koşullara (çevre gürültüsü, konuşmacıda ve dilde değişkenlik) karşı çok daha güçlü yöntemler geliştirmeye odaklandığı izlenmiştir. Bu nedenle araştırma alanı olarak genişleyen olumsuz koşullardaki konuşma tanıma ile ilgili yakın geçmişteki gelişmelere yönelik genel bir bakış açısı sunulmuştur. Böylelikle olumsuz koşullar altında gerçekleştirilen konuşma tanımadaki tıkanıklık ve zorlukları aşabilmek için kullanılabilecek yöntemleri seçmede yardımcı olunması amaçlanmıştır.  Ayrıca Türkçe konuşma tanımada kullanılan ve iyi bilinen yöntemler karşılaştırılmıştır. Türkçe konuşma tanımanın zorluğu ve bu zorlukların üstesinden gelebilmek için kullanılabilecek uygun yöntemler irdelenmiştir. Buna bağlı olarak da Türkçe konuşma tanımanın gelecekteki rotasına ilişkin bir değerlendirme ortaya konulmuştur.

Keywords

References

  1. [1] R. K. Moore, PRESENCE: A human-inspired architecture for speech-based human-machine interaction. IEEE Trans. Comput., vol. 56, no. 9, pp. (2007), 1176–1188.
  2. [2] M. Ghorbel, M. Haariz, B. Grandjean, and M. Mokhtari, Toward a generic human machine interface for assistive robots: The AMOR project. 2005 IEEE 9th Int. Conf. Rehabil. Robot., vol. 2005, pp. 168–172, 2005.
  3. [3] A. A. M. Abushariah, T. S. Gunawan, O. O. Khalifa, and M. A. M. Abushariah, English digits speech recognition system based on Hidden Markov Models. Int. Conf. Comput. Commun. Eng., no. May, pp. 1–5, 2010.
  4. [4] C. Kurian and K. Balakrishnan, Speech recognition of Malayalam numbers. World Congr. Nat. Biol. Inspired Comput. NABIC 2009 - Proc., pp. 1475–1479, 2009.
  5. [5] E. C. Paraiso and J. P. A. Barthès, An intelligent speech interface for personal assistants in R&D projects. Expert Syst. Appl., vol. 31, no. 4, pp. (2006), 673–683.
  6. [6] C. Busso et al., Analysis of emotion recognition using facial expressions, speech and multimodal information. 6th Int. Conf. Multimodal interfaces - ICMI ’04, p. 205, 2004.
  7. [7] E. S. Myakotnykh and R. A. Thompson, Adaptive speech quality management in voice-over-IP communications’. 5th Adv. Int. Conf. Telecommun. AICT 2009, no. 978, pp. 64–71, 2009.
  8. [8] Q. Xiao, Biometrics-technology, application, challenge, and computational intelligence solutions’. Comput. Intell. Mag., vol. 2, no. 2, pp. 5–10, 2007.

Details

Primary Language

Turkish

Subjects

Engineering

Journal Section

Review

Publication Date

December 24, 2019

Submission Date

May 8, 2019

Acceptance Date

October 6, 2019

Published in Issue

Year 2019 Volume: 7 Number: 4

APA
Oyucu, S., Sever, H., & Polat, H. (2019). Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım Ve Teknoloji, 7(4), 834-854. https://doi.org/10.29109/gujsc.562111
AMA
1.Oyucu S, Sever H, Polat H. Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu. GUJS Part C. 2019;7(4):834-854. doi:10.29109/gujsc.562111
Chicago
Oyucu, Saadin, Hayri Sever, and Hüseyin Polat. 2019. “Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar Ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu”. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım Ve Teknoloji 7 (4): 834-54. https://doi.org/10.29109/gujsc.562111.
EndNote
Oyucu S, Sever H, Polat H (December 1, 2019) Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji 7 4 834–854.
IEEE
[1]S. Oyucu, H. Sever, and H. Polat, “Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu”, GUJS Part C, vol. 7, no. 4, pp. 834–854, Dec. 2019, doi: 10.29109/gujsc.562111.
ISNAD
Oyucu, Saadin - Sever, Hayri - Polat, Hüseyin. “Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar Ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu”. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji 7/4 (December 1, 2019): 834-854. https://doi.org/10.29109/gujsc.562111.
JAMA
1.Oyucu S, Sever H, Polat H. Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu. GUJS Part C. 2019;7:834–854.
MLA
Oyucu, Saadin, et al. “Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar Ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu”. Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım Ve Teknoloji, vol. 7, no. 4, Dec. 2019, pp. 834-5, doi:10.29109/gujsc.562111.
Vancouver
1.Saadin Oyucu, Hayri Sever, Hüseyin Polat. Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu. GUJS Part C. 2019 Dec. 1;7(4):834-5. doi:10.29109/gujsc.562111

                                TRINDEX     16167        16166    21432    logo.png

      

    e-ISSN:2147-9526