Review
BibTex RIS Cite

ANALYSIS OF THE STUDIES BASED ON SPEECH SYNTHESIS FROM TURKISH TEXT

Year 2022, , 286 - 296, 23.03.2022
https://doi.org/10.21923/jesd.940233

Abstract

Text-to-speech synthesis studies enables all kinds of information to be transmitted by voice. Natural language processing studies, performed in order to better understand the structure of natural language and to facilitate computer-human interaction. In this study, the integration of text-to-speech synthesis and natural language processing technologies is examined. According to the literature review, 24 studies included in the research with certain criteria were examined. Approximately 62% of these studies are dissertations and natural language processing techniques were not used directly in any of them. In 10 of the studies, natural language processing techniques were used or other artificial intelligence technologies were used only in the text processing process. 50% of the researchers stated that there are deficiencies in emphasis and intonation, that the improvement of this situation; argues that it is possible with natural language processing. It is suggested that future text-to-speech synthesis studies should be carried out together with natural language processing techniques, that the compilation texts developed for Turkish should be increased in vocabulary and that they should be classified according to their meanings and integrated into speech-to-text synthesis systems.

References

  • Arık, G., 2011, Görme Engelliler İçin Bilgisayar Kullanımının Etkinleştirilmesi, Erişilebilirlik ve Bir Türkçe Hece Tabanlı Konuşma Sentezleme Sisteminin Geliştirilmesi, Yüksek Lisans Tezi, Ankara: Gazi Üniversitesi Bilişim Enstitüsü.
  • Aşlıyan, R. Ve Günel, K., 2008, Türkçe Metinler için Hece Tabanlı Konuşma Sentezleme Sistemi, Akademik Bilişim 2008.
  • Ayaz, U., 2016, Text-To-Speech Synthesıs For Turkısh Usıng A DSP Board, Yüksek Lisans Tezi, İzmir: Dokuz Eylül Üniversitesi.
  • Bicil, Y., 2010, Türkçe Metinden Konuşma Sentezleme, Yüksek Lisans Tezi, Sakarya: Sakarya Üniversitesi.
  • Eker, B., 2002, Turkish Text To Speech System, Yüksek Lisans Tezi, Ankara: Bilkent Üniversitesi Fen Bilimleri Enstitüsü.
  • Erdemir, C., 2010 Türkçe Metin Seslendirme İçin Doğal Konuşma Sentezleme, Yüksek Lisans Tezi, İstanbul: İstanbul Üniversitesi.
  • Görmez, Z., 2009, Makine Öğrenme Algoritmalarıyla Türkçe Metin Seslendirme Sistemi Yazılımı, Yüksek Lisans Tezi, İstanbul: Fatih Üniversitesi.
  • Güldalı, K., 2009, Türkçe Metin Seslendirme, Yüksek Lisans Tezi, İstanbul: İTÜ Fen Bilimleri Enstitüsü.
  • Güner, E., 2013, A Hybrid Statistical/Unit-Selection Text-To-Speech Synthesis System For Morphologically Rich Languages, Yüksek Lisans Tezi, İstanbul: Özyeğin Üniversitesi.
  • Karagöz, E. Ve Koruyan, K., 2020, Design of Audio Description System Using Cloud Based Computer Vision, Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi, 4 (1), 74-85.
  • Karamehmet, T., 2015, Implementation Of Turkish Text To Speech Synthesis, Yüksek Lisans Tezi, Ankara: Atılım Üniversitesi
  • Klatt D., 1987, Review of Text-to-Speech Conversion for English, Journal of the Acoustical Society of America, JASA, 82(3), 737-793.
  • Kul, S., 2020, Türkçe Ders Anlatan Yapay Zekaya Giden Yolda Doğal Dil İşleme, Yönetim Bilişim Sistemleri Dergisi, 6(2), 43-56.
  • Kutlugün, M. A., 2017, Gözetimli Makine Öğrenmesi Yoluyla Türe Göre Metinden Ses Sentezleme, Yüksek Lisans Tezi, İstanbul: Sabahattin Zaim Üniversitesi.
  • Kutlugün, M. A., ve Şirin, Y., 2018, A Novel Approach Improvement Framework For Text To Speech Synthesis, 26th Signal Processing and Communications Applications Conference (SIU), 1-4.
  • Li, X., Ma, D., Ve Yin, B., 2021, Advance Research İn Agricultural Text-To-Speech: The Word Segmentation Of Analytic Language And The Deep Learning-Based End-To-End System. Computers And Electronics In Agriculture, 180, 105908.
  • Otter, D. W., Medina, J. R., Ve Kalita, J. K., 2020, A Survey Of The Usages Of Deep Learning For Natural Language Processing. IEEE Transactions on Neural Networks and Learning Systems, 32(2), 604-624.
  • Schroeder, M. R., 1972, Computer speech recognition, compression, synthesis, Berlin: Springer, (2), 26-27.
  • Sel, İ., 2013, Türkçe Metinler İçin Hece Tabanlı Metinden Konuşma Sentezleme Sistemi, Yüksek Lisans Tezi, Elazığ: Fırat Üniversitesi Fen Bilimleri Enstitüsü.
  • Sel, İ., Hanbay, D. ve Karabatak, M., 2011, Beyin Bilgisayar Arayüzleri İçin Türkçe Metinden Konuşma Sentezleme Sistemi, Fırat Üniversitesi Elektrik-Elektronik Bilgisayar Sempozyumu, Bildiri Kitabı II, 2011 Elazığ, 273-276.
  • Şentürk, T., 2010, Türkçe Metin Seslendirme, Yüksek Lisans Tezi, İstanbul: İstanbul Teknik Üniversitesi.
  • Şentürk, T. ve Adalı, E., 2016, Türkçe Metin Seslendirme, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 4 (1).
  • Tekindal, B. ve Arık, G., 2012, Görme Engelliler için Türkçe Metinden Konuşma Sentezleme Yazılımı Geliştirilmesi, Bilişim Teknolojileri Dergisi, 5 (3), 9-18.
  • Tora, H., Uslu, İ. B. Ve Karamehmet, T., 2017, Implementation Of Turkish Text-To-Speech Synthesis On A Voice Synthesizer Card With Prosodic Features, Anadolu Üniversitesi Bilim ve Teknoloji Dergisi A- Uygulamalı Bilimler ve Mühendislik, 18 (3), 584-594.
  • Uslu, İ. B., 2010, Metinden Konuşma Sentezleme, TMMOB Elektrik Mühendisleri Odası Ankara Şubesi Haber.
  • Uysal, F., 2017, Eklemeli Sentezleyici Yöntemi Kullanılarak Türkçe Metinden Konuşma Sentezleme, Yüksek Lisans Tezi, Ankara: Gazi Üniversitesi Fen Bilimleri Enstitüsü.
  • Uzun, E., 2007, Görme Engelliler İçin Basılı Doküman Yorumlama ve Seslendirme Sisteminin Gerçekleştirilmesi, Yüksek Lisans Tezi, Trabzon: KTÜ Fen Bilimleri Enstitüsü.
  • Ünaldı, İ., 2007, Taşınabilir Cihazlar İçin Türkçe Metinden Konuşma Sentezleme Sistemi, Yüksek Lisans Tezi, Trabzon: KTÜ Fen Bilimleri Enstitüsü.
  • Wallace, S. E., Hux, K., Knollman-Porter, K., Brown, J. A., Parisi, E., Ve Cain, R., 2021, Reading Behaviors And Text-To-Speech Technology Perceptions Of People With Aphasia. Assistive Technology, 1-12.
  • Yang, L. W. Y., Ng, W. Y., Foo, L. L., Liu, Y., Yan, M., Lei, X., ... Ve Ting, D. S. W., 2021, Deep learning-based natural language processing in ophthalmology: applications, challenges and future directions. Current opinion in ophthalmology, 32(5), 397-405.
  • Yapıcı, M. M. , Tekerek, A. Ve Topaloğlu, N., 2019, Literature Review of Deep Learning Research Areas. Gazi Mühendislik Bilimleri Dergisi (GMBD) , 5 (3) , 188-215.
  • Yılmaz, A. E., 2009, Türkçe Metinden Konuşma Sentezleme Uygulamaları İçin Bir Veri Sözlük Seti ve Yazılım Çerçevesi, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 24 (4), 735-744.

TÜRKÇE METİNDEN KONUŞMA SENTEZLEMEYE YÖNELİK YAPILAN ÇALIŞMALARIN İNCELENMESİ

Year 2022, , 286 - 296, 23.03.2022
https://doi.org/10.21923/jesd.940233

Abstract

Metinden konuşma sentezleme çalışmaları dijital ortamdaki her türlü bilginin sesli olarak iletilmesini sağlamaktadır. Doğal dil işleme çalışmaları ise doğal dilin yapısını daha iyi anlamak ve bilgisayar-insan etkileşimini kolaylaştırmak amacıyla yapılmaktadır. Bu çalışmada, metinden konuşma sentezleme ve doğal dil işleme teknolojilerinin entegrasyonu incelenmiştir. Yapılan literatür taramasına göre belirli kriterlerle araştırmaya dâhil edilen 24 çalışma incelenmiştir. Bu çalışmaların yaklaşık %62’si tez çalışmasıdır ve hiçbirinde doğrudan doğal dil işleme teknikleri kullanılmamıştır. Çalışmaların 10’unda ise, sadece metin işleme sürecinde doğal dil işleme teknikleri kullanılmış veya diğer yapay zekâ teknolojilerinden yararlanılmıştır. Araştırmacıların %50’si, vurgu ve tonlamalarda eksiklikler olduğunu, bu durumun iyileştirilmesinin; doğal dil işleme ile mümkün olduğunu savunmaktadır. Gelecekte yapılacak olan metinden konuşma sentezleme çalışmalarının daha verimli ve doğal bir konuşma elde etmek için doğal dil işleme teknikleriyle birlikte yürütülmesi, Türkçe için geliştirilen derleme metinlerinin sözcük dağarcığının artırılması ve anlamlarına göre sınıflandırılarak metinden konuşma sentezleme sistemlerine entegre edilmesi önerilmektedir. Bu öneriler doğrultusunda insan konuşmasına en yakın seslendirme elde edilmiş olacaktır.

References

  • Arık, G., 2011, Görme Engelliler İçin Bilgisayar Kullanımının Etkinleştirilmesi, Erişilebilirlik ve Bir Türkçe Hece Tabanlı Konuşma Sentezleme Sisteminin Geliştirilmesi, Yüksek Lisans Tezi, Ankara: Gazi Üniversitesi Bilişim Enstitüsü.
  • Aşlıyan, R. Ve Günel, K., 2008, Türkçe Metinler için Hece Tabanlı Konuşma Sentezleme Sistemi, Akademik Bilişim 2008.
  • Ayaz, U., 2016, Text-To-Speech Synthesıs For Turkısh Usıng A DSP Board, Yüksek Lisans Tezi, İzmir: Dokuz Eylül Üniversitesi.
  • Bicil, Y., 2010, Türkçe Metinden Konuşma Sentezleme, Yüksek Lisans Tezi, Sakarya: Sakarya Üniversitesi.
  • Eker, B., 2002, Turkish Text To Speech System, Yüksek Lisans Tezi, Ankara: Bilkent Üniversitesi Fen Bilimleri Enstitüsü.
  • Erdemir, C., 2010 Türkçe Metin Seslendirme İçin Doğal Konuşma Sentezleme, Yüksek Lisans Tezi, İstanbul: İstanbul Üniversitesi.
  • Görmez, Z., 2009, Makine Öğrenme Algoritmalarıyla Türkçe Metin Seslendirme Sistemi Yazılımı, Yüksek Lisans Tezi, İstanbul: Fatih Üniversitesi.
  • Güldalı, K., 2009, Türkçe Metin Seslendirme, Yüksek Lisans Tezi, İstanbul: İTÜ Fen Bilimleri Enstitüsü.
  • Güner, E., 2013, A Hybrid Statistical/Unit-Selection Text-To-Speech Synthesis System For Morphologically Rich Languages, Yüksek Lisans Tezi, İstanbul: Özyeğin Üniversitesi.
  • Karagöz, E. Ve Koruyan, K., 2020, Design of Audio Description System Using Cloud Based Computer Vision, Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi, 4 (1), 74-85.
  • Karamehmet, T., 2015, Implementation Of Turkish Text To Speech Synthesis, Yüksek Lisans Tezi, Ankara: Atılım Üniversitesi
  • Klatt D., 1987, Review of Text-to-Speech Conversion for English, Journal of the Acoustical Society of America, JASA, 82(3), 737-793.
  • Kul, S., 2020, Türkçe Ders Anlatan Yapay Zekaya Giden Yolda Doğal Dil İşleme, Yönetim Bilişim Sistemleri Dergisi, 6(2), 43-56.
  • Kutlugün, M. A., 2017, Gözetimli Makine Öğrenmesi Yoluyla Türe Göre Metinden Ses Sentezleme, Yüksek Lisans Tezi, İstanbul: Sabahattin Zaim Üniversitesi.
  • Kutlugün, M. A., ve Şirin, Y., 2018, A Novel Approach Improvement Framework For Text To Speech Synthesis, 26th Signal Processing and Communications Applications Conference (SIU), 1-4.
  • Li, X., Ma, D., Ve Yin, B., 2021, Advance Research İn Agricultural Text-To-Speech: The Word Segmentation Of Analytic Language And The Deep Learning-Based End-To-End System. Computers And Electronics In Agriculture, 180, 105908.
  • Otter, D. W., Medina, J. R., Ve Kalita, J. K., 2020, A Survey Of The Usages Of Deep Learning For Natural Language Processing. IEEE Transactions on Neural Networks and Learning Systems, 32(2), 604-624.
  • Schroeder, M. R., 1972, Computer speech recognition, compression, synthesis, Berlin: Springer, (2), 26-27.
  • Sel, İ., 2013, Türkçe Metinler İçin Hece Tabanlı Metinden Konuşma Sentezleme Sistemi, Yüksek Lisans Tezi, Elazığ: Fırat Üniversitesi Fen Bilimleri Enstitüsü.
  • Sel, İ., Hanbay, D. ve Karabatak, M., 2011, Beyin Bilgisayar Arayüzleri İçin Türkçe Metinden Konuşma Sentezleme Sistemi, Fırat Üniversitesi Elektrik-Elektronik Bilgisayar Sempozyumu, Bildiri Kitabı II, 2011 Elazığ, 273-276.
  • Şentürk, T., 2010, Türkçe Metin Seslendirme, Yüksek Lisans Tezi, İstanbul: İstanbul Teknik Üniversitesi.
  • Şentürk, T. ve Adalı, E., 2016, Türkçe Metin Seslendirme, Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, 4 (1).
  • Tekindal, B. ve Arık, G., 2012, Görme Engelliler için Türkçe Metinden Konuşma Sentezleme Yazılımı Geliştirilmesi, Bilişim Teknolojileri Dergisi, 5 (3), 9-18.
  • Tora, H., Uslu, İ. B. Ve Karamehmet, T., 2017, Implementation Of Turkish Text-To-Speech Synthesis On A Voice Synthesizer Card With Prosodic Features, Anadolu Üniversitesi Bilim ve Teknoloji Dergisi A- Uygulamalı Bilimler ve Mühendislik, 18 (3), 584-594.
  • Uslu, İ. B., 2010, Metinden Konuşma Sentezleme, TMMOB Elektrik Mühendisleri Odası Ankara Şubesi Haber.
  • Uysal, F., 2017, Eklemeli Sentezleyici Yöntemi Kullanılarak Türkçe Metinden Konuşma Sentezleme, Yüksek Lisans Tezi, Ankara: Gazi Üniversitesi Fen Bilimleri Enstitüsü.
  • Uzun, E., 2007, Görme Engelliler İçin Basılı Doküman Yorumlama ve Seslendirme Sisteminin Gerçekleştirilmesi, Yüksek Lisans Tezi, Trabzon: KTÜ Fen Bilimleri Enstitüsü.
  • Ünaldı, İ., 2007, Taşınabilir Cihazlar İçin Türkçe Metinden Konuşma Sentezleme Sistemi, Yüksek Lisans Tezi, Trabzon: KTÜ Fen Bilimleri Enstitüsü.
  • Wallace, S. E., Hux, K., Knollman-Porter, K., Brown, J. A., Parisi, E., Ve Cain, R., 2021, Reading Behaviors And Text-To-Speech Technology Perceptions Of People With Aphasia. Assistive Technology, 1-12.
  • Yang, L. W. Y., Ng, W. Y., Foo, L. L., Liu, Y., Yan, M., Lei, X., ... Ve Ting, D. S. W., 2021, Deep learning-based natural language processing in ophthalmology: applications, challenges and future directions. Current opinion in ophthalmology, 32(5), 397-405.
  • Yapıcı, M. M. , Tekerek, A. Ve Topaloğlu, N., 2019, Literature Review of Deep Learning Research Areas. Gazi Mühendislik Bilimleri Dergisi (GMBD) , 5 (3) , 188-215.
  • Yılmaz, A. E., 2009, Türkçe Metinden Konuşma Sentezleme Uygulamaları İçin Bir Veri Sözlük Seti ve Yazılım Çerçevesi, Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 24 (4), 735-744.
There are 32 citations in total.

Details

Primary Language Turkish
Subjects Computer Software
Journal Section Review Articles
Authors

Gamze Yılmaz 0000-0002-1917-3740

Mustafa Yağcı 0000-0003-2911-3909

Publication Date March 23, 2022
Submission Date May 20, 2021
Acceptance Date November 1, 2021
Published in Issue Year 2022

Cite

APA Yılmaz, G., & Yağcı, M. (2022). TÜRKÇE METİNDEN KONUŞMA SENTEZLEMEYE YÖNELİK YAPILAN ÇALIŞMALARIN İNCELENMESİ. Mühendislik Bilimleri Ve Tasarım Dergisi, 10(1), 286-296. https://doi.org/10.21923/jesd.940233