BibTex RIS Cite

Turkish Text to Speech Synthesizer

Year 2011, Volume: 4 Issue: 1 - Volume: 4 Issue: 1, - , 24.06.2016

Abstract

The main purpose of this study is development of a "Turkish Text Synthesizer System which converts text, written in Turkish, to human voice. Three different methods are examined for developing this system, these three methods are implemented and their clarity is measured statistically.First, the diphone concatenation method was applied. While the words were understandable, results were far from natural. Thus, considering the reduction of hardware costs in todays conditions the more accepted "syllable concatenation method” was developed. It is statisticaly proven that there is positive improvement with clarity and sound quality with this method. Finally, by changing the amplitude and duration of the sounds, more successful results were obtained for intonation. In order to determine and compare clarity of all methods set sentences were listened by different age groups and their answers were formulated to a score from 0 to 100, and the results were given in a matrix.The Turkish Language Association’s (TDK) database is used to prepare the necessary audio files in the begining of this study. Then, by means of a software program developed, MBROLA library was used to automatically create all the sound files. The amplitude balancing algorithm has been applied to these audio files, and clarity was increased by normalizing the maximum and minimum amplitude differences between sound files.It is provided that, the system has loosely coupled components (text to XML and XML to speech), and using these components a graphical user interface is developed.Finally, a text editing software program is developed to help the visually impaired edit text without the need for a screen image.

References

  • Lemmetty S., Review of Speech Synthesis Technology, Helsinki University of Technology, 1999
  • Allen, J., Hunnicutt, S., Klatt D., From Text to Speech: The MITalk System, Cambridge University Press, 1987
  • Dutoit T., A Short Introduction to Text-to-Speech Synthesis http://tcts.fpms.ac.be/synthesis/introtts_old.html, alındığı tarih 25.02.2010
  • http://www.acapela-group.com, alındığı tarih 25.02.2010
  • Ljungqvist M., Lindström A., Gustafson K., A New System for text-to-Speech and Its Applications to Swedish, ICSLP94 (4) : 1779-1782, 1994
  • Mönius B., Schroeter J., Santen J., Sproat R., Olive J., Recent Advances Multilingual Text-to-Speech Synthesis, Fortschritte der Akustik, DAGA, 1995
  • Güldalı K., Türkçe Metin Seslendirme, İstanbul Teknik Üniversitesi, 2009
  • http://www.nuance.com/realspeak, alındığı tarih 26.02.2010
  • Festival Project Homepage http://www.cstr.ed.ac.uk/projects/festival, alındığı tarih 26.02.2010
  • 0] Dutoit T., “An Introduction to Text to Speech Synthesis”, pp 26-32, 1997
  • 1] Wave Dosya Formatı http://ccrma.stanford.edu/courses/422/projects/WaveForm at, alındığı tarih 01.03.2010
  • 2] SAMPA Türkçe, http://www.phon.ucl.ac.uk/home/sampa/turkish.htm, alındığı tarih 07.03.2010
  • 3] Türkçe İmla Kılavuzu - Türk Dil Kurumu, 2000
  • 4] Adalı E., Doğal Dil İşleme, 2010

Türkçe Metin Seslendirme

Year 2011, Volume: 4 Issue: 1 - Volume: 4 Issue: 1, - , 24.06.2016

Abstract

Bu çalışmada temel amaç, Türkçe metinlerin insan sesine dönüştürülebilmesi ve “Türkçe Metin Seslendirme” sisteminin geliştirilmesidir. Bu sistem geliştirilirken üç farklı yöntem incelenmiş, uygulanmış ve aralarındaki anlaşılırlık istatistiksel olarak ölçülmüştür. İlk olarak, “çift-ses (diphone) eklemeli yöntem” uygulanmıştır. Anlaşılırlığı düşük olmasa da doğallıktan uzak sonuçlar elde edilmiştir. Bunun üzerine, donanım maliyetinin de azalması ile, çift-ses eklemeye nazaran günümüz koşullarında daha kabul görmüş “hece eklemeli yöntem” geliştirilmiştir. Anlaşılırlık olarak ve ses kalitesinde olumlu yönde fark olduğu istatistiksel olarak ispatlanmıştır. Son olarak, ses süre ve şiddetinin değiştirilmesi suretiyle, vurgu ve tonlamada da başarılı sonuçlar elde edilmiştir. Tüm yöntemlerin ayrı ayrı anlaşılırlığının tespit edilebilmesi ve karşılaştırılabilmesi için; belirlenmiş cümleler, farklı yaş gruplarındaki insanlara dinletilmiş ve alınan cevaplara göre belirli formül yardımı ile yüz üzerinden puan verilecek şekilde hesaplama yapılarak, bir matriste sunulmuştur.Bu çalışmada farklı Türkçe ses sentezleme yöntemleri karşılaştırılmış ve kullanıcı deneyleri ile kalite analizi gerçekleştirilmiştir. Ses sentezleme yöntemlerinin karşılaştırmalı incelenmesi ve yapılarla oynanmasına müsaade edilen bir biçimde sunulması (XML), bu makalenin önemli katkı sağlamış olduğu noktalardır.Tüm çalışmalar için gerekli ses dosyalarının hazırlanması amacıyla önce Türk Dil Kurumunun ses veri tabanı kullanılmıştır. Daha sonra, yazılan program vasıtası ile MBROLA kütüphanelerinin kullanılması ile, tüm ses dosyalarının otomatik olarak oluşturulabilmesi sağlanmıştır. Oluşturulan bu ses dosyalarına, genlik dengeleme algoritması uygulanmış, ses dosyaları arasındaki en fazla ve en az genlik seviye farklılıkları aza indirgenerek anlaşılırlık arttırılmıştır.Hazırlanan programın gevşek bağlaşımlı bileşenlerden (metinden XML geçişi ve XML’den ses oluşturulması) oluşabilmesi sağlanmış ve bu bileşenler kullanılarak kullanıcı arayüzü hazırlanmıştır.Son olarak, görme engellilerin de ekran görüntüsü gerektirmeden kullanabileceği metin düzenleme program hazırlanmıştır.

References

  • Lemmetty S., Review of Speech Synthesis Technology, Helsinki University of Technology, 1999
  • Allen, J., Hunnicutt, S., Klatt D., From Text to Speech: The MITalk System, Cambridge University Press, 1987
  • Dutoit T., A Short Introduction to Text-to-Speech Synthesis http://tcts.fpms.ac.be/synthesis/introtts_old.html, alındığı tarih 25.02.2010
  • http://www.acapela-group.com, alındığı tarih 25.02.2010
  • Ljungqvist M., Lindström A., Gustafson K., A New System for text-to-Speech and Its Applications to Swedish, ICSLP94 (4) : 1779-1782, 1994
  • Mönius B., Schroeter J., Santen J., Sproat R., Olive J., Recent Advances Multilingual Text-to-Speech Synthesis, Fortschritte der Akustik, DAGA, 1995
  • Güldalı K., Türkçe Metin Seslendirme, İstanbul Teknik Üniversitesi, 2009
  • http://www.nuance.com/realspeak, alındığı tarih 26.02.2010
  • Festival Project Homepage http://www.cstr.ed.ac.uk/projects/festival, alındığı tarih 26.02.2010
  • 0] Dutoit T., “An Introduction to Text to Speech Synthesis”, pp 26-32, 1997
  • 1] Wave Dosya Formatı http://ccrma.stanford.edu/courses/422/projects/WaveForm at, alındığı tarih 01.03.2010
  • 2] SAMPA Türkçe, http://www.phon.ucl.ac.uk/home/sampa/turkish.htm, alındığı tarih 07.03.2010
  • 3] Türkçe İmla Kılavuzu - Türk Dil Kurumu, 2000
  • 4] Adalı E., Doğal Dil İşleme, 2010
There are 14 citations in total.

Details

Other ID JA37HP33RG
Journal Section Makaleler(Araştırma)
Authors

Tuncay Şentürk This is me

Eşref Adalı

Publication Date June 24, 2016
Published in Issue Year 2011 Volume: 4 Issue: 1 - Volume: 4 Issue: 1

Cite

APA Şentürk, T., & Adalı, E. (2016). Türkçe Metin Seslendirme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, 4(1).
AMA Şentürk T, Adalı E. Türkçe Metin Seslendirme. TBV-BBMD. June 2016;4(1).
Chicago Şentürk, Tuncay, and Eşref Adalı. “Türkçe Metin Seslendirme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi 4, no. 1 (June 2016).
EndNote Şentürk T, Adalı E (June 1, 2016) Türkçe Metin Seslendirme. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 4 1
IEEE T. Şentürk and E. Adalı, “Türkçe Metin Seslendirme”, TBV-BBMD, vol. 4, no. 1, 2016.
ISNAD Şentürk, Tuncay - Adalı, Eşref. “Türkçe Metin Seslendirme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi 4/1 (June 2016).
JAMA Şentürk T, Adalı E. Türkçe Metin Seslendirme. TBV-BBMD. 2016;4.
MLA Şentürk, Tuncay and Eşref Adalı. “Türkçe Metin Seslendirme”. Türkiye Bilişim Vakfı Bilgisayar Bilimleri Ve Mühendisliği Dergisi, vol. 4, no. 1, 2016.
Vancouver Şentürk T, Adalı E. Türkçe Metin Seslendirme. TBV-BBMD. 2016;4(1).

Article Acceptance

Use user registration/login to upload articles online.

The acceptance process of the articles sent to the journal consists of the following stages:

1. Each submitted article is sent to at least two referees at the first stage.

2. Referee appointments are made by the journal editors. There are approximately 200 referees in the referee pool of the journal and these referees are classified according to their areas of interest. Each referee is sent an article on the subject he is interested in. The selection of the arbitrator is done in a way that does not cause any conflict of interest.

3. In the articles sent to the referees, the names of the authors are closed.

4. Referees are explained how to evaluate an article and are asked to fill in the evaluation form shown below.

5. The articles in which two referees give positive opinion are subjected to similarity review by the editors. The similarity in the articles is expected to be less than 25%.

6. A paper that has passed all stages is reviewed by the editor in terms of language and presentation, and necessary corrections and improvements are made. If necessary, the authors are notified of the situation.

0

.   This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.