Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis

Cilt: 1 Sayı: 2 1 Aralık 2011
PDF İndir
TR

Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis

Öz

Özet

Metinden konusma sentezleme; yazılı bir metnin gelistirilen sistem tarafından otomatik olarak okunmasıdır. Bu çalısmada, difon tabanlı, eklemeli bir konusma sentezleyici tasarlanmıs ve gerçeklestirilmistir. Birlestirmede PSOLA yöntemi kullanılmaktadır. Genellikle konusma sentezleyicilerin ezgi modeli yoktur veya eksiktir. Bu durum sentezlenen konusmanın dogallıgını olumsuz yönde etkiler. Çalısmamızda bu eksikligin giderilmesi için yeni bir model önerilmistir. Sentezlenen konusmanın dogallıgının artırılması için, konusmanın ezgisi üzerinde süre ve vurgu temelli kurallar tanımlanmıstır. Bu kurallar, hazırlanan ara yüzde yapılan pek çok denemenin sonucunda bulunmustur. Uygulanan kuralların sentezlerin dogallıgındaki basarısı öznel dinleme testleriyle ölçülmüstür. Sonuç olarak, tanımlanan kuralların gelistirilen konusma sentezleyicide uygulanması ile CMOS testi sonucunda 1,86/5,00 puanlık bir artıs elde edilmistir. Bu sonuç, ezgi modelimizin basarılı oldugunu göstermektedir.

 

Abstract

Text to speech synthesis (TTS) is the automatic reading of a text by a system. In this work, a TTS system which concatenates diphones has been designed and implemented. For concatenations, PSOLA method was used. Usually speech synthesizers lack an intonation model. This degrades the naturalness of the synthesized speech. For increasing the naturalness of the synthesized speech, duration and accent based rules were defined in this study for a proper intonation. These rules were determined after an extensive set of experiments performed in the designed testbed. In the end, an improvement of 1.86/5.00 in the CMOS score was obtained by applying the defined rules in the developed synthesis platform. This result shows the success of our intonation model.

Anahtar Kelimeler

Kaynakça

  1. Braille Teknik Ltd. Sti. http://www.brailleteknik.com/jaws.html son erisim: 08/02/2012
  2. Loquendo S.p.A., a Telecom Italia Group Company http://www.loquendo.com/en/demo-center/tts-demo/
  3. GVZ Ses tanıma ve sentezleme teknolojileri sirketi http://www.gvz.com.tr/index.html son erisim: 08/02/2012
  4. DİKTE Yöndata Bilgisayar Ltd. Sti. http://www.dikte.com.tr/konusmatanima.php son erisim: 08/02/2012
  5. Google translate http://translate.google.com son erisim: 08/02/2012
  6. Dutoit, T., An Introduction to Text-to-Speech Synthesis, Kluwer Academic Publishers, 1997.
  7. Tatham, M. and Morton K., Developments in Speech Synthesis, Wiley, 2005.
  8. Narayanan, S. and Alwan, A., Text to Speech Synthesis, New Paradigms and Advances, Prentice Hall, 2005.

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

-

Yayımlanma Tarihi

1 Aralık 2011

Gönderilme Tarihi

9 Ekim 2012

Kabul Tarihi

-

Yayımlandığı Sayı

Yıl 2011 Cilt: 1 Sayı: 2

Kaynak Göster

APA
Uslu, B., İlk, H. G., & Yılmaz, A. E. (2011). Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis. EMO Bilimsel Dergi, 1(2), 95-102. https://izlik.org/JA87TK42LW
AMA
1.Uslu B, İlk HG, Yılmaz AE. Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis. EMO Bilimsel Dergi. 2011;1(2):95-102. https://izlik.org/JA87TK42LW
Chicago
Uslu, Baran, H. Gökhan İlk, ve A. Egemen Yılmaz. 2011. “Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis”. EMO Bilimsel Dergi 1 (2): 95-102. https://izlik.org/JA87TK42LW.
EndNote
Uslu B, İlk HG, Yılmaz AE (01 Aralık 2011) Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis. EMO Bilimsel Dergi 1 2 95–102.
IEEE
[1]B. Uslu, H. G. İlk, ve A. E. Yılmaz, “Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis”, EMO Bilimsel Dergi, c. 1, sy 2, ss. 95–102, Ara. 2011, [çevrimiçi]. Erişim adresi: https://izlik.org/JA87TK42LW
ISNAD
Uslu, Baran - İlk, H. Gökhan - Yılmaz, A. Egemen. “Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis”. EMO Bilimsel Dergi 1/2 (01 Aralık 2011): 95-102. https://izlik.org/JA87TK42LW.
JAMA
1.Uslu B, İlk HG, Yılmaz AE. Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis. EMO Bilimsel Dergi. 2011;1:95–102.
MLA
Uslu, Baran, vd. “Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis”. EMO Bilimsel Dergi, c. 1, sy 2, Aralık 2011, ss. 95-102, https://izlik.org/JA87TK42LW.
Vancouver
1.Baran Uslu, H. Gökhan İlk, A. Egemen Yılmaz. Türkçe Metinden Konusma Sentezlemede Doğallığın Artırılması İçin Öneriler / Recommendations for Increasing the Naturalness in Turkish Text-to-Speech Synthesis. EMO Bilimsel Dergi [Internet]. 01 Aralık 2011;1(2):95-102. Erişim adresi: https://izlik.org/JA87TK42LW

EMO BİLİMSEL DERGİ
Elektrik, Elektronik, Bilgisayar, Biyomedikal, Kontrol Mühendisliği Bilimsel Hakemli Dergisi
TMMOB ELEKTRİK MÜHENDİSLERİ ODASI 
IHLAMUR SOKAK NO:10 KIZILAY/ANKARA
TEL: +90 (312) 425 32 72 (PBX) - FAKS: +90 (312) 417 38 18
bilimseldergi@emo.org.tr