Araştırma Makalesi

Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması

Sayı: 34 31 Mart 2022
PDF İndir
TR EN

Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması

Öz

Konuşma tanıma insanların çıkardığı ses dalgalarının yazıya dönüştürülmesi işlemidir. Geçmişten günümüze birçok konuşma tanıma modeli ve veri seti üretilmekle beraber ülkemizde bu konuda bir eksiklik olduğu yadsınamaz bir gerçektir. Bu çalışmada, Türkçe konuşma tanıma sistemleri için sesli kitaplardan oluşan özgün bir veri seti geliştirilmiştir. Bu veri seti halihazırda oluşturulmuş olan sesli kitapların bölümlenmesi yoluyla hazırlanmıştır. Bu veri seti üzerinde Evrişimli Sinir Ağları (CNN) ve Bağlantıcı Zamansal Sınıflandırma (CTC) ile birlikte Yinelemeli Sinir Ağı (RNN), Uzun Kısa Süreli Hafıza (LSTM), Geçitli Tekrarlayan Birimler (GRU) modellerinin performansı incelenmiş ve karşılaştırması yapılmıştır. Bu çalışmanın sonuçlarına göre performansı en yüksek olan model LSTM olması ile birlikte daha az parametre kullanan GRU modelinin konuşma tanıma oranı LSTM modelinin konuşma tanıma oranına yakın çıkmıştır.

Anahtar Kelimeler

Kaynakça

  1. Abdel-Hamid O., Mohamed A., Jiang H., Deng L., Penn G. and Yu D., (2014) "Convolutional neural networks for speech recognition" IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 22, no. 10, pp. 1533-1545, doi: 10.1109/TASLP.2014.2339736.
  2. Benba A., Jilbab A. and Hammouch A., (2015) “Detecting patients with parkinson’s disease using mel frequency cepstral coefficients and support vector machines”, International Journal on Electrical Engineering and Informatics- Volume 7, Number 2.
  3. Cho K., Van Merriënboer B., Bahdanau D., Bengio Y., (2014) “On the properties of neural machine translation: encoder-decoder approaches.” arXiv preprint arXiv:1409.1259.
  4. Dahl G. E., Yu D., Deng L., A. Acero (2012) “Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition.” Ieee Transactıons On Audıo, Speech, And Language Processıng, Vol. 20, No. 1.
  5. Goodfellow I., Bengio Y. and Courville A., (2018) Derin Öğrenme, Ankara: Buzdağı Yayınevi
  6. Graves A., Mohamed A., Hinton G. (2013) “Speech recognition with deep recurrent neural networks.” ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing- Proceedings. 38. 10.1109/ICASSP.2013.6638947.
  7. Graves A., Fernández S., Gomez F., and Schmidhuber J., (2006) “Connectionist temporal classification: labelling unsegmented sequence data with recurrent neural networks.” In Proceedings of the 23rd international conference on Machine learning (pp. 369-376).
  8. Hochreiter S. and Schmidhuber J. (1997) “Long short-term memory. neural computation.”, 9(8), 1735–1780.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

31 Mart 2022

Gönderilme Tarihi

3 Mart 2022

Kabul Tarihi

4 Mart 2022

Yayımlandığı Sayı

Yıl 2022 Sayı: 34

Kaynak Göster

APA
Yalman, H. İ., & Tüfekci, Z. (2022). Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması. Avrupa Bilim ve Teknoloji Dergisi, 34, 321-327. https://doi.org/10.31590/ejosat.1082109
AMA
1.Yalman Hİ, Tüfekci Z. Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması. EJOSAT. 2022;(34):321-327. doi:10.31590/ejosat.1082109
Chicago
Yalman, Halil İbrahim, ve Zekeriya Tüfekci. 2022. “Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması”. Avrupa Bilim ve Teknoloji Dergisi, sy 34: 321-27. https://doi.org/10.31590/ejosat.1082109.
EndNote
Yalman Hİ, Tüfekci Z (01 Mart 2022) Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması. Avrupa Bilim ve Teknoloji Dergisi 34 321–327.
IEEE
[1]H. İ. Yalman ve Z. Tüfekci, “Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması”, EJOSAT, sy 34, ss. 321–327, Mar. 2022, doi: 10.31590/ejosat.1082109.
ISNAD
Yalman, Halil İbrahim - Tüfekci, Zekeriya. “Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması”. Avrupa Bilim ve Teknoloji Dergisi. 34 (01 Mart 2022): 321-327. https://doi.org/10.31590/ejosat.1082109.
JAMA
1.Yalman Hİ, Tüfekci Z. Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması. EJOSAT. 2022;:321–327.
MLA
Yalman, Halil İbrahim, ve Zekeriya Tüfekci. “Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması”. Avrupa Bilim ve Teknoloji Dergisi, sy 34, Mart 2022, ss. 321-7, doi:10.31590/ejosat.1082109.
Vancouver
1.Halil İbrahim Yalman, Zekeriya Tüfekci. Yeni Bir Türkçe Sesli Kitap Veri Seti Üzerinde Convolutional RNN+CTC, LSTM+CTC ve GRU+CTC Modellerinin Karşılaştırılması. EJOSAT. 01 Mart 2022;(34):321-7. doi:10.31590/ejosat.1082109

Cited By