Araştırma Makalesi

Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması

Cilt: 6 Sayı: 1 30 Nisan 2024
PDF İndir
EN TR

Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması

Öz

Bu çalışmada, konuşma işaretlerini sıkıştırmak için derin öğrenme tabanlı oto kodlayıcı ve artık vektör nicemlemesini temel alan sıkıştırma yöntemi önerilmiştir. Önerilen sıkıştırma yönteminde, öncelikle giriş konuşma işaretini daha düşük boyutlu bir uzaya atayan oto kodlayıcı kullanılmakta ve ardından oto kodlayıcı çıkışı, artık vektör nicemlemesi ile daha da sıkıştırılmaktadır. Sıkıştırma yöntemi, birbirine paralel çalışan iki farklı kod çözücü yapısı ve iki kod kitapçığı sayesinde farklı oranlarda sıkıştırma oranı sunmaktadır. Yöntemin başarımı konuşma kalitesini algısal değerlendirme metriği kullanılarak TIMIT veri kümesi ile test edilmiştir. Önerilen konuşma sıkıştırma yöntemi, 1.25 ve 2.5 kbps iletim hızları için sırasıyla 1.665 ve 1.985 konuşma kalitesini algısal değerlendirme skorları elde etmiştir.

Anahtar Kelimeler

Destekleyen Kurum

Bursa Teknik Üniversitesi

Proje Numarası

230D005

Teşekkür

Bu çalışma Bursa Teknik Üniversitesi Bilimsel Araştırma Projeleri birimi tarafından desteklenmiştir. Proje no: 230D005

Kaynakça

  1. P.K. Mongia, and R.K. Sharma, “Estimation and statistical analysis of human voice parameters to investigate the influence of psychological stress and to determine the vocal tract transfer function of an individual,” Journal of Computer Networks and Communications, vol. 2014, no. 17, pp. 1-17, 2014.
  2. T.F. Quatieri, “Discrete-time speech signal processing: principles and practice,” Pearson Education India, 2002.
  3. P. Warkade, and A. Mishra, “Lossless Speech Compression Techniques: A Literature Review,” International Journal of Innovative Research in Computer Science & Technology, vol. 3, pp. 25-32, 2015.
  4. T. Ogunfunmi, and M. Narasimha, “Principles of speech coding.” CRC Press, 2010.
  5. L. Rabiner, and R. Schafer, “Theory and applications of digital speech processing.” Prentice Hall Press, USA, 2010.
  6. D. O'Shaughnessy, “Linear predictive coding”, IEEE potentials, vol. 7, pp. 29-32, 1988
  7. M. Schroeder, and B. Atal, “Code-excited linear prediction (CELP): High-quality speech at very low bit rates”, IEEE International Conference on Acoustics, Speech, and Signal Processing. vol. 10, pp. 937-940, 1985.
  8. T. Unno, T.P. Barnwell, and K. Truong, “An improved mixed excitation linear prediction (MELP) coder,” IEEE International Conference on Acoustics, Speech, and Signal Processing. Proceedings., vol. 1, pp. 245-248, 1999.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Kodlama, Bilgi Teorisi ve Sıkıştırma, Derin Öğrenme

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

27 Nisan 2024

Yayımlanma Tarihi

30 Nisan 2024

Gönderilme Tarihi

14 Mart 2024

Kabul Tarihi

15 Nisan 2024

Yayımlandığı Sayı

Yıl 2024 Cilt: 6 Sayı: 1

Kaynak Göster

APA
Bekiryazıcı, T., Aydemir, G., & Gürkan, H. (2024). Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması. Mühendislik Bilimleri ve Araştırmaları Dergisi, 6(1), 113-124. https://doi.org/10.46387/bjesr.1452937
AMA
1.Bekiryazıcı T, Aydemir G, Gürkan H. Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması. Müh.Bil.ve Araş.Dergisi. 2024;6(1):113-124. doi:10.46387/bjesr.1452937
Chicago
Bekiryazıcı, Tahir, Gürkan Aydemir, ve Hakan Gürkan. 2024. “Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması”. Mühendislik Bilimleri ve Araştırmaları Dergisi 6 (1): 113-24. https://doi.org/10.46387/bjesr.1452937.
EndNote
Bekiryazıcı T, Aydemir G, Gürkan H (01 Nisan 2024) Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması. Mühendislik Bilimleri ve Araştırmaları Dergisi 6 1 113–124.
IEEE
[1]T. Bekiryazıcı, G. Aydemir, ve H. Gürkan, “Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması”, Müh.Bil.ve Araş.Dergisi, c. 6, sy 1, ss. 113–124, Nis. 2024, doi: 10.46387/bjesr.1452937.
ISNAD
Bekiryazıcı, Tahir - Aydemir, Gürkan - Gürkan, Hakan. “Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması”. Mühendislik Bilimleri ve Araştırmaları Dergisi 6/1 (01 Nisan 2024): 113-124. https://doi.org/10.46387/bjesr.1452937.
JAMA
1.Bekiryazıcı T, Aydemir G, Gürkan H. Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması. Müh.Bil.ve Araş.Dergisi. 2024;6:113–124.
MLA
Bekiryazıcı, Tahir, vd. “Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması”. Mühendislik Bilimleri ve Araştırmaları Dergisi, c. 6, sy 1, Nisan 2024, ss. 113-24, doi:10.46387/bjesr.1452937.
Vancouver
1.Tahir Bekiryazıcı, Gürkan Aydemir, Hakan Gürkan. Konuşma İşaretlerinin Derin Evrişimsel Oto Kodlayıcı ve Artık Vektör Nicemleme Tabanlı Sıkıştırılması. Müh.Bil.ve Araş.Dergisi. 01 Nisan 2024;6(1):113-24. doi:10.46387/bjesr.1452937