Araştırma Makalesi

Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi

Cilt: 14 Sayı: 3 1 Eylül 2024
PDF İndir
EN TR

Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi

Öz

Derin öğrenme alanındaki gelişmeler daha doğru sınıflandırıcıların oluşturulmasına olanak sağlamıştır. Ancak yüksek genelleme yeteneğine sahip derin öğrenme modellerinin oluşturulabilmesi için büyük miktarda etiketli veri kümelerine ihtiyaç duyulmaktadır. Veri artırma bu ihtiyacın karşılanmasında yaygın olarak kullanılan bir yöntemdir. Bu çalışmada konuşmacıların yaş ve cinsiyetlerine göre sınıflandırılmasında farklı veri artırma yöntemlerinin sınıflandırma performansı üzerindeki etkileri araştırılmıştır. Çalışmada yetişkin konuşmacılar erkek ve kadın olarak, çocuklar ise cinsiyet ayrımı yapılmadan tek bir sınıf olarak değerlendirilmiş ve toplamda üç (kadın, erkek ve çocuk) sınıflı bir sınıflandırma gerçekleştirilmiştir. Bu amaç doğrultusunda gürültü ekleme, zaman uzatma ve perde kaydırma olmak üzere üç veri artırma yöntemi farklı kombinasyonlarda kullanılarak yedi farklı model oluşturulmuş ve her birinin performans ölçümleri yapılmıştır. aGender veri kümesinden rastgele seçilen 5760 konuşma verisi ile geliştirilen bu modeller arasında en yüksek performans artışı üç veri artırma yönteminin birlikte kullanıldığı modelle sağlanmıştır. Bu model sınıflandırma doğruluğunu %84.583’den % 87.523’e çıkararak %3’e yakın performans artışı sağlarken veri artırmanın kullanıldığı diğer modellerde de %1 ile %2.3 arasında performans artışı sağlanmıştır.

Anahtar Kelimeler

Kaynakça

  1. Arakawa, R., Takamichi, S., & Saruwatari, H. (2019). Implementation of DNN-based real-time voice conversion and its improvements by audio data augmentation and mask-shaped device. In: Proc. ISCA Workshop Speech Synthesis, (pp. 93–98). Vienna, Austria.
  2. Bhatt, D., Patel, C., Talsania, H., Patel, J., Vaghela, R., Pandya, S., ... & Ghayvat, H. (2021). CNN variants for computer vision: History, architecture, application, challenges and future scope. Electronics, 10(20), 2470.
  3. Bishop, C. M. (1995). Training with noise is equivalent to Tikhonov regularization. Neural Computation, 7(1), 108–116.
  4. Chai, J., Zeng, H., Li, A., & Ngai, E. W. (2021). Deep learning in computer vision: A critical review of emerging techniques and application scenarios. Machine Learning with Applications, 6, 100134.
  5. Gerosa, M., Giuliani, D., & Brugnara, F. (2005). Speaker adaptive acoustic modeling with mixture of adult and children's speech. In Interspeech, (pp. 2193-2196). Lisbon, Portugal.
  6. Dehak, N., Kenny, P.J., Dehak, R., Dumouchel, P., & Ouellet, P. (2011). Front-End Factor Analysis for Speaker Verification. IEEE Trans. Audio Speech Lang, 19, 788–798.
  7. Ertam, F. (2019)An effective gender recognition approach using voice data via deeper LSTM networks. Appl. Acoust., 156, 351–358.
  8. Gupta, A., Harrison, P. J., Wieslander, H., Pielawski, N., Kartasalo, K., Partel, G., ... & Wählby, C. (2019). Deep learning in image cytometry: a review. Cytometry Part A, 95(4), 366-380.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Bilgisayar Yazılımı

Bölüm

Araştırma Makalesi

Erken Görünüm Tarihi

27 Ağustos 2024

Yayımlanma Tarihi

1 Eylül 2024

Gönderilme Tarihi

26 Haziran 2024

Kabul Tarihi

21 Temmuz 2024

Yayımlandığı Sayı

Yıl 2024 Cilt: 14 Sayı: 3

Kaynak Göster

APA
Yücesoy, E. (2024). Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi. Journal of the Institute of Science and Technology, 14(3), 974-987. https://doi.org/10.21597/jist.1505349
AMA
1.Yücesoy E. Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi. Iğdır Üniv. Fen Bil Enst. Der. 2024;14(3):974-987. doi:10.21597/jist.1505349
Chicago
Yücesoy, Ergün. 2024. “Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi”. Journal of the Institute of Science and Technology 14 (3): 974-87. https://doi.org/10.21597/jist.1505349.
EndNote
Yücesoy E (01 Eylül 2024) Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi. Journal of the Institute of Science and Technology 14 3 974–987.
IEEE
[1]E. Yücesoy, “Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi”, Iğdır Üniv. Fen Bil Enst. Der., c. 14, sy 3, ss. 974–987, Eyl. 2024, doi: 10.21597/jist.1505349.
ISNAD
Yücesoy, Ergün. “Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi”. Journal of the Institute of Science and Technology 14/3 (01 Eylül 2024): 974-987. https://doi.org/10.21597/jist.1505349.
JAMA
1.Yücesoy E. Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi. Iğdır Üniv. Fen Bil Enst. Der. 2024;14:974–987.
MLA
Yücesoy, Ergün. “Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi”. Journal of the Institute of Science and Technology, c. 14, sy 3, Eylül 2024, ss. 974-87, doi:10.21597/jist.1505349.
Vancouver
1.Ergün Yücesoy. Konuşmacıları Kadın, Erkek ve Çocuk Olarak Sınıflandırmada Veri Artırmanın Performansa Etkisi. Iğdır Üniv. Fen Bil Enst. Der. 01 Eylül 2024;14(3):974-87. doi:10.21597/jist.1505349