Research Article
BibTex RIS Cite

Analysis of Turkish Audio Recording Data Using Machine Learning Algorithms

Year 2022, Volume: 34 Issue: 1, 19 - 29, 27.03.2022

Abstract

References

  • Duygu - Vikipedi. https://tr.wikipedia.org/wiki/Duygu
  • Yapay Zeka, Makine Öğrenmesi ve Derin Öğrenme Kavramları Arasındaki Fark Nedir? - Evrim Ağacı. https://evrimagaci.org/yapay-zeka-makine-ogrenmesi-ve-derin-ogrenme-kavramlari-arasindaki-fark-nedir
  • S. Tuzcu, Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması.
  • J. Gondohanindijo, E. Noersasongko, Pujiono, Muljono, A. Z. Fanani, Affandy, R. S. Basuki, Comparison Method in Indonesian Emotion Speech Classification, 2019
  • O. Mohamad Nezami, P. Jamshid Lou, M. Karami, ShEMO: a large-scale validated database for Persian speech emotion detection, Lang. Resour. Eval., vol. 53, no. 1, Mar. 2019
  • R. Matin, D. Valles, A Speech Emotion Recognition Solution-based on Support Vector Machine for Children with Autism Spectrum Disorder to Help Identify Human Emotions, 2020
  • S. Dani, A. A. Mande, S. Telang, Z. Shao, Emotion Detection Using Audio Data Samples, Int. J. Adv. Res. Comput. Sci., vol. 10, no. 6, pp. 13–20, Dec. 2019
  • M. G. De Pinto, M. Polignano, P. Lops, G. Semeraro, Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients, IEEE Conference on Evolving and Adaptive Intelligent Systems, May 2020
  • BERT Modeli ile Türkçe Metinlerde Sınıflandırma Yapmak | by Kemal Toprak Uçar | Medium. https://medium.com/@toprakucar/bert-modeli-ile-türkçe-metinlerde-sınıflandırma-yapmak [J.Devlin, M. Chang, K.Lee, K.Toutanova, BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.
  • [Machine Learning — Classification — Naive Bayes — Part 11 | by Ekrem Hatipoglu | Medium. https://medium.com/@ekrem.hatipoglu/machine-learning-classification-naive-bayes
  • 04.04. Naive Bayes Classifier - Erdinç Uzun. https://erdincuzun.com/makine_ogrenmesi/naive-bayes-classifier
  • K. Kirasich, T. Smith, B. Sadler, Random Forest vs Logistic Regression: Binary Classification for Heterogeneous Datasets, 2018
  • L. He, F. Kong, Z. Shen, Multiclass SVM based land cover classification with multisource data,2005
  • A. D. Kulkarni, B. Lowe, Random Forest Algorithm for Land Cover Classification International Journal on Recent and Innovation Trends in Computing and Communication Random Forest Algorithm for Land Cover Classification, 2016
  • Makine Öğrenimi Bölüm-4 (Destek Vektör Makineleri) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-4-destek-vektör-makineleri
  • 04.05. Decision Tree (Karar Ağacı): ID3 Algoritması - Classification (Sınıflama) - Erdinç Uzun. https://erdincuzun.com/makine_ogrenmesi/decision-tree-karar-agaci-id3-algoritmasi-classification-siniflama
  • Makine Öğrenimi Bölüm-5 (Karar Ağaçları) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-5-karar-ağaçları
  • Makine Öğrenimi Bölüm-2 (k-En Yakın Komşuluk) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-2

Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi

Year 2022, Volume: 34 Issue: 1, 19 - 29, 27.03.2022

Abstract

Duygu, insanın ruh halinde içsel ve çevresindeki etkilerle etkileşiminden doğan fiziksel değişimlerdir. Bireyler duygularını, beden dilinin yanı sıra sesli iletişim vasıtalarıyla da diğer bireylere aktarabilirler. Özellikle beden dilinin yetersiz olduğu durum ve zamanlarda bireyler için sesli iletişim önem kazanmaktadır. Çalışmamızda da Türkçe ses kayıtlarını içeren veri seti üzerinde Pyhton programlama dili aracılığıyla öncelikle verilerin duygu etiketlerinin tespiti yapılmış olup, sonrasında literatür çalışmalarında en çok kullanılan beş makine öğrenim algoritmasıyla analizler gerçekleştirilmiştir. Analizler hem Rapid Miner hem de Pyhton programlama dili aracılığıyla gerçekleştirilmiştir. Çalışmada, Pyhton programlama dili aracılığıyla yapılan analizlerde hem CountVectorizer hem de TF-IDF vektörizasyon yöntemleri, Rapid Miner ile yapılan analizlerde TF-IDF vektörizasyon yöntemi kullanılmıştır. Sonuç kısmında ise Pyhton programlama dilinde en iyi doğruluk oranını %70 oranla Naive Bayes makine öğrenim algoritması CountVectorizer yöntemiyle elde etmiştir. Rapid Miner’da ise en iyi doğruluk oranını %69,60 oranla Support Vector Machine makine öğrenim algoritması elde etmiştir. Çalışmamızla beraber ortaya yeni bir Türkçe duygu veri seti çıkmıştır. Çalışmamız ayrıca Türkçe ses kayıtlarından elde edilen verilerin BERT modeli ile duygu tespiti yapılan özgün bir çalışmadır.

References

  • Duygu - Vikipedi. https://tr.wikipedia.org/wiki/Duygu
  • Yapay Zeka, Makine Öğrenmesi ve Derin Öğrenme Kavramları Arasındaki Fark Nedir? - Evrim Ağacı. https://evrimagaci.org/yapay-zeka-makine-ogrenmesi-ve-derin-ogrenme-kavramlari-arasindaki-fark-nedir
  • S. Tuzcu, Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması.
  • J. Gondohanindijo, E. Noersasongko, Pujiono, Muljono, A. Z. Fanani, Affandy, R. S. Basuki, Comparison Method in Indonesian Emotion Speech Classification, 2019
  • O. Mohamad Nezami, P. Jamshid Lou, M. Karami, ShEMO: a large-scale validated database for Persian speech emotion detection, Lang. Resour. Eval., vol. 53, no. 1, Mar. 2019
  • R. Matin, D. Valles, A Speech Emotion Recognition Solution-based on Support Vector Machine for Children with Autism Spectrum Disorder to Help Identify Human Emotions, 2020
  • S. Dani, A. A. Mande, S. Telang, Z. Shao, Emotion Detection Using Audio Data Samples, Int. J. Adv. Res. Comput. Sci., vol. 10, no. 6, pp. 13–20, Dec. 2019
  • M. G. De Pinto, M. Polignano, P. Lops, G. Semeraro, Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients, IEEE Conference on Evolving and Adaptive Intelligent Systems, May 2020
  • BERT Modeli ile Türkçe Metinlerde Sınıflandırma Yapmak | by Kemal Toprak Uçar | Medium. https://medium.com/@toprakucar/bert-modeli-ile-türkçe-metinlerde-sınıflandırma-yapmak [J.Devlin, M. Chang, K.Lee, K.Toutanova, BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.
  • [Machine Learning — Classification — Naive Bayes — Part 11 | by Ekrem Hatipoglu | Medium. https://medium.com/@ekrem.hatipoglu/machine-learning-classification-naive-bayes
  • 04.04. Naive Bayes Classifier - Erdinç Uzun. https://erdincuzun.com/makine_ogrenmesi/naive-bayes-classifier
  • K. Kirasich, T. Smith, B. Sadler, Random Forest vs Logistic Regression: Binary Classification for Heterogeneous Datasets, 2018
  • L. He, F. Kong, Z. Shen, Multiclass SVM based land cover classification with multisource data,2005
  • A. D. Kulkarni, B. Lowe, Random Forest Algorithm for Land Cover Classification International Journal on Recent and Innovation Trends in Computing and Communication Random Forest Algorithm for Land Cover Classification, 2016
  • Makine Öğrenimi Bölüm-4 (Destek Vektör Makineleri) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-4-destek-vektör-makineleri
  • 04.05. Decision Tree (Karar Ağacı): ID3 Algoritması - Classification (Sınıflama) - Erdinç Uzun. https://erdincuzun.com/makine_ogrenmesi/decision-tree-karar-agaci-id3-algoritmasi-classification-siniflama
  • Makine Öğrenimi Bölüm-5 (Karar Ağaçları) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-5-karar-ağaçları
  • Makine Öğrenimi Bölüm-2 (k-En Yakın Komşuluk) | by E. Kaan Ulgen | Medium. https://medium.com/@k.ulgen90/makine-öğrenimi-bölüm-2
There are 18 citations in total.

Details

Primary Language Turkish
Journal Section FBD
Authors

Engin Demir 0000-0002-4546-3581

Abdülkadir Tepecik 0000-0002-3842-7873

Publication Date March 27, 2022
Submission Date September 11, 2021
Published in Issue Year 2022 Volume: 34 Issue: 1

Cite

APA Demir, E., & Tepecik, A. (2022). Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi, 34(1), 19-29.
AMA Demir E, Tepecik A. Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi. March 2022;34(1):19-29.
Chicago Demir, Engin, and Abdülkadir Tepecik. “Türkçe Ses Kayıt Verilerinin CountVectorizer Ve TF-IDFVectorizer Yöntemleri Ile BERT Modelleri Olarak Google Colab Platformunda Ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”. Fırat Üniversitesi Fen Bilimleri Dergisi 34, no. 1 (March 2022): 19-29.
EndNote Demir E, Tepecik A (March 1, 2022) Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi 34 1 19–29.
IEEE E. Demir and A. Tepecik, “Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”, Fırat Üniversitesi Fen Bilimleri Dergisi, vol. 34, no. 1, pp. 19–29, 2022.
ISNAD Demir, Engin - Tepecik, Abdülkadir. “Türkçe Ses Kayıt Verilerinin CountVectorizer Ve TF-IDFVectorizer Yöntemleri Ile BERT Modelleri Olarak Google Colab Platformunda Ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”. Fırat Üniversitesi Fen Bilimleri Dergisi 34/1 (March 2022), 19-29.
JAMA Demir E, Tepecik A. Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi. 2022;34:19–29.
MLA Demir, Engin and Abdülkadir Tepecik. “Türkçe Ses Kayıt Verilerinin CountVectorizer Ve TF-IDFVectorizer Yöntemleri Ile BERT Modelleri Olarak Google Colab Platformunda Ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”. Fırat Üniversitesi Fen Bilimleri Dergisi, vol. 34, no. 1, 2022, pp. 19-29.
Vancouver Demir E, Tepecik A. Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi. 2022;34(1):19-2.