Araştırma Makalesi

Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi

Cilt: 34 Sayı: 1 27 Mart 2022
PDF İndir
EN TR

Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi

Öz

Duygu, insanın ruh halinde içsel ve çevresindeki etkilerle etkileşiminden doğan fiziksel değişimlerdir. Bireyler duygularını, beden dilinin yanı sıra sesli iletişim vasıtalarıyla da diğer bireylere aktarabilirler. Özellikle beden dilinin yetersiz olduğu durum ve zamanlarda bireyler için sesli iletişim önem kazanmaktadır. Çalışmamızda da Türkçe ses kayıtlarını içeren veri seti üzerinde Pyhton programlama dili aracılığıyla öncelikle verilerin duygu etiketlerinin tespiti yapılmış olup, sonrasında literatür çalışmalarında en çok kullanılan beş makine öğrenim algoritmasıyla analizler gerçekleştirilmiştir. Analizler hem Rapid Miner hem de Pyhton programlama dili aracılığıyla gerçekleştirilmiştir. Çalışmada, Pyhton programlama dili aracılığıyla yapılan analizlerde hem CountVectorizer hem de TF-IDF vektörizasyon yöntemleri, Rapid Miner ile yapılan analizlerde TF-IDF vektörizasyon yöntemi kullanılmıştır. Sonuç kısmında ise Pyhton programlama dilinde en iyi doğruluk oranını %70 oranla Naive Bayes makine öğrenim algoritması CountVectorizer yöntemiyle elde etmiştir. Rapid Miner’da ise en iyi doğruluk oranını %69,60 oranla Support Vector Machine makine öğrenim algoritması elde etmiştir. Çalışmamızla beraber ortaya yeni bir Türkçe duygu veri seti çıkmıştır. Çalışmamız ayrıca Türkçe ses kayıtlarından elde edilen verilerin BERT modeli ile duygu tespiti yapılan özgün bir çalışmadır.

Anahtar Kelimeler

Kaynakça

  1. Duygu - Vikipedi. https://tr.wikipedia.org/wiki/Duygu
  2. Yapay Zeka, Makine Öğrenmesi ve Derin Öğrenme Kavramları Arasındaki Fark Nedir? - Evrim Ağacı. https://evrimagaci.org/yapay-zeka-makine-ogrenmesi-ve-derin-ogrenme-kavramlari-arasindaki-fark-nedir
  3. S. Tuzcu, Çevrimiçi Kullanıcı Yorumlarının Duygu Analizi ile Sınıflandırılması.
  4. J. Gondohanindijo, E. Noersasongko, Pujiono, Muljono, A. Z. Fanani, Affandy, R. S. Basuki, Comparison Method in Indonesian Emotion Speech Classification, 2019
  5. O. Mohamad Nezami, P. Jamshid Lou, M. Karami, ShEMO: a large-scale validated database for Persian speech emotion detection, Lang. Resour. Eval., vol. 53, no. 1, Mar. 2019
  6. R. Matin, D. Valles, A Speech Emotion Recognition Solution-based on Support Vector Machine for Children with Autism Spectrum Disorder to Help Identify Human Emotions, 2020
  7. S. Dani, A. A. Mande, S. Telang, Z. Shao, Emotion Detection Using Audio Data Samples, Int. J. Adv. Res. Comput. Sci., vol. 10, no. 6, pp. 13–20, Dec. 2019
  8. M. G. De Pinto, M. Polignano, P. Lops, G. Semeraro, Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients, IEEE Conference on Evolving and Adaptive Intelligent Systems, May 2020

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

27 Mart 2022

Gönderilme Tarihi

11 Eylül 2021

Kabul Tarihi

1 Ocak 2022

Yayımlandığı Sayı

Yıl 2022 Cilt: 34 Sayı: 1

Kaynak Göster

APA
Demir, E., & Tepecik, A. (2022). Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi, 34(1), 19-29. https://izlik.org/JA92FB72WE
AMA
1.Demir E, Tepecik A. Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi. 2022;34(1):19-29. https://izlik.org/JA92FB72WE
Chicago
Demir, Engin, ve Abdülkadir Tepecik. 2022. “Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”. Fırat Üniversitesi Fen Bilimleri Dergisi 34 (1): 19-29. https://izlik.org/JA92FB72WE.
EndNote
Demir E, Tepecik A (01 Mart 2022) Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi 34 1 19–29.
IEEE
[1]E. Demir ve A. Tepecik, “Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”, Fırat Üniversitesi Fen Bilimleri Dergisi, c. 34, sy 1, ss. 19–29, Mar. 2022, [çevrimiçi]. Erişim adresi: https://izlik.org/JA92FB72WE
ISNAD
Demir, Engin - Tepecik, Abdülkadir. “Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”. Fırat Üniversitesi Fen Bilimleri Dergisi 34/1 (01 Mart 2022): 19-29. https://izlik.org/JA92FB72WE.
JAMA
1.Demir E, Tepecik A. Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi. 2022;34:19–29.
MLA
Demir, Engin, ve Abdülkadir Tepecik. “Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi”. Fırat Üniversitesi Fen Bilimleri Dergisi, c. 34, sy 1, Mart 2022, ss. 19-29, https://izlik.org/JA92FB72WE.
Vancouver
1.Engin Demir, Abdülkadir Tepecik. Türkçe Ses Kayıt Verilerinin CountVectorizer ve TF-IDFVectorizer Yöntemleri ile BERT Modelleri Olarak Google Colab Platformunda ve RapidMiner’da Makine Öğrenmesi Algoritmalarıyla Analizi. Fırat Üniversitesi Fen Bilimleri Dergisi [Internet]. 01 Mart 2022;34(1):19-2. Erişim adresi: https://izlik.org/JA92FB72WE