Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi

M. Hanefi Calp

doi:10.19113/sdufenbed.1590769

TR EN

Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi

Öz

Makine öğrenmesi, bilgisayar ve robot gibi insan yapımı araçları kullanarak doğal sistemleri taklit etmekte, sınıflandırma ve tahmin yapabilmektedir. Bu yöntem, bilginin bellekte kayıt altına alınması ve örnek veriden öğrenerek bu bilgiden otomatik olarak birtakım çıkarımlar yapabilmesini sağlamaktadır. Bu çalışmada, makine öğrenmesi yöntemleri kullanılarak ses ve konuşma analizi ile kişilerin cinsiyetleri tahmin edilmiştir. Çalışma için gerekli olan veri seti Kaggle açık kaynak veri paylaşım platformundan temin edilmiştir. Bu veri seti, sesi Erkek veya Kadın olarak tanımlamak amacıyla sesin ve konuşmanın akustik özelliklerine göre oluşturulmuştur. Veri setindeki verilerin en doğru şekilde tahmin edilebilmesi için K-En Yakın Komşu (KNN), Karar Ağacı (KA), Naive Bayes (NB) ve Yapay Sinir Ağları (YSA) yöntemlerinden yararlanılmıştır. Yararlanılan tüm bu yöntemlerde “Meanfun, Sd, Q25, IQR, Label” parametreleri temel alınarak süreç ilerletilmiştir. Bununla birlikte, veri seti farklı eğitim-test oranlarında (%75-%25, %80, %20, %70, %30) birçok defa denenerek modeller oluşturulmuş olup sonuçlar test edilmiştir. Daha sonra herbir yöntem oluşturulan modeller üzerinde uygulanarak deneysel çalışmalar yapılmıştır. Modeller hem kendi içerisinde hem de diğer modeller arasında kıyaslanmış ve en iyi performansa sahip model belirlenmiştir. Ayrıca elde edilen bulgular, kolay analiz edilebilmesi amacıyla şekil ve grafikler ile görselleştirilmiştir. Sonuç olarak, en yüksek sınıflandırma başarısı, veri setinin %75 eğitim ve %25 test kümesine bölünerek, %98.96’lık bir oranla YSA modeli ile elde edildiği ortaya çıkmıştır.

Anahtar Kelimeler

Predicting of the Gender from Audio Data Using Machine Learning Methods

Öz

Machine learning uses man-made tools such as computers and robots to imitate natural systems, and make classifications and predictions. This method allows the information to be recorded in memory, learn from sample data, and make some inferences from this information automatically. In this study, the gender of individuals was estimated using machine learning methods through voice and speech analysis. The data set required for the study was obtained from the Kaggle open source data sharing platform. This data set was created according to the acoustic properties of the voice and speech in order to define the voice as Male or Female. In order to estimate the data in the data set in the most accurate way, K-Nearest Neighbor (K-NN), Decision Tree (KA), Naive Bayes (NB), and Artificial Neural Networks (ANN) methods were used. In all these methods used, the process was advanced based on the parameters “Meanfun, Sd, Q25, IQR, Label”. In addition, the data set was tried many times at different training-test ratios (75%-25%, 80%, 20%, 70%, 30%) and models were created and the results were tested. Then, experimental studies were conducted by applying each method on the created models. The models were compared both within themselves and among other models, and the model with the best performance was determined. In addition, the obtained findings were visualized with figures and graphics for easy analysis. As a result, it was revealed that the highest classification success was obtained with the ANN model with a rate of 98.96% by dividing the data set into 75% training and 25% test sets.

Anahtar Kelimeler

Kaynakça

[1] Pacheco, P. 2011. An Introduction to Parallel Programming. Burlington: Morgan Kaufmann Publishers is an imprint of Elsevier.
[2] Alpaydın, E. 2013. Yapay Öğrenme. İstanbul: MIT, BÜTEK.
[3] Erdoğan, İ., Güllü, M., & Polat, H. 2022. Makine Öğrenmesi Algoritmaları Ile Uçtan Uca Yazar Tanıma Uygulaması Geliştirme. El-Cezeri, 9(4), 1303-1314.
[4] Özbay, F. A., & Özbay, E. 2023. Ses verilerinden cinsiyet tespiti için yeni bir yaklaşım: Optimizasyon yöntemleri ile özellik seçimi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38(2), 1179-1192.
[5] Özkaynak, E., Sulak, E. E., & Yılmaz, H., 2018. Temel Bileşenler Analizi Kullanılarak Ses Tanıma ile Cinsiyet Tespiti, 20. Akademik Bilişim 2018 Konferansı Bildirileri – Karabük Üniversitesi.
[6] Tümen, V. 2022. Sinaptik Etkinlik Fonksiyon Tabanlı Sızdıran Entegre ve Ateşleme Nöron Modelini Kullanarak İnsan Ses Sinyallerinde Cinsiyet Tespiti. Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, 11(2), 469-477.
[7] Açıl, T. 2019. Güncel makine öğrenmesi teknikleri ile iris görüntülerinden cinsiyet analizi, Yüksek Lisans Tezi, İskenderun Teknik Üniversitesi/Mühendislik ve Fen Bilimleri Enstitüsü/Elektrik-Elektronik Mühendisliği Anabilim Dalı.
[8] Bektaş, M. 2020. Derin öğrenme algoritmaları kullanarak yazar, tür ve cinsiyet tanıma (Master's thesis, Tekirdağ Namık Kemal Üniversitesi).

[9] Demirel, Ş., Y. Giray, S. 2019. KA Algoritmaları ve Çocuk İşçiliği Üzerine Bir Uygulama. Social Sciences Research Journal, 8 (4), 52-65.
[10] Sebik, N. B., & Bülbül, H. İ. 2018. Veri Madenciliği Modellerinin Akciğer Kanseri Veri Seti Üzerinde Başarilarinin İncelenmesi. Tübav Bilim Dergisi, 11(3), 1-7.
[11] Gürsoy, U. T., & Bilgin, Ş. 2016. Banka Müşterilerinin İnternet Bankacılığına İlişkin Yaklaşımlarının Veri Madenciliği Teknikleri ile İncelenmesi. Kafkas Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 7(14), 421-442.
[12] Aydın, M. R. 2019. YSA ile Talep Tahmini: Perakende Sektöründe Bir Uygulama. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 18(35), 43-55.
[13] Akkuş, B., & Zontul, M. 2019. Veri madenciliği yöntemleri ile ülkeleri gelişmişlik ölçütlerine göre kümeleme üzerine bir uygulama. AURUM Journal of Engineering Systems and Architecture, 3(1), 51-64.
[14] Alabdoo, I. N. F. (2024). Parmak Görüntüleri Üzerinden Kişi Yaş ve Cinsiyet Tahmini Yapılması (Master's thesis, Kırşehir Ahi Evran Üniversitesi-Fen Bilimleri Enstitüsü).
[15] Görgün, M. K., Demirok, G. B., & Kutlu, M. (2023). Türkçe sosyal medya mesajlarından kullanıcıların yaş ve cinsiyetini tahmin etme. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, 12(2), 325-333.
[16] Yılmaz, N., Seçgin, Y., Demirci, R., & Keskin, N. K. (2024). Gender Prediction From Foramen Magnum Using Machine Learning Algorithms. Celal Bayar Üniversitesi Sağlık Bilimleri Enstitüsü Dergisi, 11(3), 447-451.
[17] Kocamış, O. G. (2024). Sakroiliak eklem morfometrisi ve varyasyon tipleriile makine öğrenme teknikleri kullanılarak cinsiyet ve yaş tayini.
[18] Temelci, H. (2024). Türk Popülasyonunda Makine ÖğRenme Algoritmaları Kullanılarak MDBT Görüntüleri ÜZerinde Scapula'nın Antropometrik Ölçümleri ile Cinsiyet Tahmini (Doctoral dissertation, Necmettin Erbakan University (Turkey)).
[19] Wu, D. 2009. Supplier selection: A hybrid model using DEA, decision tree and neural network. Expert systems with Applications, 36(5), 9105-9112.
[20] Zhao-han, S., & Bing Xiang, L. 2005. Research method of customer churn crisis based on decision tree. Journal of Management Sciences in China, 8(2), 20-25.
[21] Akpınar, H. 2000. Veri tabanlarında bilgi keşfi ve veri madenciliği. İstanbul Üniversitesi İşletme Fakültesi Dergisi, 29(1), 1-22.
[22] Wang, J. 2006. Encyclopedia of Data Warehousing and Mining. Information Science Reference, Volume: 49, ss: 140.
[23] Mitchell, T. 1997. “Machine Learning”, McGraw Hill, New York.
[24] Kabalcı, E. 2014. YSA. Ders Notları https://ekblc.files.wordpress.com/2013/09/ysa.pdf
[25] Ağyar, Z. 2015. YSAnın kullanım alanları ve bir uygulama. Mühendis ve Makine, 56(662), 22-23.
[26] Kuncan, F., Kaya, Y., & Kuncan, M. 2019. Sensör işaretlerinden cinsiyet tanıma için yerel ikili örüntüler tabanlı yeni yaklaşımlar. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 34(4), 2173-2186.
[27] Babalola, Katende, Bitirim ve Toygar. 2022. Cinsiyet Tanımı için Ses Biyometrisinin Kullanımı, The 14th International Scientific Research Congress - Science and Engineering, 14. Uluslararası Bilimsel Araştırmalar Kongresi Fen ve Mühendislik Bilimleri, UBAK 20-21 Aug. 2022, Proceeding Book Bildiri Tam Metin Kitabı, Editor: Prof. Dr. Bahri Bayram, ASOS Yayınları, Ankara
[28] Hızlısoy, S., Çolakoğlu, E., & Arslan, R. S. 2022. Speech-to-Gender Recognition Based on Machine Learning Algorithms. International Journal Of Applied Mathematics Electronics And Computers, 10(4), 84-92.
[29] Nabiyev, V., & Yücesoy, E. 2009. VQ Yöntemiyle KonuĢmacı Cinsiyetinin Belirlenmesi. Turkish Journal of Computer and Mathematics Education (TURCOMAT), 1(1).
[30] Bakır, Ç. 2016. Alman dili üzerinde konuşmacı cinsiyetinin otomatik olarak belirlenmesi. Academic Platform-Journal of Engineering and Science, 4(2).

Ayrıntılar

Birincil Dil

Türkçe

Konular

Kuantum Mühendislik Sistemleri (Bilgisayar ve İletişim Dahil)

Bölüm

Araştırma Makalesi

Yazarlar

M. Hanefi Calp ^*
0000-0001-7991-438X
Türkiye

Yayımlanma Tarihi

25 Nisan 2025

Gönderilme Tarihi

25 Kasım 2024

Kabul Tarihi

7 Mart 2025

Yayımlandığı Sayı

Yıl 2025 Cilt: 29 Sayı: 1

DOI

https://doi.org/10.19113/sdufenbed.1590769

IZ

https://izlik.org/JA87KF45AU

Kaynak Göster

RIS / Bibtex

APA

Calp, M. H. (2025). Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 29(1), 96-113. https://doi.org/10.19113/sdufenbed.1590769

AMA

1.Calp MH. Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi. Süleyman Demirel Üniv. Fen Bilim. Enst. Derg. 2025;29(1):96-113. doi:10.19113/sdufenbed.1590769

Chicago

Calp, M. Hanefi. 2025. “Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi”. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi 29 (1): 96-113. https://doi.org/10.19113/sdufenbed.1590769.

EndNote

Calp MH (01 Nisan 2025) Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi 29 1 96–113.

IEEE

[1]M. H. Calp, “Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi”, Süleyman Demirel Üniv. Fen Bilim. Enst. Derg., c. 29, sy 1, ss. 96–113, Nis. 2025, doi: 10.19113/sdufenbed.1590769.

ISNAD

Calp, M. Hanefi. “Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi”. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi 29/1 (01 Nisan 2025): 96-113. https://doi.org/10.19113/sdufenbed.1590769.

JAMA

1.Calp MH. Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi. Süleyman Demirel Üniv. Fen Bilim. Enst. Derg. 2025;29:96–113.

MLA

Calp, M. Hanefi. “Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi”. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, c. 29, sy 1, Nisan 2025, ss. 96-113, doi:10.19113/sdufenbed.1590769.

Vancouver

1.M. Hanefi Calp. Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi. Süleyman Demirel Üniv. Fen Bilim. Enst. Derg. 01 Nisan 2025;29(1):96-113. doi:10.19113/sdufenbed.1590769