TY - JOUR T1 - Makine Öğrenmesi Yöntemleri Kullanılarak Ses Verilerinden Cinsiyet Tahmin Edilmesi TT - Predicting of the Gender from Audio Data Using Machine Learning Methods AU - Calp, M. Hanefi PY - 2025 DA - April Y2 - 2025 DO - 10.19113/sdufenbed.1590769 JF - Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi JO - J. Nat. Appl. Sci. PB - Süleyman Demirel Üniversitesi WT - DergiPark SN - 1308-6529 SP - 96 EP - 113 VL - 29 IS - 1 LA - tr AB - Makine öğrenmesi, bilgisayar ve robot gibi insan yapımı araçları kullanarak doğal sistemleri taklit etmekte, sınıflandırma ve tahmin yapabilmektedir. Bu yöntem, bilginin bellekte kayıt altına alınması ve örnek veriden öğrenerek bu bilgiden otomatik olarak birtakım çıkarımlar yapabilmesini sağlamaktadır. Bu çalışmada, makine öğrenmesi yöntemleri kullanılarak ses ve konuşma analizi ile kişilerin cinsiyetleri tahmin edilmiştir. Çalışma için gerekli olan veri seti Kaggle açık kaynak veri paylaşım platformundan temin edilmiştir. Bu veri seti, sesi Erkek veya Kadın olarak tanımlamak amacıyla sesin ve konuşmanın akustik özelliklerine göre oluşturulmuştur. Veri setindeki verilerin en doğru şekilde tahmin edilebilmesi için K-En Yakın Komşu (KNN), Karar Ağacı (KA), Naive Bayes (NB) ve Yapay Sinir Ağları (YSA) yöntemlerinden yararlanılmıştır. Yararlanılan tüm bu yöntemlerde “Meanfun, Sd, Q25, IQR, Label” parametreleri temel alınarak süreç ilerletilmiştir. Bununla birlikte, veri seti farklı eğitim-test oranlarında (%75-%25, %80, %20, %70, %30) birçok defa denenerek modeller oluşturulmuş olup sonuçlar test edilmiştir. Daha sonra herbir yöntem oluşturulan modeller üzerinde uygulanarak deneysel çalışmalar yapılmıştır. Modeller hem kendi içerisinde hem de diğer modeller arasında kıyaslanmış ve en iyi performansa sahip model belirlenmiştir. Ayrıca elde edilen bulgular, kolay analiz edilebilmesi amacıyla şekil ve grafikler ile görselleştirilmiştir. Sonuç olarak, en yüksek sınıflandırma başarısı, veri setinin %75 eğitim ve %25 test kümesine bölünerek, %98.96’lık bir oranla YSA modeli ile elde edildiği ortaya çıkmıştır. KW - Ses KW - Cinsiyet KW - Tanıma KW - Tahmin KW - Makine Öğrenmesi N2 - Machine learning uses man-made tools such as computers and robots to imitate natural systems, and make classifications and predictions. This method allows the information to be recorded in memory, learn from sample data, and make some inferences from this information automatically. In this study, the gender of individuals was estimated using machine learning methods through voice and speech analysis. The data set required for the study was obtained from the Kaggle open source data sharing platform. This data set was created according to the acoustic properties of the voice and speech in order to define the voice as Male or Female. In order to estimate the data in the data set in the most accurate way, K-Nearest Neighbor (K-NN), Decision Tree (KA), Naive Bayes (NB), and Artificial Neural Networks (ANN) methods were used. In all these methods used, the process was advanced based on the parameters “Meanfun, Sd, Q25, IQR, Label”. In addition, the data set was tried many times at different training-test ratios (75%-25%, 80%, 20%, 70%, 30%) and models were created and the results were tested. Then, experimental studies were conducted by applying each method on the created models. The models were compared both within themselves and among other models, and the model with the best performance was determined. In addition, the obtained findings were visualized with figures and graphics for easy analysis. As a result, it was revealed that the highest classification success was obtained with the ANN model with a rate of 98.96% by dividing the data set into 75% training and 25% test sets. CR - [1] Pacheco, P. 2011. An Introduction to Parallel Programming. Burlington: Morgan Kaufmann Publishers is an imprint of Elsevier. CR - [2] Alpaydın, E. 2013. Yapay Öğrenme. İstanbul: MIT, BÜTEK. CR - [3] Erdoğan, İ., Güllü, M., & Polat, H. 2022. Makine Öğrenmesi Algoritmaları Ile Uçtan Uca Yazar Tanıma Uygulaması Geliştirme. El-Cezeri, 9(4), 1303-1314. CR - [4] Özbay, F. A., & Özbay, E. 2023. Ses verilerinden cinsiyet tespiti için yeni bir yaklaşım: Optimizasyon yöntemleri ile özellik seçimi. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 38(2), 1179-1192. CR - [5] Özkaynak, E., Sulak, E. E., & Yılmaz, H., 2018. Temel Bileşenler Analizi Kullanılarak Ses Tanıma ile Cinsiyet Tespiti, 20. Akademik Bilişim 2018 Konferansı Bildirileri – Karabük Üniversitesi. CR - [6] Tümen, V. 2022. Sinaptik Etkinlik Fonksiyon Tabanlı Sızdıran Entegre ve Ateşleme Nöron Modelini Kullanarak İnsan Ses Sinyallerinde Cinsiyet Tespiti. Bitlis Eren Üniversitesi Fen Bilimleri Dergisi, 11(2), 469-477. CR - [7] Açıl, T. 2019. Güncel makine öğrenmesi teknikleri ile iris görüntülerinden cinsiyet analizi, Yüksek Lisans Tezi, İskenderun Teknik Üniversitesi/Mühendislik ve Fen Bilimleri Enstitüsü/Elektrik-Elektronik Mühendisliği Anabilim Dalı. CR - [8] Bektaş, M. 2020. Derin öğrenme algoritmaları kullanarak yazar, tür ve cinsiyet tanıma (Master's thesis, Tekirdağ Namık Kemal Üniversitesi). CR - [9] Demirel, Ş., Y. Giray, S. 2019. KA Algoritmaları ve Çocuk İşçiliği Üzerine Bir Uygulama. Social Sciences Research Journal, 8 (4), 52-65. CR - [10] Sebik, N. B., & Bülbül, H. İ. 2018. Veri Madenciliği Modellerinin Akciğer Kanseri Veri Seti Üzerinde Başarilarinin İncelenmesi. Tübav Bilim Dergisi, 11(3), 1-7. CR - [11] Gürsoy, U. T., & Bilgin, Ş. 2016. Banka Müşterilerinin İnternet Bankacılığına İlişkin Yaklaşımlarının Veri Madenciliği Teknikleri ile İncelenmesi. Kafkas Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, 7(14), 421-442. CR - [12] Aydın, M. R. 2019. YSA ile Talep Tahmini: Perakende Sektöründe Bir Uygulama. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 18(35), 43-55. CR - [13] Akkuş, B., & Zontul, M. 2019. Veri madenciliği yöntemleri ile ülkeleri gelişmişlik ölçütlerine göre kümeleme üzerine bir uygulama. AURUM Journal of Engineering Systems and Architecture, 3(1), 51-64. CR - [14] Alabdoo, I. N. F. (2024). Parmak Görüntüleri Üzerinden Kişi Yaş ve Cinsiyet Tahmini Yapılması (Master's thesis, Kırşehir Ahi Evran Üniversitesi-Fen Bilimleri Enstitüsü). CR - [15] Görgün, M. K., Demirok, G. B., & Kutlu, M. (2023). Türkçe sosyal medya mesajlarından kullanıcıların yaş ve cinsiyetini tahmin etme. Niğde Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi, 12(2), 325-333. CR - [16] Yılmaz, N., Seçgin, Y., Demirci, R., & Keskin, N. K. (2024). Gender Prediction From Foramen Magnum Using Machine Learning Algorithms. Celal Bayar Üniversitesi Sağlık Bilimleri Enstitüsü Dergisi, 11(3), 447-451. CR - [17] Kocamış, O. G. (2024). Sakroiliak eklem morfometrisi ve varyasyon tipleriile makine öğrenme teknikleri kullanılarak cinsiyet ve yaş tayini. CR - [18] Temelci, H. (2024). Türk Popülasyonunda Makine ÖğRenme Algoritmaları Kullanılarak MDBT Görüntüleri ÜZerinde Scapula'nın Antropometrik Ölçümleri ile Cinsiyet Tahmini (Doctoral dissertation, Necmettin Erbakan University (Turkey)). CR - [19] Wu, D. 2009. Supplier selection: A hybrid model using DEA, decision tree and neural network. Expert systems with Applications, 36(5), 9105-9112. CR - [20] Zhao-han, S., & Bing Xiang, L. 2005. Research method of customer churn crisis based on decision tree. Journal of Management Sciences in China, 8(2), 20-25. CR - [21] Akpınar, H. 2000. Veri tabanlarında bilgi keşfi ve veri madenciliği. İstanbul Üniversitesi İşletme Fakültesi Dergisi, 29(1), 1-22. CR - [22] Wang, J. 2006. Encyclopedia of Data Warehousing and Mining. Information Science Reference, Volume: 49, ss: 140. CR - [23] Mitchell, T. 1997. “Machine Learning”, McGraw Hill, New York. CR - [24] Kabalcı, E. 2014. YSA. Ders Notları https://ekblc.files.wordpress.com/2013/09/ysa.pdf CR - [25] Ağyar, Z. 2015. YSAnın kullanım alanları ve bir uygulama. Mühendis ve Makine, 56(662), 22-23. CR - [26] Kuncan, F., Kaya, Y., & Kuncan, M. 2019. Sensör işaretlerinden cinsiyet tanıma için yerel ikili örüntüler tabanlı yeni yaklaşımlar. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 34(4), 2173-2186. CR - [27] Babalola, Katende, Bitirim ve Toygar. 2022. Cinsiyet Tanımı için Ses Biyometrisinin Kullanımı, The 14th International Scientific Research Congress - Science and Engineering, 14. Uluslararası Bilimsel Araştırmalar Kongresi Fen ve Mühendislik Bilimleri, UBAK 20-21 Aug. 2022, Proceeding Book Bildiri Tam Metin Kitabı, Editor: Prof. Dr. Bahri Bayram, ASOS Yayınları, Ankara CR - [28] Hızlısoy, S., Çolakoğlu, E., & Arslan, R. S. 2022. Speech-to-Gender Recognition Based on Machine Learning Algorithms. International Journal Of Applied Mathematics Electronics And Computers, 10(4), 84-92. CR - [29] Nabiyev, V., & Yücesoy, E. 2009. VQ Yöntemiyle KonuĢmacı Cinsiyetinin Belirlenmesi. Turkish Journal of Computer and Mathematics Education (TURCOMAT), 1(1). CR - [30] Bakır, Ç. 2016. Alman dili üzerinde konuşmacı cinsiyetinin otomatik olarak belirlenmesi. Academic Platform-Journal of Engineering and Science, 4(2). UR - https://doi.org/10.19113/sdufenbed.1590769 L1 - https://dergipark.org.tr/tr/download/article-file/4391283 ER -