Makine öğrenmesi, bilgisayar ve robot gibi insan yapımı araçları kullanarak doğal sistemleri taklit etmekte, sınıflandırma ve tahmin yapabilmektedir. Bu yöntem, bilginin bellekte kayıt altına alınması ve örnek veriden öğrenerek bu bilgiden otomatik olarak birtakım çıkarımlar yapabilmesini sağlamaktadır. Bu çalışmada, makine öğrenmesi yöntemleri kullanılarak ses ve konuşma analizi ile kişilerin cinsiyetleri tahmin edilmiştir. Çalışma için gerekli olan veri seti Kaggle açık kaynak veri paylaşım platformundan temin edilmiştir. Bu veri seti, sesi Erkek veya Kadın olarak tanımlamak amacıyla sesin ve konuşmanın akustik özelliklerine göre oluşturulmuştur. Veri setindeki verilerin en doğru şekilde tahmin edilebilmesi için K-En Yakın Komşu (KNN), Karar Ağacı (KA), Naive Bayes (NB) ve Yapay Sinir Ağları (YSA) yöntemlerinden yararlanılmıştır. Yararlanılan tüm bu yöntemlerde “Meanfun, Sd, Q25, IQR, Label” parametreleri temel alınarak süreç ilerletilmiştir. Bununla birlikte, veri seti farklı eğitim-test oranlarında (%75-%25, %80, %20, %70, %30) birçok defa denenerek modeller oluşturulmuş olup sonuçlar test edilmiştir. Daha sonra herbir yöntem oluşturulan modeller üzerinde uygulanarak deneysel çalışmalar yapılmıştır. Modeller hem kendi içerisinde hem de diğer modeller arasında kıyaslanmış ve en iyi performansa sahip model belirlenmiştir. Ayrıca elde edilen bulgular, kolay analiz edilebilmesi amacıyla şekil ve grafikler ile görselleştirilmiştir. Sonuç olarak, en yüksek sınıflandırma başarısı, veri setinin %75 eğitim ve %25 test kümesine bölünerek, %98.96’lık bir oranla YSA modeli ile elde edildiği ortaya çıkmıştır.
Machine learning uses man-made tools such as computers and robots to imitate natural systems, and make classifications and predictions. This method allows the information to be recorded in memory, learn from sample data, and make some inferences from this information automatically. In this study, the gender of individuals was estimated using machine learning methods through voice and speech analysis. The data set required for the study was obtained from the Kaggle open source data sharing platform. This data set was created according to the acoustic properties of the voice and speech in order to define the voice as Male or Female. In order to estimate the data in the data set in the most accurate way, K-Nearest Neighbor (K-NN), Decision Tree (KA), Naive Bayes (NB), and Artificial Neural Networks (ANN) methods were used. In all these methods used, the process was advanced based on the parameters “Meanfun, Sd, Q25, IQR, Label”. In addition, the data set was tried many times at different training-test ratios (75%-25%, 80%, 20%, 70%, 30%) and models were created and the results were tested. Then, experimental studies were conducted by applying each method on the created models. The models were compared both within themselves and among other models, and the model with the best performance was determined. In addition, the obtained findings were visualized with figures and graphics for easy analysis. As a result, it was revealed that the highest classification success was obtained with the ANN model with a rate of 98.96% by dividing the data set into 75% training and 25% test sets.
| Birincil Dil | Türkçe |
|---|---|
| Konular | Kuantum Mühendislik Sistemleri (Bilgisayar ve İletişim Dahil) |
| Bölüm | Makaleler |
| Yazarlar | |
| Yayımlanma Tarihi | 25 Nisan 2025 |
| Gönderilme Tarihi | 25 Kasım 2024 |
| Kabul Tarihi | 7 Mart 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 29 Sayı: 1 |
e-ISSN :1308-6529
Linking ISSN (ISSN-L): 1300-7688
Dergide yayımlanan tüm makalelere ücretiz olarak erişilebilinir ve Creative Commons CC BY-NC Atıf-GayriTicari lisansı ile açık erişime sunulur. Tüm yazarlar ve diğer dergi kullanıcıları bu durumu kabul etmiş sayılırlar. CC BY-NC lisansı hakkında detaylı bilgiye erişmek için tıklayınız.