Öz: Türkçe sesli komutların doğru bir şekilde sınıflandırılması, sesle kontrol edilen teknolojilerin gelişimi ve ana dil bağlamında insan-bilgisayar etkileşiminin sorunsuz bir şekilde gerçekleşmesi açısından kritik öneme sahiptir. Bu çalışmada, konuşma sinyallerinin zamansal, spektral ve zaman-frekans temelli özelliklerini yakalayarak tanıma doğruluğunu artırmayı amaçlayan çeşitli özellik çıkarım modelleri sistematik olarak değerlendirilmiştir. Altı farklı özellik vektörü modeli geliştirilmiş; son modelde ise Bilgi Kazancı tabanlı özellik seçimi ile Doğrusal Öngörümleme Kodlama kullanılarak elde edilen formant frekansları entegre edilerek kapsamlı ve ayrıştırıcı bir temsil elde edilmiştir. Sınıflandırma süreci, yaygın olarak kullanılan altı algoritma ile gerçekleştirilmiştir: Rastgele Orman, k-En Yakın Komşu, Çok Katmanlı Algılayıcı, Lojistik Model Ağacı, Destek Vektör Makineleri ve Rastgele Orman, Çok Katmanlı Algılayıcı ve Lojistik Model Ağacı yöntemlerini birleştiren bir topluluk oylama yöntemi. Topluluk oylama sınıflandırıcısı, %93,94 doğruluk oranı ile en yüksek performansı sergileyerek bireysel sınıflayıcıları ve temel modelleri anlamlı şekilde geride bırakmıştır. Bu çalışma, Türkçe sesli komut tanıma uygulamalarına yönelik sağlam, açıklanabilir ve yüksek performanslı bir özellik çerçevesi sunarak literatüre önemli bir katkı sağlamaktadır. Spektral, zamansal ve artikülatuvar özelliklerin entegrasyonu, sesli komutların daha başarılı bir şekilde ayrıştırılmasını mümkün kılmakta ve Türkçe dilindeki sesli kontrol sistemlerinin gelecekteki uygulamaları için değerli çıkarımlar sunmaktadır.
Türkçe sesli komut tanıma Özellik çıkarımı Topluluk öğrenmesi Bilgi kazancı Çapraz korelasyon
Accurate classification of Turkish voice commands is essential for advancing voice-controlled technologies and enabling seamless human-computer interaction in native language contexts. This study systematically evaluates multiple feature extraction models capturing temporal, spectral, and time-frequency characteristics of speech signals to enhance recognition accuracy. Six feature vector models were developed, with the final model integrating Information Gain-based feature selection and Linear Predictive Coding-derived formant frequencies to create a comprehensive and discriminative representation. Classification was performed using six widely adopted algorithms: Random Forest, k-Nearest Neighbors, Multilayer Perceptron, Logistic Model Tree, Support Vector Machine, and an Ensemble voting method combining Random Forest, Multilayer Perceptron, and Logistic Model Tree. The Ensemble voting classifier demonstrated superior performance, achieving an accuracy of 93.94%, significantly outperforming individual classifiers and baseline models. This study contributes to the literature by presenting a robust, explainable, and high-performing feature framework tailored for Turkish voice command recognition. The integration of spectral, temporal, and articulatory features enables improved discrimination of speech commands, offering valuable insights for future voice-activated applications in Turkish language environments.
Turkish voice command recognition Feature extraction of speech Ensemble learning Information gain Cross-correlation
| Primary Language | English |
|---|---|
| Subjects | Speech Recognition |
| Journal Section | Research Article |
| Authors | |
| Submission Date | July 29, 2025 |
| Acceptance Date | December 22, 2025 |
| Publication Date | April 24, 2026 |
| DOI | https://doi.org/10.19113/sdufenbed.1753641 |
| IZ | https://izlik.org/JA93NA43GK |
| Published in Issue | Year 2026 Volume: 30 Issue: 1 |
e-ISSN :1308-6529
Linking ISSN (ISSN-L): 1300-7688
All published articles in the journal can be accessed free of charge and are open access under the Creative Commons CC BY-NC (Attribution-NonCommercial) license. All authors and other journal users are deemed to have accepted this situation. Click here to access detailed information about the CC BY-NC license.