Epilepsi, bireylerin sosyal ilişkilerini, toplumsal uyumunu ve yaşam kalitesini olumsuz yönde etkileyen bir hastalıktır. Bu çalışmada, çok öznitelikli (16 kanal), çok sınıflı (sağlıklı, jeneralize nöbet, fokal nöbet, nöbet aktivitesi) ve dengeli Bangalore Epilepsi veri kümesi üzerinde Lojistik Regresyon, Destek Vektör Makineleri (SVM) ve Aşırı Gradyan Artırma (XGBoost) modelleri; Temel Bileşenler Analizi (PCA) ile ve PCA’sız iki işlem hattında değerlendirilmiştir. Doğruluk-çalışma süresi dengesi bağlamında PCA’nın marjinal katkısı nicel olarak gösterilmiş; sınıflar arası ayrışmanın zorlaştığı durumlarda hangi modelin daha tutarlı ve etkin performans verdiği incelenmiştir. Bulgular, öznitelik korelasyonlarının yüksek olduğu veri kümelerinde XGBoost’un doğruluk, F1, ROC-AUC açısından SVM ve lojistik regresyona kıyasla daha iyi performans sergilediğine işaret etmektedir. Bu durum epileptik nöbet tespitinde PCA’nın her durumda model başarımını artırmadığını; dolayısıyla veri ön-işleme stratejilerinin model tipine göre dikkatle seçilmesi gerektiğini göstermektedir. Elde edilen sonuçlar, hem bilişsel sinyal işleme literatürüne metodolojik bir karşılaştırma katkısı sunmakta hem de model seçimi konusunda uygulayıcılara yol göstermektedir. Standart metrikler ile on katlı çapraz doğrulama ve farklı oranlarda ayrılmış test kümelerine dayalı bir kıyaslama sunması çalışmanın başlıca katkılarındandır.
Epileptik Nöbet Sınıflandırma BEED Veri Kümesi Temel Bileşenler Analizi (PCA) Makine Öğrenmesi Teknikleri.
Çalışmanın tüm süreçlerinin araştırma ve yayın etiğine uygun olduğunu, etik kurallara ve bilimsel atıf gösterme ilkelerine uyduğumu beyan ederim.
Epilepsy is a disorder that adversely affects individuals’ social relationships, societal integration, and overall quality of life. In this study, Logistic Regression, Support Vector Machines (SVM), and XGBoost models were evaluated on the multivariate (16-channel), multiclass (healthy, generalized seizure, focal seizure, seizure activity), and balanced Bangalore EEG Epilepsy Dataset using two processing pipelines—with and without Principal Component Analysis (PCA). The marginal contribution of PCA was quantitatively examined in terms of the accuracy–runtime trade-off, and the consistency and efficiency of each model were analyzed in cases where class separation became more challenging. The findings indicate that, in datasets with high feature correlations, XGBoost outperformed SVM and Logistic Regression in terms of accuracy, F1, and ROC-AUC metrics. This suggests that PCA does not necessarily improve model performance in epileptic seizure detection, emphasizing that data pre-processing strategies should be carefully chosen according to the model type. The results provide a methodological comparison that contributes to the cognitive signal processing literature and offer guidance for practitioners in model selection. Presenting a benchmark based on standard metrics, ten-fold cross-validation, and test sets with different split ratios constitutes one of the main contributions of this study.
Epileptic Seizure Classification BEED Dataset Principal Component Analysis (PCA) Machine Learning
| Birincil Dil | Türkçe |
|---|---|
| Konular | Ekonometrik ve İstatistiksel Yöntemler |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 1 Eylül 2025 |
| Kabul Tarihi | 16 Ekim 2025 |
| Yayımlanma Tarihi | 29 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Sayı: Sayı:71 (EYS'25 Özel Sayısı) |
Bu dergide yer alan çalışmalar Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.