Bu çalışma, Apple (AAPL) için günlük Al/Tut/Sat işlem sinyallerini tahmin eden pratik bir makine öğrenmesi hattını test etmekte ve “iyi sınıflandırma” başarısının, işlem maliyetleri eklendiğinde iyi bir ekonomik performansa dönüşüp dönüşmediğini incelemektedir. Veri seti, senkronize edilmiş günlük piyasa serileri ile AAPL’ye ait teknik göstergelerden oluşturulmaktadır. Hedef sinyal, MACD’nin sinyal çizgisiyle karşılaştırılması ve RSI filtresi kullanan şeffaf bir kuralla üretildiğinden, problem denetimli bir üç sınıflı sınıflandırma problemine dönüşmektedir. Çalışmada dört ağaç tabanlı topluluk modeli karşılaştırılmaktadır: Random Forest, LightGBM, XGBoost ve AdaBoost. Sonuçların ad hoc parametre seçimlerine duyarlı olmaması için her model sistematik bir arama prosedürüyle ayarlanmaktadır. Ham etiketlerde ciddi sınıf dengesizliği bulunduğundan eğitim aşamasında SMOTE uygulanmakta; ancak tüm performans ve ekonomik testler, gerçekçi değerlendirme için orijinal zaman sıralı test döneminde yürütülmektedir. Bulgular, modeller arasında belirgin bir sıralama ortaya koymaktadır. XGBoost en yüksek sınıflandırma kalitesini sunmaktadır (Doğruluk 0.974, Kesinlik 0.975, Duyarlılık 0.974, F1 0.974). LightGBM ve Random Forest çok yakın düzeylerde onu izlemektedir. AdaBoost ise belirgin biçimde daha zayıf kalmaktadır (Doğruluk 0.668, F1 0.536); ayrıca kesinliği nispeten yüksek görünse de (0.779) sınıflar arasında dengeli bir performans sergileyememektedir. Karışıklık matrisi sonuçları bu tabloyu desteklemekte; güçlü modellerin Al ve Sat sınıflarını neredeyse hatasız ayırdığı, kalan hataların büyük ölçüde Tut sınıfında yoğunlaştığı görülmektedir. Buna karşılık AdaBoost’un Tut sınıfını neredeyse hiç yakalayamadığı ve birçok Tut gününü Al/Sat olarak etiketlediği anlaşılmaktadır. Ekonomik geriye dönük test sonuçları da aynı örüntüyü doğrulamaktadır. Gerçekçi işlem maliyetleri ve başlangıç sermayesi altında, model tahminleriyle işlem yapmak XGBoost için +%49.1, LightGBM için +%46.1 ve Random Forest için +%44.9 getiri üretmektedir. AdaBoost ise zarar yazmaktadır (−%11.3) ve daha olumsuz bir risk profili sergilemektedir (Sharpe −0.10, maksimum düşüş %29.0). Ayrıca daha fazla işlem ürettiğinden (yaklaşık 68 işlem) toplam maliyetleri de daha yüksek gerçekleşmektedir. Genel olarak, bu sinyal tasarımı altında modern gradient boosting tabanlı toplulukların hem istatistiksel olarak daha güçlü hem de ekonomik açıdan daha inandırıcı sonuçlar ürettiği değerlendirilmektedir.
Makine Öğrenmesi Alım–Satım Sinyali Sınıflandırması Teknik Göstergeler Algoritmik Alım–Satım Bayesyen Hiperparametre Optimizasyonu
This study tests a practical machine-learning pipeline to predict daily Buy/Hold/Sell trading signals for Apple (AAPL) and to assess whether “good classification” also yields good trading returns after costs. The dataset is built from synchronized daily market series and AAPL-based technical indicators. The target signal is generated by a transparent rule using MACD relative to its signal line and an RSI filter, so the task is a supervised three-class classification problem. Four tree-based ensemble models are compared: Random Forest, LightGBM, XGBoost, and AdaBoost. To avoid fragile, hand-picked settings, each model is tuned with a systematic search procedure. Because the raw labels are strongly imbalanced, SMOTE is applied for training, while all performance and economic tests are run on the original time-ordered test period to keep the evaluation realistic. The results show a clear ranking. XGBoost delivers the best overall classification quality (Accuracy 0.974, Precision 0.975, Recall 0.974, F1 0.974). LightGBM and Random Forest follow at similarly high levels, while AdaBoost is much weaker (Accuracy 0.668, F1 0.536) despite relatively higher precision (0.779), meaning its predictions are not well balanced across classes. Confusion-matrix evidence supports this: the strong models classify Buy and Sell almost perfectly, and most remaining errors come from the Hold class. AdaBoost, however, fails to detect Hold and instead generates many Buy/Sell signals on Hold days. Economic backtests confirm the same story under realistic transaction costs and initial capital. Trading on predicted signals yields +49.1% for XGBoost, +46.1% for LightGBM, and +44.9% for Random Forest. AdaBoost loses money (−11.3%), with worse risk outcomes (Sharpe −0.10, max drawdown 29.0%) and heavier trading (about 68 trades, higher total costs). Overall, modern gradient-boosting ensembles are both statistically strong and economically more credible for this signal design.
Machine Learning Trading Signal Classification Technical Indicators Algorithmic Trading Bayesian Hyperparameter Optimization
| Birincil Dil | İngilizce |
|---|---|
| Konular | Finansal Ekonomi |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 27 Mart 2025 |
| Kabul Tarihi | 18 Ocak 2026 |
| Yayımlanma Tarihi | 24 Ocak 2026 |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 24 Sayı: 59 |