This study comprehensively investigates the impact of various data scaling techniques on the performance of machine learning models for Ethereum (ETH) price prediction. The analysis evaluates traditional scaling methods MinMaxScaler, StandardScaler, RobustScaler, Quantile Transformer as well as a custom volatility-sensitive method called VolatilityScaler, in conjunction with five model architectures: Support Vector Machines (SVM), K-Nearest Neighbors (KNN), Artificial Neural Networks (ANN), Long Short-Term Memory (LSTM), and Convolutional Neural Networks (CNN). Hourly ETH price data obtained from Binance API between 2018 and 2025 was used, and the dataset was enriched with technical indicators and preprocessed using the Polars library for efficient memory usage. The results show that data scaling affects not only error metrics Mean Squared Error (MSE) and Mean Absolute Error (MAE) but also the explained variance (R²) of each model. Among the findings, MinMaxScaler achieved the lowest error in SVM and KNN models, while Quantile Transformer yielded the highest explanatory power (R² = 0.9320) in CNN models. For LSTM, MinMaxScaler produced one of the best performances, with a test MSE as low as 0.0005. Although VolatilityScaler achieved competitive results in certain models, it demonstrated limited generalization capacity overall. These findings highlight that, especially in volatile markets like cryptocurrencies, data scaling is not merely a preprocessing step but a critical factor in model performance. This study contributes to the literature by offering a systematic model–scaler interaction analysis and introducing a novel scaling method tailored for financial time series with high volatility.
Bu çalışma, Ethereum (ETH) fiyat tahmininde farklı veri ölçekleme yöntemlerinin makine öğrenmesi modelleri üzerindeki etkisini kapsamlı şekilde incelemektedir. Çalışmada, geleneksel yöntemler olan MinMaxScaler, StandardScaler, RobustScaler, Quantile Transformer'ın yanı sıra volatiliteye duyarlı özel bir ölçekleyici olan VolatilityScaler kullanılmış ve bu ölçekleyiciler, SVM, KNN, ANN, LSTM ve CNN modelleriyle sistematik olarak test edilmiştir. 2018–2025 yılları arasında Binance API üzerinden elde edilen saatlik ETH fiyat verileri kullanılmış, veri seti teknik göstergelerle zenginleştirilmiş ve Polars kütüphanesi ile ön işleme tabi tutulmuştur. Çalışmada, ölçekleme yöntemlerinin yalnızca model hata oranlarını (Ortalama Kare Hata – MSE, Ortalama Mutlak Hata – MAE) değil, aynı zamanda modelin açıklayıcılığını (R²) doğrudan etkilediği gözlemlenmiştir. Elde edilen bulgulara göre; MinMaxScaler, Destek Vektör Regresyonu (Support Vector Regression, SVR) ve K-En Yakın Komşu (K-Nearest Neighbors, KNN) modellerinde en düşük hata oranlarını sağlamış; Çeyrek Dönüşüm Ölçekleyici (Quantile Transformer) ise Konvolüsyonel Sinir Ağı (Convolutional Neural Network, CNN) modelinde en yüksek açıklayıcılığa ulaşmıştır (R² = 0.9320). Uzun-Kısa Süreli Bellek (Long Short-Term Memory, LSTM) modellerinde ise MinMaxScaler ile test MSE değeri 0.0005’e kadar düşmüş ve yüksek doğruluk sağlanmıştır. VolatilityScaler yöntemi, bazı modellerde başarılı sonuçlar üretmiş olsa da genelleme performansı açısından sınırlı kalmıştır. Bu sonuçlar, kripto para piyasası gibi yüksek volatiliteye sahip alanlarda ölçekleme stratejisinin yalnızca ön işleme değil, aynı zamanda model başarısı üzerinde belirleyici bir faktör olduğunu ortaya koymaktadır. Çalışma, özellikle ölçekleyici-model etkileşimini bütüncül biçimde ele alması ve yeni bir ölçekleme yöntemi sunması açısından literatüre özgün katkı sağlamaktadır.
| Primary Language | Turkish |
|---|---|
| Subjects | Time-Series Analysis, International Finance |
| Journal Section | Research Article |
| Authors | |
| Publication Date | November 30, 2025 |
| Submission Date | April 26, 2025 |
| Acceptance Date | July 25, 2025 |
| Published in Issue | Year 2025 Volume: 10 Issue: 2 |