In parallel with population growth, the demand for electrical energy continues to rise. As traditional energy sources have proved insufficient to meet this demand, attention has shifted to environmentally friendly renewable energy sources, among which solar energy stands out. Electricity generation from solar energy is achieved via photovoltaic (PV) systems. Accurately predicting generated power using machine learning (ML) methods with low error supports effective and efficient electricity planning. This study aims to predict solar energy power using ML methods—Gradient Boosting Regressor (GBR), Decision Tree Regressor (DTR), Random Forest Regressor (RFR), and AdaBoost Regressor (AR). For this purpose, the “Solar energy power generation” dataset from Kaggle was utilized. The dataset includes meteorological variables such as temperature, humidity, and radiation, consisting of 21 variables and 4,212 measurements. The Relief feature selection method was used to identify the most informative independent variables for predicting solar energy power. Seventy percent of the data was used for training and the remainder for testing. Model performance was examined with respect to the number of variables. To compare methods, we employed MSE, RMSE, MAE, R2, and training time, and applied cross-validation to enhance model performance. The results indicate that AR achieved superior predictive performance, yielding lower errors (MSE = 0.111, RMSE = 0.333, MAE = 0.145) than the other methods. In contrast, RFR was found to be better in terms of both speed (training time = 2.896) and explained variance (R2=0.926). Additionally, except for DTR, all evaluated techniques exhibited improved performance as the number of variables increased.
Machine Learning Predictive Models Number of Variables Regression Solar Energy Power Generation
Bu çalışmada, makine öğrenme yöntemlerinden Gradient Boosting Regressor (GBR), Decision Tree Regressor (DTR), Random Forest Regressor (RFR) ve Adaboost Regressor (AR) kullanılarak solar enerji gücünü tahminlemek amaçlanmaktadır. Bu amaçla, Kaggle veri tabanında yer alan “Solar energy power generation dataset” kullanılmıştır. Veri seti 21 değişken 4212 adet ölçümden oluşmaktadır. Çalışmada Relief özellik seçim yöntemi kullanılarak en önemli görülen 4 bağımsız değişken güneş enerji gücünü tahminlemek amacıyla kullanılmıştır. Verilerin %70’i eğitim geriye kalanları test verisi olarak ayrılmıştır. Değişken sayılarına göre yöntemlerin performansı incelenmiştir. Yöntemlerin performanslarını karşılaştırmak amacıyla MSE, RMSE, MAE, R2 ve eğitim zamanı ölçülerinden yararlanılmıştır. Daha iyi model performans elde edebilmek için çapraz doğrulama yöntemi kullanılmıştır. Analiz sonuçlarına göre GBR yönteminin diğer yöntemlere nazaran daha düşük hatalar ile daha başarılı tahminleme performansı gösterdiği belirlenmiştir. Diğer taraftan; hız ve R2 ölçüsü açısından ise RFR yönteminin daha iyi olduğu görülmektedir. Çalışmada DT yönteminin dışındaki tüm yöntemlerde, değişken sayısı arttıkça yöntemlerin daha iyi performans gösterdiği belirlenmiştir.
MAkine öğrenme Tahmin modelleri Değişken sayısı Regresyon Güneş enerjisi
| Birincil Dil | İngilizce |
|---|---|
| Konular | Yazılım Mühendisliği (Diğer) |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 30 Mayıs 2025 |
| Kabul Tarihi | 22 Ekim 2025 |
| Yayımlanma Tarihi | 29 Ocak 2026 |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 15 Sayı: 2 |