In parallel with population growth, the demand for electrical energy continues to rise. As traditional energy sources have proved insufficient to meet this demand, attention has shifted to environmentally friendly renewable energy sources, among which solar energy stands out. Electricity generation from solar energy is achieved via photovoltaic (PV) systems. Accurately predicting generated power using machine learning (ML) methods with low error supports effective and efficient electricity planning. This study aims to predict solar energy power using ML methods—Gradient Boosting Regressor (GBR), Decision Tree Regressor (DTR), Random Forest Regressor (RFR), and AdaBoost Regressor (AR). For this purpose, the “Solar energy power generation” dataset from Kaggle was utilized. The dataset includes meteorological variables such as temperature, humidity, and radiation, consisting of 21 variables and 4,212 measurements. The Relief feature selection method was used to identify the most informative independent variables for predicting solar energy power. Seventy percent of the data was used for training and the remainder for testing. Model performance was examined with respect to the number of variables. To compare methods, we employed MSE, RMSE, MAE, R2, and training time, and applied cross-validation to enhance model performance. The results indicate that AR achieved superior predictive performance, yielding lower errors (MSE = 0.111, RMSE = 0.333, MAE = 0.145) than the other methods. In contrast, RFR was found to be better in terms of both speed (training time = 2.896) and explained variance (R2=0.926). Additionally, except for DTR, all evaluated techniques exhibited improved performance as the number of variables increased.
Machine Learning Predictive Models Number of Variables Regression Solar Energy Power Generation
Bu çalışmada, makine öğrenme yöntemlerinden Gradient Boosting Regressor (GBR), Decision Tree Regressor (DTR), Random Forest Regressor (RFR) ve Adaboost Regressor (AR) kullanılarak solar enerji gücünü tahminlemek amaçlanmaktadır. Bu amaçla, Kaggle veri tabanında yer alan “Solar energy power generation dataset” kullanılmıştır. Veri seti 21 değişken 4212 adet ölçümden oluşmaktadır. Çalışmada Relief özellik seçim yöntemi kullanılarak en önemli görülen 4 bağımsız değişken güneş enerji gücünü tahminlemek amacıyla kullanılmıştır. Verilerin %70’i eğitim geriye kalanları test verisi olarak ayrılmıştır. Değişken sayılarına göre yöntemlerin performansı incelenmiştir. Yöntemlerin performanslarını karşılaştırmak amacıyla MSE, RMSE, MAE, R2 ve eğitim zamanı ölçülerinden yararlanılmıştır. Daha iyi model performans elde edebilmek için çapraz doğrulama yöntemi kullanılmıştır. Analiz sonuçlarına göre GBR yönteminin diğer yöntemlere nazaran daha düşük hatalar ile daha başarılı tahminleme performansı gösterdiği belirlenmiştir. Diğer taraftan; hız ve R2 ölçüsü açısından ise RFR yönteminin daha iyi olduğu görülmektedir. Çalışmada DT yönteminin dışındaki tüm yöntemlerde, değişken sayısı arttıkça yöntemlerin daha iyi performans gösterdiği belirlenmiştir.
| Primary Language | English |
|---|---|
| Subjects | Software Engineering (Other) |
| Journal Section | Research Article |
| Authors | |
| Submission Date | May 30, 2025 |
| Acceptance Date | October 22, 2025 |
| Publication Date | January 29, 2026 |
| Published in Issue | Year 2026 Volume: 15 Issue: 2 |
All articles published by EJT are licensed under the Creative Commons Attribution 4.0 International License. This permits anyone to copy, redistribute, remix, transmit and adapt the work provided the original work and source is appropriately cited.