This study aims to compare Random Forest Regression and LightGBM algorithms for the prediction of pH value, which is an important parameter in water quality assessment. The performance of both algorithms is evaluated with metrics such as RMSE, R-squared and AUC (Area Under Curve). The results show that the LightGBM algorithm outperforms Random Forest (0.84) with an AUC value of 0.86 and provides better prediction accuracy, especially on large and complex datasets. These findings demonstrate the applicability of machine learning techniques in environmental monitoring processes and their potential for effective management of water quality. The results highlight the superiority of the LightGBM algorithm in solving environmental problems such as pH prediction, but also provide suggestions for more comprehensive approaches. The application of hybrid modeling techniques, generalizable analyses with datasets from different water sources, and the development of real-time monitoring systems are suggested to extend the findings of the study. This study contributes to the literature by demonstrating the importance of machine learning algorithms in environmental monitoring and water quality management.
Bu çalışma, su kalitesinin değerlendirilmesinde önemli bir parametre olan pH değerinin tahmini için Random Forest Regression ve LightGBM algoritmalarını karşılaştırmayı amaçlamaktadır. Kaggle platformundan elde edilen geniş bir veri seti üzerinde gerçekleştirilen analizlerde, her iki algoritmanın performansı RMSE, R-squared ve AUC (Area Under Curve) gibi metriklerle değerlendirilmiştir. Sonuçlar, LightGBM algoritmasının AUC değeriyle (0.86), Random Forest'tan (0.84) daha yüksek performans sergilediğini ve özellikle büyük ve karmaşık veri setlerinde daha iyi bir tahmin doğruluğu sağladığını göstermiştir. Bu bulgular, makine öğrenimi tekniklerinin çevresel izleme süreçlerindeki uygulanabilirliğini ve su kalitesinin etkin bir şekilde yönetilmesindeki potansiyelini ortaya koymaktadır. Elde edilen sonuçlar, pH tahmini gibi çevresel sorunların çözümünde LightGBM algoritmasının üstünlüğünü vurgulamakla birlikte, daha kapsamlı yaklaşımlar için öneriler de sunmaktadır. Hibrit modelleme tekniklerinin uygulanması, farklı su kaynaklarından alınan veri setleriyle genelleştirilebilir analizlerin yapılması ve gerçek zamanlı izleme sistemlerinin geliştirilmesi, çalışmanın bulgularının genişletilmesi adına önerilmektedir. Bu çalışma, çevresel izleme ve su kalitesi yönetiminde makine öğrenimi algoritmalarının önemini bir kez daha ortaya koyarak literatüre katkı sağlamaktadır.
| Primary Language | English |
|---|---|
| Subjects | Ecology (Other) |
| Journal Section | Research Article |
| Authors | |
| Submission Date | January 29, 2025 |
| Acceptance Date | March 24, 2025 |
| Publication Date | March 28, 2025 |
| Published in Issue | Year 2025 Volume: 11 Issue: 1 |