This study aims to compare Random Forest Regression and LightGBM algorithms for the prediction of pH value, which is an important parameter in water quality assessment. The performance of both algorithms is evaluated with metrics such as RMSE, R-squared and AUC (Area Under Curve). The results show that the LightGBM algorithm outperforms Random Forest (0.84) with an AUC value of 0.86 and provides better prediction accuracy, especially on large and complex datasets. These findings demonstrate the applicability of machine learning techniques in environmental monitoring processes and their potential for effective management of water quality. The results highlight the superiority of the LightGBM algorithm in solving environmental problems such as pH prediction, but also provide suggestions for more comprehensive approaches. The application of hybrid modeling techniques, generalizable analyses with datasets from different water sources, and the development of real-time monitoring systems are suggested to extend the findings of the study. This study contributes to the literature by demonstrating the importance of machine learning algorithms in environmental monitoring and water quality management.
Bu çalışma, su kalitesinin değerlendirilmesinde önemli bir parametre olan pH değerinin tahmini için Random Forest Regression ve LightGBM algoritmalarını karşılaştırmayı amaçlamaktadır. Kaggle platformundan elde edilen geniş bir veri seti üzerinde gerçekleştirilen analizlerde, her iki algoritmanın performansı RMSE, R-squared ve AUC (Area Under Curve) gibi metriklerle değerlendirilmiştir. Sonuçlar, LightGBM algoritmasının AUC değeriyle (0.86), Random Forest'tan (0.84) daha yüksek performans sergilediğini ve özellikle büyük ve karmaşık veri setlerinde daha iyi bir tahmin doğruluğu sağladığını göstermiştir. Bu bulgular, makine öğrenimi tekniklerinin çevresel izleme süreçlerindeki uygulanabilirliğini ve su kalitesinin etkin bir şekilde yönetilmesindeki potansiyelini ortaya koymaktadır. Elde edilen sonuçlar, pH tahmini gibi çevresel sorunların çözümünde LightGBM algoritmasının üstünlüğünü vurgulamakla birlikte, daha kapsamlı yaklaşımlar için öneriler de sunmaktadır. Hibrit modelleme tekniklerinin uygulanması, farklı su kaynaklarından alınan veri setleriyle genelleştirilebilir analizlerin yapılması ve gerçek zamanlı izleme sistemlerinin geliştirilmesi, çalışmanın bulgularının genişletilmesi adına önerilmektedir. Bu çalışma, çevresel izleme ve su kalitesi yönetiminde makine öğrenimi algoritmalarının önemini bir kez daha ortaya koyarak literatüre katkı sağlamaktadır.
| Primary Language | English |
|---|---|
| Subjects | Ecology (Other) |
| Journal Section | Research Article |
| Authors | |
| Submission Date | January 29, 2025 |
| Acceptance Date | March 24, 2025 |
| Publication Date | March 28, 2025 |
| Published in Issue | Year 2025 Volume: 11 Issue: 1 |
Founded in 2013 as the "Menba Kastamonu University Faculty of Fisheries Journal," our journal continues to be published as the "MEMBA Journal of Water Sciences."
-----------
MEMBA Journal of Water Sciences is an international, peer-reviewed, open-access scientific journal published by Kastamonu University. The journal aims to encourage the publication of fundamental and applied scientific research related to aquatic sciences and water resources, strengthen interdisciplinary scientific communication, and increase knowledge in this field. The journal began publishing continuously in 2026 and only accepts original articles, short notes, technical notes, reports, and reviews in English.
MEMBA Water Sciences Journal
TRDizin, SOBIAD, ASCI, CAB Direct, Google Scholar, Paperity, Asosindex, Academic Journal Index, CNKI Scholar
----------
Submitting a plagiarism similarity report is mandatory when uploading an article to our journal, and the plagiarism similarity rate in this report must be below 30%. Authors must submit this report when uploading their article.
Articles uploaded to our journal must include abstracts in both Turkish and English.