Research Article
BibTex RIS Cite

A Comparative Assessment on Air Pollution Estimation by Machine Learning Algorithms

Year 2019, , 8 - 15, 31.08.2019
https://doi.org/10.31590/ejosat.530347

Abstract

Air pollution is one of the biggest problems of today. Air pollution, population growth, urban development and growth are increasingly important with the development of industry. Generally, the harmful effects of air pollutants on humans, animals and the environment show complex distribution patterns depending on time, space, duration of action, concentration and other characteristics. This complexity means that modeling and measurement of pollutant samples and trends is also difficult to predict the levels of pollution to which people are exposed. One of the most important steps in prevention of air pollution is the evaluation of contamination in a model. In this study, it is aimed to model air pollution by using some meteorological parameters in the estimation of air pollution by various machine learning algorithms which give new and successful results in meteorology and environment applications. Minimum-Max (Min-Max) normalization technique was used with learning methods. The performance values obtained in the study are compared with the similar studies in the literature and the most appropriate classification algorithm for the solution of the problem has been determined. Separate models were designed and analyzed by using methods such as Artificial Neural Networks (ANN), Random Forest, K-Nearest Neighborhood (K-NN), Logistic Regression, Decision Tree, Linear Regression and Naive Bayes. The performance values obtained in the study were compared with similar studies in the literature and the most appropriate estimation algorithm for the solution of the problem was determined. In this case, 70% of the data set is used for training and 30% for testing. As a result of the study, it was seen that the correct estimation rate for the ANN model was 87% and the other machine learning models gave the best results in the estimation with 99% of the Random Forest accuracy rate and 99% of the Decision Tree accuracy rate. The Linear Regression method performs poorly with a 30% accuracy rate. Performance evaluation of methods used on KastamonuDataSet in terms of the Explanatory Coefficient (R2), Mean Squared Error (MSE), Root Mean Square Error (RMSE) and Mean Absolute Error (MAE) metrics. 

References

  • Alimissis, A., Philippopoulos, K., Tzanis, C.G., and Deligiorgi, D. (2018). Spatial estimation of urban air pollution with the use of artificial neural network models, Atmospheric Environment, 191, 205-213, 2018.
  • Bilbro, R. (2016). An Introduction to Machine Learning with Python. Erişim adresi: https://districtdatalabs.silvrback.com/an-introduction-to-machine-learning-with-python.
  • Aydınlar, B., Güveni H. ve Kırksekiz, S., 2009. Hava Kirliliği ve Modellenmesi, Sakarya Üniversitesi, Fen Bilimleri Enstitüsü, Çevre Mühendisliği Bölümü Yüksek Lisans Rapor.
  • Çınaroğlu, S. (2017). Sağlık Harcamasının Tahmininde Makine Öğrenmesi Regresyon Yöntemlerinin Karşılaştırılması, Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 22(2): 179-200.
  • Demirarslan, O. Çetin, Ş., & Ayberk, S. (2008). Hava Kirliliği Belirlemelerinde Modelleme Yaklaşımı ve Modelleme Aşamasında Karşılaşılabilecek Sorunlar, Environmental Problems Symposium, Kocaeli 2008.
  • Hu, K. & Rahman, A. (2017). HazeEst: Machine Learning Based Metropolitan Air Pollution Estimation From Fixed and Mobile Sensors, IEE Sensors, 17(11): 3571-3525.
  • Huang, C-J., & Kuo, P-H. (2018). A Deep CNN-LSTM Model for Particulate Matter (PM2.5) Forecasting in Smart Cities, Sensors 2018.
  • Gültepe, Y. & Duru, A.M. (2018). Daily SO2 Air Pollution Prediction with the use of Artificial Neural Network Models, International Journal of Computer Applciations, 181(34): 36-40.
  • Karasu, S., Hacıoğlu, R. & Altan, A. (2018). Prediction of Bitcoin Prices with Machine Learning Methods using Time Series Data, 26th signal Processing and Communications Applications Conference.
  • Kunt, F. (2007). Hava Kirliliğinin Yapay Sinir Ağları Yöntemiyle Modellenmesi ve Tahmini, Selçuk University Graduate School of Natural and Applied Sciences, M.Sc. Thesis, Environmental Engineering Department, Konya, 2007.
  • Martínez-Espaňa, R., Bueno-Crespo, A., Timón, I., Soto, J., Muňoz, A. & Cecilia, J.M. (2018). Air-Pollution Prediction in Smart Cities through Machine Learning Methods: A Case of Study in Murcia, Spain.
  • Peng, H. (2013). Air Quality Prediction by Machine Learning Methods. The Degree of Master of Science, the University of British Columbia.
  • Saygın, H., Eren, Ö., & Oral, H.V. (2018). Peaks Over Threshold Method Application on Airborne Particulate Matter (PM10) and Sulphur Dioxide (SO2) Pollution Detection in Specified Regions of İstanbul, Avrupa Bilim ve Teknoloji Dergisi, 14:399-407.
  • Tamas, W., Notton, G., Paoli, C., Nivet, M-L. & Voyant, C. (2016). Hybridization of Air Quality Frecasting Models Using Machine Learning and Clustering: An Orginal Approach to Detect Pollutant Peaks, Aerosol and Air Qaulity Research, 16: 405-416.
  • Yapraklı, T.Ş. & Erdal, H. (2016). Firma Başarısızlığı Tahminlemesi: Makine Öğrenmesie Dayalı Bir Uygulama, Bilişim Teknolojileri Dergisi, 9(1): 21-31.
  • Zaree, T. & Honarvar, A.R. (2018). Improvement of Air Pollution Prediction in a Smart City and its Correction with Weather Conditions using Metrological Big Data, Turkish Journal of Electrical Engineering & Computer Sciences, 26: 1302-1313.
  • Zhao, Y. & Hasan, Y.A. (2013). Machine Learning Algorithms for Predicting Roadside Fine Particulate Matter Concentration Level in Hong Kong Central, Computation Ecology and Software, 3(3): 61-73.
  • Wang, W. & Xu, Z. (2004). A Heuristic Training for Support Vector Regression, Neurocomputing, 61: 259-275.

Makine Öğrenmesi Algoritmaları ile Hava Kirliliği Tahmini Üzerine Karşılaştırmalı Bir Değerlendirme

Year 2019, , 8 - 15, 31.08.2019
https://doi.org/10.31590/ejosat.530347

Abstract

Hava kirliliği, günümüzün en büyük sorunlarından birini teşkil etmektedir. Hava kirliliği, nüfusun artması, kentsel gelişme ve büyüme, endüstrinin gelişmesiyle giderek artan bir önem arz etmektedir. Genellikle hava kirleticilerinin insanlara, canlılara ve çevreye zararlı etkileri zaman, mekan, etki süresi, konsantrasyon ve diğer karakteristiklerine bağlı olarak karmaşık dağılım şekilleri göstermektedir. Bu karmaşıklık, kirletici örnekleri ve eğilimleri modelleme veya ölçmede, ayrıca insanların maruz kaldığı seviyeleri tahmin etmenin zor olduğu anlamına gelmektedir. Hava kirliliğinin önlenmesi konusunda yapılacak çalışmalar içerisinde en önemli adımlardan biri kirlenme olayının bir model içerisinde değerlendirilmesidir. Bu çalışmada Kastamonu ili ele alınarak, meteoroloji ve çevre uygulamalarında oldukça yeni ve başarılı sonuçlar veren çeşitli makine öğrenmesi algoritmaları ile hava kirliliğinin tahmininde, bazı meteorolojik parametreler kullanılarak hava kirliliği modellenmesi amaçlanmıştır. Normalizasyon tekniklerinin sistem performansına etkisini gözlemleyebilmek için veri setindeki değerler Minimum-Maksimum (Min-Max) normalizasyon teknikleri ile normalize edilmiştir. Çalışmada elde edilen performans değerleri, literatürdeki benzer çalışmalarla kıyaslanarak problemin çözümüne ilişkin en uygun sınıflandırma algoritması tespit edilmiştir. Yapay Sinir Ağları (YSA), Rastgele Orman (Random Forest), K-En Yakın Komşu (K-Nearest Neighborhood), Lojistik Regresyon (Logistic Regression), Karar Ağacı (Decision Tree), Lineer Regresyon (Linear Regression) ve Basit Bayes (Naive Bayes) gibi yöntemler kullanılarak ayrı ayrı modeller tasarlanmış ve sonuçlar analiz edilmiştir. Veri setinin %70’i eğitim ve %30’si test verisi olarak ayrılmıştır. Çalışma sonucunda, yapay sinir ağları beklendiği gibi %91 oranında başarı göstererek en doğru tahmini yapan yöntem olarak belirlenirken, sınıflandırmalardan en başarısız sonuç Lineer Regresyon ile %30 elde edilirken, en başarılı sonuçlar Rastgele Orman ve Karar Ağacı ile %99 elde edilmiştir. KastamonuDataSet üzerinde kullanılan yöntemlerin performans değerlendirmelerinde kullanılan temel performans göstergeleri olarak Açıklayıcılık Katsayısı (R2), Ortalama Karesel Hata (Mean Squared Error-MSE), Ortalama Hata Kare Kökü (Root Mean Square Error-RMSE) ve Ortalama Mutlak Hata (Mean Absolute Error-MAE) metrikleri bakımından istatistiksel önemli farklılıkların bulunduğu tespit edilmiştir. 

References

  • Alimissis, A., Philippopoulos, K., Tzanis, C.G., and Deligiorgi, D. (2018). Spatial estimation of urban air pollution with the use of artificial neural network models, Atmospheric Environment, 191, 205-213, 2018.
  • Bilbro, R. (2016). An Introduction to Machine Learning with Python. Erişim adresi: https://districtdatalabs.silvrback.com/an-introduction-to-machine-learning-with-python.
  • Aydınlar, B., Güveni H. ve Kırksekiz, S., 2009. Hava Kirliliği ve Modellenmesi, Sakarya Üniversitesi, Fen Bilimleri Enstitüsü, Çevre Mühendisliği Bölümü Yüksek Lisans Rapor.
  • Çınaroğlu, S. (2017). Sağlık Harcamasının Tahmininde Makine Öğrenmesi Regresyon Yöntemlerinin Karşılaştırılması, Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 22(2): 179-200.
  • Demirarslan, O. Çetin, Ş., & Ayberk, S. (2008). Hava Kirliliği Belirlemelerinde Modelleme Yaklaşımı ve Modelleme Aşamasında Karşılaşılabilecek Sorunlar, Environmental Problems Symposium, Kocaeli 2008.
  • Hu, K. & Rahman, A. (2017). HazeEst: Machine Learning Based Metropolitan Air Pollution Estimation From Fixed and Mobile Sensors, IEE Sensors, 17(11): 3571-3525.
  • Huang, C-J., & Kuo, P-H. (2018). A Deep CNN-LSTM Model for Particulate Matter (PM2.5) Forecasting in Smart Cities, Sensors 2018.
  • Gültepe, Y. & Duru, A.M. (2018). Daily SO2 Air Pollution Prediction with the use of Artificial Neural Network Models, International Journal of Computer Applciations, 181(34): 36-40.
  • Karasu, S., Hacıoğlu, R. & Altan, A. (2018). Prediction of Bitcoin Prices with Machine Learning Methods using Time Series Data, 26th signal Processing and Communications Applications Conference.
  • Kunt, F. (2007). Hava Kirliliğinin Yapay Sinir Ağları Yöntemiyle Modellenmesi ve Tahmini, Selçuk University Graduate School of Natural and Applied Sciences, M.Sc. Thesis, Environmental Engineering Department, Konya, 2007.
  • Martínez-Espaňa, R., Bueno-Crespo, A., Timón, I., Soto, J., Muňoz, A. & Cecilia, J.M. (2018). Air-Pollution Prediction in Smart Cities through Machine Learning Methods: A Case of Study in Murcia, Spain.
  • Peng, H. (2013). Air Quality Prediction by Machine Learning Methods. The Degree of Master of Science, the University of British Columbia.
  • Saygın, H., Eren, Ö., & Oral, H.V. (2018). Peaks Over Threshold Method Application on Airborne Particulate Matter (PM10) and Sulphur Dioxide (SO2) Pollution Detection in Specified Regions of İstanbul, Avrupa Bilim ve Teknoloji Dergisi, 14:399-407.
  • Tamas, W., Notton, G., Paoli, C., Nivet, M-L. & Voyant, C. (2016). Hybridization of Air Quality Frecasting Models Using Machine Learning and Clustering: An Orginal Approach to Detect Pollutant Peaks, Aerosol and Air Qaulity Research, 16: 405-416.
  • Yapraklı, T.Ş. & Erdal, H. (2016). Firma Başarısızlığı Tahminlemesi: Makine Öğrenmesie Dayalı Bir Uygulama, Bilişim Teknolojileri Dergisi, 9(1): 21-31.
  • Zaree, T. & Honarvar, A.R. (2018). Improvement of Air Pollution Prediction in a Smart City and its Correction with Weather Conditions using Metrological Big Data, Turkish Journal of Electrical Engineering & Computer Sciences, 26: 1302-1313.
  • Zhao, Y. & Hasan, Y.A. (2013). Machine Learning Algorithms for Predicting Roadside Fine Particulate Matter Concentration Level in Hong Kong Central, Computation Ecology and Software, 3(3): 61-73.
  • Wang, W. & Xu, Z. (2004). A Heuristic Training for Support Vector Regression, Neurocomputing, 61: 259-275.
There are 18 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Articles
Authors

Yasemin Gültepe

Publication Date August 31, 2019
Published in Issue Year 2019

Cite

APA Gültepe, Y. (2019). Makine Öğrenmesi Algoritmaları ile Hava Kirliliği Tahmini Üzerine Karşılaştırmalı Bir Değerlendirme. Avrupa Bilim Ve Teknoloji Dergisi(16), 8-15. https://doi.org/10.31590/ejosat.530347

Cited By











Data Mining, Weka Decision Trees
Orclever Proceedings of Research and Development
https://doi.org/10.56038/oprd.v3i1.376








Classification of Marble Types Using Machine Learning Techniques
Afyon Kocatepe Üniversitesi Uluslararası Mühendislik Teknolojileri ve Uygulamalı Bilimler Dergisi
https://doi.org/10.53448/akuumubd.1268931