Araştırma Makalesi
BibTex RIS Kaynak Göster

The Detection of Anomalies in Air Pollution Levels Using Statistical and Machine Learning Methods: The Case of Kırıkkale Province

Yıl 2025, Cilt: 8 Sayı: 2, 53 - 62, 31.12.2025
https://doi.org/10.55581/ejeas.1795805

Öz

This study aims to identify anomalies in air pollution levels by applying statistical methods to daily PM10 data measured in Kırıkkale province between 2021 and 2023. The early detection of unusual variations in air quality is of critical importance for reducing environmental risks, protecting public health, and providing a scientific basis for policymakers. Within this scope, both traditional statistical methods (Z-score, Benford’s Law, Interquartile Range (IQR), Median Absolute Deviation (MAD)) and machine learning-based approaches (Isolation Forest, Local Outlier Factor (LOF) were employed. Threshold values and computational procedures for each method were examined in detail, and the proportions of detected anomalies were comparatively analyzed. The findings revealed that the seasonal and annual distributions of anomalies displayed notable differences. Furthermore, the results were associated with Kırıkkale’s demographic structure, industrial activities, traffic density, and urbanization dynamics. Overall, the use of multiple methods was found to provide a more reliable, flexible, and applicable approach to environmental data analysis.

Kaynakça

  • World Health Organization. (2021). WHO global air quality guidelines: particulate matter (PM2. 5 and PM10), ozone, nitrogen dioxide, sulfur dioxide and carbon monoxide. World Health Organization.
  • T.C. İçişleri Bakanlığı, Emniyet Genel Müdürlüğü. (2024). Trafik İstatistikleri.
  • TÜİK. (2024). Adrese Dayalı Nüfus Kayıt Sistemi Sonuçları.
  • T.C. Sağlık Bakanlığı. (2024). Ölüm İstatistikleri.
  • Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM computing surveys (CSUR), 41(3), 1-58.
  • Nigrini, M. J. (2012). Benford's Law: Applications for forensic accounting, auditing, and fraud detection. John Wiley & Sons.
  • Coles, S., Bawa, J., Trenner, L., & Dorazio, P. (2001). An introduction to statistical modeling of extreme values (Vol. 208, p. 208). London: Springer.
  • Zhang, Y., Bocquet, M., Mallet, V., Seigneur, C., & Baklanov, A. (2012). Real-time air quality forecasting, part I: History, techniques, and current status. Atmospheric Environment, 60, 632-655.
  • Guo, Y., Li, K., Zhao, B., Shen, J., Bloss, W. J., Azzi, M., & Zhang, Y. (2022). Evaluating the real changes of air quality due to clean air actions using a machine learning technique: Results from 12 Chinese mega-cities during 2013–2020. Chemosphere, 300, 134608.
  • D'Elia, I., Briganti, G., Vitali, L., Piersanti, A., Righini, G., D'Isidoro, M., ... & Ciancarella, L. (2021). Measured and modelled air quality trends in Italy over the period 2003–2010. Atmospheric Chemistry and Physics Discussions, 2021, 1-38.
  • Barnett, V., & Lewis, T. (1994). Outliers in statistical data (Vol. 3, No. 1). New York: Wiley.
  • Tukey, J. W. (1977). Exploratory data analysis (Vol. 2, pp. 131-160). Reading, MA: Addison-wesley.
  • Rousseeuw, P. J., & Croux, C. (1993). Alternatives to the median absolute deviation. Journal of the American Statistical association, 88(424), 1273-1283.
  • Liu, F. T., Ting, K. M., & Zhou, Z. H. (2008, December). Isolation forest. In 2008 eighth ieee international conference on data mining (pp. 413-422). IEEE.
  • Breunig, M. M., Kriegel, H. P., Ng, R. T., & Sander, J. (2000, May). LOF: identifying density-based local outliers. In Proceedings of the 2000 ACM SIGMOD international conference on Management of data (pp. 93-104).
  • Benford, F. (1938). The law of anomalous numbers. Proceedings of the American philosophical society, 551-572.
  • Iglewicz, B. and Hoaglin, D. (1993) The ASQC Basic References in Quality Control: Statistical Techniques. In: Mykytka, E.F., Eds., How to Detect and Handle Outliers, ASQC Quality Press, Milwaukee, Vol. 16.
  • Hoaglin, D. C., Iglewicz, B., & Tukey, J. W. (1986). Performance of some resistant rules for outlier labeling. Journal of the American Statistical Association, 81(396), 991-999.
  • Leys, C., Ley, C., Klein, O., Bernard, P., & Licata, L. (2013). Detecting outliers: Do not use standard deviation around the mean, use absolute deviation around the median. Journal of experimental social psychology, 49(4), 764-766.
  • Ronchetti, E. M., & Huber, P. J. (2009). Robust statistics. Hoboken, NJ, USA: John Wiley & Sons.
  • Durtschi, C., Hillison, W., & Pacini, C. (2004). The effective use of Benford’s law to assist in detecting fraud in accounting data. Journal of forensic accounting, 5(1), 17-34.
  • Karakavak, H. N., & Kadılar, G. Ö. (2025). Hava Kirlilik Düzeylerindeki Anomali Tespitinde Benford Kanunu ve Genelleştirilmiş Uç Değer Dağılım: Ankara İli Örneği. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 29(1), 176-188.
  • Dikbaş, Ü., & Ebegil, M. (2025). Denetimli Makine Öğrenmesi Teknikleri ile Anomali Tespiti: Shuttle Uzay Verisi Örneği. Savunma Bilimleri Dergisi, 21(2), 291-308.
  • Cleveland, R. B., Cleveland, W. S., McRae, J. E., & Terpenning, I. (1990). STL: A seasonal-trend decomposition procedure based on loess. Journal of Official Statistics, 6(1), 3-73.
  • T.C. Sağlık Bakanlığı. (2024). Hava Kalitesi İzleme Sistemi (SİM).

Hava Kirliliği Düzeylerindeki Anomalilerin İstatistiksel ve Makine Öğrenmesi Yöntemleri ile Tespiti: Kırıkkale İli Örneği

Yıl 2025, Cilt: 8 Sayı: 2, 53 - 62, 31.12.2025
https://doi.org/10.55581/ejeas.1795805

Öz

Bu çalışma, 2021–2023 yılları arasında Kırıkkale ilinde ölçülen günlük PM10 verilerini kullanarak hava kirliliği düzeylerindeki anomalilerin istatistiksel yöntemlerle belirlenmesini amaçlamaktadır. Hava kalitesinde ortaya çıkan olağandışı değişimlerin erken tespiti; çevresel risklerin azaltılması, halk sağlığının korunması ve politika yapıcılar için bilimsel bir temel oluşturulması açısından kritik öneme sahiptir. Bu kapsamda hem geleneksel istatistiksel yöntemler (Z-skoru, Benford Kanunu, Interquartile Range (IQR), Median Absolute Deviation (MAD) hem de makine öğrenmesi tabanlı yöntemler (Isolation Forest, Local Outlier Factor (LOF)) kullanılmıştır. Her yöntem için eşik değerler ve hesaplama süreçleri ayrıntılı olarak ele alınmış; tespit edilen anomalilerin oranları karşılaştırmalı biçimde analiz edilmiştir. Bulgular, anomalilerin mevsimsel ve yıllık dağılımlarının belirgin farklılıklar gösterdiğini ortaya koymuştur. Ayrıca elde edilen sonuçlar, Kırıkkale’nin demografik yapısı, sanayi faaliyetleri, trafik yoğunluğu ve kentleşme dinamikleri ile ilişkilendirilmiştir. Genel olarak, çoklu yöntem kullanımının çevresel veri analizinde daha güvenilir, esnek ve uygulanabilir bir yaklaşım sunduğu sonucuna ulaşılmıştır.

Etik Beyan

İkincil veriler kullanıldığından etik kurul onayına gerek olmayan çalışma

Kaynakça

  • World Health Organization. (2021). WHO global air quality guidelines: particulate matter (PM2. 5 and PM10), ozone, nitrogen dioxide, sulfur dioxide and carbon monoxide. World Health Organization.
  • T.C. İçişleri Bakanlığı, Emniyet Genel Müdürlüğü. (2024). Trafik İstatistikleri.
  • TÜİK. (2024). Adrese Dayalı Nüfus Kayıt Sistemi Sonuçları.
  • T.C. Sağlık Bakanlığı. (2024). Ölüm İstatistikleri.
  • Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM computing surveys (CSUR), 41(3), 1-58.
  • Nigrini, M. J. (2012). Benford's Law: Applications for forensic accounting, auditing, and fraud detection. John Wiley & Sons.
  • Coles, S., Bawa, J., Trenner, L., & Dorazio, P. (2001). An introduction to statistical modeling of extreme values (Vol. 208, p. 208). London: Springer.
  • Zhang, Y., Bocquet, M., Mallet, V., Seigneur, C., & Baklanov, A. (2012). Real-time air quality forecasting, part I: History, techniques, and current status. Atmospheric Environment, 60, 632-655.
  • Guo, Y., Li, K., Zhao, B., Shen, J., Bloss, W. J., Azzi, M., & Zhang, Y. (2022). Evaluating the real changes of air quality due to clean air actions using a machine learning technique: Results from 12 Chinese mega-cities during 2013–2020. Chemosphere, 300, 134608.
  • D'Elia, I., Briganti, G., Vitali, L., Piersanti, A., Righini, G., D'Isidoro, M., ... & Ciancarella, L. (2021). Measured and modelled air quality trends in Italy over the period 2003–2010. Atmospheric Chemistry and Physics Discussions, 2021, 1-38.
  • Barnett, V., & Lewis, T. (1994). Outliers in statistical data (Vol. 3, No. 1). New York: Wiley.
  • Tukey, J. W. (1977). Exploratory data analysis (Vol. 2, pp. 131-160). Reading, MA: Addison-wesley.
  • Rousseeuw, P. J., & Croux, C. (1993). Alternatives to the median absolute deviation. Journal of the American Statistical association, 88(424), 1273-1283.
  • Liu, F. T., Ting, K. M., & Zhou, Z. H. (2008, December). Isolation forest. In 2008 eighth ieee international conference on data mining (pp. 413-422). IEEE.
  • Breunig, M. M., Kriegel, H. P., Ng, R. T., & Sander, J. (2000, May). LOF: identifying density-based local outliers. In Proceedings of the 2000 ACM SIGMOD international conference on Management of data (pp. 93-104).
  • Benford, F. (1938). The law of anomalous numbers. Proceedings of the American philosophical society, 551-572.
  • Iglewicz, B. and Hoaglin, D. (1993) The ASQC Basic References in Quality Control: Statistical Techniques. In: Mykytka, E.F., Eds., How to Detect and Handle Outliers, ASQC Quality Press, Milwaukee, Vol. 16.
  • Hoaglin, D. C., Iglewicz, B., & Tukey, J. W. (1986). Performance of some resistant rules for outlier labeling. Journal of the American Statistical Association, 81(396), 991-999.
  • Leys, C., Ley, C., Klein, O., Bernard, P., & Licata, L. (2013). Detecting outliers: Do not use standard deviation around the mean, use absolute deviation around the median. Journal of experimental social psychology, 49(4), 764-766.
  • Ronchetti, E. M., & Huber, P. J. (2009). Robust statistics. Hoboken, NJ, USA: John Wiley & Sons.
  • Durtschi, C., Hillison, W., & Pacini, C. (2004). The effective use of Benford’s law to assist in detecting fraud in accounting data. Journal of forensic accounting, 5(1), 17-34.
  • Karakavak, H. N., & Kadılar, G. Ö. (2025). Hava Kirlilik Düzeylerindeki Anomali Tespitinde Benford Kanunu ve Genelleştirilmiş Uç Değer Dağılım: Ankara İli Örneği. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 29(1), 176-188.
  • Dikbaş, Ü., & Ebegil, M. (2025). Denetimli Makine Öğrenmesi Teknikleri ile Anomali Tespiti: Shuttle Uzay Verisi Örneği. Savunma Bilimleri Dergisi, 21(2), 291-308.
  • Cleveland, R. B., Cleveland, W. S., McRae, J. E., & Terpenning, I. (1990). STL: A seasonal-trend decomposition procedure based on loess. Journal of Official Statistics, 6(1), 3-73.
  • T.C. Sağlık Bakanlığı. (2024). Hava Kalitesi İzleme Sistemi (SİM).
Toplam 25 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Hava Kirliliği Modellemesi ve Kontrolü
Bölüm Araştırma Makalesi
Yazarlar

Serap Yörübulut 0000-0003-0781-4405

Ugur Enes Özcan 0009-0005-9898-729X

Gönderilme Tarihi 3 Ekim 2025
Kabul Tarihi 2 Aralık 2025
Yayımlanma Tarihi 31 Aralık 2025
Yayımlandığı Sayı Yıl 2025 Cilt: 8 Sayı: 2