This study aims to identify anomalies in air pollution levels by applying statistical methods to daily PM10 data measured in Kırıkkale province between 2021 and 2023. The early detection of unusual variations in air quality is of critical importance for reducing environmental risks, protecting public health, and providing a scientific basis for policymakers. Within this scope, both traditional statistical methods (Z-score, Benford’s Law, Interquartile Range (IQR), Median Absolute Deviation (MAD)) and machine learning-based approaches (Isolation Forest, Local Outlier Factor (LOF) were employed. Threshold values and computational procedures for each method were examined in detail, and the proportions of detected anomalies were comparatively analyzed. The findings revealed that the seasonal and annual distributions of anomalies displayed notable differences. Furthermore, the results were associated with Kırıkkale’s demographic structure, industrial activities, traffic density, and urbanization dynamics. Overall, the use of multiple methods was found to provide a more reliable, flexible, and applicable approach to environmental data analysis.
Anomaly Detection Environmental Data Analysis Machine Learning PM10
Bu çalışma, 2021–2023 yılları arasında Kırıkkale ilinde ölçülen günlük PM10 verilerini kullanarak hava kirliliği düzeylerindeki anomalilerin istatistiksel yöntemlerle belirlenmesini amaçlamaktadır. Hava kalitesinde ortaya çıkan olağandışı değişimlerin erken tespiti; çevresel risklerin azaltılması, halk sağlığının korunması ve politika yapıcılar için bilimsel bir temel oluşturulması açısından kritik öneme sahiptir. Bu kapsamda hem geleneksel istatistiksel yöntemler (Z-skoru, Benford Kanunu, Interquartile Range (IQR), Median Absolute Deviation (MAD) hem de makine öğrenmesi tabanlı yöntemler (Isolation Forest, Local Outlier Factor (LOF)) kullanılmıştır. Her yöntem için eşik değerler ve hesaplama süreçleri ayrıntılı olarak ele alınmış; tespit edilen anomalilerin oranları karşılaştırmalı biçimde analiz edilmiştir. Bulgular, anomalilerin mevsimsel ve yıllık dağılımlarının belirgin farklılıklar gösterdiğini ortaya koymuştur. Ayrıca elde edilen sonuçlar, Kırıkkale’nin demografik yapısı, sanayi faaliyetleri, trafik yoğunluğu ve kentleşme dinamikleri ile ilişkilendirilmiştir. Genel olarak, çoklu yöntem kullanımının çevresel veri analizinde daha güvenilir, esnek ve uygulanabilir bir yaklaşım sunduğu sonucuna ulaşılmıştır.
İkincil veriler kullanıldığından etik kurul onayına gerek olmayan çalışma
| Birincil Dil | Türkçe |
|---|---|
| Konular | Hava Kirliliği Modellemesi ve Kontrolü |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 3 Ekim 2025 |
| Kabul Tarihi | 2 Aralık 2025 |
| Yayımlanma Tarihi | 31 Aralık 2025 |
| Yayımlandığı Sayı | Yıl 2025 Cilt: 8 Sayı: 2 |