Makine Öğrenmesi Algoritmaları ile TÜFE Verilerinde Aykırı Değer Tespiti
Öz
Veri süreçlerindeki olağandışı durum ve gözlemlerin tespit edilmesi süreçlerin iyileştirilmesi, güçlendirilmesi, yapılacak olan analizlerden ve tahminlerden daha doğru sonuç alınabilmesi gibi çeşitli sebeplerden ötürü oldukça önem arz etmektedir. Bu nedenle, verilerde aykırı değerlerin belirlenmesi gerek araştırmacıların gerekse uygulamacıların son yıllarda yoğun bir şekilde üzerinde durduğu önemli bir konu haline gelmiştir. Aykırı değer gözlemlerin tespit edilmesinde istatistiksel yöntemler olmakla birlikte makine öğrenmesi teknikleri de yer almaktadır. Çalışmanın temel amacı aykırı değer tespitinde geleneksel yöntemlerin yanı sıra makine öğrenme modellerinin de kullanabileceğini ve gerek istatistiksel yöntemlerle gerekse kendi aralarında tahmin performanslarının farklı olabileceğini ortaya koymaktır. Çalışmanın dolaylı amaçları ise bütün bu yöntemlerin makroekonomik zaman serilerinde aykırı gözlemleri tespit etmede yardımcı olabileceği ve aykırı olarak tespit edilen ilgili dönemlerin iktisadi çalışmalarda daha kapsamlı değerlendirilebileceğinin ortaya konulmasıdır. Çalışma kapsamında 2003Q2-2024Q4 Tüketici Fiyat Endeksi (TÜFE) çeyreklik verileri analiz edilmiştir. Analiz sonuçlarına göre istatistiksel yöntemlerden; Kutu grafiği enflasyonist dönemin yaşandığı gözlemleri, QQ grafiği, histogram ve z-score yöntemleri enflasyonist dönemdeki en yüksek değere sahip gözlemleri aykırı olarak tahmin etmiştir. Makine öğrenme yöntemlerinden, Yerel aykırı değer faktörü (Local outlier factor-LOF), Tek-sınıf destek vektör makineleri (One-class support vector machine-OCSVM) ve Bağlantıya dayalı aykırı değer faktörü (Connectivity-based outlier factor- COF) veri setindeki en düşük ve en yüksek enflasyon dönemlerini aykırı değer olarak belirlemiştir. İzolasyon ormanı (Isolation forest-IF), Açıya dayalı aykırı değer tespiti (Angle-based outlier detection-ABOD), Histograma dayalı aykırı değer skoru (Histogram-based outlier score-HBOS) ve en yakın komşu (k-nearest neighbor-KNN) gibi yöntemler ise enflasyonist dönemdeki gözlemleri aykırı değer olarak tahmin etmiştir.
Anahtar Kelimeler
Kaynakça
- Aggarwal, C.C., 2017. Outlier Analysis, Second Edition, Springer.
- Blázquez-García, A., Conde, A., Mori, U., & Lozano, J. A. (2021). A review on outlier/anomaly detection in time series data. ACM Computing Surveys.
- Breunig, M.M., Kriegel, H., Ng, R.T., Sander, J., 2000. LOF: Identifying density-based local outliers. ACM SIGMOD Conference
- Chan, W.-S., 1998. Outlier analysis of annual retail price inflation: A cross-country study. Journal of Actuarial Practice, 5(2), 90.
- Fox, A. J. (1972/2018). Outliers in time series. Journal of the Royal Statistical Society: Series B (Methodological), 34(3), 350–363. https://doi.org/10.1111/j.2517-6161.1972.tb00915.x
- Garg, A., Zhang, W., Samaran, J., Savitha, R., & Foo, C. S. (2022). An evaluation of anomaly detection and diagnosis in multivariate time series. IEEE Transactions on Neural Networks and Learning Systems.
- Goldstein, M., Dengel, A., 2012. Histogram-based outlier score (HBOS): A fast unsupervised anomaly detection algorithm.
- Goldstein, M., & Uchida, S. (2016). A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data. PLoS ONE, 11(4), e0152173. https://doi.org/10.1371/journal.pone.0152173
Ayrıntılar
Birincil Dil
Türkçe
Konular
Yarı ve Denetimsiz Öğrenme
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
30 Mart 2026
Gönderilme Tarihi
23 Şubat 2025
Kabul Tarihi
11 Ekim 2025
Yayımlandığı Sayı
Yıl 2026 Cilt: 9 Sayı: 2026