This study presents an approach that can contribute to data validation processes for quality control and security in urban transportation and bicycle sharing systems. For this purpose, anomaly detection was performed using unsupervised machine learning methods using Konya rental bicycle data. Two common algorithms, the local outlier factor and isolation forest methods, were used in the analysis process. The number of observations in the data set was 1069, and the anomaly estimate was determined to be 3%. The local outlier factor and isolation forest methods detected 33 anomalies, respectively, 20 of which were identified in common by both models. Parameter sensitivity analyses revealed that neither model exhibited a significant change in the number of anomalies identified under different parameter values. The findings demonstrate that the methods used yield consistent results across the data set and that they can quickly detect physically impossible values, especially in transportation records containing location data.
Machine learning unsupervised learning anomaly detection local outlier factor isolation forest
Bu çalışmada, şehir içi ulaşım ve bisiklet paylaşım sistemlerinde kalite kontrol ve güvenlik amaçlı veri doğrulama süreçlerine katkı sağlayabilecek bir yaklaşım sunulmaktadır. Bu amaçla, Konya kiralık bisiklet verisi kullanılarak denetimsiz makine öğrenmesi yöntemleriyle anomali tespiti gerçekleştirilmiştir. Analiz sürecinde iki yaygın algoritma olan yerel aykırı değer faktörü ve izolasyon ormanı yöntemleri kullanılmıştır. Veri setinde gözlem sayısı 1069 olup, anomalilerin tahmini oranı %3 olarak belirlenmiştir. Yerel aykırı değer faktörü ve izolasyon ormanı yöntemleri ile sırasıyla 33’er anomali tespit edilmiş, bunlardan 20 tanesi her iki model tarafından ortak olarak belirlenmiştir. Parametre duyarlılık analizleri sonucunda, her iki modelin de belirlenen anomali sayısında farklı parametre değerleri altında anlamlı bir değişiklik göstermediği gözlemlenmiştir. Bulgular, kullanılan yöntemlerin veri seti üzerinde tutarlı sonuçlar verdiğini ve özellikle konum verisi içeren ulaşım kayıtlarında fiziksel olarak mümkün olmayan değerlerin hızlı biçimde tespit edilebildiğini ortaya koymaktadır.
Makine öğrenmesi denetimsiz öğrenme anomali tespiti yerel aykırı değer faktörü izolasyon ormanı
| Primary Language | Turkish |
|---|---|
| Subjects | Semi- and Unsupervised Learning |
| Journal Section | Research Article |
| Authors | |
| Publication Date | November 8, 2025 |
| Submission Date | September 1, 2025 |
| Acceptance Date | October 16, 2025 |
| Published in Issue | Year 2025 Volume: 10 Issue: 3 |