Research Article
BibTex RIS Cite

Detection of Anomalies in Urban Bike-Sharing Systems via Unsupervised Machine Learning: Konya Case Study

Year 2025, Volume: 10 Issue: 3, 496 - 509, 08.11.2025

Abstract

This study presents an approach that can contribute to data validation processes for quality control and security in urban transportation and bicycle sharing systems. For this purpose, anomaly detection was performed using unsupervised machine learning methods using Konya rental bicycle data. Two common algorithms, the local outlier factor and isolation forest methods, were used in the analysis process. The number of observations in the data set was 1069, and the anomaly estimate was determined to be 3%. The local outlier factor and isolation forest methods detected 33 anomalies, respectively, 20 of which were identified in common by both models. Parameter sensitivity analyses revealed that neither model exhibited a significant change in the number of anomalies identified under different parameter values. The findings demonstrate that the methods used yield consistent results across the data set and that they can quickly detect physically impossible values, especially in transportation records containing location data.

References

  • Adesh, S., Shobha, G., Shetty, N., & Xu, S. (2024). Improved LOF for anomaly detection on big data using HPCC Systems. Journal of Parallel and Distributed Computing, 179, 150–163. https://doi.org/10.1016/j.jpdc.2024.01.00
  • Aggarwal, C. C. (2017). Outlier analysis (2nd ed.). Cham: Springer.
  • Alghushairy, O., Hussain, F. K., Hussain, O. K., & Alfarhood, S. (2021). A review of Local Outlier Factor algorithms for outlier detection in big data streams. Big Data and Cognitive Computing, 5(1), 1–22. https://doi.org/10.3390/bdcc5010001
  • Breunig, M. M., Kriegel, H.-P., Ng, R. T., & Sander, J. (2000). LOF: Identifying density-based local outliers. ACM SIGMOD Record, 29(2), 93–104. https://doi.org/10.1145/342009.335388
  • Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys, 41(3), 1–58. https://doi.org/10.1145/1541880.1541882
  • Falcão, A. E. Z., Rocha, R. L. S., Falcão, D. S. C., & Rocha, A. R. C. (2019). Quantitative comparison of unsupervised anomaly detection algorithms for intrusion detection. Journal of Information Security and Applications, 46, 1–12. https://doi.org/10.1016/j.jisa.2019.02.013
  • Konya Büyükşehir Belediyesi – KABİS Veri Servisi. (2023). Bisiklet park alanları ve istasyonlarının konumları. Erişim adresi: https://acikveri.konya.bel.tr/tr/dataset/bisiklet-park-alanlari-ve-istasyonlarinin-konumlari (20.08.2025)
  • Liu, F. T., Ting, K. M., & Zhou, Z.-H. (2008). Isolation forest. In Proceedings of the 2008 Eighth IEEE International Conference on Data Mining (pp. 413–422). https://doi.org/10.1109/ICDM.2008.17
  • Mehrotra, K. G. (2017). Anomaly detection principles and algorithms. Cham: Springer.
  • Nowak-Brzezińska, A., & Horyńa, M. (2020). Comparison of algorithms for outlier detection: LOF, COF, and K-Means. Applied Sciences, 10(18), 1–18. https://doi.org/10.3390/app10186468
  • Petrariu, A. I., Moscaliuc, M., Turcu, C. E., & Gherman, L. D. (2022). A comparative study of unsupervised anomaly detection algorithms. International Journal of Advanced Computer Science and Applications, 13(9), 536–543. https://doi.org/10.14569/IJACSA.2022.0130963

Makine Öğrenmesi ile Kentsel Kiralık Bisiklet Verilerinde Anomali Tespiti: Konya İli Örneği

Year 2025, Volume: 10 Issue: 3, 496 - 509, 08.11.2025

Abstract

Bu çalışmada, şehir içi ulaşım ve bisiklet paylaşım sistemlerinde kalite kontrol ve güvenlik amaçlı veri doğrulama süreçlerine katkı sağlayabilecek bir yaklaşım sunulmaktadır. Bu amaçla, Konya kiralık bisiklet verisi kullanılarak denetimsiz makine öğrenmesi yöntemleriyle anomali tespiti gerçekleştirilmiştir. Analiz sürecinde iki yaygın algoritma olan yerel aykırı değer faktörü ve izolasyon ormanı yöntemleri kullanılmıştır. Veri setinde gözlem sayısı 1069 olup, anomalilerin tahmini oranı %3 olarak belirlenmiştir. Yerel aykırı değer faktörü ve izolasyon ormanı yöntemleri ile sırasıyla 33’er anomali tespit edilmiş, bunlardan 20 tanesi her iki model tarafından ortak olarak belirlenmiştir. Parametre duyarlılık analizleri sonucunda, her iki modelin de belirlenen anomali sayısında farklı parametre değerleri altında anlamlı bir değişiklik göstermediği gözlemlenmiştir. Bulgular, kullanılan yöntemlerin veri seti üzerinde tutarlı sonuçlar verdiğini ve özellikle konum verisi içeren ulaşım kayıtlarında fiziksel olarak mümkün olmayan değerlerin hızlı biçimde tespit edilebildiğini ortaya koymaktadır.

References

  • Adesh, S., Shobha, G., Shetty, N., & Xu, S. (2024). Improved LOF for anomaly detection on big data using HPCC Systems. Journal of Parallel and Distributed Computing, 179, 150–163. https://doi.org/10.1016/j.jpdc.2024.01.00
  • Aggarwal, C. C. (2017). Outlier analysis (2nd ed.). Cham: Springer.
  • Alghushairy, O., Hussain, F. K., Hussain, O. K., & Alfarhood, S. (2021). A review of Local Outlier Factor algorithms for outlier detection in big data streams. Big Data and Cognitive Computing, 5(1), 1–22. https://doi.org/10.3390/bdcc5010001
  • Breunig, M. M., Kriegel, H.-P., Ng, R. T., & Sander, J. (2000). LOF: Identifying density-based local outliers. ACM SIGMOD Record, 29(2), 93–104. https://doi.org/10.1145/342009.335388
  • Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys, 41(3), 1–58. https://doi.org/10.1145/1541880.1541882
  • Falcão, A. E. Z., Rocha, R. L. S., Falcão, D. S. C., & Rocha, A. R. C. (2019). Quantitative comparison of unsupervised anomaly detection algorithms for intrusion detection. Journal of Information Security and Applications, 46, 1–12. https://doi.org/10.1016/j.jisa.2019.02.013
  • Konya Büyükşehir Belediyesi – KABİS Veri Servisi. (2023). Bisiklet park alanları ve istasyonlarının konumları. Erişim adresi: https://acikveri.konya.bel.tr/tr/dataset/bisiklet-park-alanlari-ve-istasyonlarinin-konumlari (20.08.2025)
  • Liu, F. T., Ting, K. M., & Zhou, Z.-H. (2008). Isolation forest. In Proceedings of the 2008 Eighth IEEE International Conference on Data Mining (pp. 413–422). https://doi.org/10.1109/ICDM.2008.17
  • Mehrotra, K. G. (2017). Anomaly detection principles and algorithms. Cham: Springer.
  • Nowak-Brzezińska, A., & Horyńa, M. (2020). Comparison of algorithms for outlier detection: LOF, COF, and K-Means. Applied Sciences, 10(18), 1–18. https://doi.org/10.3390/app10186468
  • Petrariu, A. I., Moscaliuc, M., Turcu, C. E., & Gherman, L. D. (2022). A comparative study of unsupervised anomaly detection algorithms. International Journal of Advanced Computer Science and Applications, 13(9), 536–543. https://doi.org/10.14569/IJACSA.2022.0130963
There are 11 citations in total.

Details

Primary Language Turkish
Subjects Semi- and Unsupervised Learning
Journal Section Research Article
Authors

Ünal Dikbaş 0000-0002-7851-535X

Meral Ebegil 0000-0003-4798-3422

Publication Date November 8, 2025
Submission Date September 1, 2025
Acceptance Date October 16, 2025
Published in Issue Year 2025 Volume: 10 Issue: 3

Cite

APA Dikbaş, Ü., & Ebegil, M. (2025). Makine Öğrenmesi ile Kentsel Kiralık Bisiklet Verilerinde Anomali Tespiti: Konya İli Örneği. The Journal of International Scientific Researches, 10(3), 496-509.