Research Article
BibTex RIS Cite

Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi

Year 2025, Issue: 009, 9 - 27, 30.04.2025

Abstract

E-ticaretin yaygınlaşmasıyla birlikte web trafiğinin analiz edilmesi, işletmeler için önemli bir rekabet avantajı haline gelmiştir. Bu çalışmada, altı aylık bir süreyi kapsayan 35 milyon HTTP isteğinden oluşan büyük ölçekli bir e-ticaret web günlükleri veri seti analiz edilmiştir. Kullanıcı davranışlarını anlamak, en popüler ürünleri belirlemek, ziyaret saatlerini analiz etmek ve yönlendirme kaynaklarını incelemek amacıyla çeşitli veri işleme ve analiz teknikleri uygulanmıştır. Zaman serisi analizleri ve makine öğrenmesine dayalı yöntemler kullanılarak kullanıcı segmentasyonu gerçekleştirilmiş ve kullanıcıların siteyle etkileşim desenleri çıkarılmıştır. Ayrıca, veri gizliliğini korumak için anonimleştirme ve maskeleme teknikleri kullanılmıştır. Bu çalışmanın sunduğu bulgular, e-ticaret sitelerinin kullanıcı deneyimini iyileştirmek, satış stratejilerini optimize etmek ve bot aktivitelerini tespit etmek için kritik içgörüler sağlamaktadır. Ayrıca, geliştirilen analiz yaklaşımı, büyük veri ortamında kullanıcı davranışlarının daha derinlemesine incelenmesine olanak tanımakta ve gelecekte e-ticaret sektöründe veri odaklı karar alma süreçlerine yön verecek yeni metodolojilerin geliştirilmesine zemin hazırlamaktadır.

References

  • [1] Y. Gedik, “E-Ticaret: Teorik bir çerçeve”. Ankara Üniversitesi Sosyal Bilimler Dergisi, 12(1), 184-198, 2021.
  • [2] Ç. Köseoğlu, “Bilişim sistemlerinde log yönetimi, analizi ve anomali tespiti: Aile ve Sosyal Politikalar Bakanlığı üzerine bir uygulama” (Yüksek Lisans Tezi). Erciyes Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Kayseri, 2018.
  • [3] C. Kidd ve M. Raza, “Log Analytics: Analyzing Log Data 101”. Erişim adresi: https://www.splunk.com, 2023.
  • [4] T. Özseven ve M. Düğenci, “Log Analiz: Erişim Kayıt Dosyaları Analiz Yazılımı ve GOP Üniversitesi Uygulaması”. Bilişim Teknolojileri Dergisi, 4(2), 2011.
  • [5] N. Singh, A. Jain, R.S. Raw ve R. Raman, “Detection of Web-Based Attacks by Analyzing Web Server Log Files”. In Mohapatra, D.P., ve Patnaik, S. (Ed.), Intelligent Computing, Networking, and Informatics. Advances in Intelligent Systems and Computing, cilt 243. Springer, New Delhi, 2014. https://doi.org/10.1007/978-81-322-1665-0_10.
  • [6] B. J. Jansen, A. Spink ve I. Taksa, “Handbook of research on web log analysis”. IGI Global, 2008.
  • [7] I. Çınar ve H. Ş. Bilge, “Web Madenciliği Yöntemleri ile Web Loglarının İstatistiksel Analizi ve Saldırı Tespiti”. Bilişim Teknolojileri Dergisi, 9(2), 125, 2016.
  • [8] G. Suchacka ve G. Chodak, “Using association rules to assess purchase probability in online stores”. Information Systems and E-Business Management, 15, 751–780, 2017. https://doi.org/10.1007/s10257-016-0329-4
  • [9] J. Iwański, G. Suchacka ve G. Chodak, “Application of the Information Bottleneck method to discover user profiles in a Web store”. Journal of Organizational Computing and Electronic Commerce, 28(2), 98–121, 2018. https://doi.org/10.1080/10919392.2018.1444340
  • [10] S. Rovetta, G. Suchacka ve F. Masulli, “Bot recognition in a Web store: an approach based on unsupervised learning”. Journal of Network and Computer Applications, 157, 2020. https://doi.org/10.1016/j.jnca.2020.102577
  • [11] G. Suchacka, ve J. Iwański, “Identifying legitimate Web users and bots with different traffic profiles – an Information Bottleneck approach”. Knowledge-Based Systems, 197, 2020. https://doi.org/10.1016/j.knosys.2020.105875
  • [12] G. Chodak, G. Suchacka ve Y. Chawla, “HTTP-level e-commerce databased on server access logs for an online store”. Computer Networks, 183, 107589, 2020. https://doi.org/10.1016/j.comnet.2020.107589
  • [13] G. Van Rossum ve F. L. Drake, “Python 3 Reference Manual”. Scotts Valley, CA: CreateSpace, 2009.
  • [14] T. Kluyver vd., “Jupyter Notebooks – a publishing format for reproducible computational workflows”. In F. Loizides ve B. Schmidt (Ed.), Positioning and Power in Academic Publishing: Players, Agents and Agendas (s. 87–90). IOS Press, 2016.
  • [15] W. McKinney, “Data structures for statistical computing in Python”. In S. van der Walt ve J. Millman (Ed.), Proceedings of the 9th Python in Science Conference (s. 51–56), 2010.
  • [16] F. Pedregosa vd., “Scikit-learn: Machine learning in Python”. Journal of Machine Learning Research, 12, 2825–2830, 2011. https://jmlr.org/papers/v12/pedregosa11a.html.
  • [17] G. E. P. Box, G. M. Jenkins, G. C. Reinsel, ve G. M. Ljung, “Time Series Analysis: Forecasting and Control” (5. baskı). Wiley, 2015.
  • [18] C. M. Bishop, “Pattern Recognition and Machine Learning”. Springer, 2006.
  • [19] B. Yalçınkaya, M. E. Gedikli ve M. O. Cibaroğlu, “Elektronik Belge Yönetim Sisteminde Log Analizi: İstatistiksel Bir Değerlendirme”. Bilgi Yönetimi Ve Bilgi Güvenliği (s. 61-78), Ankara: Ankara Üniversitesi, 2019.
  • [20] J. Han, M. Kamber ve J. Pei, “Data mining: Concepts and techniques” (3. baskı). Elsevier, 2011.

Large-scale e-commerce web traffic analysis: evaluating user interactions

Year 2025, Issue: 009, 9 - 27, 30.04.2025

Abstract

With the widespread adoption of e-commerce, analyzing web traffic has become a crucial competitive advantage for businesses. In this study, a large-scale e-commerce web log dataset comprising 35 million HTTP requests over six months was analyzed. Various data processing and analysis techniques were applied to understand user behavior, identify the most popular products, analyze visit times, and examine referral sources. Time series analysis and machine learning methods were employed for user segmentation and interaction pattern extraction. Additionally, anonymization and masking techniques were implemented to ensure data privacy. The findings provide critical insights for enhancing user experience, optimizing sales strategies, and detecting bot activities in e-commerce websites. The analytical approach developed in this study and the obtained findings enable a deeper understanding of user behavior in large-scale data environments, laying the foundation for new methodologies to guide data-driven decision-making in the e-commerce sector.

References

  • [1] Y. Gedik, “E-Ticaret: Teorik bir çerçeve”. Ankara Üniversitesi Sosyal Bilimler Dergisi, 12(1), 184-198, 2021.
  • [2] Ç. Köseoğlu, “Bilişim sistemlerinde log yönetimi, analizi ve anomali tespiti: Aile ve Sosyal Politikalar Bakanlığı üzerine bir uygulama” (Yüksek Lisans Tezi). Erciyes Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Anabilim Dalı, Kayseri, 2018.
  • [3] C. Kidd ve M. Raza, “Log Analytics: Analyzing Log Data 101”. Erişim adresi: https://www.splunk.com, 2023.
  • [4] T. Özseven ve M. Düğenci, “Log Analiz: Erişim Kayıt Dosyaları Analiz Yazılımı ve GOP Üniversitesi Uygulaması”. Bilişim Teknolojileri Dergisi, 4(2), 2011.
  • [5] N. Singh, A. Jain, R.S. Raw ve R. Raman, “Detection of Web-Based Attacks by Analyzing Web Server Log Files”. In Mohapatra, D.P., ve Patnaik, S. (Ed.), Intelligent Computing, Networking, and Informatics. Advances in Intelligent Systems and Computing, cilt 243. Springer, New Delhi, 2014. https://doi.org/10.1007/978-81-322-1665-0_10.
  • [6] B. J. Jansen, A. Spink ve I. Taksa, “Handbook of research on web log analysis”. IGI Global, 2008.
  • [7] I. Çınar ve H. Ş. Bilge, “Web Madenciliği Yöntemleri ile Web Loglarının İstatistiksel Analizi ve Saldırı Tespiti”. Bilişim Teknolojileri Dergisi, 9(2), 125, 2016.
  • [8] G. Suchacka ve G. Chodak, “Using association rules to assess purchase probability in online stores”. Information Systems and E-Business Management, 15, 751–780, 2017. https://doi.org/10.1007/s10257-016-0329-4
  • [9] J. Iwański, G. Suchacka ve G. Chodak, “Application of the Information Bottleneck method to discover user profiles in a Web store”. Journal of Organizational Computing and Electronic Commerce, 28(2), 98–121, 2018. https://doi.org/10.1080/10919392.2018.1444340
  • [10] S. Rovetta, G. Suchacka ve F. Masulli, “Bot recognition in a Web store: an approach based on unsupervised learning”. Journal of Network and Computer Applications, 157, 2020. https://doi.org/10.1016/j.jnca.2020.102577
  • [11] G. Suchacka, ve J. Iwański, “Identifying legitimate Web users and bots with different traffic profiles – an Information Bottleneck approach”. Knowledge-Based Systems, 197, 2020. https://doi.org/10.1016/j.knosys.2020.105875
  • [12] G. Chodak, G. Suchacka ve Y. Chawla, “HTTP-level e-commerce databased on server access logs for an online store”. Computer Networks, 183, 107589, 2020. https://doi.org/10.1016/j.comnet.2020.107589
  • [13] G. Van Rossum ve F. L. Drake, “Python 3 Reference Manual”. Scotts Valley, CA: CreateSpace, 2009.
  • [14] T. Kluyver vd., “Jupyter Notebooks – a publishing format for reproducible computational workflows”. In F. Loizides ve B. Schmidt (Ed.), Positioning and Power in Academic Publishing: Players, Agents and Agendas (s. 87–90). IOS Press, 2016.
  • [15] W. McKinney, “Data structures for statistical computing in Python”. In S. van der Walt ve J. Millman (Ed.), Proceedings of the 9th Python in Science Conference (s. 51–56), 2010.
  • [16] F. Pedregosa vd., “Scikit-learn: Machine learning in Python”. Journal of Machine Learning Research, 12, 2825–2830, 2011. https://jmlr.org/papers/v12/pedregosa11a.html.
  • [17] G. E. P. Box, G. M. Jenkins, G. C. Reinsel, ve G. M. Ljung, “Time Series Analysis: Forecasting and Control” (5. baskı). Wiley, 2015.
  • [18] C. M. Bishop, “Pattern Recognition and Machine Learning”. Springer, 2006.
  • [19] B. Yalçınkaya, M. E. Gedikli ve M. O. Cibaroğlu, “Elektronik Belge Yönetim Sisteminde Log Analizi: İstatistiksel Bir Değerlendirme”. Bilgi Yönetimi Ve Bilgi Güvenliği (s. 61-78), Ankara: Ankara Üniversitesi, 2019.
  • [20] J. Han, M. Kamber ve J. Pei, “Data mining: Concepts and techniques” (3. baskı). Elsevier, 2011.
There are 20 citations in total.

Details

Primary Language Turkish
Subjects Computer Software
Journal Section Research Article
Authors

Halil İbrahim Çit 0009-0009-8840-2912

Emre Şatır 0000-0002-1950-5549

Submission Date March 18, 2025
Acceptance Date April 30, 2025
Publication Date April 30, 2025
Published in Issue Year 2025 Issue: 009

Cite

APA Çit, H. İ., & Şatır, E. (2025). Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi. Journal of Scientific Reports-C(009), 9-27.
AMA Çit Hİ, Şatır E. Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi. Journal of Scientific Reports-C. April 2025;(009):9-27.
Chicago Çit, Halil İbrahim, and Emre Şatır. “Büyük ölçekli E-Ticaret Web Trafiği Analizi: Kullanıcı Etkileşimlerinin Değerlendirilmesi”. Journal of Scientific Reports-C, no. 009 (April 2025): 9-27.
EndNote Çit Hİ, Şatır E (April 1, 2025) Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi. Journal of Scientific Reports-C 009 9–27.
IEEE H. İ. Çit and E. Şatır, “Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi”, Journal of Scientific Reports-C, no. 009, pp. 9–27, April2025.
ISNAD Çit, Halil İbrahim - Şatır, Emre. “Büyük ölçekli E-Ticaret Web Trafiği Analizi: Kullanıcı Etkileşimlerinin Değerlendirilmesi”. Journal of Scientific Reports-C 009 (April2025), 9-27.
JAMA Çit Hİ, Şatır E. Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi. Journal of Scientific Reports-C. 2025;:9–27.
MLA Çit, Halil İbrahim and Emre Şatır. “Büyük ölçekli E-Ticaret Web Trafiği Analizi: Kullanıcı Etkileşimlerinin Değerlendirilmesi”. Journal of Scientific Reports-C, no. 009, 2025, pp. 9-27.
Vancouver Çit Hİ, Şatır E. Büyük ölçekli e-ticaret web trafiği analizi: kullanıcı etkileşimlerinin değerlendirilmesi. Journal of Scientific Reports-C. 2025(009):9-27.