The rapid growth of e-commerce and increasing consumer expectations have intensified the need for efficient customer segmentation methods. Traditional segmentation techniques, which often rely on manual and rule-based approaches, fail to address the complexity and scalability required in modern e-commerce. Machine learning algorithms provide a powerful alternative, offering data-driven insights that enable personalized marketing strategies and targeted customer engagement. This study aims to analyze and compare the effectiveness of K-Nearest Neighbors (KNN), Support Vector Machine (SVM), and Random Forest algorithms in the classification of customer segments in e-commerce. Existing literature suggests various approaches for customer segmentation, but a direct comparison of these machine learning models in an e-commerce context remains limited. This research seeks to fill this gap by evaluating the classification performance of these models and determining their suitability for segmenting online shoppers. The dataset utilized in this study was obtained from Kaggle and contains consumer behavior-related features, including shopping frequency, promotional engagement, spending habits, and security concerns. To determine the optimal number of clusters, Elbow and Silhouette methods were employed. Once the clustering structure was established, the K-Means algorithm was applied to segment customers into distinct groups based on their behavioral patterns. These clusters were then classified using KNN, SVM, and Random Forest, and their performance was assessed using standard classification metrics such as Accuracy, Precision, Recall, and F1-Score. The results revealed that SVM achieved the highest accuracy (95%), making it the most reliable model for customer segmentation. Random Forest closely followed with an accuracy of 93%, demonstrating strong performance while offering higher scalability and lower computational costs. KNN, on the other hand, showed the lowest accuracy (78%), indicating that it may not be the most suitable choice for high-dimensional or large datasets. In addition, SVM and Random Forest consistently outperformed KNN in terms of Precision, Recall, and F1-Score, confirming their superior classification capabilities. In conclusion, this study highlights the importance of selecting the right machine learning model for customer segmentation in e-commerce. SVM is recommended for applications requiring the highest classification accuracy, while Random Forest is better suited for large datasets with high scalability demands. KNN, despite its simplicity, is more appropriate for small-scale segmentation tasks. The findings provide valuable insights for e-commerce businesses seeking to optimize their segmentation strategies through machine learning, ultimately enhancing customer targeting, engagement, and retention.
E-ticaretin hızla büyümesi ve artan tüketici beklentileri, etkili müşteri segmentasyonu yöntemlerine olan ihtiyacı artırmıştır. Geleneksel segmentasyon teknikleri genellikle manuel ve kural tabanlı yaklaşımlara dayandığından, modern e-ticaretin gerektirdiği karmaşıklık ve ölçeklenebilirliği sağlamada yetersiz kalmaktadır. Makine öğrenmesi algoritmaları, veriye dayalı içgörüler sunarak kişiselleştirilmiş pazarlama stratejileri ve hedefe yönelik müşteri etkileşimleri oluşturmayı mümkün kılan güçlü bir alternatif sunmaktadır. Bu çalışma, K-En Yakın Komşu (KNN), Destek Vektör Makineleri (SVM) ve Rastgele Orman (Random Forest) algoritmalarını kullanarak müşteri segmentasyonu sınıflandırma performanslarını analiz etmeyi ve karşılaştırmayı amaçlamaktadır. Mevcut literatürde müşteri segmentasyonu için çeşitli yaklaşımlar önerilmiştir, ancak bu makine öğrenmesi modellerinin e-ticaret bağlamında doğrudan karşılaştırılması sınırlı kalmıştır. Bu araştırma, bu boşluğu doldurmayı hedefleyerek farklı modellerin sınıflandırma performanslarını değerlendirip çevrimiçi alışveriş yapan müşterileri segmente etmede en uygun yöntemi belirlemeyi amaçlamaktadır. Bu çalışmada kullanılan veri seti Kaggle platformundan elde edilmiş olup, alışveriş sıklığı, promosyon katılımı, harcama alışkanlıkları ve güvenlik endişeleri gibi tüketici davranışlarını yansıtan özellikleri içermektedir. En uygun küme sayısını belirlemek için Elbow ve Silhouette yöntemleri kullanılmıştır. Kümeleme yapısı belirlendikten sonra K-Means algoritması uygulanarak müşteriler davranışsal özelliklerine göre farklı gruplara ayrılmıştır. Ardından, KNN, SVM ve Random Forest algoritmaları bu kümeleri sınıflandırmak için eğitilmiş ve performansları Accuracy (Doğruluk), Precision (Kesinlik), Recall (Duyarlılık) ve F1-Skoru gibi metrikler kullanılarak değerlendirilmiştir. Elde edilen sonuçlara göre, SVM modeli %95 doğruluk oranı ile en yüksek performansı sergilemiştir. Random Forest modeli ise %93 doğruluk oranı ile SVM’ye çok yakın sonuçlar üretmiş olup, daha düşük hesaplama maliyeti ve daha yüksek ölçeklenebilirlik avantajı sunmaktadır. KNN modeli ise %78 doğruluk oranı ile en düşük performansı göstermiştir, bu da yüksek boyutlu veya büyük veri setleri için uygun olmadığını göstermektedir. Ek olarak, Precision, Recall ve F1-Skoru açısından da SVM ve Random Forest’ın KNN’den daha üstün olduğu tespit edilmiştir, bu da onların daha güçlü sınıflandırma yeteneklerine sahip olduğunu doğrulamaktadır. Sonuç olarak, bu çalışma e-ticarette müşteri segmentasyonu için doğru makine öğrenmesi modelinin seçilmesinin önemini vurgulamaktadır. SVM, en yüksek doğruluk oranı gerektiren uygulamalar için önerilirken, Random Forest büyük veri setleri ve ölçeklenebilirlik gereksinimleri için daha uygun bir alternatif sunmaktadır. KNN modeli ise küçük ölçekli segmentasyon görevleri için daha uygun olup, büyük veri setleri için ideal olmadığı belirlenmiştir. Bu bulgular, makine öğrenmesi kullanarak müşteri segmentasyonunu optimize etmek isteyen e-ticaret işletmeleri için yol gösterici olacak ve müşteri hedefleme, etkileşim ve sadakat stratejilerini geliştirmeye katkı sağlayacaktır.
Primary Language | Turkish |
---|---|
Subjects | Customer Relationship Management |
Journal Section | Articles |
Authors | |
Early Pub Date | August 21, 2025 |
Publication Date | August 31, 2025 |
Submission Date | February 11, 2025 |
Acceptance Date | August 15, 2025 |
Published in Issue | Year 2025 Volume: 18 Issue: 2 |
Hitit Journal of Social Sciences is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License (CC BY NC).