Year 2019, Volume 7, Issue 3, Pages 1985 - 2000 2019-07-31

Otomotiv Endüstrisi Verileri Üzerinde Birliktelik Kuralları Algoritmalarının SPMF ile Performans Karşılaştırması
Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data

Melih Nair [1] , Fatih Kayaalp [2]

13 34

Bilgi teknolojilerindeki son gelişmeler sayesinde, şirketler verilerini daha düşük maliyetlerle daha hızlı ve daha kolay saklayabilirler. Gün içinde şirketlerde gerçekleştirilen tüm işlemler (satışlar, cari kartlar, faturalama vb.), günün sonunda birleştirilir ve büyük veri setleri oluştururlar. Bu veri setlerinden veri madenciliği aracılıyla değerli bilgiler elde edilmesi mümkündür. Pazardaki rekabetin yüksek olduğu günümüz şartları açısından bu durum şirketler için çok daha önemli hale gelmiştir.  Bu çalışmada Türkiye’de araç bakım ve servis ürünleri satan bir şirketin veriseti kullanılmıştır. Bu verisetine, müşteriler tarafından birlikte satın alınmış olan ürünlerin tespiti için Birliktelik Kuralları uygulanmıştır. Şirketlere özgü olarak çıkarımı yapılan bu kurallar şirketlerin satış ve pazarlama stratejilerinin belirlenmesinde, depoların verimli bir şekilde kullanımlarında ve müşteriler ya da bölgelere göre uygun satış kampanyaları oluşturulmasında kullanılabilir. Birliktelik kuralları aynı zamanda Sık Satılan Ürün Algoritmaları olarak da isimlendirilebilmektedir. Bu algoritmalardan en güncel 11 tanesi SPMF yazılımı kullanılarak bu veri setine uygulanmış ve bu algoritmaların değişken destek değerleri ve değişken kayıt sayılarına bağlı olarak performansları, bellek kullanım miktarları ve işlem süreleri açısından karşılaştırılmıştır. Başlangıçtaki veri seti, 6 aylık, 12 aylık ve 22 aylık kayıt içerecek şekilde 3 ayrı veri seti haline getirilmiştir. Deney sonuçlarına bakıldığında, işlem zamanlarının genellikle destek değerleriyle ters orantılı olarak arttığı söylenebilir. Çünkü neredeyse tüm algoritmaların en düşük destek değeri olan 0,1 için daha yüksek işlem zamanı değerlerine sahip oldukları görülmüştür. 6 aylık ve 12 aylık veri setleri için dEclat_bitset algoritması en verimli performansı göstermiştir. Fakat 22 aylık veri setinde, 0,7 ve 0,3 destek değerleri için Eclat algoritması en verimli olarak görünürken; 0,3 ve 0,1 destek değerleri için dEclat_bitset algoritması en verimli olarak görünmektedir. 

By the recent developments about the information technologies, companies can store their data faster and easier with lower costs. All transactions (sales, current card, invoicing, etc.) performed in companies during the day combine at the end of the day to form big datasets. It is possible to extract valuable information through these datasets with data mining. And this has become more important for companies in terms of today's conditions where the competition in the market is high. In this study, a dataset of a company selling car maintenance and repair products in Turkey is used. Association Rules are applied on this dataset for determining the items which are bought together by the customers. These rules, which are calculated specifically for the company, can be used to redefine the sales and marketing strategies, to revise the storage areas efficiently, and to create sales campaigns suitable for the customers and regions. These algorithms are also called Frequent Itemset Mining Algorithms. The most recent 11 algorithms from these are applied to this dataset in order to compare the performances according to metrics like memory usage and execution times against varying support values and varying record numbers by using SPMF platform. Three different datasets are created by using the whole dataset like 6-months, 12-months and 22-months. According to the experiments, it can be said that executon times generally increases inversely with the support values as nearly all algorithms have higher execution time values for the lowest support value of 0.1. dEclat_bitset algorithm has the most efficient performance for 6-months and 12-months dataset. But Eclat algorithm can be said to be the most efficient algorithm for 0.7 and 0.3 support values; on the other hand dEclat_bitset is the most efficient algorithm for 0.3 and 0.1 support values on 22-months dataset.

  • [1] V.J.E.U.R. Gancheva, “Market basket analysis of beauty products”. 2013.
  • [2] U.Fayyad, G. Piatetsky Shapiro, and P. Smyth, “From data mining to knowledge discovery in databases”. Ai Magazine, vol. 17, no. 3, .pp. 37-54, 1996.
  • [3] S. Erpolat, “Otomobil Yetkili Servislerinde Birliktelik Kurallarının Belirlenmesinde Apriori ve FP-Growth Algoritmalarının Karşılaştırılması,” 2012.
  • [4] A. Bala et al., “Performance Analysis of Apriori and FP-Growth Algorithms (Association Rule Mining),” vol. 7, no. 2, pp. 279-293, 2016.
  • [5] G. Yıldız Erduran, “Online müşteri şikayetlerinin veri madenciliği ile incelenmesi,” 2017.
  • [6] C. Aguwa, M. H. Olya, and L. Monplaisir, “Modeling of fuzzy-based voice of customer for business decision analytics,” Knowledge-Based Systems, 2017, no. 125, pp. 136-145.
  • [7] A. Griva et al., Retail business analytics: “Customer visit segmentation using market basket data,” Expert Systems with Applications, 2018, no. 100, pp. 1-16.
  • [8] M. Postigo-Boix, and J. L. Melus-Moreno, “A social model based on customers' profiles for analyzing the churning process in the mobile market of data plans,” Physica a-Statistical Mechanics and Its Applications, no. 496, pp. 571-592, 2018.
  • [9] B. Doğan et al., “Sigortacılık Sektöründe Müşteri İlişki Yönetimi İçin Kümeleme Analizi,” 2018, ss. 11-18.
  • [10] T. Bardak et al., “Mobilya Alımında Geleneksel Mağaza ile Sanal Mağaza Tercihinin Veri Madenciliğine Dayalı Analizi,” 2018, 6, ss. 25-27.
  • [11] T. Dökeroğlu, , Z.M.M. Malik, ve A.-S.J.D.Ü.B.v.T.D. Shadi, “Gözetimsiz Makine Öğrenme Teknikleri ile Miktara Dayalı Negatif Birliktelik Kural Madenciliği,” ss. 1119-1138.
  • [12] B. Bakariya, G. Thakur, and K. J. I. A .J. O. I. T. Chaturvedi, “An Efficient Algorithm for Extracting Infrequent Itemsets from Weblog,” vol. 16, no. 2, pp. 275-280, 2019.
  • [13] A. Morais et al., “Predicting the need of Neonatal Resuscitation using Data Mining,” 8th International Conference on Emerging Ubiquitous Systems and Pervasive Networks (Euspn 2017) / 7th International Conference on Current and Future Trends of Information and Communication Technologies in Healthcare (Icth-2017) / Affiliated Workshops, no. 113, pp. 571-576, 2017.
  • [14] B. Anandan, and C. Clifton, “Differentially Private Feature Selection for Data Mining,” Iwspa '18: Proceedings of the Fourth Acm International Workshop on Security and Privacy Analytics, 2018, pp. 43-53.
  • [15] A. Stokes et al., “Long Term Lead Survival in Adult Congenital Heart Disease Patients: A Retrospective Analysis Using Clinical Correspondence Data Mining,” Heart, 2018, no. 104, pp. A22-A23.
  • [16] A. Idri et al., “A systematic map of medical data preprocessing in knowledge discovery,” Computer Methods and Programs in Biomedicine, no. 162, pp. 69-85,2018.
  • [17] I. Ionita, and L. Ionita, “Classification Algorithms of Data Mining Applied for Demographic Processes,” Brain-Broad Research in Artificial Intelligence and Neuroscience, vol. 9, no. 1, pp. 94-100, 2018.
  • [18] R. Tibshirani, and J. Friedman, “The elements of statistical learning: data mining, inference, and prediction,” Springer Heidelberg, 2001.
  • [19] A. Berson, S. Smith, and K. Thearling, “Building Data Mining Applications for CRM McGraw-Hill,” 1999.
  • [20] J. Arora et al., “A review on association rule mining algorithms,” vol. 1, no.5, 2013.
  • [21] F. H. AL-Zawaidah, et al., “An improved algorithm for mining association rules in large databases,” vol. 1, no. 7, pp. 311-316, 2011.
  • [22] R. Agrawal, T. Imielinski, and A. Swami. “Mining associations between sets of items in large databases,” In Proceedings of the ACM SIGMOD International Conference on Management of Data, 1993.
  • [23] A. Geyer-Schulz, and M. Hahsler. “Evaluation of recommender algorithms for an internet information broker based on simple association rules and on the repeat-buying theory,” In proceedings WEBKDD, 2002.
  • [24] Kaur, C.J.I.J.o.A.R.i.C.E. and Technology, “Association rule mining using apriori algorithm: a survey,” 2013, no. 2(6).
  • [25] J. Han, J. Pei, and Y. Yin. “Mining frequent patterns without candidate generation,” In ACM sigmod record, 2000.
  • [26] Grahne, G. and J. Zhu. “Efficiently using prefix-trees in mining frequent itemsets,” In FIMI, 2003.
  • [27] Goethals, B.J.U.o.H., “Survey on frequent pattern mining,” no. 19, pp. 840-852,2003.
  • [28] M. J. Zaki, and K. Gouda. “Fast vertical mining using diffsets,” In Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining, 2003.
  • [29] M. Adda, L. Wu, and Y. Feng. “Rare itemset mining in Sixth International Conference on Machine Learning and Applications (ICMLA 2007),” IEEE, 2007.
  • [30] J. Pillai, and O.J.I.J.o.C.A. Vyas, “Overview of itemset utility mining and its applications,” vol. 5, no.11, pp. 9-13. .
  • [31] R. Agrawalet al., “Fast discovery of association rules,” vol. 12, no. 1, pp. 307-328,1996.
  • [32] N. Pasquier et al. “Discovering frequent closed itemsets for association rules in International Conference on Database Theory,” Springer, 1999.
  • [33] C. Lucchese, S. Orlando, and R. Perego. “DCI Closed: A Fast and Memory Efficient Algorithm to Mine Frequent Closed Itemsets,” FIMI, 2004.
  • [34] G. Grahne, J.J.I.t.o.k. Zhu, and D. engineering, “Fast algorithms for frequent itemset mining using fp-trees,”, vol. 17, no.10, pp. 1347-1362, 2005.
  • [35] N. Dwivedi, and S. R. Satti. “Set and array based hybrid data structure solution for Frequent Pattern Mining,” in 2015 Tenth International Conference on Digital Information Management (ICDIM), 2015.
Primary Language en
Subjects Engineering
Journal Section Articles
Authors

Orcid: 0000-0002-0920-2704
Author: Melih Nair (Primary Author)
Institution: Düzce Üniversitesi
Country: Turkey


Orcid: 0000-0002-8752-3335
Author: Fatih Kayaalp
Institution: Düzce Üniversitesi
Country: Turkey


Dates

Publication Date: July 31, 2019

Bibtex @research article { dubited581931, journal = {Düzce Üniversitesi Bilim ve Teknoloji Dergisi}, issn = {}, eissn = {2148-2446}, address = {Duzce University}, year = {2019}, volume = {7}, pages = {1985 - 2000}, doi = {10.29130/dubited.581931}, title = {Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data}, key = {cite}, author = {Nair, Melih and Kayaalp, Fatih} }
APA Nair, M , Kayaalp, F . (2019). Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data. Düzce Üniversitesi Bilim ve Teknoloji Dergisi, 7 (3), 1985-2000. DOI: 10.29130/dubited.581931
MLA Nair, M , Kayaalp, F . "Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data". Düzce Üniversitesi Bilim ve Teknoloji Dergisi 7 (2019): 1985-2000 <http://dergipark.org.tr/dubited/issue/46290/581931>
Chicago Nair, M , Kayaalp, F . "Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data". Düzce Üniversitesi Bilim ve Teknoloji Dergisi 7 (2019): 1985-2000
RIS TY - JOUR T1 - Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data AU - Melih Nair , Fatih Kayaalp Y1 - 2019 PY - 2019 N1 - doi: 10.29130/dubited.581931 DO - 10.29130/dubited.581931 T2 - Düzce Üniversitesi Bilim ve Teknoloji Dergisi JF - Journal JO - JOR SP - 1985 EP - 2000 VL - 7 IS - 3 SN - -2148-2446 M3 - doi: 10.29130/dubited.581931 UR - https://doi.org/10.29130/dubited.581931 Y2 - 2019 ER -
EndNote %0 Duzce University Journal of Science and Technology Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data %A Melih Nair , Fatih Kayaalp %T Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data %D 2019 %J Düzce Üniversitesi Bilim ve Teknoloji Dergisi %P -2148-2446 %V 7 %N 3 %R doi: 10.29130/dubited.581931 %U 10.29130/dubited.581931
ISNAD Nair, Melih , Kayaalp, Fatih . "Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data". Düzce Üniversitesi Bilim ve Teknoloji Dergisi 7 / 3 (July 2019): 1985-2000. https://doi.org/10.29130/dubited.581931
AMA Nair M , Kayaalp F . Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data. DUBİTED. 2019; 7(3): 1985-2000.
Vancouver Nair M , Kayaalp F . Performance Comparison of Association Rule Algorithms with SPMF on Automotive Industry Data. Düzce Üniversitesi Bilim ve Teknoloji Dergisi. 2019; 7(3): 2000-1985.