Gözetimsiz Makine Öğrenme Teknikleri ile Miktara Dayalı Negatif Birliktelik Kural Madenciliği
Abstract
Birliktelik kuralları,
veri kümesindeki nesnelerin varlığının diğer nesnelerin varlığını nasıl
etkilediğini tanımlanmaktadır. Bu kurallar, alış veriş sepeti analizinde, bir
ürünün aynı işlemdeki diğer ürün üzerindeki etkisini incelemek için
kullanılmaktadır. Pozitif ve negatif birliktelik kuralları olarak iki şekilde
ifade edilebilirler. Pozitif birliktelik kuralı, bir ürün varlığının aynı
işlemde diğer ürünü bulma olanağını arttırdığını gösterirken, negatif
birliktelik kuralı, bir çeşidin bulunmasının, diğer ürünün aynı işlemde
olabilme ihtimalini düşürdüğünü göstermektedir. Daha önceki işlemlerdeki sıklıkları
araştırdığı için pozitif birliktelik kuralı madenciliği, negatif birliktelik
kuralları madenciliğine göre daha kolaydır. Negatif birlikteki kuralı
madenciliğinde daha önceki işlemler araştırıldığında, ilgisiz ürünler
arasındaki ilgisizlik kurallarının madenciliği ile karşılaşılır. Bu kuralların
çıkarımından kaçınmak için, mevcut negatif birliktelik kuralı, madencilik
tekniklerine sağlanan önceden tanımlı alan bilgisine dayanır. Dolayısıyla bu
bilgi, bulunan kuralların ilgili ürünlere ait olması için kullanılır. Bu
çalışmada, satın alınan miktarlara dayalı veri kümesinden otomatik olarak bilgi
alınması ile veri kümesindeki ürünler arasındaki negatif birliktelik
kurallarını bulma kabiliyetine sahip yeni bir teknik önerilmektedir.
Birliktelik kuralı madenciliği, gözetimsiz veri madencilik tekniği olduğundan,
sağlanan veri kümesi etiketsiz verilerden oluşmaktadır. DBSCAN kümeleme
yönteminin kullanımı, gerçek yaşam işlem veri tabanında test edildiğinde %0,21
destek ve %91,84 güven ortalama değerleri ile 4.086 şeklinde daha iyi negatif
birliktelik kuralı sonucu göstermiştir. K-ortalama kümeleme yönteminin
kullanımı ile çıkarılan alan bilgisine dayalı negatif birliktelik kuralları
madenciliği sonucu, %0,19 destek ve %85,84 güven ortalama değerine sahip 1.780
iken, önerilen alan bilgisiz negatif birliktelik kuralı sonucu %0,12 destek ve
%99,37 güven ortalama değerli 9.066 sonucunu vermiştir.
Keywords
References
- [1] A. L. Buczak and E. Guven, "A survey of data mining and machine learning methods for cyber security intrusion detection," IEEE Communications Surveys & Tutorials, vol. 18, pp. 1153-1176, 2016.
- [2] A. Holzinger and I. Jurisica, "Knowledge discovery and data mining in biomedical informatics: The future is in integrative, interactive machine learning solutions," in Interactive knowledge discovery and data mining in biomedical informatics, ed: Springer, 2014, pp. 1-18.
- [3] M. Hahsler and R. Karpienko, "Visualizing association rules in hierarchical groups," Journal of Business Economics, vol. 87, pp. 317-335, 2017.
- [4] Y. Zhao and S. S. Bhowmick, "Association Rule Mining with R," A Survey Nanyang Technological University, Singapore, 2015.
- [5] P. Kazienko, Associations: discovery, analysis and applications: Oficyna Wydawnicza Politechniki Wrocławskiej, 2008.
- [6] G. Suchacka and G. Chodak, "Using association rules to assess purchase probability in online stores," Information Systems and e-Business Management, vol. 15, pp. 751-780, 2017.
- [7] S. Datta and S. Bose, "Discovering association rules partially devoid of dissociation by weighted confidence," in Recent Trends in Information Systems (ReTIS), 2015 IEEE 2nd International Conference on, 2015, pp. 138-143.
- [8] S. Brin, R. Motwani, and C. Silverstein, "Beyond market baskets: Generalizing association rules to correlations," in Acm Sigmod Record, 1997, pp. 265-276.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Authors
Tansel Dökeroğlu
*
Türkiye
Zahraa Mohammed Malik Malık
This is me
Türkiye
Shadi Al-shehabı
Türkiye
Publication Date
August 1, 2018
Submission Date
April 12, 2018
Acceptance Date
June 11, 2018
Published in Issue
Year 2018 Volume: 6 Number: 4
Cited By
Otomotiv Endüstrisi Verileri Üzerinde Birliktelik Kuralları Algoritmalarının SPMF ile Performans Karşılaştırması
Düzce Üniversitesi Bilim ve Teknoloji Dergisi
https://doi.org/10.29130/dubited.581931TV ve Set Üstü Cihaz Arayüzlerinin Kullanılabilirliğinin Değerlendirmesinde Makine Öğrenmesinin Kullanımı
European Journal of Science and Technology
https://doi.org/10.31590/ejosat.946025Kullanılabilirlik Sezgiselleri ile Problemlerinin İlişkilendirilmesi: Makine Öğrenmesi Kullanımı
European Journal of Science and Technology
https://doi.org/10.31590/ejosat.946150Görüntü tabanlı özelliklerden ve makine öğrenmesi yöntemlerinden faydalanılarak kötücül yazılım tespiti
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.994289