İkinci el piyasada devredilen otomobil sayısı her geçen yıl artmaktadır. Bu durum ikinci el araç piyasasının detaylı bir
şekilde incelenmesini zorunlu kılmaktadır. Yeni geliştirilen analizler ve yığınla toplanabilen veri setleri yardımıyla ikinci el
araç piyasasının işleyiş mekanizmasına ilişkin faydalı bilgiler ortaya çıkabilmektedir. Çalışmanın amacı, ikinci el araçlara
ilişkin verilerin bulunduğu bir veri tabanını birliktelik kuralları ile incelemektir. Birliktelik kuralları bir arada gözlenen
özelliklerin belirlenmesinde başarıyla kullanılmaktadır. Bu çalışma için, 2016 yılının Temmuz ayında ve Ağustos ayının
ilk üç haftasında ikinci el otomobil ilanlarının yer aldığı bir siteden 211109 adet otomobile ait 73 adet değişken web
kazıma tekniği ile bir araya getirilmiştir. Birliktelik kurallarının oluşturulabilmesi için veri setinin mantıksal (boolean)
değişkenlerden oluşması gerekmektedir. Sayısal değişkenler, dağılımları göz önünde bulundurulmak üzere mantıksal
yapıya çevrilmiştir. Çalışmada apriori algoritması ile oluşturulan birliktelik kuralları ağ grafiği yardımı ile görselleştirilmiştir.
Çalışma sonunda “dizel araçlar az yakar, fazla hız yapamazlar, torkları yüksektir; yeni ve pahalı araçların vergisi
yüksektir” gibi kurallar oluşturulmuştur. Çalışmanın sonuçları ikinci el araç piyasasında işlem yapan taraflar için yol
gösterici nitelikte bilgiler içermektedir.
Veri madenciliği apriori algoritması ikinci el oto birliktelik kuralları ağ grafiği web kazıma
Number of road motor vehicles that are handed over are increasing over the years. That makes the detailed examination
of second hand car market is a necessity. It is possible to extract useful information about the operating mechanism of
second hand car market using new analysis techniques and massive datasets. The purpose of this study is to examine
the database which includes data belong to second hand cars by association rules. Association rules are successful at
determining which two objects are observed simultaneously in a dataset. For this study, a dataset includes to 21109
second hand cars with 73 variables is scraped from a website in July 2016 and August 2016. In order to apply the apriori
algorithm, the dataset must be consisted from Boolean variables. Numerical variables are converted to Boolean type by
using their distribution. The association rules that are created with apriori algorithm is visualized with a network graph. At
the end of the study rules such as “diesel cars have less fuel consumption, cannot go much faster, have higher torque
values; new and expensive cars have higher taxes” are created. The overall results have useful information for those
who operate in second hand car market.
Data mining apriori algorithm second-hand car association rules network graphs web scraping
Konular | Ekonomi |
---|---|
Bölüm | MAKALE |
Yazarlar | |
Yayımlanma Tarihi | 29 Mart 2017 |
Gönderilme Tarihi | 28 Mart 2017 |
Yayımlandığı Sayı | Yıl 2017 Cilt: 7 Sayı: 1 |
Bilginin ışığında aydınlanmak dileğiyle....
ODÜSOBİAD