Bölümleyici kümeleme algoritmalarında girdi olarak küme sayısı parametresi kullanılmakta ve kümelemenin başarısı büyük ölçüde analiz öncesi seçilen bu değere bağlı olmaktadır. Optimal küme sayısını bulmak için analiz sonrasında küme geçerliliği kontrolleri yapılsa da hem hesaplama zamanı maliyeti hem de kullanılan ölçütlerin veri yapılarına duyarlılığından etkilenmektedir. Bu nedenle küme sayısını analiz öncesi tahmin eden yöntemlere ihtiyaç duyulmaktadır. Görsel kümelenme eğilimi değerlendirmesi (GÖKED), küme sayısını bulmak için kullanılan öncü algoritmalardan biridir. Bu çalışmada görsel kümelenme eğilimi algoritmasının tanıtımı yapılarak R ortamında geliştirilen bir GÖKED fonksiyonu ile test edilmektedir
Küme analizi kümelenme eğilimi değerlendirmesi veri görüntüleme
In cluster analysis, the partitioning algorithms require a priori estimate of number of clusters (c) as an input parameter, and thus the success of partitioning depends mostly on this parameter. In order to find an optimal c, the obtained results are checked by the various cluster validity indices at the end of each run of successive cluster analyses. Cluster validation is time consuming, and also depends on the clustering indices which may not guarantee the quality of clustering since their performances vary with complexity in data structures. In order to find an optimal number of clusters in data sets, one may benefit from the pre-analysis approaches before going to clustering. The visual assessment of clustering tendency (VAT) is a frontier algorithm which produces a grey-level image of reordered distance matrix showing existing clusters with dark blocks. This paper aims to introduce VAT algorithm and demonstrate it with a user-defined function developed in R statistical computing environment
Cluster analysis clustering tendency assessment data visualization
Diğer ID | JA22BB73JV |
---|---|
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 1 Aralık 2015 |
Yayımlandığı Sayı | Yıl 2015 Cilt: 30 Sayı: 2 |