Clustering methods that one of the most striking subjects of data mining are the most intensive research area of this field and there are many techniques and related methods on it. Some of the studies in this field have been obtained by updating the algorithms previously available and their performance has been evaluated. The most interesting topic of clustering techniques is K-Means method. Every initializing of K-Means algorithm return different cluster outputs because of random selection of the initial centers. Therefore, the reliability of the results is adversely affected and the number of iterations increase for clustering accuracy.One of the methods that tries to eliminate this problem is the k-means ++ method. In this study, the proposed method that we called double k was applied to synthetic dataset. It has been observed that double k method which finding final cluster labels is more successful than the K-Means and K-Means++ methods.
Data mining Clustering Initial Centroids ,K-Means ,K-Means++
Veri madenciliğinin en dikkat çekici konularından biri olan kümelenme yöntemleri, bu alanın en yoğun araştırma sahası olup kümelenme üzerine bir çok teknik ve bağlı yöntemler bulunmaktadır.Bu alandaki çalışmaların bir kısmı daha önce mevcut olan algoritmaların güncellenmesiyle elde edilmiş ve performansları değerlendirilmiştir.Kümelenmenin en çok ilgi duyulan konusu K-Ortalamalar yöntemidir.K-Ortalamalar algoritması her çalıştırıldığında, başlangıç merkezlerinin rastgele seçilmesi nedeniyle farklı küme çıktıları döndürür.Bu nedenle, sonuçların güvenilirliği olumsuz etkilenir ve kümeleme doğruluğu için yineleme sayısı artar.Bu sorunu ortadan kaldırmaya çalışan yöntemlerden biri de K-Ortalamalar++ yöntemidir.Bu çalışmada, sentetik veri kümesine çift k olarak adlandırdığımız önerilen yöntem uygulanmıştır.Çift k yöntemi, nihai kümelenme etiketlerini bulmada K-Ortalamalar ve K-Ortalamalar++ yöntemine gore daha başarılı olduğu gözlenmiştir.
Veri Madenciliği Kümeleme Başlangıç Ağırlık Merkezleri K-Ortalamalar K-Ortalamalar++
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Nisan 2021 |
Yayımlandığı Sayı | Yıl 2021 Sayı: 23 |