Kümeleme analizi
nesnelerin doğal gruplarını bulmak için kullanılan bir yöntemdir. Kümeleme
yapılırken küme içi homojenlik ile kümeler arası heterojenliğin yüksek olması
istenir. Literatürde, kategorik verileri kümelemek için çok fazla yöntem yoktur
ve var olanların hangisinin en iyi olduğu ile ilgili kesin bir bilgi
bulunmamaktadır. Veri sayısına ve veri yapısına göre her bir yöntemin birbirine
üstünlükleri ve eksiklikleri vardır. Ayrıca iyi bir kümeleme yapmak için
kullanılacak değişken sayısı büyük önem taşımaktadır. Bu çalışmada kategorik
verilerin kümelenmesi ile ilgilenildi. Hiyerarşik kümeleme tekniklerinden tek
bağlantı tekniği, tam bağlantı tekniği, ortalama bağlantı tekniği ve bölmeli
kümeleme tekniklerinden K-modes algoritması kullanılarak kümeleme analizi
yapıldı ve sonuçlar karşılaştırıldı. Analiz sonuçlarına göre veri sayısı
büyüdükçe kümeleme performansı hiyerarşik tekniklerde azalırken K-modes
algoritmasında arttığı tespit edildi.
Konular | Mühendislik |
---|---|
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 29 Aralık 2017 |
Gönderilme Tarihi | 15 Mart 2017 |
Yayımlandığı Sayı | Yıl 2017 Cilt: 2 Sayı: 2 |