Kümeleme analizi
nesnelerin doğal gruplarını bulmak için kullanılan bir yöntemdir. Kümeleme
yapılırken küme içi homojenlik ile kümeler arası heterojenliğin yüksek olması
istenir. Literatürde, kategorik verileri kümelemek için çok fazla yöntem yoktur
ve var olanların hangisinin en iyi olduğu ile ilgili kesin bir bilgi
bulunmamaktadır. Veri sayısına ve veri yapısına göre her bir yöntemin birbirine
üstünlükleri ve eksiklikleri vardır. Ayrıca iyi bir kümeleme yapmak için
kullanılacak değişken sayısı büyük önem taşımaktadır. Bu çalışmada kategorik
verilerin kümelenmesi ile ilgilenildi. Hiyerarşik kümeleme tekniklerinden tek
bağlantı tekniği, tam bağlantı tekniği, ortalama bağlantı tekniği ve bölmeli
kümeleme tekniklerinden K-modes algoritması kullanılarak kümeleme analizi
yapıldı ve sonuçlar karşılaştırıldı. Analiz sonuçlarına göre veri sayısı
büyüdükçe kümeleme performansı hiyerarşik tekniklerde azalırken K-modes
algoritmasında arttığı tespit edildi.
Subjects | Engineering |
---|---|
Journal Section | Research Articles |
Authors | |
Publication Date | December 29, 2017 |
Submission Date | March 15, 2017 |
Published in Issue | Year 2017 Volume: 2 Issue: 2 |