Araştırma Makalesi

Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması

Cilt: 2 Sayı: 2 29 Aralık 2017
PDF İndir

Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması

Öz

Kümeleme analizi nesnelerin doğal gruplarını bulmak için kullanılan bir yöntemdir. Kümeleme yapılırken küme içi homojenlik ile kümeler arası heterojenliğin yüksek olması istenir. Literatürde, kategorik verileri kümelemek için çok fazla yöntem yoktur ve var olanların hangisinin en iyi olduğu ile ilgili kesin bir bilgi bulunmamaktadır. Veri sayısına ve veri yapısına göre her bir yöntemin birbirine üstünlükleri ve eksiklikleri vardır. Ayrıca iyi bir kümeleme yapmak için kullanılacak değişken sayısı büyük önem taşımaktadır. Bu çalışmada kategorik verilerin kümelenmesi ile ilgilenildi. Hiyerarşik kümeleme tekniklerinden tek bağlantı tekniği, tam bağlantı tekniği, ortalama bağlantı tekniği ve bölmeli kümeleme tekniklerinden K-modes algoritması kullanılarak kümeleme analizi yapıldı ve sonuçlar karşılaştırıldı. Analiz sonuçlarına göre veri sayısı büyüdükçe kümeleme performansı hiyerarşik tekniklerde azalırken K-modes algoritmasında arttığı tespit edildi. 

Anahtar Kelimeler

Kaynakça

  1. [1] Guo L, 2008. Clustering Categorical Response, Master Thesis, Office of Graduate Studies College of Arts and Sciences, Georgia State University, 1-2.
  2. [2] Triphaty B K, Ghosh A, 2011. SSDR: An algorithm for Clustering Categorical Data Using Rough Set Theory, Advances in Applied Science Research, 2(3):314-326.
  3. [3] Huang Z, 1998. Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values”, Data Mining and Knowledge Discovery, 2(3): 283-304.
  4. [4] Gibson D, Kleinberg J, Raghavan P, 1998. Clustering categorical data: an approach based on dynamical systems, In Proceedings of the 24th VLDB Conference, New York, USA, 311-322.
  5. [5] Ganti V, Gehrke J, Ramakrishan R, 1999. CACTUS: Clustering categorical data using summaries, In Proceedings of ACM SIGKDD, International Conference on Knowledge Discovery&Data Mining, San Diego, CA, USA, 73- 83.
  6. [6] Guha S., Rastogi R., Shim K, 1999. ROCK: A robust clustering algorithm for categorical attributes, Proceedings of the IEEE International Conference on Data Engineering, Sydney, 345-366.
  7. [7] He Z, Xu X, Deng S 2002. Squeezer: An Efficient Algorithm for Clustering Categorical Data, Department of Computer Science and Engineering, Harbin Institue of Technology, 17(5):611-624.
  8. [8] Rezankova H, 2009. Cluster Analysis and Categorical Data, Vysoka Skola Economicka v Praze, Praha, 223-234.

Ayrıntılar

Birincil Dil

Türkçe

Konular

Mühendislik

Bölüm

Araştırma Makalesi

Yazarlar

Yayımlanma Tarihi

29 Aralık 2017

Gönderilme Tarihi

15 Mart 2017

Kabul Tarihi

21 Kasım 2017

Yayımlandığı Sayı

Yıl 2017 Cilt: 2 Sayı: 2

Kaynak Göster

APA
Baş Kaman, F. (2017). Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması. Sinop Üniversitesi Fen Bilimleri Dergisi, 2(2), 62-78. https://izlik.org/JA85NR69PN
AMA
1.Baş Kaman F. Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması. Sinopfbd. 2017;2(2):62-78. https://izlik.org/JA85NR69PN
Chicago
Baş Kaman, Ferhan. 2017. “Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması”. Sinop Üniversitesi Fen Bilimleri Dergisi 2 (2): 62-78. https://izlik.org/JA85NR69PN.
EndNote
Baş Kaman F (01 Aralık 2017) Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması. Sinop Üniversitesi Fen Bilimleri Dergisi 2 2 62–78.
IEEE
[1]F. Baş Kaman, “Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması”, Sinopfbd, c. 2, sy 2, ss. 62–78, Ara. 2017, [çevrimiçi]. Erişim adresi: https://izlik.org/JA85NR69PN
ISNAD
Baş Kaman, Ferhan. “Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması”. Sinop Üniversitesi Fen Bilimleri Dergisi 2/2 (01 Aralık 2017): 62-78. https://izlik.org/JA85NR69PN.
JAMA
1.Baş Kaman F. Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması. Sinopfbd. 2017;2:62–78.
MLA
Baş Kaman, Ferhan. “Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması”. Sinop Üniversitesi Fen Bilimleri Dergisi, c. 2, sy 2, Aralık 2017, ss. 62-78, https://izlik.org/JA85NR69PN.
Vancouver
1.Ferhan Baş Kaman. Kategorik Verilerde Kümeleme İçin Farklı Algoritmaların Karşılaştırılması. Sinopfbd [Internet]. 01 Aralık 2017;2(2):62-78. Erişim adresi: https://izlik.org/JA85NR69PN


Sinopfbd' de yayınlanan makaleler CC BY-NC 4.0 ile lisanslanmıştır.  88x31.png