Araştırma Makalesi

R Programlama Dili ile Kümeleme Analizi

Cilt: 22 Sayı: Özel Sayı 2 31 Aralık 2022
PDF İndir
TR

R Programlama Dili ile Kümeleme Analizi

Öz

Kümeleme analizi sıklıkla kullanılan, temelde, birbirine benzeyen gözlemleri bir araya gruplamayı amaçlayan çok değişkenli bir istatistik yöntemidir. Kümeleme analizi, hiyerarşik ve hiyerarşik olmayan algoritmalar şeklinde iki ana başlık altında toplanabilir. Bu iki başlık arasındaki farklardan biri, hiyerarşik olmayan algoritmaların, analiz öncesinde küme sayısına ihtiyaç duymasıdır. Ayrıca, hiyerarşik algoritmalarla oluşan küme üyelikleri nihaidir ve değişmezler. Hiyerarşik olmayan algoritmalarda ise, küme üyelikleri, sabit kalana kadar değişmektedir. İstatistiksel yöntemlerde, özellikle son yıllarda açık kaynak kodlu programların ve programlama dillerinin kullanımı yaygınlaşmıştır. Mevcut çalışmada, R programlama dili kullanılarak, hiyerarşik ve hiyerarşik olmayan kümeleme algoritmalarına yönelik uygulamaların gösterilmesi amaçlanmıştır. Ayrıca, kümeleme analizi öncesinde küme sayısının nasıl belirlenebileceği de R programlamayla gösterilmiştir. Küme sayısının belirlenmesi için literatürde sıklıkla kullanılan Elbow, ortalama Silhouette ve GAP istatistiği yöntemleri kullanılmıştır. Çalışmada analizler için factoextra() ve cluster() paketleri kullanılmıştır. Ayrıca çalışmada kullanılan kodların ve görsellerin gösterimi RMarkdown’da üretilmiştir. Kümeleme sonuçlarının nasıl yorumlandığının gösterimi için k-ortalamalar sonucunda oluşan kümeler yorumlanmıştır.

Anahtar Kelimeler

Kaynakça

  1. Arora, P., Deepali, D. ve Varshney, S. (2016). Analysis of k-means and k-medoids algorithm for big data. Procedia Computer Science, 78, 507-512. doi: 10.1016/j.procs.2016.02.095
  2. Berry, M. J. ve Linoff, G. S. (2004). Data mining techniques: for marketing, sales, and customer relationship management. New York: John Wiley & Sons.
  3. Bholowalia, P.ve Kumar, A. (2014). EBK-means: A clustering technique based on elbow method and k-means in WSN. International Journal of Computer Applications, 105(9), 17-24. Erişim adresi: https://research.ijcaonline.org/volume105/number9/pxc3899674.pdf
  4. Brock, G., Pihur, V., Datta, S. ve Datta, S. (2008). clValid: An R package for cluster validation. Journal of Statistical Software, 25, 1-22. Erişim adresi: https://www.jstatsoft.org/article/view/v025i04
  5. Celebi, M. E., Kingravi, H. A. ve Vela, P. A. (2013). A comparative study of efficient initialization methods for the k-means clustering algorithm. Expert systems with applications, 40(1), 200-210. doi:10.1016/j.eswa.2012.07.021
  6. Cohen-Addad, V., Kanade, V., Mallmann-Trenn, F. ve Mathieu, C. (2019). Hierarchical clustering: Objective functions and algorithms. Journal of the ACM (JACM), 66(4), 1-42. doi:10.1145/3321386
  7. Day, W. H. ve Edelsbrunner, H. (1984). Efficient algorithms for agglomerative hierarchical clustering methods. Journal of classification, 1(1), 7-24. Erişim adresi: https://link.springer.com/article/10.1007/bf01890115
  8. Dehariya, V. K., Shrivastava, S. K.ve Jain, R. C. (2010, November). Clustering of image data set using k-means and fuzzy k-means algorithms. In 2010 International conference on computational intelligence and communication networks (pp. 386-391). IEEE. doi: 10.1109/CICN.2010.80

Ayrıntılar

Birincil Dil

Türkçe

Konular

-

Bölüm

Araştırma Makalesi

Yazarlar

Cem Gürler
Türkiye

Yayımlanma Tarihi

31 Aralık 2022

Gönderilme Tarihi

12 Kasım 2022

Kabul Tarihi

29 Aralık 2022

Yayımlandığı Sayı

Yıl 2022 Cilt: 22 Sayı: Özel Sayı 2

Kaynak Göster

APA
Gürler, C. (2022). R Programlama Dili ile Kümeleme Analizi. Anadolu Üniversitesi Sosyal Bilimler Dergisi, 22(Özel Sayı 2), 341-366. https://doi.org/10.18037/ausbd.1227364
AMA
1.Gürler C. R Programlama Dili ile Kümeleme Analizi. AÜSBD. 2022;22(Özel Sayı 2):341-366. doi:10.18037/ausbd.1227364
Chicago
Gürler, Cem. 2022. “R Programlama Dili ile Kümeleme Analizi”. Anadolu Üniversitesi Sosyal Bilimler Dergisi 22 (Özel Sayı 2): 341-66. https://doi.org/10.18037/ausbd.1227364.
EndNote
Gürler C (01 Aralık 2022) R Programlama Dili ile Kümeleme Analizi. Anadolu Üniversitesi Sosyal Bilimler Dergisi 22 Özel Sayı 2 341–366.
IEEE
[1]C. Gürler, “R Programlama Dili ile Kümeleme Analizi”, AÜSBD, c. 22, sy Özel Sayı 2, ss. 341–366, Ara. 2022, doi: 10.18037/ausbd.1227364.
ISNAD
Gürler, Cem. “R Programlama Dili ile Kümeleme Analizi”. Anadolu Üniversitesi Sosyal Bilimler Dergisi 22/Özel Sayı 2 (01 Aralık 2022): 341-366. https://doi.org/10.18037/ausbd.1227364.
JAMA
1.Gürler C. R Programlama Dili ile Kümeleme Analizi. AÜSBD. 2022;22:341–366.
MLA
Gürler, Cem. “R Programlama Dili ile Kümeleme Analizi”. Anadolu Üniversitesi Sosyal Bilimler Dergisi, c. 22, sy Özel Sayı 2, Aralık 2022, ss. 341-66, doi:10.18037/ausbd.1227364.
Vancouver
1.Cem Gürler. R Programlama Dili ile Kümeleme Analizi. AÜSBD. 01 Aralık 2022;22(Özel Sayı 2):341-66. doi:10.18037/ausbd.1227364

Cited By