Kümeleme analizi sıklıkla kullanılan, temelde, birbirine benzeyen gözlemleri bir araya gruplamayı amaçlayan çok değişkenli bir istatistik yöntemidir. Kümeleme analizi, hiyerarşik ve hiyerarşik olmayan algoritmalar şeklinde iki ana başlık altında toplanabilir. Bu iki başlık arasındaki farklardan biri, hiyerarşik olmayan algoritmaların, analiz öncesinde küme sayısına ihtiyaç duymasıdır. Ayrıca, hiyerarşik algoritmalarla oluşan küme üyelikleri nihaidir ve değişmezler. Hiyerarşik olmayan algoritmalarda ise, küme üyelikleri, sabit kalana kadar değişmektedir. İstatistiksel yöntemlerde, özellikle son yıllarda açık kaynak kodlu programların ve programlama dillerinin kullanımı yaygınlaşmıştır. Mevcut çalışmada, R programlama dili kullanılarak, hiyerarşik ve hiyerarşik olmayan kümeleme algoritmalarına yönelik uygulamaların gösterilmesi amaçlanmıştır. Ayrıca, kümeleme analizi öncesinde küme sayısının nasıl belirlenebileceği de R programlamayla gösterilmiştir. Küme sayısının belirlenmesi için literatürde sıklıkla kullanılan Elbow, ortalama Silhouette ve GAP istatistiği yöntemleri kullanılmıştır. Çalışmada analizler için factoextra() ve cluster() paketleri kullanılmıştır. Ayrıca çalışmada kullanılan kodların ve görsellerin gösterimi RMarkdown’da üretilmiştir. Kümeleme sonuçlarının nasıl yorumlandığının gösterimi için k-ortalamalar sonucunda oluşan kümeler yorumlanmıştır.
Hiyerarşik Kümeleme Hiyerarşik Olmayan Kümeleme K-Ortalamalar R Programlama
Hiyerarşik Kümeleme Hiyerarşik Olmayan Kümeleme K-Ortalamalar R Programlama
Birincil Dil | Türkçe |
---|---|
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Aralık 2022 |
Gönderilme Tarihi | 12 Kasım 2022 |
Yayımlandığı Sayı | Yıl 2022 Cilt: 22 Sayı: Özel Sayı 2 |
Bu eser Creative Commons Atıf-GayriTicari 4.0 Uluslararası Lisansı ile lisanslanmıştır.