Sınıflandırma, herhangi bir konu hakkında gözlemlenen verilerin yapılarını inceleyerek verileri birbirlerine benzer gruplara, içeriklere ve belirlediğimiz bazı özelliklere göre gruplandırma işlemi olarak tanımlanabilir. Böylece birbirlerine benzeyen gruplarda yer alan gözlemlerin araştırma amaçlarına göre değerlendirilmesi ve yorumlanması kolaylaşacaktır. Kümeleme analizi sınıflandırma çalışmalarında en sık kullanılan yöntemlerden biridir. Kümeleme analizi doğal grupları bulunmayan verileri grup veya kümelerin sınırlı bir sayısına ayırmayı amaçlayan çok değişkenli istatistiksel bir yöntemdir. Gri İlişkisel Kümeleme yönteminde kümelerin belirli bir kurala göre gruplanmış nesnelerden oluştuğu için kümeler homojenliğe sahip olması ve yeniden hesaplama yapılmaya gerek duymadan nesnelerin kendi içerisinde ayrımını yapabilen bir yöntemdir. Ayrıca küme sayısı analiz öncesinde değil, kümeleme gerçekleştirildikten sonra belirlenebileceği için yaygın kullanılan diğer kümeleme algoritmalarına göre alternatif bir yaklaşım sunabilmektedir.
Bu çalışmada Türkiye’deki illerin sosyo-ekonomik veriler yardımıyla gri kümeleme analizi ile sınıflandırılması amaçlanmıştır. Türkiye İstatistik Kurumu’ndan alınmış veriler ile öncelikle gri ilişkisel katsayı matrisleri oluşturulmuş ve sonrasında kümeleme analizi yapılarak illerin sosyo-ekonomik verilere göre dağılımı belirlenmiştir. Analizler eğitim, tarım, istihdam gibi alt başlıklarda verilen veri kategorileri için de ayrı ayrı yapılarak Türkiye’nin sosyo-ekonomik haritası belirlenmeye çalışılmıştır.
Gri Kümeleme Analizi Sosyo-Ekonomik Veri Sınıflandırma Gri İlişkisel Analiz
Bu çalışma Prof. Dr. N. Alp Erilli danışmanlığında Kübra Karadaş tarafından yazılan ve Sivas Cumhuriyet Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri bölümü tarafından onaylanan “Gri Kümeleme Analizi ve Bir Uygulama” isimli yüksek lisans tezinden türetilmiştir.
Classification can be defined as the process of examining the structures of the data observed on any subject and grouping the data according to similar groups, contents and some characteristics we have determined. Thus, it will be easier to evaluate and interpret the observations in similar groups according to the research objectives. Cluster analysis is one of the most frequently used methods in classification studies. Cluster analysis is a multivariate statistical method that aims to classify data without natural groups into a limited number of groups or clusters. In the Gray Relational Clustering method, since the clusters consist of objects grouped according to a certain rule, the clusters have homogeneity and it is a method that can distinguish objects within itself without the need for recalculation. In addition, since the number of clusters can be determined after clustering is performed, not before the analysis, it can offer an alternative approach to other commonly used clustering algorithms.
In this study, it is aimed to classify the provinces in Turkiye by using gray clustering analysis with the help of socio-economic data. Gray relational coefficient matrices were first created with the data obtained from the Turkish Statistical Institute and then clustering analysis was performed to determine the distribution of provinces according to socio-economic data. Analyses were also conducted separately for the data categories given under sub-headings such as education, agriculture and employment, and with this it is aimed to determine the socio-economic map of Turkiye.
Gray Clustering Analysis Socio-Economic Data Classification Gray Relational Analysis
Birincil Dil | Türkçe |
---|---|
Konular | İstatistiksel Analiz, Uygulamalı İstatistik |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 28 Aralık 2023 |
Gönderilme Tarihi | 21 Kasım 2023 |
Kabul Tarihi | 19 Aralık 2023 |
Yayımlandığı Sayı | Yıl 2023 Cilt: 13 Sayı: 2 |