Sınıflandırma, herhangi bir konu hakkında gözlemlenen verilerin yapılarını inceleyerek verileri birbirlerine benzer gruplara, içeriklere ve belirlediğimiz bazı özelliklere göre gruplandırma işlemi olarak tanımlanabilir. Böylece birbirlerine benzeyen gruplarda yer alan gözlemlerin araştırma amaçlarına göre değerlendirilmesi ve yorumlanması kolaylaşacaktır. Kümeleme analizi sınıflandırma çalışmalarında en sık kullanılan yöntemlerden biridir. Kümeleme analizi doğal grupları bulunmayan verileri grup veya kümelerin sınırlı bir sayısına ayırmayı amaçlayan çok değişkenli istatistiksel bir yöntemdir. Gri İlişkisel Kümeleme yönteminde kümelerin belirli bir kurala göre gruplanmış nesnelerden oluştuğu için kümeler homojenliğe sahip olması ve yeniden hesaplama yapılmaya gerek duymadan nesnelerin kendi içerisinde ayrımını yapabilen bir yöntemdir. Ayrıca küme sayısı analiz öncesinde değil, kümeleme gerçekleştirildikten sonra belirlenebileceği için yaygın kullanılan diğer kümeleme algoritmalarına göre alternatif bir yaklaşım sunabilmektedir.
Bu çalışmada Türkiye’deki illerin sosyo-ekonomik veriler yardımıyla gri kümeleme analizi ile sınıflandırılması amaçlanmıştır. Türkiye İstatistik Kurumu’ndan alınmış veriler ile öncelikle gri ilişkisel katsayı matrisleri oluşturulmuş ve sonrasında kümeleme analizi yapılarak illerin sosyo-ekonomik verilere göre dağılımı belirlenmiştir. Analizler eğitim, tarım, istihdam gibi alt başlıklarda verilen veri kategorileri için de ayrı ayrı yapılarak Türkiye’nin sosyo-ekonomik haritası belirlenmeye çalışılmıştır.
Bu çalışma Prof. Dr. N. Alp Erilli danışmanlığında Kübra Karadaş tarafından yazılan ve Sivas Cumhuriyet Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri bölümü tarafından onaylanan “Gri Kümeleme Analizi ve Bir Uygulama” isimli yüksek lisans tezinden türetilmiştir.
Classification can be defined as the process of examining the structures of the data observed on any subject and grouping the data according to similar groups, contents and some characteristics we have determined. Thus, it will be easier to evaluate and interpret the observations in similar groups according to the research objectives. Cluster analysis is one of the most frequently used methods in classification studies. Cluster analysis is a multivariate statistical method that aims to classify data without natural groups into a limited number of groups or clusters. In the Gray Relational Clustering method, since the clusters consist of objects grouped according to a certain rule, the clusters have homogeneity and it is a method that can distinguish objects within itself without the need for recalculation. In addition, since the number of clusters can be determined after clustering is performed, not before the analysis, it can offer an alternative approach to other commonly used clustering algorithms.
In this study, it is aimed to classify the provinces in Turkiye by using gray clustering analysis with the help of socio-economic data. Gray relational coefficient matrices were first created with the data obtained from the Turkish Statistical Institute and then clustering analysis was performed to determine the distribution of provinces according to socio-economic data. Analyses were also conducted separately for the data categories given under sub-headings such as education, agriculture and employment, and with this it is aimed to determine the socio-economic map of Turkiye.
Primary Language | Turkish |
---|---|
Subjects | Statistical Analysis, Applied Statistics |
Journal Section | Research Articles |
Authors | |
Publication Date | December 28, 2023 |
Submission Date | November 21, 2023 |
Acceptance Date | December 19, 2023 |
Published in Issue | Year 2023 Volume: 13 Issue: 2 |