Gri Kümeleme Analizi ile Türkiye’deki Şehirlerin Sosyo-Ekonomik Verilere Göre Sınıflandırılması

Kübra Karadaş; Necati Alp Erilli

Research Article

Gri Kümeleme Analizi ile Türkiye’deki Şehirlerin Sosyo-Ekonomik Verilere Göre Sınıflandırılması

Year 2023, Volume: 13 Issue: 2, 60 - 74, 28.12.2023

Kübra Karadaş , Necati Alp Erilli

Abstract

Sınıflandırma, herhangi bir konu hakkında gözlemlenen verilerin yapılarını inceleyerek verileri birbirlerine benzer gruplara, içeriklere ve belirlediğimiz bazı özelliklere göre gruplandırma işlemi olarak tanımlanabilir. Böylece birbirlerine benzeyen gruplarda yer alan gözlemlerin araştırma amaçlarına göre değerlendirilmesi ve yorumlanması kolaylaşacaktır. Kümeleme analizi sınıflandırma çalışmalarında en sık kullanılan yöntemlerden biridir. Kümeleme analizi doğal grupları bulunmayan verileri grup veya kümelerin sınırlı bir sayısına ayırmayı amaçlayan çok değişkenli istatistiksel bir yöntemdir. Gri İlişkisel Kümeleme yönteminde kümelerin belirli bir kurala göre gruplanmış nesnelerden oluştuğu için kümeler homojenliğe sahip olması ve yeniden hesaplama yapılmaya gerek duymadan nesnelerin kendi içerisinde ayrımını yapabilen bir yöntemdir. Ayrıca küme sayısı analiz öncesinde değil, kümeleme gerçekleştirildikten sonra belirlenebileceği için yaygın kullanılan diğer kümeleme algoritmalarına göre alternatif bir yaklaşım sunabilmektedir.
Bu çalışmada Türkiye’deki illerin sosyo-ekonomik veriler yardımıyla gri kümeleme analizi ile sınıflandırılması amaçlanmıştır. Türkiye İstatistik Kurumu’ndan alınmış veriler ile öncelikle gri ilişkisel katsayı matrisleri oluşturulmuş ve sonrasında kümeleme analizi yapılarak illerin sosyo-ekonomik verilere göre dağılımı belirlenmiştir. Analizler eğitim, tarım, istihdam gibi alt başlıklarda verilen veri kategorileri için de ayrı ayrı yapılarak Türkiye’nin sosyo-ekonomik haritası belirlenmeye çalışılmıştır.

Keywords

Gri Kümeleme Analizi, Sosyo-Ekonomik Veri, Sınıflandırma, Gri İlişkisel Analiz

Ethical Statement

Bu çalışma Prof. Dr. N. Alp Erilli danışmanlığında Kübra Karadaş tarafından yazılan ve Sivas Cumhuriyet Üniversitesi, Sosyal Bilimler Enstitüsü, Ekonometri bölümü tarafından onaylanan “Gri Kümeleme Analizi ve Bir Uygulama” isimli yüksek lisans tezinden türetilmiştir.

References

Albayrak, A. S. (2005). Türkiye’deki illerin Sosyoekonomik Gelişmişlik Düzeylerinin Çok Değişkenli İstatistik Yöntemlerle İncelenmesi, ZKÜ Sosyal Bilimler Dergisi, Cilt:1 Sayı:1.
Anderberg, M. R. (1973). Cluster Analysis for Applications, Academic Press, New York.
Balasko, B., Abonyi, J., Feil, B. (2005). Fuzzy clustering and data analysis toolbox. Department of Process Engineering, University of Veszprem, Veszprem.
Birkalan, A. Ö., Bay, H. (2022). Bölgesel Asgari Ücret Varsayımı Altında Bölgelerin Kümeleme Analizi Yöntemleriyle Tespiti. Maliye Dergisi, Temmuz-Aralık; 183: 24-48.
Bulut, H. (2019). Türkiye'deki illerin yaşam endekslerine göre kümelenmesi. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 23 (1), 74-82.
Chang, K. C., Yeh, M. F. (2005). Grey relational analysis-based approach for data clustering, IEE Proceedings - Vision Image and Signal Processing, 152 (2), 165-172.
Çelik, Ş. (2013). Kümeleme analizi ile sağlık göstergelerine göre Türkiye'deki illerin sınıflandırılması. Doğuş Üniversitesi Dergisi, 14 (2), 175-194.
Deng, J. L. (1982). Control Problems of Grey Systems, Systems & Control Letters, 1 (5), 288-294.
Erilli, N.A. (2009). Kümeleme Analizine Bulanık Yaklaşım Algoritmaları ve Uygulamalar, Yayınlanmamış Yüksek Lisans Tezi, Ondokuz Mayıs Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, Samsun.
Erilli, N. A., Tunç, T., Yüksel, Ö., Yolcu, U. (2009). İllerin Sosyoekonomik Verilere Dayanarak Bulanık Kümeleme Analizi ile Sınıflandırılması, e-Journal of New World Sciences Academy, 4(1), 1-11.
Filiz, Z. (2005). İllerin sosyo-ekonomik düzeylerine göre gruplandırılmasında farklı yaklaşımlar, Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Dergisi, 6(1), 77-100.
Hamurcu, M., Tamer, E. (2015). Ankara Büyükşehir Belediyesi’nde çok ölçütlü karar verme yöntemi ile monoray güzergâh seçimi, Transist, 8 s. 410-419.
Jain, A.K., Dubes, R.C. (1988). Algorithms for clustering data, Prentice Hall, New Jersey.
Kalaycı, Ş. (2005). SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri, Asil Yayıncılık, Ankara.
Kandemir, A. Ş. (2018). Bulanık Kümeleme Analizi ile Türkiye'deki İllerin Konaklama İstatistiklerine Göre Sınıflandırılması. Journal of Travel and Hospitality Management, 15(3), 657-668.
Kaygısız, Z., Saraçlı, S., Dokuzlar, K., (2005). İllerin Gelişmişlik Düzeyini Etkileyen Faktörlerin Path Analizi ve Kümeleme Analizi İle İncelenmesi, VII. Uluslararası Ekonometri ve İstatistik Sempozyumu, İ. Ü., Ekonometri Bölümü, İstanbul, 26–27 Mayıs.
Ke, L., Xiaoliub, S., Zhongfua, T., Wenyanb, G. (2012). Grey Clustering Analysis Method for Overseas Energy Project Investment Risk Decision, Systems Engineering Procedia 3 (3), 55-62.
Kohonen, T. (1995). Self-organizing maps, Springer-Verlag, New York.
Köse, E., Aplak H. S., Kabak, M. (2013). Personel Seçimi için Gri Sistem Teori Tabanli Bütünlesik Bir Yaklasim, Ege Akademik Bakis, 13(4), 461.
Lin, Z. (2015). A Multi-attribute Evaluation Model of the Development Competitiveness of Tourism cities based on Grey Clustering Analysis, International Journal of Hybrid Information Technology, 8(10), 331-338.
Liu, S., Forrest J. Y. L. (2010). Grey systems: Theory and applications. Springer-Verlag Berlin Heidelberg.
Mulder, N.J. (1985). Decision Making and Classification. Photogrammetria, 40. 95-116.
Rousseuw, P. J. (1987). Silhouettes: A Graphical Aid to the Interpretation and Validation of Cluster Analysis. Journal of Computational and Applied Mathematics. 20: 53- 65.
Tatlıdil, H. (2002). Uygulamalı Çok Değişkenli İstatistiksel Analiz, Akademi Matbaası, Ankara.
Tekin, B. (2015). Temel Sağlık Göstergeleri Açısından Türkiye'deki İllerin Gruplandırılması: Bir Kümeleme Analizi Uygulaması. Çankırı Karatekin Üniversitesi İİBF Dergisi, 5(2), 389-416.
URL-1: www.tuik.gov.tr (Erişim tarihi: 10.10.2022)
Wong, C. C., Chen, C. C., Su, M. C. (2001). A novel algorithm for data clustering, Pattern Recognition, 34(2), 425-442.
Xie, L., Beni, G. (1991). A Validity Measure for Fuzzy Clustering, IEEE Trans. On Pattern Analysis and Machine Int. 13(4), 841-846.
Zorlutuna, Ş., Erilli, N. A. (2018). Sosyo-Ekonomik Verilere göre İllerin Bulanık C-Ortalamalar Yöntemi ile Sınıflandırılması: 2002-2008-2013 Dönemleri Karşılaştırması. İktisadi Yenilik Dergisi, 5 (2), 13-31.

Classification of Provinces in Turkiye According to Socio-Economic Data with Gray Cluster Analysis

Year 2023, Volume: 13 Issue: 2, 60 - 74, 28.12.2023

Kübra Karadaş , Necati Alp Erilli

Abstract

Classification can be defined as the process of examining the structures of the data observed on any subject and grouping the data according to similar groups, contents and some characteristics we have determined. Thus, it will be easier to evaluate and interpret the observations in similar groups according to the research objectives. Cluster analysis is one of the most frequently used methods in classification studies. Cluster analysis is a multivariate statistical method that aims to classify data without natural groups into a limited number of groups or clusters. In the Gray Relational Clustering method, since the clusters consist of objects grouped according to a certain rule, the clusters have homogeneity and it is a method that can distinguish objects within itself without the need for recalculation. In addition, since the number of clusters can be determined after clustering is performed, not before the analysis, it can offer an alternative approach to other commonly used clustering algorithms.
In this study, it is aimed to classify the provinces in Turkiye by using gray clustering analysis with the help of socio-economic data. Gray relational coefficient matrices were first created with the data obtained from the Turkish Statistical Institute and then clustering analysis was performed to determine the distribution of provinces according to socio-economic data. Analyses were also conducted separately for the data categories given under sub-headings such as education, agriculture and employment, and with this it is aimed to determine the socio-economic map of Turkiye.

Keywords

Gray Clustering Analysis, Socio-Economic Data, Classification, Gray Relational Analysis

References

Albayrak, A. S. (2005). Türkiye’deki illerin Sosyoekonomik Gelişmişlik Düzeylerinin Çok Değişkenli İstatistik Yöntemlerle İncelenmesi, ZKÜ Sosyal Bilimler Dergisi, Cilt:1 Sayı:1.
Anderberg, M. R. (1973). Cluster Analysis for Applications, Academic Press, New York.
Balasko, B., Abonyi, J., Feil, B. (2005). Fuzzy clustering and data analysis toolbox. Department of Process Engineering, University of Veszprem, Veszprem.
Birkalan, A. Ö., Bay, H. (2022). Bölgesel Asgari Ücret Varsayımı Altında Bölgelerin Kümeleme Analizi Yöntemleriyle Tespiti. Maliye Dergisi, Temmuz-Aralık; 183: 24-48.
Bulut, H. (2019). Türkiye'deki illerin yaşam endekslerine göre kümelenmesi. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 23 (1), 74-82.
Chang, K. C., Yeh, M. F. (2005). Grey relational analysis-based approach for data clustering, IEE Proceedings - Vision Image and Signal Processing, 152 (2), 165-172.
Çelik, Ş. (2013). Kümeleme analizi ile sağlık göstergelerine göre Türkiye'deki illerin sınıflandırılması. Doğuş Üniversitesi Dergisi, 14 (2), 175-194.
Deng, J. L. (1982). Control Problems of Grey Systems, Systems & Control Letters, 1 (5), 288-294.
Erilli, N.A. (2009). Kümeleme Analizine Bulanık Yaklaşım Algoritmaları ve Uygulamalar, Yayınlanmamış Yüksek Lisans Tezi, Ondokuz Mayıs Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, Samsun.
Erilli, N. A., Tunç, T., Yüksel, Ö., Yolcu, U. (2009). İllerin Sosyoekonomik Verilere Dayanarak Bulanık Kümeleme Analizi ile Sınıflandırılması, e-Journal of New World Sciences Academy, 4(1), 1-11.
Filiz, Z. (2005). İllerin sosyo-ekonomik düzeylerine göre gruplandırılmasında farklı yaklaşımlar, Eskişehir Osmangazi Üniversitesi Sosyal Bilimler Dergisi, 6(1), 77-100.
Hamurcu, M., Tamer, E. (2015). Ankara Büyükşehir Belediyesi’nde çok ölçütlü karar verme yöntemi ile monoray güzergâh seçimi, Transist, 8 s. 410-419.
Jain, A.K., Dubes, R.C. (1988). Algorithms for clustering data, Prentice Hall, New Jersey.
Kalaycı, Ş. (2005). SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri, Asil Yayıncılık, Ankara.
Kandemir, A. Ş. (2018). Bulanık Kümeleme Analizi ile Türkiye'deki İllerin Konaklama İstatistiklerine Göre Sınıflandırılması. Journal of Travel and Hospitality Management, 15(3), 657-668.
Kaygısız, Z., Saraçlı, S., Dokuzlar, K., (2005). İllerin Gelişmişlik Düzeyini Etkileyen Faktörlerin Path Analizi ve Kümeleme Analizi İle İncelenmesi, VII. Uluslararası Ekonometri ve İstatistik Sempozyumu, İ. Ü., Ekonometri Bölümü, İstanbul, 26–27 Mayıs.
Ke, L., Xiaoliub, S., Zhongfua, T., Wenyanb, G. (2012). Grey Clustering Analysis Method for Overseas Energy Project Investment Risk Decision, Systems Engineering Procedia 3 (3), 55-62.
Kohonen, T. (1995). Self-organizing maps, Springer-Verlag, New York.
Köse, E., Aplak H. S., Kabak, M. (2013). Personel Seçimi için Gri Sistem Teori Tabanli Bütünlesik Bir Yaklasim, Ege Akademik Bakis, 13(4), 461.
Lin, Z. (2015). A Multi-attribute Evaluation Model of the Development Competitiveness of Tourism cities based on Grey Clustering Analysis, International Journal of Hybrid Information Technology, 8(10), 331-338.
Liu, S., Forrest J. Y. L. (2010). Grey systems: Theory and applications. Springer-Verlag Berlin Heidelberg.
Mulder, N.J. (1985). Decision Making and Classification. Photogrammetria, 40. 95-116.
Rousseuw, P. J. (1987). Silhouettes: A Graphical Aid to the Interpretation and Validation of Cluster Analysis. Journal of Computational and Applied Mathematics. 20: 53- 65.
Tatlıdil, H. (2002). Uygulamalı Çok Değişkenli İstatistiksel Analiz, Akademi Matbaası, Ankara.
Tekin, B. (2015). Temel Sağlık Göstergeleri Açısından Türkiye'deki İllerin Gruplandırılması: Bir Kümeleme Analizi Uygulaması. Çankırı Karatekin Üniversitesi İİBF Dergisi, 5(2), 389-416.
URL-1: www.tuik.gov.tr (Erişim tarihi: 10.10.2022)
Wong, C. C., Chen, C. C., Su, M. C. (2001). A novel algorithm for data clustering, Pattern Recognition, 34(2), 425-442.
Xie, L., Beni, G. (1991). A Validity Measure for Fuzzy Clustering, IEEE Trans. On Pattern Analysis and Machine Int. 13(4), 841-846.
Zorlutuna, Ş., Erilli, N. A. (2018). Sosyo-Ekonomik Verilere göre İllerin Bulanık C-Ortalamalar Yöntemi ile Sınıflandırılması: 2002-2008-2013 Dönemleri Karşılaştırması. İktisadi Yenilik Dergisi, 5 (2), 13-31.

There are 29 citations in total.

Details

Primary Language	Turkish
Subjects	Statistical Analysis, Applied Statistics
Journal Section	Research Articles
Authors	Kübra Karadaş 0000-0003-4858-313X Necati Alp Erilli 0000-0001-6948-0880
Publication Date	December 28, 2023
Submission Date	November 21, 2023
Acceptance Date	December 19, 2023
Published in Issue	Year 2023 Volume: 13 Issue: 2

Cite

APA	Karadaş, K., & Erilli, N. A. (2023). Gri Kümeleme Analizi ile Türkiye’deki Şehirlerin Sosyo-Ekonomik Verilere Göre Sınıflandırılması. İstatistik Araştırma Dergisi, 13(2), 60-74.

Download Cover Image

Article Files

Full Text