Research Article
BibTex RIS Cite

CLUSTERİNG OECD COUNTRİES REGARDİNG INTERNET USAGE WİTH ENTROPY-CRITIC BASED EM ALGORİTHM

Year 2021, Volume: 12 Issue: 24, 648 - 679, 21.12.2021
https://doi.org/10.36543/kauiibfd.2021.027

Abstract

In the study, mobile and cable internet subscription rates were determined as two different criteria and the clustering of 37 OECD countries between 2012 and 2019 was made. The criteria were first calculated by entropy and then by CRITIC method. The weights are reflected in data created for the groups of 37 OECD countries divided into 2012-2015 and 2016-2019, making a total of 4 different clustering operations. By determining the similarities and differences in Internet subscription rates of OECD countries by year, changes between clusters were determined. Finally, the Wilcoxon test was performed to determine the significance levels of differences between internet uses, and the Kruskal Wallis-H test was performed to analyze the differences between 5 clusters formed according to the EM algorithm. It was concluded that the increase in internet use in the period 2016-2019 compared to internet use in the period 2012-2015 was statistically significant.

References

  • Acock, A. (2005). Working with missing values. Journal of Marriage and Family, 1012-1028.
  • Aftab, F., Khan, A., Zhang, Z. (2019). Hybrid self-organized clustering scheme for drone based cognitive Internet of Things. IEEE Access, 7, 56217-56227.
  • Akın, Y. K. (2008). Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi (Doktora Tezi).
  • Barreto, S., Ferreira, C., Paixao, J., Santos, B. S. (2007). Using clustering analysis in a capacitated location-routing problem. European Journal of Operational Research, 179(3), 968-977.
  • Benavent, A. P., Ruiz, F. E., Martinez, J. S. (2006, Augt). Ebem: An entropy-based em algorithm for gaussian mixture models. In 18th International Conference on Pattern Recognition (ICPR'06) (Vol. 2, pp. 451-455).
  • Borman, S. (2004). The expectation maximization algorithm—a short tutorial. Introduces the Expectation Maximization (EM) algorithm and fleshes out the basic mathematical results, including a proof of convergence. The Generalized EM algorithm is also introduced, July 2004, 1-8.
  • Chen, C. Y., Ye, F. (2012, May). Particle swarm optimization algorithm and its application to clustering analysis. In 2012 Proceedings of 17th Conference on Electrical Power Distribution, 789-794).
  • Çakmak, Z. (1999). Kümeleme analizinde geçerlilik problemi ve kümeleme sonuçlarının değerlendirmesi. Dumlupınar Üniversitesi Sosyal Bilimler Dergisi, (3), 187-205.
  • Çelik, Ş. (2013). Kümeleme analizi ile sağlık göstergelerine göre Türkiye’deki illerin sınıflandırılması. Doğuş Üniversitesi Dergisi, 14(2), 175-194.
  • Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society: Series B (Methodological), 39(1), 1-22.
  • Diakoulaki, D., Mavrotas, G., Papayannakis, L. (1995). Determining objective weights in multiple criteria problems: The critic method. Computers & Operations Research, 22(7), 763-770.
  • Ding, L., Shi, P., & Liu, B. (2010, Eki). The clustering of internet, internet of things and social network. In 2010 Third International Symposium on Knowledge Acquisition and Modeling, 417-420.
  • Eren, H., Ömürbek, N. (2019). Türkiye’nin sağlık göstergeleri açısından kümelenmesi ve performans analizi. Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 11(29), 421-452.
  • Erman, J., Arlitt, M., & Mahanti, A. (2006, Eyl). Traffic classification using clustering algorithms. In Proceedings of the 2006 SIGCOMM workshop on Mining network data, 281-286.
  • Ersöz, F. (2009). OECD'ye üye ülkelerin seçilmiş sağlık göstergelerinin kümeleme ve ayırma analizi ile karşılaştırılması. Türkiye Klinikleri Tıp Bilimleri Dergisi, 29(6), 1650-1659.
  • Feder, M., Weinstein, E. (1988). Parameter estimation of superimposed signals using the EM algorithm. IEEE Transactions on acoustics, speech, and signal processing, 36(4), 477-489.
  • Gan, H., Sang, N., Huang, R., Tong, X., Dan, Z. (2013). Using clustering analysis to improve semi-supervised classification. Neurocomputing, 101, 290-298.
  • Ghosh, R., Surachawala, T., Lerman, K. (2011). Entropy-based classification of 'retweeting' activity on twitter. arXiv preprint arXiv:1106.0346.
  • Güriş, S., & Kızılarslan, Ş. (2017). Dengesiz panel veri modeli ile em algoritması sonuçlarının karşılaştırılması. Journal Of Marmara University Social Sciences Institute/Öneri, 12(47), 15-30.
  • Haegeman, B., Etienne, R. S. (2010). Entropy maximization and the spatial distribution of species. The American Naturalist, 175(4), E74-E90.
  • Hartigan, J. A. (1975). Clustering algorithms. John Wiley & Sons, 9-10.
  • Internet World Stats, http://www. internetworldstats.com/stats.htm, (19.12.2020).
  • Jahan, A., Mustapha, F., Sapuan, S. M., Ismail, M. Y., Bahraminasab, M. (2012). A framework for weighting of criteria in ranking stage of material selection process. The International Journal of Advanced Manufacturing Technology, 58(1), 411-420.
  • Karaatlı, M., Karataş, T., Ömürbek, N. (2020). Ülkelerin insani özgürlük endeksine göre kümelenmesi. Anadolu Üniversitesi Sosyal Bilimler Dergisi, 20(3), 271-286.
  • Karami, A., Johansson, R. (2014). Utilization of multi attribute decision making techniques to ıntegrate automatic and manual ranking of options. Journal of Information Science and Engineering, 30, 519-534.
  • Ketchen, D. J., & Shook, C. L. (1996). The application of cluster analysis in strategic management research: an analysis and critique. Strategic management journal, 17(6), 441-458.
  • Louis, T. A. (1982). Finding the observed information matrix when using the EM algorithm. Journal of the Royal Statistical Society: Series B (Methodological), 44(2), 226-233.
  • Madbuly, D., Maravelakis, P., & Mahmoud, M. (2013). The effect of methods for handling missing values on the performance of the mewma control chart. Communications in Statistics - Simulation and Computation, 1437–1454.
  • Morris, M., & Ogan, C. (2004). The ınternet as mass medium, d mcquail (ed.), McQuail’s Reader in Mass Communication Theory, 134-145.
  • Muthén, B., Shedden, K. (1999). Finite mixture modeling with mixture outcomes using the EM algorithm. Biometrics, 55(2), 463-469.
  • OECD Data, “Broadband database”, https://data.oecd.org/innovation-and-technology.htm#profile-Broadband%20acces, (19.12.2020).
  • OECD Data, “ICT access and Usage by Households and Individuals”, https://data.oecd.org/ict/internet-access.htm, (19.12.2020).
  • Ömürbek, N., Dağ, O., Eren, H. (2020). EM algoritmasına göre kümelenen havalimanlarının borda sayım yöntemi ile değerlendirilmesi. Atatürk Üniversitesi İktisadi ve İdari Bilimler Dergisi, 34(2), 491-514.
  • Sonğur, C. (2016). Sağlık göstergelerine göre Ekonomik Kalkınma ve İşbirliği Örgütü ülkelerinin kümeleme analizi. SGD-Sosyal Güvenlik Dergisi, 6(1), 197-224.
  • Tatlıdil, H. (1992). Uygulamalı çok değişkenli istatistiksel analiz, Ankara, Engin Yayınevi.
  • Turanlı, M., Özden, Ü. H., & Türedi, S. (2006). Avrupa birliği’ne aday ve üye ülkelerin ekonomik benzerliklerinin kümeleme analiziyle incelenmesi, İstanbul Ticaret Üniversitesi Sosyal Bilimler Dergisi, 5(9), 95-108.
  • Wang, T.C. & Lee, H.D. (2009). Developing a fuzzy TOPSIS approach based on subjective weights and objective weights. Expert Systems with Applications, 36 (5), 8980-8985.
  • Wang, Y., Xiang, Y., Zhang, J., Zhou, W., Wei, G., Yang, L. T. (2013). Internet traffic classification using constrained clustering. IEEE transactions on parallel and distributed systems, 25(11), 2932-2943.
  • Zhang, H., Gu, C.L., Gu, L.W., Zhang, Y. (2011). The evaluation of tourism destination competitiveness by TOPSIS & information entropy - A case in the Yangtze River Delta of China. Tourism Management, 32, 443-451.

ENTROPİ-CRITIC TEMELLİ EM ALGORİTMASI İLE İNTERNET KULLANIMI AÇISINDAN OECD ÜLKELERİNİN KÜMELENMESİ

Year 2021, Volume: 12 Issue: 24, 648 - 679, 21.12.2021
https://doi.org/10.36543/kauiibfd.2021.027

Abstract

Çalışmada, OECD içerisinde yer alan 37 ülkenin, 2012-2019 yılları arasındaki mobil internet ve kablolu internet abonelik oranlarına göre kümelemesi yapılmış, mobil internet ve kablolu internet iki farklı kriter olarak belirlenmiştir. Kriterlerin ilk önce Entropi yöntemi ile sonrasında CRITIC yöntemi ile ağırlıkları hesaplanmıştır. Elde edilen ağırlıkların 37 OECD ülkesinin 2012-2015 ve 2016-2019 yıllarına ayrılan gruplar için oluşturulan verilere yansıtılarak toplamda 4 farklı kümeleme işlemi yapılmıştır. Sonuç olarak ortaya çıkan kümelerde Entropi ve CRITIC temelli verilerin olması, kümelerde bir değişikliğe sebep olmamıştır. Uygulamanın son adımında, OECD ülkelerinin yıllara göre internet abonelik oranlarındaki benzerlikleri ve farklılıkları saptanarak, oluşan kümeler arasındaki değişimler belirlenmiştir. Son olarak internet kullanımları arasındaki farkların anlamlılık düzeylerinin tespit edilmesi için Wilcoxon testi yapılmış ve EM Algoritmasına göre oluşan 5 küme arasındaki farklılıkların analizi için Kruskal Wallis-H testi uygulanmıştır. Elde edilen veriler incelendiği zaman 2016-2019 dönemindeki internet kullanımının, 2012-2015 döneminde kullanılan internet kullanımına göre artışının istatistiksel olarak anlamlı olduğu sonucuna varılmıştır.

References

  • Acock, A. (2005). Working with missing values. Journal of Marriage and Family, 1012-1028.
  • Aftab, F., Khan, A., Zhang, Z. (2019). Hybrid self-organized clustering scheme for drone based cognitive Internet of Things. IEEE Access, 7, 56217-56227.
  • Akın, Y. K. (2008). Veri madenciliğinde kümeleme algoritmaları ve kümeleme analizi (Doktora Tezi).
  • Barreto, S., Ferreira, C., Paixao, J., Santos, B. S. (2007). Using clustering analysis in a capacitated location-routing problem. European Journal of Operational Research, 179(3), 968-977.
  • Benavent, A. P., Ruiz, F. E., Martinez, J. S. (2006, Augt). Ebem: An entropy-based em algorithm for gaussian mixture models. In 18th International Conference on Pattern Recognition (ICPR'06) (Vol. 2, pp. 451-455).
  • Borman, S. (2004). The expectation maximization algorithm—a short tutorial. Introduces the Expectation Maximization (EM) algorithm and fleshes out the basic mathematical results, including a proof of convergence. The Generalized EM algorithm is also introduced, July 2004, 1-8.
  • Chen, C. Y., Ye, F. (2012, May). Particle swarm optimization algorithm and its application to clustering analysis. In 2012 Proceedings of 17th Conference on Electrical Power Distribution, 789-794).
  • Çakmak, Z. (1999). Kümeleme analizinde geçerlilik problemi ve kümeleme sonuçlarının değerlendirmesi. Dumlupınar Üniversitesi Sosyal Bilimler Dergisi, (3), 187-205.
  • Çelik, Ş. (2013). Kümeleme analizi ile sağlık göstergelerine göre Türkiye’deki illerin sınıflandırılması. Doğuş Üniversitesi Dergisi, 14(2), 175-194.
  • Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society: Series B (Methodological), 39(1), 1-22.
  • Diakoulaki, D., Mavrotas, G., Papayannakis, L. (1995). Determining objective weights in multiple criteria problems: The critic method. Computers & Operations Research, 22(7), 763-770.
  • Ding, L., Shi, P., & Liu, B. (2010, Eki). The clustering of internet, internet of things and social network. In 2010 Third International Symposium on Knowledge Acquisition and Modeling, 417-420.
  • Eren, H., Ömürbek, N. (2019). Türkiye’nin sağlık göstergeleri açısından kümelenmesi ve performans analizi. Mehmet Akif Ersoy Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 11(29), 421-452.
  • Erman, J., Arlitt, M., & Mahanti, A. (2006, Eyl). Traffic classification using clustering algorithms. In Proceedings of the 2006 SIGCOMM workshop on Mining network data, 281-286.
  • Ersöz, F. (2009). OECD'ye üye ülkelerin seçilmiş sağlık göstergelerinin kümeleme ve ayırma analizi ile karşılaştırılması. Türkiye Klinikleri Tıp Bilimleri Dergisi, 29(6), 1650-1659.
  • Feder, M., Weinstein, E. (1988). Parameter estimation of superimposed signals using the EM algorithm. IEEE Transactions on acoustics, speech, and signal processing, 36(4), 477-489.
  • Gan, H., Sang, N., Huang, R., Tong, X., Dan, Z. (2013). Using clustering analysis to improve semi-supervised classification. Neurocomputing, 101, 290-298.
  • Ghosh, R., Surachawala, T., Lerman, K. (2011). Entropy-based classification of 'retweeting' activity on twitter. arXiv preprint arXiv:1106.0346.
  • Güriş, S., & Kızılarslan, Ş. (2017). Dengesiz panel veri modeli ile em algoritması sonuçlarının karşılaştırılması. Journal Of Marmara University Social Sciences Institute/Öneri, 12(47), 15-30.
  • Haegeman, B., Etienne, R. S. (2010). Entropy maximization and the spatial distribution of species. The American Naturalist, 175(4), E74-E90.
  • Hartigan, J. A. (1975). Clustering algorithms. John Wiley & Sons, 9-10.
  • Internet World Stats, http://www. internetworldstats.com/stats.htm, (19.12.2020).
  • Jahan, A., Mustapha, F., Sapuan, S. M., Ismail, M. Y., Bahraminasab, M. (2012). A framework for weighting of criteria in ranking stage of material selection process. The International Journal of Advanced Manufacturing Technology, 58(1), 411-420.
  • Karaatlı, M., Karataş, T., Ömürbek, N. (2020). Ülkelerin insani özgürlük endeksine göre kümelenmesi. Anadolu Üniversitesi Sosyal Bilimler Dergisi, 20(3), 271-286.
  • Karami, A., Johansson, R. (2014). Utilization of multi attribute decision making techniques to ıntegrate automatic and manual ranking of options. Journal of Information Science and Engineering, 30, 519-534.
  • Ketchen, D. J., & Shook, C. L. (1996). The application of cluster analysis in strategic management research: an analysis and critique. Strategic management journal, 17(6), 441-458.
  • Louis, T. A. (1982). Finding the observed information matrix when using the EM algorithm. Journal of the Royal Statistical Society: Series B (Methodological), 44(2), 226-233.
  • Madbuly, D., Maravelakis, P., & Mahmoud, M. (2013). The effect of methods for handling missing values on the performance of the mewma control chart. Communications in Statistics - Simulation and Computation, 1437–1454.
  • Morris, M., & Ogan, C. (2004). The ınternet as mass medium, d mcquail (ed.), McQuail’s Reader in Mass Communication Theory, 134-145.
  • Muthén, B., Shedden, K. (1999). Finite mixture modeling with mixture outcomes using the EM algorithm. Biometrics, 55(2), 463-469.
  • OECD Data, “Broadband database”, https://data.oecd.org/innovation-and-technology.htm#profile-Broadband%20acces, (19.12.2020).
  • OECD Data, “ICT access and Usage by Households and Individuals”, https://data.oecd.org/ict/internet-access.htm, (19.12.2020).
  • Ömürbek, N., Dağ, O., Eren, H. (2020). EM algoritmasına göre kümelenen havalimanlarının borda sayım yöntemi ile değerlendirilmesi. Atatürk Üniversitesi İktisadi ve İdari Bilimler Dergisi, 34(2), 491-514.
  • Sonğur, C. (2016). Sağlık göstergelerine göre Ekonomik Kalkınma ve İşbirliği Örgütü ülkelerinin kümeleme analizi. SGD-Sosyal Güvenlik Dergisi, 6(1), 197-224.
  • Tatlıdil, H. (1992). Uygulamalı çok değişkenli istatistiksel analiz, Ankara, Engin Yayınevi.
  • Turanlı, M., Özden, Ü. H., & Türedi, S. (2006). Avrupa birliği’ne aday ve üye ülkelerin ekonomik benzerliklerinin kümeleme analiziyle incelenmesi, İstanbul Ticaret Üniversitesi Sosyal Bilimler Dergisi, 5(9), 95-108.
  • Wang, T.C. & Lee, H.D. (2009). Developing a fuzzy TOPSIS approach based on subjective weights and objective weights. Expert Systems with Applications, 36 (5), 8980-8985.
  • Wang, Y., Xiang, Y., Zhang, J., Zhou, W., Wei, G., Yang, L. T. (2013). Internet traffic classification using constrained clustering. IEEE transactions on parallel and distributed systems, 25(11), 2932-2943.
  • Zhang, H., Gu, C.L., Gu, L.W., Zhang, Y. (2011). The evaluation of tourism destination competitiveness by TOPSIS & information entropy - A case in the Yangtze River Delta of China. Tourism Management, 32, 443-451.
There are 39 citations in total.

Details

Primary Language Turkish
Journal Section Articles
Authors

Kemal Berkay Aktaş 0000-0003-2310-8439

Nuri Ömürbek 0000-0002-0360-4040

Meltem Karaatlı 0000-0002-7403-9587

Publication Date December 21, 2021
Acceptance Date September 6, 2021
Published in Issue Year 2021 Volume: 12 Issue: 24

Cite

APA Aktaş, K. B., Ömürbek, N., & Karaatlı, M. (2021). ENTROPİ-CRITIC TEMELLİ EM ALGORİTMASI İLE İNTERNET KULLANIMI AÇISINDAN OECD ÜLKELERİNİN KÜMELENMESİ. Kafkas Üniversitesi İktisadi Ve İdari Bilimler Fakültesi Dergisi, 12(24), 648-679. https://doi.org/10.36543/kauiibfd.2021.027

KAUJEASF is the corporate journal of Kafkas University, Faculty of Economics and Administrative Sciences Journal Publishing.

KAUJEASF has been included in Web of Science since 2022 and started to be indexed in the Emerging Sources Citation Index (ESCI ), a Clarivate product.

2025 June issue article acceptance and evaluations are ongoing.