Araştırma Makalesi
BibTex RIS Kaynak Göster

Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması

Yıl 2022, Cilt: 4 Sayı: 1, 1 - 10, 30.06.2022

Öz

Toplanan verilerin tutarlı bir şekilde gruplandırılması, veriden anlamlı bilgilerin çıkarılabilmesi için önemli bir adımdır. Verilerin gruplara ayrılması sınıflandırma ve kümeleme olmak üzere iki farklı işlem ile gerçekleştirilir. Sınıflandırma işleminde verilerin ayrılacağı alt grupların etiketleri ve dolayısıyla sayıları belirli iken, kümeleme işleminde verilerin ait olduğu gruplar belli değildir. Bu nedenle kümeleme işlemi danışmansız bir makine öğrenmesi işlemidir. Kümeleme işleminde veri elemanları birbirlerine göre benzerlik ve farklılıklarına göre alt gruplara ayrılırlar. Optimizasyon algoritmaları doğrusal olmayan problemlerin çözümünde kullanılan, muhtemel çözümler içerisinden uygun sonucu bulmaya çalışan yöntemlerdir. Kümeleme işlemleri için geliştirilmiş ve yaygın olarak kullanılan geleneksel kümeleme yöntemlerinin yanında olası çözümler arasında uygun çözüme ulaşmaya çalışan karakteristik özelliklerinden dolayı optimizasyon algoritmaları da kümeleme problemlerinin çözümü için kullanılır hale gelmiştir. Bu çalışmada yakın zamanda geliştirilen bir optimizasyon algoritması olan Ağaç Tohum Algoritması 17 farklı kümeleme problemine uygulanmış ve elde edilen sonuçlar geleneksel kümeleme yöntemleri olan K-Ortalamalar, K-Medoidler ve Bulanık C-Ortalamalar yöntemlerinin performansları ile karşılaştırılmıştır. Ağaç Tohum Algoritmasının kümeleme işleminde geleneksel yöntemlere göre daha başarılı sonuçlara ulaştığı görülmüştür.

Kaynakça

  • D.W. Van Der Merwe, A.P. Engelbrecht, Data clustering using particle swarm optimization, 2003 Congress on Evolutionary Computation, CEC 2003 - Proceedings. 1 (2003) 215–220. doi:10.1109/CEC.2003.1299577.
  • J. Nasiri, F.M. Khiyabani, A whale optimization algorithm (WOA) approach for clustering, Cogent Mathematics & Statistics. 5 (2018) 1483565. doi:10.1080/25742558.2018.1483565.
  • M. Fathian, B. Amiri, A. Maroosi, Application of honey-bee mating optimization algorithm on clustering, Applied Mathematics and Computation. 190 (2007) 1502–1513. doi:10.1016/j.amc.2007.02.029.
  • T. Niknam, B. Amiri, J. Olamaei, A. Arefi, An efficient hybrid evolutionary optimization algorithm based on PSO and SA for clustering, Journal of Zhejiang University: Science A. 10 (2009) 512–519. doi:10.1631/jzus.A0820196.
  • N. Kushwaha, M. Pant, S. Kant, V.K. Jain, Magnetic optimization algorithm for data clustering, Pattern Recognition Letters. 115 (2018) 59–65. doi:10.1016/j.patrec.2017.10.031.
  • U. Maulik, A. Mukhopadhyay, Simulated annealing based automatic fuzzy clustering combined with ANN classification for analyzing microarray data, Computers and Operations Research. 37 (2010) 1369–1380. doi:10.1016/j.cor.2009.02.025.
  • S.Z. Selim, K. Alsultan, A simulated annealing algorithm for the clustering problem, Pattern Recognition. 24 (1991) 1003–1008. doi:https://doi.org/10.1016/0031-3203(91)90097-O.
  • U. Maulik, S. Bandyopadhyay, Genetic algorithm-based clustering technique, Pattern Recognition. 33 (2000) 1455–1465. doi:https://doi.org/10.1016/S0031-3203(99)00137-5.
  • D. Dua, C. Graff, {UCI} Machine Learning Repository, (2017). http://archive.ics.uci.edu/ml.
  • J. MacQueen, others, Some methods for classification and analysis of multivariate observations, içinde: Proceedings of the fifth Berkeley symposium on mathematical statistics and probability, 1967: ss. 281–297.
  • N. Shi, X. Liu, Y. Guan, Research on k-means clustering algorithm: An improved k-means clustering algorithm, 3rd International Symposium on Intelligent Information Technology and Security Informatics, IITSI 2010. (2010) 63–67. doi:10.1109/IITSI.2010.74.
  • M. Karakoyun, A. Babalik, Data Clustering with Shuffled Leaping Frog Algorithm (SFLA) for Classification, (2015). doi:10.15242/iae.iae0815009.
  • Esra Dinçer, Veri Madenciliğinde K-Means Algoritması Ve Tıp Alanında Uygulanması, (2006) 73–77.
  • M. Karakoyun, A. Saglam, N.A. Baykan, A.A. Altun, Non-locally color image segmentation for remote sensing images in different color spaces by using data-clustering methods, 5th International Conference on Advanced Technology & Sciences (ICAT’17). (2017) 6–12.
  • J.C. Dunn, A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters, Journal of Cybernetics. 3 (1973) 32–57. doi:10.1080/01969727308546046.
  • J.C. Bezdek, Objective Function Clustering BT - Pattern Recognition with Fuzzy Objective Function Algorithms, içinde: J.C. Bezdek (Ed.), Springer US, Boston, MA, 1981: ss. 43–93. doi:10.1007/978-1-4757-0450-1_3.
  • T. Velmurugan, Performance based analysis between k-Means and Fuzzy C-Means clustering algorithms for connection oriented telecommunication data, Applied Soft Computing Journal. 19 (2014) 134–146. doi:10.1016/j.asoc.2014.02.011.
  • M.S. Kiran, TSA: Tree-seed algorithm for continuous optimization, Expert Systems with Applications. 42 (2015) 6686–6698. doi:10.1016/j.eswa.2015.04.055.
  • M.S. Kiran, Tree Seed Algorithm, (y.y.). http://mskiran.kisisel.selcuk.edu.tr/tsa/ (erişim 12 Şubat 2020).
  • A.C. Cinar, M.S. Kiran, Similarity and Logic Gate-Based Tree-Seed Algorithms for Binary Optimization, Computers and Industrial Engineering. 115 (2018) 631–646. doi:10.1016/j.cie.2017.12.009.
  • A. Babalik, A.C. Cinar, M.S. Kiran, A modification of tree-seed algorithm using Deb’s rules for constrained optimization, Applied Soft Computing Journal. 63 (2018) 289–305. doi:10.1016/j.asoc.2017.10.013.
  • M. Aslan, M. Beskirli, H. Kodaz, M.S. Kiran, An improved tree seed algorithm for optimization problems, International Journal of Machine Learning and Computing. 8 (2018) 20–25. doi:10.18178/ijmlc.2018.8.1.657.

Application of Tree Seed Algorithm on Clustering Problems

Yıl 2022, Cilt: 4 Sayı: 1, 1 - 10, 30.06.2022

Öz

Seperating gathered data into consistent subgroups is an imprtant phase to retiriewe meaningful information from data. Seperating data into groups can be performed with two different operation which are classification and clustering. While the labels of data groups and so the number of subgroups are known in classification, class labels are not known in clustering process. So, clusteing is an unsupervised machine learning operation. In clustering process, data objects are seperated into subgroups according to similarity and dissimilarity among data samples. Optimization algorithms are useful method which try to reach optimum solution among possible solutions and are used to solve nonolinear problems. Besides commonly used traditional clustering methods, optimization methods are recently applied on clustering problems because of their characteristics for reaching optimum solutions among possible solutions space. In this study a recently developed optimization algorithm called Tree Seed Algorithm is applied on 17 different clustering problems and the results are compared with the performances of traditional clustering methods like K-Means, K-Medoids and Fuzzy C-Means. It is seen that Tree Seed Algorithm has better performance than traditional methods for clustering problems.

Kaynakça

  • D.W. Van Der Merwe, A.P. Engelbrecht, Data clustering using particle swarm optimization, 2003 Congress on Evolutionary Computation, CEC 2003 - Proceedings. 1 (2003) 215–220. doi:10.1109/CEC.2003.1299577.
  • J. Nasiri, F.M. Khiyabani, A whale optimization algorithm (WOA) approach for clustering, Cogent Mathematics & Statistics. 5 (2018) 1483565. doi:10.1080/25742558.2018.1483565.
  • M. Fathian, B. Amiri, A. Maroosi, Application of honey-bee mating optimization algorithm on clustering, Applied Mathematics and Computation. 190 (2007) 1502–1513. doi:10.1016/j.amc.2007.02.029.
  • T. Niknam, B. Amiri, J. Olamaei, A. Arefi, An efficient hybrid evolutionary optimization algorithm based on PSO and SA for clustering, Journal of Zhejiang University: Science A. 10 (2009) 512–519. doi:10.1631/jzus.A0820196.
  • N. Kushwaha, M. Pant, S. Kant, V.K. Jain, Magnetic optimization algorithm for data clustering, Pattern Recognition Letters. 115 (2018) 59–65. doi:10.1016/j.patrec.2017.10.031.
  • U. Maulik, A. Mukhopadhyay, Simulated annealing based automatic fuzzy clustering combined with ANN classification for analyzing microarray data, Computers and Operations Research. 37 (2010) 1369–1380. doi:10.1016/j.cor.2009.02.025.
  • S.Z. Selim, K. Alsultan, A simulated annealing algorithm for the clustering problem, Pattern Recognition. 24 (1991) 1003–1008. doi:https://doi.org/10.1016/0031-3203(91)90097-O.
  • U. Maulik, S. Bandyopadhyay, Genetic algorithm-based clustering technique, Pattern Recognition. 33 (2000) 1455–1465. doi:https://doi.org/10.1016/S0031-3203(99)00137-5.
  • D. Dua, C. Graff, {UCI} Machine Learning Repository, (2017). http://archive.ics.uci.edu/ml.
  • J. MacQueen, others, Some methods for classification and analysis of multivariate observations, içinde: Proceedings of the fifth Berkeley symposium on mathematical statistics and probability, 1967: ss. 281–297.
  • N. Shi, X. Liu, Y. Guan, Research on k-means clustering algorithm: An improved k-means clustering algorithm, 3rd International Symposium on Intelligent Information Technology and Security Informatics, IITSI 2010. (2010) 63–67. doi:10.1109/IITSI.2010.74.
  • M. Karakoyun, A. Babalik, Data Clustering with Shuffled Leaping Frog Algorithm (SFLA) for Classification, (2015). doi:10.15242/iae.iae0815009.
  • Esra Dinçer, Veri Madenciliğinde K-Means Algoritması Ve Tıp Alanında Uygulanması, (2006) 73–77.
  • M. Karakoyun, A. Saglam, N.A. Baykan, A.A. Altun, Non-locally color image segmentation for remote sensing images in different color spaces by using data-clustering methods, 5th International Conference on Advanced Technology & Sciences (ICAT’17). (2017) 6–12.
  • J.C. Dunn, A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters, Journal of Cybernetics. 3 (1973) 32–57. doi:10.1080/01969727308546046.
  • J.C. Bezdek, Objective Function Clustering BT - Pattern Recognition with Fuzzy Objective Function Algorithms, içinde: J.C. Bezdek (Ed.), Springer US, Boston, MA, 1981: ss. 43–93. doi:10.1007/978-1-4757-0450-1_3.
  • T. Velmurugan, Performance based analysis between k-Means and Fuzzy C-Means clustering algorithms for connection oriented telecommunication data, Applied Soft Computing Journal. 19 (2014) 134–146. doi:10.1016/j.asoc.2014.02.011.
  • M.S. Kiran, TSA: Tree-seed algorithm for continuous optimization, Expert Systems with Applications. 42 (2015) 6686–6698. doi:10.1016/j.eswa.2015.04.055.
  • M.S. Kiran, Tree Seed Algorithm, (y.y.). http://mskiran.kisisel.selcuk.edu.tr/tsa/ (erişim 12 Şubat 2020).
  • A.C. Cinar, M.S. Kiran, Similarity and Logic Gate-Based Tree-Seed Algorithms for Binary Optimization, Computers and Industrial Engineering. 115 (2018) 631–646. doi:10.1016/j.cie.2017.12.009.
  • A. Babalik, A.C. Cinar, M.S. Kiran, A modification of tree-seed algorithm using Deb’s rules for constrained optimization, Applied Soft Computing Journal. 63 (2018) 289–305. doi:10.1016/j.asoc.2017.10.013.
  • M. Aslan, M. Beskirli, H. Kodaz, M.S. Kiran, An improved tree seed algorithm for optimization problems, International Journal of Machine Learning and Computing. 8 (2018) 20–25. doi:10.18178/ijmlc.2018.8.1.657.
Toplam 22 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Mühendislik
Bölüm Makaleler
Yazarlar

Abdülkadir Pektaş 0000-0002-9148-0008

Onur İnan Bu kişi benim 0000-0003-4573-7025

Yayımlanma Tarihi 30 Haziran 2022
Kabul Tarihi 27 Mart 2022
Yayımlandığı Sayı Yıl 2022 Cilt: 4 Sayı: 1

Kaynak Göster

APA Pektaş, A., & İnan, O. (2022). Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması. Necmettin Erbakan Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi, 4(1), 1-10.
AMA Pektaş A, İnan O. Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması. NEU Fen Muh Bil Der. Haziran 2022;4(1):1-10.
Chicago Pektaş, Abdülkadir, ve Onur İnan. “Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması”. Necmettin Erbakan Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi 4, sy. 1 (Haziran 2022): 1-10.
EndNote Pektaş A, İnan O (01 Haziran 2022) Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması. Necmettin Erbakan Üniversitesi Fen ve Mühendislik Bilimleri Dergisi 4 1 1–10.
IEEE A. Pektaş ve O. İnan, “Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması”, NEU Fen Muh Bil Der, c. 4, sy. 1, ss. 1–10, 2022.
ISNAD Pektaş, Abdülkadir - İnan, Onur. “Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması”. Necmettin Erbakan Üniversitesi Fen ve Mühendislik Bilimleri Dergisi 4/1 (Haziran 2022), 1-10.
JAMA Pektaş A, İnan O. Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması. NEU Fen Muh Bil Der. 2022;4:1–10.
MLA Pektaş, Abdülkadir ve Onur İnan. “Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması”. Necmettin Erbakan Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi, c. 4, sy. 1, 2022, ss. 1-10.
Vancouver Pektaş A, İnan O. Ağaç Tohum Algoritmasının Kümeleme Problemlerine Uygulanması. NEU Fen Muh Bil Der. 2022;4(1):1-10.


32206                   17157           17158