Toplanan verilerin tutarlı bir şekilde gruplandırılması, veriden anlamlı bilgilerin çıkarılabilmesi için önemli bir adımdır. Verilerin gruplara ayrılması sınıflandırma ve kümeleme olmak üzere iki farklı işlem ile gerçekleştirilir. Sınıflandırma işleminde verilerin ayrılacağı alt grupların etiketleri ve dolayısıyla sayıları belirli iken, kümeleme işleminde verilerin ait olduğu gruplar belli değildir. Bu nedenle kümeleme işlemi danışmansız bir makine öğrenmesi işlemidir. Kümeleme işleminde veri elemanları birbirlerine göre benzerlik ve farklılıklarına göre alt gruplara ayrılırlar. Optimizasyon algoritmaları doğrusal olmayan problemlerin çözümünde kullanılan, muhtemel çözümler içerisinden uygun sonucu bulmaya çalışan yöntemlerdir. Kümeleme işlemleri için geliştirilmiş ve yaygın olarak kullanılan geleneksel kümeleme yöntemlerinin yanında olası çözümler arasında uygun çözüme ulaşmaya çalışan karakteristik özelliklerinden dolayı optimizasyon algoritmaları da kümeleme problemlerinin çözümü için kullanılır hale gelmiştir. Bu çalışmada yakın zamanda geliştirilen bir optimizasyon algoritması olan Ağaç Tohum Algoritması 17 farklı kümeleme problemine uygulanmış ve elde edilen sonuçlar geleneksel kümeleme yöntemleri olan K-Ortalamalar, K-Medoidler ve Bulanık C-Ortalamalar yöntemlerinin performansları ile karşılaştırılmıştır. Ağaç Tohum Algoritmasının kümeleme işleminde geleneksel yöntemlere göre daha başarılı sonuçlara ulaştığı görülmüştür.
Seperating gathered data into consistent subgroups is an imprtant phase to retiriewe meaningful information from data. Seperating data into groups can be performed with two different operation which are classification and clustering. While the labels of data groups and so the number of subgroups are known in classification, class labels are not known in clustering process. So, clusteing is an unsupervised machine learning operation. In clustering process, data objects are seperated into subgroups according to similarity and dissimilarity among data samples. Optimization algorithms are useful method which try to reach optimum solution among possible solutions and are used to solve nonolinear problems. Besides commonly used traditional clustering methods, optimization methods are recently applied on clustering problems because of their characteristics for reaching optimum solutions among possible solutions space. In this study a recently developed optimization algorithm called Tree Seed Algorithm is applied on 17 different clustering problems and the results are compared with the performances of traditional clustering methods like K-Means, K-Medoids and Fuzzy C-Means. It is seen that Tree Seed Algorithm has better performance than traditional methods for clustering problems.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 30 Haziran 2022 |
Kabul Tarihi | 27 Mart 2022 |
Yayımlandığı Sayı | Yıl 2022 Cilt: 4 Sayı: 1 |