The classification methods consider the probability of predicting the majority class to be high when the number of class observations is different. To address this problem, there are some methods such as resampling methods in the literature. Undersampling, one of the resampling methods, creates balance by removing data from the majority class. This study aims to compare different optimization methods to determine the most suitable observations to be taken from the majority class while undersampling. Firstly, a simple simulation study was conducted and graphs were used to analyze the discrepancy between the resampled datasets. Then, different classifier models were constructed for different imbalanced data sets. In these models, random undersampling, undersampling with genetic algorithm, undersampling with differential evolution algorithm, undersampling with an artificial bee colony, and under-sampling with particle herd optimization were compared. The results were given rank numbers differing depending on the classifiers and data sets and a general mean rank was obtained. As a result, when undersampling, artificial bee colony was seen to perform better than other methods of optimization.
Imbalanced classes, Classification, Undersampling, Optimization
Sınıflama yöntemleri, sınıf gözlemlerinin sayısı farklı olduğunda çoğunluk sınıfını tahmin etme olasılığının yüksek olduğunu düşünür. Bu sorunu gidermek için literatürde yeniden örnekleme yöntemleri gibi bazı yöntemler bulunmaktadır. Yeniden örnekleme yöntemlerinden biri olan azörnekleme, çoğunluk sınıfından verileri silerek denge oluşturur. Bu çalışma, az örnekleme yapılırken çoğunluk sınıftan alınacak en uygun gözlemleri belirlemek için farklı optimizasyon yöntemlerini karşılaştırmayı amaçlamaktadır. İlk olarak, basit bir simülasyon çalışması yapılmış ve yeniden örneklenen veri setleri arasındaki farklılığı analiz etmek için grafikler kullanılmıştır. Daha sonra, farklı dengesiz veri setleri için farklı sınıflayıcı modelleri oluşturulmuştur. Bu modellerde rastgele azörnekleme, genetik algoritma ile azörnekleme, diferansiyel evrim algoritması ile azörnekleme, yapay arı kolonisi ile azörnekleme ve parçacık sürüsü optimizasyonu ile azörnekleme karşılaştırılmıştır. Sonuçlara sınıflandırıcılara ve veri setlerine göre değişen sıra numaraları verilmiş ve genel bir ortalama sıra elde edilmiştir. Sonuç olarak, yetersiz örnekleme yapıldığında, yapay arı kolonisinin diğer optimizasyon yöntemlerinden daha iyi performans gösterdiği görülmüştür.
Primary Language | English |
---|---|
Subjects | Mathematics, Interdisciplinary Applications |
Journal Section | Mathematics |
Authors |
|
Publication Date | December 31, 2021 |
Application Date | February 21, 2021 |
Acceptance Date | October 25, 2021 |
Published in Issue | Year 2021, Volume 11, Issue 2 |
Bibtex | @research article { adyujsci884120, journal = {Adıyaman University Journal of Science}, issn = {2147-1630}, eissn = {2146-586X}, address = {}, publisher = {Adıyaman University}, year = {2021}, volume = {11}, number = {2}, pages = {385 - 409}, doi = {10.37094/adyujsci.884120}, title = {Optimization Based Undersampling for Imbalanced Classes}, key = {cite}, author = {Sağlam, Fatih and Sözen, Mervenur and Cengiz, Mehmet Ali} } |
APA | Sağlam, F. , Sözen, M. & Cengiz, M. A. (2021). Optimization Based Undersampling for Imbalanced Classes . Adıyaman University Journal of Science , 11 (2) , 385-409 . DOI: 10.37094/adyujsci.884120 |
MLA | Sağlam, F. , Sözen, M. , Cengiz, M. A. "Optimization Based Undersampling for Imbalanced Classes" . Adıyaman University Journal of Science 11 (2021 ): 385-409 <https://dergipark.org.tr/en/pub/adyujsci/issue/67254/884120> |
Chicago | Sağlam, F. , Sözen, M. , Cengiz, M. A. "Optimization Based Undersampling for Imbalanced Classes". Adıyaman University Journal of Science 11 (2021 ): 385-409 |
RIS | TY - JOUR T1 - Optimization Based Undersampling for Imbalanced Classes AU - Fatih Sağlam , Mervenur Sözen , Mehmet Ali Cengiz Y1 - 2021 PY - 2021 N1 - doi: 10.37094/adyujsci.884120 DO - 10.37094/adyujsci.884120 T2 - Adıyaman University Journal of Science JF - Journal JO - JOR SP - 385 EP - 409 VL - 11 IS - 2 SN - 2147-1630-2146-586X M3 - doi: 10.37094/adyujsci.884120 UR - https://doi.org/10.37094/adyujsci.884120 Y2 - 2021 ER - |
EndNote | %0 Adıyaman University Journal of Science Optimization Based Undersampling for Imbalanced Classes %A Fatih Sağlam , Mervenur Sözen , Mehmet Ali Cengiz %T Optimization Based Undersampling for Imbalanced Classes %D 2021 %J Adıyaman University Journal of Science %P 2147-1630-2146-586X %V 11 %N 2 %R doi: 10.37094/adyujsci.884120 %U 10.37094/adyujsci.884120 |
ISNAD | Sağlam, Fatih , Sözen, Mervenur , Cengiz, Mehmet Ali . "Optimization Based Undersampling for Imbalanced Classes". Adıyaman University Journal of Science 11 / 2 (December 2021): 385-409 . https://doi.org/10.37094/adyujsci.884120 |
AMA | Sağlam F. , Sözen M. , Cengiz M. A. Optimization Based Undersampling for Imbalanced Classes. ADYU J SCI. 2021; 11(2): 385-409. |
Vancouver | Sağlam F. , Sözen M. , Cengiz M. A. Optimization Based Undersampling for Imbalanced Classes. Adıyaman University Journal of Science. 2021; 11(2): 385-409. |
IEEE | F. Sağlam , M. Sözen and M. A. Cengiz , "Optimization Based Undersampling for Imbalanced Classes", Adıyaman University Journal of Science, vol. 11, no. 2, pp. 385-409, Dec. 2021, doi:10.37094/adyujsci.884120 |
...