Research Article
BibTex RIS Cite

Dengesiz Kardiyak Aritmi Verilerinin Sınıflandırılması

Year 2022, Issue: 34, 546 - 552, 31.03.2022
https://doi.org/10.31590/ejosat.1083423

Abstract

Aritmiler kalp atışındaki düzensizliklerdir ve hayati tehlike yaratabilir. Kardiyak Aritminin erken teşhisi, hastaların hayatlarını kurtarmak için oldukça önemlidir. Bu çalışmada, asıl amaç EKG kayıtlarından kardiyak aritmi varlığının saptanması ve 16 gruba sınıflandırılmasıdır. UCI veri bankasındaki aritmi veri seti, sınıflandırma amacıyla farklı ağ yapılarını uygulamak için kullanılmıştır. Veri setinde her sınıfın örnek sayısı aynı değildir. Veri seti oldukça düzensiz bir sınıf dağılımıa sahiptir. Ayrıca, veri setinde bazı sınıflar mevcut değildir. Sınıflar arasındaki dengesiz dağılım, sınıflandırıcının performansında düşük sınıflandırma doğruluğu gibi azalmalara neden olur. Ayrıca çapraz geçerlilik sınaması (cross-validation) adımlarında, sınıflandırmadaki zorluğun üstesinden gelmek için veriler, her bir sınıftan aynı sayıda örnek içeren gruplara ayrılmıştır. Her sınıfın örnekleri, bu koşulu sağlamak için beş gruba bölünmüştür. Eğitim ve test veri setleri bu grupların bir kombinasyonu olarak elde edilmiştir. Veri kümesindeki dengesizlik durumuyla başa çıkmak amacıyla, ilk olarak, verileri sınıflandırmak için Çok Katmanlı Algılayıcı (MLP), Destek Vektör Makinesi (SVM), Radyal Temel Fonksiyon (RBF) ve Rastgele Orman (RF) gibi bazı tipik sınıflandırma algoritmaları kullanılmıştır. Sınıflandırıcıların kesinlik ve doğruluk performans ölçümlerine göre, genel doğruluğu artırmak için, her bir veri sınıfı için iç içe sınıflandırıcı yapıları oluşturulmuştur. Daha iyi bir sınıflandırıcı performansı elde etmek için farklı yapılar denenmiştir. Klasik ve önerilen dört yeni topluluk ağının (ensemble network) performansları karşılaştırma için sunulmuştur. Karşılaştırma sonuçları, rastgele orman sınıflandırıcısının doğruluk açısından en iyi performansa sahip olduğunu ve en yüksek doğruluğa sahip topluluk ağıyla bile hemen hemen aynı performans sonuçların alınabileceğini göstermiştir. Bu nedenle ilerideki çalışmalarda sınıflandırıcı performansının iyileştirilmesi için veri setinin arttırılması ve farklı ağ yapılarının uygulanması planlanmaktadır.

References

  • Mustaqeem, A., Anwar, S. M., & Majid, M. (2018). Multiclass Classification of Cardiac Arrhythmia Using Improved Feature Selection and SVM Invariants. Computational and Mathematical Methods in Medicine, 2018, 1–10. https://doi.org/10.1155/2018/7310496
  • Gupta, A., Banerjee, A., Babaria, D., Lotlikar, K., & Raut, H. (2021). Prediction and Classification of Cardiac Arrhythmia. Advances in Intelligent Systems and Computing.
  • Guvenir, H., Acar, B., Demiroz, G., & Cekin, A. (1997). A supervised machine learning algorithm for arrhythmia analysis. Computers in Cardiology 1997. https://doi.org/10.1109/cic.1997.647926
  • Azar, A. T., Elshazly, H. I., Hassanien, A. E., & Elkorany, A. M. (2014). A random forest classifier for lymph diseases. Computer Methods and Programs in Biomedicine, 113(2), 465–473. https://doi.org/10.1016/j.cmpb.2013.11.004
  • Sharifrazi, D., Alizadehsani, R., Roshanzamir, M., Joloudari, J. H., Shoeibi, A., Jafari, M., Hussain, S., Sani, Z. A., Hasanzadeh, F., Khozeimeh, F., Khosravi, A., Nahavandi, S., Panahiazar, M., Zare, A., Islam, S. M. S., & Acharya, U. R. (2021). Fusion of convolution neural network, support vector machine and Sobel filter for accurate detection of COVID-19 patients using X-ray images. Biomedical Signal Processing and Control, 68, 102622. https://doi.org/10.1016/j.bspc.2021.102622
  • Chicco, D., Tötsch, N., & Jurman, G. (2021b). The Matthews correlation coefficient (MCC) is more reliable than balanced accuracy, bookmaker informedness, and markedness in two-class confusion matrix evaluation. BioData Mining, 14(1). https://doi.org/10.1186/s13040-021-00244-z

Classification of Imbalanced Cardiac Arrhythmia Data

Year 2022, Issue: 34, 546 - 552, 31.03.2022
https://doi.org/10.31590/ejosat.1083423

Abstract

Arrhythmias are irregularities in the heartbeat and can be life-threatening. Early diagnosis of Cardiac Arrhythmia is quite crucial for saving patient lives. In this study, the main goal is to detect the presence of cardiac arrhythmia and classify it into 16 groups from the ECG recordings. The arrhythmia dataset in the UCI databank is used to apply different network structures for classification. The number of sample of each class are not the same in the dataset. The dataset has a very immoderate class distribution, and moreover, some classes don't exist. The imbalance condition between the classes causes a decrement in the performance of the classifier such as low classification accuracy. Also, in the cross-validation steps, the data is divided into groups each of which includes the same number of samples from the classes to overcome this difficulty in the classification. The samples of each class are divided into five groups to satisfy that condition. The training and test datasets are obtained as a combination of these groups. To deal with the imbalance condition in the dataset, first, some typical classification algorithms as Multilayer Perceptron (MLP), Support Vector Machine (SVM), Radial Basis Function (RBF), and Random Forest (RF) are used to classify the data. According to the precision and accuracy performance measurements of the classifiers for each data class, the nested classifier structures are constructed to improve the overall accuracy. The different structures are tried to obtain a better classifier performance. The results of classical and proposed four new ensemble networks are presented to compare their performance. The result shows that the random forest classifier has the best performance in terms of accuracy and, even with the ensemble network having the highest accuracy can be obtained almost the same performance results. For this reason, it is planned to increase the dataset and apply the different network structures for the enhancement of classifier performance as to future work.

References

  • Mustaqeem, A., Anwar, S. M., & Majid, M. (2018). Multiclass Classification of Cardiac Arrhythmia Using Improved Feature Selection and SVM Invariants. Computational and Mathematical Methods in Medicine, 2018, 1–10. https://doi.org/10.1155/2018/7310496
  • Gupta, A., Banerjee, A., Babaria, D., Lotlikar, K., & Raut, H. (2021). Prediction and Classification of Cardiac Arrhythmia. Advances in Intelligent Systems and Computing.
  • Guvenir, H., Acar, B., Demiroz, G., & Cekin, A. (1997). A supervised machine learning algorithm for arrhythmia analysis. Computers in Cardiology 1997. https://doi.org/10.1109/cic.1997.647926
  • Azar, A. T., Elshazly, H. I., Hassanien, A. E., & Elkorany, A. M. (2014). A random forest classifier for lymph diseases. Computer Methods and Programs in Biomedicine, 113(2), 465–473. https://doi.org/10.1016/j.cmpb.2013.11.004
  • Sharifrazi, D., Alizadehsani, R., Roshanzamir, M., Joloudari, J. H., Shoeibi, A., Jafari, M., Hussain, S., Sani, Z. A., Hasanzadeh, F., Khozeimeh, F., Khosravi, A., Nahavandi, S., Panahiazar, M., Zare, A., Islam, S. M. S., & Acharya, U. R. (2021). Fusion of convolution neural network, support vector machine and Sobel filter for accurate detection of COVID-19 patients using X-ray images. Biomedical Signal Processing and Control, 68, 102622. https://doi.org/10.1016/j.bspc.2021.102622
  • Chicco, D., Tötsch, N., & Jurman, G. (2021b). The Matthews correlation coefficient (MCC) is more reliable than balanced accuracy, bookmaker informedness, and markedness in two-class confusion matrix evaluation. BioData Mining, 14(1). https://doi.org/10.1186/s13040-021-00244-z
There are 6 citations in total.

Details

Primary Language English
Subjects Engineering
Journal Section Articles
Authors

Cansu Ecemiş 0000-0001-5685-3895

Neslihan Avcu 0000-0001-8481-2863

Zekeriya Sarı 0000-0003-4070-9666

Early Pub Date January 30, 2022
Publication Date March 31, 2022
Published in Issue Year 2022 Issue: 34

Cite

APA Ecemiş, C., Avcu, N., & Sarı, Z. (2022). Classification of Imbalanced Cardiac Arrhythmia Data. Avrupa Bilim Ve Teknoloji Dergisi(34), 546-552. https://doi.org/10.31590/ejosat.1083423