Araştırma Makalesi
BibTex RIS Kaynak Göster

The Impact of Resampling Techniques on the Performance of Software Defect Prediction Using the NASA Metrics Data Program Dataset

Yıl 2025, Sayı: Advanced Online Publication, 25 - 26
https://doi.org/10.34248/bsengineering.1792907

Öz

Software defects are inevitable, and predicting such defects has become a necessity for effective resource management. However, software defect prediction poses several challenges, particularly when models are trained on imbalanced datasets. The NASA Metrics Data Program (MDP) is a widely used repository containing software metrics and defect data from various NASA projects. To narrow the study’s scope, the JM1 subset was selected due to its large size and class imbalance. The effects of resampling techniques on the performance of machine learning models were examined using the JM1 dataset. We evaluate several oversampling, undersampling, and hybrid resampling methods-including SMOTE, RUS, ROSE, ADASYN, Tomek Links, ENN, Near Miss, and Borderline-SMOTE-in conjunction with classifiers such as Naive Bayes (NB), Support Vector Machines (SVM), Logistic Regression (LR), Decision Tree (DT), and Random Forest (RF). Our results indicate that models trained without any resampling often perform poorly in identifying faulty modules (the minority class), despite achieving deceptively high values in overall accuracy metrics. Conversely, hybrid methods such as SMOTE+ENN and oversampling techniques like ROSE significantly improve performance-particularly when used with Random Forest and Naive Bayes classifiers-based on metrics sensitive to class imbalance such as AUC and F1-score. The best performance is observed when combining Random Forest with SMOTE+ENN, achieving 0.9350 accuracy, an AUC of 0.9837, and F1-scores of 0.9126 and 0.9483 for non-defective and defective modules, respectively. Consequently, for imbalanced software defect datasets, the selection of appropriate resampling methods and the use of metrics truly reflecting real-world performance are critically important.

Kaynakça

  • Abdelmoumin, G., Rawat, D. B., & Rahman, A. (2023). Studying imbalanced learning for anomaly-based intelligent IDS for mission-critical Internet of Things. Journal of Cybersecurity and Privacy, 3(4), 706–743.
  • Agrawal, A., Menzies, T., Minku, L. L., Wagner, M., & Yu, Z. (2020). Better software analytics via “DUO”: Data mining algorithms using/used-by optimizers. Empirical Software Engineering, 25(3), 2099–2136.

NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi

Yıl 2025, Sayı: Advanced Online Publication, 25 - 26
https://doi.org/10.34248/bsengineering.1792907

Öz

Yazılımlarda hatalar kaçınılmazdır ve bu hataların önceden tahmin edilmesi, etkin kaynak yönetimi açısından kritik öneme sahiptir. Ancak yazılım hata tahmininde (YHT), özellikle dengesiz veri kümeleri ile çalışıldığında, önemli zorluklar ortaya çıkmaktadır. NASA Metrics Data Program (MDP), NASA tarafından yürütülen ve çeşitli yazılım projelerinden elde edilen metrikleri ve hata bilgilerini içeren, araştırmalarda yaygın olarak kullanılan bir veri deposudur. Çok sayıda alt kümeye sahip NASA MDP verilerinde, çalışmanın kapsamını sınırlamak için uygun bir alt veri kümesinin seçilmesi uygun olacaktır. Bu amaçla, büyük ve dengesiz veriler içermesi nedeniyle JM1 alt kümesi tercih edilmiştir. JM1 üzerinde yeniden örnekleme tekniklerinin makine öğrenmesi modellerinin başarımına etkileri incelenmiştir. Bu kapsamda SMOTE, RUS, ROSE, ADASYN, Tomek Links, ENN, Near Miss ve Borderline-SMOTE gibi aşırı örnekleme, eksik örnekleme ve hibrit teknikler; Naive Bayes (NB), Destek Vektör Makineleri (DVM), Lojistik Regresyon (LR), Karar Ağacı (KA) ve Rastgele Orman (RO) sınıflandırıcıları ile birlikte değerlendirilmiştir. Sonuçlar, yeniden örnekleme uygulanmayan modellerin, özellikle azınlık sınıfı olarak tanımlanan hatalı modülleri tanımada düşük başarım sergilediğini; buna karşın genel doğruluk metriklerinde yanıltıcı şekilde yüksek değerler elde edebildiğini göstermektedir. Öte yandan, SMOTE+ENN gibi hibrit ve ROSE gibi aşırı örnekleme yöntemlerinin, özellikle Rastgele Orman ve Naive Bayes sınıflandırıcılarıyla birlikte kullanıldığında, AUC ve F1-ölçütü gibi dengesizliğe duyarlı metriklerde anlamlı iyileşmeler sağladığı gözlemlenmiştir. En iyi sonuç, SMOTE+ENN yöntemiyle birlikte kullanılan Rastgele Orman modeliyle elde edilmiş; 0,9350 doğruluk, 0,9837 AUC ve hatasız/hatalı modüller için sırasıyla 0,9126/0,9483 F1-ölçütü değerlerine ulaşılmıştır. Bu bulgular, yazılım hata tahmininde sınıf dengesizliğiyle mücadelede uygun yeniden örnekleme stratejilerinin seçiminin ve dengesizliğe duyarlı metriklerle değerlendirme yapılmasının önemini ortaya koymaktadır.

Kaynakça

  • Abdelmoumin, G., Rawat, D. B., & Rahman, A. (2023). Studying imbalanced learning for anomaly-based intelligent IDS for mission-critical Internet of Things. Journal of Cybersecurity and Privacy, 3(4), 706–743.
  • Agrawal, A., Menzies, T., Minku, L. L., Wagner, M., & Yu, Z. (2020). Better software analytics via “DUO”: Data mining algorithms using/used-by optimizers. Empirical Software Engineering, 25(3), 2099–2136.
Toplam 2 adet kaynakça vardır.

Ayrıntılar

Birincil Dil Türkçe
Konular Bilgi Sistemleri (Diğer)
Bölüm Araştırma Makalesi
Yazarlar

Emre Can Yılmaz 0000-0003-4365-9131

Recai Oktaş 0000-0003-3282-3549

Gönderilme Tarihi 29 Eylül 2025
Kabul Tarihi 7 Kasım 2025
Erken Görünüm Tarihi 4 Aralık 2025
Yayımlandığı Sayı Yıl 2025 Sayı: Advanced Online Publication

Kaynak Göster

APA Yılmaz, E. C., & Oktaş, R. (2025). NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi. Black Sea Journal of Engineering and Science(Advanced Online Publication), 25-26. https://doi.org/10.34248/bsengineering.1792907
AMA Yılmaz EC, Oktaş R. NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi. BSJ Eng. Sci. Aralık 2025;(Advanced Online Publication):25-26. doi:10.34248/bsengineering.1792907
Chicago Yılmaz, Emre Can, ve Recai Oktaş. “NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi”. Black Sea Journal of Engineering and Science, sy. Advanced Online Publication (Aralık 2025): 25-26. https://doi.org/10.34248/bsengineering.1792907.
EndNote Yılmaz EC, Oktaş R (01 Aralık 2025) NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi. Black Sea Journal of Engineering and Science Advanced Online Publication 25–26.
IEEE E. C. Yılmaz ve R. Oktaş, “NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi”, BSJ Eng. Sci., sy. Advanced Online Publication, ss. 25–26, Aralık2025, doi: 10.34248/bsengineering.1792907.
ISNAD Yılmaz, Emre Can - Oktaş, Recai. “NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi”. Black Sea Journal of Engineering and Science Advanced Online Publication (Aralık2025), 25-26. https://doi.org/10.34248/bsengineering.1792907.
JAMA Yılmaz EC, Oktaş R. NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi. BSJ Eng. Sci. 2025;:25–26.
MLA Yılmaz, Emre Can ve Recai Oktaş. “NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi”. Black Sea Journal of Engineering and Science, sy. Advanced Online Publication, 2025, ss. 25-26, doi:10.34248/bsengineering.1792907.
Vancouver Yılmaz EC, Oktaş R. NASA Metrics Data Program Veri Seti Üzerinde Yeniden Örnekleme Yöntemlerinin Yazılımda Hata Tahmini Başarımına Etkisi. BSJ Eng. Sci. 2025(Advanced Online Publication):25-6.

                           24890