Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
Öz
Yazılım
kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım
metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve
Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek
olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya
meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve
zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için
kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı
kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle
dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme
yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları
ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi
algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini
için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE
yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri
artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı
yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı
performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç
oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.
Anahtar Kelimeler
Kaynakça
- Gupta D, Vinay K, Mittal GH. “Comparative study of soft computing techniques for software quality model”. International Journal of Software Engineering Research & Practices, 1(1), 33-37, 2011.
- Hall T, Beecham S, Bowes D, Gray D, Counsell S. “A systematic literature review on fault prediction performance in software engineering”. IEEE Transactions on Software Engineering, 38(6), 1276-1304, 2012.
- Catal C, Diri B. “A systematic review of software fault prediction studies”. Expert Systems with Applications, 36(4), 7346-7354, 2009.
- Pal B, Hasan A, Aktar M, Shahdat N. “Cluster ensemble and probabilistic neural network modeling of class ımbalance learning in software defect prediction”. Artificial Intelligence and Applications, In Press.
- Shirabad S, Menzies TJ. School of Information Technology and Engineering, University of Ottawa. “The PROMISE repository of software engineering databases”. http://promise.site.uottawa.ca/SERepository (01.10.2017).
- Koru A, Liu H. “Building effective defect-prediction models in practice”. IEEE Software, 22(6), 23-29, 2005.
- Menzies T, Dekhtyar A, Distefano J, Greenwald J. “Problems with precision: A response to comments on data mining static code attributes to learn defect predictors”. IEEE Transactions on Software Engineering, 33(9), 637-640, 2007.
- Sahana DC. Software Defect Prediction Based on Classication Rule Mining. MSc Thesis, National Institute of Technology Rourkela, Rourkela, India, 2013.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yayımlanma Tarihi
12 Ekim 2018
Gönderilme Tarihi
7 Şubat 2018
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2018 Cilt: 24 Sayı: 5