Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
Öz
Yazılım
kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım
metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve
Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek
olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya
meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve
zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için
kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı
kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle
dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme
yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları
ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi
algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini
için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE
yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri
artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı
yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı
performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç
oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.
Anahtar Kelimeler
References
- Gupta D, Vinay K, Mittal GH. “Comparative study of soft computing techniques for software quality model”. International Journal of Software Engineering Research & Practices, 1(1), 33-37, 2011.
- Hall T, Beecham S, Bowes D, Gray D, Counsell S. “A systematic literature review on fault prediction performance in software engineering”. IEEE Transactions on Software Engineering, 38(6), 1276-1304, 2012.
- Catal C, Diri B. “A systematic review of software fault prediction studies”. Expert Systems with Applications, 36(4), 7346-7354, 2009.
- Pal B, Hasan A, Aktar M, Shahdat N. “Cluster ensemble and probabilistic neural network modeling of class ımbalance learning in software defect prediction”. Artificial Intelligence and Applications, In Press.
- Shirabad S, Menzies TJ. School of Information Technology and Engineering, University of Ottawa. “The PROMISE repository of software engineering databases”. http://promise.site.uottawa.ca/SERepository (01.10.2017).
- Koru A, Liu H. “Building effective defect-prediction models in practice”. IEEE Software, 22(6), 23-29, 2005.
- Menzies T, Dekhtyar A, Distefano J, Greenwald J. “Problems with precision: A response to comments on data mining static code attributes to learn defect predictors”. IEEE Transactions on Software Engineering, 33(9), 637-640, 2007.
- Sahana DC. Software Defect Prediction Based on Classication Rule Mining. MSc Thesis, National Institute of Technology Rourkela, Rourkela, India, 2013.
Details
Primary Language
Turkish
Subjects
Engineering
Journal Section
Research Article
Publication Date
October 12, 2018
Submission Date
February 7, 2018
Acceptance Date
-
Published in Issue
Year 2018 Volume: 24 Number: 5