Diğer analiz yazılımları gibi veri madenciliği yazılımlarıda (VMY) kullandıkları yöntemleri gerçekleştirmek için başvuru kitabı (reference manual) kullanırlar. VMY’nın başvuru kitabına göre elde edilen sonuçların tutarlı olduğunu ve analizlerin hangi kaynağa göre yapıldığını kullanıcılara beyan ederler. VMY’nın kullandıkları başvuru kitaplarının kaynakları birbirinden farklı olabilir ve farklı sonuçlar ortaya çıkarabilir. Analizlerin bazıları yakınsama ve yineleme teknikleriyle çalışabilir. Aynı analiz için farklı yakınsama ve yineleme teknikleri farklı sonuçları ortaya çıkartabilir. Çalışmanın amacı aynı veri ve aynı analiz için farklı veri madenciliği yazılımlarından elde edilen sonuçların uyuşmazlığını göstermektir. Örnek veri olarak çalışmada 2012 yılı Borsa İstanbul’da işlem gören 270 işletmenin BvGT’si kullanılmıştır. İşletmelerin mali başarısızlık durumuna düşüp düşmemeleri, nakdi ve nakdi olmayan değerlerinin dengeli kullanılmasına bağlıdır. Edward I. Altman ve arkadaşları bilanço ve gelir tablolarına (BvGT) bağlı finansal oranlara göre mali başarısızlık-başarı Altman Z Skora (AZS) yöntemlerini belirlemişlerdir. Bu çalışma için 2012 yılına ait BvGT’deki kalemlere bağlı 21 oran elde edilmiştir. BvGT’ye bağlı oranlar kendi doğalarından ötürü bir biriyle istatistiksel açıdan ilişkili içindedirler. Ortaya çıkabilecek çoklu bağlantı sorunu temel bileşenler analizine (TBA) göre çözülmek istenmiştir ve boyut indirgemesi yapılmıştır. TBA’DA işleme alınan kovaryans matrisi (KM) positif tanımlı matris (PTM) olmadığı fark edilmiştir. Her yazılım PTM olmayan matris sorununu çözmek için kendi nümerik analiz yöntemlerini kullandığı anlaşılmıştır. İşletmelerin mali başarısızlık-başarıları AZS’ye göre kategorik olarak 0-1 şeklinde belirlenmiştir. TBA’dan kestirilen indirgenmiş sayıdaki değişkenler kullanılarak ikili lojistik regresyon (İLR) analiziyle mali başarı ve başarısızlık kestirilmiştir. Veri madenciliği yazılımlarının İLR’deki ayrıştırma performansı ROC eğrisine göre karşılaştırılmıştır. IBM Modeler (SPSS), Statistica, Stata, SAS, R, Weka, Orange yazılımlarında TBA sonrası İLR analizi yapılmıştır. Veri madenciliği yazılımlarının PTM olmayan kovaryas matrisine bağlı sonuçlarının uyuşmazlık tartışılmıştır.
Like other analysis software such as data mining software (DMS) to perform the methods use a guidebook (reference manual). Software declares their results are consistently obtained by the reference book and their analysis are based on related references. DMS uses different references and may cause different results. Some analysis may work with some different convergence and iteration techniques. The same analysis with different convergence and iteration techniques can reveal a different outcome. Aim of the study is to reveal the mismatch of data mining software results for the same analysis. In this study as an example data, 270 Borsa İstanbul companies were used at period 2012. In order to survive in the competitive environment, companies must balance their monetary and non-monetary assets. Edward I. Altman et al revealed the procedure called Altman Z score (AZS) of financial distress or not from the balance sheet and income table (BS&IT). In this study according to items of BS&IT 21 financial ratios were calculated. The financial ratios of BS&IT are related to each other because of BS&IT nature. The problem of multicollinearity was wanted to solved with principal component analysis (PCA) and dimension was reduced. Covariance matrix that analyzed with PCA, was not a positive definite matrix. Each DMS use its own numerical analysis procedure in order to solve this problem. Financial distress or not of companies were determined according to Altman Z score (AZS) as categorically labeled with 0-1. The reduced number of variables estimated from PCA, the financial distress of companies or not were predicted using binary logistic regression (BLR) with these reduced variables. BLR extraction performance of the data mining software was compared to ROC curves. After PCA, BLR was conducted on the IBM Modeler (SPSS), Statistica, Stata, SAS, R, Weka, Orange data mining software. The mismatch of data mining software results was discussed.
Bölüm | Makaleler |
---|---|
Yazarlar | |
Yayımlanma Tarihi | 1 Ocak 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 7 Sayı: 1 |