Analyzing the financial situation of companies is very important today. Thanks to early analysis, companies can improve their financial situation and be saved from bankruptcy. Until now, many studies have been carried out on the financial analysis of companies. Data mining techniques are widely used in many different areas of the financial sector. In this study, data mining classification technique has been used to determine the financial risk status of companies. The data set has been created by using the balance sheets taken from the Kamu Aydınlatma Platformu (KAP) between 2013 and 2018 of different companies serving in the manufacturing industry. There are a total of 1027 records in the data set. On these records, the financial ratios determined for that year for each firm have been calculated and recorded in the database. The Springate model has been used to determine the financial success of the companies. Springate formula consists of 4 financial ratios. Springate score value is calculated by multiplying these ratios with certain coefficients. If the calculated score value is less than 0.862, the firm is considered unsuccessful, else the firm is considered successful. In this context, the Springate score has been calculated for each record and the companies have been labeled as successful or unsuccessful according to the score value. In this study, the KNN (K-Nearest Neighbor) algorithm has been used for classification. The KNN algorithm classifies the new element to be classified by looking at its proximity to its k neighbors. KNN algorithm needs learning data to classify unclassified data. In this study, cross validation method has been used for determining learning data and the data to be classified. According to the cross validation method, the data set is divided into n groups. For each group, the selected group creates the data to be classified. All other groups (n-1 groups) are used as learning data. Then the classification process is applied and the results are stored. After the classification process is completed for all groups, the statistical summary of the results is checked. In this study, the dataset was divided into 10 groups and the classification results have been evaluated. When the results have been examined, it has seen that the algorithm has make a successful classification with a rate of 88.42%. Thus, the financial risk estimation of the companies has made with the classification technique applied on the determined finance model.
Data Mining KNN Classification Algorithm Financial Risk Analysis Financial Mathematics
Ege University
FDK-2020-21759
This study is supported by Ege University Scientific Research Projects Directorate with the project number FDK-2020-21759.
Firmaların finansal durumlarının analiz edilmesi günümüzde oldukça önem taşımaktadır. Erken yapılan analizler sayesinde firmalar finans durumlarını düzeltebilir ve iflas etmekten kurtarılabilir. Bu zamana kadar firmaların finansal analizi üzerine birçok çalışma yapılmıştır. Veri madenciliği teknikleri finans sektörünün farklı birçok alanında yaygın olarak kullanılmaktadır. Bu çalışmada firmaların finansal risk durumlarının belirlenmesi için veri madenciliği sınıflandırma tekniği kullanılmıştır. Veri seti, imalat sanayi sektöründe hizmet veren farklı firmaların 2013 ile 2018 yılları arasında Kamu Aydınlatma Platformu (KAP)’ndan alınan bilanço tabloları kullanılarak oluşturulmuştur. Veri setimizde toplam 1027 kayıt bulunmaktadır. Bu kayıtlar üzerinde her bir firma için o yıla ait belirlenen finansal oranlar hesaplanarak veri tabanına kaydedilmiştir. Firmaların finansal başarılarının belirlenmesi için Springate modeli kullanılmıştır. Springate modeli firmaların gelecekteki iflasın erken tahminlenmesi için kullanılan bir modeldir. Springate formülü 4 finansal orandan oluşur. Bu oranlar belli katsayılar ile çarpılarak Springate skor değeri hesaplanır. Hesaplanan skor değeri 0.862’den küçük ise firma başarısız büyük ise firma başarılı olarak kabul edilir. Bu kapsamda her bir kayıt için Springate skoru hesaplanmış ve skor değerine göre firmalar başarılı veya başarısız olarak etiketlenmiştir. Bu çalışmada sınıflandırma işlemi için KNN (K-En Yakın Komşu) algoritması kullanılmıştır. KNN algoritması, sınıflandırılacak yeni elemanı belirlenen k tane komşusuyla arasındaki yakınlığa bakarak sınıflandırır. KNN algoritması sınıflandırılmamış verileri sınıflandırmak için öğrenim verisine ihtiyaç duyar. Çalışmada öğrenim ve sınıflandırılacak verilerin belirlenmesi için çapraz sorgulama yöntemi kullanılmıştır. Çapraz sorgulama yöntemine göre veri seti n adet gruba ayrılır. Her bir grup için, seçilen grup sınıflandırılacak veriyi oluşturur. Diğer tüm gruplar (n-1 grup) öğrenim verisi olarak kullanılır. Daha sonra sınıflandırma işlemi uygulanarak ve sonuçlar saklanır. Bütün gruplar için sınıflandırma işlemleri bittikten sonra sonuçların istatistiksel özetine bakılır. Bu çalışmada veri kümesi 10 gruba ayrılarak sınıflandırma sonuçları değerlendirilmiştir. Sonuçlar incelendiğinde algoritmanın %88.42 oranla başarılı sınıflandırma yaptığı görülmüştür. Böylece firmaların finansal risk tahmini, belirlenen finans modeli üzerinde uygulanan sınıflandırma tekniği ile yapılmıştır.
Veri Madenciliği KNN Sınfıflandırma Algoritması Finansal Risk Analizi Finansal Matematik
FDK-2020-21759
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Proje Numarası | FDK-2020-21759 |
Yayımlanma Tarihi | 1 Aralık 2021 |
Yayımlandığı Sayı | Yıl 2021 |