Görsel veri madenciliği, verileri veya analiz sonucunda elde edilen bulguları görselleştirerek örtük ve faydalı bilgileri keşfetmeye yarar. Bu çalışmada; 2020 yılı aktif sigortalı sayılarına ait veriler yardımıyla, Türkiye’deki illerin benzerlik ve farklılıklarının ortaya çıkarılması amaçlanmıştır. Yöntem olarak istatistiksel veri analizi ve veri madenciliği tekniklerinden çok boyutlu ölçekleme ve kümeleme analizleri bulguları görselleştirilerek kullanılmıştır. Tüm analizler R programlama dili kullanılarak yapılmıştır. Çok boyutlu ölçeklemede uyum iyiliği değerleri incelenmiştir. Kümeleme analizinde optimal küme sayısını tespit etmek için içsel kümeleme performansı indeksleri karşılaştırılmıştır. Elde edilen sonuçlara göre, iki boyutlu uzayda elde edilen harita, gerçek uzaklıklarla karşılaştırıldığında iyi derecede uyum göstermektedir. En iyi kümeleme için içsel indekslerin çoğu küme sayısının iki olması gerektiğini söylemektedir. Buna göre çok boyutlu ölçekleme ile elde edilen iki boyutlu dağılımda iller iki kümeye ayrışmaktadırlar. 4/a ve 4/b sigortalılarda dağılım dengeli iken 4/c sigortalılarda çok az sayıda ilin diğerlerinden ayrıştığı belirlenmiştir.
Çok Boyutlu Ölçekleme K-Ortalamalar Kümeleme İstatistiksel Analiz Veri Görselleştirme Görsel Veri Madenciliği
Çok Boyutlu Ölçekleme K-Ortalamalar Kümeleme İstatistiksel Analiz Veri Görselleştirme Görsel Veri Madenciliği
Birincil Dil | Türkçe |
---|---|
Konular | Ekonomi, Finans |
Bölüm | Araştırma Makaleleri |
Yazarlar | |
Yayımlanma Tarihi | 30 Mart 2022 |
Yayımlandığı Sayı | Yıl 2022 Sayı: 1 |