Boyut İndirgeme Yöntemlerinin Karşılaştırmalı Analizi
Öz
Veri boyutunu indirgeyen çok sayıda teknik mevcuttur. Klasik yapay öğrenme tekniklerinden; PCA (Temel Bileşenler Analizi) ve LDA (Doğrusal Ayıraç Analizi), probleme matematiksel bir çözüm zemini kazandırdıkları için ön plana çıkarken, doğrusal olmayan tekniklerden, derin öğrenme yaklaşımlarından olan Oto-Kodlayıcı (Auto-Encoding), büyük verilerin indirgenmesine izin vermesi bakımından araştırmacıların ilgisini çekmektedir.
Bu çalışmada, gerçek ve sentetik veriler (doğrusal ve doğrusal olmayan) kullanılarak PCA, LDA ve Auto-Encoding (AE) yöntemlerinin boyut indirgeme performansları incelenmiştir. Belirli kıstaslarda (harcanan zaman, yeniden inşa etme doğruluğu vb.) alınan sonuçlar karşılaştırmalı bir şekilde sunulmuştur.
Anahtar Kelimeler
Kaynakça
- [1] Tharwat A. Principal component analysis - a tutorial. Int J Appl Pattern Recognit. 2016; [2] Jamal A, Handayani A, Septiandri AA, Ripmiatin E, Effendi Y. Dimensionality Reduction using PCA and K-Means Clustering for Breast Cancer Prediction. Lontar Komput J Ilm Teknol Inf. 2018;
- [3] Gu Q, Li Z, Han J. Linear discriminant dimensionality reduction. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2011.
- [4] Analysis LD. Introduction to LDA LDA. Cancer Lett. 2005; [5] Ng A. “Sparse autoencoder.” CS294A Lect notes 72. 2011;1(19).
- [6] Çalişan M, Talu MF. Examination of the effect of the basic parameters of the auto-encoder on coding performance. In: IDAP 2017 - International Artificial Intelligence and Data Processing Symposium. 2017.
- [7] MNIST Dataset [Internet]. [cited 2019 May 12]. Available from: http://yann.lecun.com/exdb/mnist/
- [8] Keogh EJ, Pazzani MJ. A simple dimensionality reduction technique for fast similarity search in large time series databases. In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). 2000.
- [9] Bishop CM. Pattern Regonization and Macine Learning. Oxidation Communications. 2004.
- [10] Han J, Kamber M, Pei J. Data Mining: Concepts and Techniques. Data Mining: Concepts and Techniques. 2012.
Ayrıntılar
Birincil Dil
Türkçe
Konular
Mühendislik
Bölüm
Araştırma Makalesi
Yazarlar
Mücahit Çalışan
*
0000-0003-2651-5937
Türkiye
Yayımlanma Tarihi
18 Haziran 2020
Gönderilme Tarihi
21 Mart 2020
Kabul Tarihi
31 Mayıs 2020
Yayımlandığı Sayı
Yıl 2020 Cilt: 9 Sayı: 1
Cited By
Ovarian Cancer Prediction Using PCA, K-PCA, ICA and Random Forest
Journal of Intelligent Systems with Applications
https://doi.org/10.54856/jiswa.202112168Assessment of COVID-19-Related Genes Through Associative Classification Techniques
Konuralp Tıp Dergisi
https://doi.org/10.18521/ktd.958555MAKİNE ÖĞRENMESİ YÖNTEMLERİ İLE EĞİTİM BAŞARISINA ETKİ EDEN FAKTÖRLERİN MODELLENMESİ
İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi
https://doi.org/10.55071/ticaretfbd.1442084