Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır.
Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz
öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikrodizi veri kümesi üzerinde öznitelik
boyut azaltılması amacıyla Temel bileşenler analizi (TBA) ve Parçacık sürü optimizasyonu (PSO) kullanılmıştır.
Bu sayede hastalıkları etkileyen genler tespit edilmektedir. Boyutu azaltılmış veri kümeleri Destek Vektör
Makinesi ve k-En Yakın Komşuluk sınıflayıcı yöntemlerine giriş olarak verilmiş ve sınıflandırma başarı sonuçları
değerlendirilmiştir. Sonuç olarak PSO boyut azaltma yöntemi ile prostat kanserinde etkin genler belirlenmiş ve 50
öznitelik ile %95.77 başarı elde edilmiştir.
Mikrodizi Prostat Kanseri Temel bileşen analizi Parçacık sürü optimizasyonu
Data mining analysis based on microarray data is used in disease diagnosis and pharmacology. The major challenge
in the analysis phase is the high dimension of microarrays and the large number of unnecessary features. For this
reason, Principle Component Analysis (PCA) and Particle Swarm Optimization (PSO) were used to reduce the
feature dimension on the prostate cancer microarray dataset used in the study. In this way, genes that affect diseases
are determined. Dimension reduced data sets are given as input to Support Vector Machine and k-Nearest neighbor
classification methods and classification success results are evaluated. Finally, active genes in prostate cancer were
identified by PSO dimension reduction method and 95.77% success was achieved with 50 attributes.
Microarray Prostate cancer Principal Component Analysis Particle Swarm Optimization.
Birincil Dil | Türkçe |
---|---|
Konular | Mühendislik |
Bölüm | Makaleler |
Yazarlar | |
Yayımlanma Tarihi | 31 Ocak 2019 |
Yayımlandığı Sayı | Yıl 2019 Cilt: 7 Sayı: 1 |