Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi
Abstract
Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır.
Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz
öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikrodizi veri kümesi üzerinde öznitelik
boyut azaltılması amacıyla Temel bileşenler analizi (TBA) ve Parçacık sürü optimizasyonu (PSO) kullanılmıştır.
Bu sayede hastalıkları etkileyen genler tespit edilmektedir. Boyutu azaltılmış veri kümeleri Destek Vektör
Makinesi ve k-En Yakın Komşuluk sınıflayıcı yöntemlerine giriş olarak verilmiş ve sınıflandırma başarı sonuçları
değerlendirilmiştir. Sonuç olarak PSO boyut azaltma yöntemi ile prostat kanserinde etkin genler belirlenmiş ve 50
öznitelik ile %95.77 başarı elde edilmiştir.
Keywords
Mikrodizi,Prostat Kanseri,Temel bileşen analizi,Parçacık sürü optimizasyonu
References
- [1] H. Liu, I. Bebu and X. Li, "Microarray probes and probe sets," Frontiers in bioscience (Elite edition), vol. 2, pp. 325-338, 2010. [2] H.U. Luleyap, "The Principles of Moleculer Genetics," İzmir, Türkiye: Nobel Yayınevi, 2008.
- [3] K. Ipekdal, “Microarray Technology,” (2018, 10 Aralık). [Online]. Available: http://yunus.hacettepe.edu.tr/ ~mergen/sunu/s_mikroarrayan decology.pdf.
- [4] M. A. Hall and L. A. Smith, "Practical feature subset selection for machine learning", In Computer science’98 proceedings of the 21st Australasian computer science conference ACSC, 1998, pp. 181-191.
- [5] B. Sahu, and D. Mishra, "A novel feature selection algorithm using particle swarm optimization for cancer microarray data," Procedia Engineering, vol. 38, pp. 27-31, 2012.
- [6] S. Kar, , K. D. Sharma and M. Maitra, "Gene selection from microarray gene expression data for classification of cancer subgroups employing PSO and adaptive K-nearest neighborhood technique," Expert Systems with Applications, vol.42, no.1, pp. 612-627, 2015.
- [7] H. Banka and S.A Dara, "Hamming distance based binary particle swarm optimization (HDBPSO) algorithm for high dimensional feature selection, classification and validation," Pattern Recognition Letters, vol. 52, pp. 94-100, 2015.
- [8] P. Yasodha and N. R. Ananthanarayanan, "Analysing big data to build knowledge based system for early detection of ovarian cancer," Indian Journal of Science and Technology, vol. 8, no. 14, 2015.
- [9] K. H. Chen, K. J. Wang, M. L. Tsai, K. M. Wang, A. M. Adrian, W. C. Cheng, ... and K. S. Chang, "Gene selection for cancer identification: a decision tree model empowered by particle swarm optimization algorithm," BMC bioinformatics, vol. 15, no. 1, pp. 49, 2014.
- [10] O. Inan, M. S. Uzer, and N. Yılmaz, "A new hybrid feature selection method based on association rules and PCA for detection of breast cancer," International Journal of Innovative Computing, Information and Control, vol. 9, no. 2, pp. 727-729, 2013.
- [11] M. Kaya, H. Ş. Bilge ve O. Yıldız, "Gen ifadelerinde Öz Nitelik Seçimi ve Boyut İndirgeme, 21. IEEE Sinyal İşleme ve İletişim Uygulamaları Kurultayı SIU2013, Haspolat, Türkiye, 2013.