Research Article
BibTex RIS Cite

Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi

Year 2019, Volume: 7 Issue: 1, 769 - 777, 31.01.2019
https://doi.org/10.29130/dubited.464092

Abstract

Mikrodizi verilerine dayanan veri madenciliği analizi, hastalık teşhisi ve farmakoloji alanlarında kullanılmaktadır.
Analiz aşamasında yaşanan en önemli zorluk, mikrodizilerin yüksek boyutlu olması ve çok sayıda gereksiz
öznitelik içermesidir. Bu nedenle çalışmada kullandığımız prostat kanseri mikrodizi veri kümesi üzerinde öznitelik
boyut azaltılması amacıyla Temel bileşenler analizi (TBA) ve Parçacık sürü optimizasyonu (PSO) kullanılmıştır.
Bu sayede hastalıkları etkileyen genler tespit edilmektedir. Boyutu azaltılmış veri kümeleri Destek Vektör
Makinesi ve k-En Yakın Komşuluk sınıflayıcı yöntemlerine giriş olarak verilmiş ve sınıflandırma başarı sonuçları
değerlendirilmiştir. Sonuç olarak PSO boyut azaltma yöntemi ile prostat kanserinde etkin genler belirlenmiş ve 50
öznitelik ile %95.77 başarı elde edilmiştir. 

References

  • [1] H. Liu, I. Bebu and X. Li, "Microarray probes and probe sets," Frontiers in bioscience (Elite edition), vol. 2, pp. 325-338, 2010. [2] H.U. Luleyap, "The Principles of Moleculer Genetics," İzmir, Türkiye: Nobel Yayınevi, 2008.
  • [3] K. Ipekdal, “Microarray Technology,” (2018, 10 Aralık). [Online]. Available: http://yunus.hacettepe.edu.tr/ ~mergen/sunu/s_mikroarrayan decology.pdf.
  • [4] M. A. Hall and L. A. Smith, "Practical feature subset selection for machine learning", In Computer science’98 proceedings of the 21st Australasian computer science conference ACSC, 1998, pp. 181-191.
  • [5] B. Sahu, and D. Mishra, "A novel feature selection algorithm using particle swarm optimization for cancer microarray data," Procedia Engineering, vol. 38, pp. 27-31, 2012.
  • [6] S. Kar, , K. D. Sharma and M. Maitra, "Gene selection from microarray gene expression data for classification of cancer subgroups employing PSO and adaptive K-nearest neighborhood technique," Expert Systems with Applications, vol.42, no.1, pp. 612-627, 2015.
  • [7] H. Banka and S.A Dara, "Hamming distance based binary particle swarm optimization (HDBPSO) algorithm for high dimensional feature selection, classification and validation," Pattern Recognition Letters, vol. 52, pp. 94-100, 2015.
  • [8] P. Yasodha and N. R. Ananthanarayanan, "Analysing big data to build knowledge based system for early detection of ovarian cancer," Indian Journal of Science and Technology, vol. 8, no. 14, 2015.
  • [9] K. H. Chen, K. J. Wang, M. L. Tsai, K. M. Wang, A. M. Adrian, W. C. Cheng, ... and K. S. Chang, "Gene selection for cancer identification: a decision tree model empowered by particle swarm optimization algorithm," BMC bioinformatics, vol. 15, no. 1, pp. 49, 2014.
  • [10] O. Inan, M. S. Uzer, and N. Yılmaz, "A new hybrid feature selection method based on association rules and PCA for detection of breast cancer," International Journal of Innovative Computing, Information and Control, vol. 9, no. 2, pp. 727-729, 2013.
  • [11] M. Kaya, H. Ş. Bilge ve O. Yıldız, "Gen ifadelerinde Öz Nitelik Seçimi ve Boyut İndirgeme, 21. IEEE Sinyal İşleme ve İletişim Uygulamaları Kurultayı SIU2013, Haspolat, Türkiye, 2013.
  • [12] D. Singh, P. G. Febbo, K. Ross, D. G. Jackson, J. Manola, C. Ladd, ... and E. S. Lander, "Gene expression correlates of clinical prostate cancer behavior," Cancer cell, vol. 1, no. 2, pp. 203-209, 2002.
  • [13] H. Göker ve H. Tekedere, "Fatih Projesine Yönelik Görüşlerin Metin Madenciliği Yöntemleri İle Otomatik Değerlendirilmesi," Bilişim Teknolojileri Dergisi, c. 10, s. 3, ss. 291-299, 2017.
  • [14] Y. Saeys, I. Inza, and P. Larrañaga, "A review of feature selection techniques in bioinformatics," bioinformatics, vol. 23, no. 19, pp. 2507-2517, 2007.
  • [15] I. T. Jolliffe, "Principal component analysis and factor analysis," In Principal component analysis, pp. 115-128, 1986.
  • [16] J. Kennedy, and R. Eberhart,"PSO optimization," In Proc. IEEE Int. Conf. Neural Networks, 1995, pp. 1941-1948
  • [17] B. Xue, M. Zhang, & W. N. Browne, "Particle swarm optimisation for feature selection in classification: Novel initialisation and updating mechanisms," Applied Soft Computing, vol. 18, pp. 261-276, 2014.
  • [18] V. Vapnik, “The nature of statistical learning theory,” Springer-Verlag: New York, 1995, pp. 75-100.
  • [19] E. Karacan, "Hastalıkların Uyarlanmış Destek Vektör Makinesiyle Teşhis Edilmesi, " Yüksek Lisans Tezi, Bilgisayar Mühendisliği, Ondokuz Mayıs Üniversitesi, Samsun, Türkiye, 2015.
  • [20] S. A. Dudani, "The distance-weighted k-nearest-neighbor rule," IEEE Transactions on Systems, Man and Cybernetics, vol. 6, no. 4, pp. 325–327, 1976.

Prostate Cancer Diagnosis With Machine Learning Methods On Microarray Data Reduced In Dimension Using Particle Swarm Optimization

Year 2019, Volume: 7 Issue: 1, 769 - 777, 31.01.2019
https://doi.org/10.29130/dubited.464092

Abstract

Data mining analysis based on microarray data is used in disease diagnosis and pharmacology. The major challenge
in the analysis phase is the high dimension of microarrays and the large number of unnecessary features. For this
reason, Principle Component Analysis (PCA) and Particle Swarm Optimization (PSO) were used to reduce the
feature dimension on the prostate cancer microarray dataset used in the study. In this way, genes that affect diseases
are determined. Dimension reduced data sets are given as input to Support Vector Machine and k-Nearest neighbor
classification methods and classification success results are evaluated. Finally, active genes in prostate cancer were
identified by PSO dimension reduction method and 95.77% success was achieved with 50 attributes. 

References

  • [1] H. Liu, I. Bebu and X. Li, "Microarray probes and probe sets," Frontiers in bioscience (Elite edition), vol. 2, pp. 325-338, 2010. [2] H.U. Luleyap, "The Principles of Moleculer Genetics," İzmir, Türkiye: Nobel Yayınevi, 2008.
  • [3] K. Ipekdal, “Microarray Technology,” (2018, 10 Aralık). [Online]. Available: http://yunus.hacettepe.edu.tr/ ~mergen/sunu/s_mikroarrayan decology.pdf.
  • [4] M. A. Hall and L. A. Smith, "Practical feature subset selection for machine learning", In Computer science’98 proceedings of the 21st Australasian computer science conference ACSC, 1998, pp. 181-191.
  • [5] B. Sahu, and D. Mishra, "A novel feature selection algorithm using particle swarm optimization for cancer microarray data," Procedia Engineering, vol. 38, pp. 27-31, 2012.
  • [6] S. Kar, , K. D. Sharma and M. Maitra, "Gene selection from microarray gene expression data for classification of cancer subgroups employing PSO and adaptive K-nearest neighborhood technique," Expert Systems with Applications, vol.42, no.1, pp. 612-627, 2015.
  • [7] H. Banka and S.A Dara, "Hamming distance based binary particle swarm optimization (HDBPSO) algorithm for high dimensional feature selection, classification and validation," Pattern Recognition Letters, vol. 52, pp. 94-100, 2015.
  • [8] P. Yasodha and N. R. Ananthanarayanan, "Analysing big data to build knowledge based system for early detection of ovarian cancer," Indian Journal of Science and Technology, vol. 8, no. 14, 2015.
  • [9] K. H. Chen, K. J. Wang, M. L. Tsai, K. M. Wang, A. M. Adrian, W. C. Cheng, ... and K. S. Chang, "Gene selection for cancer identification: a decision tree model empowered by particle swarm optimization algorithm," BMC bioinformatics, vol. 15, no. 1, pp. 49, 2014.
  • [10] O. Inan, M. S. Uzer, and N. Yılmaz, "A new hybrid feature selection method based on association rules and PCA for detection of breast cancer," International Journal of Innovative Computing, Information and Control, vol. 9, no. 2, pp. 727-729, 2013.
  • [11] M. Kaya, H. Ş. Bilge ve O. Yıldız, "Gen ifadelerinde Öz Nitelik Seçimi ve Boyut İndirgeme, 21. IEEE Sinyal İşleme ve İletişim Uygulamaları Kurultayı SIU2013, Haspolat, Türkiye, 2013.
  • [12] D. Singh, P. G. Febbo, K. Ross, D. G. Jackson, J. Manola, C. Ladd, ... and E. S. Lander, "Gene expression correlates of clinical prostate cancer behavior," Cancer cell, vol. 1, no. 2, pp. 203-209, 2002.
  • [13] H. Göker ve H. Tekedere, "Fatih Projesine Yönelik Görüşlerin Metin Madenciliği Yöntemleri İle Otomatik Değerlendirilmesi," Bilişim Teknolojileri Dergisi, c. 10, s. 3, ss. 291-299, 2017.
  • [14] Y. Saeys, I. Inza, and P. Larrañaga, "A review of feature selection techniques in bioinformatics," bioinformatics, vol. 23, no. 19, pp. 2507-2517, 2007.
  • [15] I. T. Jolliffe, "Principal component analysis and factor analysis," In Principal component analysis, pp. 115-128, 1986.
  • [16] J. Kennedy, and R. Eberhart,"PSO optimization," In Proc. IEEE Int. Conf. Neural Networks, 1995, pp. 1941-1948
  • [17] B. Xue, M. Zhang, & W. N. Browne, "Particle swarm optimisation for feature selection in classification: Novel initialisation and updating mechanisms," Applied Soft Computing, vol. 18, pp. 261-276, 2014.
  • [18] V. Vapnik, “The nature of statistical learning theory,” Springer-Verlag: New York, 1995, pp. 75-100.
  • [19] E. Karacan, "Hastalıkların Uyarlanmış Destek Vektör Makinesiyle Teşhis Edilmesi, " Yüksek Lisans Tezi, Bilgisayar Mühendisliği, Ondokuz Mayıs Üniversitesi, Samsun, Türkiye, 2015.
  • [20] S. A. Dudani, "The distance-weighted k-nearest-neighbor rule," IEEE Transactions on Systems, Man and Cybernetics, vol. 6, no. 4, pp. 325–327, 1976.
There are 19 citations in total.

Details

Primary Language Turkish
Subjects Engineering
Journal Section Articles
Authors

Serhat Kılıçarslan 0000-0001-9483-4425

Kemal Adem

Onur Cömert

Publication Date January 31, 2019
Published in Issue Year 2019 Volume: 7 Issue: 1

Cite

APA Kılıçarslan, S., Adem, K., & Cömert, O. (2019). Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi. Düzce Üniversitesi Bilim Ve Teknoloji Dergisi, 7(1), 769-777. https://doi.org/10.29130/dubited.464092
AMA Kılıçarslan S, Adem K, Cömert O. Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi. DUBİTED. January 2019;7(1):769-777. doi:10.29130/dubited.464092
Chicago Kılıçarslan, Serhat, Kemal Adem, and Onur Cömert. “Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri Ile Prostat Kanseri Teşhisi”. Düzce Üniversitesi Bilim Ve Teknoloji Dergisi 7, no. 1 (January 2019): 769-77. https://doi.org/10.29130/dubited.464092.
EndNote Kılıçarslan S, Adem K, Cömert O (January 1, 2019) Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi. Düzce Üniversitesi Bilim ve Teknoloji Dergisi 7 1 769–777.
IEEE S. Kılıçarslan, K. Adem, and O. Cömert, “Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi”, DUBİTED, vol. 7, no. 1, pp. 769–777, 2019, doi: 10.29130/dubited.464092.
ISNAD Kılıçarslan, Serhat et al. “Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri Ile Prostat Kanseri Teşhisi”. Düzce Üniversitesi Bilim ve Teknoloji Dergisi 7/1 (January 2019), 769-777. https://doi.org/10.29130/dubited.464092.
JAMA Kılıçarslan S, Adem K, Cömert O. Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi. DUBİTED. 2019;7:769–777.
MLA Kılıçarslan, Serhat et al. “Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri Ile Prostat Kanseri Teşhisi”. Düzce Üniversitesi Bilim Ve Teknoloji Dergisi, vol. 7, no. 1, 2019, pp. 769-77, doi:10.29130/dubited.464092.
Vancouver Kılıçarslan S, Adem K, Cömert O. Parçacık Sürü Optimizasyonu Kullanılarak Boyutu Azaltılmış Mikrodizi Verileri Üzerinde Makine Öğrenmesi Yöntemleri ile Prostat Kanseri Teşhisi. DUBİTED. 2019;7(1):769-77.