Tıp ve biyoloji alanlarında tercih edilen mikrodizi teknolojisi, kantitatif veya niteliksel veriler üreten bir analiz yöntemidir. Genler arasındaki örüntülerin açığa çıkartılarak yorumlanabilmesi için güçlü bir potansiyel barındırmaktadır. Bu potansiyeli ortaya çıkarmak için genler ile ilişkili kanser hastalıkları üzerinde moleküler değerlendirme sağlamak mümkündür. Ancak mikrodizi veri kümeleri, yüksek boyutlu bir yapıya sahiptir. Bu durum makine öğrenmesinde boyutluluğun laneti olarak bilinmektedir. Mikrodizi veri kümeleri üzerinde değerlendirme sürecinin kolaylaştırılması için bilgisayar destekli sistemler kullanılarak uzmanlara yardımcı bir fikir verilmesi temel amaçtır. Bu çalışmada akut lösemilerin sınıflandırılabilmesi için yüksek boyut sunan mikrodizi veri kümesi analiz edilmiştir. Çalışmanın ilk aşamasında, hastalıkla ilişkili genlerin veri kümesinden seçilebilmesi için karınca kolonisi, balina ve parçacık sürü optimizasyon algoritmaları kullanılmıştır. Seçilen potansiyel genler klasik makine öğrenmesi algoritmaları ile değerlendirilmiştir. Çalışmanın ikinci aşamasında elde edilen bu genler, dalgacık dönüşümü yöntemi ile spektrogramlar olarak ifade edilmiştir. Çalışmanın üçüncü aşamasında, spektrogramlardaki yerel kontrastın iyileştirilmesi için CLAHE yöntemi kullanılmıştır. Son olarak elde edilen iyileştirilmiş spektrogramlar; aktarım öğrenme mimarileri ve DGCNN(derin graf evrişimsel sinir ağı) yaklaşımı ile sınıflandırılmıştır. Karınca, parçacık sürü ve balina özellik seçim algoritmaları kullanılarak seçilen genlerin spektral yoğunluk bilgisinin ifade edildiği spektrogramların DGCNN yaklaşımı ile sınıflandırılmasının sonucunda elde edilen maksimum başarı oranları sırasıyla %93.33, %86.6 ve %86.6 olarak bulunmuştur.
Mikrodizi teknolojisi Doğadan ilham alan optimizasyon algoritmaları Sürekli dalgacık dönüşümü tekniği Derin graf evrişimli sinir ağı yaklaşımı ALL ve AML malignitelerinin sınıflandırılması
The microarray technology which is preferred in the fields of medicine and biology is an analysis method that produces quantitative or qualitative data. It has a strong potential for revealing and interpreting patterns between genes. To reveal this potential, it is possible to provide a molecular evaluation of cancer diseases associated with genes. However, microarray datasets have a high dimensional structure. This is known as the curse of dimensionality in machine learning. The main aim is to give a helpful idea to the experts by using computer-aided systems to facilitate the evaluation process on microarray datasets. In this study, a high-dimensional microarray dataset is analyzed for the classification of acute leukaemias. In the first phase of the study, ant colony, whale and particle swarm optimization algorithms are used to select disease-related genes from the dataset. Selected potential genes were evaluated with classical machine learning algorithms. These genes obtained in the second stage of the study were expressed as spectrograms by the wavelet transform method. In the third stage of the study, the CLAHE method is used to improve the local contrast in the spectrograms. Finally, the obtained improved spectrograms are classified by transfer learning architectures and DGCNN (deep graph convolutional neural network) approach. The maximum success rates obtained as a result of the classification of the spectral density information of the selected genes using the ant, particle swarm and whale feature selection algorithms with the DGCNN approach are found to be 93.33%, 86.6% and 86.6%, respectively.
Microarray technology Nature-inspired optimization algorithms Continuous wavelet transform technique Deep graph convolutional neural network approach Classification of ALL and AML malignancies
Birincil Dil | Türkçe |
---|---|
Konular | Bilgi Sistemleri (Diğer) |
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 27 Haziran 2023 |
Yayımlandığı Sayı | Yıl 2023 Cilt: 29 Sayı: 3 |