Geniş veri setlerinden anlamlı ve doğru bilgilerin çıkarılması biyoinformatik çalışmalarında önemli bir unsurdur. Karşılaşılan en önemli zorluklardan biri, kanser ile ilişkili olan genomik işaretçilerin tespitidir. Bu problemin çözümü için kullanılan genom dizilimlerinin sayısallaştırılması ve dizilimlerden öznitelik çıkarımı, sorunun çözümünde oldukça etkilidir. DNA dizilimlerinin sayısallaştırılması için literatürde var olan çeşitli yöntemler kullanılmaktadır. Öznitelik çıkarımında da, önceki çalışmalarda, belirli istatistiksel parametreler hesaplanmakta ve bu parametreler üzerinden bir ayrım gerçekleştirilmektedir. Ayrıca, hesaplanan parametreler uzmanın tecrübesine dayalı olarak seçilmektedir. Bu çalışmada önerilen yaklaşımda ise, yeni bir haritalama yöntemi olan Entropi tabanlı sayısal haritalama ile DNA dizilimleri sayısal sinyallere dönüştürülmüş ve daha sonra sayısallaştırılan DNA dizilimlerinden Evrişimsel Sinir Ağları (ESA) kullanılarak öznitelik çıkarımı yapılmıştır. ESA modelleri kullanarak yapılan öznitelik çıkarma işleminde sistem, veriden kendisi öznitelik çıkarmaktadır. Daha sonra ESA modellerinden elde edilen öznitelikler Destek Vektör Makinesi (DVM) ve k-En yakın komşu algoritması (k-NN) ile sınıflandırılmıştır. Bu çalışmada, yukarıda bahsedilen her iki yaklaşım kullanılarak DNA dizilerinden göğüs kanseri ve sağlıklı gen dizilimi gruplarının sınıflandırması için yeni bir yöntem önerilmektedir. Önerilen yöntem ile ulaşılan sınıflandırma doğruluğu %85.97’dir. Elde edilen sonuçlar, derin öğrenmenin genom analizinde genlerin sınıflandırılması, yeni genlerin bulunması gibi uygulamalarda etkili bir yöntem olabileceğini göstermektedir.
Primary Language | Turkish |
---|---|
Journal Section | Articles |
Authors | |
Publication Date | March 27, 2020 |
Submission Date | August 26, 2019 |
Published in Issue | Year 2020 |