SAYISAL HARİTALAMA TEKNİKLERİ VE FOURIER DÖNÜŞÜMÜ KULLANILARAK DNA DİZİLİMLERİNİN SINIFLANDIRILMASI
Öz
Bir DNA diziliminde bulunan bazların bir araya gelerek oluşturdukları kombinasyonlar, o DNA dizilimindeki bir gene karşılık gelir ve bu genlerden de RNA kopya dizilimleri çıkarılır. Kopyalanan bu RNA’lar oluşurken genin baz dizilimi baştan sona tümüyle okunmaz, bir kısım dizilimin okunmasından ve RNA kopyasının çıkartılmasından sonra uzun bir bölüm okunmadan atlanır ve başka bir bölüme geçilir sonra kalınan yerden devam edilir. Genlerin okunmayan ve kodlanmayan bu bölümüne intron, kodlanan kısımlarına ise ekson denir. Bir DNA dizilimindeki protein nerede, ne kadar kodlanır? Büyüme ve gelişme nerede düzenlenir? Kök hücreler nerede başka hücreye dönüştürülür? Hücreler hangi durumlarda çoğaltılır? Tüm bu soruların cevabı ve kanser gibi genetik hastalıkların araştırılması DNA dizilimlerinin ekson ve intron olarak sınıflandırmasıyla mümkündür.
Bu makale çalışmasının amacı, bir DNA diziliminin ekson ve intron olarak sınıflandırılmasında farklı sayısal haritalama tekniklerinin performanslarını karşılaştırmaktır. Bu amaç doğrultusunda insan türünün MEFV genine ait DNA dizilimleri, 9 farklı haritalama tekniği ile sayısal dizilere dönüştürülmüştür. Dönüştürülen bu sayısal dizileri ekson ve intron olarak sınıflandırmak için Ayrık Fourier Dönüşümü Yöntemi kullanılmıştır. Ayrık Fourier Dönüşümü yönteminde 4 farklı pencereleme fonksiyonu kullanılmış ve bu pencereleme fonksiyonlarının da sınıflandırma başarımı üzerinde etkileri karşılaştırılmıştır. Ayrıca Fourier tabanlı yöntemle elde edilen sonuçlar makine öğrenme tabanlı Destek Vektör Makineleri ve K-En yakın komşu algoritması yöntemleri ile karşılaştırılmıştır. Ayrık Fourier Dönüşümü yönteminin İnteger haritalama tekniği ile %96,2 sınıflandırma başarım oranıyla diğer makine öğrenme yöntemlerine göre yüksek olduğu açıkça görülmektedir. Uygulama sonucunda Tamsayı Tekniği ve Paired Numerik Tekniği 4 pencereleme fonksiyonunda diğer sayısal tekniklere göre daha yüksek sınıflandırma performansı göstermiştir. Ayrıca Hamming pencereleme fonksiyonunda sınıflandırma başarısı diğer pencereleme fonksiyonlarından daha yüksek çıkmıştır.
Anahtar Kelimeler
Kaynakça
- Internet: http://schoolworkhelper.net/dna-mrna-introns-and-exons, Erişim Tarihi: 01.01.2015.
- Kwan, J. Y. Y., Kwan, B. Y. M., Kwan, H. K., Spectral Analysis of Numerical Exon and Intron Sequences, Proceedings of IEEE International Conference on Bioinformatics and Biomedicine Workshops, Hong Kong, 876-877, 2010.
- Marhon, S. A., Kremer, S. J., A dynamic representation-based, de novomethod for protein-coding region prediction and biological information detection, Elsevier, Digital Signal Processing 46, 10–18, 2015.
- Zhang, J., Yang, C., DNA Sequence Recognition Based on the Markov Model, 6th International Conference on Biomedical Engineering and Informatics (BMEI 2013), 2013.
- Mandal, S. B., Saha, S., Mandal, A., Roy, M., Prediction of Protein Coding Regions of a DNA Sequence through Spectral Analysis, IEEE/OSA/IAPR International Conference on Informatics, Electronics & Vision, 2012.
- Xia, J., Caragea, D., Brown, S. J, Prediction of Alternatively Spliced Exons Using Support Vector Machines, Int. J. Data Mining and Bioinformatics, 4(4), 411-30, 2010.
- Dror, G., Sorek, R., Shamir, R., Accurate Identification of Alternatively Spliced Exons Using Support Vector Machine, Bioinformatics, 21(7), 897-901, April 1, 2005.
- Barman, S., Saha, S., Mandal, A., Roy, M., Prediction of protein coding regions of a DNA sequence through spectral analysis, Informatics, Electronics & Vision (ICIEV), 2012 International Conference, 18-19 May 2012.
Ayrıntılar
Birincil Dil
Türkçe
Konular
-
Bölüm
-
Yayımlanma Tarihi
14 Aralık 2016
Gönderilme Tarihi
12 Haziran 2015
Kabul Tarihi
-
Yayımlandığı Sayı
Yıl 2016 Cilt: 31 Sayı: 4
Cited By
A novel numerical mapping method based on entropy for digitizing DNA sequences
Neural Computing and Applications
https://doi.org/10.1007/s00521-017-2871-5FOURIER DÖNÜŞÜMÜ KULLANILARAK GERÇEK ZAMANLI KUMAŞ HATASI TESPİTİ
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.300604DNA genom dizilimi üzerinde dijital sinyal işleme teknikleri kullanılarak elde edilen ekson ve intron bölgelerinin EfficientNetB7 mimarisi ile sınıflandırılması
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.900987Lösemi hastalığının temel türlerinden ALL ve KML malignitelerinin grafik sinir ağları ve bulanık mantık algoritması ile sınıflandırılması
Gazi Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi
https://doi.org/10.17341/gazimmfd.1022624The Effect of Numerical Mapping Techniques on Performance in Genomic Research
Sakarya University Journal of Computer and Information Sciences
https://doi.org/10.35377/saucis...1191850Classification of Exon and Intron Regions on DNA Sequences with Hybrid Use of SBERT and ANFIS Approaches
Journal of Polytechnic
https://doi.org/10.2339/politeknik.1187808DETECTION OF EXON AND INTRON REGIONS IN DNA SEQUENCES BY THE PROPOSED HASHING FUNCTION
Journal of Scientific Reports-A
https://doi.org/10.59313/jsr-a.1281084