Year 2018, Volume 1, Issue 1, Pages 15 - 19 2018-12-25

DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması
Comparison of DNA Patterns with Graf Simulation

Cantekin ÇELİKHASI [1] , Ahmet SAYAR [2] , Adem ULU [3]

36 87

Bu çalışmanın amacı farklı DNA örneklerindeki dizilimlerin benzerlik oranını hesaplamaktır. DNA verilerinin büyüklüklerinin getirdiği işlem hacmini kısaltmak ve performansı arttırmak için,DNA dizileri sıkıştırılıp motif çıkarımı yapıldı. Bunun için LZ Sıkıştırma algoritması kullanıldı. Elde edilen motiflerden her biri sadece bir graf düğümünü ifade ederken bu motiflerin sırası da düğümlerin komşuluklarını ifade edecek şekilde grafa dönüştürüldü. Her bir DNA’dan elde edilen graf, DNA’lardaki benzerliği bulabilmek için kullanıldı. Graflar üzerinden benzerlik oranını hesaplayan algoritmalardan, her iki Komşu Eşleşme ve Kosinüs Benzerliği metotlarını karşılaştırdık. Buna göre Kosinüs Benzerliği’nin Komşu Eşleşme’ye göre daha performanslı olduğunu gösterdik.

The aim of this study is to calculate the similarity ratio of the sequences in different DNA samples. In order to increase the performance and shorten the transaction volume of the DNA data, DNA sequences were compressed and DNA motifs were obtained. For this, the LZ Compression algorithm was used. While each of the obtained motifs was only a graph node, the order of these motifs was transformed into graphs expressing the edge of the nodes. The obtained graph from each DNA was used to find the similarity in DNA. According to the algorithms calculating the similarity ratio on the graphs, we compared both Neighbor Matching and Cosinus Similarity methods and then we showed that Cosinus Similarity is more efficient than Neighbor Matching.

  • [1] R Shamir, Bioinformatics for Biologists, California: Cambridge, 2014.
  • [2] M SÜLÜ, Graf Tabanlı Biyolojik Dizilerde Örüntü Keşfi, Elazığ, 2011.
  • [3] GenBank, Pan paniscus mitochondrial DNA, complete sequence, 26 7 2016. [Çevrimiçi]. Available: https://www.ncbi.nlm.nih.gov/nuccore/D38116. [Erişildi: 15 4 2018].
  • [4] Elkan, Timothy L Bailey and Charles ,Fitting a mixture model by expectation maximization to discover motifs in biopolymers, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, 1994.
  • [5] CE Lawrence, SF Altschul, MS Boguski, JS Liu, AF Neuwald, JC Wootton, Detecting subtle sequence signals: a Gibbs sampling strategy for multiple alignment, Science, p. 262, 1993.
  • [6] U B BALOĞLU, Dna Sıralarındaki Tekrarlı Örüntülerin Ve Potansiyel Motiflerin Veri Madenciliği Yöntemiyle Çıkarılması, Fırat Üniverstesi, Elazığ, 2006.
  • [7] A Lempel, J Ziv, On the Complexity of Finite Sequences, IEEE Transactions on Information Theory, p. 22, 1976.
  • [8] M Nikolic, Measuring Similarity of Graph Nodes by Neighbor Matching, IOS Press, pp. 865-878, 2012.
  • [9] M Gallo, Implementing and Understanding Cosine Similarity, 29 07 2016. [Çevrimiçi]. Available: https://masongallo.github.io/machine/learning,/python/2016/07/29/cosine-similarity.html [Erişildi: 10 04 2018].
  • [10] A Madylova, Kosinüs Benzerliğini Kullanarak Belgeler Arası Anlamsal Benzerliği Kavramsal Sözlüğe Dayalı Hesaplama Yöntemi, İTU, İstanbul, 2009.
  • [11] B Anderson, H.Sapiens mitochondrial genome, 14 7 2016. [Çevrimiçi]. Available: https://www.ncbi.nlm.nih.gov/nuccore/V00662. [Erişildi: 15 04 2018].
Primary Language tr
Subjects Engineering
Journal Section Articles
Authors

Author: Cantekin ÇELİKHASI (Primary Author)
Institution: KOCAELİ ÜNİVERSİTESİ
Country: Turkey


Author: Ahmet SAYAR
Institution: KOCAELİ ÜNİVERSİTESİ
Country: Turkey


Author: Adem ULU
Institution: KOCAELİ ÜNİVERSİTESİ
Country: Turkey


Bibtex @conference paper { veri488314, journal = {Veri Bilimi}, issn = {}, eissn = {2667-582X}, address = {Murat GÖK}, year = {2018}, volume = {1}, pages = {15 - 19}, doi = {}, title = {DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması}, key = {cite}, author = {ÇELİKHASI, Cantekin and SAYAR, Ahmet and ULU, Adem} }
APA ÇELİKHASI, C , SAYAR, A , ULU, A . (2018). DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması. Veri Bilimi, 1 (1), 15-19. Retrieved from http://dergipark.org.tr/veri/issue/41532/488314
MLA ÇELİKHASI, C , SAYAR, A , ULU, A . "DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması". Veri Bilimi 1 (2018): 15-19 <http://dergipark.org.tr/veri/issue/41532/488314>
Chicago ÇELİKHASI, C , SAYAR, A , ULU, A . "DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması". Veri Bilimi 1 (2018): 15-19
RIS TY - JOUR T1 - DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması AU - Cantekin ÇELİKHASI , Ahmet SAYAR , Adem ULU Y1 - 2018 PY - 2018 N1 - DO - T2 - Veri Bilimi JF - Journal JO - JOR SP - 15 EP - 19 VL - 1 IS - 1 SN - -2667-582X M3 - UR - Y2 - 2018 ER -
EndNote %0 Veri Bilimi DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması %A Cantekin ÇELİKHASI , Ahmet SAYAR , Adem ULU %T DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması %D 2018 %J Veri Bilimi %P -2667-582X %V 1 %N 1 %R %U
ISNAD ÇELİKHASI, Cantekin , SAYAR, Ahmet , ULU, Adem . "DNA Dizilerinin Graf Benzetim Yolu İle Karşılaştırılması". Veri Bilimi 1 / 1 (December 2018): 15-19.