This study describes the
genotype imputation method using the Beagle program and was completed with the
aim of evaluating the imputation performance in three different scenarios. A
population-based imputation method, the Beagle program uses linkage
disequilibrium (LD) information between missing single nucleotid polimorfizm
(SNP) and observed SNPs, the local haplotype cluster (Browning) model to offer
high rates of imputation accuracy for estimation of deficient genotypes. With
this aim, the study used 1356 SNP data from the 22nd chromosome of
191 individuals in the 1000 Genome project, cutting the dataset at random rates
of 20%, 50% and 70% to create three different scenarios. The Allelic-R2
values obtained as a result of the three scenarios were larger than 90% and
imputations with high degree of accuracy were made. In this study the
differences in the size of the reference datasets in the Beagle program were
not identified to have a clear effect on imputation accuracy. In conclusion, in
terms of results obtained from samples with different sizes using the Beagle
program, imputations with high accuracy could be made.
Bu çalışma, genotip atama yöntemlerinden olan Beagle
programının tanıtılarak, oluşturulan üç farklı senaryoda atama performansının
değerlendirilmesi amacıyla gerçekleştirilmiştir. Populasyon tabanlı atama
yöntemleri içerisinde yer alan Beagle programı eksik tek nükleotit
polimorfizmler (Single Nucleotid Polimorfizm, SNP) ve gözlemlenmiş SNP’ler
arasındaki bağlantı dengesizliği (Linkage Disequilibrium, LD) bilgileri ile lokal
haplotip küme (Browning) modelini kullanarak, eksik genotipleri tahmin etmede
yüksek oranda atama doğruluğu sunmaktadır. Bu amaçla, çalışmada 1000 Genom
Projesi’nde dizilenmiş 191 bireyin 22. kromozomu üzerinde bulunan 1356 SNP
bilgileri kullanılarak, veri seti %20, %50 ve %70 oranlarında şansa bağlı
olarak kesilerek üç farklı senaryo oluşturulmuştur. Üç senaryo sonucunda elde
edilen Alelik-R2 değerleri, %90’dan büyük olarak elde edilmiş ve
yüksek doğruluk derecesine sahip atamalar yapılmıştır. Çalışmada tanıtımı
amaçlanan Beagle programında referans veri setlerinin büyüklükleri arasındaki
farklılıkların, atama doğruluğu üzerine belirgin bir etkisi saptanamamıştır.
Sonuç olarak, Beagle programında farklı büyüklüklere sahip örneklerden elde
edilen sonuçlar doğrultusunda, yüksek doğruluk derecesinde atamalar
yapabildiğini göstermiştir.
Journal Section | Articles |
---|---|
Authors | |
Publication Date | December 26, 2017 |
Acceptance Date | November 1, 2017 |
Published in Issue | Year 2017 |