Bootstrap bir istatistiğin standart hatasını ve yanlılığını tahmin etmek üzere kullanılan bir tekniktir. Bootstrap tekniği; eldeki örneklemden yeniden örnekleme ile üretilen bootstrap dağılımının, istatistiğin örneklem dağılımını temsil edeceği ana fikri üzerine kuruludur. Buna karşın; bootstrap uygulanırken örneklem büyüklüğünün ve bootstrap yineleme sayısının bootstrap tahminlerinin doğruluğuna olan etkisi genelikle dikkate alınmamakta ve ihmal edilmektedir. Her ne kadar literatürde bu konuyu ele alan sınırlı sayıda çalışma olsa da, bu çalışmalarda elde edilen sonuçlar örneklemin alındığı ana kütle dağılımına bağımlı olarak ifade edilmektedir. Bu makalede, örneklem büyüklüğü ve bootstrap yineleme sayısı ile konum parametrelerinin bootstrap tahminlerinin standart hataları arasındaki ilişkiyi farklı ana kütle dağılımları için inceleyen ampirik bir çalışmanın sonuçları sunulmaktadır. Bu maksatla öncelikle farklı sürekli ve kesikli dağılımlardan çekilmiş farklı büyüklüğe sahip örneklemlere uygulanan bootstrap işlemi sonrası bootstrap dağılımının örneklem dağılımını ne oranda temsil ettiği incelenmektedir. Uygulama sonucunda, bootstrap tahminlerinin doğruluğuna örneklem büyüklüğünün bootstrap yineleme sayısına göre daha fazla etki ettiği görülmüştür. Ayrıca, medyana ilişkin bootstrap dağılımlarının özellikle küçük örneklemler için örnekleme dağılımını temsil etmede oldukça yetersiz olduğu tespit edilmiştir. En son olarak da bootstrap tahminleri standart hataları ile örneklem büyüklüğü ve bootstrap yineleme sayısı arasındaki ilişkinin ana kütle dağılımından bağımsız olarak tahmin edilebilmesi için jackknife-sonrası-bootstrap tekniği ve regresyon modeli tabanlı bir yöntem önerilmektedir.
Bootstrap Bootstrap yinelemesi Jackknife-sonrası-bootstrap Örnekleme değişkenliği Yeniden örnekleme değişkenliği
Bootstrap is a technique for estimating standard error and bias of the statistic of interest. The idea behind the bootstrap technique is that bootstrap distribution generated by resampling from the sample at hand mimics the sampling distribution of the statistic. Nevertheless, the effect of sample size and number of bootstrap replications on the accuracy of bootstrap predictions is rarely considered and ignored while applying bootstrap. Although there exist limited studies on this matter in the literature, results obtained in these studies are expressed based on the population distribution. In this paper, we provide results of an empirical study that examines the relationship between sample size and number of bootstrap replications and standard errors of bootstrap estimates of location parameters for different population distributions. To that end, we focus on the representativeness of bootstrap distribution to sampling distribution for different continuous and discrete population distributions and different sample sizes, firstly. According to application results, we observe that sample size has more impact on accuracies of bootstrap estimates as regards to number of bootstrap replications. Additionally, we confirm that bootstrap distributions of median based on small sample sizes are inadequate for representing sampling distribution. Lastly, in order to model relationship between standard errors of bootstrap estimates and sample size and number of bootstrap estimations independently of population distribution, we propose a methodology based on jackknife-after-bootstrap technique and regression modeling.
Bootstrap Bootstrap repetitions Jackknife-after-bootstrap Sampling variability Resampling variability
Birincil Dil | İngilizce |
---|---|
Konular | Mühendislik |
Bölüm | Makale |
Yazarlar | |
Yayımlanma Tarihi | 20 Şubat 2020 |
Yayımlandığı Sayı | Yıl 2020 Cilt: 26 Sayı: 1 |