Tabakalı örneklemede örnekleme çerçevesi birbiriyle örtüşmeyen tabakalara bölünür. Bu bölünme çoğu pratik durumda coğrafi bölgeler, cinsiyet, yaş gibi doğal durumu yansıtacak şekilde kendiliğinden oluşur. Bu şekilde kendiliğinden oluşan tabakalar araştırma değişkenine göre içsel olarak homojen olmayabilir. Fakat araştırma değişkeninin tabaka sınırları katı bir şekilde önceden belirlenmemişse tabakaların içsel olarak homojenliği sağlanabilir. Bu yolla araştırma değişkenine göre içsel olarak homojen tabakalar oluşturulur ve tahmin hassasiyeti en üst düzeye çıkarılmış olur. Bu amaçla bu çalışmada tabaka-içi homojenliği sağlamak için Kümeleme Analiz Yöntemleri ve Tabaka Sınırı Belirleme Yöntemleri karşılaştırılmıştır. Bu karşılaştırma için beş farklı çarpıklık değerine sahip veri setleri türetilmiş ve her veri seti için ayrıştırma yöntemlerine göre tabaka sınırları belirlenmiştir. Tahminlerin güvenilirliğini arttırmak için her yöntemden 1000 kez bağımsız örnek seçilmiştir. Böylece her yöntemden elde edilen ortalama tahmin edicisine ilişkin Kök Hata Kareler Ortalamaları (KHKO) hesaplanmış ve en küçük KHKO değerini veren yöntemin tabaka sınırlarının optimum sınırlar olduğu sonucuna ulaşılmıştır. Analizler R programında yer alan “NbClust” ve “Stratification” paketleri ile yapılmıştır. Çalışmada elde edilen sonuçlara göre en küçük üç çarpıklık değerine sahip simülasyonlar için “Lavallee-Hidiroglou”, dördüncü simülasyon için “Ortalama Kümeleme” ve en büyük çarpıklık değerine sahip simülasyon için ise “K-Ortalamalar Kümeleme” yöntemleri ile elde edilen tabaka sınırları, optimum tabaka sınırları olarak belirlenmiştir.
In stratified sampling, the sampling frame is divided into non-overlapping strata. In most practical cases, this division occurs spontaneously, reflecting the natural state such as geographical regions, gender and age. Self-forming strata formed in this way may not be internally homogeneous according to the research variable. However, internal homogeneity of the strata can be achieved if the strata boundaries of the research variable are not strictly predetermined. Thus, internally homogeneous strata are formed according to the research variable and precision of an estimate is maximized. For this purpose, in this study, Cluster Analysis Methods and Optimum Strata Boundary Determination Methods were compared to ensure intra-stratum homogeneity. For this comparison, data sets with five different skewness values were derived. For each data set, strata boundaries were determined according to the decomposition methods. In order to increase the reliability of the estimations, independent samples were selected from each method for 1000 times. Thus, the Root Mean Squares Error (RMSE) of the mean estimator obtained from each method was calculated and it was concluded that the method with the smallest RMSE value had the optimum strata boundaries. Analyzes were made with the "NbClust" and "Stratification" packages in the R program. According to the results obtained in the study the strata boundaries obtained by the “Lavallee-Hidiroglou” Method for the simulations with the 3 lowest skewness values; “Average Clustering” Method for the fourth simulation; and “K-Means Clustering” Method for the simulation with the largest skewness value were determined as the optimum strata boundaries.
Primary Language | Turkish |
---|---|
Subjects | Statistics |
Journal Section | Research Articles |
Authors | |
Publication Date | July 7, 2022 |
Published in Issue | Year 2022 Volume: 12 Issue: 1 |