Normallik testleri istatistiksel uygulamalarda yaygın olarak kullanılmaktadır, ancak davranışları genellikle sonlu örneklerde güvenilir olmayabilecek asimptotik kritik değerler kullanılarak değerlendirilmektedir. Özellikle, örneklem büyüklüğünün kritik değer kalibrasyonu ve dağılımsal yapı ile nasıl etkileşime girerek ampirik gücü şekillendirdiği yeterince anlaşılmamıştır. Ampirik ve asimptotik kritik değerlerin örneklem büyüklüğü ile nasıl evrimleştiğini ve bu evrimin simetrik ve asimetrik normallikten sapmalar altında tek değişkenli normallik testlerinin ampirik gücünü nasıl yönettiğini araştırmak amacıyla, yaygın olarak kullanılan on altı normallik testi için büyük ölçekli bir Monte Carlo simülasyon çalışması yapılmıştır. Ampirik ve asimptotik kritik değerler, asimptotik referans değerle birlikte n=25, 50, 100 ve 500 örneklem büyüklüklerinde değerlendirilmiştir. Ampirik güç, α=0,05 ve α=0,10 anlamlılık seviyelerinde değerlendirilmiş ve sonuçlar, yapısal olarak benzer simetrik ve asimetrik alternatif dağılımlar üzerinden ortalama alınarak özetlenmiştir. Küçük ve orta örneklem boyutlarında, çeşitli testler için ampirik ve asimptotik kritik değerler arasında önemli farklılıklar gözlemlendi. Bu farklılıklar doğrudan heterojen güç davranışına dönüştü. Simetrik alternatiflerde, birçok test orta örneklem boyutlarına kadar hızlı güç artışı gösterdi, ardından belirgin bir doygunluk yaşandı. Buna karşılık, asimetrik alternatifler gecikmeli güç birikimi gösterdi ve anlamlı kazanımlar daha büyük örneklem boyutlarında da devam etti. Anlamlılık düzeyinin artırılması gücü eşit şekilde artırdı ancak testlerin göreceli sıralamasını değiştirmedi. Normallik testinde örneklem boyutu etkileri dağılıma büyük ölçüde bağlıdır ve yalnızca asimptotik teori ile yeterince yakalanamaz. Simetrik sapmaları tespit etmek için orta örneklemler yeterli olabilirken, asimetrik sapmalar güvenilir güç elde etmek için daha büyük örneklemler gerektirir. Bu bulgular, normallik testinde sonlu örneklem değerlendirmelerinin önemini vurgulamakta ve daha bilinçli test seçimi için mekanik bir temel sağlamaktadır.
Normallik testleri Sonlu örneklem etkileri Ampirik ve asimptotik kritik değerler Örneklem boyutu yeterliliği Güç doygunluğu
Normality tests are widely used in statistical practice; however, their finite-sample behavior—shaped by the interaction between sample size, critical value calibration, and distributional structure—remains insufficiently understood. This study investigates how sample size governs the reliability of empirical and asymptotic critical values and, in turn, shapes the empirical power of widely used normality tests under symmetric and asymmetric departures from normality. A large-scale Monte Carlo simulation study was conducted for sixteen widely used normality tests. Empirical and asymptotic critical values were evaluated across sample sizes n=25, 50, 100 and 500, together with the asymptotic benchmark. Empirical power was assessed at significance levels α=0.05 and α=0.10, with results summarized by averaging across structurally similar symmetric and asymmetric alternative distributions. Substantial discrepancies between empirical and asymptotic critical values were observed for several tests at small and moderate sample sizes. These discrepancies translated directly into heterogeneous power behavior. Under symmetric alternatives, many tests exhibited rapid power gains up to moderate sample sizes, followed by clear saturation. In contrast, asymmetric alternatives showed delayed power accumulation, with meaningful gains persisting at larger sample sizes. Increasing the significance level increased power uniformly but did not alter relative test rankings. Sample size effects in normality testing are strongly distribution-dependent and cannot be adequately captured by asymptotic theory alone. Moderate samples may suffice for detecting symmetric deviations, whereas asymmetric departures require larger samples to achieve reliable power. These findings underscore the importance of finite-sample considerations in normality testing and provide a mechanistic basis for more informed test selection.
Normality tests Finite-sample effects Empirical and asymptotic critical values Sample size adequacy Monte Carlo simulation
Ethics approval was not required for this study as it involves only simulation-based analyses using synthetic data generated under predefined statistical models
| Primary Language | English |
|---|---|
| Subjects | Bioengineering (Other) |
| Journal Section | Research Article |
| Authors | |
| Submission Date | December 21, 2025 |
| Acceptance Date | January 15, 2026 |
| Publication Date | March 1, 2026 |
| DOI | https://doi.org/10.21597/jist.1846196 |
| IZ | https://izlik.org/JA98DP98BX |
| Published in Issue | Year 2026 Volume: 16 Issue: 1 |