Researchers examine assumptions before performing most hypothesis testing. A common assumption is that the data are normally distributed. However, normality tests and descriptive statistics often create dilemmas for researchers, making it difficult to decide whether the data is normally distributed. The aim of the study was to compare univariate normality tests (Anderson-Darling, Cramer-von Mises, Jarque-Bera, Kolmogorov-Smirnov, Lilliefors, Pearson chi-square, Shapiro-Francia and Shapiro-Wilk) and descriptive statistics used for normality (standard values of skewness and kurtosis coefficients, skewness coefficient/standard error) according to the value of skewness, sample size, and the continuous-categorical status of the data. The research was a Monte Carlo simulation study. The simulation conditions were determined by the skewness coefficient (-2.5, -1.0, 0.0, 1.0, and 2.5), sample size (20, 30, 50, 100, 500, 1000, and 5000), and continuous or ordinal (number of categories 2, 3, 4, 5, and 7) status of the data. In the study, 210 simulation conditions were studied with fully crossed design. The evaluation criteria were determined as type-1 error and power. As a result of the research, it was determined that Jarque–Bera, the standard value of the skewness coefficient, skewness coefficient/standard error and the standard value of the kurtosis coefficients showed a better performance in terms of type-1 error. In terms of power, there was decrease in the power of all methods when the sample size was small, the data type was continuous, and the skewness coefficient was -1 or +1.
Araştırmacılar, çoğu hipotez testinden önce testin varsayımlarını incelemektedir. Sıklıkla karşılaşılan bir varsayım ise verinin normal dağılım göstermesidir. Ancak normallik testleri ve betimsel istatistikler çoğunlukla araştırmacıları ikileme düşürerek verinin normal dağılıp dağılmadığıyla ilgili karar almasını zorlaştırmaktadır. İşte bu yönde araştırmanın amacı çarpıklık katsayısı, örneklem büyüklüğü ve verinin sürekli–sıralı olma durumuna göre tek değişkenli normallik testlerini (Anderson-Darling, Cramer-von Mises, Jarque-Bera, Kolmogorov-Smirnov, Lilliefors, Pearson ki kare, Shapiro-Francia ve Shapiro-Wilk) ve normallik için kullanılan betimsel istatistikleri (çarpıklık katsayısının standart değeri, basıklık katsayısının standart değeri, çarpıklık katsayısı/standart hata) karşılaştırmaktır. Araştırma bir Monte Carlo simülasyon çalışmasıdır. Simülasyon koşulları çarpıklık katsayısı (-2.5, -1.0, 0.0, 1.0, 2.5), örneklem büyüklüğü (20, 30, 50, 100, 500, 1000 ve 5000) ve verinin sürekli ya da sıralı (kategorisi sayısı 2, 3, 4, 5 ve 7) olması olarak belirlenmiştir. Araştırmada tamamen çaprazlanmış desenle 210 simülasyon koşulu üzerinde çalışılmıştır. Değerlendirme ölçütleri 1. tip hata ve güç olarak belirlenmiştir. Araştırma sonucunda 1. tip hata açısından Jarque–Bera, çarpıklık katsayısının standart değeri, çarpıklık katsayısı/standart hata ve basıklık katsayısının standart değerinin koşulların çoğunda diğer yöntemlere göre daha düşük 1. tip hata ve daha yüksek güç değerlerine sahip olduğu belirlenmiştir. Örneklemin küçük, veri tipinin sürekli, çarpıklık katsayısının -1 ya da +1 olduğu koşullarda tüm yöntemlerin gücünde düşüş gözlenmiştir.
Birincil Dil | Türkçe |
---|---|
Bölüm | Araştırma Makalesi |
Yazarlar | |
Yayımlanma Tarihi | 7 Ocak 2022 |
Gönderilme Tarihi | 5 Temmuz 2021 |
Yayımlandığı Sayı | Yıl 2022 Cilt: 12 Sayı: 1 |
AJESI’de yayınlanan makalelerde bu lisans kullanılmaktadır.
Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.