En la práctica del procesamiento de resultados de observación, la distribución de la población general es desconocida o (para variables aleatorias continuas) difiere de la distribución normal, por lo que el uso de métodos estadísticos clásicos no es razonable y puede conducir a errores. En este caso, se utilizan métodos que son independientes (o libres) de la distribución de la población general, métodos no paramétricos.
El artículo analiza desde un punto de vista unificado tres pruebas de muestra única que se encuentran con frecuencia en la práctica: la prueba de signo, la prueba t y la prueba de Wilcoxon de rango con signo, un procedimiento no paramétrico cuya potencia es comparable a la potencia de la prueba t en el caso de una muestra distribuida normalmente, y supera la potencia de la prueba t si la distribución de la muestra tiene "colas más pesadas" en comparación con la distribución normal.
1. Defina un modelo para el modelo de ubicación de la siguiente manera. Sea - denote una muestra aleatoria obtenida de acuerdo con la siguiente ley
donde se supone que los errores aleatorios son variables aleatorias independientes e igualmente distribuidas con una densidad de distribución continua
simétrica alrededor de cero.
2 . Bajo la condición de simetría, cualquier parámetro de posición , incluidas la media y la mediana, es igual a
. Considere la hipótesis
3. Para probar esta hipótesis, considere tres pruebas que se utilizan con frecuencia en la práctica: la prueba de signos, la prueba t y la prueba de Wilcoxon.
3.1. La prueba de signos clásica ( prueba de signos) se basa en estadísticas
donde para,
respectivamente. Permitir
. ,
( , ,
).
,
.
–
p-value
,
–
(R
pbinom
cdf ).
,
()
.
3.2. t- (t-test) .
,
. t- t-
, . ,
t-
.
. p-value t-
,
– t- c
(R
pt
cdf t-). p-value , .
3.3. t- , t- .
(signed-rank Wilcoxon test) , .
, .
t-, ,
.
. ,
,
,
p-value ,
–
(R
psignrank
cdf ).
4. . : , t- . .
4.1. ,
,
–
- ,
–
.
. , -
.
4.2. , t-
.
,
–
t-
.
.
4.3. , - (Hodges-Lehmann)
,
(Walsh averages) .
.
,
–
signed-rank Wilcoxon .
. ,
–
. , , ,
.
5. ( ) A B . , ?
, A B. . R t-
> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B
> wilcox.test(response, alternative = "greater", conf.int = TRUE)
Wilcoxon signed rank exact test
data: response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
1 Inf
sample estimates:
(pseudo)median
7.75
> t.test(response, alternative = "greater", conf.int = TRUE)
One Sample t-test
data: response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
1.781971 Inf
sample estimates:
mean of x
8.75
wilcox.test()
, p-value , -
. -
t.test()
. , , , A .
, . , t- t- « » .