🐃 🎈 🚒 Prueba de Wilcoxon: un punto ideal para los profesionales 🚝 👨🏼‍⚖️ 💷

En la práctica del procesamiento de resultados de observación, la distribución de la población general es desconocida o (para variables aleatorias continuas) difiere de la distribución normal, por lo que el uso de métodos estadísticos clásicos no es razonable y puede conducir a errores. En este caso, se utilizan métodos que son independientes (o libres) de la distribución de la población general, métodos no paramétricos.

El artículo analiza desde un punto de vista unificado tres pruebas de muestra única que se encuentran con frecuencia en la práctica: la prueba de signo, la prueba t y la prueba de Wilcoxon de rango con signo, un procedimiento no paramétrico cuya potencia es comparable a la potencia de la prueba t en el caso de una muestra distribuida normalmente, y supera la potencia de la prueba t si la distribución de la muestra tiene "colas más pesadas" en comparación con la distribución normal.

1. Defina un modelo para el modelo de ubicación de la siguiente manera. Sea $X_1, X_2, \ ldots, X_n$ - denote una muestra aleatoria obtenida de acuerdo con la siguiente ley

$X_i = \ theta + e_i,$

donde se supone que los errores aleatorios $e_1, e_2, \ ldots, e_n$ son variables aleatorias independientes e igualmente distribuidas con una densidad de distribución continua f (t) simétrica alrededor de cero.

2 . Bajo la condición de simetría, cualquier parámetro de posición X_i , incluidas la media y la mediana, es igual a $\ theta$ . Considere la hipótesis

$H_0: \ theta = 0, ~~~ H_a: \ theta> 0.$

3. Para probar esta hipótesis, considere tres pruebas que se utilizan con frecuencia en la práctica: la prueba de signos, la prueba t y la prueba de Wilcoxon.

3.1. La prueba de signos clásica ( prueba de signos) se basa en estadísticas

$S=\sum_{i=1}^nsign(X_i),$

donde sign(t)=-1,0,1 para, t<0,t=0,t>0 respectivamente. Permitir

$S^+=\#_i\{X_i>0\}.$

S=2S^+-n . , X_i ( , , ). H_0 , S^+ 1/2 . s^+ – S^+ p-value $P_{H_0}(S^+\geq s^+)=1-F_B(s^+-1;n;0.5)$ , F_B(t;n;p) – (R pbinom

cdf ).

, H_0 () f(t) .

3.2. t- (t-test) .

$T=\sum_{i=1}^nsign(X_i)\cdot|X_i|.$

, f(t) . t- t-

$t=\frac{\bar{X}}{s/\sqrt{n}},$

$\bar{X}$ , . , t- n-1 . t_0 . p-value t- $P_{H_0}(t\geq t_0)=1-F_T(t_0;n-1)$ , $F_T(t;\nu)$ – t- c $\nu$ (R pt

cdf t-). p-value , .

3.3. t- , t- .

(signed-rank Wilcoxon test) , . R|X_i| X_i $|X_1|,\ldots,|X_n|$ , .

$W=\sum_{i=1}^nsign(X_i)\cdot R|X_i|.$

t-, , H_0 f(t) .

. , , W^+ ,

$W^+=\sum_{X_i>0}R|X_i|=\frac{1}{2}W+\frac{n(n+1)}{4}.$

p-value $P_{H_0}(W^+\geq w^+)=1-F_{W^+}(w^+-1;n)$ , $F_{W^+}(x;n)$ – (R psignrank

cdf W^+ ).

4. . : , t- $\theta$ . .

4.1. $\theta$ ,

$\hat{\theta}=med\{X_1,X_2,\ldots,X_n\}.$

$0<\alpha<1$ $\theta$ $(1-\alpha)100\%$ $\left(X_{(c_1+1)},X_{(n-c_1)}\right)$ , $X_{(i)}$ – - , c_1 – $\alpha/2$ p=1/2 . e_i . , - $\alpha$ .

4.2. $\theta$ , t- $\bar{X}$ . $\bar{X}\pm t_{\alpha/2,n-1}\cdot[s/\sqrt{n}]$ , $t_{\alpha/2,n-1}$ – $\alpha/2$ t- n-1 . e_i .

4.3. $\theta$ , - (Hodges-Lehmann)

$\hat{\theta}_W=med_{i\leq j}\left\{\frac{X_i+X_j}{2}\right\}.$

$A_{ij}=(X_i+X_j)/2$ , $i\leq j$ (Walsh averages) . $A_{(1)}<\cdots<A_{(n(n+1)/2)}$ . $(1-\alpha)100\%$ $\theta$ $\left(A_{(c_2+1)}, A_{(n(n+1)/2-c2)}\right)$ , c_2 – $\alpha/2$ signed-rank Wilcoxon . e_i . , W^+ – $\left\{0,1,…,n(n+1)/2\right\}$ n^2 . , , , $\alpha$ .

5. ( ) A B . , ?

, A B. $\theta$ . R t- $H_0: \ theta = 0, H_a: \ theta> 0.$

> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B

> wilcox.test(response, alternative = "greater", conf.int = TRUE)

	Wilcoxon signed rank exact test

data:  response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
   1 Inf
sample estimates:
(pseudo)median 
          7.75 

> t.test(response, alternative = "greater", conf.int = TRUE)

	One Sample t-test

data:  response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 1.781971      Inf
sample estimates:
mean of x 
     8.75

wilcox.test()

W ^ + , p-value , - $\ theta$ $95 \%$ $\ theta$ . - t.test()

. , 0,05 , , A .

, . , t- t- « » .

Prueba de Wilcoxon: un punto ideal para los profesionales

More articles: