Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
Mª Purificación Galindo Villardón Mª Purificación Vicente Galindo
Universidad de Salamanca Departamento de Estadística
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
1
Índice Pregunta 1. ..................................................................................................... 4 Pregunta 2. ..................................................................................................... 4 Pregunta 3. ..................................................................................................... 4 Pregunta 4. ..................................................................................................... 5 Pregunta 5. ..................................................................................................... 5 Pregunta 6. ..................................................................................................... 5 Pregunta 7. ..................................................................................................... 6 Pregunta 8. ..................................................................................................... 7 Pregunta 9. ..................................................................................................... 7 Pregunta 10. ................................................................................................... 8
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
2
Respuestas a las preguntas más frecuentes con las que se encuentra un investigador
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
3
Pregunta 1.
¿Qué quiere decir que se han encontrado resultados no significativos? Que los datos no aportan información suficiente para rechazar la Hipótesis teórica (H0) y aceptar la alternativa que es la que generalmente le interesa al investigador.
Pregunta 2.
¿Qué quiere decir que se han encontrado resultados significativos? Que los datos han aportado información suficiente para rechazar la Hipótesis teórica (H0) y aceptar la alternativa que es la que generalmente le interesa al investigador.
Pregunta 3.
¿Qué diferencia hay entre resultados probablemente significativos y resultados altamente significativos? Hablamos de resultados probablemente significativos cuando la Hipótesis H 0 (igualdad de medianas, por ejemplo) se rechaza al nivel de significación del 5% pero se acepta al nivel del 1%. Hablamos de resultados altamente significativos cuan la Hipótesis H0 (igualdad de medianas, por ejemplo) se rechaza al nivel de significación del 5% y también al nivel del 1%.
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
4
Dicho en términos más intuitivos, cuando los resultados son altamente significativos es que la diferencia entre las medianas de los dos grupos es más clara. Pregunta 4. ¿Se puede aceptar una hipótesis con resultados altamente significativos? No. Hablar de resultados significativos ya implica que hemos rechazado la Hipótesis nula (igualdad de medianas en este caso) a algún nivel. Si no hay rechazo no hay significación estadística.
Pregunta 5.
¿Es verdad que los editores y evaluadores de las publicaciones científicas, aceptan mejor un trabajo con resultados significativos que un trabajo que tiene resultados no significativos? Sí. Es algo claramente constatado.
Pregunta 6. ¿Y eso es una buena práctica? En Estadística aceptar la Hipótesis teórica (Ho) no quiere decir que hayamos probado que es cierta. Muchas veces se debe a un tamaño de muestra demasiado pequeño, a una variabilidad demasiado grande que no se ha manejado de manera óptima, a un test estadístico inadecuado para la situación del estudio, y un largo etc. Porque esto ocurre, resultados no significativos se asocian con “no se han
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
5
hecho las cosas adecuadamente” y los referees dicen “No merece la pena publicar este trabajo”. Sin embargo a veces es cierto que todo se ha hecho correctamente y sencillamente lo que sucede es que no hay diferencias. Rechazar de forma sistemática los trabajos con resultados “no significativos” implica que esos trabajos que dicen que un tratamiento nuevo no difiere del resto (eso puede ocurrir en 1000 investigaciones, por ejemplo) quedan sin publicar y solo se hacen públicos los 2 o 3 que si obtuvieron diferencias significativas. Evidentemente eso está produciendo un sesgo que puede ser muy peligroso (de hecho en la literatura especializada se habla del “sesgo de publicación” para referirse a este hecho). Lo óptimo, desde nuestro punto de vista, sería incrementar el control en el rigor estadístico de las publicaciones para que no quepa la opción de hablar de resultados no significativos por mala praxis y publicar tanto los que son significativos como los que no lo son.
Pregunta 7. He leído, si tienes pocos datos no te preocupes, utiliza la U de Mann-Whitney, ¿es eso cierto? No es cierto en absoluto. Si tiene pocos datos, debería preocuparse de obtener más. Lo que realmente ocurre es lo siguiente: cuando el tamaño muestral es bajo, la t de Student suele llevar a la aceptación de H0. Sin embargo la U de Mann-Whitney (para datos independientes) o el test de Wilcoxon para datos apareados, son versiones no paramétricas que declaran fácilmente la significación estadística. Pero hay que tener en cuenta que los test no paramétricos son, en general, menos
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
6
potentes. Recuérdese que la potencia es la probabilidad de rechazar H 0 cuando REALMENTE es falsa. Por tanto no es más recomendable un test que nos lleva fácilmente a rechazar H0, sino los test que nos llevan a rechazar Ho cuando realmente es falsa.
Pregunta 8. Al comparar casos y controles, con muestras pequeñas, ¿debemos aplicar el test U de Mann-Whitney o el test de Wilcoxon? Casos y Controles son dos grupos claramente diferenciados por mucho que cada caso tenga un control con características similares en todo excepto en la variable objeto de estudio. Por tanto se trata de datos independientes, (estadísticamente). Debería utilizarse la U de Mann –Whitney. Pregunta 9.
¿Qué implicaciones tiene el trabajar con rangos de orden en vez de hacerlo con los valores brutos recogidos por el investigador? Trabajar con rangos de orden implica quitarle importancia a la variabilidad de los datos. Por ejemplo, si tenemos un primer valor de 8, y uno siguiente de 10, al asignar rangos de orden, el 8 se cambia por un uno y el diez por un dos. Si los valores brutos fueran 8 y 500, el 8 se cambiaría por un uno y el 500 por un dos. La variabilidad es trascendental cuando utilizamos la t de Student ya que va en los denominadores de las formulas de contraste y variabilidades grandes implican valores experimentales pequeños que nos llevan a aceptar la Hipótesis nula por falta de pruebas. Esta es la razón por la que a veces fracasan los test clásicos a la
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
7
hora de declarar diferencias y los test no paramétricos, U, Wilcoxon, consiguen probar diferencias. Es el investigador el que tiene que decidir si esa variabilidad tiene importancia en el estudio o es un artefacto que es bueno no considerar.
Pregunta 10. ¿Cuándo los resultados son no significativos no se ha probado nada, y cuándo son significativos sí? Resultados estadísticamente significativos quiere decir que los datos han aportado información (pruebas) suficiente para rechazar la Hipótesis teórica, con bajo riesgo. Igual que en un juicio, cuando hay pruebas se declara al sujeto delincuente. ¿Y si las pruebas son falsas? Pues el veredicto será erróneo, pero es la forma en la que se trabaja. En estadística pasa igual, si hay pruebas se declaran diferencias, variables relacionadas, etc., pero si las pruebas no son buenas… habremos decidido mal. Por eso hablamos de un riesgo del 5% porque sabemos que de cada 100 veces que se declaran diferencias, en 5 realmente no existen esas diferencias…, pero, es la forma en la que se trabaja.
Módulo 6. Test no paramétricos: U de Mann-Whitney y Test de Wilcoxon
8
M贸dulo 6. Test no param茅tricos: U de Mann-Whitney y Test de Wilcoxon
9