Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar
Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: t de Student
Mª Purificación Galindo Villardón Mª Purificación Vicente Galindo
Universidad de Salamanca Departamento de Estadística Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
1
Índice Pregunta 1. ..................................................................................................... 4 Pregunta 2. ..................................................................................................... 4 Pregunta 3. ..................................................................................................... 4 Pregunta 4. ..................................................................................................... 5 Pregunta 5. ..................................................................................................... 5 Pregunta 6. ..................................................................................................... 6 Pregunta 7. ..................................................................................................... 6 Pregunta 8. ..................................................................................................... 7 Pregunta 9. ..................................................................................................... 7 Pregunta 10. ................................................................................................... 8
Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
2
Respuestas a las preguntas m谩s frecuentes con las que se encuentra un investigador
M贸dulo 5. An谩lisis de la relaci贸n entre dos variables una cualitativa y otra cuantitativa: T de Student
3
Pregunta 1.
¿Qué significa el p-valor? Desde un punto de vista intuitivo, el p-valor puede entenderse como el riesgo que corres al atreverte a rechazar la Hipótesis nula con los datos aportados en el estudio. Como se trata de un riesgo, solo si es pequeño rechazarás la Hipótesis nula y aceptarás la alternativa.
Pregunta 2.
¿Por qué se utiliza como significativo p-valor <0.05? Pues no hay ninguna razón contundente para ello. Es acuerdo en la comunidad científica, pero podría ser trabajarse con otro.
Pregunta 3. ¿Resultados estadísticamente significativos son clínicamente (biológicamente, económicamente, etc.) importantes? No necesariamente.
Suele ocurrir así, pero no siempre es cierto. Tampoco el
recíproco es cierto. Puede que los resultados del estudio sean no significativos (por bajo tamaño muestral, por alta variabilidad, por ejemplo) y eso no implica que no tenga relevancia clínica. En Estadística ocurre como en los juicios: la falta de pruebas no garantiza la inocencia y la presencia de pruebas no garantiza la culpabilidad. Aunque lo más frecuente es que si no hay pruebas sea inocente y si las hay sea culpable. Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
4
Pregunta 4. Si la relación entre una variable explicativa X y una variable respuesta Y no es significativa, ¿eso significa que X debe ser descartada en estudios sucesivos? (Por ejemplo, ¿si al estudiar los valores medios de un marcador tumoral en pacientes con y sin cáncer, no aparecen resultados significativos, no deben hacerse nunca más esos análisis ya que ese marcador no es importante?) NO. Estadísticamente no significativo quiere decir que las pruebas que aportan los datos no son suficientes para rechazar la H0 con bajo riesgo. Nada más.
Pregunta 5.
Unos libros dicen que una muestra es pequeña cuando es menor que 25, otros que 30, ¿cuál es la correcta? Muestra grande y muestra pequeña es algo muy ligado al contexto. En este caso, cuando hablamos de comparación de medias en dos grupos (o del estudio de la relación entre una variable cuantitativa y otra cualitativa dicotómica que es equivalente a lo anterior), si la muestra es grande, el punto crítico, a partir del cual se rechaza la Hipótesis nula, se toma del modelo normal (campana de Gauss). Si la muestra es pequeña, el punto crítico se toma del modelo t de Student.
Para tamaños de muestra menores de 20 o 25, hay diferencias
importantes entre ambos valores. A partir de 25 los valores críticos en ambos modelos prácticamente coinciden. Y para mayores de 30 coinciden en las unidades y las primeras cifras decimales. Luego decidir si la muestra grande es a partir de 25 o a partir de 30 depende del nivel de precisión. El punto crítico se mira solo a nivel de unidades, o a nivel de unidades y décimas, o a nivel de unidades décimas y centésimas, etc.
Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
5
Obsérvese, sin embargo, que 30 individuos para otro tipo de estudios, puede ser una muestra claramente insuficiente. ¿Alguien se fiaría de una encuesta realizada a 30 personas, a la hora de predecir quién va a ser el siguiente presidente, por ejemplo?
Pregunta 6. ¿Al comparar casos y controles, debemos aplicar un test para datos independientes o un test para datos apareados? Casos y Controles son dos grupos claramente diferenciados por mucho que cada caso tenga un control con características similares en todo excepto en la variable objeto de estudio. Por tanto se trata de datos independientes, (estadísticamente). Datos apareados son aquellos que provienen de un estudio en el cual cada unidad considerada (paciente, empresa, planta, votante, etc.) proporciona dos medidas (antes y después, en la situación 1 y en la 2, etc.).
Pregunta 7. He leído que cuando se tienen más de dos grupos a comparar no pueden hacerse tantas comparaciones por parejas como sean necesarias con una t de Student. ¿Por qué?? Porque no está garantizado el riesgo de cometer un error de tipo I (rechazo indebido de la hipótesis). Con dos grupos, si fijamos el riesgo en el 5%, ese es el riesgo asumido. Pero si en vez de dos grupos tengo tres y hago las tres comparaciones posibles, el riesgo supera el 14%, con 4 grupos, haciendo las 6 comparaciones posibles entre pares, el riesgo se eleva hasta más del 26 % y cuando hay seis grupos en el estudio, el riesgo supera el 50%. Es decir ganaríamos lo mismo Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
6
haciendo las 15 comparaciones por pares que tirando una moneda al aire y diciendo si sale cara hay diferencias significativas… En caso de tener más de dos grupos debe utilizarse un ANOVA.
Pregunta 8. ¿Qué es peor cometer un error de tipo I o un error de tipo II, en un estudio estadístico? Depende del estudio. Sería como preguntar si es peor dejar en libertad a un delincuente o encerrar a un inocente. La respuesta es: “Depende”. Sin embargo hay que tener en cuenta que la estadística está pensada para maximizar la potencia estadística, es decir para maximizar la probabilidad de rechazar la hipótesis nula cuando realmente es falsa. En el símil del juicio para maximizar la probabilidad de declarar culpable al que realmente lo es y no la de declarar inocente al que realmente es inocente.
Pregunta 9.
Hoy día es muy frecuente encontrar en las publicaciones el término “tamaño del efecto” ¿Qué significa? ¿Es mejor incluir en una publicación el tamaño del efecto o el p-valor? El p-valor simplemente dice que hay información relevante en los datos pero no si es muy relevante o poco relevante. Con el tamaño del efecto tratamos de cuantificar esa información.
Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
7
Sería muy conveniente que los referees obligaran en las publicaciones científicas a escribir el tamaño del efecto y el valor exacto del p-valor y no limitarse solo a decir, se declararon resultados significativos si p-valor era menor de 0.05. Pregunta 10. ¿Estudios que no estén acompañados de un p-valor no tienen relevancia estadística? No. Desgraciadamente muchos referees rechazan todo estudio que no lleva un pvalor y sin embargo hay métodos estadísticos
muy eficaces que garantizan su
fiabilidad de otra manera. Por ejemplo, las técnicas multivariantes factoriales (Componentes Principales, Análisis de Correspondencias, Biplot, STATIS, oct. etc.), presentan sus resultados es términos de valores y vectores propios, absorción de inercia, etc. Lamentablemente la cultura estadística en el campo mutivariante es baja y eso está motivando un retraso incomprensible en el uso de estas técnicas. Pero sin duda estos métodos se impondrán como ya ocurre en ramas de la Ciencia, como la Biología, donde estos análisis son ya rutinarios.
Módulo 5. Análisis de la relación entre dos variables una cualitativa y otra cuantitativa: T de Student
8
M贸dulo 5. An谩lisis de la relaci贸n entre dos variables una cualitativa y otra cuantitativa: T de Student
9