Análisis de la relación entre dos variables cuantitativas correl francisco javier cervigon ruckauer

Page 1

Estadística para investigadores: todo lo que siempre quiso saber y nunca se atrevió a preguntar

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y Regresión

Mª Purificación Galindo Villardón Mª Purificación Vicente Galindo Universidad de Salamanca Departamento de Estadística Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

1


Índice Pregunta 1. ..................................................................................................... 4 Pregunta 2. ..................................................................................................... 4 Pregunta 3. ..................................................................................................... 4 Pregunta 4. ..................................................................................................... 5 Pregunta 5. ..................................................................................................... 5 Pregunta 6. ..................................................................................................... 6 Pregunta 7. ..................................................................................................... 6 Pregunta 8. ..................................................................................................... 7 Pregunta 9. ..................................................................................................... 7 Pregunta 10. ................................................................................................... 7

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

2


Respuestas a las preguntas más frecuentes con las que se encuentra un investigador

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

3


Pregunta 1.

¿Un coeficiente de correlación significativo implica que entre las variables X e Y existe una relación causa efecto? No, en absoluto. Indica simplemente que X e Y covarían pero puede ser que covarien simplemente por efecto de una tercera. Por ejemplo, el número de canas y la presión arterial covarían por efecto de una tercera variable que es la edad.

Pregunta 2.

¿Un coeficiente de correlación no significativo implica que entre las variables no existe una relación causa efecto? No necesariamente. Si no están relacionadas es evidente que una no es causa de la otra, pero puede ocurrir que exista relación y no la detectemos en el estudio por falta de información, por ejemplo, por un bajo tamaño muestral.

Pregunta 3. ¿Un coeficiente de correlación cero (o próximo a cero) implica que las variables X e Y son independientes? No. Lo que es cierto es que cuando dos variables son independientes el coeficiente de correlación de Pearson es cero, pero puede ser cero y las variables estar relacionadas mediante una relación parabólica, por ejemplo.

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

4


Pregunta 4. ¿Podemos fiarnos de una publicación en la que aparece una recta de regresión y no incluye ni el coeficiente de correlación ni el coeficiente de determinación? Podemos fiarnos, pero no es recomendable. Ya que no sabemos el poder explicativo del modelo; es decir, qué porcentaje de puntos de la nube vienen bien representados por el modelo. Sería como escribir la media y no acompañarla de una medida de dispersión.

Pregunta 5.

Un modelo de regresión lineal, con alto valor explicativo (R2 próximo al 100%), ¿es un buen modelo para predecir? Lo contrario si es cierto, si no tienen alto poder explicativo no es bueno para predecir, pero puede tener alto poder explicativo y no ser bueno para predecir ya que el modelo se estudia en un rango de valores y fuera de ese rango la relación puede ser diferente. Por ejemplo, para unas dosis determinadas, puede existir un modelo lineal que explique adecuadamente la relación entre la cantidad de un nutriente y el crecimiento de una planta. Pero si aumentamos indefinidamente la dosis, la planta no crecería hasta el infinito (como predeciríamos con el modelo lineal) sino que puede incluso morir.

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

5


Pregunta 6. ¿Por qué se usa, en las publicaciones, el coeficiente de correlación en vez de la covarianza, cuando en los textos de estadística siempre se explica primero la covarianza? La covarianza es el estadístico que captura realmente la información sobre si las variables están o no, relacionadas linealmente. Pero, no está acotada y arrastra las unidades de las dos variables, lo que hace difícil su interpretación. Por el contrario, el Coeficiente de Correlación de Pearson recoge toda la información capturada por la covarianza, y además es adimensional y está acotado. Todo esto facilita considerablemente la interpretación y es la razón por la que se utiliza mucho más en las publicaciones. Sin embargo, a nivel didáctico no tiene sentido explicar el coeficiente de correlación sin haber explicado la covarianza.

Pregunta 7. ¿Es lo mismo el coeficiente de correlación que el coeficiente de regresión? No. Ambos se calculan a partir de la covarianza y tienen por tanto, el mismo signo, pero transmiten información muy diferente. El coeficiente de correlación se calcula como la covarianza partida por el producto de las desviaciones típicas de las dos variables y se utiliza para decidir si hay relación lineal entre las variables, de qué tipo es (directa o inversa)

y

cuantificarla. El coeficiente de regresión se calcula como la covarianza partida por la varianza de la variable independiente y se interpreta como el incremento (decremento) en la variable respuesta por cada incremento unitario en la variable independiente.

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

6


Para que coincidieran tendría que ocurrir que la desviación típica de la variable independiente y la desviación típica de la dependiente coincidieran, cosa muy poco probable.

Pregunta 8. ¿Una nube de puntos muy dispersa puede llevar asociado un coeficiente de correlación significativo? Sí. Un coeficiente de correlación significativo sólo dice que existen indicios suficientes para suponer que no son independientes, pero eso no equivale a afirmar que será posible encontrar un buen modelo que nos permita estimar la variable respuesta a partir del conocimiento de la variable independiente. Pregunta 9.

¿Puede ocurrir que al estudiar la relación de una variable X1 con una variable Y resulte significativa, al estudiar la relación entre X2 e Y, también sea significativa y al estudiar la relación entre X1 y X2 e Y, alguna de las dos variables X aparezca como no significativa? Lamentablemente SI. Si X1 y X2 están relacionadas entre sí, una de las dos (por ejemplo X2) aparecería como no significativa ya que no aportaría información diferente de la ya capturada al estudiar la relación entre Y y la variable X1.

Pregunta 10. ¿Puede ocurrir que si las variables explicativas X1 y X2 están fuertemente relacionadas entre sí, al estudiar el modelo de regresión que relaciona Y con X 1 y con X2 aparezca un signo para el coeficiente de regresión contrario al real? Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

7


Lamentablemente sí. Cuando las variables explicativas están fuertemente relacionadas se dice que hay colinealidad. En presencia de colinealidad pueden aparecer como no significativas variables que sí están realmente relacionadas con la respuesta y puede ocurrir que el signo que aparezca en el modelo de regresión sea el contrario al esperado. Cuando esto ocurra lo mejor es contactar con un especialista estadístico que le ayude en el tratamiento de los datos y le haga un correcto diagnóstico de la colinealidad.

Módulo 3. Análisis de la relación entre dos variables cuantitativas: Correlación y regresión

8


Mรณdulo 3. Anรกlisis de la relaciรณn entre dos variables cuantitativas: Correlaciรณn y regresiรณn

9


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.