Regresión lineal

Page 1


Regresión lineal o ajuste lineal

La primera forma de regresión lineal documentada fue el método de los mínimos cuadrados que fue publicada por Legendre en 1805, Gauss publicó un trabajo en donde desarrollaba de manera más profunda el método de los mínimos cuadrados, y en dónde se incluía una versión del teorema de Gauss-Márkov. Es un modelo usado para aproximar la relación de dependencia entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. La regresión nos permite además, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendría para un valor x que no esté en la distribución.

¿Cuándo utilizar un pronóstico de regresión lineal? El pronóstico de regresión lineal simple es un modelo óptimo para patrones de demanda con tendencia (Creciente o decreciente), es decir, patrones que presenten una relación de linealidad entre la demanda y el tiempo.


Existen medidas de la intensidad de la relación que presentan las variables que son fundamentales para determinar en qué momento es conveniente utilizar regresión lineal.

Tipos de modelos de regresión lineal

Regresión lineal simple: se basa en estudiar los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta. Es decir, se esta en presencia de una regresión lineal simple cuando una variable independiente ejerce influencia sobre otra variable dependiente. Sólo se maneja una variable independiente, por lo que soó lo cuenta con dos paraó metros

Ejemplo: Y = f(x) 

Regresión lineal múltiple: La regresión lineal permite trabajar con una variable a nivel de intervalo o razón, así también se puede comprender la relación de dos o más variables y permitirá relacionar mediante ecuaciones, una variable en relación a otras variables llamándose Regresión múltiple. O sea, la regresión lineal múltiple es cuando dos o más variables independientes influyen sobre una variable dependiente.

Ejemplo: Y = f(x, w, z).

 Rectas de Regresión: Las rectas de regresión son las rectas que mejor se ajustan a la nube de puntos (o también llamado diagrama de dispersión) generada por una distribución binomial.


Análisis de regresión El objetivo de un análisis de regresión es determinar la relación que existe entre una variable dependiente y una o más variables independientes. Para poder realizar esta relación, se debe postular una relación funcional entre las variables. Cuando se trata de una variable independiente, la forma funcional entonces determina la intensidad entre las variables a través de coeficientes de correlación y determinación.

Correlación El análisis de correlación se encuentra estrechamente vinculado con el análisis de regresión y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema. La correlación entre dos variables es el grado de asociación entre las mismas. Este es expresado por un único valor llamado coeficiente de correlación (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando “r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo de “b” en el análisis de regresión).


Tipos de Correlación

Supuestos del modelo de regresión lineal En el caso en que nuestras observaciones sean una muestra aleatoria proveniente de una población, estaremos interesados en realizar inferencias sobre la misma. A fin de que estas inferencias sean “estadísticamente razonables”, se han de cumplir las siguientes condiciones: 1. En la población, la relación entre las variables X e Y debe ser aproximadamente lineal. 2. Los residuos se distribuyen según una Normal de media 0, i.e. 3. Los residuos son independientes unos de otros. 4. Los residuos tienen varianza σ2 constante.

Afortunadamente, el modelo de regresión lineal es bastante “robusto”, lo que significa que no es necesario que las condiciones anteriores se cumplan con exactitud (en particular las tres últimas).

Aplicaciones de la regresión lineal


Líneas de tendencia: Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo período. Este tipo de líneas puede decir si un conjunto de datos en precio del petróleo o el valor de las acciones) han aumentado en un determinado período. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la línea.

Medicina: Las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.

En el caso del Tabaquismo, los investigadores incluyeron el estado socio-económico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica. 

Industria: En la industria tiene aplicación para investigar la relación entre el rendimiento de la producción y uno o más factores del (o de los) que depende, como la Temperatura, la humedad ambiental, la presión, la cantidad de insumos, etc; con base en este análisis se puede pronosticar el comportamiento de una variable que se desea estimar.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.