Estadística a fondo. Explicaciones concisas y precisas
Estadística facilisima!!! 1
Fácil
No se necesita mas pasos!
Todo sobre
Regresion Lineal © 1 paso para todo Por Sebastián Mendoza #509
Introduccion 多Q ue es?
多Para que?
:)
多?
多quien, como cuando, donde, oohhh, ya veo, en serio, pero y si?... Todo esto en su respectivo lugar
Ya veo tu punto, pero sigo sin entenderte.
Una manera UNICA de aprendizaje
1 2 3 4 5
El objetivo de estas guias
Es compartir con todos las personas posibles el conocimiento de diversas areas!
No solo pasos si no informacion!
No solo se aprende como hacerlo, ademas sabras por que y cuando!
Una revista a tu alcance! Lee una edicion donde quieras y cuando quieras!
Una sola subscripcion!
Con un sola subscripcion tendras a tu disposicion todas las guias de este tema!
No hay guia igual
Con tanto contenido de matematicas, fisicas estadisticas, historia, idiomas.... con tanto contenido no hay necesidad de repetir informacion o un mismo tema!
¿Que es?
Unidad 1 En esta unidad veremos el origen de la regresión lineal, y Hablaremos un poco mas de ella antes de empezar a desarrollarnos en ella
Historia de La regresión lineal
E
l término regresión fue introducido por Francis Galton en su libro Natural inheritance (1889) y fue confirmada por su amigo Karl Pearson. Su trabajo se centró en la descripción de los rasgos físicos de los descendientes (variable A) a partir de los de sus padres (variable B). Estudiando la altura de padres e hijos a partir de más de mil registros de grupos familiares, se llegó a la conclusión de que los padres muy altos tenían una tendencia a tener hijos que heredaban parte de esta altura, pero que revelaban también una tendencia a regresar a la media. Galton generalizó esta tendencia bajo la “ley de la regresión universal”: Cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor.
D
onde?
Una pregunta muy común para esto es ¿donde se aplica?, Sin embargo responder esto nos tomaría mucho tiempo así que mencionaremos sus principales usos.
C
Ciencia
A
Análisis
Predicción
R
P
Relaciones
1. Descripción de datos Ingenieros y científicos frecuentemente utilizan ecuaciones para resumir un conjunto de datos. El análisis de regresión es útil para describir los datos. 2. Estimación de parámetros. Uno de los casos en los cuales se utiliza el análisis de regresión para estimar parámetros es el siguiente: Suponga que un circuito eléctrico contiene una resistencia conocida de R ohms. Diferentes corrientes pasan a través del circuito y el correspondiente voltaje es medido. El diagrama de dispersión podría indicar que el voltaje y la corriente están relacionados por una línea recta que pasa por el orígen con pendiente R (debido a que el voltaje R y la corriente estan relacionados por la ley de Ohm E=IR). El análisis de regresión podría ser utilizado para ajustar este modelo a los datos, produciendo un estimado de la resistencia desconocida. 3. Para predicción y estimación. Algunos casos de esta utilidad del análisis de regresión son:
(A)La respuesta de un cultivo al variar la cantidad de los fertilizantes; el objetivo puede ser establecer la forma de la relación, o predecir la combinación optima de fertilizantes. (B)La relación entre varias medidas meteorológicas y la producción del cultivo; el más obvio objetivo podría ser tratar de entender los efectos meteorológicos sobre el crecimiento del cultivo.
Unidad 2 Regresión Lineal
En esta unidad se observara como se pone en practica la regresión lineal.
El modelo de pronóstico de regresión lineal permite hallar el valor esperado de una variable aleatoria a cuando b toma un valor específico. La aplicación de este método implica un supuesto de linealidad cuando la demanda presenta un comportamiento creciente o decreciente, por tal razón, se hace indispensable que previo a la selección de este método exista un análisis de regresión que determine la intensidad de las relaciones entre las variables que componen el modelo. El objetivo de un análisis de regresión es determinar la relación que existe entre una variable dependiente y una o más variables independientes. Para poder realizar esta relación, se debe postular una relación funcional entre las variables. Cuando se trata de una variable independiente, la forma funcional que más se utiliza en la práctica es la relación lineal. El análisis de regresión entonces determina la intensidad entre las variables a través de coeficientes de correlación y determinación.
Coeficiente de correlación [r] El coeficiente de correlación, comúnmente identificado como r o R , es una medida de asociación entre las variables aleatorias X y Y, cuyo valor varía entre
Pronostico de periodo T Intersección de la línea con el eje Pendiente (positiva o negativa)
Período de tiempo Donde ... Promedio de la variable dependiente (Ventas o Demanda)
Promedio de la variable independiente (Tiempo)
Ejemplo
Tabla 1. Análisis de regresión lineal para la densidad óptica como una función de la concentración de biomasa. Concentración (X) (mM) Densidad óptica ( Y) (%Trasmitancia) 1 4 2 9 4 18 5 20 8 35 10 41 12 47 15 60
1. Identificar la variable independendiente y la variable dependiente: En este caso la variable dependiente es la densidad óptica ( y) y la variable independiente es concentración ( x). 2. Determinar si existe una relación de dependencia razonable. En la situación presentada puede observarse que en la realidad estas dos características (concentración de biomasa y densidad óptica) presentan una relación lógica. Se ha encontrado que la densidad óptica depende de la concentración de biomasa. 3. Determinar el modelo estadístico: Como la densidad óptica parece aumentar a medida que aumenta la concentración entonces se debe sugerir un modelo lineal dado por:
donde $y_{i}$ es el valor observado en este caso la densidad óptica para un valor de concentración x, beta{o} corresponde al intercepto de y con la línea de regresión y beta{1} representa el valor medio de densidad óptica para un valor determinado de concentración llamada pendiente de la línea de regresión o coeficiente de regresión, x es el valor de la concentración, que se asume, es medida sin error.y varepsilon{ij}es la variable aleatoria error.
Estos supuesto deben cumplirse para que el análisis de los datos sea válido. 4. Determinar la ecuación de regresión o modelo ajustado: El modelo predicho o ecuación de regresión ajustada es una expresión como la siguiente
Para obtenerla usted debe encontrar los valores estimados de los parámetros: b{0} y b{1}. Éstos se obtienen aplicando el método de mínimos cuadrados. El método de mímos cuadrado trata de buscar cual es la recta que más se acerca a los puntos; es decir busca la recta que haga que la distancia entre el valor real y{i} y el valor obtenido por la recta ajustada {y}{i} sea la más pequeña y así, la suma de todas estas distancias simbolizadas como:
Para poder utilizar este modelo , se asume que las variables error varepsilon{ij} cumplen los suguientes supuestos: sea la más pequeña. Como la mejor recta está determinada por beta{0} y beta {1}entonces matemáticamente, se desea escoger los valores para beta{0} y beta{1} que minimicen la suma de cuadrados del error. Para el ejemplo los valores estimados son:
i Son normales con media cero ii Son independientes iii Tienen igual varianza sigma^{2}.
b{o}=1.1931, corresponde al punto de intersección en el eje y o punto en el que la recta corta al eje y; y se interpreta como la respuesta mínima que se espera tener para la variable y, es decir el mínimo valor de densidad óptica.
¿Sabias que? Se usan en los negocios principalmente para:
Análisis de línea de tendencias Análisis de riesgos para inversionistas Ventas o previsiones del mercado Control de calidad total Regresión lineal en recursos humanos
b{1}=3.9378, corresponde a la pendiente de la recta o coeficiente de regresión. Como puede observarse en la gráfica la recta tuvo una inclinación ascendente de izquierda a derecha, lo que es consistente con el valor obtenido de beta{1} que fué positivo, por esto se concluye que tiene pendiente POSITIVA y puede decirse que existe una relación lineal positiva entre la densidad óptica y la concentración (lo cual se había detectado gráficamente). El valor de la pendiente significa que a medida que aumente en una unidad la concentración de biomasa, la densidad óptica promedio incrementará en $3.9378$ unidades. Al reemplazar en la ecuación de regresión los valores de los parámetros estimados se tiene:
Sebastian Mendoza I.U.P.S.M