curso de estadistica GRATIS GO

Page 1

Pagina 1


ESTADISTICA La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. La estadística se divide en dos elementos: La estadística descriptiva. Se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, etc. La inferencia estadística. Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada Población: El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes. Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra. Pagina 2


Muestra Se llama muestra a una parte de la población a estudiar que sirve para representarla Una muestra representativa contiene las características relevantes de la población en las mismas proporciones que están incluidas en tal población. Utilizan esta información para hacer referencias sobre la población que está representada por la muestra. En consecuencia muestra y población son conceptos relativos. Una población es un todo y una muestra es una fracción o segmento de ese todo. Muestreo: Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población. Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra. Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra. Variables y Atributos: Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que pueden ser expresados mediante números. Son caracteres susceptibles de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Los atributos también llamados caracteres cualitativos, son aquellos que no son susceptibles de medición, es decir que no se pueden expresar mediante un número. Pagina 3


La forma de expresar los atributos es mediante palabras, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de "modalidades". Ejemplo; El estado civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en la misma modalidad en todos. Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la magnitud de dichas variaciones. Por intuición y por experiencia sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas. Las variables continuas se caracterizan por el hecho de que para todo para de valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.

Pagina 4


Ejemplo: En el preescolar Blanca de Pérez, ubicado en la urbanización Monseñor Padilla de esta ciudad se procedió a recoger las medidas de talla y peso de los niños que a este asisten. Niño

Peso

Talla

José

18,300

1,15

Julio

20,500

1,20

Pedro

19,000

1,10

Luis

18,750

1,18

Las variables discretas serán aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas que solo toman un determinado números de valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por ejemplo el número de estudiantes de una clase es una variable discreta ya que solo tomará los valores 1, 2, 3, 4... Nótese que no encontramos valor como 1,5 estudiantes. Tabla de Distribución de Frecuencias Tal como puede leerse en la literatura estadística ésta es una ciencia que se encarga de recoger, organizar y analizar los hechos de naturaleza numérica referente a cualquier tópico.

Objetivos

1. Organizar los datos en una tabla de distribución de frecuencias agrupándolos en clases

2. Construir los gráficos que sean necesarios para el análisis de los datos. Pagina 5


Procedimiento para la elaboración de una tabla de frecuencia

a. Calcular el Rango ( R ) El rango se define como la diferencia entre el Valor Máximo y el Valor Mínimo de los datos, es decir:

R = Max ( ) −Min ( ).

b. Calcular el número de Clases o Intervalos de clases ( K ) K =1+ 3,322Log(N), en donde K es el número de clases (intervalos) y N es el número de datos por agrupar. c. Calcular la Amplitud de Intervalo (A). Esta se obtiene dividiendo el Rango (R) entre la Amplitud del intervalo (K), es decir:

A = R / K.

d. Calcular las Frecuencias Absolutas (fi) Se calcula buscando y contando los valores que se encuentren en el intervalo de clase analizado. e. Calcular las Frecuencias Absolutas Acumuladas (Fi) Se realiza contabilizando las frecuencias absolutas de los intervalos f. Calcular las Frecuencias Relativas (hi) Es la división de la frecuencia absoluta y el numero de datos,

hi = fi / N

g. Calcular las Frecuencias Relativas Acumuladas(Hi) Se realiza contabilizando las frecuencias relativas de los intervalos

EJERCICIOS

1 . E l n úm e ro de e stre lla s d e lo s h o tele s d e un a ciu d ad vie ne d a do p o r la sigu ie n t e se rie : 3 , 3 , 4, 3 , 4, 3 , 1 , 3 , 4 , 3, 3 , 3, 2 , 1 , 3 , 3 , 3, 2 , 3, 2 , 2 , 3 , 3 , 3, 2 , 2 , 2 , 2 , 2 , 3, 2 , 1 , 1 , 1 , 2 , 2 , 4, 1 . Co n st ru ir la t ab la d e d ist ribu ció n d e f re cu e n cia s e in t e rp re t a r f 2 y h3 Pagina 6


2 . L a s p u nt u a cio n e s o b te n ida s p o r u n gru p o e n u na p ru e ba h a n sid o : 1 5 , 2 0 , 1 5, 18 , 2 0 , 1 8 , 1 7, 16 , 1 5 , 19 , 18 , 1 5 , 1 6, 20 , 1 6, 1 5 , 1 8 , 1 6 , 1 6, 20 . E la b o ra r la t ab la d e f re cu e n cia 3 . L a s ca lif ica cion e s d e 50 a lum n o s e n Ma t e má t ica s ha n sid o la s sigu ie n t e s: 5 , 5 , 4 , 9 , 7 , 4, 5 , 6 , 5 , 7 , 7 , 5 , 5, 7 , 1 0 , 5 , 6 , 5, 4 , 5 , 8 , 8 , 4 , 8, 8 , 4 , 8 , 6 , 6 , 6 , 6, 7 , 6 , 6 , 7 , 6 , 7 , 8, 5 , 6 , 9 , 6 , 4 , 4 , 6 , 7 , 5 , 5 , 6 , 7. E la b o ra r la t ab la de f re cue n cia

4. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas: Construir la tabla de frecuencias

a. Calcúlese el porcentaje de personas que pesa entre 63 y 68 Kg b. ¿Cuántas personas tienen peso mayor o igual que 73 Kg. pero menor que 78?

60;66;77;70;66;68;57;70;66;53;75;65;69;71;58; 66;67;74;61;63;69;80;59;66;70;67;78;75;64;71; 81;62;64;69;68;72;83;56;65;74;67;54;65;65;69; 61;67;73;57;62;67;68;63;67;71;68;76;61;62;63; 76;61;67;67;64;72;64;73;79;58;67;71;68;59;69; 7 0 ; 6 6 ; 6 2 ; 6 3 ; 6 6.

Pagina 7


Histograma de Frecuencias Un histograma de frecuencias es un gráfico que se forma levantando rectángulos sobre cada uno de los Límites Reales de cada intervalo, con una altura equivalente a la frecuencia absoluta de cada clase. El histograma se utiliza para representar datos que corresponden a los valores de una variable cuantitativa continua. Para indicar esta continuidad de la variable no se dejan espacios entre las barras.

MEDIDAS DE TENDENCIA CENTRAL La estadística descriptiva en su función básica de reducir datos, propone una serie de indicadores que permiten tener una percepción rápida de lo que ocurre en un fenómeno. La primera gama de indicadores corresponde a las “Medidas de Tendencia Central”. Existen varios procedimientos para expresar matemáticamente las medidas de tendencia central, de los cuales, los más conocidos son: la media aritmética, la moda y la mediana.

Medidas de tendencia central: Son indicadores estadísticos que muestran hacia que valor (o valores) se agrupan los datos.

LA MEDIA ARITMÉTICA La media aritmética (μ o X): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.

Pagina 8


Media aritmética para datos no agrupados Podemos diferenciar la fórmula del promedio simple para datos poblaciones y muéstrales:

Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N identifica el tamaño de la población, mientras que n el de la muestra).

Ejemplo

El profesor de la materia de estadística desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3.2; 3.1; 2.4; 4.0; 3.5; 3.0; 3.5;

3.8; 4.2; 4.0

¿Cuál es el promedio de notas de los alumnos de la clase? SOLUCIÓN Aplicando la fórmula para datos no agrupados tenemos:

Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmética.

Pagina 9


En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que la media aritmética es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atípica comparada con las demás, que están ubicadas entre 3,0 y 4,2.

Media aritmética para datos agrupados En el capitulo 2 explicábamos dos tipos de tablas de frecuencias (A y B). Cuando los datos se agrupan en tablas tipo A, la media aritmética es igual a la división de la sumatoria del producto de las clases por la frecuencia sobre el número de datos.

Ejemplo: media aritmética para datos agrupados en tablas tipo A La siguiente tabla de frecuencia muestra el número de preguntas de 81 encuestados sobre un Test que consta de solo seis preguntas.

Pagina 10


Solución: PASO 1: Realizar la sumatoria del producto resultante de las clases por su frecuencia absoluta. Para efectos del cálculo de la media, deberíamos sumar 15 veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la última clase:

PASO 2: Dividir la sumatoria sobre el número total de datos.

En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es 3,41) preguntas buenas. Ejemplo: media aritmética para datos agrupados en tablas tipo B Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia: fi [3 8 , 44 )

7

[4 4 , 50 )

8

[5 0 , 56 )

15

[5 6 , 62 )

25

[6 2 , 68 )

18

[6 8 , 74 )

9

[7 4 , 80 )

6

Pagina 11


VENTAJAS Y DESVENTAJAS DE LA MEDIA ARITMETICA

Ventajas  Es la medida de tendencia central más usada.  El promedio es estable en el muestreo.  Es sensible a cualquier cambio en los datos (puede ser usado como un detector de variaciones en los datos).  Se emplea a menudo en cálculos estadísticos posteriores.  En la gráfica de frecuencia representa el centro de gravedad.

Desventajas  Es sensible a los valores extremos.  No es recomendable emplearla en distribuciones muy asimétricas.

LA MEDIANA

Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales. La definición de geométrica se refiere al punto que divide en dos partes a un segmento. Por ejemplo, la mediana del segmento AB es el punto C.

Existen entonces dos segmentos iguales:

Pagina 12


Ejemplo: mediana para datos no agrupados (cantidad de datos impar) Encontrar la mediana para los siguientes datos: 4, 1, 2, 3, 4, 2, 2, 1.

SOLUCIÓN

PASO 1: Ordenar los datos. 1, 1, 2, 2, 2, 3, 3, 4, 4, 5, 5. PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.

La mediana es 3, dejando 5 datos a cada lado. Me = 3 Ejemplo: mediana para datos no agrupados (cantidad de datos par) Modifiquemos el ejemplo anterior, eliminando el último dato. Encontrar la mediana: 4, 1, 2, 3, 4, 2, 2, 1, 5, 5.

SOLUCIÓN PASO 1: Ordenar los datos. 1, 1, 2, 2, 2, 3, 4, 4, 5, 5 PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.

El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la mediana será 2,5.

Pagina 13


CALCULO DE LA MEDIANA PARA DATOS AGRUPADOS

VENTAJAS Y DESVENTAJAS DE LA MEDIANA

Ventajas  Es estable a los valores extremos.  Es recomendable para distribuciones muy asimétricas.

Desventajas  No presenta todo el rigor matemático.  Se emplea solo en variables cuantitativas.

LA MODA Moda (Mo): indica el valor que más se repite, o la clase que posee mayor frecuencia. En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal. Ejemplo: moda para datos no agrupados Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más consume a la semana: Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3 Pagina 14


SOLUCIÓN

PASO 1: Determinar las frecuencias de cada valor de la variable. La marca 1 se repite 15 veces La marca 2 se repite 6 veces La marca 3 se repite 9 veces PASO 2: la moda representa el valor que más se repite. En este caso es la marca Mo = Marca 1

CALCULO DE LA MODA PARA DATOS AGRUPADOS Algunos autores suelen aplicar una fórmula para determinar la moda para tablas de frecuencia.

VENTAJAS Y DESVENTAJAS DE LA MODA

Ventajas  Es estable a los valores extremos.  Es recomendable para el tratamiento de variables cualitativas. 4.3.6 Desventajas  Pueda que no se presente.  Puede existir más de una moda.  En distribuciones muy asimétricas suele ser un dato muy poco representativo.  Carece de rigor matemático.

Pagina 15


EJERCICIO 1. De la siguiente distribución correspondiente a la edad de mujeres españolas que realizan algún tipo de estudios, obténgase la mediana, la media aritmética y la moda,

Edad Mujeres

fi (millones)

15 – 24

2.3

25 - 34

2.4

35 – 44

2.1

45 – 54

1.8

55 – 65

1.5

MEDIDAS DE DISPERSION Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).

Pagina 16


EL RANGO ESTADISTICO El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números aleatorios. Se le suele simbolizar con R. Requisitos del rango Ordenamos los números según su tamaño. Restamos el valor mínimo del valor máximo. Ejemplo Para una muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es 100 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de: Rango = (100-0) =100 EL RANGO MEDIO El medio rango de un conjunto de valores numéricos es la media del menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de mayor valor. En consecuencia el medio rango es:

Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de

mayor

valor

Max=

8.

El

medio rango

resolviéndolo

mediante

la

correspondiente fórmula sería:

Pagina 17


; Representación del medio rango :

LA VARIANZA La varianza, también denominada variancia (Aunque esta denominación es menos elegida) es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su media aritmética. Suele ser representada con la letra griega σ o una V en mayúscula. .

Pagina 18


DESVIACION TIPICA La variancia a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la desviación típica, o desviación standard, que se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por S, dado que es su inicial de su nominación en inglés. Desviación típica muestral

Desviación típica poblacional

Pagina 19


EJERCICIO 1. En una epidemia de escarlatina, se ha recogido el número de muertos en 40 ciudades de un país, obteniéndose la siguiente tabla: Calcular la varianza y la desviación estándar.

de

Muertos

fi ciudades

0–5

7

6 – 11

11

12 – 17

10

18 – 23

7

24 - 29

1

30 – 35

2

36 – 41

1

42 – 47

1

PROBABILIDADES La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico. Probabilidad de un suceso es el número al que tiende la frecuencia relativa asociada al suceso a medida que el número de veces que se realiza el experimento crece

Pagina 20


Supongamos que un suceso E tiene h posibilidades de ocurrir entre un total de n posibilidades, cada una de las cuales tiene la misma oportunidad de ocurrir que las demás. Entonces la probabilidad de que ocurra E (sea un éxito) se denota: p = Pr (E) = h / n La probabilidad de que no ocurra E (sea un fracaso se denota: q = Pr (no E) = (n – h) / n  1 – h/n = 1 – p = 1 - Pr (E) Así pues p + q = 1, es decir, Pr (E) + Pr (no E) = 1

EJEMPLITOS: En una baraja de 52 cartas, ¿cuál es la probabilidad de AS?, ¿Y de OROS

4 52

13 52

Pagina 21


Se lanzan dos dados equilibrados con seis caras marcadas con los números del 1 al 6. Se pide: a. Halla la probabilidad de que la suma de los valores que aparecen en la cara superior sea múltiplo de tres. b. ¿Cuál es la probabilidad de que los valores obtenidos difieran en una cantidad mayor de dos? Solución: El espacio muestral del experimento es: E = {(1,1); (1,2); (1,3); (1,4); (1,5); (1,6); (2,1); ...; (6,6)}

y está formado por 36 sucesos elementales. Constituyen el número de casos posibles

del

experimento.

Calculamos las probabilidades de los sucesos que nos piden: a. Si llamamos A al suceso "obtener una suma múltiplo de 3", los casos favorables al suceso A son: A = {(1,2); (2,1); (1,5); (2,4); (3,3); (4,2); (5,1); (3,6); (4,5); (5,4); (6,3); (6,6)}. Por tanto, P( A ) = 12/36 = 1/3 b. Si llamamos B al suceso "obtener unos valores que se diferencian en una cantidad mayor que dos", los casos favorables al suceso B son: B = {(1,4); (4,1); (1,5); (5,1); (1,6); (6,1); (2,5); (5,2); (2,6); (6,2); (3,6); (6,3)}.

Pagina 22


Por tanto, P( B ) = 12/36 = 1/3 ANÁLISIS COMBINATORIO: Es la rama de la matemática que estudia los diversos arreglos o selecciones que podemos formar con los elementos de un conjunto dado, los cuales nos permite resolver muchos problemas prácticos. Por ejemplo podemos averiguar cuántos números diferentes de teléfonos , placas o loterías se pueden formar utilizando un conjunto dado de letras y dígitos. Además el estudio y comprensión del análisis combinatorio no va ha servir de andamiaje para poder resolver y comprender problemas sobre probabilidades COMBINACIONES Es una selección de r objetos de n dados sin atender a la ordenación de los mismos. Es decir, es la obtención de subconjuntos, de r elementos cada uno, a

partir de un conjunto inicial de n elementos. La denotaremos con Cnr, nCr ó

.

Por ejemplo: Si tomamos el mismo conjunto A={a,b,c,d}, ¿cuántos subconjuntos de 2 elementos cada uno se pueden obtener? Haciéndolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los subconjuntos.

Cnr = nCr = Ejemplo: Una señora tiene 3 frutas: manzana, fresa y piña. ¿Cuántos sabores diferentes de jugo podrá preparar con estas frutas? Pagina 23


Fresa (F) , Piña (P) , Manzana (M)

Solución: Método 2: (Empleando combinaciones) 

Se puede escoger una fruta de las tres ó 2 frutas de las tres ó las tres frutas de las tres, además en este caso no importa el orden; por lo tanto usamos el principio de adición aplicado a la combinación:

# Maneras diferentes =

# Maneras diferentes =

Total de sabores diferentes: 3 + 3 + 1 = 7

DISTRIBUCION BINOMIAL En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos independientes de Bernoulli con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma

Pagina 24


independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1

n e s e l núm e ro d e p ru e ba s. k e s e l n úm e ro d e é xit o s. p e s la p ro b ab ilid ad d e é xit o . q e s la p ro b ab ilid ad d e f ra ca so .

E l n úm e ro co mb ina t o rio Me di a V a r i a nza De s vi a c i ón tí pi c a

E JE MP L O L a ú lt im a no ve la d e u n a u to r h a ten id o un gra n é xit o , h a st a e l p u n to d e qu e e l 8 0% d e lo s le ct o re s ya la h a n le íd o . U n gru p o de 4 am igo s so n af icio n ad o s a la le ctu ra : 1.

¿Cu á l e s la p r ob ab ilid a d de qu e en e l gru p o h a ya n le id o la n o ve la 2 pe rso na s? B (4 , 0 .8 ) p = 0. 8 q = 0 . 2

Pagina 25


2.

¿Y a l m e no s 2?

DI S TRI BUCI O N DE P O IS S O N

En teoría de probabilidad y estadística, la distribución de Poisson es una distribución de probabilidad discreta. Expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una frecuencia media conocida y son independientes del tiempo discurrido desde el último evento. La función de densidad de la distribución de Poisson es

REGRESION LINEAL En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza

la

relación

entre

una

variable

dependiente

Y,

las

variables

independientes

Pagina 26


Líneas de tendencia Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo período. Este tipo de líneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han aumentado o decrementado en un determinado período. Se puede dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de puntos, pero su posición y pendiente se calcula de manera más precisa utilizando técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la línea.

La regresión nos permite además, determinar el grado de dependencia de las series de valores X e Y, prediciendo el valor y estimado que se obtendría para un valor x que no esté en la distribución.

Los extremos de una función: máximo o mínimo se obtiene cuando las derivadas de s respecto de a y de b sean nulas. Lo que da lugar a un sistema de dos ecuaciones con dos incógnitas del que se despeja a y b.

Pagina 27


Y=aX+b EJEMPLITO Para la economía española, disponemos de los datos anuales redondeados sobre consumo final de los hogares a precios corrientes (Y) y renta nacional disponible neta (X), tomados de la Contabilidad Nacional de España base 1995 del INE , para el período 1995-2002, ambos expresados en miles de millones de euros:

Considerando que el consumo se puede expresar como función lineal de la renta (Yt=a+b·Xt), determine:

Los parámetros a y b de la recta de regresión. La predicción del valor que tomará el consumo para una renta de 650.000 millones de euros.

Pagina 28


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.