Estadística y Probabilidad by Miguel Zazo González

ESTADÍSTICA Y PROBABILIDAD

http://sites.google.com/site/mat3catorce/

Índice

ESTADÍSTICA ................................................................................................................................. 3

CONCEPTOS .................................................................................................................................. 3

VARIABLES ESTADÍSTICAS ............................................................................................................. 3

ORDENACIÓN DE DATOS. TABLA DE FRECUENCIAS ....................................................................... 4

REPRESENTACIONES GRÁFICAS ..................................................................................................... 6

MEDIDAS DE CENTRALIZACIÓN ..................................................................................................... 9

MEDIDAS DE DISPERSIÓN ........................................................................................................... 11

8. ......................................................................................................................................................... 13 9.

INTRODUCCIÓN A LA ESTADÍSTICA BIDIMENSIONAL .................................................................. 13

10.

VARIABLE ESTADÍSTICA BIDIMENSIONAL .................................................................................... 14

11.

DIAGRAMA DE DISPERSIÓN. NUBE DE PUNTOS .......................................................................... 15

12.

TABLAS DE DOBLE ENTRADA....................................................................................................... 16

13.

MEDIDAS MARGINALES .............................................................................................................. 17

14.

COVARIANZA .............................................................................................................................. 19

15.

COEFICIENTE DE CORRELACIÓN LINEAL ....................................................................................... 20

16.

COEFICIENTE DE DETERMINACIÓN .............................................................................................. 22

17.

RECTA DE REGRESIÓN DE Y SOBRE X ........................................................................................... 23

18.

COEFICIENTE DE REGRESIÓN DE LA RECTA Y/X ........................................................................... 24

19.

RECTA DE REGRESIÓN DE X SOBRE Y ........................................................................................... 24

20.

COEFICIENTE DE REGRESIÓN DE LA RECTA X/Y ........................................................................... 25

21.

EXPERIMENTOS ALEATORIOS. SUCESOS ALEATORIOS ................................................................. 29

22.

OPERACIONES CON SUCESOS ...................................................................................................... 31

22.1.

LEYES DE MORGAN ........................................................................................................................ 33

23.

CONCEPTO DE PROBABILIDAD .................................................................................................... 33

24.

DEFINICIÓN AXIOMÁTICA DE PROBABILIDAD ............................................................................. 35

25.

PROBABILIDAD CONDICIONADA ................................................................................................. 36

26.

INDEPENDENCIA DE SUCESOS ..................................................................................................... 37

27.

PROBABILIDAD TOTAL ................................................................................................................ 39

28.

TEOREMA DE BAYES ................................................................................................................... 41

29.

EJERCICIOS .................................................................................................................................. 43

30.

INTRODUCCIÓN A LAS FUNCIONES DE PROBABILIDAD ............................................................... 51

31.

DISTRIBUCIÓN DE PROBABILIDAD DISCRETA .............................................................................. 51

1/66

http://sites.google.com/site/mat3catorce/

32.

DEFINICIÓN DE LA PROBABILIDAD A PARTIR DE LAS FRECUENCIAS RELATIVAS .......................... 53

33.

VARIABLE ALEATORIA DISCRETA ................................................................................................. 53

34. DISTRIBUCIÓN DE PROBABILIDAD. FUNCIÓN DE DISTRIBUCIÓN DE UNA VARIABLE ALEATORIA DISCRETA ............................................................................................................................................. 55 35.

MEDIA O ESPERANZA MATEMÁTICA DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA........ 57

36.

VARIANZA DE UNA DISTRIBUCIÓN DE PROBABILIDAD DISCRETA ................................................ 57

37.

DISTRIBUCIÓN BINOMIAL ........................................................................................................... 58

37.1.

PARÁMETROS DE UNA DISTRIBUCIÓN BINOMIAL .................................................................................. 60

38.

DISTRIBUCIÓN DE PROBABILIDAD CONTINUA ............................................................................ 61

39.

FUNCIÓN DE DENSIDAD .............................................................................................................. 62

40.

FUNCIÓN DE DISTRIBUCIÓN ........................................................................................................ 63

41.

DISTRIBUCIÓN NORMAL ............................................................................................................. 63

41.1. 42.

DISTRIBUCIÓN NORMAL ESTÁNDAR ................................................................................................... 65

DISTRIBUCIÓN NORMAL COMO APROXIMACIÓN DE UNA BINOMIAL ......................................... 65

2/66

http://sites.google.com/site/mat3catorce/

1. Estadística La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello, gracias al análisis de estos datos, unos significados precisos o unas previsiones para el futuro. La Estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva. La Estadística descriptiva se ocupa de tomar los datos de un conjunto, organizarlos en tablas o en representaciones gráficas y del cálculo de unos números que dan información de manera global del conjunto deseado. La Estadística inferencial trata sobre la elaboración de conclusiones, partiendo de los resultados de una muestra y del grado de fiabilidad de estas conclusiones. En la Estadística actual se utilizan métodos de Análisis Matemático, surgiendo la vinculación a este a través del Cálculo de Probabilidades.

2. Conceptos 

Población: conjunto de todos los elementos que son objeto de estudio estadístico. Los elementos de la población pueden ser finitos o infinitos.

Ejemplo Si se quiere analizar el precio del litro de gasóleo de España, la población es cada una de las gasolineras del País.



Individuo: es cada uno de los elementos de la población.

Ejemplo Precio del litro de gasóleo de la gasolinera de la Avenida de la Aviación, Madrid.



Muestra: subconjunto de elementos de la población. Se suelen tomar muestras cuando es difícil o costosa la observación de todos los elementos de la población estadística.

Ejemplo Precio del litro de gasóleo de 100 gasolineras de España elegidas al azar entre las distintas Comunidades Autónomas.



Tamaño de la población: es el número de individuos de la población.



Tamaño de la muestra: es el número de individuos de la muestra

3. Variables Estadísticas A los valores de las distintas modalidades que adopta un carácter se le llama variable estadística. Por ejemplo, si el individuo observado es un libro, podremos describirlo mediante los caracteres peso, tamaño, número de hojas, color de las pastas, etc.

3/66

http://sites.google.com/site/mat3catorce/

A cada carácter que se quiere estudiar se le asocia una variable estadística cuyos valores son los que adopta el carácter de estudio. Las variables estadísticas se pueden clasificar de la siguiente forma: 

Variable estadística cualitativa: representa un carácter no medible. Se describen con palabras.

Ejemplo Sea X la variable estadística que indica el estado civil de una persona. X podrá tomar los valores “soltero” o “casado”. Es una variable estadística cualitativa



Variable estadística cuantitativa: representa un carácter medible. Se expresa con números. Se clasifican en: o

Variable estadística discreta: Son aquellas que toman valores en un conjunto numerable.

Ejemplo Sea X la variable estadística “número de hijos de una familia”, es una variable estadística cuantitativa discreta

Variable estadística continua: Son aquellas que pueden tomar infinitos valores en un intervalo dado.

Ejemplo Sea Y la variable estadística “altura de una persona”, es una variable estadística cuantitativa continua

Ejemplo Si se quiere estudiar el precio del litro de gasóleo en las gasolineras de España, la variable estadística que podemos utilizar es X que indica el precio del litro en euros. Tomamos una muestra del precio del litro en 100 gasolineras

x1  0.99€

x 2  0.81€ x3  0.95€ ... x100  1.03€ La población son todas las gasolineras de España. El tamaño de la muestra es 100. De entre todas las gasolineras se eligen 100 para analizar el precio del litro del gasóleo. Esta elección deberá ser representativa de todas las gasolineras si se quiere sacar alguna conclusión rigurosa.

4. Ordenación de datos. Tabla de frecuencias - Llamamos Frecuencia Absoluta de un valor x i de la variable estadística X , y se representa por f i , al número de veces que aparece repetido dicho valor en el conjunto de las observaciones realizadas. - Llamamos Frecuencia Relativa de un valor x i de la variable estadística X , y se representa por fri , a

fri 4/66 

fi n

http://sites.google.com/site/mat3catorce/

donde n es el número total de individuos de la muestra o población. -

Llamamos Frecuencia Absoluta Acumulada de un valor x i estadística

Fi   f j

de la variable

representa por Fi , al valor:

j 1

- Llamamos Frecuencia Relativa Acumulada de un valor x i

de la variable

por Fri , al valor:

estadística X , y se representa

Fri 

Fi n

- Marca de clase: Si los valores de la variable estadística están agrupados por intervalos o clases, la marca de clase es el punto medio de ese intervalo. Ejemplo Sea X la variable estadística “calificación de un examen”. Se presentan 10 alumnos y sus calificaciones son:

x1  5; x2  7; x3  3; x4  5; x5  5; x6  3; x7  8; x8  6; x9  4; x10  8

5/66

http://sites.google.com/site/mat3catorce/

La información concerniente a la variable estadística X se muestra en la siguiente tabla de frecuencias: Calificación 3 4 5 6 7 8

fri

Fri

2 1 3 1 1 2

0.2 0.1 0.3 0.1 0.1 0.2

2 3 6 7 8 10

0.2 0.3 0.6 0.7 0.8 1

Podría agruparse los datos en intervalos. Si se quiere tener 4 intervalos, la longitud de cada uno de ellos será de

10  0  2.5 dando lugar a la siguiente tabla de frecuencias: 4 marca de clase

[0 , 2.5) [2.5 , 5) [5 , 7.5) [7.5 , 10)

1.25 3.75 6.25 8.75

fri

Fri

0 3 5 2

0 0.3 0.5 0.2

0 3 8 10

0 0.3 0.8 1

5. Representaciones gráficas A continuación se muestran de distintas representaciones gráficas de datos estadísticos. En primer lugar se debe de escribir la tabla de frecuencias y a continuación representar la información. Veámoslo con el ejemplo anterior, donde X es la variable estadística “calificación de un examen” Calificación X 3 4 5 6 7 8

fri

Fri

2 1 3 1 1 2

0.2 0.1 0.3 0.1 0.1 0.2

2 3 6 7 8 10

0.2 0.3 0.6 0.7 0.8 1

6/66

http://sites.google.com/site/mat3catorce/

3,5 3 2,5 2 Calificaciones 1,5 1 0,5 0 3

7/66

http://sites.google.com/site/mat3catorce/

Gráfica de frecuencias acumuladas:

12 10 8 6 4 2 0 3

La representación de variables cualitativas suele hacerse con diagrama de sectores. Sea Y la variable estadística que indica la marca de los vehículos que son clientes de una cadena de talleres mecánicos. La información, así como la frecuencia, número de coches de cada modelo, se muestran en la siguiente tabla de frecuencias: SEAT RENAULT CITROEN OPEL FORD Otras

350 200 111 165 180 165

SEAT RENAULT CITROEN OPEL FORD OTRAS

8/66

http://sites.google.com/site/mat3catorce/

6. Medidas de Centralización Es conveniente reducir la información obtenida a un solo valor para facilitar la comparación entre las distintas muestras o poblaciones. Estos valores centralizan la información y reciben el nombre de medidas de tendencia central o medidas de centralización. Definición:

Si x i son los distintos valores que toma la variable estadística X , se define la Media Aritmética de X como x , donde

x

x i 1

siendo n el tamaño de la muestra o población

Si la información estadística viene dada en función de las frecuencias, entonces la media aritmética x se define también como: k

x

fx

i i

i 1

Ejemplo Dados los siguientes valores {2, 4, 0, -6, -3, 6, 2, 10} relativos a una variable estadística X , su media aritmética es: 8

x

x

i 1



2  4  0  - 6  - 3  6  2  10 15   1.875 8 8

Ejemplo En el ejemplo anterior, X la variable estadística “calificación de un examen”, la media aritmética es 6

x

fx

i i

i 1



2·3  1·4  3·5  1·6  1·7  2·8 54   5.4 10 10

9/66

http://sites.google.com/site/mat3catorce/

Otras medidas centralizadoras son: Definición: Media Armónica

H

n k

fi  i 1 x i

Definición: Media Geométrica 1/ n

 k f  G    xi  i   i 1  Definición:

Mediana M e : es el valor central de los datos una vez ordenados de menor a mayor. Si hubiese un par de valores centrales, la Mediana sería la media aritmética de estos dos valores. Ejemplo Dados los siguientes valores {2, 4, 0, -6, -3, 6, 2, 10} relativos a una variable estadística. Calcular su mediana. Los datos centrales una vez ordenados de menor a mayor son los subrayados: {-6, -3, 0, 2, 3, 4, 6, 10} La mediana es la media aritmética de los valores centrales

23  2.5 . La mediana es 2.5. 2

La relación entre las distintas medias es: Media Armónica

Media Geométrica

Media Aritmética

Definición:

Moda M o : valor de la variable estadística que se presenta con mayor frecuencia absoluta. Si dos o más valores de las variables estadísticas tienen la misma frecuencia mayor que las demás, tendremos una distribución bimodal o polimodal.

10/66

http://sites.google.com/site/mat3catorce/

Ejemplo Dados los siguientes valores {2, 4, 2, 6, -3, 6, 2, 10} relativos a una variable estadística Y , su moda es 2. Ejemplo Dados los siguientes valores {2, 4, 2, 6, -3, 6, 3, 10} relativos a una variable estadística Y , su moda es 2 y 6.

7. Medidas de Dispersión Las mediadas de centralización necesitan de otras que las complementen en el estudio de las distribuciones de frecuencia de las variables estadísticas. Las medidas de dispersión informan de las desviaciones que sufren los datos respecto de los valores centrales. Definición: Rango o amplitud de recorrido es la diferencia entre el mayor y el menor de los datos. Ejemplo Dados los siguientes valores {2, 4, 0, 6, 3, 6, 2, 10} relativos a una variable estadística Y , su rango es 10   6  16

 

Definición: Varianza

 x n

  2

i 1

x



Si la información estadística viene dada en función de las frecuencias, entonces la media aritmética  2 se define también como:

 f x  x 

  2

i 1

La varianza es siempre un valor mayor o igual que cero.  2 toma el valor cero solo cuando todos los valores de la muestra son iguales.

2 0 11/66

http://sites.google.com/site/mat3catorce/

A efectos de un cálculo de la varianza más sencillo, se desarrolla la expresión de  2 con lo que tenemos n

2 

Demostración:

 x  x   x 2

2 

 xi

 2·x

x i 1

x  n



fx i 1

i i



i 1



 2·x  xi  n· x

i 1



 2·x·x  x 

 x 

i 1

x

   x

 2·x·xi  x

i 1

2 



i 1



 xi

x i 1

  2

 2· x  x 

x i 1



 x



 x

Ejemplo Cálculo sencillo de la varianza a partir de la tabla de frecuencias. Sea X la variable estadística “calificación de un examen” del ejemplo anterior. Calcular la varianza de la muestra.

Calificación 3 4 5 6 7 8 totales

f i ·xi

2 1 3 1 1 2

6 4 15 6 7 16 54

9 16 25 36 49 64

18 16 75 36 49 128 322

x  5.4 k

2 

fx i 1

2 i



 x



322 2  5.4  3.04 10 12/66

http://sites.google.com/site/mat3catorce/

Definición: La Desviación Típica es la raíz cuadrada de la varianza:

  2 Ejemplo La desviación típica del ejemplo anterior es

   2  3.04  1.7435

Definición: Coeficiente de Variación

CV 

 x

El Coeficiente de Variación sirve para comparar diferentes muestras, ya que un menor coeficiente de variación indicará una menor variabilidad. Ejemplo Sean X la variable estadística que indican la producción de leche en miles de litros. Sean A y B dos granjas productoras de leche. Los datos obtenidos durante cuatro trimestres de un año dado son Granja A Granja B

12 20

25 30

x Granja A Granja B

24.75 21.75

2 15

60 22



CV 21.9245867 0.88584189 5.4025457 0.24839291

A la vista de los resultados, la granja A tiene una mayor producción anual de leche si se observa solo la media aritmética. Sin embargo, una desviación típica mayor de la granja A indica una mayor variabilidad en la producción. Un CV menor de la granja B da a entender una mayor fiabilidad de esta granja en la producción de leche, y será este el valor a tener en cuenta si se quiere contratar una granja que asegure un suministro de leche al mercado.

8. 9. Introducción a la Estadística Bidimensional

13/66

http://sites.google.com/site/mat3catorce/

Una Variable Estadística Bidimensional recogerá la información de dos caracteres de un individuo, obteniéndose, por tanto, pares de resultados. Una de las cuestiones que ofrece mayor interés en el estudio de las variables bidimensionales es la de conocer el grado de relación que existe entre ambas variables unidimensionales. En el estudio de esta relación se plantean dos problemas diferentes, aunque relacionados entre sí:  

Estudiar el grado de causas comunes entre ambas, problema denominado correlación Analizar una de las variables, condicionándola a los comportamientos de otra. Este problema recibe el nombre de regresión

Ejemplo





Es el caso de la variable estadística X , Y que mide el peso en Kg. y la estatura en cm. de una persona; una observación de esta variable estadística podría ser

xi , yi  = (80kg, 185cm).

10.

Variable Estadística Bidimensional

Los dos caracteres observados no tienen por qué ser de la misma clase. Se podrían presentar las siguientes situaciones: -

Dos caracteres cualitativos: sexo y color del pelo de una persona. Dos caracteres cuantitativos: peso y estatura de una persona. Uno cualitativo y otro cuantitativo: empleo y años de servicio.

En el caso de caracteres cuantitativos, las variables que representan sus valores podrían clasificarse: -

X discreta, Y discreta: Número de hermanos, número de hijos de una persona. X continua, Y continua: Perímetro craneal y perímetro torácico de una persona. X discreta, Y continua: Número de hijos de una familia, estatura del padre. X continua, Y discreta: Temperatura y pulsaciones.

14/66

http://sites.google.com/site/mat3catorce/

11.

Diagrama de dispersión. Nube de puntos

La representación sobre unos ejes cartesianos de los distintos valores de la variable  X , Y  se denomina diagrama de dispersión. La forma que adquieren los datos representados se conoce como nube de puntos. Ejemplo El siguiente ejemplo muestra los valores de la variable estadística bidimensional (X, Y) y su diagrama de dispersión. X recoge el valor de la nota en Física e Y el valor de la nota en Matemáticas.

X: Física

Y: Matemáticas

5 10

Y Física

9; 10

6; 8 6; 7

8; 8 8; 7 8; 6

6 3; 5 3; 4

4 2

2; 2

4; 5

5; 5

7; 5

3; 2

0 0

X Matemáticas

Ejemplo

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

89 86 72 62 45 82 80 86 62 45 87 85 75 76 72 42 85 84

300 270 260 230 190 260 266 267 245 160 310 290 280 296 250 200 300 293

Renta

Sean los valores de la variable estadística bidimensional (X, Y) y su diagrama de dispersión. X recoge el valor de la Esperanza de vida en años e Y la renta en unidades monetarias de una muestra de 18 países.

100 90 80 70 60 50 40 30 20 10 0 150

Esperanza de vida / Renta

200

250

300

350

Esperanza de vida

15/66

http://sites.google.com/site/mat3catorce/

12.

Tablas de doble entrada

Dada una variable estadística bidimensional  X , Y  , se considera el número de modalidades distintas que adopta el carácter X y el número de modalidades que adopta el carácter Y. Por ejemplo, si X indica si una persona es fumadora o no e Y el sexo, tendremos que X tendrá dos modalidades (fuma o no fuma) e Y otras dos (hombre o mujer). El caso general vendría determinado cuando X e Y tenga las siguientes modalidades distintas:

x1 , x2 ,..., xk  y1 , y 2 ,..., y n  

Se define f ij o frecuencia absoluta, al número de veces que se repite la modalidad xi , yi  de la variable estadística  X , Y 



Se define frecuencia relativa frij como:

fij frij  n Donde n es el número de individuos objeto de estudio. La tabla de doble entrada recogerá las frecuencias absolutas de cada modalidad xi , y j , es decir, el número de veces que aparece esta combinación.





La tabla de doble entrada adopta la siguiente forma: Y

f 11

f 21

f i1

f nj

f 12

f 22

fi2

f n2

f1 j

f2 j

fij

f nj

f1m

f 2m

f im

f nm





Donde fij es la frecuencia absoluta, las veces que se repite la modalidad xi , y j en la muestra o población a estudiar. 16/66

http://sites.google.com/site/mat3catorce/





Ejemplo En el ejemplo de la variable X , Y , donde X indica si una persona es fumadora o no e Y el sexo, se han recogido los datos de 10 pacientes: La tabla de doble entrada:

Paciente 1 2 3 4 5 6 7 8 9 10

13.

X SI SI NO SI SI NO SI NO SI NO

X ,Y 

Y HOMBRE HOMBRE HOMBRE MUJER MUJER MUJER MUJER HOMBRE MUJER HOMBRE

SI NO

HOMBRE 2 3

Medidas Marginales

Dada una variable estadística bidimensional  X , Y  que toma los valores: (x1, y1), (x2, y2), (x3, y3), …, (xn, yn) Los datos asociados a cada variable se llaman datos marginales. x1, x2… xn-1, xn son los datos marginales de la variable X y1, y2… yn-1, yn son los datos marginales de la variable Y

La media aritmética marginal de X e Y respectivamente, es: n

x

x i 1

n n

y

y i 1

Se denomina centro medio o centro de gravedad al punto:

x, y  17/66

MUJER 4 1

http://sites.google.com/site/mat3catorce/

La varianza marginal de X e Y respectivamente, es:

 x n

 x2 

i 1

x



 y n

y  2

i 1

y



La desviación típica marginal de X e Y es:

 x  x 

x 

i 1

 y

y 

i 1



y

Ejemplo En una clase con 30 alumnos se ha hecho un estudio sobre el número de horas diarias de estudio X y el número de suspensos Y, obteniéndose los siguientes resultados representados: (2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1), (4, 0), (0, 4), (2, 2), (2, 1), (2, 1), (4, 0), (3, 1), (2, 4), (2, 1), (1, 2), (2, 1), (2, 0), (3, 0), (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4) X/Y 0 1 2 3 4 Totales 0 0 0 2 1 2 5 1 0 0 8 2 0 10 2 0 2 5 1 0 8 3 0 2 0 0 0 2 4 1 1 1 0 0 3 5 2 0 0 0 0 2 Totales 3 5 16 4 2 30 Tabla de distribuciones marginales: Y 0 1 2 3 4 5

f 5 10 8 2 3 2

X 0 1 2 3 4

f 3 5 16 4 2

Medidas marginales: Media aritmética marginal de X

18/66

http://sites.google.com/site/mat3catorce/

x

fx

i i

i 1

3·0  5·1  16·2  4·3  2·4  1.9 30



Media aritmética marginal de Y k

y

fy i

i 1



5·0  10·1  8·2  2·3  3·4  2·5  1.8 30

Varianza marginal de Y k

 y2 



f i  yi  y 

 n 5·(0  1.8) 2  10·(1  1.8) 2  8·(2  1.8) 2  2·(3  1.8) 2  3·(4  1.8) 2  2·(5  1.8) 2   2.0266 30 i 1

De igual manera se calcula la Varianza marginal de X k

x  2

14.

 f x  x  i 1

 0.956

Covarianza

Uno de los objetivos del análisis estadístico bidimensional es detectar la relación que pudiera existir entre cada una de las variables. Se tratará de medir la intensidad y el sentido de la relación. Si existe relación estadística diremos que las variables están correlacionadas o que hay correlación entre ellas. Esto permitirá, entre otras cosas, estimar una variable a partir de otra. Existe correlación directa cuando el aumento de una variable implica un aumento de la otra. Existe correlación inversa cuando el aumento de una variable implica una disminución de la otra variable.

La Covarianza es la medida que permite saber el sentido de la correlación. Se define como:

 x  x y  y  n

 xy 

i 1

n 19/66

http://sites.google.com/site/mat3catorce/

Si la covarianza es positiva la correlación es directa; si la covarianza es negativa la correlación es inversa. La covarianza también puede representarse como S xy o COV  X , Y  Si la información estadística viene dada en función de las frecuencias, la covarianza se expresa como:

 f x k

 xy 

i 1, j 1



 x yj  y



Para una mayor facilidad de cálculo, se puede usar la expresión equivalente: k

 xy  15.

f

i 1, j 1

xi y j

 x·y

Coeficiente de Correlación Lineal

El Coeficiente de Correlación Lineal mide también la correlación entre las variables pero evita el efecto de escala de las variables X e Y. Se define como:

 xy r  x y A “r” también se denomina Coeficiente de Correlación Lineal de Pearson Propiedades del coeficiente de correlación lineal r :     

1  r  1 r próximo a +1 indica que hay una alta correlación lineal directa. r próximo a -1 indica que hay una alta correlación lineal inversa. r próximo a 0 indica que la correlación lineal es débil. r  1 o r  1 indica que la correlación lineal es perfecta para los datos analizados. La nube de puntos cae exactamente sobre la recta.

20/66

http://sites.google.com/site/mat3catorce/

Ejemplo Una empresa dedicada a la elaboración y venta de ropa ha realizado los gastos en publicidad y ha obtenido las ventas que figuran en la siguiente tabla. Los datos vienen expresados en miles de euros y se refieren a los últimos 10 años. Hallar el coeficiente de correlación lineal r: Publicidad Ventas 7,5 200 8 205 8,5 230 10 240 10,5 250 12 270 13 280 14 300 15 310 18 325 Nube de puntos: 400 350 Ventas

300 250 200 150 100 5

Se muestra a continuación la tabla que facilita los cálculos estadísticos:

totales

Publicidad 7,5 8 8,5 10 10,5 12 13 14 15 18 116,5

Ventas 200 205 230 240 250 270 280 300 310 325 2610

56,25 64 72,25 100 110,25 144 169 196 225 324 1460,75

40000 42025 52900 57600 62500 72900 78400 90000 96100 105625 698050

x·y 1500 1640 1955 2400 2625 3240 3640 4200 4650 5850 31700

Para determinar de correlación lineal r, necesitamos conocer las medias marginales, varianzas marginales y covarianza. Medias aritméticas marginales: n

x

x i 1



116.5  11.65 10

y

y i 1



2610  261 10

21/66

http://sites.google.com/site/mat3catorce/

Varianzas marginales:

 x n

x  2

i 1

x



 y n

y  2

  x  n

i 1

y

i 1

  y  n



x  2

i 1

1460.75  11.65 2  10.36 10

y 

698050  2612  1684.2816 10

Desviaciones típicas marginales:

 x   x 2  10.36  3.22  y   y 2  1684.2816  41.04 Covarianza: k

 xy 

f

i 1, j 1

xi y j  x·y 

31700  11.65·261  129.35 10

Coeficiente de correlación lineal:

r

 xy 129.35   0.98  x y 3.22·41.04

El grado de dependencia ente la variable X, gasto en publicidad e Y, ventas, es muy alto, están directamente relacionadas.

16.

Coeficiente de Determinación

Se define el Coeficiente de Determinación como:

  xy  2  r      x y

El coeficiente de determinación es siempre mayor o igual que 0 y menor o igual que 1.

0  r2 1 Ejemplo el coeficiente de determinación del Ejemplo 7.1 es:

  xy r     x y 2

   0.982  0.9604  

22/66

http://sites.google.com/site/mat3catorce/

17.

Recta de Regresión de Y sobre X

En el supuesto de que sea una recta la función más parecida a la forma de la nube de puntos, estaremos ante un problema de regresión lineal y estaremos ante dos casos:  

Recta de Regresión de Y sobre X Recta de Regresión de X sobre Y

En el primer caso obtendremos valores aproximados de Y conocidos los de la X. En el segundo, obtendremos valores aproximados de la X conocidos los de la Y. Por tanto, la recta de regresión permite estimar una variable a partir de otra. Conviene recordar la ecuación de una recta en el plano: y  a·x  b , donde a es la pendiente de la recta y b es el punto de corte en el eje de ordenadas o eje Y.

y=a·x+b X

Si la variable independiente es X, y la dependiente Y, se define la recta de regresión de Y/X como:

y y

 xy xx 2 x





Propiedades de la recta de regresión: 

 

 La recta de regresión pasa por el punto: x, y Pendiente de la recta. La pendiente tiene el mismo signo que el coeficiente de correlación lineal.

 xy  x2

23/66

http://sites.google.com/site/mat3catorce/

Ejemplo La recta de regresión Y/X del Ejemplo 7.1 tiene por ecuación:

yy

 xy x

.35 x  x  y  261  129 x  11.65  y  12.49·x  115.44 3.22 2

Por ejemplo, si x=25 mil euros, sustituyendo en la ecuación anterior y operando, obtenemos una estimación de ventas de y=427.69 mil euros

18.

Coeficiente de regresión de la recta Y/X

Se define el coeficiente de regresión de la recta Y/X como

Coef. de Regresión 

 xy

 x2

El coeficiente de regresión coincide con la pendiente de la recta de regresión.   

Si el coeficiente de regresión es mayor que 0, la recta es creciente. Si el coeficiente de regresión es menor que 0, la recta es decreciente. Si el coeficiente de regresión es igual que 0 la recta es horizontal.

Ejemplo el coeficiente de regresión de la recta Y/X del Ejemplo 7.1 es:

Coef. de Regresión 

19.

 xy

 x2

 12.49

Recta de Regresión de X sobre Y

Si la variable independiente es Y, y la dependiente X, se define la recta de regresión de X/Y como:

xx

 xy y  y  y2

24/66

http://sites.google.com/site/mat3catorce/

20.

Coeficiente de regresión de la recta X/Y

Se define el coeficiente de regresión de la recta X/Y como

Coef. de Regresión 

  

 xy

 y2

 

Observación: las dos rectas de regresión se cortan en el punto x, y

Ejemplo La siguiente tabla muestra la temperatura media en grados centígrados, y la precipitación en 3 mm tomadas en el Observatorio de Sierra Nevada durante un año.

 X , Y  Será la variable aleatoria bidimensional donde X: Temperatura ºC Y: Precipitaciones mm3 Temperatura Precipitación Diciembre Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre

x i ·y i

-3.65

152.4

-556.26

13.3225

23225.76

-2.45

117.7

-288.365

6.0025

13853.29

-2.35

110.6

-259.91

5.5225

12232.36

-1.7

115.5

-196.35

2.89

13340.25

-0.5

78.4

-39.2

0.25

6146.56

6.15

74.7

459.405

37.8225

5580.09

9.6

31.7

304.32

92.16

1004.89

13.55

3.4

46.07

183.6025

11.56

13.05

5.3

69.165

170.3025

28.09

7.6

61.7

468.92

57.76

3806.89

3.85

105.4

405.79

14.8225

11109.16

Noviembre

-0.2

124.4

-24.88

0.04

15475.36

totales

42.95

981.2

388.705

584.4975

105814.26

Diagrama de dispersión y la nube de puntos:

25/66

http://sites.google.com/site/mat3catorce/

Precipitaciones

180 160 140 120 100 80 60 40 20 0 -5

Temperatura

Precipitaciones

180 160 140 120 100 80 60 40 20 0 -5

Temperatura

Observando la nube de puntos y su tendencia, se detecta una relación inversa entre temperatura y precipitaciones. - Medias aritméticas marginales: N

x

x

i 1

 3.57916667

y

y i 1

 81.7666667

Covarianza: N

 xy   xy 

 x  x  y i 1

 y 

1 N

 x  y   x  y  i 1

1  388.705 - 3.57916667  81.7666667   -260.26444 12

26/66

http://sites.google.com/site/mat3catorce/

Varianzas marginales:

 x

x  2

i 1

y 



 y i 1

1 N

x i 1

2 i

 x  35.897691 2

 x

 y

 2132.06722

- Coeficiente de Correlación lineal:

r

 xy - 260.264444   -0.9407649  x y 35.897691 2132.06722

El coeficiente de correlación lineal r=-0.9407 próximo a -1, indica una alta correlación inversa entre las variables X, Y. - Coeficiente de Determinación: 2

   2 r   xy   - 0.9407649  0.885038     x y 2

- Coeficiente de Regresión de Y sobre X =

- Coeficiente de Regresión de X sobre Y=

 xy 

2 x



- 260.264444  7.2501 35.897691

 xy - 260.264444   0.12207  y2 2132.06722

- Recta de regresión de Y sobre X

y y 

 xy x  x   x2

y  81.7666667 

- 260.264444 x  3.57916667  35.897691

y  7.2501·x  107.716241

27/66

http://sites.google.com/site/mat3catorce/

160 140 120 100 80 60 40 20 0 -5

y  -7.25  x  107.72 - Recta de regresión de X sobre Y

xx 

 xy y  y  y2

x  -0.12207141·y  13.5605387

180 160 140 120

100 80 60 40 20 0 -5.970886364

28/66

13.56053867

http://sites.google.com/site/mat3catorce/

Resumen de los cálculos estadísticos: media x media y varianza x varianza y desviación típica x desviación típica y covarianza coeficiente de correlación lineal coeficiente de determinación coeficiente regresión Y/X coeficiente regresión X/Y pendiente Y/X pendiente X/Y punto de corte ordenadas Y/X punto de corte ordenadas Y/X

21.

3.579166667 81.76666667 35.89769097 2132.067222 5.991468182 46.17431345 -260.2644444 -0.94076497 0.885038729 -7.250172292 -0.122071406 -7.250172292 -0.122071406 107.7162417 13.56053867

Experimentos aleatorios. Sucesos aleatorios

Un experimento se llama aleatorio cuando el resultado no puede predecirse con certeza.

Ejemplo El lanzamiento de una moneda es un experimento aleatorio. No sabemos con certeza si saldrá cara o cruz.

Al conjunto de todos los resultados que pueden obtenerse al realizar un experimento aleatorio se le llama espacio muestral. Se suele representar por E o  . Cada subconjunto del espacio muestral se denomina suceso.

Ejemplo En el lanzamiento de una moneda el espacio muestral consta de solo dos elementos <<cara>> y <<cruz>>.

Algunos tipos de sucesos son:

29/66

http://sites.google.com/site/mat3catorce/

Un suceso se denomina elemental cuando consta de un solo elemento. Sucesos compuestos: son los formados por varios sucesos elementales. Suceso seguro es aquel que se verifica siempre. Suceso imposible es aquel que no puede verificarse. Suceso Unión de dos sucesos A y B es el suceso que se realiza cuando lo hace A o B Suceso Intersección: de dos sucesos A y B es el suceso que se realiza cuando lo hacen A y B Suceso Contrario de un suceso A es el suceso que se verifica cuando no se verifica A. Se representa por A

Ejemplo Un experimento consiste en extraer una carta de la baraja española de 40 naipes. Si el fenómeno que queremos observar es la carta que ha salido, el espacio muestral será <<as de oros>>, <<dos de oros>>,…<<rey de bastos>>. El suceso <<tres de espadas>> es elemental. El suceso <<oros>> no es elemental ya que está formado por 10 sucesos elementales, <<as de oros>>, <<dos de oros>>,…<<rey de oros>>. Extraer una carta de las 40 es un suceso seguro. Extraer as de copas y as de oros a la vez es un suceso imposible. Ejemplo En el experimento consistente en lanzar un dado, es un suceso elemental A=<<obtener un 6>>; sin embargo, es un suceso compuesto B=<<obtener cifra par>> o C=<<obtener múltiplo de 3>>. El suceso D=<<obtener par e impar>> es un suceso imposible.

Dos sucesos A y B son iguales, A=B, si y solo si A  B y B  A

30/66

http://sites.google.com/site/mat3catorce/

22.

Operaciones con sucesos

Se denomina E al espacio muestral. Definición: Unión de dos sucesos A y B, es el suceso formado por todos los sucesos elementales contenidos en A, B o ambos simultáneamente. Se representa por:

A B Definición: Intersección de dos sucesos A y B, es el suceso formado por todos los sucesos elementales comunes ambos sucesos. Se representa por:

A B Dos sucesos A y B son incompatibles si su intersección es el conjunto vacío (A  B= ) Definición: Complementario o Contrario del suceso A es el suceso que está formado por todos los sucesos elementales que no están en A. Se representa por:

Ac o A Definición: Diferencia de los sucesos A y B es el suceso formado por los sucesos elementales que están contenidos en A, pero que no lo están en B. Se representa por:

A B  A B Definición: Diferencia Simétrica de dos sucesos está formada por los sucesos elementales que pertenecen a algunos de los dos sucesos, exceptuando los comunes. Se representa por:

AB   A  B    A  B 

31/66

http://sites.google.com/site/mat3catorce/

Unión

A  B es el suceso formado por todos los elementos de A y todos los elementos de B.

Intersección

A  B es el suceso formado por todos los elementos que son, a la vez, de A y de B.

Diferencia

A  B es el suceso formado por todos los

Suceso contrario

El suceso AC  E  A se llama suceso contrario de A.

elementos de A que no son de B.

Propiedades:

Conmutativa Asociativa Idempotente Simplificación Distributiva Elemento neutro Absorción

Unión

Intersección

A B  B  A A  B  C    A  B  C A A  A A  B  A  A

A B  B  A A  B  C    A  B  C A A  A A  B  A  A

A  B  C    A  B   A  C  A  A A E  E

Además:

A   A  AC  E Siendo E el espacio muestral.

32/66

A  B  C    A  B   A  C  A E  A A  

http://sites.google.com/site/mat3catorce/

22.1.

Leyes de Morgan

( A  B ) c  Ac  B c ( A  B)c  Ac  Bc Ejemplo

Sea el conjunto A formado por los elementos E1, E4, E6 Sea el conjunto B formado por los elementos E3, E4, E5, E6, E7

A  B  E1, E3, E 4, E5, E 6, E 7 A  B  E 4, E 6

AC  E 2, E3, E 4, E5, E 6, E 7, E8 B C  E1, E 2, E8

A  B  A  B C  E1 B  A  B  AC  E3, E5, E 6 ( A  B) c  Ac  B c  E 2, E8

( A  B) c  Ac  B c  E1, E 2, E3, E5, E7, E8

23.

Concepto de Probabilidad

La probabilidad es una medida de la aleatoriedad. Representa una medida de las oportunidades que tiene un suceso de ocurrir. 33/66

http://sites.google.com/site/mat3catorce/

Regla de Laplace: <<La probabilidad de un suceso A se obtiene dividiendo el número de casos favorables al A entre el número de casos posibles>> La regla de Laplace se aplica siempre si se supone que cada caso tiene igual probabilidad de ocurrir.

Número de casos favorables P( A) 

Número de casos posibles

Ejemplo La probabilidad de obtener un 5 al lanzar un dado es 1/6. La probabilidad de sacar un rey de la baraja española es 4/40. La probabilidad de tener el número premiado de la Lotería 1/100.000 suponiendo que los números que se juegan son el 0 al 99.999 La probabilidad de acertar la lotería primitiva, haciendo una única apuesta es

1  49    6

Desde un punto de vista estadístico, si un experimento se repite n veces bajo las mismas condiciones y el suceso A ha ocurrido n A veces, se define la probabilidad de

A como el límite de

nA , según n se hace cada vez mayor. n

Ejemplo: Supóngase, que en una serie muy larga de repeticiones de la experiencia <<lanzar una moneda truncada>>, se ha constatado que el 70% de las veces aparece cara. En la práctica se toma 0.7 como la probabilidad del suceso <<en un lanzamiento resulta cara>>

34/66

http://sites.google.com/site/mat3catorce/

24.

Definición axiomática de Probabilidad

Definición:

Sea E el conjunto de resultados posibles (espacio muestral) de un experimento aleatorio. Se llama función de probabilidad a cualquier función de P(E ) en R que asigna a cada suceso A un número real P( A) que cumple:

0  P A  1

II.

P( E )  1

III.

P( A  B)  P( A)  P( B)  P( A  B)

Propiedades: 

P( A)  P( Ac )  1



A1, A2, A3,…, An sucesos incompatibles.

Si A  A1  A 2  A 3  ...  A n P( A)  P( A1 )  P( A2 )  P( A3 )  ...  P( An ) 

Si A y B son dos sucesos incompatibles, esto es P( A  B)  0 , entonces:

P( A  B)  P( A)  P( B)  P( A  B) 

La probabilidad de un suceso imposible es 0, P()  0

Ejemplo Analice el experimento consistente observar el valor de un dado.

P(dado=1)=1/6 , P(dado=2)=1/6, P(dado=3)=1/6 , P(dado=4)=1/6 , P(dado=5)=1/6 , P(dado=6)=1/6 P(E)=P(sacar un número al tirar un dado)=1 Sea A sacar un número par y B sacar 5. Como A y B son incompatibles P(AUB)= P(A)+ P(B)=3/6+1/6=4/6=2/3 Sea A sacar “1”, “2”, “5”. c

P(A)+P(A )=P(“1”, “2”, “5”)+ P(“3”, “4”, “6”)=3/6+3/6=1 Sea A sacar un número par y B sacar un número divisible por 3. A={2, 4, 6} y B={3, 6}.

P( A  B)  P( A)  P( B)  P( A  B) 

3 2 1 4 2     6 6 6 6 3 35/66

http://sites.google.com/site/mat3catorce/

Probabilidad de no sacar 5. Sea A={1, 2, 3, 4, 6} y A ={5}. Como P(A)+P(A )=1 se puede despejar P(A), P(A)=1c

P(A )=1-(1/6)=5/6 Probabilidad de sacar más de 3. A={4, 5, 6}; P(A)=3/6=1/2

Ejemplo De una baraja de 40 cartas se extrae una carta ¿cuál es la probabilidad de extraer oros o figuras? Sea el suceso A=<<la carta obtenida es oros>>,

P( A) 

1 4

3 10 El suceso <<la carta obtenida es oros o figura >> corresponde a A  B Sea el suceso B=<<la carta obtenida es una figura>>,

P( B ) 

El suceso <<la carta obtenida es oros y figura >> corresponde a

A  B y P A  B  

3 40

P A  B   P A  PB   P A  B  

1 3 3 19    4 10 40 40 Si A es un suceso cualquiera y A es su contrario, PA  1  P A Entonces

Ejemplo Sea el suceso

A =<<la carta obtenida es oros de una baraja de 40 cartas>>

1 . La probabilidad del suceso A =<<la carta obtenida NO es oros de una baraja de 4 1 3 40 cartas>> es P( A)  1   4 4 P( A) 

25.

Probabilidad condicionada

Definición:

La Probabilidad Condicionada se define como la probabilidad de que aparezca un suceso A sabiendo que ya se ha presentado el suceso B. Que se haya presentado el suceso B nos da una información a la hora de calcular la probabilidad de A. La probabilidad condicionada se expresa:

P( A  B) P( A / B)  P( B)

36/66

http://sites.google.com/site/mat3catorce/

Ejemplo: El experimento consistente observar el valor de un dado. Sea A: el resultado es menor que 4. y A={1, 2, 3}. P(A)=3/6 Sea B: sacar un número par, B={2, 4, 6} P(B)=3/6 ¿Cuál es la probabilidad de sacar un número menor que 4 sabiendo que el resultado ha sido par? Se pregunta por la probabilidad condicionada, donde la información que sabemos, el suceso A, nos dice que el resultado es par.

1 P( A  B) P({2}) 1 P( A / B)   6 P( B) P({2,4,6}) 3 3 6

26.

Independencia de Sucesos

Definición: Dos sucesos A y B son independientes si y solo si P( A / B)  P( A)

Como consecuencia se verifica:

P( A  B)  P( A)  P( B) Si A1, A2, A3,…, An son independientes, entonces:

P( A1  A2  A3 ...  An )  P( A1 )  P( A2 )  P( A3 )...  P( An ) Ejemplo Se considera el experimento de lanzar dos monedas. El espacio muestral es: E={(CC), (CX), (XC), (XX)} Sean los sucesos A={(CX), (XC)} y B={(CX), (XX)} P(A)=1/2 Y P(B)=1/2. Luego los sucesos A y B son independientes.

P( A  B)  P((C, F ))  1 / 4  P( A)  P( B)

37/66

http://sites.google.com/site/mat3catorce/

Ejemplo En la lotería nacional se extraen 5 bolas numeradas del 0 al 9 de 5 bombos. El sacar bolas de distintos bombos da idea de la independencia de estos sucesos, ya que en nada afecta lo que salga en un bombo a la hora de extraer otra bola de otro bombo. La probabilidad de que salga el número 00000 es 1/100000, un caso favorable entre 100000 números posibles. Por otra parte, la probabilidad de que salga el número 00000 es la probabilidad de que salga el 0 en el bombo 1, 0, en el bombo 2… 0 en el bombo 5 P(“0” U “0” U “0” U “0” U 5 5 P(“0”)=(P(“0”)) =(1/10) =1/100.000

“0”

P(“0”)

Ejemplo: La probabilidad de que un hombre y una mujer vivan dentro de 25 años son 0.8 y 0.85 respectivamente. Hallar la probabilidad de que dentro de 25 años: a) b) c) d)

Vivan los dos Viva uno de los dos Ninguno viva Viva solo la mujer c

Sea H y M los sucesos de que hombre y mujer vivan dentro de 25 años, y H y M los sucesos de que no vivan dentro de 25 años. Por tanto: c

P(H)=0.8, P(M)=0.85, P(H )=0.20, P(M )=0.15 Por el contexto del problema, los sucesos H y M son independientes. (a)

P(H  M)= P(H) P(M)=0.8·0.85=0.68

(b)

P(H

 M)= P(H) +P(M)- P(H  M)=0.80+0.85-0.68=0.97 c c c P(H  M )= P(H ) P(M )=0.2·0.15=0.03 c c P(H  M)= P(H ) P(M)= 0.2·0.85=0.17 c

E H 0.12

M 0.68

38/66

0.17

http://sites.google.com/site/mat3catorce/

27.

Probabilidad Total

Teorema de la Probabilidad Total: Si A1, A2, A3,…, An son sucesos incompatibles (disjuntos entre sí) del espacio E, tal que E=A1 U A2 U A3 U,…, U An Entonces la probabilidad de cualquier suceso S  E verifica

P(S )  P( A1 ) P(S / A1 )  P( A2 ) P(S / A2 )  ...  P( An ) P(S / An )

Ejemplo Consideremos un experimento aleatorio y supongamos que su espacio muestral asociado es E. Sean los sucesos A1, A2, A3, A4 una partición de E, cuyas probabilidades se conocen. Sea B un suceso cualquiera del espacio muestra. El siguiente esquema representa esta situación.

El Teorema de la Probabilidad Total indica que la probabilidad de B es :

P( B)  P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 )  P( A3 ) P( B / A3 )  P( A4 ) P( B / A4 ) Obsérvese que también se cumple:

P( B)  P( B  A1 )  P( B  A2 )  P( B  A3 )  P( B  A4 ) Ya que:

P( B  A1 )  P( A1 ) P( B / A1 ) P( B  A2 )  P( A2 ) P( B / A2 ) P( B  A3 )  P( A3 ) P( B / A3 ) P( B  A4 )  P( A4 ) P( B / A4 )

39/66

http://sites.google.com/site/mat3catorce/

Ejemplo En una ciudad el 55% de la población en edad laboral son hombres, un 15% está en paro. Entre las mujeres el paro es del 25%.Si en una ciudad se elige al azar una persona en edad laboral ¿cuál es la probabilidad de que esté en paro? Sean los sucesos H= hombre activo, M= mujer activa, P= parado. Los sucesos H: Hombre, M: Mujer son incompatibles y su unión es el espacio muestral E, población en edad laboral. Si elegimos una persona en edad laboral, la probabilidad de que esté en paro resulta ser, aplicando el teorema de la probabilidad total: P(P)=P(H)P(P/H)+ P(M)P(P/M) P(H)=55/100 “probabilidad de ser hombre en edad laboral” P(M)=45/100 “probabilidad de ser mujer en edad laboral” P(P/H)=15/100 “probabilidad de estar parado siendo hombre” P(P/H)=25/100 “probabilidad de estar parado siendo mujer” Sustituyendo en la expresión de la probabilidad total: P(P)=P(H)P(P/H)+ P(M)P(P/M)=(55/100)(15/100)+(45/100)(25/100)=0.195. 19.55% de probabilidad de estar en paro la persona elegida al azar.

40/66

http://sites.google.com/site/mat3catorce/

28.

Teorema de Bayes

Teorema de Bayes: Si A1, A2, A3,…, An son sucesos incompatibles (Ai  Aj=  si i≠j) del espacio E, tal que n

E=A1 U A2 U A3 U,…, U An=

A

i 1

Entonces la probabilidad de que ocurrido el suceso S, la causa sea el suceso Ai es

P( Ai / S ) 

P( Ai ) P( S / Ai ) n

 P( A ) P( S / A ) i 1

P( Ai / S ) 



P( Ai ) P( S / Ai ) P( S )

P( Ai ) P( S / Ai ) P( S )  P( A1 ) P( S / A1 )  P( A2 ) P( S / A2 )  ...  P( An ) P( S / An )

Ejemplo Sea el mismo ejemplo anterior, donde se considera un experimento aleatorio y supongamos que su espacio muestral asociado es E. Sean los sucesos A1, A2, A3, A4 una partición de E, cuyas probabilidades se conocen. Sea B un suceso cualquiera del espacio muestra. El siguiente esquema representa esta situación.

El Teorema Bayes permite obtener P( A1 / B) :

P( A1 / B) 

P( A1 ) P( B / A1 ) P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 )  P( A3 ) P( B / A3 )  P( A4 ) P( B / A4 )

41/66

http://sites.google.com/site/mat3catorce/

Ejemplo: Un trabajador debe tomar el tren para ir al trabajo. Si coge el de las 7h la probabilidad de llegar puntual a su trabajo es de 0.9; si lo pierde llega tarde el 40% de las veces. Sabiendo que lo pierde el 20% de las veces, cual es la probabilidad de que: a) Llegue puntual; b) Haya cogido el tren de las 7h sabiendo que ha llegado puntual a su trabajo. c) Haya perdido el tren si ha llegado tarde. Los sucesos posibles son C = coger el tren a las 7h NC = no coger el tren P = llegar puntual T = llegar tarde (a)

Se aplica el teorema de la probabilidad total. “probabilidad de ser puntual” es P(P) P(P)=P(C)P(P/C)+ P(NC)P(P/NC)=0.8·0.9+0.2·0.6=0.84

De aquí se deduce que si no llega puntual es que llega tarde, su complementario, y que P(T)=1-P(P)=0.16 (b)

Teorema de Bayes; P(C/P)

P(C / P) 

P(C ) P( P / C ) P(C ) P( P / C )  P(C ) P( P / C )  P( NC ) P( P / NC ) P( P)

P(C/P)=(0.8·0.9)/0.84=6/7 (c)

Teorema de Bayes; P(NC/T)

P( NC / T ) 

P( NC ) P(T / NC ) P( NC ) P(T / NC )  P( NC ) P(T / NC )  P(C ) P(T / C ) P(T )

P(NC/T)=(0.2·0.4)/0.16=1/2

42/66

http://sites.google.com/site/mat3catorce/

29.

Ejercicios

Ejercicio 1: Describe el espacio muestral asociado a cada uno de los siguientes experimentos aleatorios: a. b. c. d.

Lanzar tres monedas. Lanzar tres dados y anotar la suma de los puntos obtenidos. Extracción de dos bolas de una urna que contiene cuatro bolas blancas y tres negras. El tiempo, con relación a la lluvia, que hará durante tres días consecutivos.

Solución a. Llamando C a obtener cara y X a la obtención de cruz, obtenemos el siguiente espacio muestral: E={(CCC),(CCX),(CXC),(XCC),(CXX),(XCX),(XXC),(XXX)} b. E={3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18} c.

Llamando B a sacar bola blanca y N a sacar bola negra, tenemos: E={BB,BN,NN}

d. Si llamamos L al día lluvioso y N al día sin lluvia, para tres días consecutivos se obtiene el siguiente espacio muestral: E={(LLL),(LLN),(LNL),(NLL),(LNN),(NLN),(NNL),(NNN)} Ejercicio 2: Se considera el sexo de los hijos de las familias de tres hijos. Sea A el suceso el hijo mayor es una hembra, y B el suceso los dos hijos pequeños son varones. ¿Cuáles son los elementos de A y B? Solución: Llamando V a ser varón y H a ser hembra, el espacio muestral está formado por los sucesos elementales: E={(VVV),(VVH),(VHV),(HVV),(VHH),(HVH),(HHV),(HHH)} Y los sucesos A y B son compuestos y están formados por los siguientes sucesos elementales: A={(HHH),(HHV),(HVH),(HVV)} B={(VVV),(HVV)} Ejercicio 3 Tenemos una urna con nueve bolas numeradas del 1 al 9. Realizamos el experimento, que consiste en sacar una bola de la urna, anotar el número y devolverla a la urna. Consideramos los siguientes sucesos: A="salir un número primo" y B="salir un número cuadrado". Responde a las cuestiones siguientes: a. Calcula los sucesos y . b. Los sucesos A y B, ¿son compatibles o incompatibles?. c. Encuentra los sucesos contrarios de A y B.

43/66

http://sites.google.com/site/mat3catorce/

Solución: Los sucesos A y B están formados por los sucesos elementales que pueden verse a continuación: A = {2,3,5,7} B = {1,4,9} A partir de estos conjuntos, tenemos: 1. La unión e intersección de A y B son: = {1,2,3,4,5,7,9} =Ø 2. Al ser

= Ø, los sucesos A y B son incompatibles.

3. El suceso contrario de A es

= {1,4,6,8,9}

El suceso contrario de B es

= {2,3,5,6,7,8}

Ejercicio 4: Se lanzan dos dados equilibrados con seis caras marcadas con los números del 1 al 6. Se pide: a. Halla la probabilidad de que la suma de los valores que aparecen en la cara superior sea múltiplo de tres. b. ¿Cuál es la probabilidad de que los valores obtenidos difieran en una cantidad mayor de dos? Solución: El espacio muestral del experimento es: E = {(1,1); (1,2); (1,3); (1,4); (1,5); (1,6); (2,1); ...; (6,6)} y está formado por 36 sucesos elementales equiprobables. Constituyen el número de casos posibles del experimento. Utilizando la regla de Laplace, calculamos las probabilidades de los sucesos que nos piden: a. Si llamamos A al suceso "obtener una suma múltiplo de 3", los casos favorables al suceso A son: A = {(1,2); (2,1); (1,5); (2,4); (3,3); (4,2); (5,1); (3,6); (4,5); (5,4); (6,3); (6,6)}. Por tanto, P( A ) = 12/36 = 1/3 b. Si llamamos B al suceso "obtener unos valores que se diferencian en una cantidad mayor que dos", los casos favorables al suceso B son: B = {(1,4); (4,1); (1,5); (5,1); (1,6); (6,1); (2,5); (5,2); (2,6); (6,2); (3,6); (6,3)}.

44/66

http://sites.google.com/site/mat3catorce/

Por tanto, P( B ) = 12/36 = 1/3 Ejercicio 5: Si escogemos al azar dos números de teléfono y observamos la última cifra de cada uno, determina las probabilidades siguientes: a. Que las dos cifras sean iguales. b. Que su suma sea 11. c. Que su suma sea mayor que 7 y menor que 13. Solución: El espacio muestral de este experimento está formado por los cien sucesos elementales: 00, 01, 02, 03, 04, 05, 06, 07, 08, 09, 10, 11, ..., 98, 99. Para cada sucesos del enunciado calculamos sus casos favorables, aplicamos la regla de Laplace y obtenemos: a. Los casos favorables son: 00, 11, 22, ..., 99. La probabilidad de que las últimas cifras sean iguales es: P(últimas cifras iguales) = 10/100 = 1/10 = 0.1 b. Los casos favorables a que la suma de las últimas cifras sea 11 son: 29, 38, 47, 56, 65, 74, 83 y 92. Por tanto, P(últimas cifras suman once) = 8/100 = 0.08 c.

Deben contarse los números de dos cifras cuya suma sea 8, 9, 10, 11 y 12. Haciendo un recuento ordenado, se obtienen 43 casos favorables. La probabilidad buscada es: P(últimas cifras suman un valor mayor que 7 y menor que 13) = 43/100 = 0.43

Ejercicio 6: En una caja tenemos 15 bolas blancas, 30 bolas negras y 45 bolas verdes. Si extraemos tres bolas simultáneamente, ¿cuál es la probabilidad de que salga una bola de cada color? Solución: Calcularemos los casos posibles del experimento y los casos favorables al suceso del enunciado para aplicar la regla de Laplace. Los casos posibles son las distintas formas de extraer 3 bolas entre 90. Como el orden no debe tenerse en cuenta, estos casos son:

Los casos favorables son 15 · 30 · 45 = 20 250. Éstas son las formas de agrupar tres bolas de distinto color. La probabilidad pedida es:

45/66

http://sites.google.com/site/mat3catorce/

Ejercicio 7: Se tiran tres dados al mismo tiempo. Encuentra la probabilidad de que: a. La suma de los números aparecidos sea menor que 8. b. La suma de los números sea mayor que 4 y menor que 8.

Solución: Los casos posibles de este experimento son las 216 ternas siguientes: 111, 112, 121, 211, ..., 665, 666. Realizando un recuento ordenado de los casos favorables a los sucesos del enunciado, obtenemos las siguientes probabilidades a y b respectivamente:

Ejercicio 8: Se lanzan dos dados: a. ¿Cuál es la probabilidad de obtener una suma de puntos igual a 7? b. Si la suma de puntos ha sido 7, ¿cuál es la probabilidad de que en alguno de los dados haya salido un tres?

Solución: Sean los sucesos A="la suma de los puntos es 7" y B="en alguno de los dados ha salido un tres". a. Los casos posibles al lanzar dos dados son 36 y los casos favorables al suceso A son los seis siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1). Por tanto, P( A )=6/36=1/6 b. En este caso, el suceso B/A es salir en algún dado 3, si la suma ha sido 7. Observamos que esta situación ocurre en las parejas (3,4) y (4,3). Por tanto, P( B/A )=2/6=1/3 Ejercicio 9: Se consideran dos sucesos, A y B, asociados a un experimento aleatorio con P(A)=0.7; P(B)=0.6; P(

)=0.58.

a. ¿Son independientes A y B? b. Si M

A, ¿cuál es el valor de P(

46/66

http://sites.google.com/site/mat3catorce/

Solución:

a. Para ver si son independientes, comprobaremos si P( A P(

) = P[(A

Por tanto, Por otro lado,

B)c] = 1 - P(A

P(A

B) = 1 - P(

) = 1 -0.58 = 0.42

P( A ) · P( B ) = 0.7 · 0.6 = 0.42

Luego, A y B son independientes, pues

b. M

B ) = P( A ) · P( B )

P( A

B ) = P( A ) · P( B ) = 0.42

. Por tanto,

Ejercicio 10: Una compañía dedicada al transporte público explota tres líneas de una ciudad, de forma que el 60% de los autobuses cubre el servicio de la primero línea, el 30% cubre la segunda y el 10% cubre el servicio de la tercera línea. Se sabe que la probabilidad de que, diariamente, un autobús se averíe es del 2%, 4% y 1%, respectivamente, para cada línea. Determina la probabilidad de que, en un día, un autobús sufra una avería.

Solución: El suceso "sufrir una avería" (Av) puede producirse en las tres líneas, (L1, L2, L3). Según el teorema de la probabilidad total y teniendo en cuenta las probabilidades del diagrama de árbol adjunto, tenemos: P(Av)

P(L1) · P(Av/L1) + P(L2) = 0.6 · 0.02 + 0.3 = 0.012 + 0.012 + 0.001 = 0.025

47/66

· P(Av/L2) + · 0.04 +

P(L3) 0.1

· P(Av/L3) · 0.01

= =

http://sites.google.com/site/mat3catorce/

Ejercicio 11: Una empresa del ramo de la alimentación elabora sus productos en cuatro factorías: F1, F2, F3 y F4. El porcentaje de producción total que se fabrica en cada factoría es del 40%, 30%, 20% y 10%, respectivamente, y además el porcentaje de envasado incorrecto en cada factoría es del 1%, 2%, 7% y 4%. Tomamos un producto de la empresa al azar. ¿Cuál es la probabilidad de que se encuentre defectuosamente envasado? Solución: Llamando M = "el producto está defectuosamente envasado", se tiene que este producto puede proceder de cada una de las cuatro factorías y, por tanto, según el teorema de la probabilidad total y teniendo en cuenta las probabilidades del diagrama de árbol adjunto, tenemos:

P(M) = P(F1) · P(M/F1) + P(F2) · P(M/F2) + P(F3) · P(M/F3) + P(F4) · P(M/F4) = = 0.4 · 0.01 + 0.3 · 0.02 + 0.2 · 0.07 + 0.1 · 0.04 = = 0.004 + 0.006 + 0.014 + 0.004 = 0.028

Ejercicio 12: Una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno en el que dé negativo? p(+|NE) = 0,04 ; p(-|NE) = 0,96 p(-|E) = 0,05 ; p(+|E) = 0,95 p(E) = 0,07 ; p(NE) = 0,93

48/66

http://sites.google.com/site/mat3catorce/

Ejercicio 13: Tres máquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3%, 4% y 5%. a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa. b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido producida por la máquina B. c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza defectuosa?

Solución: Sea D= "la pieza es defectuosa" y N= "la pieza no es defectuosa". La información del problema puede expresarse en el diagrama de árbol adjunto. a. Para calcular la probabilidad de que la pieza elegida sea defectuosa, P(D), por la propiedad de la probabilidad total, P(D) = P(A) · P(D/A) + P(B) · P(D/B) + P(C) · P(D/C) = = 0.45 · 0.03 + 0.30 · 0.04 + 0.25 · 0.05 = 0.038 b. Debemos calcular P(B/D). Por el teorema de Bayes,

Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D) ya calculado. Aplicando el teorema de Bayes, obtenemos:

49/66

http://sites.google.com/site/mat3catorce/

La máquina con mayor probabilidad de haber producido la pieza defectuosa es A

Ejercicio 14: Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1 negra y C con 2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos una bola. Si la bola ha sido roja, ¿cuál es la probabilidad de haber sido extraída de la urna A?

Solución: Llamamos R= "sacar bola roja" y N= "sacar bola negra". En el diagrama de árbol adjunto pueden verse las distintas probabilidades de ocurrencia de los sucesos R o N para cada una de las tres urnas. La probabilidad pedida es P(A/R). Utilizando el teorema de Bayes, tenemos:

50/66

http://sites.google.com/site/mat3catorce/

30.

Introducciรณn a las funciones de Probabilidad

Se tratarรกn en este tema las caracterรญsticas de un distribuciรณn de probabilidad, asignar probabilidades a sucesos mediante una distribuciรณn de probabilidad, interpretar el significado de la esperanza matemรกtica (la media) y la varianza.

31.

Distribuciรณn de Probabilidad Discreta

Cuando se realiza un experimento aleatorio y se hace recuento de las frecuencias se tiene una distribuciรณn de frecuencias. Cuando las frecuencias se sustituyen por las probabilidades teรณricas se tiene una distribuciรณn de probabilidad. La distribuciรณn de probabilidad es un modelo matemรกtico (teรณrico) que trata de explicar los resultados de un experimento aleatorio real. Este modelo permite asignar probabilidades a los distintos sucesos o realizar conjeturas sin necesidad de llevar a cabo el experimento.

51/66

http://sites.google.com/site/mat3catorce/

Ejemplo En la mesa de dados de un casino se han jugado una noche 1000 partidas al juego de azar de lanzar dos dados y apostar a la suma de los resultados. Un observador atento ha anotado el número de veces que se ha producido cada suma, obteniéndose la siguiente distribución de frecuencias: SUMA FRECUENCIAS

2 3 4 5 6 7 8 9 10 29 50 82 100 140 188 132 115 80

11 54

12 30

Teóricamente se pueden calcular las probabilidades de la suma de los dos da dos que son:

P(2)  P(sacar 1 y 1) 

11 1  6 6 36

11 11 2   6 6 6 6 36 11 11 11 3 P(4)  P(sacar 1 y 3 o sacar 3 y 1 o sacar 2 y 2)     6 6 6 6 6 6 36 P(3)  P(sacar 1 y 2 o sacar 2 y 1) 

En la siguiente tabla muestra las probabilidades teóricas y el número aproximado de veces que debería salir cada resultado con las esas probabilidades teóricas SUMA PROBABILIDAD por 1000 partidas

2 1/36 28

3 2/36 56

4 3/36 83

5 4/36 111

6 5/36 139

52/66

7 6/36 166

8 5/36 139

9 4/36 111

10 3/36 83

11 2/36 56

12 1/36 28

http://sites.google.com/site/mat3catorce/

32. Definición de la probabilidad a partir de las frecuencias relativas Este apartado trata de definir la probabilidad a partir de “un número muy grande de observaciones”. A esta probabilidad se la llama a posteriori, pues se establece después de haber realizado el experimento. Si un experimento se ha realizado n veces y en m de ellas se ha verificado el suceso A, decimos que P(A)=m/n

Ejemplo En el ejemplo anterior las frecuencias determinan la probabilidad a posteriori SUMA

FRECUENCIA

100

140

188

132

115

PROBABIDAD A POSTERIORI

29/100 0

50/10 00

82/10 00

100/10 00

10/10 00

188/10 00

132/10 00

115/10 00

80/10 00

54/10 00

30/10 00

Ejemplo Si de 500 personas consultadas, oyen la radio 325, podemos decir que la probabilidad de oír la radio es 325/500 (un 65% ya que (325/500)·100=0.65)

33.

Variable aleatoria discreta

Definición:

Variable aleatoria es una función que toma valores de acuerdo con un experimento aleatorio

Ejemplo En el lanzamiento de dos dados donde se observa la suma de los puntos obtenidos, la variable aleatoria S=<<suma de sus resultados>> puede tomar los valores 2, 3, 4, 5, 6,…,12.

Definición:

Una variable aleatoria es discreta si puede tomar un conjunto finito de valores o un conjunto numerable de valores.

53/66

http://sites.google.com/site/mat3catorce/

Si X es una variable aleatoria discreta que puede tomar los valores x1, x2, x3, …, xn las probabilidades respectivas serán:

P( X  x1 ), P( X  x2 ), P( X  x3 ), ..., P( X  xn ) Además, la suma de las probabilidades de estas probabilidades es 1. n

 P( X  x ) P( X  x )  P( X  x i

i 1

)  P( X  x3 )  ...  P( X  xn )  1

Ejemplo Se lanzan dos dados. El espacio muestral de 36 elementos es:

E  {(1,1), (1,2), (1,3)...(6,5), (6,6)} Sea X la variable aleatoria discreta tomar los siguientes valores:

X =<<suma de sus resultados>>, entonces X podrá

X (1,1)  2 X (1,2)  3 X (1,3)  4 ... X (6,5)  11 X (6,6)  12 La probabilidad de obtener un 2 es

P X (1,1)  

La probabilidad de obtener un 3 es

P X (1,2) o X (2,1)  

probabilidad

1 36 2 36

obtener

6 P X (1,6) o X (6,1) o X (5,2) o X (2,5) o X (4,3) o X (3,4)   36

P X  x i 

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

Además:

P( X  2)  P( X  3)  P( X  4)  ...  P( X  10)  P( X  11)  P( X  12)  1 2 3 4 5 6 5 4 3 2 1            1 36 36 36 36 36 36 36 36 36 36 36 54/66

http://sites.google.com/site/mat3catorce/

34. Distribución de Probabilidad. Función de Distribución de una variable aleatoria discreta Definición:

Una función de probabilidad f (x) de una variable aleatoria discreta X es una función tal que:

f ( x )  P  X  xi  Queda determinada si conocemos cuanto vale la probabilidad de la variable aleatoria discreta para cada suceso.

Si P( X  x1 ), P( X  x 2 ), P( X  x3 ), ..., P( X  x n ) entonces f ( x1 )  P( X  x1 ); f ( x 2 )  P( X  x 2 ); f ( x3 )   P( X  x3 );...; f ( x n )  P( X  x n ) La función de probabilidad f (x) toma calores entre 0 y 1.

Ejemplo sea la variable aleatoria discreta tendrá una función de probabilidad:

f  xi 

X =<<suma de sus resultados>>, entonces X

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

Si f (x) es una función de probabilidad, entonces: n

 f (x )  1 i 1

Ejemplo en el ejemplo anterior: n

 f ( x )  36  36  36  36  36  36  36  36  36  36  36  1 i 1

55/66

http://sites.google.com/site/mat3catorce/

Definición:

La Función de Distribución F (x) , de la variable aleatoria discreta X se define:

F ( xi )  P( X  xi )  P( X  x1 )  P( X  x2 ), ...,  P( X  xi ) o F ( xi )  f ( x1 )  f ( x2 ), ...,  f ( xi ) o F ( xi )   f ( xi ) xi  x

La función F (x) mide la probabilidad de que la variable aleatoria tome valores menores o iguales que x.

Ejemplo sea la variable aleatoria discreta X =<<suma de los resultados al lanzar dos dados>>, entonces X tendrá una función de distribución:

F  xi 

1/36

3/36

6/36

10/36

15/36

21/36

26/36

30/36

33/36

35/36

36/36 =1

Ejemplo: Al lanzar cuatro monedas se obtienen los siguientes resultados (variaciones con 4 repetición de 2 elementos cogidos de 4 en 4, 2 =16) E={CCCC, CCCX, CCXC, CXCC, XCCC, CCXX, CXCX, CXXC, XCCX, XCXC, XXCC, CXXX, XCXX, XXCX, XXXC, XXXX} La variable aleatoria C=<<número de caras al lanzar cuatro monedas>> puede tomar los valores 0, 1, 2, 3, 4. La función de distribución de probabilidad y la Función de distribución son:

Distribución de Probabilidad Función de Distribución

Caras=n P(C=n) P(C<=n)

0 1/16 1/16

56/66

1 4/16 5/16

2 6/16 11/16

3 4/16 15/16

4 1/16 16/16=1

http://sites.google.com/site/mat3catorce/

35. Media o Esperanza matemática de una distribución de probabilidad discreta Como sucede con las variables estadísticas, algunos rasgos significativos pueden deducirse conociendo su media y su varianza. Definición: Dada una distribución de probabilidad f(x), se define la media o esperanza matemática de la variable aleatoria X como: n

   xi f ( xi ) i 1

   xi P ( X  xi ) i 1

La esperanza matemática o media, es un valor teórico. Indica el valor promedio que cabría esperar al realizar un experimento aleatorio un gran número de veces.

Ejemplo La media de la variable aleatoria C=<<número de caras al lanzar cuatro monedas>> del ejemplo anterior es:

1 4 6 4 16 0  4  12  12  4  1·  2·  3·  4·  2 16 16 16 16 16 16

  0·

Este valor esperado coincide con el número de caras que intuitivamente cabe esperar por término medio.

36.

Varianza de una distribución de probabilidad discreta

Definición:

La varianza es una medida del grado de concentración de los valores de la variable aleatoria en torno a su media. Se define la Varianza de una variable aleatoria X discreta como:

57/66

http://sites.google.com/site/mat3catorce/

   P( X  xi )( xi   ) 2 2

i 1 n

   f ( xi )( xi   ) 2 2

i 1

Definición:

La Desviación Típica es la raíz cuadrada de la varianza:

  2 Al igual que la varianza de una variable estadística, la varianza de una variable aleatoria discreta se puede expresar también como: n

i 1

 2   f ( xi )( xi   ) 2   f ( xi )( xi ) 2  

Ejemplo La varianza de la variable aleatoria X=<<número de caras al lanzar cuatro monedas>> del ejemplo anterior es:

1 2 4 6 4 16 0  4  24  36  16  1 ·  22·  32·  42·  22   4 1 16 16 16 16 16 16

 2  02·

37.

Distribución Binomial

La Distribución Binomial es una distribución discreta asociada a fenómenos aleatorios con dos únicos resultados posibles que en general se denominarán éxito y fracaso. La distribución Binomial se caracteriza por las siguientes propiedades: - Se realizan n ensayos, cada uno de los cuales tiene dos únicas opciones complementarias que se denominan éxito (E) y fracaso (F). - La probabilidad de éxito es la misma para cada ensayo, P(E)=p. - La probabilidad de fracaso, P(F)=q, es la misma en cada ensayo y su valor es q=1-p. - La variable aleatorias X=<<número de éxitos en n ensayos>> puede tomar valores 1, 2, 3,…, n. Si la variable aleatoria X tiene una distribución binomial, se representa por B(n, p)

58/66

http://sites.google.com/site/mat3catorce/

Ejemplo El experimento aleatorio consistente en lanzar 25 veces una moneda y anotar el número de caras obtenidas corresponde a una distribución binomial B(25, ½); esto es n=25, p=1/2, q=1 (1/2)=1/2.

Si X es una distribución binomial B(n, p), la probabilidad de r éxitos en n repeticiones de experimento viene dado por

 n  r nr P(X  r)    p q r En particular:

n P(X  0)    p 0 q n0  q n 0

;

 n P(X  n)    p n q nn  p n  n

La probabilidad de que el número de éxitos sea menor o igual que r es:

P(X  r)  P(X  0)  P(X  1)  P(X  2)  ...  P(X  r)

r n P(X  r)     p i q n i i 0  i 

La probabilidad de que el número de éxitos sea mayor que r es:

P(X  r)  P(X  r  1)  P(X  r  2)  ...  P(X  n)

59/66

;

P(X  r)  1  P(X  r)

http://sites.google.com/site/mat3catorce/

Ejemplo La probabilidad de que un jugador de baloncesto meta una canasta de 3 puntos es 0.25. Si efectúa nueve lanzamientos de tres puntos ¿Cuál es la probabilidad de que meta dos canastas? La variable aleatoria X=<<número de canastas de tres puntos al lanzar 9 veces>> sigue una distribución Binomial B(9, 0.25).

9 9 9! 9! P(X  2)    p 2 q 92   0.2520.757  0.2520.757  0.2520.757  0.30 2!(9  2)! 2!·7!  2  2 ¿Cuál es la probabilidad de que meta al menos dos canastas?

P(X  2)  P(X  2)  P(X  3)  ...  P(X  9) Es mas corto calcular 9 9 P(X  2)  1 - P(X  2)  1 - P(X  0)  P(X  1)   1   0.2500.759   0.2510.758  0.6996 0 1 ¿Cuál es la probabilidad de que falle seis? Es igual que calcular la probabilidad de que acierte tres canastas.

9 9! 9·8·7·6! P(X  3)   0.2530.756  0.2520.757  0.2530.756  0.2336 3!(9  3)! 3!·6!  3

Ejemplo: En un cierto hospital se comprobó que la aplicación de un determinado tratamiento en enfermos de cirrosis produce una cierta mejoría en el 80 por ciento de los casos. Se aplica el tratamiento a 8 personas, se pide calcular a) Probabilidad de que mejoren 5. Si llamamos M a la variable aleatoria <<Número de personas que mejoran al aplicar el tratamiento a 8 personas>>, la variable sigue una distribución binomial B(8, 0.8)

8 8! P(M  5)   0.80 5 0.20 3  0.80 5 0.20 3  0.1468 5 5 ! ( 8  5 )!   b) Probabilidad de que mejoren al menos 3

8 8 P(X  3)  1 - P(X  3)  1 - P(X  0)  P(X  1)   1   0.80 0 0.208   0.8010.20 7  0.9988  0 1 37.1.

Parámetros de una Distribución Binomial

60/66

http://sites.google.com/site/mat3catorce/

La media de la distribución binomial B(n, p) es:

  n·p La varianza de la distribución binomial B(n, p) es:

 2  n·p·q La desviación típica de la distribución binomial B(n, p) es:

  n·p·q Ejemplo Un examen consta de 100 preguntas con tres respuestas posibles cada una, de las que solo una es cierta. Si se responde al azar, ¿cuál será la media de aciertos? ¿y la varianza? Sea la variable aleatoria X=<<acertar la pregunta>>. La distribución de X es el de una distribución binomial B(100, 1/3), ya que el examen consta de 100 preguntas y la probabilidad de éxito es de 1/3. La media será n·p=100·1/3 y la varianza n·p·q=100·1/3·2/3 Ejemplo En el ejemplo 8.3 ¿Cuál es el número de personas que se espera que mejoren? El número de personas que se espera que mejoren es la media de la variable M, es decir

  n·p  8·0.8  6.4 personas.

Ejemplo En una ciudad se encontró que el 20 por ciento de los hogares estaban asegurados contra incendios. Con objeto de establecer una encuesta en el área, una compañía de seguros selecciona cinco hogares al azar. ¿Cuál es el número de hogares que se espera estén asegurados? Sea A la variable <<estar asegurado al tomar cinco hogares>>, que se distribuye como una Binomial B(5, 0.2). El número de hogares que se espera estén asegurados es la media de A, por tanto es

  n·p  5·0.2  1

38.

Distribución de Probabilidad Continua

Una distribución es continua cuando la variable aleatoria asociada puede tomar como valores todos los números reales en un intervalo de la recta real.

61/66

http://sites.google.com/site/mat3catorce/

En una distribución continua, las probabilidades no nulas se asignan a los intervalos, mientras que la probabilidad de un valor concreto es cero. Por tanto, a diferencia de la variable aleatoria discreta en que a cada valor le hacíamos corresponder una probabilidad, en la variable aleatoria continua es a cada intervalo al que hacemos corresponder una probabilidad. Si una distribución de probabilidad está ligada a una variable aleatoria continua se llama distribución de probabilidad continua.

Ejemplo: La probabilidad de que una persona mida exactamente 178.548564135485 cm. no tiene sentido. Se dice que la probabilidad de elegir a una persona y que mida esa altura es cero. Tiene sentido hablar de cual es la probabilidad de que una persona mide entre 175.5 y 180 cm.

Ejemplo Una carrera popular en la que participan miles de ciudadanos y emplean en el recorrido desde 1 hora hasta 2 horas. La variable aleatoria X=<<duración de la carrera en minutos>> es continua. A la hora de representar una variable aleatoria continua suele usarse tablas con los datos agrupados en intervalos. 0,4 0,35 0,3

39.

frecuencia absoluta

[60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) TOTAL

0.05 0.35 0.3 0.15 0.1 0.05 1

0,25 0,2 0,15 0,1 0,05 0 [60, 70)

[70, 80)

[80, 90)

[90, 100)

[100, 110)

[110, 120)

Función de Densidad

Se tiene definida una función de probabilidad continua cuando se conoce una función f(x). Esta función permite hallar, por medio del cálculo de áreas, las probabilidades en las funciones de distribución continuas. A la función f(x) se la lama Función de Densidad de la variable aleatoria X. Definición:

Dada una variable aleatoria X, para que una función f(x) sea función de densidad de X debe cumplir las siguientes propiedades:

- f(x)  0

-  f(x)dx  1

62/66

http://sites.google.com/site/mat3catorce/

40.

Función de Distribución

Definición:

Dada una variable aleatoria X que toma valores en el intervalo [a, b], se llama función de distribución de X a la función F(x) definida por

F ( x)  P( X  x)

41.

Distribución Normal

Multitud de fenómenos sociales y naturales se asocian se ajustan a esta distribución. La estatura, el peso, el diámetro craneal, el consumo de agua per cápita, el cociente intelectual de los individuos, la distribución de errores en una serie de medidas, etc. son fenómenos que se rigen por una distribución normal. La distribución normal se presenta en poblaciones donde los casos extremos son raros y la mayoría de los valores se agrupan en torno a una media. Los tipos medios son los que aparecen con mayor frecuencia.

La función de densidad de la distribución normal es una función de tipo exponencial

f ( x) 

 2

1  x     2  

Si X sigue una distribución normal, se representa por X ~ N ( ,  ) La representación gráfica de esta función se denomina campana de Gauss. Las características de esta función son: - El dominio de definición es toda la recta real. - f(x) es simétrica respecto de la media. - El máximo de f(x) se alcanza en x - La curva tiene un asíntota horizontal en y=0 cuando x tiende a infinito y a menos infinito. - El área comprendida entre la curva y el eje OX desde menos infinito hasta k es el valor de la probabilidad P(X<=k)

63/66

http://sites.google.com/site/mat3catorce/

Distribución Normal 0.0120 0.0100

El valor de  determina la amplitud

f(x)

0.0080 0.0060 0.0040 0.0020 0.0000 210

270

330

390

450

510

570

f ( x) 

1 e 2 

1  X      2  



   X  ,      ,   0

Características matemáticas

Características estadísticas



 f (x)dx  1



f(x) > 0

para todo x

3) Cuando x =   f `(x) = 0 (má (máximo en  ) Cuando x =  +  ó x =  -   f ``(x) = 0 (dos puntos de inflexió inflexión) 4) Es simétrica alrededor de  5)

lim f ( x )  0

x 

6) Es más o menos amplia según 

64/66

1) Dado que la distribución normal es continua, solamente pueden calcularse probabilidades para intervalos del espacio muestral de X, ya que para culaquier x0, P(X=x0) = 0 2) P(  -  < X <  +  ) = 0.6833 P(  - 2 < X <  + 2 2 ) = 0.9544 P(  - 3 < X <  + 3 3 ) = 0.997

http://sites.google.com/site/mat3catorce/

41.1.

Distribución Normal estándar

La función de densidad de una variable aleatoria normal es complicada y por lo tanto difícil de integrar. Se han tabulado las probabilidades de una clase particular de la familia normal, que se llama Normal Estándar, N(0, 1). Si la variable aleatoria. X tiene distribución N(, ) siempre se puede obtener la forma estandarizada haciendo la transformación:

Z

X 



Y se dice que Z se distribuye N(0,1) o que Z tiene una distribución “normal estandarizada”. Al proceso de hallar Z se le denomina tipificación o normalización de la variable aleatoria X.

Ejemplo Si X sigue una distribución normal de media 15 y varianza 9, esto es entonces, la normalización de X es:

Z

X ~ N (15,3) ,

X  15 3

Ejemplo Sea la variable aleatoria Z que sigue una distribución Normal N(60, 10). Sea conocida la distribución de la N(0, 1) Hallar a probabilidad P( Z  70)

 Z  60 70  60   Z  60 10   Z  60  P( Z  70)  P     P  1  PN (0,1)  1  0.1587   P 10  10   10  10  10 

42.

Distribución Normal como aproximación de una Binomial

Bajo determinadas condiciones (para n grande y tanto p como q no estén próximos a cero) la distribución Binomial B(n, p) se puede aproximar mediante una distribución normal

B(n, p ) ~ N (  ,  )   n· p

  n· p·q B(n, p ) ~ N (n· p, n· p·q

65/66

http://sites.google.com/site/mat3catorce/

Ejemplo Durante cierta epidemia de gripe, enferma el 30% de la población. En un aula con 200 estudiantes, determinar el tipo de distribución y aproximar a una normal B(200, 0.30) que puede aproximarse a una normal



N 200·0.30,

 

200·0.30·(1 - 0.30)  N 200·0.30,

media de la distribución es 60 y la varianza 42.

66/66

 

200·0.30·0.70  N 60, 42

 La