Sesión7

Page 1

Distribuciones Continuas y Teorema del Límite Central Curso PI-2610 Probabilidad y Estadística Marco Alvarado Peña

Sesión 7


Objetivos de Aprendizaje Al finalizar esta sesión el estudiante deberá ser capaz de:

1- Conocer los principales conceptos de Distribuciones Continuas. 2- Seleccionar la distribución que mejor se adecúe el análisis que se requiera. 3- Entender la relación del Teorema del Límite Central y la Distribución Normal. 4- Aplicar las distribuciones de probabilidad continuas según lo planteado en la parte de teoría para cada una de ellas. 5- Visualizar el potencial de utilización de las distribuciones continuas en términos de la aplicabilidad que cada una posea. 6- Resolver problemas cotidianos relacionados con variables aleatorias continuas tanto desde el punto de vista manual como de aplicabilidad de un software estadístico.

2


Índice Distribuciones Continuas y Teorema del Límite Central....... 1 Objetivos de Aprendizaje....................................................... 2 Teorema Central del Límite (TLC)......................................... 5 Distribuciones Continuas...................................................... 6 Distribución Exponencial (Teoría de colas y confiabilidad)... 6 Consideraciones................................................................... 9 Ejemplos............................................................................... 10 Ejemplo de Distribución Exponencial.................................... 11 Distribución Gamma...............................................................12 Distribución normal................................................................ 14 El valor Z – Estandarizar....................................................... 17 Función Densidad y Distribución de Probabilidad................ 22 Figuras importantes.............................................................. 23 Consideraciones..................................................................... 25 Atención................................................................................ 26 Teorema central del límite (TLC)........................................... 27 Prueba de normalidad – Test cuantitativos........................... 28 Distribuciones que se derivan del muestreo....................... 29 Distribución T de Student...................................................... 29 3


Distribuci贸n ji-cuadrada.........................................................31 Distribuci贸n F de Fisher........................................................ 34 Referencias............................................................................. 37

4


Teorema Central del LĂ­mite (TLC) Una de las razones por las que la distribuciĂłn normal es tan importante es debido al TLC que en un caso particular afirma:

Sea x1 , x2..... xn una muestra aleatoria de cualquier poblaciĂłn, y sea x la media muestral; entonces, independientemente de cĂłmo sea la distribuciĂłn de la poblaciĂłn de donde se extrajo la muestra, la distribuciĂłn de x se aproxima a la norma N(Îź,Ďƒ2) conforme n crece. La forma lĂ­mite de la distribuciĂłn de:

đ?‘‹Ě…− đ?œ‡ z= đ?œŽ/ √đ?‘› Conforme n -----> ∞, es la distribuciĂłn normal estĂĄndar N (0,1). - En algunos casos la aproximaciĂłn puede ser buena para n pequeĂąa n < 10. - En otros casos se necesita un n grande, n > 100.

5


- En el caso en que las x tengan la misma distribución y no sea radicalmente diferente a la normal, entonces un n ≥ 4 es suficiente.

El tamaño de muestra n de acuerdo a cada proceso y según conocimiento del mismo puede variar según los tres puntos citados anteriormente.

Distribuciones Continuas Distribución Exponencial (Teoría de colas y confiabilidad) Esta Distribución explica fenómenos de la vida real como por ejemplo líneas de espera, (teoría de colas). Se usa para modelar tiempos de espera para la ocurrencia de un cierto evento en un determinado intervalo de tiempo.

6


−đ?œ†đ?‘Ľ đ?‘“(đ?‘Ľ) = {đ?œ†đ?‘’ , đ?‘?đ?‘Žđ?‘&#x;đ?‘Ž đ?‘Ľ ≼ 0 đ?‘‘đ?‘’ đ?‘œđ?‘Ąđ?‘&#x;đ?‘œ đ?‘šđ?‘œđ?‘‘đ?‘œ 0

đ??š(đ?‘Ľ) = đ?‘ƒ(đ?‘‹ ≤ đ?‘Ľ) = {

0 đ?‘?đ?‘Žđ?‘&#x;đ?‘Ž đ?‘Ľ < 0 1 − đ?‘’ −đ?œ†đ?‘Ľ đ?‘?đ?‘Žđ?‘&#x;đ?‘Ž đ?‘Ľ ≼ 0

E [X] = 1/Îť V (X) = 1/Îť

Para ejemplificar lo anterior se presentan los grĂĄficos a continuaciĂłn:

7


Fig 1. TeorĂ­a de colas y confiabilidad

8


(X ≤ x) = F(x) = 1 − e ↑ −đ?œ†x P (X > x) = 1 − F(x) = 1 − e ↑ − Îťx P (a ≤ X ≤ b) = F(b) − F(a) = (1 − e ↑ − Îťb) − (1 − e ↑ − Îťa)

Consideraciones La distribuciĂłn exponencial es el equivalente continuo de la distribuciĂłn geomĂŠtrica discreta. Esta ley de distribuciĂłn describe procesos en los que:

- Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que: - El tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un instante tf, no depende del tiempo

9


De hecho la distribución exponencial puede derivarse de un proceso experimental de Poisson con las mismas características, pero tomando como variable aleatoria, en este caso, el tiempo que tarda en producirse un hecho.

Ejemplos 1- El tiempo que tarda una partícula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se utiliza en Ciencia para, por ejemplo, la datación de fósiles o cualquier materia orgánica mediante la técnica del carbono14, C14.

2- El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un paciente.

3- En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos sigue un modelo probabilístico exponencial. Por ejemplo, el tiempo que transcurre entre que sufrimos dos veces una herida importante. 10


Ejemplo de Distribución Exponencial Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en aùos estå dado por T. La variable aleatoria T se modela bien mediante la distribución exponencial con tiempo medio para la falla β = 5. Si se instalan cinco de estos componentes en diferentes sistemas, ¿cuål es la probabilidad de que al menos dos aún funcionen al final de ocho aùos?

SoluciĂłn La probabilidad de que un componente dado aĂşn funcione despuĂŠs de ocho aĂąos estĂĄ dada por: P (T > 8) =

1 5

x

âˆŤ8 e-1/5

dt = đ?‘’ −8/5 = 0.2

Como puede observar gracias a la DistribuciĂłn Exponencial se obtiene la probabilidad de ocurrencia bajo ese enfoque y con el dato calculado es como obtener el p de la DistribuciĂłn Binomial y se aplica para la soluciĂłn dicha distribuciĂłn discreta.

11


RepresĂŠntese con X el nĂşmero de componentes que funcionan despuĂŠs de ocho aĂąos. Entonces con el uso de la distribuciĂłn binomial: P (X ≼ 2) = ∑5đ?‘Ľ=2 b(x: 5. 0.2)= 1- ∑5đ?‘Ľ=0 b(x: b. 0.2)= 1- 0.7373 = 0.2627

DistribuciĂłn Gamma Este modelo es una generalizaciĂłn del modelo Exponencial ya que, en ocasiones, se utiliza para modelar variables que describen el tiempo hasta que se produce p veces un determinado suceso. Su funciĂłn de densidad es de la forma:

đ?‘“(đ?‘Ľ) = { 0

1

đ?›źđ?‘?Γ(đ?‘?)

đ?‘Ľ

đ?‘’−đ?›ź đ?‘Ľđ?‘?−1 , đ?‘Ľ > 0 , đ?‘Ľâ‰¤0

Como se puede observar, este modelo depende de dos parĂĄmetros positivos: Îą y p. La funciĂłn Γ(p) es la denominada funciĂłn Gamma de Euler que representa la siguiente integral: ∞

Γ(đ?‘?) = âˆŤ0 đ?‘Ľ đ?‘?−1 đ?‘’ −đ?‘Ľ đ?‘‘đ?‘Ľ 12


Se verifica Γ(đ?‘? + 1) = đ?‘?Γ(đ?‘?), con lo que si, p es un nĂşmero entero positivo, Γ(đ?‘? + 1) = p!

Decimos que una variable aleatoria x, sigue una distribuciĂłn gamma si su “PDFâ€? (la funciĂłn de su distribuciĂłn de probabilidad) es:

�(�; �, � ) =

1 { � � Γ (� )

đ?‘Ľ đ?›źâˆ’1

đ?‘’ −đ?‘Ľđ?›˝ , đ?‘Ľ > 0

0

,

otra manera

Donde tanto đ?›˝ como đ?›ź son positivos: (đ?›˝, đ?›ź ) > 0 Cuando β = 1 a esta distribuciĂłn le llamamos “Gamma EstĂĄndarâ€?:

đ?‘Ľ đ?›źâˆ’1 đ?‘’ −đ?‘Ľ đ?‘“(đ?‘Ľ; đ?›ź, đ?›˝ ) = { Γ(đ?›ź )

,� ≼ 0 0

, otra manera

Valor esperado: E(x) = Îź = Îą β Varianza: V(x) = Ďƒ2 = Îą β2

13


*Caso especial: Cuando ι = 1 la distribución gamma es una exponencial con β=

1 đ?œ†

Con la introducciĂłn de ĂŠstas dos distribuciones de probabilidad continua y que son importantes en el campo de la confiabilidad, se pasa a una de las distribuciones mĂĄs importantes... DistribuciĂłn Normal.

DistribuciĂłn normal - Es una de las mĂĄs importantes en la EstadĂ­stica. - Propuesta por el MatemĂĄtico AlemĂĄn Karl Friedrich Gauss (1777- 1855). - Muchos de los fenĂłmenos del mundo real se comportan bajo esta estructura probabilĂ­stica de comportamiento. - Cuando una variable aleatoria representa a una poblaciĂłn que tiene un comportamiento probabilĂ­stico normal el histograma tiene una forma mĂĄs o menos simĂŠtrica o de campana.

14


Es la distribuciĂłn continua mĂĄs importante, tanto en estadĂ­stica teĂłrica como aplicada. Si X es una variable aleatoria normal, entonces su funciĂłn de distribuciĂłn de probabilidad estĂĄ dada por:

đ?‘“ (đ?‘Ľ ) = {

−đ?‘Ľ

1 đ?œŽâˆš2đ?œ‹

2 1 ) − (đ?‘Ľâˆ’đ?œ‡ đ?œŽ đ?‘’ 2

,

đ?‘Ľâˆˆâ„?

donde Îź (mu) es la media y Ďƒ (sigma) es la desviaciĂłn estĂĄndar (Ďƒ2 es la varianza). Suponga una variable aleatoria X~ N(Îź, Ďƒ2), que presenta un comportamiento normal con media Îź, y variabilidad Ďƒ2, para calcular la probabilidad de que esta variable tome valores entre dos nĂşmeros a y b, entonces se calcula el ĂĄrea bajo la curva entre a y b (mediante mĂŠtodos numĂŠricos ya que la integral de la funciĂłn de distribuciĂłn no tiene soluciĂłn analĂ­tica), tal y como se muestra en la figura seguidamente.

15


Fig 2. Distribución normal

Cuando es un distribución normal con parámetros μ = o y σ2 = 1, entonces a la distribución se le conoce como distribución normal estándar (N(0,1)) y los valores de las probabilidades están ya tabulados en las respectivas tablas que puede consultar en la bibliografía de éste curso.

Estandarizar una variable es fácil, puesto que si X tiene una distribución normal con E(X) = μ y V(X) = σ2, entonces la variable (estandarizada) z se comporta de dicha manera.

16


z=

(đ?‘Ľâˆ’đ?œ‡ ) đ?œŽ

El valor Z – Estandarizar

z=

(đ?‘Ľâˆ’đ?œ‡ ) đ?œŽ

En esta ecuaciĂłn, Îź es la media, Ďƒ es la desviaciĂłn estĂĄndar y x es un valor que nos gustarĂ­a evaluar. - x- Îź esta diferencia calcula que tan lejos se estĂĄ de la media miu. - Cuando se divide por Ďƒ, se estĂĄ calculando cuantas desviaciones estĂĄndar se estĂĄ de la media

17


Zona 1: đ?? Âą đ?&#x;? đ??ˆ 68.26% de los datos se esperan contener dentro de una desviaciĂłn estĂĄndar de la media Zona 2: đ?? Âą đ?&#x;? đ??ˆ 95.46% de los datos se esperan contener dentro de dos desviaciones estĂĄndar de la media Zona 3: đ?? Âą đ?&#x;‘ đ??ˆ 99.73% de los datos se esperan contener dentro de tres desviaciones estĂĄndar

Fig 3. Ă reas bajo la curva de distribuciĂłn

18


Ejemplo El tiempo de entrega de un producto se distribuye normal con media 60,5 y desviaciĂłn estĂĄndar 5,9. Si un tiempo de entrega es de 70, ÂżcuĂĄntas desviaciones estĂĄndar tiene respecto de la media? z= ( z= (

đ?‘Ľâˆ’đ?œ‡ đ?œŽ

)

70−60.5 5.9

)

= 1.61

Si estamos considerando una zona con Îź Âą 3 Ďƒ entonces 1,61 desviaciones estĂĄndar de la media estĂĄ al interno del ĂĄrea de la zona de 3 Ďƒ.

19


Fig 4. Desviaci贸n 1,61

20


¿Cuántas desviaciones estándar tiene el tiempo de 100 respecto de la media?

z= (

100−60.5 5.9

)

= 6.69

Este valor está muy lejos de la zona de aceptación, recuerde que la zona de aceptación está definida por μ ± 3 σ , lo que indica que algún cambio ha ocurrido en las operaciones normales del proceso.

Fig 5. Desviación 6.69

21


FunciĂłn Densidad y DistribuciĂłn de Probabilidad La funciĂłn de densidad de la variable aleatoria normal X, con media Îź y varianza Ďƒ2, es

1 đ?‘›(đ?‘Ľ; đ?œ‡, đ?œŽ) = {√2đ?œ‹đ?œŽ

đ?‘’

1 −(2)[(đ?‘Ľâˆ’đ?œ‡)/đ?œŽ]2

,

−∞ < đ?‘Ľ < ∞,

Donde đ?œ‹ = 3,14159... y e = 2,71828

*Nota: Los errores en las mediciones cientĂ­ficas se aproximan extremadamente bien mediante una distribuciĂłn normal. Una variable Aleatoria continua X que tiene la forma de campana se dice que sigue una DistribuciĂłn Normal.

Fig 6. Densidad y DistribuciĂłn de Probabilidad

22


Figuras importantes

Fig 7. Curvas normales con μ1 < μ2 y σ1 = σ2

Fig 8. Curvas normales con μ1 = μ2 y σ1 < σ2

23


Fig 9. Curvas normales con μ1 < μ2 y σ1 < σ2

24


Consideraciones - La moda, que es el punto sobre el eje horizontal donde la curva es un máximo, ocurre en x = μ

- La curva es simétrica alrededor de un eje vertical a través de la media μ - La curva tiene sus puntos de inflexión en x= μ ± σ, es cóncava hacia abajo si μ – σ < X < μ + σ, y es cóncava hacia arriba en cualquier otro punto

- La curva normal se aproxima al eje horizontal de manera asintótica conforme nos alejamos de la media en cualquier dirección

- El área toral bajo la curva y sobre el eje horizontal es igual a 1

- Es una buena aproximación para la binomial y la hipergeométrica

25


AtenciĂłn La funciĂłn de probabilidad normal depende de Îź y Ďƒ y como estos valores tienen un dominio de Âąâˆž entonces puede existir un nĂşmero infinito de curvas para cada Îź y Ďƒ.

Para evitar esto se ha encontrado una curva normal reducida o estandarizada que tenga un valor medio igual a cero y una varianza igual a 1, de tal manera que cualquier distribuciĂłn normal de Îź y varianza Ďƒ2 se puede convertir o estandarizar a otra distribuciĂłn.

Z=

đ?‘Ľâˆ’đ?œ‡ đ?œŽ

En consecuencia de lo anterior la funciĂłn densidad es: 1

đ?‘“ (đ?‘Ľ ) = {√2đ?œ‹

đ?‘’ −đ?‘Ľ

2 /2

26


Teorema central del lĂ­mite (TLC) Una de las razones por las que la distribuciĂłn normal es tan importante es debido al TLC que en un caso particular afirma: Sea x1, x2, ..., xn una muestra aleatoria de cualquier poblaciĂłn, y sea đ?‘ĽĚ… la media muestral; entonces, independientemente de cĂłmo sea la distribuciĂłn de la poblaciĂłn de donde se extrajo la muestra, la distribuciĂłn de đ?‘ĽĚ… se aproxima a la normal N (Îź,Ďƒ2) conforme n crece. La forma lĂ­mite de la distribuciĂłn de z=

đ?‘‹Ě…− đ?œ‡ đ?œŽ/ √đ?‘›

conforme n-->∞, es la

distribución normal eståndar N(0,1). Como puede apreciar es muy similar a la z estandarizada de la Distribución normal, sin embargo como se estå trabajando con muestras la desviación eståndar debe ser dividido entre raíz de n. - En algunos casos la aproximación puede ser buena para n pequeùa n<10. - En otros casos se necesita un n grande, n>100. - En el caso en que las x tengan la misma distribución y no sea radicalmente diferente a la normal, entonces un n≼4 es suficiente 27


El p-value es la significancia de la

Prueba de normalidad – Test cuantitativos

prueba, es el área bajo la

Es posible usar test cuantitativos para calcular el p-value asociado a la

distribución de referencia que

hipótesis nula del tipo de distribución.

esta mas allá del valor del estadístico de prueba

Existen muchas pruebas para verificar la normalidad, entre las que se encuentran las siguientes:

- Ji-cuadrada para bondad de ajuste (para cualquier distribución) - Kolmogorov – Smirnov - Shapiro – Wilks - Anderson – Darling (para dist. Gauseana o Normal), usaremos ésta prueba ya implementada en Minitab: Stat/ Basic Stat/ Normality Test

28


Distribuciones que se derivan del muestreo DistribuciĂłn T de Student Es una distribuciĂłn de probabilidad que surge del problema de: - Estimar la media y desviaciĂłn de una poblaciĂłn normalmente distribuida cuando el tamaĂąo de la muestra es pequeĂąo.

Debido a que si se obtiene una muestra aleatoria de tamaĂąo n de una poblaciĂłn cuya distribuciĂłn es normal, entonces el estadĂ­stico:

T=

đ?‘ĽĚ… − đ?œ‡ đ?‘†/ √đ?‘›

âˆź T – Student (v)

Grados de libertad (dt)

v = n-1

29


En la siguiente figura se muestra la grรกfica de densidades T y la normal. Como se aprecia la distribuciรณn T es similar a la normal (0,1), excepto que tiene colas mรกs pesadas.

GRAPH / PROBABILITY DISTRIB PLOT

Fig 10. Colas pesadas

30


DistribuciĂłn ji-cuadrada Usada para hacer inferencias acerca de la desviaciĂłn estĂĄndar Ďƒ. Sean Z1, Z2, ..., Zk, v.a. ind., âˆź N (Îź = 0, Ďƒ2 = 1), entonces la v.a. : X2= Z21 +... + Z2k

X âˆź X2k

Si se obtiene una muestra de tamaĂąo n, entonces el estadĂ­stico:

2

X=

(đ?‘›âˆ’1)đ?‘† 2 đ?œŽ2

Tiene una distribuciĂłn ji-cuadrada con n-1 grados de libertad (S2, es la varianza muestral).

31


Conforme crecen los grados de libertad se aproxima a una distribuci贸n normal.

GRAPH / PROBABILITY DISTRIB PLOT

Fig 11. Distribuci贸n ji-cuadrada

32


La distribución X2 tiene muchas aplicaciones en inferencia estadística. La más conocida es la de denominada prueba X2 utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas.

Pero también está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student.

Aparece también en todos los problemas de análisis de varianza por su relación con la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución X2.

33


DistribuciĂłn F de Fisher Sean W y Y variables aleatorias ji-cuadrada independientes con u y v grados de libertad, respectivamente. Entonces el cociente F =

đ?‘Š/ đ?‘˘ đ?‘Œ/ đ?‘Ł

tiene una distribuciĂłn F con u grados

de libertad en el numerador, y v en el denominador, cuya funciĂłn de densidad de probabilidad estĂĄ dada por:

đ?‘“ (đ?‘Ľ ) =

đ?‘˘ đ?‘˘ đ?‘˘ 2 (2)−1 (đ?‘˘+đ?‘Ł ) ( 2 đ?‘Ł) đ?‘Ľ

�

�

�

( ) ( ) [( ) đ?‘Ľ + 1] 2 2 đ?‘Ł {

� 2

( )−1

0<x<∞

34


Densidades F para diferentes grados de libertad. La distribuci贸n F se encuentra centrada con respecto a 1, y los dos par谩metros le dan flexibilidad.

Fig 12. F de Fisher

35


La importancia de la distribución F radica en que es de especial utilidad para hacer inferencia cuando se comparan varianzas, ya que si se tienen dos poblaciones con distribución normal y varianzas σ21 y σ22, respectivamente, y se toman muestras aleatorias de cada población, de tamaño n1 y n2, respectivamente, entonces la variable aleatoria formada por el cociente F =

𝑆12 / 𝜎12 𝑆22 / 𝜎22

sigue una distribución F con n1

y n2 grados de libertad en el numerador y denominador, respectivamente, donde S21 y S22 son las varianzas muestrales.

36


Referencias

Moya, M. y Robles,N. (2010). Probabilidad y Estad铆stica: Un Enfoque te贸rico y pr谩ctico. Cartago: Tecnol贸gico de Costa Rica.

37


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.