Distribuciones Continuas y Teorema del Límite Central Curso PI-2610 Probabilidad y Estadística Marco Alvarado Peña
Sesión 7
Objetivos de Aprendizaje Al finalizar esta sesión el estudiante deberá ser capaz de:
1- Conocer los principales conceptos de Distribuciones Continuas. 2- Seleccionar la distribución que mejor se adecúe el análisis que se requiera. 3- Entender la relación del Teorema del Límite Central y la Distribución Normal. 4- Aplicar las distribuciones de probabilidad continuas según lo planteado en la parte de teoría para cada una de ellas. 5- Visualizar el potencial de utilización de las distribuciones continuas en términos de la aplicabilidad que cada una posea. 6- Resolver problemas cotidianos relacionados con variables aleatorias continuas tanto desde el punto de vista manual como de aplicabilidad de un software estadístico.
2
Índice Distribuciones Continuas y Teorema del Límite Central....... 1 Objetivos de Aprendizaje....................................................... 2 Teorema Central del Límite (TLC)......................................... 5 Distribuciones Continuas...................................................... 6 Distribución Exponencial (Teoría de colas y confiabilidad)... 6 Consideraciones................................................................... 9 Ejemplos............................................................................... 10 Ejemplo de Distribución Exponencial.................................... 11 Distribución Gamma...............................................................12 Distribución normal................................................................ 14 El valor Z – Estandarizar....................................................... 17 Función Densidad y Distribución de Probabilidad................ 22 Figuras importantes.............................................................. 23 Consideraciones..................................................................... 25 Atención................................................................................ 26 Teorema central del límite (TLC)........................................... 27 Prueba de normalidad – Test cuantitativos........................... 28 Distribuciones que se derivan del muestreo....................... 29 Distribución T de Student...................................................... 29 3
Distribuci贸n ji-cuadrada.........................................................31 Distribuci贸n F de Fisher........................................................ 34 Referencias............................................................................. 37
4
Teorema Central del LĂmite (TLC) Una de las razones por las que la distribuciĂłn normal es tan importante es debido al TLC que en un caso particular afirma:
Sea x1 , x2..... xn una muestra aleatoria de cualquier poblaciĂłn, y sea x la media muestral; entonces, independientemente de cĂłmo sea la distribuciĂłn de la poblaciĂłn de donde se extrajo la muestra, la distribuciĂłn de x se aproxima a la norma N(Îź,Ďƒ2) conforme n crece. La forma lĂmite de la distribuciĂłn de:
đ?&#x2018;&#x2039;Ě&#x2026;â&#x2C6;&#x2019; đ?&#x153;&#x2021; z= đ?&#x153;&#x17D;/ â&#x2C6;&#x161;đ?&#x2018;&#x203A; Conforme n -----> â&#x2C6;&#x17E;, es la distribuciĂłn normal estĂĄndar N (0,1). - En algunos casos la aproximaciĂłn puede ser buena para n pequeĂąa n < 10. - En otros casos se necesita un n grande, n > 100.
5
- En el caso en que las x tengan la misma distribución y no sea radicalmente diferente a la normal, entonces un n ≥ 4 es suficiente.
El tamaño de muestra n de acuerdo a cada proceso y según conocimiento del mismo puede variar según los tres puntos citados anteriormente.
Distribuciones Continuas Distribución Exponencial (Teoría de colas y confiabilidad) Esta Distribución explica fenómenos de la vida real como por ejemplo líneas de espera, (teoría de colas). Se usa para modelar tiempos de espera para la ocurrencia de un cierto evento en un determinado intervalo de tiempo.
6
â&#x2C6;&#x2019;đ?&#x153;&#x2020;đ?&#x2018;Ľ đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) = {đ?&#x153;&#x2020;đ?&#x2018;&#x2019; , đ?&#x2018;?đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x17D; đ?&#x2018;Ľ â&#x2030;Ľ 0 đ?&#x2018;&#x2018;đ?&#x2018;&#x2019; đ?&#x2018;&#x153;đ?&#x2018;Ąđ?&#x2018;&#x;đ?&#x2018;&#x153; đ?&#x2018;&#x161;đ?&#x2018;&#x153;đ?&#x2018;&#x2018;đ?&#x2018;&#x153; 0
đ??š(đ?&#x2018;Ľ) = đ?&#x2018;&#x192;(đ?&#x2018;&#x2039; â&#x2030;¤ đ?&#x2018;Ľ) = {
0 đ?&#x2018;?đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x17D; đ?&#x2018;Ľ < 0 1 â&#x2C6;&#x2019; đ?&#x2018;&#x2019; â&#x2C6;&#x2019;đ?&#x153;&#x2020;đ?&#x2018;Ľ đ?&#x2018;?đ?&#x2018;&#x17D;đ?&#x2018;&#x;đ?&#x2018;&#x17D; đ?&#x2018;Ľ â&#x2030;Ľ 0
E [X] = 1/Îť V (X) = 1/Îť
Para ejemplificar lo anterior se presentan los grĂĄficos a continuaciĂłn:
7
Fig 1. TeorĂa de colas y confiabilidad
8
(X â&#x2030;¤ x) = F(x) = 1 â&#x2C6;&#x2019; e â&#x2020;&#x2018; â&#x2C6;&#x2019;đ?&#x153;&#x2020;x P (X > x) = 1 â&#x2C6;&#x2019; F(x) = 1 â&#x2C6;&#x2019; e â&#x2020;&#x2018; â&#x2C6;&#x2019; Îťx P (a â&#x2030;¤ X â&#x2030;¤ b) = F(b) â&#x2C6;&#x2019; F(a) = (1 â&#x2C6;&#x2019; e â&#x2020;&#x2018; â&#x2C6;&#x2019; Îťb) â&#x2C6;&#x2019; (1 â&#x2C6;&#x2019; e â&#x2020;&#x2018; â&#x2C6;&#x2019; Îťa)
Consideraciones La distribuciĂłn exponencial es el equivalente continuo de la distribuciĂłn geomĂŠtrica discreta. Esta ley de distribuciĂłn describe procesos en los que:
- Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que: - El tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un instante tf, no depende del tiempo
9
De hecho la distribución exponencial puede derivarse de un proceso experimental de Poisson con las mismas características, pero tomando como variable aleatoria, en este caso, el tiempo que tarda en producirse un hecho.
Ejemplos 1- El tiempo que tarda una partícula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se utiliza en Ciencia para, por ejemplo, la datación de fósiles o cualquier materia orgánica mediante la técnica del carbono14, C14.
2- El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un paciente.
3- En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos sigue un modelo probabilístico exponencial. Por ejemplo, el tiempo que transcurre entre que sufrimos dos veces una herida importante. 10
Ejemplo de Distribución Exponencial Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de falla en aùos estå dado por T. La variable aleatoria T se modela bien mediante la distribución exponencial con tiempo medio para la falla β = 5. Si se instalan cinco de estos componentes en diferentes sistemas, ¿cuål es la probabilidad de que al menos dos aún funcionen al final de ocho aùos?
SoluciĂłn La probabilidad de que un componente dado aĂşn funcione despuĂŠs de ocho aĂąos estĂĄ dada por: P (T > 8) =
1 5
x
â&#x2C6;Ť8 e-1/5
dt = đ?&#x2018;&#x2019; â&#x2C6;&#x2019;8/5 = 0.2
Como puede observar gracias a la DistribuciĂłn Exponencial se obtiene la probabilidad de ocurrencia bajo ese enfoque y con el dato calculado es como obtener el p de la DistribuciĂłn Binomial y se aplica para la soluciĂłn dicha distribuciĂłn discreta.
11
RepresĂŠntese con X el nĂşmero de componentes que funcionan despuĂŠs de ocho aĂąos. Entonces con el uso de la distribuciĂłn binomial: P (X â&#x2030;Ľ 2) = â&#x2C6;&#x2018;5đ?&#x2018;Ľ=2 b(x: 5. 0.2)= 1- â&#x2C6;&#x2018;5đ?&#x2018;Ľ=0 b(x: b. 0.2)= 1- 0.7373 = 0.2627
DistribuciĂłn Gamma Este modelo es una generalizaciĂłn del modelo Exponencial ya que, en ocasiones, se utiliza para modelar variables que describen el tiempo hasta que se produce p veces un determinado suceso. Su funciĂłn de densidad es de la forma:
đ?&#x2018;&#x201C;(đ?&#x2018;Ľ) = { 0
1
đ?&#x203A;źđ?&#x2018;?Î&#x201C;(đ?&#x2018;?)
đ?&#x2018;Ľ
đ?&#x2018;&#x2019;â&#x2C6;&#x2019;đ?&#x203A;ź đ?&#x2018;Ľđ?&#x2018;?â&#x2C6;&#x2019;1 , đ?&#x2018;Ľ > 0 , đ?&#x2018;Ľâ&#x2030;¤0
Como se puede observar, este modelo depende de dos parĂĄmetros positivos: Îą y p. La funciĂłn Î&#x201C;(p) es la denominada funciĂłn Gamma de Euler que representa la siguiente integral: â&#x2C6;&#x17E;
Î&#x201C;(đ?&#x2018;?) = â&#x2C6;Ť0 đ?&#x2018;Ľ đ?&#x2018;?â&#x2C6;&#x2019;1 đ?&#x2018;&#x2019; â&#x2C6;&#x2019;đ?&#x2018;Ľ đ?&#x2018;&#x2018;đ?&#x2018;Ľ 12
Se verifica Î&#x201C;(đ?&#x2018;? + 1) = đ?&#x2018;?Î&#x201C;(đ?&#x2018;?), con lo que si, p es un nĂşmero entero positivo, Î&#x201C;(đ?&#x2018;? + 1) = p!
Decimos que una variable aleatoria x, sigue una distribuciĂłn gamma si su â&#x20AC;&#x153;PDFâ&#x20AC;? (la funciĂłn de su distribuciĂłn de probabilidad) es:
đ?&#x2018;&#x201C;(đ?&#x2018;Ľ; đ?&#x203A;ź, đ?&#x203A;˝ ) =
1 { đ?&#x203A;˝ đ?&#x203A;ź Î&#x201C; (đ?&#x203A;ź )
đ?&#x2018;Ľ đ?&#x203A;źâ&#x2C6;&#x2019;1
đ?&#x2018;&#x2019; â&#x2C6;&#x2019;đ?&#x2018;Ľđ?&#x203A;˝ , đ?&#x2018;Ľ > 0
0
,
otra manera
Donde tanto đ?&#x203A;˝ como đ?&#x203A;ź son positivos: (đ?&#x203A;˝, đ?&#x203A;ź ) > 0 Cuando β = 1 a esta distribuciĂłn le llamamos â&#x20AC;&#x153;Gamma EstĂĄndarâ&#x20AC;?:
đ?&#x2018;Ľ đ?&#x203A;źâ&#x2C6;&#x2019;1 đ?&#x2018;&#x2019; â&#x2C6;&#x2019;đ?&#x2018;Ľ đ?&#x2018;&#x201C;(đ?&#x2018;Ľ; đ?&#x203A;ź, đ?&#x203A;˝ ) = { Î&#x201C;(đ?&#x203A;ź )
,đ?&#x2018;Ľ â&#x2030;Ľ 0 0
, otra manera
Valor esperado: E(x) = Îź = Îą β Varianza: V(x) = Ď&#x192;2 = Îą β2
13
*Caso especial: Cuando ι = 1 la distribución gamma es una exponencial con β=
1 đ?&#x153;&#x2020;
Con la introducciĂłn de ĂŠstas dos distribuciones de probabilidad continua y que son importantes en el campo de la confiabilidad, se pasa a una de las distribuciones mĂĄs importantes... DistribuciĂłn Normal.
DistribuciĂłn normal - Es una de las mĂĄs importantes en la EstadĂstica. - Propuesta por el MatemĂĄtico AlemĂĄn Karl Friedrich Gauss (1777- 1855). - Muchos de los fenĂłmenos del mundo real se comportan bajo esta estructura probabilĂstica de comportamiento. - Cuando una variable aleatoria representa a una poblaciĂłn que tiene un comportamiento probabilĂstico normal el histograma tiene una forma mĂĄs o menos simĂŠtrica o de campana.
14
Es la distribuciĂłn continua mĂĄs importante, tanto en estadĂstica teĂłrica como aplicada. Si X es una variable aleatoria normal, entonces su funciĂłn de distribuciĂłn de probabilidad estĂĄ dada por:
đ?&#x2018;&#x201C; (đ?&#x2018;Ľ ) = {
â&#x2C6;&#x2019;đ?&#x2018;Ľ
1 đ?&#x153;&#x17D;â&#x2C6;&#x161;2đ?&#x153;&#x2039;
2 1 ) â&#x2C6;&#x2019; (đ?&#x2018;Ľâ&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x153;&#x17D; đ?&#x2018;&#x2019; 2
,
đ?&#x2018;Ľâ&#x2C6;&#x2C6;â&#x201E;?
donde Îź (mu) es la media y Ď&#x192; (sigma) es la desviaciĂłn estĂĄndar (Ď&#x192;2 es la varianza). Suponga una variable aleatoria X~ N(Îź, Ď&#x192;2), que presenta un comportamiento normal con media Îź, y variabilidad Ď&#x192;2, para calcular la probabilidad de que esta variable tome valores entre dos nĂşmeros a y b, entonces se calcula el ĂĄrea bajo la curva entre a y b (mediante mĂŠtodos numĂŠricos ya que la integral de la funciĂłn de distribuciĂłn no tiene soluciĂłn analĂtica), tal y como se muestra en la figura seguidamente.
15
Fig 2. Distribución normal
Cuando es un distribución normal con parámetros μ = o y σ2 = 1, entonces a la distribución se le conoce como distribución normal estándar (N(0,1)) y los valores de las probabilidades están ya tabulados en las respectivas tablas que puede consultar en la bibliografía de éste curso.
Estandarizar una variable es fácil, puesto que si X tiene una distribución normal con E(X) = μ y V(X) = σ2, entonces la variable (estandarizada) z se comporta de dicha manera.
16
z=
(đ?&#x2018;Ľâ&#x2C6;&#x2019;đ?&#x153;&#x2021; ) đ?&#x153;&#x17D;
El valor Z â&#x20AC;&#x201C; Estandarizar
z=
(đ?&#x2018;Ľâ&#x2C6;&#x2019;đ?&#x153;&#x2021; ) đ?&#x153;&#x17D;
En esta ecuaciĂłn, Îź es la media, Ď&#x192; es la desviaciĂłn estĂĄndar y x es un valor que nos gustarĂa evaluar. - x- Îź esta diferencia calcula que tan lejos se estĂĄ de la media miu. - Cuando se divide por Ď&#x192;, se estĂĄ calculando cuantas desviaciones estĂĄndar se estĂĄ de la media
17
Zona 1: đ?? Âą đ?&#x;? đ??&#x2C6; 68.26% de los datos se esperan contener dentro de una desviaciĂłn estĂĄndar de la media Zona 2: đ?? Âą đ?&#x;? đ??&#x2C6; 95.46% de los datos se esperan contener dentro de dos desviaciones estĂĄndar de la media Zona 3: đ?? Âą đ?&#x;&#x2018; đ??&#x2C6; 99.73% de los datos se esperan contener dentro de tres desviaciones estĂĄndar
Fig 3. Ă reas bajo la curva de distribuciĂłn
18
Ejemplo El tiempo de entrega de un producto se distribuye normal con media 60,5 y desviaciĂłn estĂĄndar 5,9. Si un tiempo de entrega es de 70, ÂżcuĂĄntas desviaciones estĂĄndar tiene respecto de la media? z= ( z= (
đ?&#x2018;Ľâ&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x153;&#x17D;
)
70â&#x2C6;&#x2019;60.5 5.9
)
= 1.61
Si estamos considerando una zona con Îź Âą 3 Ď&#x192; entonces 1,61 desviaciones estĂĄndar de la media estĂĄ al interno del ĂĄrea de la zona de 3 Ď&#x192;.
19
Fig 4. Desviaci贸n 1,61
20
¿Cuántas desviaciones estándar tiene el tiempo de 100 respecto de la media?
z= (
100−60.5 5.9
)
= 6.69
Este valor está muy lejos de la zona de aceptación, recuerde que la zona de aceptación está definida por μ ± 3 σ , lo que indica que algún cambio ha ocurrido en las operaciones normales del proceso.
Fig 5. Desviación 6.69
21
FunciĂłn Densidad y DistribuciĂłn de Probabilidad La funciĂłn de densidad de la variable aleatoria normal X, con media Îź y varianza Ď&#x192;2, es
1 đ?&#x2018;&#x203A;(đ?&#x2018;Ľ; đ?&#x153;&#x2021;, đ?&#x153;&#x17D;) = {â&#x2C6;&#x161;2đ?&#x153;&#x2039;đ?&#x153;&#x17D;
đ?&#x2018;&#x2019;
1 â&#x2C6;&#x2019;(2)[(đ?&#x2018;Ľâ&#x2C6;&#x2019;đ?&#x153;&#x2021;)/đ?&#x153;&#x17D;]2
,
â&#x2C6;&#x2019;â&#x2C6;&#x17E; < đ?&#x2018;Ľ < â&#x2C6;&#x17E;,
Donde đ?&#x153;&#x2039; = 3,14159... y e = 2,71828
*Nota: Los errores en las mediciones cientĂficas se aproximan extremadamente bien mediante una distribuciĂłn normal. Una variable Aleatoria continua X que tiene la forma de campana se dice que sigue una DistribuciĂłn Normal.
Fig 6. Densidad y DistribuciĂłn de Probabilidad
22
Figuras importantes
Fig 7. Curvas normales con μ1 < μ2 y σ1 = σ2
Fig 8. Curvas normales con μ1 = μ2 y σ1 < σ2
23
Fig 9. Curvas normales con μ1 < μ2 y σ1 < σ2
24
Consideraciones - La moda, que es el punto sobre el eje horizontal donde la curva es un máximo, ocurre en x = μ
- La curva es simétrica alrededor de un eje vertical a través de la media μ - La curva tiene sus puntos de inflexión en x= μ ± σ, es cóncava hacia abajo si μ – σ < X < μ + σ, y es cóncava hacia arriba en cualquier otro punto
- La curva normal se aproxima al eje horizontal de manera asintótica conforme nos alejamos de la media en cualquier dirección
- El área toral bajo la curva y sobre el eje horizontal es igual a 1
- Es una buena aproximación para la binomial y la hipergeométrica
25
AtenciĂłn La funciĂłn de probabilidad normal depende de Îź y Ď&#x192; y como estos valores tienen un dominio de Âąâ&#x2C6;&#x17E; entonces puede existir un nĂşmero infinito de curvas para cada Îź y Ď&#x192;.
Para evitar esto se ha encontrado una curva normal reducida o estandarizada que tenga un valor medio igual a cero y una varianza igual a 1, de tal manera que cualquier distribuciĂłn normal de Îź y varianza Ď&#x192;2 se puede convertir o estandarizar a otra distribuciĂłn.
Z=
đ?&#x2018;Ľâ&#x2C6;&#x2019;đ?&#x153;&#x2021; đ?&#x153;&#x17D;
En consecuencia de lo anterior la funciĂłn densidad es: 1
đ?&#x2018;&#x201C; (đ?&#x2018;Ľ ) = {â&#x2C6;&#x161;2đ?&#x153;&#x2039;
đ?&#x2018;&#x2019; â&#x2C6;&#x2019;đ?&#x2018;Ľ
2 /2
26
Teorema central del lĂmite (TLC) Una de las razones por las que la distribuciĂłn normal es tan importante es debido al TLC que en un caso particular afirma: Sea x1, x2, ..., xn una muestra aleatoria de cualquier poblaciĂłn, y sea đ?&#x2018;ĽĚ&#x2026; la media muestral; entonces, independientemente de cĂłmo sea la distribuciĂłn de la poblaciĂłn de donde se extrajo la muestra, la distribuciĂłn de đ?&#x2018;ĽĚ&#x2026; se aproxima a la normal N (Îź,Ď&#x192;2) conforme n crece. La forma lĂmite de la distribuciĂłn de z=
đ?&#x2018;&#x2039;Ě&#x2026;â&#x2C6;&#x2019; đ?&#x153;&#x2021; đ?&#x153;&#x17D;/ â&#x2C6;&#x161;đ?&#x2018;&#x203A;
conforme n-->â&#x2C6;&#x17E;, es la
distribuciĂłn normal estĂĄndar N(0,1). Como puede apreciar es muy similar a la z estandarizada de la DistribuciĂłn normal, sin embargo como se estĂĄ trabajando con muestras la desviaciĂłn estĂĄndar debe ser dividido entre raĂz de n. - En algunos casos la aproximaciĂłn puede ser buena para n pequeĂąa n<10. - En otros casos se necesita un n grande, n>100. - En el caso en que las x tengan la misma distribuciĂłn y no sea radicalmente diferente a la normal, entonces un nâ&#x2030;Ľ4 es suficiente 27
El p-value es la significancia de la
Prueba de normalidad – Test cuantitativos
prueba, es el área bajo la
Es posible usar test cuantitativos para calcular el p-value asociado a la
distribución de referencia que
hipótesis nula del tipo de distribución.
esta mas allá del valor del estadístico de prueba
Existen muchas pruebas para verificar la normalidad, entre las que se encuentran las siguientes:
- Ji-cuadrada para bondad de ajuste (para cualquier distribución) - Kolmogorov – Smirnov - Shapiro – Wilks - Anderson – Darling (para dist. Gauseana o Normal), usaremos ésta prueba ya implementada en Minitab: Stat/ Basic Stat/ Normality Test
28
Distribuciones que se derivan del muestreo DistribuciĂłn T de Student Es una distribuciĂłn de probabilidad que surge del problema de: - Estimar la media y desviaciĂłn de una poblaciĂłn normalmente distribuida cuando el tamaĂąo de la muestra es pequeĂąo.
Debido a que si se obtiene una muestra aleatoria de tamaĂąo n de una poblaciĂłn cuya distribuciĂłn es normal, entonces el estadĂstico:
T=
đ?&#x2018;ĽĚ&#x2026; â&#x2C6;&#x2019; đ?&#x153;&#x2021; đ?&#x2018;&#x2020;/ â&#x2C6;&#x161;đ?&#x2018;&#x203A;
â&#x2C6;ź T â&#x20AC;&#x201C; Student (v)
Grados de libertad (dt)
v = n-1
29
En la siguiente figura se muestra la grรกfica de densidades T y la normal. Como se aprecia la distribuciรณn T es similar a la normal (0,1), excepto que tiene colas mรกs pesadas.
GRAPH / PROBABILITY DISTRIB PLOT
Fig 10. Colas pesadas
30
DistribuciĂłn ji-cuadrada Usada para hacer inferencias acerca de la desviaciĂłn estĂĄndar Ď&#x192;. Sean Z1, Z2, ..., Zk, v.a. ind., â&#x2C6;ź N (Îź = 0, Ď&#x192;2 = 1), entonces la v.a. : X2= Z21 +... + Z2k
X â&#x2C6;ź X2k
Si se obtiene una muestra de tamaĂąo n, entonces el estadĂstico:
2
X=
(đ?&#x2018;&#x203A;â&#x2C6;&#x2019;1)đ?&#x2018;&#x2020; 2 đ?&#x153;&#x17D;2
Tiene una distribuciĂłn ji-cuadrada con n-1 grados de libertad (S2, es la varianza muestral).
31
Conforme crecen los grados de libertad se aproxima a una distribuci贸n normal.
GRAPH / PROBABILITY DISTRIB PLOT
Fig 11. Distribuci贸n ji-cuadrada
32
La distribución X2 tiene muchas aplicaciones en inferencia estadística. La más conocida es la de denominada prueba X2 utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas.
Pero también está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student.
Aparece también en todos los problemas de análisis de varianza por su relación con la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución X2.
33
DistribuciĂłn F de Fisher Sean W y Y variables aleatorias ji-cuadrada independientes con u y v grados de libertad, respectivamente. Entonces el cociente F =
đ?&#x2018;&#x160;/ đ?&#x2018;˘ đ?&#x2018;&#x152;/ đ?&#x2018;Ł
tiene una distribuciĂłn F con u grados
de libertad en el numerador, y v en el denominador, cuya funciĂłn de densidad de probabilidad estĂĄ dada por:
đ?&#x2018;&#x201C; (đ?&#x2018;Ľ ) =
đ?&#x2018;˘ đ?&#x2018;˘ đ?&#x2018;˘ 2 (2)â&#x2C6;&#x2019;1 (đ?&#x2018;˘+đ?&#x2018;Ł ) ( 2 đ?&#x2018;Ł) đ?&#x2018;Ľ
đ?&#x2018;˘
đ?&#x2018;˘
đ?&#x2018;˘
( ) ( ) [( ) đ?&#x2018;Ľ + 1] 2 2 đ?&#x2018;Ł {
đ?&#x2018;˘ 2
( )â&#x2C6;&#x2019;1
0<x<â&#x2C6;&#x17E;
34
Densidades F para diferentes grados de libertad. La distribuci贸n F se encuentra centrada con respecto a 1, y los dos par谩metros le dan flexibilidad.
Fig 12. F de Fisher
35
La importancia de la distribución F radica en que es de especial utilidad para hacer inferencia cuando se comparan varianzas, ya que si se tienen dos poblaciones con distribución normal y varianzas σ21 y σ22, respectivamente, y se toman muestras aleatorias de cada población, de tamaño n1 y n2, respectivamente, entonces la variable aleatoria formada por el cociente F =
𝑆12 / 𝜎12 𝑆22 / 𝜎22
sigue una distribución F con n1
y n2 grados de libertad en el numerador y denominador, respectivamente, donde S21 y S22 son las varianzas muestrales.
36
Referencias
Moya, M. y Robles,N. (2010). Probabilidad y Estad铆stica: Un Enfoque te贸rico y pr谩ctico. Cartago: Tecnol贸gico de Costa Rica.
37