BIOESTADÍSTICA Capítulo catorce: Métodos no paramétricos: aplicaciones de Chi-Cuadrada. Competencias: Al terminar este capítulo el estudiante podrá: UNO Enumerar las características de la distribución Chi-cuadrada. DOS Realizar una prueba de hipótesis para comparar un conjunto observado de frecuencias observadas con un conjunto de frecuencias esperadas. TRES Efectuar una prueba de hipótesis de normalidad, usando la distribución Chicuadrada. CUATRO Realizar una prueba de hipótesis para determinar si dos criterios de clasificación están relacionados. Dr. Wilson Nina
BIOESTADÍSTICA
14-2
CARACTERÍSTICAS DE LA DISTRIBUCIÓN CHICUADRADA • Las características principales distribución chi-cuadrada son:
de
–
tiene sesgo positivo
–
es no negativa
–
está basada en los grados de liberad
–
cuando los grados de libertad cambian se crea una nueva distribución
la
2-2
P r o b a b i l i d a d
CHI-SQUARE DISTRIBUTION gl = 3 gl = 5 gl = 10
χ2 Valores de chi-cuadarada
BIOESTADÍSTICA
14-4
PRUEBA DE BONDAD DE AJUSTE: FRECUENCIAS ESPERADAS IGUALES f y f
• Sean las frecuencias observada y esperada 0 e respectivas. • H0: no hay diferencia entre f0 y fe • H : existe una diferencia entre f y f 1 0 e • El estadístico de prueba es: 2 ( f − f ) 0 e x = Σ fe 2
• El valor crítico es un valor de chi-cuadrada con (k - 1) grados de libertad, donde k es el número de categorías.
14-5
EJEMPLO 1 • Los siguientes datos de ausentismo se recolectaron en una planta manufacturera. Para .05 de nivel de confianza, realice una prueba para determinar si existe diferencia en el tasa de ausentismo por día de la semana. Día Lunes Martes Miércoles Jueves Viernes
Frecuencia 120 45 60 90 130
14-6
EJEMPLO 1
continuacón
• Suponga frecuencias esperadas iguales: (120 + 45 + 60 + 90 + 130) / 5 = 89. • Use estos números para calcular que el estadístico de prueba es 42.4719. • Los grados de libertad son (5 - 1) = 4. • Entonces, el valor crítico es 9.488
14-7
EJEMPLO 1
continuacón
• H0 : no existe diferencia entre las frecuencias observadas y esperadas de ausencias. • H0 : existe una diferencia entre las frecuencias observadas y esperadas de ausencias. • Estadístico de prueba: chi-cuadrada = 60.8 • Regla de decisión: rechazar H0 si el estadístico de prueba es mayor que el valor crítico. • Conclusión: rechazar H0 y concluir que existe una diferencia entre las frecuencias observadas y las esperadas de ausencias.
BIOESTADÍSTICA
14-8
PRUEBA DE BONDAD DE AJUSTE: FRECUENCIAS ESPERADAS DISTINTAS EJEMPLO 2 • El U.S. Bureau of the Census indica que: – – – –
63.9% de la población está casada} 7.7% es viuda 6.9% divorciada (y no vuelta a casar) 21.5% soltera (nunca casada).
• Una muestra de 500 adultos del área de Filadelfia indica que 310 personas estaban casadas, 40 viudas, 30 divorciadas y 120 solteras. Para .05 de nivel de significancia ¿se puede concluir que el área de Filadelfia es diferente al de Estados Unidos como un todo?
14-9
EJEMPLO 2
continuación
Estado
f0
Casado
310
319.5
.2825
Viudo
40
38.5
.0584
Divorciado
30
34.5
.5870
Soltero
120
107.5
1.4535
Total
500
fe
( f0 − fe )2 / fe
2.3814
14-10
EJEMPLO 2
continuación
• Paso 1: H0 : la distribución no ha cambiado. • H1 : la distribución cambió. • Paso 2: H0 se rechaza si x 2 > 7.815, gl = 3, • Paso 3:
α =.05
x 2 = 2.3824
• Paso 4: H0 se rechaza. La distribución cambió.
BIOESTADÍSTICA
14-11
PRUEBA DE BONDAD DE AJUSTE PARA NORMALIDAD • Propósito: probar si las frecuencias observadas en una distribución de frecuencias se ajusta a la distribución normal teórica. • Procedimiento: determinar la media y la desviación estándar de la distribución de frecuencias. –
Calcular el valor z para el límite inferior y superior de cada clase.
–
Determinar
–
para cada categoría
f ebondad de ajuste de chi-cuadrada para Usar la prueba de determinar si coincide con . f0
fe
14-12
EJEMPLO 3 • Una muestra de 500 donativos a la Arthritis Foundation se presenta con la siguiente distribución de frecuencias. ¿Es razonable concluir que se tiene una distribución normal con media de $10 y desviación estándar de $2? Use .05 de nivel de significancia.
• Nota: para calcular f e para la primera clase, primero se calcula la probabilidad de esta clase. P(X<6)=P[Z<(610)/2]=.0228. Así, f e es (.0228)(500)=11.4
14-13
EJEMPLO 3 cantidad gastada
continuación
f0
área
fe
( f 0 − fe )2 / fe
<$6
20
.02
11.40
6.49
$6-8
60
.14
67.95
.93
$8-10
140
.34
170.65
5.50
$10-12
120
.34
170.65
15.03
$12-14
90
.14
67.95
7.16
>$14
70
.02
11.40
301.22
Total
500
500
336.33
14-14
EJEMPLO 3
continuación
• Paso 1: H0 : la distribución es normal. • H1 : la distribución no es normal. • Paso 2: H0 se rechaza si x 2 > 11.07, gl = 5, α=.05 • Paso 3: x 2 = 336.33 • Paso 4: H0 se rechaza. La distribución no es normal
BIOESTADÍSTICA
14-15
ANÁLISIS DE TABLAS DE CONTINGENCIA se usa para probar si dos características o variables están relacionadas. Cada observación se clasifica según las dos variables. Se usa el procedimiento de prueba de hipótesis normal. Los grados de libertad son iguales a: (número de filas - 1) (número de columnas - 1). La frecuencia esperada se calcula como: Frecuencia esperada = (total por fila)(total por columna)/gran total
• El análisis de tablas de contingencia
• • • •
14-16
EJEMPLO 4 • ¿Existe una relación entre el lugar de un accidente y el sexo de la persona accidentada? Una muestra de 150 accidentes presentada a la policía estaba clasificada por tipo y sexo. Con .05 de nivel de significancia, ¿se puede concluir que el sexo y el lugar del accidente están relacionados?
14-17
EJEMPLO 4
continuaci贸n
Sexo
Trabajo
Hogar
Otro
Total
Hombre
60
20
10
90
Mujer
20
30
10
60
Total
80
50
20
150
Nota: la frecuencia esperada para la intersecci贸n hombre-trabajo se calcula como (90)(80)/150 = 48. De manera similar, se pueden calcular las frecuencias esperadas para las otras celdas.
14-18
EJEMPLO 4
continuación
• Paso 1: H0 : el sexo de la persona y el lugar del accidente no están relacionados. H1 : el sexo y el lugar están relacionados. • Paso 2: H0 se rechaza si x 2 > 5.991, gl = 2 , α =.05 • Paso 3: x 2 = 16.667 • Paso 4: H0 se rechaza. El sexo y el lugar sí tienen una relación.