Casos y problemas
resueltos
VI: Inferencia en la media Inferencia enno la proporción IV: Inferencia paramétrica • Intervalos de confianza • Tamaño de la muestra • Contraste de proporciones • Contraste de diferencia de proporciones
•
Estadística Inferencia Estadística Aplicada a las Ciencias Sociales
I: Estadística Descriptiva Aplicada a las Ciencias Sociales
-1Patricio Alcaíno Martínez Derechos Reservados Patricio Alcaíno Martínez
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
2
Palabras iniciales Estimados usuari@s:
•
Este material que pongo a su disposición está creado a partir de casos e investigaciones reales de distintos ámbitos de las Ciencias Sociales. Los datos han sido cambiados para ajustarlos a un criterio didáctico. Por ello, la información y conclusiones a las cuales llegan, no son necesariamente válidos.
•
Los casos y problemas aquí presentados constituyen una muestra representativa de las situaciones más frecuentes a resolver en investigación social. A saber: 1. Cálculo del intervalo de confianza de la proporción poblacional en una población binomial con muestra grande. 2. Cálculo del tamaño de la muestra para investigaciones de poblaciones binomiales con muestra grande. 3. Contraste, test o dócima de la proporción poblacional con muestra grande.. 4. Contraste, test o dócima de la diferencia de proporciones con muestra grande..
•
Este volumen está dirigido a tratar el tema de la inferencia en proporciones y a un análisis básico de los procedimientos estadísticos asociados. El lector deberá manejar los conceptos y procedimientos elementales de Inferencia Estadística y contraste de hipótesis y tener competencia en el cálculo de proporciones y probabilidades con el modelo normal estandarizado.
•
Para trabajar con este material el usuario deberá hacer uso de calculadora y la tabla de probabilidades Z, tabla que se adjunta en la página final de este docuento.
Atentamente;
Patricio Alcaíno Martínez
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
3
1. La Polar, llegar y llevar En una encuesta realizada en Chile con una muestra aleatoria de 984 personas mayores de 18 años, el 58% opinó que los culpables de lo ocurrido en la multitienda La Polar deberían pagar con cárcel. Según estos datos: 1.1. Construya un intervalo del 99% de confianza para la proporción de chilenos que piensa que los culpables del fraude de La Polar deberían pagar con cárcel. Solución: Para construir el intervalo, se requieren los siguientes datos: n 984 P 0,58
Para el 99% de confianza, Z = 2,58 Se calcula el error estándar de la proporción:
p
0,58 0,42 0,01573 984
El intervalo de confianza es igual a:
p 0,58 2,58 0,01573 p 0,58 0,041 , con un 99% de confianza. 0,539 p 0,621 , con un 99% de confianza. El porcentaje de chilenos que opina que los culpables del fraude de La Polar deberían pagar con cárcel, fluctúa entre el 53,9% y el 62,1%, con un 99% de confianza.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
4
2. Discriminación de género En una muestra de 865 mujeres trabajadoras, 179 declararon haber sido víctimas de discriminación de género en su lugar de trabajo en el curso de los últimos 6 meses. Sobre la base de estos datos: 2.1. Calcular un intervalo de confianza del 95% para la proporción poblacional de mujeres trabajadoras que habría sufrido tal discriminación. 2.2. Calcule la probabilidad de que la proporción poblacional de mujeres discriminadas en su lugar de trabajo supere el 25%.
Solución: 2.1. Intervalo de confianza
n 865 x 179 Para el 95% de confianza, Z = 1,96 Cálculo de p muestral:
P
179 = 0,207 865
Cálculo del error muestral:
p
0,207 · 0,793 = 0,0138 865
Entonces, el intervalo de confianza del 95% para p es igual a:
p 0,207 1,96 · 0,0138 p 0,207 0,027 , con un 95% de confianza. Sumando y restando el error y transformando a %, este intervalo se expresa como:
18,0% p 23,4% , con un 95% de confianza. O bien:
p 18,0; 23,4 % , con un 95% de confianza.
Esto significa que en la población hay un 95% de probabilidades de que la proporción de mujeres que sufren discriminación de género esté entre el 18,0% y el 23,4%.
2.2. Calcule la probabilidad de que la proporción poblacional de mujeres discriminadas en su lugar de trabajo supere el 25%. Por el cálculo anterior, se tiene:
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
P 0,207;
y, además:
p = 0,0138
El 25% se expresa como probabilidad p i = 0,25 Estandarizando:
Z
0,25 0,207 = 3,12 0,0138
Según la tabla Z, la probabilidad P(Z >3,12) = 0,0009 Entonces, la probabilidad de que la proporción poblacional de mujeres discriminadas en su lugar de trabajo supere el 25% es igual a 0,0009.
5
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
6
3. Impacto de la crisis económica en la empresa Se realiza un estudio con 285 empresarios seleccionados al azar, para determinar el nivel de impacto de la recesión económica en sus empresas. Los resultados se muestran en la tabla siguiente: ¿Cuál ha sido el nivel de impacto de la crisis económica en su empresa? Nivel de impacto Muy afectada Medianamente afectada Poco afectada Nada afectada TOTAL
Nº casos 83 110 53 39 285
De acuerdo a estos datos: 3.1. Indique cuál es la variable en estudio y la escala en que está medida. 3.2. Calcule la probabilidad de que en la muestra un empresario sienta Poco afectada o Nada afectada su empresa, por la crisis económica. 3.3. Calcule el error muestral de la proporción de empresarios que se sienten Muy afectado por la recesión económica. 3.4. Calcule un intervalo de confianza del 90% para la proporción de empresas que se siente Medianamente o Muy afectada por la recesión económica.
Solución: 3.1. Indique cuál es la variable en estudio y la escala en que está medida. La variable es Nivel de impacto de la crisis económica en la empresa. Esta variable está medida a escala ordinal de cuatro valores. 3.2. Calcule la probabilidad de que en la muestra un empresario sienta Poco afectada o Nada afectada su empresa, por la crisis económica. Casos favorables = 53 +39 = 92 Caso totales = 285 Probabilidad = 92/285 = 0,323 La probabilidad de que en la muestra un empresario sienta Poco afectada o Nada afectada su empresa por la crisis económica es 0,323. 3.3. Calcule el error muestral de la proporción de empresarios que se sienten Muy afectado por la recesión económica. Datos muestrales:
n 285 ; x 83 Entonces:
P
83 0,291; y q = 0,709 285
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
7
El error estándar de la proporción es igual a:
p
0,291 0,709 0,0269 285
El error estándar de la proporción poblacional de empresarios que se sienten Muy afectados por la recesión económica es 0,0269, lo que equivale al 2,69%.
3.4. Calcule un intervalo de confianza del 90% para la proporción de empresas que se siente Medianamente o Muy afectada por la recesión económica. Datos muestrales:
n 285 ; x 193 Entonces:
P
193 0,677; y q = 0,323 285
El error estándar de la proporción es igual a:
p
0,677 0,323 0,0277 285
El valor de z para un intervalo de confianza del 90% es 1,645. Entonces, el intervalo de confianza de p está dado por:
p 0,677 1,645 0,0277 p 0,677 0,046 ; con un 90% de confianza. La proporción de empresario que se siente Medianamente o Muy afectados por la recesión económica fluctúa entre el 63,1% y el 72,3%, con un 90% de probabilidades.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
8
4. Caso elecciones presidenciales A causa de cierto proceso eleccionario presidencial que se acerca en el país, se realiza una encuesta para conocer la intención de voto en una muestra de 750 votantes, respecto de los dos únicos candidatos, construyéndose la siguiente tabla de resultados.
VOTARÍA: Por candidato A Por candidato B Nulo o en blanco TOTAL
Sexo Hombres Mujeres 148 194 168 159 14 67 330 420
TOTAL 342 327 81 750
Sobre la base de estos datos: 4.1. Haga una estimación por intervalo del % poblacional de votación Nulo o en blanco, con una confianza del 95%. 4.2. Construya un intervalo de confianza del 90% para la proporción poblacional de mujeres que votaría por el candidato A. 4.3. En la población de votantes del candidato B, calcule un intervalo de confianza del 95% para la proporción de hombres. Solución: 4.1. Haga una estimación por intervalo del % poblacional de votación Nulo o en blanco, con una confianza del 95%. Datos muestrales:
n 750 ; x 81 Entonces:
81 0,108; y q = 0,892 750 El error estándar de la proporción es igual a: P
p
0,108 0,892 0,0113 750
El valor de Z para una confianza del 95% es 1,96. Entonces, el intervalo de la proporción está dado por:
p 0,108 1,96 0,0113 p 0,108 0,022 ; con una probabilidad del 95%. 0,086 p 0,13 ; con una probabilidad del 95%. La proporción poblacional de intención de voto nulo o en blanco fluctúa entre el 8,6% y el 13,0%, con una confianza del 95%.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
4.2. Construya un intervalo de confianza del 90% para la proporción poblacional de mujeres que votaría por el candidato A. Datos muestrales:
n 420 ; x 194 Entonces:
P
194 0,462; y q = 0,538 420
El error estándar de la proporción es igual a:
p
0,462 0,538 0,0243 420
El valor de z para una confianza del 95% es 1,645. Entonces, el intervalo de l proporción está dado por:
p 0,462 1,645 0,0243 p 0,462 0,040 ; con una probabilidad del 90%. 0,422 p 0,502 ; con una probabilidad del 90%. La proporción poblacional de intención de voto de las mujeres por el candidato A fluctúa entre el 42,2% y el 50,2%, con una confianza del 90%.
4.3. En la población de votantes del candidato B, calcule un intervalo de confianza del 95% para la proporción de hombres. Datos muestrales:
n 327 ; x 168 Entonces:
P
168 0,514; y q = 0,486 327
El error estándar de la proporción es igual a:
p
0,514 0,486 0,0276 327
El valor de z para una confianza del 95% es 1,96. Entonces, el intervalo de l proporción está dado por:
p 0,514 1,96 0,0276 p 0,514 0,054 ; con una probabilidad del 95%. 0,460 p 0,568 ; con una probabilidad del 95%. En la población de intención de voto del candidato B, la proporción de hombres fluctúa entre el 46,0% y el 56,8%, con una confianza del 95%.
9
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
10
5. Jóvenes desocupados en España Se ha determinado mediante encuesta con muestra grande, un intervalo de confianza para la proporción de jóvenes españoles que actualmente se encuentra desocupado. El estudio llegó a establecer con un 95% de confianza, que entre el 37,4% y el 44,6% de la población joven, actualmente está desocupada. De acuerdo a este estudio, determine lo siguiente: 5.1. ¿Cuál fue, en este estudio, la proporción muestral de jóvenes desocupados? 5.2. ¿Cuál es el error de investigación en este trabajo? 5.3. En este estudio, ¿cuál es el error estándar de la proporción de jóvenes españoles que está desocupado? Solución: 5.1. ¿Cuál fue, en este estudio, la proporción muestral de jóvenes desocupados? En un intervalo de confianza, la proporción muestral es el punto medio del intervalo. Gráficamente, la situación se puede representar así:
2,5%
2,5%
95%
Pi P
37,4%
44,6%
Por lo tanto, en este caso, la proporción muestral P es igual a:
P
37,4 44,6 41,0% 2
En la muestra, el 41% de los encuestados jóvenes, está desocupado.
5.2. ¿Cuál es el error de investigación en este trabajo? El error de investigación, o simplemente error, es la cantidad que se suma y se resta a la proporción muestral para obtener los límites del intervalo de confianza. Entonces: e 44,6 41,0 3,6% El error en esta investigación fue del 3,6%. En efecto, restando y sumando esta cantidad a la proporción muestral, se obtienen los límites del intervalo de confianza señalado.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
11
5.3. En este estudio, ¿cuál es el error estándar de la proporción de jóvenes españoles que está desocupado? El error estándar se puede obtener del error de investigación, ya que:
e Z p Como el error fue 3,6%, es decir, 0,036 y para el 95% de confianza z = 1,96, entonces:
0,036 1,96 p Despejando:
p
0,036 0,018367 1,96
Es decir, el error estándar o muestral en la investigación fue, aproximadamente, un 1,84%.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
12
6. Mobbing Se desea estudiar la proporción de la población de trabajadores que ha sido objeto de mobbing en el curso del último año. 6.1. Señale el tamaño de la muestra para un error no superior al 6% en la estimación. Indique las condiciones en que se daría ese error. 6.2. Calcule el tamaño de la muestra para un 95% de confianza con un error no superior al 4%. Solución: 6.1. Señale el tamaño de la muestra para un error no superior al 6% en la estimación. Indique las condiciones en que se daría ese error. Se tiene como dato que e = 0,06. Entonces:
n
1 0,06 2
= 277,7 278 trabajadores.
Con esta muestra se lograría una confianza de al menos 95%, asumiendo que p = 0,5.
6.2. Calcule el tamaño de la muestra para un 95% de confianza con un error no superior al 4%. Se tiene como dato que e = 0,04 y que z = 1,96. Entonces:
n
1,96 2 · 0,25 0,04 2
= 600,25 601 trabajadores.
En estas condiciones, el estudio requeriría una muestra de 601 trabajadores.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
13
7. Estudio de mercado Se desea investigar qué % de la población del segmento C2-C3 se interesa por contratar un seguro de vida. Para los efectos se debe determinar el tamaño de la muestra. 7.1. Si no se tiene ningún otro dato, y el tamaño de la muestra debe asegurar, a lo más un 2,5% de error. 7.2. Si se quiere un error no superior al 4% y una confianza del 99%, ¿cuál sería el tamaño adecuado de la muestra? 7.3. Si se sabe que, aproximadamente el 12% de esta población estaría interesada en un seguro de vida, se quiere un error no superior al 4% y un nivel de confianza del 95%, ¿cuál sería el tamaño mínimo de la muestra? 7.4. Si se cuenta con recursos para encuestar una muestra de solo 800 personas de la población y no se tiene ningún otro dato, calcule el error de investigación con este tamaño de muestra, si se desea trabajar con un 95% de confianza.
Solución: 7.1. Si no se tiene ningún otro dato, y el tamaño de la muestra debe asegurar, a lo más un 2,5% de error.
n
n
1 e2
1 0,025 2
1.600.
Para las condiciones dadas, el tamaño de la muestra debe ser de 1.600 sujetos de la población definida. Con esta muestra se lograría una confianza de al menos 95%, asumiendo que p = 0,5. 7.2. Si se quiere un error no superior al 4% y una confianza del 99%, ¿cuál sería el tamaño adecuado de la muestra?
n n
z 2 0,25 e2 2,58 2 0,25 0,04 2
= 1.040.
Para las condiciones dadas, el tamaño de la muestra debe ser de 1.040 sujetos de la población definida.
7.3. Si se sabe que, aproximadamente el 12% de esta población estaría interesada en un seguro de vida, se quiere un error no superior al 4% y un nivel de confianza del 95%, ¿cuál sería el tamaño mínimo de la muestra?
n
n
z2 p q e2
1,96 2 0,12 0,88 0,04 2
= 254
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
14
Para las condiciones señaladas, el tamaño de la muestra debe ser de al menos 254 sujetos de la población definida.
7.4. Si se cuenta con recursos para encuestar una muestra de solo 800 personas de la población y no se tiene ningún otro dato, calcule el error de investigación con este tamaño de muestra, si se desea trabajar con un 95% de confianza. El error de investigación estaría dado por:
e 1,96
0,5 0,5 0,034648232 800
Esto es, un error del 3,46%.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
8. Candidato a Alcalde En la comuna de Quilleco, con un universo de 5.422 votantes, un candidato a Alcalde encarga una encuesta para determinar el porcentaje de votantes que apoyan su candidatura, con una confianza del 95% y un error no mayor al 4%. Un estudio exploratorio indicó que esa cifra llega al 28,5%. 8.1. ¿Cuál es el tamaño adecuado de la muestra?
Solución: 8.1. ¿Cuál es el tamaño adecuado de la muestra? N = 5.422 IC (95%)
Z 0,975 1,96
e 4%
e = 0,04
p 0,285
q = 0,715
Tamaño de la muestra sin considerar el tamaño de la población es:
n1
1,962 ·0,285 · 0,715 0,042
= 489, 3 490 votantes.
Cálculo del factor de corrección de población finita:
k
1 = 0,9173 489 1 5422
Entonces, finalmente: n 490 · 0,9173 = 450 votantes. El citado estudio requiere una muestra aleatoria de 450 votantes.
15
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
16
9. Al menos una empresa deudora Se sabe que en cierto sector industrial, el 18,5% de las empresas tienen sus cotizaciones provisionales impagas. Se desea seleccionar una muestra aleatoria de esta población que tenga, con una confianza del 99%, al menos una empresa en esta situación. ¿Cuál será el tamaño adecuado de la muestra? Solución: Confianza del 99%
p 0,185 Luego: n
1 – 0,99 = 0,01
1 p 0,815
log 0,01 = 22,5 23 empresas seleccionadas al azar. log 0,815
Se tiene un 99% de probabilidades de que resulte al menos una empresa con cotizaciones impagas, en una muestra aleatoria de tamaño 23.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
17
10. Reforma laboral Un estudio realizado con 385 trabajadores dependientes reveló 258 a favor de cierta reforma laboral. 10.1. ¿Cuál es el error muestral en este estudio? 10.2. ¿Cuál es la probabilidad de que la proporción poblacional de personas que opinan así sea mayor al 70%? 10.3. Calcule un intervalo de confianza del 95% para la proporción poblacional de trabajadores a favor de la reforma laboral. 10.4. Si se quiere un intervalo de confianza del 99% para la proporción poblacional de trabajadores a favor de la reforma laboral con un error inferior al 3%, ¿cuál debería ser el tamaño adecuado de la muestra?
Solución: Es un problema de proporciones, con n = 385 y x = 258. 10.1. ¿Cuál es el error muestral en este estudio? La proporción muestral es: p = 258/385 = 0,670
El error muestral es: p =
0,67 0,33 = 0,0240. 385
R: El error muestral en este estudio es 0,024, lo que equivale al 2,4%.
10.2. ¿Cuál es la probabilidad de que la proporción poblacional de personas que opinan así sea mayor al 70%? Estandarizando: Según tabla z:
z=
0,7 0,67 = 1,25 0,024
p (z 1,25) = 0,1057.
La probabilidad de que los trabajadores que piensan así sean más del 70% es 0,1057.
10.3. Calcule un intervalo de confianza del 95% para la proporción poblacional de trabajadores a favor de la reforma laboral. Tenemos que: p = 0,024 Entonces:
y que: z0,975 = 1,96
IC (95) p = 0,67 1,96 · 0,024 = 0,67 0,047
La proporción poblacional está entre el 62,3 y el 71,7%, con un 95% de probabilidades.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
18
10.4. Si se quiere un intervalo de confianza del 99% para la proporción poblacional de trabajadores a favor de la reforma laboral con un error inferior al 3%, ¿cuál debería ser el tamaño adecuado de la muestra? De los resultados anteriores se tiene: p = 0,67. Para un 99% de confianza se requiere z 0,995 2,58 Entonces:
n
2,582 · 0,67 · 0,33 0,032
= 1.635 trabajadores
Entonces, el tamaño de la muestra tendría que ser de 1.635 trabajadores.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
19
11. Crisis económica Se realiza un estudio con una muestra aleatoria de 657 familias del Gran Santiago, de las cuales 278 han debido pedir préstamos para enfrentar las dificultades originadas por la crisis económica. 11.1. ¿Es suficiente esta información para afirmar, con un 10% de significación, que en la población del Gran Santiago, más de un 40% de las familias ha debido recurrir a préstamos para enfrentar la crisis? 11.2. En el contexto del caso, ¿en qué consiste cometer error de tipo II en el contraste anterior?
Solución: 11.1. ¿Es suficiente esta información para afirmar, con un 10% de significación, que en la población del Gran Santiago, más de un 40% de las familias ha debido recurrir a préstamos para enfrentar la crisis? Nivel de significación: 0,10 . Planteamiento de las hipótesis: La hipótesis nula es: H0: p = 0,40 Hipótesis alternativa: H1: p > 0,40; ensayo de cola derecha. Nótese que las hipótesis planteadas con consistentes con el enunciado del problema. Cálculos: La proporción muestral es igual a:
278 = 0,423 657
P
Si H0 es verdadera, entonces el error muestral es igual a:
p
0,40 · 0,60 = 0,0191 657
Importante: Nótese que se usa p = 0,40, tal como lo expresa la hipótesis nula y no la P muestral 0,423. Esto es porque el método asume que la hipótesis nula es verdadera hasta que los datos prueben lo contrario. El estadístico de prueba es igual a:
z
0,423 0,40 = 1,20 0,0191
Cálculo del valor-p: En este caso, el valor-p es la probabilidad de que Z sea mayor a 1,21. Se toma el lado “mayor que” porque el ensayo es de cola derecha.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
Valor p:
20
* P (z > 1,20) = 0,1151 (según tabla)
Decisión: Para decidir se compara el valor-p ( * ) con el nivel de significación ( ) Como * 0,10; NO se rechaza la hipótesis nula, al 10%. Conclusión: De acuerdo a los datos, es posible afirmar que el % de familias del Gran Santiago que han debido recurrir a préstamos para enfrentar la crisis no supera el 40% (p = 0,1151).
11.2. En el contexto del caso, ¿en qué consiste cometer error de tipo II en el contraste anterior? El error de tipo II se comete al no rechazar la hipótesis nula sendo que es falsa. En este caso es “aceptar” que en la población del Gran Santiago el 40% de las familias ha debido recurrir a préstamos para enfrentar la crisis, siendo que es falso.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
21
12. Estrés laboral Se encontró, en una muestra de 136 trabajadores del nivel ejecutivo de una empresa de venta de intangibles, un total de 25 que presentan síntomas emocionales, con ansiedad y ánimo depresivo, expresados como desánimo y hastío por el trabajo. Los directivos de la empresa declararon, que si bien estos corresponden a síntomas de estrés laboral, el fenómeno no alcanza a afectar a más del 20% de sus ejecutivos, proporción considerada como “normal” para el tipo de trabajo que desarrollan. Con una significación del 1%, ¿es posible con estos resultados refutar la declaración de los directivos de la empresa? Solución: Se trata de un contraste de proporciones, en donde los directivos desean probar que el fenómeno descrito afecta a menos del 20% de sus ejecutivos. Como la proporción muestral es 18,4% resulta atractivo realizar dicho contraste. Nivel de significación: 0,01 . Hipótesis:
H0 :
p = 0,20
H1 :
p 0,20
(ensayo de cola izquierda).
Datos y cálculos: Proporción muestral: P = 25/136 = 0,1838
0,20 · 0,80 = 0,0343 136
Error muestral:
p
Estadístico de prueba:
Z
Cálculo del valor-p:
* = P(Z < -0,47) = 0,3192 (según tabla)
0,1838 0,20 = -0,47 0,0343
Decisión: Como * > , ya que 0,3192 > 0,01; entonces, no se puede rechazar H0, al 1%. Conclusión: La proporción de afectados por los síntomas del estrés laboral no es menor al 20% (p = 0,3192). Por lo tanto, con los datos con que se cuenta, es posible refutar la declaración de los directivos. Comentario: (1) El hecho de que el % muestral (18,4%) sea menor que el planteado en la hipótesis nula (20%), no lleva necesariamente a inferir que en la población ocurre lo mismo. Como sabemos, la proporción muestral tiene cierta variabilidad (error muestral) y, por lo tanto, el 18,4% perfectamente cae dentro de los valores posibles del 20% poblacional. (2) El método de contraste de hipótesis “protege” a la hipótesis nula. Es más, la considera verdadera hasta que los datos empíricos demuestren que la diferencia es significativa, tal que no hay más remedio que rechazarla. Esta situación se ve reforzada por el hecho de que la probabilidad de rechazar la hipótesis nula es de solo un 1%, correspondiente al nivel de significación empleado en la prueba.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
22
13. Televisores en el hogar Cierta publicación afirma que el 60% de los hogares chilenos tiene más de un televisor en casa. Para verificar esta afirmación se hace un muestreo en 340 hogares, resultando 184 que, efectivamente, tienen más de un televisor. De acuerdo a los datos: 13.1. ¿Es suficiente este dato numérico para apoyar la afirmación de la publicación? Use un 5% de significación. 13.2. ¿En qué consiste el error de tipo I en el contraste anterior? Solución: 13.1. ¿Es suficiente este dato numérico para apoyar la afirmación de la publicación? Se trata de una prueba de hipótesis de proporciones en diseño de dos colas. Hipótesis
H0 :
p = 0,60
H1 :
p 0,60
(ensayo de dos colas).
Datos y cálculos: Nivel de significación: Proporción muestral:
0,10 (está dado al principio) P = 184/340 = 0,541
Error muestral:
p
Estadístico de prueba:
Z
0,60 · 0,40 = 0,0266 340
0,541 0,60 = -2,22 0,0266
Valor-p: Cálculo del valor-p:
* = 2 · P(Z < -2,21) = 2 · 0,0132 = 0,0264
Nótese que el valor-p de una cola se multiplica por dos, porque el ensayo es bilateral (de dos colas). Decisión: Como * < 0,05; entonces, se rechaza H0 con un 5% de significación. Conclusión: Al 5%, la proporción de hogares con más de un televisor NO es el 60% (p = 0,0264) La información presentada no resulta suficiente para apoyar la afirmación publicada.
13.2. ¿En qué consiste el error de tipo I en el contraste anterior? El error de tipo I consiste en rechazar una hipótesis nula siendo que es verdadera. En este caso, consiste en rechazar que el 60% de los hogares chilenos tiene más de un televisor en casa, siendo que es verdadero.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
23
14. Muerte de Osama bin Laden A una semana de que Estados Unidos anunciara la muerte de Osama bin Laden, se hizo una encuesta a 956 norteamericanos mayores de 18 años, con los siguientes resultados:
Un total de 526 cree que realmente bin Laden está muerto.
Solo 135 piensan que la muerte de bin Laden aquietará el terrorismo internacional.
Un total 318 creen que la muerte de bin Laden es un montaje de Estados Unidos.
Con estos datos y un 5% de significación, se pide contrastar las siguientes hipótesis, construyendo las conclusiones del caso. 14.1. El 15% cree que la muerte de bin Laden aquietará el terrorismo internacional. 14.2. Menos del 60% cree que bin Laden está muerto. 14.3. Más del 30% cree que la muerte de bin Laden es un montaje de Estados Unidos.
Solución: 14.1. El 15% cree que la muerte de bin Laden aquietará el terrorismo internacional Significación: = 0,05 Hipótesis en contraste:
H0 : p 0,15 H1 : p 0,15 La hipótesis alternativa conduce a una prueba de dos colas. Cálculos muestrales: n 956 x 135
P
135 0,1412 956
p
0,15 0,85 0,01155 956
Cálculo del estadístico de prueba:
z
0,1412 0,15 -0,76 0,01155
Cálculo del valor p:
* 2 P(z 0,76) 2 0,2236 = 0,4472 Decisión: Como * , no se rechaza la hipótesis nula. Conclusión:
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
Se puede afirmar, con un 5% de significación, que el 15% de los norteamericanos cree que la muerte de bin Laden aquietará el terrorismo internacional (p = 0,4476).
14.2. Menos del 60% cree que bin Laden está muerto. Significación: = 0,05 Hipótesis en contraste:
H0 : p 0,60 H1 : p 0,60 La hipótesis alternativa conduce a una prueba de cola izquierda. Cálculos muestrales: n 956 x 526
P
526 0,5502 956
p
0,6 0,4 0,01584 956
Cálculo del estadístico de prueba:
z
0,5502 0,6 -3,14 0,01584
Cálculo del valor p:
* P(z 3,14) 0,0008 Decisión: Como * , se rechaza la hipótesis nula. Conclusión: Se puede afirmar, con un 5% de significación, que menos del 60% de los norteamericanos cree que la bin Laden está muerto (p = 0,0008).
14.3. Más del 30% cree que la muerte de bin Laden es un montaje de Estados Unidos. Significación: = 0,05 Hipótesis en contraste:
H0 : p 0,30 H1 : p 0,30 La hipótesis alternativa conduce a una prueba de cola izquierda.
24
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
25
Cálculos muestrales: n 956 x 318
P
318 0,3326 956
p
0,3 0,7 0,01482 956
Cálculo del estadístico de prueba:
z
0,3326 0,3 2,20 0,01482
Cálculo del valor p:
* P(z 2,20) 0,0139
Decisión: Como * , se rechaza la hipótesis nula, al 5%. Conclusión: Se puede afirmar, con un 5% de significación, que menos más del 30% de los norteamericanos cree que la muerte de bin Laden es un montaje de Estados Unidos (p = 0,0139).
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
26
15. Infidelidad con la pareja Una investigación estudió, con una muestra aleatoria de sujetos de sexo masculino mayores de 18 años y a un nivel de significación , la proporción de hombres que poseen el gen alelo 334, que sería el factor biológico que está a la base de los casos de infidelidad con la pareja. El estudio llegó a las conclusiones siguientes:
C1: El porcentaje de hombres que posee el gen alelo 334 es mayor al 40%.
C2: De los hombres que poseen el gen alelo 334, el 65% ha sido infiel a su pareja, al menos una vez.
De acuerdo a esta información: 15.1. Indique, en lenguaje algebraico, la hipótesis alternativa en el contraste que llevó a la conclusión C1. 15.2. Indique, en lenguaje corriente, la hipótesis nula en el contraste que llevó a la conclusión C2. 15.3. Indique en qué consiste el error de tipo II en el contraste que llevó a la conclusión C1. 15.4. Indique en qué consiste el error de tipo I en el contraste que llevó a la conclusión C2. 15.5. Indique cuál fue la decisión en el contraste que llevó a la conclusión C1. 15.6. Indique cuál fue la decisión en el contraste que llevó a la conclusión C2.
Solución: 15.1. Indique, en lenguaje algebraico, la hipótesis alternativa en el contraste que llevó a la conclusión C1. En un contraste de hipótesis de proporciones la hipótesis alternativa siempre es p p 0 , p p0 o p p0 . En lenguaje algebraico esto es: H1 : p 0,40. 15.2. Indique, en lenguaje corriente, la hipótesis nula en el contraste que llevó a la conclusión C2. En un contraste de hipótesis de proporciones la hipótesis nula siempre es p p 0 . En este caso es H0 : p 0,65. En lenguaje corriente, esto es: El 65% de los hombres que poseen el gen alelo 334, han sido infieles a su pareja. 15.3. Indique en qué consiste el error de tipo II en el contraste que llevó a la conclusión C1. En un contraste, se comete el error de tipo II, al no rechazar (“aceptar”) la hipótesis nula, siendo que es falsa. En este caso consistiría en no rechazar que el 40% de los hombres posee el gen alelo 334, siendo que es falso.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
27
15.4. Indique en qué consiste el error de tipo I en el contraste que llevó a la conclusión C2. El error de tipo I es rechazar la hipótesis nula, siendo que es verdadera. En este caso consistiría en rechazar que el 65% de los hombres que poseen el gen alelo 334 ha sido infiel a su pareja, siendo que es verdadero. 15.5. Indique cuál fue la decisión en el contraste que llevó a la conclusión C1. En un contraste de hipótesis, siempre la decisión se toma respecto de la hipótesis nula. Como en el contraste que llevó a la conclusión C1 la hipótesis nula es que el 40% de los hombres poseen el gen alelo 334, entonces, significa que dicha hipótesis fue rechazada, a favor de la alternativa H0: p > 0,40. La decisión fue, entonces, rechazo de H0, a un nivel de significación . 15.6. Indique cuál fue la decisión en el contraste que llevó a la conclusión C2. Como en el contraste que llevó a la conclusión C2 la hipótesis nula es que, el 65% de los hombres que poseen el gen alelo 334 ha sido infiel a su pareja, entonces, significa que dicha hipótesis no fue rechazada, ya que confirma la conclusión. La decisión fue, entonces, NO rechazo de H0, a un nivel de significación .
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
28
16. Consumo cultural En el marco de un estudio sobre hábitos de consumo cultural, se consultó a los encuestados si escuchaban música a diario. De un total de 425 mujeres y 560 hombres encuestados, 148 mujeres y 160 hombres declararon que sí escuchaban música diariamente. Con estos datos: 16.1. La proporción de personas que escuchan música a diario, ¿es mayor en las mujeres que en los hombres? Use un 5% de significación.
Solución: Planteamiento de hipótesis: H0: p M p H = 0 H1: p M p H > 0
Datos muestrales: Mujeres (M)
Hombres (H)
TOTAL
Muestra
425
560
985
Casos favorables
148
160
308
148/425=0,348
160/560=0,286
308/985=0,313
P muestral
El error muestral de la diferencia de proporciones es igual a:
1 1 pM pH 0,313 · 0,687 · = 0,0298 425 560 Cálculo del estadístico de prueba:
z obs
0,348 0,286 = 2,08 0,0298
Nótese que en el numerador se ordenaron las proporciones muestrales tal cual lo expresa la hipótesis nula p M p H . El valor p de la prueba es: * P(z > 2,08) = 0,0188 (según tabla z) Decisión: Como * 0,05, se rechaza H0, al 5%. Conclusión: la proporción de mujeres que diariamente escuchan música es mayor que la proporción de hombres que lo hacen (p = 0,0188).
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
29
17. Mar a Bolivia Se encuesta una muestra aleatoria de chilenos mayores de 18 años para indagar sobre su opinión respecto de dar salida al mar a Bolivia a través de territorio chileno. Según nivel socioeconómico NSE (alto, bajo) las posiciones fueron las siguientes: Nivel Socioeconómico (NSE) POSICIÓN
Total
Alto
Bajo
Absoluto Desacuerdo
107
83
190
De acuerdo
191
261
452
Total
298
344
642
Sobre la base de estos datos: 17.1. Calcule un intervalo de confianza del 95% para la proporción poblacional de chilenos que están de acuerdo con dar salida al mar a Bolivia a través de territorio chileno. 17.2. Si se desea establecer con un 95% de confianza la proporción poblacional de chilenos que están de acuerdo con dar salida al mar a Bolivia a través de territorio chileno, con un error de no más del 2%, ¿cuál es el tamaño de muestra necesario? 17.3. Se afirma que “El % de chilenos que está en absoluto desacuerdo con la iniciativa es mayor en el NSE Alto que en NSE Bajo”. Con los datos generados en la investigación, realice un contraste de hipótesis con un 5% de significación para validar la afirmación del texto. Solución: 17.1. Calcule un intervalo de confianza del 95% para la proporción poblacional de chilenos que están de acuerdo con dar salida al mar a Bolivia a través de territorio chileno. Datos muestrales: n 642 ; x 452 La proporción muestral es igual a:
P
452 0,704 642
El error estándar de la proporción es igual a:
p
0,704 · 0,296 = 0,0180 642
El intervalo del 95% está dado por:
p 0,704 1,96 · 0,0180 p 0,704 0,03528 ; con un 95% de confianza.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
30
De acuerdo a los datos, la proporción de chilenos que está de acuerdo con dar salida al mar a Bolivia a través de territorio chileno fluctúa entre el 66,9% y el 73,9%, con un 95% de confianza.
17.2. Si se desea establecer con un 95% de confianza la proporción poblacional de chilenos que están de acuerdo con dar salida al mar a Bolivia a través de territorio chileno, con un error de no más del 2%, ¿cuál es el tamaño de muestra necesario?
n
1,96 2 · 0,704 · 0,296 0,02 2
2.001.
La muestra tendría que ser de tamaño 2.001, al menos.
17.3. Se afirma que “El % de chilenos que está en absoluto desacuerdo con la iniciativa es mayor en el NSE Alto que en NSE Bajo”. Con los datos generados en la investigación, realice un contraste de hipótesis con un 5% de significación para validar la afirmación del texto. Se utilizarán los subíndices A = NSE Alto y B = NSE Bajo. Nivel de significación: 5% 0,05 Planteando las hipótesis del caso:
H0 : p A p B 0 H1 : p A p B 0 La hipótesis alternativa conduce a un ensayo de cola derecha. Datos muestrales:
n A = 298;
x A = 107;
PA = 107/298 = 0,359
nB = 344;
x B = 83;
PB = 83/344 = 0,241
n = 642;
x T = 190;
ˆ = 190/642 = 0,296 p
El error estándar de la diferencia de proporciones es igual a:
pA pB =
0,296 · 0,704 ·(
1 1 ) = 0,0361 298 344
El estadístico z de prueba es igual a: Z=
0,359 0,241 3,27 0,0361
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
31
El valor p de la prueba es igual a:
* P(z 3,27) 0,0005 Como * < , se rechaza la hipótesis de igualdad de proporciones, con un 5% de significación. Conclusión: Por lo tanto, sobre la base de los datos, es posible afirmar, con un 5% de significación, que el % de chilenos que está en absoluto desacuerdo con dar salida al mar a Bolivia a través de territorio chileno, es mayor en el NSE Alto que en NSE Bajo (p = 0,0005).
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
32
18. Nutrición y tabaquismo en la tercera edad En el marco de una investigación de salud y nutrición en la tercera edad, se investiga el hábito de fumar y el estado nutricional en una muestra de 125 personas que presentan desnutrición y 250 que presentan un estado de nutrición normal. Los datos generados permitieron construir la tabla siguiente: Estado nutricional Normal Desnutrición Total
Fuma Sí 55 40 95
No 195 85 280
Total 250 125 375
Con estos datos: 18.1. Calcular un intervalo de confianza del 95% para la proporción de la tercera edad en estado normal de nutrición que fuma. 18.2. Contraste al 5% la hipótesis relacionada con la afirmación: “Menos del 30% de las personas de la tercera edad en estado de desnutrición, fuman”. 18.3. Realice, al 5%, el test correspondiente para contestar la pregunta de investigación: “Las personas de la tercera edad en estado de desnutrición ¿fuman en mayor proporción que los de estado normal de nutrición?”. 18.4. ¿Cuántas personas más de la población de personas con desnutrición se requieren encuestar para trabajar con un 95% de confianza y un error de no más del 5%?
Solución: 18.1. Con los datos de la fila “normal” de la tabla se obtiene:
n 250;
x 55 fuman;
p
55 = 0,22 250
Entonces, el error muestral de la proporción es:
p
0,22 · 0,78 = 0,0262 250
Luego, el intervalo del 95% confianza para la proporción poblacional es igual a: p = 0,22 1,96 · 0,0262 p = 0,22 0,051 ; con un 95% de confianza. La proporción poblacional de personas de la tercera edad en estado normal de nutrición que fuma fluctúa entre el 19,9% y el 27,1%, con un 95% de confianza.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
33
18.2. Contraste: se trata de una dócima de la proporción, de cola izquierda. Planteando las hipótesis: H0: p = 0,30 H1: p < 0,3 (ensayo de cola izquierda) Cálculos muestrales:
n 125; p
p
x 40 fuman;
40 = 0,32 125
0,3 · 0,7 = 0,0410 125
Estadístico de prueba: 0,32 0,3 = 0,49 z 0,0410 Valor p: * P(z < 0,49) = 0,6879 No se rechaza la hipótesis nula, al 5%. Conclusión: El % de personas de la tercera edad en estado de desnutrición que fuman no es menor al 30% (p = 0,6879)
18.3. Contraste: se trata de un test de diferencia de proporciones. El tipo de ensayo – cola derecha o cola izquierda – dependerá de cómo se plantee la hipótesis nula. Hipótesis: Haciendo: D = Desnutrición; N = Normal H0: p D p N = 0 H0: p D p N > 0; (conduce a un ensayo de cola derecha) Datos muestrales: Normal (N):
n N 250;
x N 55 fuman;
PN
55 = 0,22 250
Desnutrición (D):
n D 125;
x D 40 fuman;
PD
40 = 0,32 125
Total (T):
n T 375;
x T 95 fuman;
ˆ p
Error muestral de la diferencia de proporciones:
1 1 p D p N 0,253 · 0,747 · = 0,0476 250 125 Cálculo del estadístico de prueba:
95 = 0,253 375
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
z obs
34
0,32 0,22 = 2,10 0,0476
Valor p de la prueba: * P(z > 2,08) = 0,0188 (según tabla). Como el valor p es menor a la significación, se rechaza H0 al 5%. Conclusión: Las personas de la tercera edad en estado de desnutrición, fuman en mayor proporción que los de estado normal de nutrición (p = 0,0188).
18.4. Tamaño de la muestra
40 = 0,32 125
Para el segmento con desnutrición se tiene:
p
Para el 5% de confianza, el valor de Z:
Z 0,975 1,96
El error del 5% es:
e = 0,05
Entonces:
n
1,96 2 · 0,32 · 0,68 0,05 2
= 335 personas
Por lo tanto, se necesitan 335 – 125 = 207 persona más con desnutrición.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
35
19. Reformas laborales Se ha investigado mediante encuesta la posición de acuerdo o no, con ciertas reformas laborales que impulsa el gobierno. Según el encuestado sea o no partidario del gobierno, la tabla muestra los resultados, en número de casos.
Partidario del gobierno
Sí No
De acuerdo con reforma Sí No 53 18 38 40
19.1. Si la investigación trabaja con un 95% de confianza, calcule el error de investigación para la proporción de personas que están de acuerdo con las reformas laborales que propone el gobierno. 19.2. Calcule un intervalo de confianza del 95% para la proporción poblacional de personas que están de acuerdo con las reformas laborales que propone el gobierno. 19.3. Calcule el tamaño de la muestra para que, trabajando con un 95% de confianza, el error en la proporción de personas que son partidarios de las reformas del gobierno no exceda el 2,5%. 19.4. Calcule la probabilidad de que la proporción poblacional de personas que están de acuerdo con las reformas laborales que propone el gobierno sea mayor que el 60%. 19.5. A un nivel del 5% de significación, contraste la hipótesis de que el grado de acuerdo con las reformas es independiente de si el sujeto es o no partidario del gobierno.
Solución: 19.1. Si la investigación trabaja con un 95% de confianza, calcule el error de investigación para la proporción de personas que están de acuerdo con las reformas laborales que propone el gobierno. Se tiene que: n = 149 y x = 91. z 1,96 para un 95% de confianza. Entonces: P = 91/149 = 0,611; y q = 1 – 0,611 = 0,389. Entonces, el error de investigación de la proporción es:
e 1,96
0,611 0,389 = 0,0783 149
El error de investigación llega al 7,83%. Nota: este error es un poco alto respecto de lo usualmente deseado. Especial importancia adquiere este error cuando los resultados de investigación han de usarse para la toma de decisiones con impacto social. Una forma de reducir este error es bajando la confianza,
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
36
pero eso es un mecanismo poco deseado porque no resuelve el tema de la incertidumbre respecto de la proporción poblacional. El mejor camino es aumentar el tamaño de la muestra.
19.2. Calcule un intervalo de confianza del 95% para la proporción poblacional de personas que están de acuerdo con las reformas laborales que propone el gobierno. Se tiene que: n = 149 y x = 91. z 1,96 para un 95% de confianza. Entonces: P=
91 = 0,611 149
El error muestra es igual a:
p
0,611 0,389 = 0,03994 149
Entonces, la proporción poblacional es igual a: p = 0,611 1,96 0,03994 p = 0,611 0,078; con un 95% de confianza. O bien: 0,533 < p < 0,689; con una probabilidad del 95%. Con un 95% de confianza se puede afirmar que en la población, entre el 53,3 y el 68,9% de las personas está de acuerdo con las reformas laborales auspiciadas por el gobierno. En este resultado se nota caramente el impacto del tamaño de la muestra, que en este caso es relativamente chico, ya que el error llega cerca al 7,8%, lo que deja un intervalo con más de un 15% de amplitud. Una forma de aumentar la precisión del intervalo, es decir, dejarlo de menor amplitud, es disminuyendo la confianza, pero eso resulta, a su vez, en una baja en la confianza. Un vez más se manifiesta la necesidad de aumentar el tamaño de la muestra para disminuir el error.
19.3. Calcule el tamaño de la muestra para que, trabajando con un 95% de confianza, el error en la proporción de personas que son partidarios de las reformas del gobierno no exceda el 2,5%. El tamaño de la muestra está dado por:
n
1,962 0,611 0,389 0,025 2
n = 1.461 sujetos.
1.460,9
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
37
Es decir, para que el error de investigación no sea mayor al 2,5% se requiere una muestra de tamaño 1.461. En este resultado se nota el impacto del aumento del tamaño de muestra en la disminución del error. Sin embargo, también se debe evaluar los costos, ya que a mayor tamaño de muestra, mayor es el costo de investigación, aspecto no menor cuando las investigaciones trabajan con presupuestos acotados.
19.4. Calcule la probabilidad de que la proporción poblacional de personas que están de acuerdo con las reformas laborales que propone el gobierno sea mayor que el 60%. Se tiene hasta el momento: P = 0,611 y
p 0,03994
Para estandarizar el 60% se usa. Z=
Z=
pi p p
0,6 0,611 = -0,27 0,03994
P(z -0,27) = 0,6064 (según tabla z) Entonces: P(p 60%) = 0,6064
19.5. A un nivel del 5% de significación, contraste la hipótesis de que el grado de acuerdo con las reformas es independiente de si el sujeto es o no partidario del gobierno. Se plantean primeramente las hipótesis que serán sometidas a contraste, con 0,05 . H0: el grado de acuerdo con las reformas laborales propuestas por el gobierno es independiente de si el sujeto es o no partidario del gobierno. H1: el grado de acuerdo con las reformas laborales propuestas por el gobierno está asociado al hecho de si el sujeto es o no partidario del gobierno. Se empleará la dócima de independencia de Chi-cuadrado, con = 5%. Para calcular el valor observado se utiliza la tabla siguiente:
Partidario del gobierno
De acuerdo con reforma Sí No Sí 53 18 No 38 40 Total 91 58
Total 71 78 149
Se comprueba que en la tabla no haya frecuencias esperadas menores a 5. Si las hubiera, se verifica que no sean en más de una celda.
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
38
Usando el método abreviado para tablas de 2 x 2 y, por el tamaño de la muestra, sin corrección de continuidad de Yates, se tiene:
2OBS
(53 40 18 38)2 149 = 10,51. 71 78 91 58
Valor p: El valor p de la prueba está dado por:
* P( 2p;1 10,51 ) = 0,0012
Decisión: Como * , se rechaza la hipótesis nula, al 5% de significación. Conclusión: Con un 5% de significación se puede afirmar que el grado de acuerdo con las reformas laborales propuestas por el gobierno, está asociado al hecho de si el sujeto es o no partidario del gobierno (p = 0,0012)
Estadística Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia en la proporción: Intervalos de confianza, tamaño de la muestra, contraste de la proporción, contraste de la diferencia de proporciones. Patricio Alcaíno Martínez – Derechos Reservados
39