Estadística Aplicada a las Ciencias Sociales
PROBLEMAS Y CASOS RESUELTOS
VOLUMEN - 1 • Estadística Descriptiva básica • Presentación y análisis básico de datos • Cálculo e interpretación de estadígrafos
Patricio Alcaíno Martínez Derechos Reservados 2012
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
2
Palabras iniciales
Estimados usuari@s: •
Este material que pongo a su disposición, está elaborado a partir de casos e investigaciones reales en distintos ámbitos de las Ciencias Sociales, los que han sido recreados para ajustarlos a un contexto educativo. Por ello, los datos, información y conclusiones presentadas no son necesariamente válidas en contextos reales.
•
Este volumen está dirigido a tratar el tema de la presentación y análisis básico de datos y el cálculo e interpretación de estadígrafos. El lector deberá manejar los conceptos y procedimientos elementales de Estadística descriptiva y exhibir competencia en el cálculo de razones, proporcionalidad y tanto por ciento.
•
Para trabajar con este material el usuario deberá hacer uso de la calculadora, demostrando capacidad para utilizar efectivamente la función estadística para cálculo de la media y desviación estándar.
•
Este material tiene Derechos Reservados y su uso está permitido solo con fines educativos.
Atentamente;
Patricio Alcaíno Martínez
Revisión: Catalina Salfate, Socióloga.
Santiago de Chile, Abril de 2012.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
3
Índice de casos Caso 1: Población, índice de masculinidad e índice urbano/rural. Página 4. Se ejercitan los cálculos e interpretación de razones en una población humana. Caso 2: Embarazos no planificados. Página 8. A partir del fenómeno de los embarazos no planificados, se trabaja una completa estadística con variable continua. Caso 3: Violación a los DDHH. Página 11. El fenómeno de la violación de los DDHH en Chile da pie para trabajar con variables organizadas en tablas de contingencia, trabajando una completa estadística con variable continua. Caso 4: Clima laboral. Página 16. Breve estadística con variable cualitativa ordinal. Caso 5: Peso de recién nacidos. Página 17. Breve estadística con variable numérica no agrupada. Caso 6: Estudio de población. Página 18. Una completa estadística descriptiva que combina una variable continua con dos variables dicotómicas. Caso 7: Dieta para adelgazar. Página 25. Breve estadística con variable cualitativa nominal. Caso 8: Índice de masculinidad. Página 27. A partir de un gráfico dado, se interpreta y se obtiene información, analizando una serie de afirmaciones dadas. Caso 9: Enfermedades crónicas en adultos mayores. Página 29. Se analiza un caso con variable discreta, derivando datos e información a partir de un gráfico dado. Caso 10: Gasto en medicamentos. Página 31. Caso orientado a la interpretación de percentiles, en el contexto de un gasto mensual en medicamentos. Caso 11: Concentración de plomo en la sangre. Página 33. Estadísticas de variable continua, orientado a la interpretación de un histograma, al cálculo e interpretación de percentiles.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
Caso 1: Población, índice de masculinidad e índice urbano/rural En cierta comuna del Sur, con una población de 28.450 habitantes, se da un índice urbano/rural 0,75 y un índice de masculinidad 115,4. Esta comuna ha tenido especial interés de las autoridades de salud porque se ha detectado que 8 de cada mil habitantes presentan alteraciones genéticas atribuibles a la actividad minera de la zona, localizándose el 62,5% de los casos en las zonas urbanas. 1.1. ¿Qué indica este índice urbano/rural? 1.2. ¿A cuánto asciende la población rural de la comuna? 1.3. ¿Qué % de la población es urbana? 1.4. ¿A cuántas personas asciende la población femenina en esta comuna? 1.5. ¿Qué % de la población es masculina? 1.6. ¿Cuántas personas están afectadas de la alteración genética en esta comuna? 1.7. ¿Cuántas personas de las zonas rurales presentan la alteración genética en esta comuna? 1.8. Construya una tabla de contingencia que muestre la población de la comuna según si presenta o no alteración genética según zona de residencia.
Solución: 1.1. ¿Qué indica este índice urbano/rural? Este índice significa que hay 0,75 habitantes urbanos por cada uno rural. Amplificando por cien, indica que por cada 75 habitantes urbanos, hay 100 rurales, o bien 3 urbanos por cada 4 rurales. En resumen, indica que hay más población rural que urbana. 1.2. ¿A cuánto asciende la población rural de la comuna? En la comuna se da una relación de 3 habitantes urbanos por cada 4 rurales. Es decir, por cada 7 habitantes hay 4 rurales (y 3 urbanos). Llevando a proporción: 7 habts 28.450 habts = 4 rurales x rurales
Despejando x: x=
4 · 28.450 = 16.257. 7
R: En la comuna, la población rural llega a 16.257 habitantes.
1.3. ¿Qué % de la población es urbana? Población total = 28.450 habitantes Población urbana = 28.450 - 16.257 = 12.193 Llevando a %: 12.193 P= ·100 = 42,86% 28.450 R: En la comuna, el 42,86% de la población es urbana.
4
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
5
Otra solución: Según el índice Urbano/Rural, por cada 7 habitantes hay 3 urbanos. Llevando a proporción: P=
3 ·100 = 42,86% 7
1.4. ¿A cuántas personas asciende la población femenina en esta comuna? El índice de masculinidad de la comuna indica que hay 115,4 hombres por cada 100 mujeres. Es decir que por cada 215,4 habitantes 100 son mujeres (y 115,4 son hombres). Llevando a proporción: 215,4 habts 28.450 habts = 100 mujeres x mujeres
Despejando x: 100 · 28.450 x= = 13.208 mujeres. 215,4 R: En la comuna, la población de mujeres llega a 13.208.
1.5. ¿Qué % de la población es masculina? Población total = 28.450 habitantes Población masculina = 28.450 - 13.208 = 15.242. Llevando a %: 15.242 P= ·100 = 53,57% 28.450 R: En la comuna, el 53,57% de la población es masculina. Otra solución: Según el índice de masculinidad, por cada 215,4 habitantes hay 115,4 hombres. Llevando a proporción: P=
115,4 ·100 = 53,57% 215,4
1.6. ¿Cuántas personas están afectadas de la alteración genética en esta comuna? Según el dato, estas son 8 de cada mil. Llevando a proporción: 1.000 habts 28.450 habts = 8 afectados x afectados
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
Despejando x: 8 · 28.450 x= = 228 afectados. 1.000 R: En la comuna, la población de afectados llega a 228.
1.7. ¿Cuántas personas de las zonas rurales presentan la alteración genética en esta comuna? Según el dato, el 62,5% de los afectados corresponden a zonas urbanas. Esto significa que en las zonas rurales esta proporción alcanza al 37,5%. El 37,5% de 228 afectados es:
228 ⋅ 37,5 = 86. 100 R: De los 288 afectados, 86 habitantes rurales presentan la alteración genética en esta comuna.
1.8. Construya una tabla de contingencia que muestre la población de la comuna según si presenta o no alteración genética según zona de residencia. Para el caso de las variables asociadas, o supuestamente asociadas, se suele colocar la variable independiente en las filas y la dependiente en columnas. Así, en este caso, si se sospecha que la alteración genética es dependiente de la zona de residencia, la tabla quedaría así: Población según presenta o no alteración genética y zona de residencia Zona
Presentan la alteración genética Sí
Total
No
Urbana Rural Total
Para completar la tabla se usarán los datos dados y otros calculados anteriormente: •
Del enunciado del caso se sabe que el total de la población es 28.450.
•
De 1.2 se sabe que la población rural llega a 16.257 habitantes.
•
De 1.6 se obtiene que el total de afectados es 228.
•
De 1.7 se obtiene que de los 228 afectados, 86 son rurales.
Insertando estos datos en la tabla se llega a lo siguiente:
6
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
7
Población según presenta o no alteración genética y zona de residencia Zona
Presentan la alteración genética Sí
Total
No
Urbana Rural
86
16.257
Total
228
28.450
El resto de la tabla se completa por diferencias, llegando finalmente a la siguiente tabla de frecuencias:
Población comunal según alteración genética y zona de residencia Zona
Presenta alteración genética Sí
No
Total
Urbana
142
12.051
12.193
Rural
86
16.171
16.257
Total
228
28.222
28.450
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
8
Caso 2: Embarazos no planificados El siguiente cuadro muestra la edad de las mujeres que presentan embarazos no planificados, según un estudio muestral realizado en cierta región del norte de Argentina: Mujeres con embarazos no planificados por edad Edad
%
12 a 14 años
3
15 a 19 años
57
20 a 24 años
33
25 a 29 años
7
Total
100
A partir de este dato: 2.1. Calcule la edad promedio de las mujeres que presentan embarazos no planificados en este estudio, su desviación estándar y su coeficiente de variación. 2.2. Trace un gráfico de caja y bigotes de la edad de las mujeres que presentan embarazos no planificados en este estudio. 2.3. Sobre la base de los cuartiles, construya cinco afirmaciones respecto de la muestra estudiada. 2.4. ¿Qué % de la muestra tiene menos de 18 años?
Solución: Primeramente se trasladan los datos a una tabla, a la cual se le agrega la columna de límites reales, la de marcas de clase y una de frecuencias porcentuadas acumuladas. Edad 12 a 14 años 15 a 19 años 20 a 24 años 25 a 29 años Total
Edad 12 – 15 15 – 20 20 – 25 25 – 30 -
Xm 13,5 17,5 22,5 27,5 -
% 3 57 33 7 100
% acum 3 60 93 100 -
2.1. Calcule la edad promedio de las mujeres que presentan embarazos no planificados en este estudio, su desviación estándar y coeficiente de variación. Los estadísticos pedidos se pueden calcular en la calculadora, tomando los % como si fuesen frecuencias absolutas. Media = 19,73 años; Desviación Estándar = 3,28 años; CV = 16,6%.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
9
2.2. Trace un gráfico de caja y bigotes de la edad de las mujeres que presentan embarazos no planificados en este estudio. Para trazar un gráfico de caja, se requieren los cuartiles y el mínimo y máximo valor de la variable. Ya que se trabaja con % acumulados, el cuartil 1 está en el 25%, el cuartil 2 en el 50% y el cuartil 3 en el 75%. Entonces: Q1 = 15 + 5(25 – 3)/57 = 16,9 años Q2 = 15 + 5(50 – 3)/57 = 19,1 años Q3 = 20 + 5(75 – 60)/33 = 22,3 años Ya calculados los cuartiles, con sus valores se traza el gráfico de caja y bigotes. Helo aquí:
Años 12 14 16 18
20 22 24 26 28 30
Edad de mujeres con embarazo no planificado
2.3. Afirmaciones Considerando el concepto y definición de los tres cuartiles, se pueden derivar afirmaciones como las siguientes: •
El 25% de las encuestadas son menores de 16,9 años de edad
•
La cuarta parte de las mujeres con embarazo no planificado, tienen entre 12 y 16,9 años.
•
El 50% de las de las mujeres encuestadas con embarazo no planificado, son mayores de 19,1 años de edad
•
El 25% de las encuestadas son mayores de 22,3 años de edad.
•
La mitad de las encuestadas tienen entre 19,1 y 30 años.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
10
2.4. ¿Qué % de la muestra tiene menos de 18 años? Utilizando la tabla de frecuencias acumuladas: Edad 12 – 15 15 – 20 20 – 25 25 – 30 -
% 3 57 33 7 100
% acum 3 60 93 100 -
Lo que se pregunta es qué % acumula la tabla de frecuencia desde los 12 a los 18 años. Esto se resuelve con el concepto de percentil. Entonces: 18 = 15 +
5 (P − 3) 57
Donde P representa el porcentaje acumulado hasta x = 18 años. Despejando P: 5 (P − 3) 57 3 ⋅ 57 = 5(P − 3)
18 − 15 =
171 = P −3 5 34,2 + 3 = P P = 37,2 %
R: El 37,2% de las mujeres de la muestra tienen menos de 18 años.
Estadística Aplicada a las Ciencias Sociales
11
Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
Caso 3: Violación a los DDHH
La tabla siguiente muestra el resultado de una encuesta en relación a los Derechos Humanos durante el gobierno militar en Chile, realizada con el objeto de conocer la opinión de la ciudadanía chilena al respecto.
PREGUNTA: ¿Cree usted que las altas autoridades civiles del gobierno militar tenían conocimiento que se violaban los Derechos Humanos, o no tenían conocimiento? Grupo Etario (años) 18 - 24
25 - 39
Total
40 - 59
Sí, tenían conocimiento
60 – 79
167
No, no tenían conocimiento
835
111
Total
66
345
237
178
Muestra: 1.125 personas de 29 ciudades de más de 40 mil habitantes entre I y X región seleccionadas al azar.
Con los datos dados: 3.1. En la muestra total, calcule la edad media y su desviación estándar. 3.2. En los que opinan que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos, calcule la edad mediana y cuartiles 1 y 3. Interprete el valor numérico de cada uno de ellos, en el marco del caso. 3.3. En los que opinan que las autoridades NO tenían conocimiento de la violación de los derechos humanos, dibuje un gráfico de caja. 3.4. Calcule los siguientes porcentajes: 3.4.1. De los que opinan que SÍ tenían conocimiento, ¿qué % tiene 40 o más años? 3.4.2. De los que opinan que NO tenían conocimiento, ¿qué % tiene menos de 25 años? 3.4.3. De los que tienen menos de 60 años, ¿qué % cree que las autoridades NO tenían conocimiento? 3.4.4. De los que tienen 40 años o más, ¿qué % cree que las autoridades SÍ tenían conocimiento? 3.4.5. De la muestra, ¿qué % son personas menores de 40 años que creen que las autoridades SÍ tenían conocimiento?
Solución: En primer lugar se completa la tabla de frecuencias, aplicando sumas y diferencias: Conocimiento Sí, tenían conocimiento
Total
Grupo Etario (años) 18 – 24
25 – 39
40 – 59
60 – 79
302
254
167
112
835
No, no tenían conocimiento
43
111
70
66
290
Total
345
365
237
178
1.125
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
12
3.1. En la muestra total, calcule la edad media y su desviación estándar. Para calcular la media de las edades y su desviación estándar, previamente se organizan los datos en una tabla adecuada. Se tiene la precaución de expresar los límites reales y de calcular las marcas de clase (Xm) de cada intervalo. Años
Xm
Casos
18 – 25
21,5
345
25 – 40
32,5
365
40 – 60
50
237
60 – 80
70
178
Total
-
1.125
Ingresando los datos a la calculadora, resulta: x = 38,7 años, y;
σ = 16,9 años.
3.2. En los que opinan que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos, calcule la edad mediana y cuartiles 1 y 3. Interprete el valor numérico de cada uno de ellos, en el marco del caso. Para calcular los cuartiles de las edades, previamente se organizan los datos en una tabla de frecuencia. Se tiene la precaución de expresar los límites como límites reales y de calcular la columna de frecuencias acumuladas: Las autoridades SÍ tenían conocimiento. Años
Casos
Acum.
18 - 25
302
302
25 – 40
254
556
40 – 60
167
723
60 - 80
112
835
Total
835
Mediana: 15 (417,5 − 302) =31,8 años. 254 El 50% de los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, tiene, a lo más 31,8 años. Me = 25 +
•
Cuartil 1: 7 (208,75 − 0) =22,8 años. 302 El 25% de los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, tiene, a lo más 22,8 años. Q1 = 18 +
•
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
13
Entre los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, el 75% tiene, a lo menos, 22,8 años.
Cuartil 3:
Q3 = 40 + • •
20 (626,25 − 556) = 48,4 años. 167
Entre los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, el 25% tiene, a lo menos, 48,4 años. El 75% de los encuestados que opinan que las autoridades sí tenían conocimiento de la violación de los derechos humanos en Chile, tiene, a lo más 48,4 años.
3.3. En los que opinan que las autoridades NO tenían conocimiento de la violación de los derechos humanos, dibuje un gráfico de caja. Para construir un gráfico de caja de las edades de este segmento, previamente deben ser calculados los tres cuartiles. Reorganizando los datos en una tabla de frecuencias, se tiene lo siguiente: Las autoridades NO tenían conocimiento. Años
Casos
Acum.
18 - 25
43
43
25 – 40
111
154
40 – 60
70
224
60 - 80
66
290
290
Q1 ⇒
Q2 ⇒
290 = 72,5, lo que ubica al cuartil 1 en el segundo intervalo. 4 15 (72,5 − 43) =29,0 años. Q1 = 25 + 111 290 = 145, lo que ubica al cuartil 2 en el segundo intervalo. 2 Q2 = 25 +
Q3 ⇒
15 (145 − 43) =38,8 años. 111
3 ⋅ 290 = 217,5, lo que ubica al cuartil 3 en el tercer intervalo. 4 20 (217,5 − 154) =58,1 años. Q3 = 40 + 70
Además de estos valores, de acuerdo a la tabla de frecuencias, se tomará 18 años como el mínimo y 80 años como el máximo.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
14
El gráfico de caja queda de la siguiente manera:
Opinan que las autoridades no tenían conocimiento, según edad.
3.4. Calcule los siguientes % . Haciendo uso de la tabla de frecuencias se obtienen las cantidades requeridas. 3.4.1. De los que opinan que SÍ tenían conocimiento, ¿qué % tiene 40 o más años? De los 835 que opinan que las autoridades SÍ tenían conocimiento, 167 + 112 = 279 tienen 40 o más años. Llevando a %: 279 P= ·100 = 33,4% 835 R: De los que opinan que SÍ tenían conocimiento de la violación de los derechos humanos, el 33,4% tiene 40 o más años.
3.4.2. De los que opinan que NO tenían conocimiento, ¿qué % tiene menos de 25 años? De los 290 que opinan que NO tenían conocimiento, 43 tienen menos de 25 años. Llevando a %: 43 P= ·100 = 14,8% 290 R: De los que opinan que las autoridades NO tenían conocimiento de la violación de los derechos humanos, el 14,8% tiene menos de 25 años.
3.4.3. De los que tienen menos de 60 años, ¿qué % cree que las autoridades NO tenían conocimiento? De los 345 + 365 + 237 = 947 que tienen menos de 60 años, 224 creen que las autoridades NO tenían conocimiento de los hechos. Llevando a %: 224 P= ·100 = 23,7% 947 R: De los que tienen menos de 60 años, el 23,7% cree que las autoridades NO tenían conocimiento de la violación de los derechos humanos.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
15
3.4.4. De los que tienen 40 años o más, ¿qué % cree que las autoridades SÍ tenían conocimiento? De los 237 + 178 = 415 que tienen 40 años o más, 167 + 112 = 279 cree que las autoridades SÍ tenían conocimiento. Llevando a %: 279 P= ·100 = 67,2% 415 R: De los que tienen 40 años o más, el 67,2% cree que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos.
3.4.5. De la muestra, ¿qué % son personas menores de 40 años que creen que las autoridades SÍ tenían conocimiento? De la muestra de 1.125 personas, 302 + 254 = 556 son menores de 40 años que creen que las autoridades SÍ tenían conocimiento. Llevando a %: 556 P= ·100 = 49,4% 1.125
R: El 49,4% de la muestra son personas menores de 40 años que creen que las autoridades SÍ tenían conocimiento de la violación de los derechos humanos.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
16
Caso 4: Clima laboral
Calcule la moda, la mediana y la media en los siguientes datos, que corresponden a opinión de trabajadores acerca del clima laboral en la empresa en la cual trabajan, siendo: B = Bueno; R = regular; M = Malo. Los datos son: M; R; R; B; M; R; B; M; M
Solución: 4.1. Moda: Malo La opinión más generalizada es que el clima laboral en la empresa es Malo, con 4 observaciones sobre un total de 9. 4.2. Mediana: Ordenando:
M; M; M; M; R; R; R; B; B; con n = 9
Ubicación:
(9 + 1)/2 = 5. La mediana es el 5º valor.
Mediana:
Me = Regular
• •
Al menos el 50% de los encuestados opina que el clima laboral en la empresa es de malo a regular. Al menos el 50% de los encuestados opina que el clima laboral en la empresa es de regular a bueno.
4.3. Media: No se puede calcular, ya que las observaciones no son valores numéricos.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
Caso 5: Peso de recién nacidos
17
Calcule la moda, la mediana y la media en los siguientes datos, que corresponden al peso de 12 recién nacidos, en Kg. Peso; 2,340; 3,450; 4,560; 2,350; 1,860; 6,120; 3,570; 3,450; 4,250; 3,580; 2,560; 5,110.
Solución: 5.1. Mo = 3,450Kg. El peso más frecuente de encontrar en la muestra es 3,450Kg.
5.2. Mediana: Ordenando los pesos de menor a mayor: 1,860; 2,340; 2,350; 2,560; 3,450; 3,450; 3,570; 3,580; 4,250; 4,560; 5,110: 6,120. Por ser n par, quedan dos valores al centro de la distribución. Por lo tanto: Me =
3,450 + 3,570 = 3,510 Kg. 2
Esto es: la mitad de los recién nacidos pesan más de 3,510 Kg.
5.3. Media: Ingresando los datos a la calculadora, resulta: x = 3,600 Kg.
Esto es: el peso promedio de los recién nacidos es de 3,600 Kg.
Estadística Aplicada a las Ciencias Sociales
18
Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
Caso 6: Estudio de población Se ha de estudiar la población de una pequeña comuna de la novena región, para lo cual, primeramente se la caracteriza por grupo de edad, área de residencia y sexo. Población por grupo de edad, área de residencia y sexo. Grupo de edad (años) 0 – 10 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80
Área urbana hombres mujeres 216 315 412 512 602 418 125 88
Área rural hombres mujeres
189 322 445 485 655 512 221 132
115 98 112 188 145 102 46 24
145 126 135 201 144 155 54 46
Calcule: 6.1. ¿Qué % de la población es rural? 6.2. La proporción de la población menor de 20 años. 6.3. El índice de feminidad en el área urbana. 6.4. El índice de masculinidad en la población rural de 40 años o más. 6.5. La edad media de los hombres del área urbana y su desviación estándar. 6.6. La edad mediana en las mujeres del área rural. Interprete su valor. 6.7. ¿Qué % representa la población rural de 50 años o más, respecto de la población total? 6.8. Calcule la razón urbano/rural en la población total de la comuna. 6.9. Dibuje un gráfico de caja de la edad de los hombres rurales. 6.10. Dibuje un histograma porcentuado que muestre la distribución de mujeres urbanas según edad. 6.11. Dibuje un gráfico que muestre la distribución de la población según sexo. 6.12. ¿Qué % de la población tiene menos de 6 años?
Solución: Para facilitar la interpretación de la tabla, se calcularán algunos totales básicos. Población por grupo de edad, área de residencia y sexo. Edad (años) 0 – 10 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 TOTAL
URBANA H M 216 189 315 322 412 445 512 485 602 655 418 512 125 221 88 132 2.688 2.961
Total U 405 637 857 997 1.257 930 346 220 5.649
RURAL H 115 98 112 188 145 102 46 24 830
M 145 126 135 201 144 155 54 46 1.006
Total R 260 224 247 389 289 257 100 70 1.836
TOTAL 665 861 1.104 1.386 1.546 1.187 446 290 7.485
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
6.1. ¿Qué % de la población es rural? La población total llega a 7.455 personas, de las cuales 1.836 viven en zonas rurales. Llevando a %: P=
1.836 ·100 = 24,53% 7.485
R: El 24,53% de la población es rural.
6.2. La proporción de la población menor de 20 años. Sumando toda la población menor de 20 años, da 1.526 Llevando a %: P=
1.526 ·100 = 20,39% 7.485
R: El 20,39%de la población menor de 20 años.
6.3. El índice de feminidad en el área urbana. En el área urbana hay: Mujeres = 2.961 Hombres = 2.688 El índice de feminidad es: IF =
2.961 ·100 = 110,16 mujeres por cada 100 hombres. 2.688
R: En el área urbana hay 110,16 mujeres por cada 100 hombres.
6.4. El índice de masculinidad en la población rural de 40 años o más. Hombres rurales de 40 años o más = 317 Mujeres rurales de 40 años o más = 399 El índice de masculinidad en ese segmento es: IM =
317 ·100 = 79,45 hombres por cada 100 mujeres. 399
R: En la población rural de 40 años o más hay 79,45 hombres por cada 100 mujeres.
19
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
6.5. La edad media de los hombres del área urbana y su desviación estándar. Para los efectos, se calcula la marca de clase de cada intervalo. Hombres del área urbana por grupos de edad (años). Años
Xm
Casos
0 – 10
5
216
10 – 20
15
315
20 – 30
25
412
30 – 40
35
512
40 – 50
45
602
50 – 60
55
418
60 – 70
65
125
70 – 80
75
88 2.688
Ingresando datos a la calculadora: Edad media = 36,77 años Desviación estándar = 17,61 años
6.6. La edad mediana en las mujeres del área rural. Interprete su valor. Para los efectos, se calcula la frecuencia acumulada. Mujeres del área rural, según edad (años). Años
Casos
0 – 10
145
145
10 – 20
126
271
20 – 30
135
406
30 – 40
201
607
40 – 50
144
751
50 – 60
155
906
60 – 70
54
960
46
1006
70 – 80
Acum.
1006
Mediana ⇒ n/2 = 1.006/2 = 503. La mediana se ubica en el cuarto intervalo. Me = 30 + 10
•
(503 − 406) = 34,8 años 201
El 50% de las mujeres rurales tiene a lo más 34,8 años.
20
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
6.7. ¿Qué % representa la población rural de 50 años o más, respecto de la población total? Población total = 7.485 Población rural de 50 años o más = 427 Llevando a %: P=
427 ·100 = 5,70% 7.485
R: La población rural de 50 años o más representa el 5,70% respecto de la población total.
6.8. Calcule la razón urbano/rural en la población total de la comuna. Población urbana = 5.649 Población Rural = 1.836 Razón Urbana/Rural =
5.649 ≈3 1.836
R: En la comuna, hay 3 personas rurales por cada una rural.
6.9. Dibuje un gráfico de caja de la edad de los hombres rurales. Para los efectos, se calculan los cuartiles: Hombres rurales, según edad (años) Años
Casos
0 – 10
115
Acum 115
10 – 20
98
213
20 – 30
112
325
30 – 40
188
513
40 – 50
145
658
50 – 60
102
760
60 – 70
46
806
70 – 80
24
830
830
Cuartil 1 intervalo.
⇒ 0,25 n = 0,25 · 830 = 207,5. El cuartil 1 se ubica en el segundo
Q1 = 10 + 10
(207,5 − 115 ) = 19,4 años 98
21
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
Mediana
⇒ 0,5 n = 0,5 · 830 = 415. La mediana se ubica en el cuarto intervalo.
Q1 = 30 + 10
Cuartil 3
22
(415 − 325 ) = 34,8 años 188
⇒ 0,75 n = 0,75 · 830 = 622,5. Este cuartil se ubica en el quinto intervalo.
Q1 = 40 + 10
(622,5 − 513) = 47,6 años 145
Gráfico:
6.10. Dibuje un histograma porcentuado que muestre la distribución de mujeres urbanas según edad. El histograma requiere los límites reales de cada intervalo para el eje de las absisas y los % en el eje de las ordenadas. Mujeres urbanas según edad, en años. Años
Casos
0 – 10
189
6,4
10 – 20
322
10,9
20 – 30
445
15,0
30 – 40
485
16,4
40 – 50
655
22,1
50 – 60
512
17,3
60 – 70
221
7,5
70 – 80
%
132 2.961
4,5 100
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
El gráfico resultante es el siguiente:
6.11. Dibuje un gráfico que muestre la distribución de la población según sexo. Total mujeres = 3.967 (53%) Total hombres = 3.518 (47%) Por ser una variable cualitativa, sirve un gráfico de barras como el siguiente: Población según sexo. Sexo Hombres Mujeres Total
Casos 3.518 3.967 7.485
% 47 53 100
6.12. ¿Qué % de la población tiene menos de 6 años? Para realizar este cálculo, se aplicará el concepto de percentil. Por eso se requiere una tabla con frecuencia acumuladas: Población comunal, según edad, en años. Años
Casos
Acumulado
0 – 10
665
665
10 – 20
861
1526
20 – 30
1.104
2630
30 – 40
1.386
4016
40 – 50
1.546
5562
50 – 60
1.187
6749
60 – 70
446
7195
70 – 80
290
7485
7.485
23
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
La edad de 6 años se encuentra en el primer intervalo. 6=0+
10 (F − 0) 665
La F indica la frecuencia de aquellos que tienen menos de 6 años. Despejando: 10 (F − 0) 665 6 ⋅ 665 = 10F 3990 = 10F 3.990 =F 10 6=
F = 399 personas tienen menos de 6 años.
Llevando a %: P=
399 ·100 = 5,33% 7.485
R: El 5,33% de esta población tiene menos de 6 años.
24
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
25
Caso 7: Dieta para adelgazar
Un estudio consultó a una muestra de mujeres mayores de 18 años de la región metropolitana si seguían o no alguna dieta para adelgazar. La tabla siguiente muestra los datos obtenidos: ¿Sigue alguna dieta para adelgazar? Mujeres mayores de 18 años según siguen o no dieta para adelgazar. Número de casos. Respuesta
Nº casos
Sí
194
No
297
No responde
37
7.1. Calcule la columna de %. Aproxime correctamente a un decimal. 7.2. Construya un gráfico que muestre adecuadamente los resultados. Solución: 7.1. Calcule la columna de %. Aproxime correctamente a un decimal. Se agrega una columna para los % y una fila para los totales. En cada celda de % se calcula el % que representa la frecuencia absoluta respecto del total muestra. En la celda correspondiente al % Sí, el cálculo es: P=
194 ·100 = 36,7% 528
Para la celda % No, el cálculo es: 297 P= ·100 = 56,3% 528 Para la celda % No responde, el cálculo es: 37 P= ·100 = 7,0% 528 Se verifica que la suma es 100% . La tabla queda de la siguiente manera: ¿Sigue alguna dieta para adelgazar? Respuesta
Nº casos
%
Sí
194
36,7
No
297
56,3
No responde
37
7,0
Total
528
100
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
7.2. Construya un gráfico que muestre adecuadamente los resultados.
Porcentaje (%)
El gráfico adecuado para el tipo de variable es el de barras horizontales o verticales y el gráfico circular. En este caso se presenta un gráfico de barras verticales.
60 55 50 45 40 35 30 25 20 15 10 5 0
56,3
36,7
7,0
Sí
No
NR
¿Sigue alguna dieta para adelgazar?
26
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
27
Caso 8: Índice de Masculinidad
El Índice de Masculinidad (IM) es un indicador demográfico definido como el número de hombres por cada 100 mujeres. El gráfico de la figura muestra la evolución del IM en cierto país latinoamericano entre los años 1960 y 2000.
Indique, en función de los datos del gráfico: F si la afirmación es falsa, V si es verdadera y N si no es posible determinar su verdad o falsedad a partir de los datos del gráfico. 8.1. . . . . . En 1960 había más mujeres que hombres. 8.2. . . . . . Entre 1970 y 1980 las mujeres pasan a ser mayoría. 8.3. . . . . . En el año 2000, los hombres representan aproximadamente el 52,6% de la población. 8.4. . . . . . En 1960, aproximadamente el 45,5% de la población es femenina. 8.5. . . . . . Entre 1960 y 1970 disminuyó el número de hombres en el país. 8.6. . . . . . Hacia 1970 el 52,4% de la población es masculina. 8.7. . . . . . Entre 1960 y 2000 aumentó la cantidad de mujeres en el país.
Solución: 8.1. . . . . . En 1960 había más mujeres que hombres. (F). Según el gráfico, el IM ese año es 120, lo que indica una proporción de 120 hombres por cada 100 mujeres. Es decir, mayoría hombres. Por lo tanto, la afirmación es falsa. 8.2. . . . . . Entre 1970 y 1980 las mujeres pasan a ser mayoría. (V). Según el gráfico, en esos años el IM pasa de 110 a 97, lo que indica que la proporción de hombres, siendo dominante en 1970, pasa a ser minoría en 1980. Por lo tanto, la afirmación es verdadera. 8.3. . . . . . Hacia el año 2000, los hombres representan aproximadamente el 52,6% de la población. (F) Hacia el año 2000, el IM indica 90 hombres por cada 100 mujeres. Es decir, los hombres son minoría, por lo que no es posible que representen más del 50%. Por lo tanto, la afirmación es falsa.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
28
8.4. . . . . . En 1960, aproximadamente el 45,5% de la población es femenina. (V) En 1960 el IM indica 120 hombres por cada 100 mujeres. Esto es, que de cada 220 personas, 100 son mujeres. 100 Calculando a partir de esto el % de mujeres: · 100 = 45,5%. 220 Por lo tanto, la afirmación es verdadera.
8.5. . . . . . Entre 1960 y 1970 disminuyó el número de hombres en el país. (N). Entre 1960 y 1970 lo que bajó es la razón entre hombres y mujeres. Esto puede haber ocurrido por: • Aumento en la cantidad de mujeres, manteniéndose constante la cantidad de hombres • Disminución de la cantidad de hombres, manteniéndose constante la cantidad de mujeres • Aumento en la cantidad de mujeres y disminución de la cantidad de hombres • Disminución de hombres y mujeres, con disminución más rápida en los primeros • Aumento de hombres y mujeres, con aumento más rápido en las mujeres Por lo tanto, a partir solo del gráfico, no se puede precisar qué es lo que ocurrió.
8.6. . . . . . Hacia 1970 el 52,4% de la población es masculina. (V) En 1970 el IM es 110, lo que indica 110 hombres por cada 100 mujeres. Esto significa, a la vez, que por cada 210 personas, hay 110 hombres y 100 mujeres. Llevando esto a % de hombres:
110 ·100 = 52,4%. 210
Por lo tanto, la afirmación es verdadera.
8.7. . . . . . Entre 1960 y 2000 aumentó la cantidad de mujeres en el país. (N) Lo que sube o baja es la razón entre hombres y mujeres y no es posible precisar, a partir solo del gráfico, cuál de las dos cantidades es la que varía o cómo estas lo hacen.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
29
Caso 9: Enfermedades crónicas en adulto mayor
Se investigan algunos aspectos de la salud del adulto mayor. El siguiente gráfico corresponde a la distribución de una muestra de adulto mayor según número de enfermedades crónicas que reportaron a los investigadores. Nº de casos 32 28 24 20 16 12 8 4 0
Nº 0
1
2
3
4
Adultos mayores según Nº de enfermedades crónicas reportadas
A partir del gráfico: 9.1. Calcule el número medio de enfermedades crónicas reportadas en la muestra, su desviación estándar y coeficiente de variación. 9.2. Calcule el número mediano de enfermedades crónicas reportadas en la muestra. 9.3. Calcule el número modal de enfermedades crónicas reportadas en la muestra. 9.4. De los que reportaron al menos 1 enfermedad crónica, ¿qué % reportó más de 2? 9.5. Calcule la probabilidad de encontrar en esta muestra personas que hayan reportado 2 ó 3 enfermedades crónicas.
Solución: 9.1. Calcule el número medio de enfermedades crónicas reportadas en la muestra. Se llevan los datos del gráfico a una tabla de frecuencias: N° enfermedades 0 1 2 3 4 Total Llevando los datos a la calculadora, resulta: x = 1,4 enfermedades σ = 1,23 enfermedades 1,23 ⋅100 = 87,9% CV = 1,4
N° de casos 28 32 20 12 8 100
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
30
9.2. Calcule el número mediano de enfermedades crónicas reportadas en la muestra. Para calcular la mediana, se genera una columna de frecuencias acumuladas: N° enfermedades 0 1 2 3 4 Total
N° de casos 28 32 20 12 8 100
F acum 28 60 80 92 100 -
Por tratarse de una variable discreta, no se aplica la fórmula de la mediana para variables en intervalos, sino que se debe usar la definición de mediana. La mediana es el valor de la variable que está entre el 50° y el 51° valor de la variable. Como desde el valor 29° hasta el 60°, x = 1, entonces ese es el valor de la mediana. R: Por lo tanto, el número mediano de enfermedades crónicas en el adulto mayor es 1.
9.3. Calcule el número modal de enfermedades crónicas reportadas en la muestra. La moda es el valor de la variable con mayor frecuencia. En este caso es x = 1. R: Por lo tanto, el número modal de enfermedades crónicas en el adulto mayor es 1.
9.4. De los que reportaron al menos 1 enfermedad crónica, ¿qué % reportó más de 2? Reportaron al menos 1 enfermedad crónica: 72 adultos mayores Reportaron más de 2 enfermedades crónicas: 12 + 8 = 20 adulto mayor. Llevando a %: P=
20 ⋅ 100 = 27,8%. 72
R: De los adultos mayores que reportaron al menos 1 enfermedad crónica, el 27,8% reportó más de 2.
9.5. Calcule la probabilidad de encontrar en esta muestra personas que hayan reportado 2 ó 3 enfermedades crónicas. Total de casos: 100 Reportaron 2 ó 3 enfermedades crónicas: 20 + 12 = 32 adulto mayor Aplicando la fórmula de Laplace: 32 = 0,32. P= 100 R: la probabilidad de encontrar en esta muestra personas que hayan reportado 2 ó 3 enfermedades crónicas es 0,32.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
31
Caso 10: Gasto en medicamentos Se realiza un estudio con personas de ambos sexos con enfermedades crónicas, acerca del monto del gasto mensual en medicamentos. El estudio permitió calcular los siguientes estadígrafos, en $miles: Gasto mínimo = M$ 5,8 Gasto máximo = M$ 124,6 Gasto decil 2 = M$ 15,7 Gasto percentil 45 = M$ 38,4 Gasto cuartil 3 = M$ 75,6 Gasto percentil 95 = M$ 115,2 10.1. Construya 5 afirmaciones respecto de la muestra estudiada.
Solución: 10.1. Afirmaciones Las afirmaciones son enunciados demostrables empíricamente. En el contexto del caso, se harán afirmaciones demostrables con los valores de los estadígrafos dados. En primer lugar, con los datos dados es conviene construir un diagrama como el siguiente:
20%
25%
30%
20%
5%
5,8
124,6 15,7
38,4
75,6
M$
115,2
Gasto mensual en medicamentos (M$)
Los valores de la variable en el eje X y los % en cada segmento del gráfico, se obtienen de las definiciones de los estadígrafos dados. Por ejemplo, de la definición del decil 2 = M$15,7 se entiende que el 20% de la muestra gasta mensualmente menos de esa cantidad en medicamentos y el 80%, más de esa cantidad. Se puede verificar en el gráfico el 20% bajo M$15,7 y sobre esa cantidad 25% + 30% + 20% + 5% = 80%. De acuerdo al percentil 45, el 45% gasta a lo más M$38,4 en medicamentos al mes, porcentaje que en el diagrama corresponde a 20% + 25%. Y así sucesivamente.
Con este diagrama ya es posible construir muchas afirmaciones, tales como las siguientes: •
El 20% de las personas encuestadas gasta, a lo más, $15.700 mensuales en medicamentos.
•
El 25% de las personas encuestadas gasta mensualmente entre $15.700 y $38.400 en medicamentos.
•
De las personas estudiadas, el 55% gasta mensualmente entre $15.700 y $75.600 en medicamentos.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
32
•
El 55% de las personas de la muestra gasta, al mes, a lo menos, $38.400 en medicamentos.
•
El 50% de los encuestados gasta mensualmente entre $38.400 y $115.200 en medicamentos.
•
El 5% de las personas de la muestra gasta más de $115.200 en medicamentos al mes.
•
El 20% de los encuestados gasta entre $75.600 y $115.200 al mes en medicamentos.
•
De los encuestados, el 30% gasta entre $38.400 y $75.600 al mes en medicamentos.
•
Etc.
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
33
Caso 11: Concentración de plomo en la sangre
Un estudio realizado con una muestra de recién nacidos en cierto barrio industrial de Montevideo, arrojó el siguiente gráfico de la concentración de plomo en la sangre, medido en microgramos por decilitro de sangre ( µg /dl ).
A partir del gráfico, determine lo siguiente: 11.1. Calcule el promedio de concentración de plomo en la sangre en la muestra, su desviación estándar y coeficiente de variación. 11.2. Para efectos de dar información pública, se desea determinar la concentración máxima de plomo en la sangre del 5% inferior y la concentración mínima del 5% superior de la muestra. 11.3. Calcule la prevalencia de concentración de plomo en la sangre por sobre 10 µg /dl en la muestra.
Solución: Para los efectos de los cálculos solicitados, se trasladarán los datos del gráfico a una tabla de frecuencias: Concentración 1–3 3–5 5–7 7–9 9 – 11 11 – 13 13 – 15 15 – 17 Total
Xm 2 4 6 8 10 12 14 16
Nº 7 11 17 15 19 9 5 3 86
F acum 7 18 35 50 69 78 83 86
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
34
11.1. Calcule el promedio de concentración de plomo en la sangre en la muestra, su desviación estándar y coeficiente de variación. Con la columna de marcas de clase (Xm) y sus frecuencias absolutas de la tabla, se ingresan los datos a la calculadora, obteniendo los siguientes resultados:
x = 8,093 ≈ 8,1 µg /dl σ = 3,556 ≈ 3,6 µg /dl CV=
3,556 ⋅ 100 = 43,9 % 8,093
11.2. Para efectos de dar información pública, se desea determinar la concentración máxima de plomo en la sangre del 5% inferior y la concentración mínima del 5% superior de la muestra. La concentración máxima de plomo en la sangre del 5% inferior equivale al percentil 5:
P5 ⇒ 5% de 86 = 4,3. Este percentil se ubica en el primer intervalo de la tabla. P5 = 1 +
2 (4,3 − 0) = 2,2 µg /dl . 7
El 5% de la muestra tiene, a lo más, una concentración de 2,2 µg /dl de plomo en la sangre.
La concentración mínima de plomo en la sangre del 5% superior equivale al percentil 95: P95 ⇒ 95% de 86 = 81,7. Este percentil se ubica en el intervalo número 7 de la tabla. P95 = 13 +
2 (81,7 − 78) = 14,5 µg /dl . 5
El 5% de la muestra tiene, a lo menos, una concentración de 14,5 µg /dl de plomo en la sangre. 11.3. Calcule la prevalencia de concentración de plomo en la sangre por sobre 10 µg /dl en la muestra. La prevalencia es el % de la muestra que presenta dicha característica. Para calcular este porcentaje, aplicando el concepto de percentil, se calculará previamente el % que está bajo el valor 10 µg /dl .
9+
2 (F − 50) = 10; 19
Estadística Aplicada a las Ciencias Sociales Estadística Descriptiva: Presentación y análisis de datos. Cálculo e interpretación de estadígrafos. Patricio Alcaíno Martínez – Derechos Reservados.
35
Donde F es la frecuencia acumulada hasta x = 10 µg /dl . Despejando: 2 (F − 50) 9+ = 10 19 2 (F − 50) = 10 − 9 19 2 (F − 50) =1 19 19 F − 50 = 2 19 F= + 50 = 59,5 recién nacidos. 2 Es decir, de un total de 86 recién nacidos de la muestra, 59,5 presentan menos de 10 µg /dl de plomo en la sangre. Por lo tanto, los que están sobre ese valor de plomo son 86 – 59,5 = 26,5 recién nacidos. Llevando a porcentaje: P=
26,5 ⋅ 100 = 30,8%. 86
R: La prevalencia de concentración de plomo en la sangre por sobre 10 µg /dl en la muestra llega al 30,8% de los recién nacidos.