Ingrid martinez e1 2 2 2 histogramas

Page 1

Estrategia didáctica 1.2.2.2. Histogramas Comentario: En esta estrategia se inicia el estudio de la graficación de datos. Esto es esencial para determinar cuáles son las características de los datos que se reunieron en la encuesta.

I. Para construir el histograma de una serie de datos, realiza los siguientes pasos: 1. Calcula la longitud del intervalo en el que se encuentran todos los datos. Para ello, busca el dato mayor y el dato menor y réstalos. El resultado se le llama rango (R). Para los salarios de los obreros de la industria textil es 330.17-184.8 = 145.37. 2. Calculemos el número adecuado de cortes o intervalos que contendrá el rango para tener la mejor agrupación de los datos (y así tener mejor información de ellos.) Usemos la regla de Sturges, en la que k es el número de clases o intervalos que se usarán, n es el número de datos (hay 250 salarios) y log es la función logaritmo. k=1 + 3.3 log(n)

En nuestro caso: k = 1+3.3log(250) = 8.91

Esto quiere decir que se necesitan 8 clases para agrupar adecuadamente los 250 datos. El redondeo debe hacerse siempre al entero inmediato inferior. 3. Para saber de qué longitud deben ser los 8 intervalos o clases, se calcula R/k, esto es 145.37/8 = 18.17. Así, si sumamos 8 veces 18.17, tendremos 145.37, lo que significa que los 8 intervalos de esa longitud cubren todo el rango que contiene a los 250 datos. Pero es más adecuado facilitar el conteo, si redondeamos la longitud 18.17. Siempre es mejor que las clases tengan longitudes enteras porque facilitan los cálculos. 4. Por ejemplo, si redondeamos 18.17 a 19, el entero inmediato superior, entonces los 8 intervalos o clases cubrirán 8*19 = 152, lo que significa que hemos cubierto un poco más de la longitud original del rango (145.36), es decir, hay un exceso de 152-145.36 = 6.63. Dado que no hay reglas acerca de cuál debe ser la longitud óptima de las clases, se puede proponer el redondeo de 18.17 a 20, (necesariamente mayor a 18.17) lo que significa que las 8 clases cubrirían 8*20


= 160, y se tiene un exceso de 160-145.37=14.63. También a 21, es decir 8*21 = 168, y el exceso sería 168-145.37 = 22.63. En general, se pueden proponer longitudes de clases con números enteros (en nuestro caso de 19, 20, 21, 22, etcétera) o con números decimales, si los datos que tenemos requieren que se clasifiquen de esta forma, (18.5, 19.5, 20.5, etcétera), pero todo depende del tipo de datos que se tenga. La longitud de clase dependerá siempre de los valores de los datos y a lo largo del curso se usarán de distintos tipos para que se aclare la formación del histograma según las características de ellos. Es importante que no se olvide que sólo la continua construcción de histogramas les ayudará a desarrollar la habilidad y el sentido común para hacerlos porque no existe una fórmula universal para construirlos. 5. En nuestro ejercicio, ¿cuál sería la longitud más adecuada? Podemos saber cuál ya no es la más adecuada: Si el exceso es mayor al resultado obtenido al dividir R/k = 18.17, entonces ya no es adecuada. Por tanto, no se deben usar clases de longitud 21 o más porque el exceso que se obtiene ya es mayor a 18.17 (en el caso de que la longitud sea 21, el exceso fue de 22.63). Queda entonces elegir entre 19 y 20, pues ambas longitudes cumplen que el exceso no es mayor a 18.17. Elegiremos 20, porque es más fácil contar de 20 en 20 que de 19 en 19 y porque el cuadro que se formará con ese conteo tendrá mejor presentación. 6. Para una longitud i = 20, el exceso es de 14.63. Si contamos de 20 en 20 empezando desde el dato menor 184.8, terminaríamos en 344.8. Pero recuerda que el dato mayor es 330.17, por lo que habría un intervalo vacío entre 330.17 y 344.8 porque no hay datos mayores a 330.17. Lo más adecuado es repartir el exceso de 14.63 antes del dato menor y después del dato mayor para no dejar un intervalo tan grande vacío a la derecha del dato mayor, que sería casi de 15 unidades. Como el dato menor es de 184.8, entonces podemos empezar a contar de 20 en 20 empezando desde 180, es decir 4.8 unidades menos del dato menor y terminaríamos en 340, ya con las 8 clases de longitud 20 incluidas. Es decir nos pasaríamos 9.83 unidades por encima del dato mayor. Si sumamos 4.8 + 9.83 = 14.63, lo que quiere decir que el exceso lo hemos repartido de manera adecuada antes del dato menor y después del dato mayor para facilitar tanto el conteo como la construcción de nuestro histograma. Esto se observará mejor en el cuadro siguiente:


Intervalos clases(k)

o Frecuencia

1

180 – 199.99

7

2

200 – 219.99

49

3

220 – 239.99

126

4

240 – 259.99

42

5

260 – 279.99

14

6

280 – 299.99

6

7

300 – 319.99

4

8

320 – 339.99

2

Tota l

250

7. El cuadro anterior se llama cuadro de frecuencias. Observa que las 8 clases tienen longitud 20, y cumplen con todo lo que se discutió arriba. Se usan dos decimales porque los datos tienen 2 decimales. Los valores 180, 200, 220, ..., 320 se les llama límites inferiores de clase; 199.99, 219.99,...,399.99 se les llama límites superiores de clase. El conteo de 20 en 20 sirve para calcular los límites inferiores de clase, los límites superiores se calculan fácilmente buscando un número con dos decimales anterior al límite inferior de la clase siguiente. La frecuencia es el número de datos (salarios) que caen en cada clase. Por ejemplo, la clase 1 contiene 7 datos. Estos van del 184.8 al 194.25, revisa la tabla de salarios. La clase 2 contiene 49 datos, del 201.05 al 219.75. Completa la tabla contando de la misma forma cuántos datos contiene cada clase. La suma de las frecuencias deberá ser 250. 8. Para construir el histograma, toma como base el diagrama siguiente. Sobre el eje horizontal localiza solamente , a la misma distancia, los límites inferiores de clase: 180, 200, ..., 320 y también el límite inferior de la novena clase 340. En el eje vertical has una graduación que dependerá de la frecuencia mayor que hayas obtenido en el cuadro de frecuencias. Por ejemplo, podrás graduar de 10 en 10 o de 20 en 20, sin olvidar que en ese eje se miden las frecuencias de clase. El primer rectángulo lo construyes de manera que tenga base entre los dos primeros límites inferiores y de altura 7. El segundo rectángulo lo construyes con base entre los límites inferiores segundo y tercero y de altura 49 y así sucesivamente. Deberás tener 8 rectángulos que representan las clases del cuadro de frecuencia y su altura indica cuántos datos son agrupados en cada


intervalo. A mayor altura, habrá más datos en esa clase. Una de las funciones del histograma es que te indica en qué regiones o clases se concentran más los datos (salarios) para que te des cuenta acerca de la manera en que se reparte el salario y cómo está distribuido. La gráfica terminada se llama histograma de los salarios de los obreros de la industria textil.

I. Con las dos siguientes series de datos construye un histograma para cada una de ellas. ¿Cuál es la variable que gráficas en cada uno de los dos histogramas?: Salarios mensuales de 250 obreros de la de la industria textil, dólares. 184.80 197.65 205.47 209.05 212.44 212.95 214.13 215.50 217.11 218.05 218.90 219.75 221.45 222.95 223.83 224.68 225.70 226.27 227.00 228.40 229.45 230.15

188.13 199.25 206.49 209.55 211.75 213.16 214.50 216.20 217.37 218.27 219.14 220.26 221.50 222.95 224.00 225.00 225.87 226.59 227.06 228.55 229.93 230.50

190.34 201.05 206.83 210.07 212.27 213.63 214.83 216.35 217.42 218.27 219.60 220.43 221.62 222.95 224.00 225.25 225.92 226.70 227.40 228.93 229.93 230.63

192.04 202.53 208.00 210.25 212.44 213.63 214.83 216.40 217.54 218.34 219.60 220.95 221.80 222.96 224.32 225.53 226.04 226.72 228.25 229.10 230.12 230.63

194.42 204.11 209.04 210.74 212.44 213.89 215.34 216.96 217.71 218.56 219.75 221.28 222.30 223.50 224.51 225.55 226.04 226.88 228.25 229.27 230.15 230.75

Salarios mensuales de 150 obreros la industria petrolera, dólares. 280.05 289.94 304.11 315.01 319.23 322.58 326.75 332.45 340.08 343.35 345.78 348.67 352.07 355.64 359.70 361.97 366.24 369.51 373.48 375.54 380.00 381.50

380.00 381.50 385.29 391.81 398.55 406.57 413.21 419.38 421.89 432.36 281.12 297.57 309.56 316.00 321.05 323.80 329.18 335.72 340.15 344.44 347.48 348.95

347.78 349.99 353.00 357.52 361.88 365.08 367.33 372.50 375.54 379.25 380.31 382.42 388.04 394.00 402.21 408.53 415.29 420.16 425.10 437.55 286.50 303.02


230.80 231.00 231.65 232.15 232.67 233.24 233.90 234.20 236.00 236.78 236.80 237.77 238.62 239.30 239.70 240.78 241.14 243.58 245.09 246.78 249.51 252.55 254.64 262.08 265.77 274.83 285.00 310.12

230.80 231.14 231.87 232.33 232.75 233.35 234.00 234.35 235.21 235.93 236.92 237.80 238.96 239.50 239.98 240.88 242.02 244.06 245.25 247.00 249.80 252.55 256.90 263.00 267.35 277.44 291.00 314.34

230.80 231.47 231.87 232.50 232.77 233.52 234.20 234.35 235.50 236.07 237.27 237.80 238.96 239.50 240.15 241.00 242.47 244.13 245.80 247.56 251.35 254.25 257.83 264.45 270.75 278.00 293.53 319.22

230.96 231.50 231.87 232.58 232.77 233.55 234.20 234.70 235.70 236.50 237.10 238.10 239.13 239.50 240.32 241.00 242.54 244.50 246.10 248.14 252.00 255.11 259.79 264.45 272.45 281.68 295.59 322.75

231.00 231.66 231.90 232.59 233.20 233.86 234.20 234.88 235.70 236.75 237.60 238.28 239.30 239.50 240.65 241.14 242.70 244.50 246.24 249.65 252.24 256.45 261.06 265.65 274.49 283.33 308.15 330.17

384.77 390.22 397.94 405.48 411.33 419.38 421.07 429.25 280.90 295.48 307.48 315.55 320.45 323.80 326.98 333.54 340.08 344.44 346.62 348.80 352.55 355.80 360.39 363.14 366.77 370.60 373.89 378.21

353.00 356.23 360.79 364.27 366.95 371.69 374.96 379.11 380.00 381.50 386.95 393.48 400.06 407.66 414.02 419.47 424.05 436.44 284.44 301.95 311.75 317.28 321.44 324.00 330.27 336.81 341.23 344.44

312.83 318.41 321.65 325.50 331.36 337.90 342.26 345.25 347.50 350.95 354.75 368.61 361.58 365.08 368.42 372.50 375.54 379.99 380.55 384.46 389.21 394.95 403.31 410.44 419.38 420.15 428.19 439.82

Los siguientes grรกficos, a modo de ejemplo de los grรกficos que obtendrรกs, se obtienen las medidas que describen a los 250 salarios de los obreros textiles y petroleros, y a continuaciรณn los histogramas de ambos tipos de salarios. Salarios textil

Salarios petrolera

Min. :184.8

Min. :280.1

1st Qu.:221.7

1st Qu.:336.0

Median :232.0

Median :362.6

Mean :234.8

Mean :362.3

3rd Qu.:241.0

3rd Qu.:386.5

Max. :330.2

Max. :439.8


60 0

Frequency

Histogram of Salarios.textil

200

250

300

Salarios.textil

40 20 0

Frequency

Histogram of petrolera

300

350

400

petrolera

Puede observarse que los datos se tienden a acumular, en el caso de los salarios de los obreros de la industria textil, en el intervalo que va de 230 a 240 dólares; en el caso de los salarios de los obreros de los petroleros, estos se dispersan con mas variedad, pero puede verse que hay cierta concentración entre los valores de 340 a unos 380 dólares. Es evidente que en este caso, hay mayor variedad de salarios que en el caso de los de los obreros textiles. Se han construido los histogramas en primer lugar y las medidas en segundo, las gráficas que están descritas mediante segmentos de recta, se llaman polígonos de frecuencia. Histograma 140.0

Count

93.3

46.7

0.0 340.0

320.0

300.0

280.0

260.0

240.0

220.0

200.0

180.0

textil

salarios de obreros de la industria textil


Histograma 35.0

Count

23.3

11.7

0.0 440.0

420.0

400.0

380.0

360.0

340.0

320.0

300.0

280.0

petroleros

salarios de obreros de la industria petrolera

II. Construye histogramas para las siguientes series de datos (Usa HEC y hazlos a mano –opcional-, siguiendo las instrucciones dadas al principio de la estrategia): a) 25 36.8 18.6 28.9

32.5 32.7 29.2 25.4 24.8

15.2 35.4 21.3 28.4 26.9 34.6 29.3 24.5 31 21.2 28.3 29.5 30.2 23.9 23 26.4 27.3 33.7 29.4 21.9 29.3 17.3 23.5 20.6 29.5 21.8 37.5 33.5 29.6 26.8 28.7 34.8 27.1 34.1 27.5 29.6 22.2 22.7 31.3 33.2 37 28.3 36.9 24.6 28.1 25.4 34.5 23.6 38.4 (resistencias a la ruptura en onzas)

b) 3.87 5.84 1.42 8.64 4.90 7.35

2.58 2.51 4.04 6.43 1.58 4.32 2.20 4.19 4.79 6.20 1.52 1.38 4.54 5.12 5.15 5.50 5.92 4.56 2.46 6.90 1.47 2.11 2.32 6.75 8.80 7.40 4.72 3.62 2.46 8.75 2.65 7.86 4.71 6.25 9.45 12.80 1.92 7.60 8.79 5.92 9.65 5.09 4.11 6.37 5.40 11.25 3.90 5.33 7.41 7.95 10.60 3.81 3.78 3.75 3.10 6.43 1.70 6.40 3.24 1.79 3.49 6.77 5.62 9.70 5.11 4.50 2.50 5.21 1.76 9.20 1.20 6.85 2.80 11.75. (tiempos de ignición de materiales de tapicería.)

c) De los siguientes datos que indican el porcentaje de algodón que se usa para elaborar camisas para caballero, construye un histograma. 34.2 33.6 33.8 34.7 37.8 32.6 35.8 34.6 33.1 34.7


34.2 35.4 34.6 35.1 35 34.1

33.6 34.6 34.7 36.8 37.9 33.5

36.6 37.3 34.3 35.2 34 34.5

33.1 34.1 36.2 36.8 32.9 32.7

37.6 35.6 34.6 37.1 32.1

33.6 35.4 35.1 33.6 34.3

34.5 34.7 33.8 32.8 33.6

35 34.1 34.7 36.8 35.3

33.4 34.6 35.5 34.7 34.9

32.5 35.9 35.7 35.1 36.9

d) Si extraes una muestra de 40 datos de los salarios de los obreros petroleros y realizas el histograma de estos datos, ¿qué esperarías que mostrara este histograma comparado con el de los 250 datos? ¿por qué? ¿es esa una muestra representativa de los 250 datos?  Guardar con el nombre nombre-apellido.E1.2.2.2.Histogramas-grupo.xls

GLOSARIO GLOSARIO Histogramas: Longitud de intervalo: Rango Cortes/intervalos: Regla de Sturges: Función logaritmo: Longitud:


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.