02 em 04 empe uda1 s1

Page 1

Ciencias Exactas, Ingeniería y Tecnología

Licenciatura en Enseñanza de las matemáticas 2° Semestre Módulo 4. Probabilidad y Estadística Unidad 1. Estadística descriptiva


Módulo 4 Unidad 1. Estadística descriptiva

IMPORTANTE

Excepto donde el contenido así lo especifique, esta obra está bajo una Licencia de Creative Commons

Material recopilado y desarrollado por académicos externos contratados Ex profeso para los Programas educativos de la DCEIT de la Universidad Abierta y a Distancia de México, para fines educativos. (UnADM), 2016.

UNADM | DCEIT | EM | EMPE

2


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

Semana 1 Datos agrupados y no agrupados Para iniciar el tema de datos agrupados, te invitamos a observar los siguientes videos, en donde te explicarĂĄn en que consiste.

Tareas Plus (2013) Datos agrupados: intervalos, lĂ­mites superior e inferior. Ejemplo 1 {Archivo de video} Disponible en: https://www.youtube.com/watch?v=kB7lDbOsbpI

Dalaza, D. Tutorial de Datos agrupados y No agrupados {Archivo de video} Disponible en: https://www.youtube.com/watch?v=sc9y5sp2L_Q

Ahora es momento de revisar un ejemplo de lo abordado en el tema: Con la siguiente informaciĂłn, vamos a construir la tabla de frecuencias, y calcular las medidas de variabilidad y de dispersiĂłn. La siguiente tabla muestra las ventas de blusas de una tienda de ropa durante una semana. đ?‘Ľ" đ?‘“"

0 3

2 4

UNADM | DCEIT | EM | EMPE

4 5

6 6

8 7

10 9

12 9

14 11

16 5

18 2

20 5

3


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

Para auxiliarnos en los cĂĄlculos vamos a utilizar la siguiente tabla:

đ?‘Ľ"

đ?‘“"

đ??š"

đ?‘“" đ??š" đ?‘“" đ??š" đ?‘Ľ" đ?‘“" đ?‘Ľ" − đ?œ‡ đ?‘Ľ" − đ?œ‡ relativa relativa porcentual porcentual

đ?‘Ľ" − đ?œ‡ ' đ?‘“"

'

0

4

4

0.06

0.06

6

6

0.00

-10.1 102.0

408.0

2

4

8

0.06

0.11

6

11

8.00

-8.1

65.6

262.4

4

5

13

0.07

0.19

7

19

20.00 -6.1

37.2

186.0

6

9

22

0.13

0.31

13

31

54.00 -4.1

16.8

151.2

8

7

29

0.10

0.41

10

41

56.00 -2.1

4.4

30.8

10 9

38

0.13

0.54

13

54

90.00 -0.1

0.0

0.0

12 9

47

0.13

0.67

13

67

108.00 1.9

3.6

32.4

14 11 58

0.16

0.83

16

83

154.00 3.9

15.2

167.2

16 5

63

0.07

0.90

7

90

80.00 5.9

34.8

174.0

18 2

65

0.03

0.93

3

93

36.00 7.9

62.4

124.8

20

5

70

0.07

1.00 SUMA

7

100

100.00 9.9 706.0 0

98.0

490.0 2026.80

1. Primero, es necesario trazar una grĂĄfica de barras

UNADM | DCEIT | EM | EMPE

4


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

2. DespuĂŠs calculamos la media đ?œ‡=

) "*+ đ?‘Ľ" đ?‘“"

đ?‘›

=

706 = 10.1 70

3. Ahora calculamos la desviaciĂłn estĂĄndar đ?œŽ=

4.

) "*+

đ?‘Ľ" − đ?œ‡ ' đ?‘“" = đ?‘›âˆ’1

2026.8 = 5.4 70

Luego calculamos el porcentaje de medidas contenidas en el intervalo đ?œ‡ − đ?œŽ, đ?œ‡ + đ?œŽ . El intervalo es 4.7,15.5 , los datos contenidos en el intervalo son 45 y el porcentaje es 45/70=64%.

5.

Ahora calculamos el valor de la mediana Para calcular la mediana, debes fijarte en la frecuencia acumulada porcentual correspondiente al primer valor que se encuentre por arriba del 50% que corresponde a 10, por lo tanto la mediana es igual a 10.

6.

Estimamos los cuartiles primero y tercero

Para calcular el primer cuartil, fĂ­jate en la frecuencia acumulada correspondiente al primer valor que se encuentre por arriba de 25% que corresponde a 6. UNADM | DCEIT | EM | EMPE

5


Módulo 4 Unidad 1. Estadística descriptiva

Para calcular el tercer cuartil, nos fijamos en la frecuencia acumulada correspondiente al primer valor que se encuentre por arriba de 75% que corresponde a 14 7. Si calculamos la oscilación intercuartilar, obtenemos la diferencia entre el primer y el tercer cuartil, que es 8. 8. Ahora calculamos la moda, recuerda fijarte en el dato que se repita más que es 14. 9. Finalmente hacemos la interpretación En promedio las blusas más vendidas son la talla 10, la mediana indica que el 50% de ventas de blusas son menor o igual a la talla 10, la oscilación intercuartilar indica que las tallas comprendidas entre [6,14], corresponden al 50% de la totalidad de datos; esto es, la diferencia de tallas entre dos medidas en este intervalo es a lo más de 8 tallas. Continuando con el ejemplo, ahora la siguiente tabla muestra las calificaciones obtenidas por 111 estudiantes en un concurso de matemáticas, en donde la escala se encuentra entre 0 y 100.

1. Identificamos los valores mayor y menor. En nuestro caso son 96 y 20 respectivamente. 2. Para determinar el ancho de clase y la marca de clase al valor mayor le restamos el valor mínimo y obtenemos 76, el cual se divide entre el número de barras que van a aparecer en el histograma. Vamos a utilizar 10 barras, por lo que el ancho de clase es 8. Comenzamos desde el valor 19.5 y sumamos 8 para completar el primer intervalo y así sucesivamente. La distribución de frecuencias se muestra en la siguiente tabla 3. Calculamos la media 4. Calculamos la desviación estándar 5. Calculamos la mediana 6. Calculamos la moda 7. + Coeficiente de variación y de asimetría.

UNADM | DCEIT | EM | EMPE

6


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

20

Columna H

18 16 14 12 10 8 6 4 2 0 20

30

40

50

60

60

70

80

90

100

Con ayuda de una tabla de Excel elaboramos la tabla de frecuencias Intervalos

Limites

đ?‘Ľ"

đ?‘“"

đ??š"

23.5 31.5 39.5 47.5 55.5 63.5 71.5 79.5 87.5 95.5

11 5 13 18 15 12 18 11 5 3

11 16 29 47 62 74 92 103 108 111

reales

20-27 28-35 36-43 44-51 52-59 60-67 68-75 76-83 84-91 92-99 SUMA

19.5-27.5 27.5-35.5 35.5-43.5 43.5-51.5 51.5-59.5 59.5-67.5 67.5-75.5 75.5-83.5 83.5-91.5 91.5-99.5

đ??š" porcentual 9.9099099099 14.4144144144 26.1261261261 42.3423423423 55.8558558559 66.6666666667 82.8828828829 92.7927927928 97.2972972973 100

đ?‘Ľ" ∗ đ?‘“" 258.5 157.5 513.5 855 832.5 762 1287 874.5 437.5 286.5 6264.5

đ?‘Ľ" − đ?œ‡ ' đ?‘“" 11935.4796 3110.018 3730.5268 1438.6248 13.254 598.1232 4082.4648 5849.3996 4823.618 4577.0508 40158.5596

Para obtener el primer lĂ­mite real se utiliza el primer intervalo 20-27 y lo que se hace es al lĂ­mite inferior le restamos 0.5 y al lĂ­mite superior le sumamos 0.5, de esta manera se obtiene 19.5-27.5, y asĂ­ sucesivamente. De la informaciĂłn anterior, obtenemos lo siguiente:

UNADM | DCEIT | EM | EMPE

7


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

n 111 Dato mayor 96 Dato menor 20 Rango 96-20=76 Longitud del intervalo 8 27.5-19.5=8 media

Âľ

mediana

đ?‘Ľ

Se obtiene con la diferencia de los limites reales 56.4369369369 56.44 Se obtuvo utilizando semejanza de 56.03 triĂĄngulos 47.5 y 71.5 365.0778145455 19.1070095657

moda đ?‘Ľ varianza đ?œŽ' DesviaciĂłn estĂĄndar Ďƒ Coeficiente de đ?‘?. đ?‘Ł. = đ?œŽ 0.3385366684 đ?œ‡ variaciĂłn đ?œ‡âˆ’đ?‘Ľ Coeficiente de 0.4678911145 asimĂŠtrica positiva, para la moda 47.5 đ??ś= = asimetrĂ­a đ?œŽ -0.7881924143 asimĂŠtrica negativa, para la moda 71.5

Ahora te vamos a mostrar cĂłmo se calcula la mediana (semejanza de triĂĄngulos)

Figura 1. Mediana.

UNADM | DCEIT | EM | EMPE

8


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

Primero hay que encontrar el intervalo donde estĂĄ el 50% de los datos y utilizamos los lĂ­mites reales, despuĂŠs utilizamos la frecuencia acumulada y la frecuencia acumulada anterior a ese 50% de datos finalmente con ayuda del tema semejanza de triĂĄngulos (visto en el Modulo 2) para encontrar la proporciĂłn de la longitud. đ?‘Ž 55.5 − 47 = 59.5 − 51.5 62 − 47 68 đ?‘Ľ = 51.5 + đ?‘Ž = 51.5 + = 56.03 15 No es la Ăşnica manera de resolver el problema, podemos utilizar para dar el nĂşmero de intervalos, para la cual se aplica la regla de Sturges N = 1 + 3.3Log(R). Donde N es el nĂşmero sugerido de intervalos, y R es el rango de los datos. Luego calculamos el ancho del intervalo A con la ecuaciĂłn A=R/N n Dato mayor Dato menor Rango

111 96 20 96-20=76

N es el nĂşmero sugerido de intervalos, y R es el rango de los N = 1 + 3.3Log(R) datos.

7.2066848545

La amplitud A de cada intervalo A=R/N es

10.8571428571 11

media

55.9189189189 55.9

Âľ

mediana moda varianza DesviaciĂłn estĂĄndar Coeficiente de variaciĂłn Coeficiente de asimetrĂ­a

đ?‘› đ?‘? − đ?‘“ đ?‘Ľ = đ??ż" + 2 đ?‘“B đ?‘Ľ đ?œŽ'

+

7

55.6842105 47 355.3300909091 18.8502013493

Ďƒ đ?œŽ đ?œ‡ đ?œ‡âˆ’đ?‘Ľ đ??ś= = đ?œŽ đ?‘?. đ?‘Ł. =

0.3372129043 0.4721434978

AsimĂŠtrica positiva

Donde đ?‘Ľ es la mediana đ??ż" es el lĂ­mite inferior donde estĂĄ el 50% de los datos UNADM | DCEIT | EM | EMPE

9


MĂłdulo 4 Unidad 1. EstadĂ­stica descriptiva

đ?‘› es el tamaĂąo de la muestra đ?‘? es la longitud del intervalo đ?‘“B es la frecuencia donde estĂĄ el 50% de los datos đ?‘“ + es la frecuencia acumulada anterior al 50% de los datos En promedio las calificaciones obtenidas por los alumnos es 55.9, la mediana indica que el 50% de las calificaciones es menor o igual a 55.68. Como pudiste observar, al realizar dicho ejercicio por estas dos formas te diste cuenta que no varĂ­a mucho la informaciĂłn, podemos concluir que el mejor anĂĄlisis es el que tiene la menor desviaciĂłn estĂĄndar. Ahora es momento de poner en prĂĄctica lo aprendido, te invitamos a realizar la primera y segunda actividad de aprendizaje.

UNADM | DCEIT | EM | EMPE

10


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.