Ciencias Exactas, Ingeniería y Tecnología Enseñanza de las matemáticas 3er. Semestre Fase 1. Formación matemática Módulo 6 Aplicaciones de la estadística Unidad 0. Revisión de conceptos de estadística descriptiva MATERIAL DE ESTUDIO
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
IMPORTANTE
Excepto donde el contenido así lo especifique, esta obra está bajo una Licencia de Creative Commons
Material desarrollado y recopilado con fines educativos por académicos externos a la Institución, que colaboraron en la integración del programa educativo de Enseñanza de las Matemáticas perteneciente a la DCEIT de la Universidad Abierta y a Distancia de México (UnADM) Ciudad de México, 2017.
UNADM | DCEIT | EM | EMAE
2
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Presentación
¡Bienvenidos(as) a la Unidad 0! Esta unidad te será útil para repasar los conceptos de distribución de probabilidad de algunas variables continuas y discretas importantes así como el teorema del límite central (TLC).
Para cursar exitosamente esta unidad debes ser capaz de: • obtener las medidas de tendencia central (media, mediana) y de dispersión (varianza, desviación estándar) de una población, • definir una variable aleatoria y una distribución de probabilidad, • identificar el tipo de distribución en un problema (si es continua o discreta, si es discreta puede ser binomial, hipergeométrica, Poisson, etc.), obtener la probabilidad de un evento dado
UNADM | DCEIT | EM | EMAE
3
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
•
saber normalizar las distribuciones con media y varianza distintas de 0 y 1 respectivamente, así como calcular probabilidades empleando las tablas de probabilidad para la distribución normal estándar,
•
explicar el significado del Teorema del Límite Central y poder aplicarlo.
Te recomendamos que revises el material que se te proporcionó en el módulo 4: “Probabilidad y Estadística” en específico sobre los temas que ya se mencionaron.
Competencia específica Revisa los conceptos de estadística descriptiva, para reafirmar su comprensión mediante la resolución de ejercicios, problemas de aplicación y el manejo de aplicaciones web.
Desarrollo por semana Semana 1 En esta primera semana de estudio, resolverás dos actividades, la primera consiste en una revisión de las variables aleatorias discretas y sus distribuciones de probabilidad. La segunda es una revisión de variables aleatorias continuas, específicamente de la distribución normal y su relación con el teorema de limite central (TLC).
Distribuciones discretas Antes de comenzar a estudiar el campo de la estadística inferencial es esencial que repases los conceptos fundamentales de la estadística descriptiva, por esa razón primero recuerda ¿qué es una distribución estadística y una tabla de frecuencias? ¿Cuáles son los gráficos estadísticos principales para agrupar datos? ¿Qué es una variable estadística? ¿Y cuáles son las medidas de tendencia central de una variable aleatoria discreta? el siguiente material didáctico te será útil y práctico para repasar los tópicos antes mencionados. ¡Te invitamos a revisarlo!
UNADM | DCEIT | EM | EMAE
4
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Educación Digital con Descartes (EDAD). Estadística. Disponible en: http://proyectodescartes.org/EDAD/materiales_didacticos/EDAD_2eso_estadistic a-JS/index.htm También es importante que repases los conceptos de medidas de dispersión de una variable aleatoria discreta. Educación Digital con Descartes (EDAD). Estadística, sección 4. Disponible en: http://proyectodescartes.org/EDAD/materiales_didacticos/EDAD_3eso_estadistic a-JS/index.htm En los enlaces de Educación Digital con Descartes (EDAD), podrás encontrar una gran variedad de contenido sobre estadística descriptiva, te recomendamos seguir navegando a través de dicha plataforma para repasar a través de interactivos didácticos los conceptos de la estadística descriptiva. Entre las principales distribuciones discretas se encuentran las siguientes: 1. Distribución uniforme 2. Distribución de Bernoulli KhanAcademyEspanol (2012). Distribución de Bernoulli I. Disponible en: https://www.youtube.com/watch?v=H2f6h1hm4jo KhanAcademyEspanol (2012). Distribución de Bernoulli II. Disponible en: https://www.youtube.com/watch?v=jCUHKx3DgiQ
3. Distribución binomial En el siguiente video podrás observar algunos ejercicios con el modelo binomial.
UNADM | DCEIT | EM | EMAE
5
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Tv UnADM (2010). Distribución Binomial. Disponible en: https://www.youtube.com/watch?v=41nOjbABQ30
4. Distribución hipergeométrica Distribución hipergeométrica. Descarga en la sección de material de apoyo de unidad 0 en el aula.
5. Distribución de Poisson https://www.youtube.com/watch?v=jIZaAgQJk7o https://www.youtube.com/watch?v=nhxMLs5fwHU
En el siguiente capítulo de libro puedes repasar el concepto de las distribuciones discretas de probabilidad a través de diferentes ejemplos. John E. Freund, Irwin Miller, Marylees Miller 6ª edición (2000). Estadística Matemática Aplicada. Capítulo 5. Distribuciones de probabilidad especiales. pp. 169-202. Disponible en: https://books.google.com.mx/books?id=1ffwJNjZWxsC&lpg=PP1&dq=estadistic a%20freund&pg=PR8#v=onepage&q=estadistica%20freund&f=false
UNADM | DCEIT | EM | EMAE
6
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
El siguiente video servirá para despejar tus dudas y recordar el concepto de distribución discreta de probabilidad y se explicarán las distribuciones discretas más comunes. Colegio San Bartolomé La Merced (2012) Distribuciones discretas de probabilidad. Disponible en: https://www.youtube.com/watch?v=unUpFZiI6DM
¡Es momento de consolidar tu aprendizaje! realiza la Actividad 1.
UNADM | DCEIT | EM | EMAE
7
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Distribuciones continuas y Teorema de Límite Central Para poder desarrollar esta actividad, primero es necesario que repases los conceptos del módulo de Probabilidad y Estadística específicamente las variables aleatorias continuas. Recuerda que todos los videos y textos que te sugerimos son una guía para recordar lo que aprendiste anteriormente. Primero se dará un repaso a las definiciones de variable aleatoria continua y función de densidad (o distribución de probabilidad). En el siguiente video se da una breve explicación de la definición de variable aleatoria continua. Khan Academy (2012) Discrete and continuous random variables [Archivo de video] Disponible en: https://www.youtube.com/watch?v=dOr0NKyD31Q
En los siguientes videos se explica el concepto de función de densidad. Khan Academy (2012) Continuous probability distribution intro [Archivo de video] Disponible en: https://www.youtube.com/watch?v=j8XLYFzTJzE
Khan Academy (2012) Probability density functions [Archivo de video] Disponible en: https://www.youtube.com/watch?v=Fvi9A_tEmXQ
Después de revisar el material anterior, estudiaremos una de las distribuciones continuas más utilizadas en la estadística: la distribución normal o gaussiana. En el siguiente vídeo se encuentra una explicación de cómo calcular probabilidades con esta distribución.
UNADM | DCEIT | EM | EMAE
8
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Khan Academy (2009) Introduction to the normal distribution [Archivo de video] Disponible en: https://www.youtube.com/watch?v=hgtMWR3TFnY La segunda parte del repaso consiste en revisar material sobre el Teorema de límite central. Repasemos… Investigar a toda una población para obtener datos sobre un tema específico puede ser muy costoso, impráctico o imposible. Lo que se hace es tomar una muestra aleatoria para inferir el comportamiento de la población en algún aspecto de interés. Por ejemplo si se está interesado en saber el riesgo que tienen hombres adultos (21-35 años) de sufrir cierta enfermedad crónica como diabetes o hipertensión, la circunferencia de la cintura es un elemento que se puede tomar en cuenta. Para realizar el experimento se tomaría una muestra aleatoria de 100 hombres adultos y se mediría su circunferencia. La media de la circunferencia de los 100 hombres no tendría por qué ser igual a la media de la circunferencia de todos los hombres de la ciudad, puede que sea mayor o menor pero no exactamente igual. Si se toma una segunda muestra aleatoria del mismo tamaño, la media tampoco tendría que ser igual a la de la primera muestra. Por lo tanto es natural preguntarse qué tan confiables pueden resultar las inferencias o deducciones que se hacen sobre la media de la circunferencia de la población de hombres adultos en la ciudad basándose en una muestra. Para responder a esta pregunta se estudia cómo se distribuyen las medias de las muestras alrededor de la muestra poblacional o la distribución de muestras.
Las variables aleatorias X1, X2, X3, …, Xn forman una muestra aleatoria de tamaño n si: Las variables Xi son variables aleatorias Todas la Xi tienen la misma distribución de probabilidad. Para distinguir la medida descriptiva de una población de la medida descriptiva de una de sus muestras, se llamará al primero parámetro y al segundo estadístico. UNADM | DCEIT | EM | EMAE
9
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Para una población dada, el parámetro es un valor fijo mientras que un estadístico varía según la muestra. Un estadístico es una entonces una función de las observaciones en una muestra aleatoria.
Algunos parámetros y sus estadísticos correspondientes más comunes se muestran en la siguiente tabla: Medida descriptiva
Parámetro
Estadístico
Media
µ
X
Varianza
s2
s2
Desviación estándar
s
s
Como un estadístico es una variable aleatoria entonces tiene una distribución de probabilidad.
La distribución de probabilidad de un estadístico es una distribución de muestras. La media de la distribución de medias de muestras que se denota
µX = µ
donde
está dada por (1)
is la media de la población.
El valor de la media de muestras es la media de la población.
Si la población es infinita y el muestreo es aleatorio o si la población es finita y el muestreo es con reemplazo, entonces la varianza de la distribución de medias de muestras denotada s X2 es
UNADM | DCEIT | EM | EMAE
10
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
s = 2 X
donde
s2
(2)
n
s 2 es la varianza de la población.
Si la población es de tamaño N, el muestreo se hace sin reemplazo y el tamaño de la muestra es entonces la media de muestras se debe corregir por un factor
s = 2 X
mientras que
Cuando
(3)
s2 æ N -nö ç ÷ n è N -1 ø
.
esta ecuación se convierte en la ecuación (2).
Teorema de Límite Central Sean X1, X2, ,…, Xn variables aleatorias independientes distribuidas idénticamente con media varianza Z=
Si
finitas. Si
X -µ
s
y
es la media de la muestra, la forma límite de la distribución de
cuando
es la distribución estándar normal.
n
, la aproximación normal será apropiada sin importar la forma de a población. Si
, el
TLC funcionará sólo si la población es similar a la normal. Según el TLC no es necesario conocer la distribución de la población (podría ser binomial, poisson, uniforme, normal, etc.), si el tamaño n de las muestras es grande, la distribución de medias de muestras será aproximadamente normal. UNADM | DCEIT | EM | EMAE
11
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Se sugiere revisar los videos 5 y 6 para una mejor comprensión de las definiciones anteriores. Khan Academy (2012) Central Limit Theorem [Archivo de video] Disponible en: https://www.youtube.com/watch?v=JNm3M9cqWyc Video 5 Khan Academy (2012) Sampling distribution of a sample mean [Archivo de video] Disponible en: https://www.youtube.com/watch?v=FXZ2O1Lv-KE Video 6
Ejercicio resuelto Se asume que las alturas de 3000 estudiantes hombres en una universidad están distribuidas normalmente con una media de 1.73 m y una desviación estándar de 7.5 cm. Si se obtienen 80 muestras de 25 estudiantes cada una, ¿cuál sería la media y la desviación estándar de la distribución de medias de muestras resultante? La media será
m
y la desviación estándar
cm
La distribución de medias de muestras será aproximadamente normal con media 1.73 m y desviación estándar 1.5 cm.
UNADM | DCEIT | EM | EMAE
12
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Ahora revisa los siguientes recursos para complementar tu aprendizaje. Aplicación web 1: Simulador de distribuciones del muestreo de un media, Teorema del Límite Central http://onlinestatbook.com/stat_sim/sampling_dist/ Sugerencia: puedes traducir las instrucciones del simulador en la página de google. https://www.google.com.mx/search?q=traductor&ie=utf-8&oe=utf8&client=firefox-b&gfe_rd=cr&ei=ITW_WNDlAsKwiAXkqa-QDQ
Tabla acumulativa de la distribución normal
UNADM | DCEIT | EM | EMAE
13
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
¡Es momento de consolidar tu aprendizaje! realiza la Actividad 2.
Cierre de la unidad Esta unidad te permitió repasar los conceptos básicos de la estadística descriptiva para abrir el panorama hacía la estadística inferencial. Aprendiste a distinguir entre las diferentes distribuciones de probabilidad discretas con el fin de aplicarlas correctamente para la solución de problemas. Reconociste la importancia de la distribución normal en la estadística. Esta recapitulación de conceptos te permitirá iniciar en la toma de decisiones y la estimación de parámetros que se verá en la siguiente unidad.
UNADM | DCEIT | EM | EMAE
14
Módulo 6 Unidad 0. Revisión de conceptos de estadística descriptiva
Fuentes de consulta Básica W. J. DeCoursey. (2003). Statistics and Probability for Engineering Applications. United States of America: Newnes. M. Spiegel, J. Schiller, R. A. Srinivasan. (2001). Shaum’s Easy Outlines Probability and Statistics. New York: McGraw-Hill. John E. Freund, Irwing Miller, Marylees Miller. (6ª ed. 1999). Estadística Matemática con aplicaciones. México: Pearson Education. Complementaria D. S. Yates, D. S. Moore, D. S. Starnes. (2nd ed. 2002) The Practice of Statistics. New York: W. H. Freeman and Company.
UNADM | DCEIT | EM | EMAE
15