Distribución muestral y teorema del límite central by Enrique Israel

Estadística Inferencial Parte I

Distribución Muestral y Teorema de Límite Central

Enrique Israel Martínez Gordillo

Distribución Muestral y Teorema de Límite Central

https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central

Distribución Muestral Presentación La Estadística Inferencial es la rama de la estadística que estudia el comportamiento y propiedades de las muestras y la posibilidad de generalizar los resultados obtenidos a las poblaciones que representan. Es importante recalcar que esta generalización es de tipo inductivo y se basa en la probabilidad y en los resultados de una muestra representativa de la población. Dado esto es la importancia de la selección de la muestra y su análisis para comprender las bases de la Inferencia estadística. “RECUERDE Ningún método estadístico puede corregir los defectos por una inadecuada selección del problema que se investiga, o por una mala recolección de datos. Una investigación que empieza mal, con seguridad termina mal. CON DATOS DE MALA CALIDAD, NO SERÁ POSIBLE DAR RESPUESTA ADECUADA A UN PROBLEMA CIENTÍFICO.” (Nolberto, Ponce, 2008, p. 18)

Conceptos Básicos Supongamos que usted es líder del proyecto social “Conocimiento para todos” el cual pretende crear centros de capacitación en temas de computación, administración y negociación en zonas rurales enfocado a jóvenes de entre 18 y 25 años y necesita establecer la distancia promedio y el costo de transporte que les representaría acudir a la cede a recibir dichos cursos. El costo de realizar un censo con esta información sería muy alto para lo cual una manera más viable podría ser seleccionar una muestra de estos jóvenes y a partir de ésta tomar las decisiones más prudentes para el proyecto. El primer paso sería dar respuesta a cuestiones básicas como: ¿A quiénes afecta el proyecto?, ¿Qué información es la que me interesa obtener?, ¿Cómo voy a clasificar dicha información?, ¿Cómo seleccionar la muestra?, entre otras. Observemos que en el proyecto social “Conocimiento para todos” nos interesa el comportamiento de los jóvenes de 18 a 25 años de toda la comunidad, es decir el proyecto está pensado para TODOS ellos, y las decisiones que se tomen no pueden quedarse en el nivel de la muestra (estadístico) sino que deben ser enfocadas a la población (parámetro).

https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central

Parámetros μ Media σ Desviación Estándar P Proporción

Estadísticos X Media S Desviación Estándar p Proporción

Si el objetivo de la estadística inferencial es la toma de decisiones respecto a un objetivo planteado a nivel poblacional, entonces es necesario realizar un estudio muestral cuyos estadísticos ayuden a dar conclusiones al objetivo planteado. En el proyecto “Conocimiento para todos” para recolectar la información sobre distancia y costo del desplazamiento (parámetros) sería necesario tomar varias muestras y calcular la media y la desviación estándar (estadísticos) de cada una de ellas, al realizar este estudio se observaría que existen diferencias entre los estadísticos de cada una de las muestras. Con esta información de los estadísticos podríamos graficarlos y analizar su distribución; esta distribución de las medias de cada muestra se le conoce como Distribución muestral de medias. La distribución muestral de medias puede ser descrita por su media y su desviación estándar, es decir la media de las medias muestrales µx y la desviación estándar de las medias muestrales σx llamada error estándar pues muestra la variación entre cada media muestral y la media total. La ecuación para el error estándar es: Para poblaciones Infinitas

σ x= σ √n

Para poblaciones Finitas

√

N−n σ x= σ ⋅ √n N −1 cuando n > 0.05N donde N es el tamaño de la población. https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central

Teorema de Límite Central De la distribución muestral se concluyen los siguientes aspectos: 1. La media de la distribución de medias es igual a la media poblacional, sin importar la magnitud de la muestra, incluso si la población no es normal. 2. Al incrementarse el tamaño de la muestra, la distribución muestral de medias se acercará a la normalidad. 3. La desviación de las medias del muestreo (error estándar) varía inversamente proporcional a la magnitud de la muestra. Esta relación entre la forma de la distribución de la población y la forma de la distribución de muestreo se denomina teorema de límite central, el cual es talvés el más importante de toda la estadística inferencial, puesto que permite utilizar estadísticas muestrales para hacer inferencias a parámetros poblacionales sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que se puede obtener de las muestras. “Si x es la media de una muestra aleatoria de tamaño n, extraída de una población con media μ y desviación finita conocida σ, entonces:

x−μ z= σ x Es el valor de una variable cuya función de distribución se aproxima a la de la distribución normal estándar cuando n tiende a infinito” Para ampliar y/reforzar tu información sobre este tema, se te sugiere revisar los siguientes recursos:

De Estadística Útil, Teorema de Límite Central (TLC) recuperado de

https://www.youtube.com/watch?v=46DgBP9VwtE Consultado 22/07/2016

Distribuciones muestrales. Distribución muestral de Medias, http://www.geociencias.unam.mx/~ramon/EstInf/Clase4.pdf . Consultado 22/07/2016

https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central

Ejemplo (De Anderson, Sweeney, Williams. (2012). Estadística para negocios y economía. México D.F: Cengage Learning, pp 288 ej. 26)

El costo medio anual de un seguro para automóvil es de $939 (CNBC, 23 de febrero de 2006). Suponga una desviación estándar de $245 a)

¿Cuál es la probabilidad de que en una muestra aleatoria simple de 50 pólizas de seguro de

automóvil la media muestral esté por encima de los $1000? b)

¿Cuál es la probabilidad de que en una muestra aleatoria simple de 50 polizas de seguro de

automóvil la media de la muestra no difiera en más de $25 de la media poblacional? Solución: a)

Tomando en cuenta el teorema de límite central donde supone que la distribución

muestral sigue una distribución normal podemos hacer uso de las tablas de

distribución

normal estándar: Objetivo: Hallar la probabilidad de que en una muestra aleatoria simple de 50 pólizas de seguro

automóvil, la media muestral esté por encima de los $1000. P(x >$1,000) Datos: μ=$ 939 σ=$245 n=50 Estandarizando por teorema de límite central:

x−μ z= σ x donde: x = 1000 245 σ x= σ = =34.65 √ n √50

https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central Sustituyendo en la ecuación del teorema del límite central tenemos:

1000−939 =1.76 34.65

Buscando el área bajo la curva en las tablas de distribución normal con una Z=1.76:

El área acumulada que se obtiene de -∞ a z=1.76 es de 0.9608 por lo tanto la

probabilidad

de que el valor esté por encima de 1.76 será 1- 0.9608= 0.0392. Conclusión: La probabilidad de que en una muestra aleatoria simple de 50 pólizas de seguro

automóvil, la media muestral esté por encima de los $1000 será de 0.0392.

b) Basado de nuevo en el teorema de límite central: Objetivo: Hallar la probabilidad de que en una muestra aleatoria simple de 50 polizas de seguro automóvil la media de la muestra no difiera en más de $25 de la media poblacional,

es decir, que la

meda muestral se encuentre entre μ-25 y μ+25 P(μ-25< x < μ+25) Datos: μ=$ 939 σ=$245 n=50 https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central

Estandarizando por teorema de límite central:

x−μ z= σ x donde: x1 = 914 x2 = 964 245 σ x= σ = =34.65 √ n √50 Sustituyendo en la ecuación del teorema del límite central tenemos:

914−939 =−0.72 34.65 964−939 Z 2= =0.72 34.65

Z1=

El área bajo la curva que nos interesa es la que se encuentre entre z 1=-0.72 y z2= 0.72 y leyendo en tablas tenemos: P(z←0.72)=0.23576 P(z< 0.72)= 0.76424 La probabilidad P(μ-25<

x < μ+25) o P(914< x < 964) será la diferencia entre las

probabilidades de P(z< -0.72)=0.23576 y P(z< 0.72)= 0.76424 . 0.76424 – 0.23576 = 0.52848 Conclusión: La probabilidad de que en una muestra aleatoria simple de 50 polizas de seguro automóvil la media de la muestra no difiera en más de $25 de la media

poblacional

de es

0.52848.

https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central Si gustas apoyarte con más ejemplos de solución de problemas de distribución muestral puedes visitar:

http://es.slideshare.net/asrodriguez75/problemas-resueltos-de-distribucinmuestral Consultado 01/08/2016

Referencias

•

Aguilar Márquez Arturo, Bravo Vázquez Fabína, et al. (2010). Cálculo diferencial e integral. México DF: Prentice Hall.

•

http://www.monografias.com/trabajos-pdf4/dominio-y-rango-funcion/dominio-y-rangofuncion.pdf

•

William Anthony Granville. (1980). CALCULO DIFERENCIAL E INTEGRAL. México: Limusa.

https://buhodigital.wixsite.com/bdv1

Distribución Muestral y Teorema de Límite Central

Enrique Israel, 2017 enrique.israel.martinez@gmail.com https://about.me/enriqueisrael

https://buhodigital.wixsite.com/bdv1