Inferencia estadística una población (estimación de media y proporción)

Page 1

Estadística Inferencial Parte II

Inferencia Estadística Una población: Estimación de Media y Proporción

Enrique Israel Martínez Gordillo


Estimaciรณn de Media y Proporciรณn

https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

ESTIMACIÓN DE PARÁMETROS EN UNA POBLACIÓN MEDIA Y PROPORCIÓN Presentación La Inferencia estadística es el proceso mediante el cual a partir de información obtenida de una muestra representativa, se inducen o se comprueban parámetros supuestos para dar conclusiones sobre la población incluyendo un riesgo de error medible en términos de probabilidad. Dentro de la inferencia se pueden dar dos procesos; el primero es la estimación de un parámetro y el segundo la comprobación del comportamiento del parámetro haciendo uso ambos de la probabilidad para medir su grado de confiabilidad.

Estimación Inferencia Prueba de Hipótesis

Desarrollo Sigamos en el supuesto de que usted es líder del proyecto social “Conocimiento para todos” el cual pretende crear centros de capacitación en temas de computación, administración y negociación en zonas rurales enfocado a jóvenes de entre 18 y 25 años, y necesita como primer paso establecer la distancia promedio y el costo de transporte que les representaría acudir a la cede a recibir dichos cursos. La forma más viable para obtener esta información sería tomar una muestra representativa de la población con la variable de interés y analizarla obteniendo los estadísticos de la misma. Tomando como base los estadísticos podríamos estimar la distancia promedio y el costo de transporte que les representaría acudir a la cede a toda la población de interés y tomar decisiones bajo esta información. https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

Tipos de Estimación Estimación Puntual: Elección de un estadístico muestral respecto al cual se tiene alguna ESPERANZA O SEGURIDAD de que esté “razonablemente cerca” del parámetro que se ha de

estimar.

Dependiendo del parámetro a estimar es el estadístico a calcular, por ejemplo en el proyecto “Conocimiento para todos” donde nos interesa la distancia promedio que ha de recorrerse en kilómetros, se toma una muestra de 50 jóvenes de entre 18 y 25 años en la cual la distancia promedio (x) que recorrerían a la cede es 7.3 km, entonces podría hacer una estimación puntual de la media poblacional diciendo que la distancia promedio de todos los jóvenes de entre 18 y 25 años que habrían de recorrer a la cede (µ)es de 7.3 km. En la siguiente tabla se muestra una relación entre el parámetros y su estadístico para poder realizar las estimaciones (Muratalla, P. 2016, Apuntes del Curso): Estadístico

Parámetro

Estimación Puntual

Media de la Muestra

Media Poblacional

µ= x

Desviación de la Muestra

Desviación Poblacional

σ=s

Proporción de la Muestra

Proporción Poblacional

P=p

Estimación por Intervalo Es un intervalo de valores que se utiliza para estimar un parámetro de una población teniendo un cierto nivel de confiabilidad. Una estimación puntual a menudo es insuficiente pues existen muy bajas probabilidades de que la estimación sea verdadera por lo que puede existir un error entre el valor real y el valor estimado, es decir, tomando como ejemplo la estimación de la media poblacional, puede existir una diferencia entre el estadístico x y el parámetro µ ( x - µ ) el cual se llama Error de Estimación (E). Para analizarlo se partirá de que la variable aleatoria tiene aproximadamente una distribución normal (se conoce el valor de la desviación poblacional o la muestra es grande, mayor a 30).

x−μ z= σ x https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción Si de esta fórmula se despeja el error de estimación E= x – µ:

E=|x−μ|=z α σ x 2

Para calcular el error de estimación se requiere de cierto grado de confiabilidad y de error, es decir de una probabilidad de certeza que generalmente es del 90% , 95% y 99%, y al error se le denomina alfa (α ) lo cual es el complemento de la probabilidad de certeza.

Es importante observar que la confiabilidad es 1- α

y que la suma de las probabilidades de los

extremos de la distribución es α , es por ésto que el área de cada extremo es α /2. Por lo tanto la estimación por intervalo con un nivel de confiabilidad 1- α será el intervalo que se genera entre el estimador puntual y el error de estimación:

x -E < µ < x +E es decir µ= x ± E o lo que sería

μ=x±z α σ x 2

Observe que el nivel de confianza impacta en la ecuación a través del valor de Z α /2 el cual se obtiene de la tabla de distribución normal. Tomando los valores más comunes de α : https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

Nivel de confianza 1- α

Área en extremos

Área en cada extremo

α

α/2

0.90

0.10

.05

± 1.64

0.95

0.05

.025

± 1.96

0.99

0.01

.005

± 2.58

Valor de Zα /2

Estimación de la media de una población Estimación por intervalo de la media de una población con sigma conocida En el ejemplo en el proyecto “Conocimiento para todos” donde nos interesa la distancia promedio que ha de recorrerse en kilómetros, se toma una muestra de 50 jóvenes de entre 18 y 25 años en la cual la distancia promedio (x) que recorrerían a la cede es 7.3 km y se sabe que la desviación estándar poblacional de dichas distancias es de σ = 2.5 km. Se puede obtener una estimación con un 95% de probabilidad de que el valor real de distancia promedio poblacional µ se encuentre dentro de un intervalo para lo cual:

μ=x±z α σ x 2

donde:

x = 7.3 km σ = 2.5 km n=50

2.5 σ x= σ = =0.3535 n 50 √ √ Zα /2 @ 95% de nivel de confianza =1.96

μ=x±z α σ x =7.3±(1.96)(0.3535)=7.3±0.6928 2

https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción La estimación por intervalo de la distancia promedio que han de recorrer los jóvenes de entre 18 y 25 años a la cede va de: 7.3 - 0.6928 < µ < 7.3 + 0.6928 es decir:

de 6.6072 a 7.9928 kms a un 95% de nivel de confianza Para reforzar lo visto en esta sección te recomiendo que visites:

Intervalos de Confianza Estimar u muestras grandes, Evelio Hernández https://www.youtube.com/watch?v=EsAGiLv8qVE Consultado 12/08/2016

Estimación por intervalo de la media de una población con sigma desconocida En los casos donde no conocemos la desviación estándar poblacional (pero si tenemos forma de obtener la desviación estándar muestral) y el tamaño de muestra es pequeño (menor a 30), la distribución no se aproxima a la distribución normal estándar si no que se aproxima a una distribución t-Student.

La forma de la distribución t-Student va a depender de los grados de libertad ( gl), los cuales a su vez dependen del tamaño de muestra ( gl = n-1) y podemos notar en el gráfico que cuando n tiende a infinito la distribución t-Student tiende a una distribución normal estándar. https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción Para realizar la estimación por intervalo a un nivel de confianza dado las ecuaciones quedan:

E=t α σ x 2

σ x=

s √n

μ=x±t α σ x 2

donde el valor de

tα /2

depende del nivel de confianza y de los grados de libertad y se obtiene de las

tablas de la distribución t-Student. Ejemplo; Suponga que se quiere estimar con un 95% de nivel de confianza el gasto semanal promedio en transporte de los estudiantes de cierta universidad, para lo cual muestrean a 10 estudiantes: De la muestra se obtiene que la media es de x=$263 y la desviación estándar de s=$58. Solución: Para resolver el problema identificamos primero que no tenemos una desviación estándar poblacional (sigma desconocida) y segundo, nuestro tamaño de muestra es pequeño (menor a 30), por lo tanto el tipo de distribución que utilizaremos es la t-Student Datos:

x=$263 s=$58 n = 10 Para el valor de tα /2

a

un nivel de confianza del 95% = 0.95 corresponde un α = .05 , por lo tanto α /2

= 0.025 y con 9 grados de libertad. ( gl = n-1 = 10-1 = 9 ). De la tabla de t-Student:

https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

Grados de Libertad (gl)

Nivel de significancia para prueba de una cola (α/2) 0.005 0.01 0.025 0.05 1 63.6567 31.8205 12.7062 6.3138 2 9.9248 6.9646 4.3027 2.9200 3 5.8409 4.5407 3.1824 2.3534 4 4.6041 3.7469 2.7764 2.1318 5 4.0321 3.3649 2.5706 2.0150 6 3.7074 3.1427 2.4469 1.9432 7 3.4995 2.9980 2.3646 1.8946 8 3.3554 2.8965 2.3060 1.8595 9 3.2498 2.8214 2.2622 1.8331 10 3.1693 2.7638 2.2281 1.8125 11 3.1058 2.7181 2.2010 1.7959 12 3.0545 2.6810 2.1788 1.7823 13 3.0123 2.6503 2.1604 1.7709 14 2.9768 2.6245 2.1448 1.7613 15 2.9467 2.6025 2.1314 1.7531

0.1 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406

Obtenemos tα /2=2.2622 . Aplicando en nuestras ecuaciones:

σ x=

s 58 = =18.3412 √n √10

μ=x±t α σ x =263±2.2622∗18.3412=263±41.4914 2

La estimación por intervalo del gasto promedio semanal en transporte de los estudiantes en la universidad es de: 263- 41.4914 < µ < 263 + 41.4914 es decir:

de

$221.50

a

$304.50

a un 95% de nivel de confianza

Para reforzar lo visto en esta sección te recomiendo que visites:

Estadistica en 10 minutos: Estimar la media poblacional con sigma desconocido , Christian Pacheco https://www.youtube.com/watch?v=pjIwevk7juo Consultado 15/08/2016 https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

Estimación de la proporción de una población Estimación por intervalo de la proporción de una población Cuando lo que nos interesa es una característica de la población, es decir una variable cualitativa, el parámetro a calcular es la Proporción (P); la cual se supone como una distribución Normal quedando el teorema de límite central para proporciones:

p−P z= σ p donde el error estándar de proporciones se calcula: para poblaciones infinitas:

σ p=

p⋅(1− p) n

Para poblaciones finitas:

σ p=

p⋅(1− p) N −n ⋅ n N −1

y los cálculos de su intervalo a cierto nivel de confianza :

P= p±z α σ p 2

Ejemplo; Suponga que en el proyecto “Conocimiento para todos” nos interesa la proporción de jóvenes de entre 18 y 25 años de la comunidad rural que estarían interesados en inscribirse al programa, para lo cual se toma una muestra de 30 jóvenes a quienes se les pregunta si participarían, de estos 23 contestan que sí. https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

Para establecer el intervalo podemos tomar como nivel de confianza un 95%. Datos:

n= 30 jóvenes a= 23 jóvenes que dijeron que Sí participarían, es decir, cubren la característica. p= 23/30 = 0.7666

zα /2= 1.96 a un 95% de nivel de confianza, es decir

un α = .05

calculando el error estándar:

σ p=

p⋅(1− p) 0.7666⋅(1−0.7666) = =0.07722 n 30

Para el intervalo:

P=0.7666±1.96⋅0.07722=0.7666±0.1513 0.7666 – 0.1513 < P < 0.7666 + 0.1513 @ Nivel de confianza del 95% Conclusión: La proporción de jóvenes en la comunidad rural que se inscribirían al programa “Conocimiento para todos” se encuentra entre un 0.6153 y un 0.9179 con un nivel de confianza del 95%. Para reforzar lo visto en esta sección te recomiendo que visites:

Estimación de proporciones, Tu ciencia https://www.youtube.com/watch?v=X4SShO_TEK8 Consultado 15/08/2016

https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción

Para ver más ejemplos resueltos sobre Estimación por intervalo te recomiendo que visites:

Ejercicios de estimación e Intervalos de confianza http://es.slideshare.net/chcluz/tarea-8-ejercicios-de-estimacin-de-intervalo Consultado 15/08/2016

Cálculo del tamaño de muestra Una de las aplicaciones de gran valor de la estadística inferencial es el cálculo del tamaño de la muestra la cual va a depender del nivel de confianza que busquemos en el parámetros a inferir y del grado de error que podamos permitir. Para la comprensión de los cálculos de la muestra visita:

Carlos Ochoa, ¿Qué tamaño de muestra necesito? http://www.netquest.com/blog/es/que-tamano-de-muestra-necesito/ Consultado 21/08/2016 Ejercicios sobre determinación del tamaño de muestra http://es.slideshare.net/chcluz/tarea-9-problemas-de-determinacin-de-tamaode-la-muestra-5181924 Consultado 15/08/2016

https://buhodigital.wixsite.com/bdv1


Estimación de Media y Proporción Referencias •

Anderson, Sweeney, Williams. (2012). Estadística para negocios y economía. México D.F: Cengage Learning

William Anthony Granville. (1980). CALCULO DIFERENCIAL E INTEGRAL. México: Limusa.

Walpole Ronald E , Myers Raymond H , Myers Sharon L. (2012). Probabilidad y estadística para ingeniería y ciencias. Ciudad de México: Pearson.

Muratalla, P. 2016, Apuntes del Curso

https://buhodigital.wixsite.com/bdv1


Estimaciรณn de Media y Proporciรณn

Enrique Israel, 2017 enrique.israel.martinez@gmail.com https://about.me/enriqueisrael

https://buhodigital.wixsite.com/bdv1


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.