Técnicas de Muestreo 3 Ernesto A. ROSA Universidad Nacional de Misiones Universidad Nacional de Tres de Febrero (UNTREF) Departamento de Metodología, Estadística y Matemática Carrera de Licenciatura en Estadística Maestría en Generación y Análisis de Información Estadística
1
VI: Muestreo Aleatorio Simple (MAS) 1. Introducción 2. Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar Estimadores por Simple Expansión (MESE) 3. Determinación del Tamaño de la Muestra Introducción Requisitos y Condiciones previas Tamaño de la Muestra para estimar un Parámetro Genérico “θ” Conclusiones 4. Otros Métodos de Estimación en el MAS
Método de Estimación por Razón (MERa) Estimadores Alternativos en el MERa Método de Estimación por Regresión (MERe) 5. Muestreo con Probabilidades Desiguales (MPD) Particularidades del MPD Los Parámetros y sus Estimadores en el MPD Estimador Horvitz y Thompson (H-T) Selección con Probabilidad Desigual y Sin Reposición (SR) Selección con Probabilidades Desiguales (con Variable Auxiliar) y Con Reposición (CR) 2
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra - Introducción
Introducción La determinación del tamaño de la muestra es uno de los temas de más relevantes de la Estadística Inferencial, en donde se conjugan una cantidad de aspectos conceptuales de la Estadística y de las Probabilidades, a partir de cuya comprensión, se derivan una serie de aspectos de mayor complejidad. Posiciones ante el Muestreo: Magia, Misterio “Representativa” o Proporcional Dirigida 3
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra - Introducción
Dudas e incógnitas respecto al tamaño de la Muestra (n): ¿ De quién o de qué depende el tamaño de una Muestra ?; ¿ Cuáles son los factores que influyen ?; ¿ Todos los factores que participan tienen el mismo grado de influencia ?; ¿ Cómo participan los Parámetros o cuáles de ellos son los que permiten determinar el “n” ?; Para la determinación del tamaño de “n”, ¿ se requiere el cumplimiento de condiciones especiales ?; Obtenido un cierto tamaño en la muestra a extraer, ¿ su aplicación es irrestricta, o deben verificarse ciertos aspectos para que su utilización sea válida ? ¿ Cuánto influye el Diseño Muestral en el tamaño de la Muestra ? 4
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Requisitos y Condiciones previas
Requisitos y Condiciones previas Si bien el Diseño Muestral tiene influencia en la determinación del tamaño de la muestra, en gran parte de la teoría de la Estadística Inferencial se adopta que la muestra se elige aleatoriamente y que el Diseño Muestral que se aplica es el más básico de todos: el Muestreo Simple al Azar o Muestreo Aleatorio Simple (MAS), cuyos requisitos eran: • Tener numerados o identificados a cada uno de los N elementos que componen la población. • No prepararlos ni ordenarlos con ningún criterio previo. • Elegir las unidades de la muestra mediante algún método aleatorio. 5
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Requisitos y Condiciones previas
Adoptando que la Muestra se extraerá con un MAS, una de las formas de enfocar el análisis de la determinación del tamaño de la Muestra, es suponer que la misma será utilizada para estimar algún Parámetro. Aspectos que influyen en la determinación del tamaño de Muestra (n) : La existencia de muchas variables en una Población pasibles de ser analizadas con la Muestra que se extraiga. La dispersión de la Población con respecto a la variable principal. El nivel de confianza y la precisión que se pretende en la Estimación. Las particularidades de la Población (existencia de información referida a Estratos, Conglomerados, ordenamientos de las unidades, etc.). La relación entre Marco Muestral y Población Objetivo (cobertura de la Muestra). Restricciones presupuestarias. 6
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional fun Promedio (µ)
El tamaño de Muestra para realizar una estimación de la Media Poblacional (µ), depende realmente de los siguientes factores: Las condiciones bajo las cuales se desea realizar esa estimación: La precisión que se pretende tener en la Estimación. El grado de confianza con que se quiere realizar. El conocimiento que se debe tener de algunos otros aspectos de la población: El tamaño de la Población. La dispersión de los datos. El tamaño de n debe satisfacer las condiciones requeridas, partiendo de los datos disponibles. 7
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
Analizándose a esos 4 factores, sus respectivas influencias en la determinación del n son las siguientes: El tamaño de la Población N: parece lógico suponer que cuanto más grande es N, mayor debe ser la muestra n. La dispersión (σ x) de la Población: también parece lógico que cuanto más dispersos estén los valores de la variable, mayor debería ser la muestra que la represente. El grado de precisión con que quiere realizarse la estimación: sí se la determina como la diferencia entre el parámetro y su estimador, la lógica indica que cuanto más precisión se pretende, mayor debería ser la muestra. El grado de confianza: la lógica sugiere que cuanto mayor sea el nivel de confianza con que se quiere realizar la estimación, mayor deberá ser la muestra a observar. 8
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
Planteo Algebraico: Al querer estimar una µ con un Intervalo de Confianza, se tendrá:
P ( LI < µ < LS ) = 1 - α La expresión del intervalo, tiene entre sus componentes diversos factores, que son los que participan en su determinación, ya que: LI = x – z . σx = x – z . [(σ / √n ) . √(N-n) / (N-1)] LS = x – z . σx = x + z . [(σ / √n ) . √(N-n) / (N-1)]
9
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
Donde:
z
: es el valor de la Normal determinado por (1 - α) que es el Nivel de Confianza.
α
: es el Error aceptable.
(1 - α) : Nivel de Confianza. σx
: es la dispersión del estimador x.
N
: es la población de la cual se extraerá la muestra.
x
: es la Media Muestral o pivote del Intervalo.
AM = Ls - Li : Amplitud (o Precisión) del Intervalo. 10
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
De los factores que participan en el Intervalo de µ, de los que deben ser conocidos previamente y constituyen datos del problema, además de N y σ ya analizados, se tiene a: x: Promedio Muestral – Como pivote del Intervalo (participa en ambos límites), no influye en el tamaño de n. De los que constituyen condiciones o requisitos bajo los cuales se desea realizar la estimación de μ, los símbolos corresponden a: AM: Precisión de la Estimación: (1 – α): Grado de Confianza de la Estimación (medida en términos de probabilidad) α: Nivel de Riesgo de la Estimación, complemento del anterior. 11
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
En base a todos esos elementos y con un breve desarrollo algebraico: Li = x – z . σ x AM = Ls - Li
y
Ls = x + z . σ x
Amplitud (o Precisión) del Intervalo de Confianza
Llamando d = a la diferencia aceptable entre el Parámetro y su Estimador, es decir: P[(μ – x) > d] = α : Será: d = AM / 2 σx
de donde será:
AM = 2 . d = 2 . d =
= (x + z . σ x) – (x – z . σ x) = 2 . z . σ x ; de donde: d = z .
Pero: σ x = σ / √n por el Factor de Corrección (si corresponde) Con lo cual:
d = z . σ / √n (por ahora sin F de C)
12
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
Despejando n con la fórmula reducida (suponiendo N infinito):
n = z2 . σ 2 / d 2 = n0 Considerando el Factor de Corrección será:
n = z2 . σ 2 / [d2 + (z2 . σ 2) / N] = n0 /(1 + n0 / N) Es la fórmula ampliada. En ambas expresiones se puede analizar en forma algebraica como influye cada uno de los componentes, lo que coincide con el análisis lógico previo. Se resume a continuación: 13
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Si el Parámetro Poblacional fuese un Promedio (µ)
Analizándose a los 4 factores principales de las fórmulas, sus respectivas influencias algebraicas en la determinación del n son las siguientes: El tamaño de n es directamente proporcional a la Dispersión de la Población (σ), dato que debe ser conocido o estimado previamente. También es directamente proporcional al nivel de confianza (1 - α) que se fija como condición a cumplir, y que determina el valor de z de la Función de Probabilidad Normal La muestra es inversamente proporcional a la diferencia pretendida entre el estimador y su parámetro (d), y a mayor d, menor es la precisión de la Estimación (condición a cumplir con la muestra a extraer). Finalmente, cuanto mayor sea N, mayor es la muestra que debe extraerse, siendo el factor de menor influencia, ya que se encuentra dividiendo una parte del denominador. Ver Aspectos Conceptuales VI. 3. y Problemas Nº 37, 42 y 43 de la Guía de Aplicaciones. 14
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Promedio (µ)
Ahora bien, ¿ que supuestos implica el desarrollo que se realizó para lograr esas fórmulas ?; o bien, ¿ pueden ser aplicadas indiscriminadamente sin ninguna limitación ? Para llegar a cualquiera de las dos fórmulas alcanzadas, se pasó por un supuesto implícito: que la media que se calcule con la muestra que se extrae tiene una distribución Normal. Debido a ese supuesto, es que se pudo calcular el n utilizando el valor de z que queda determinado por el nivel de confianza (1-α) fijado como condición. Debido a esto, para que el valor calculado de n tenga validez, debe comprobarse que se den las condiciones para que el estimador pueda aceptarse que tenga distribución Normal (o tS). 15
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional un Total (X)
Determinación de n para estimar el Total (X) El razonamiento que se aplica para determinar el n en el caso de que se quiera estimar un Total, es similar al caso de la Media. Se parte de que se quiere estimar X con un Intervalo, llegándose a: La expresión o fórmula reducida:
n = N 2 . z2 . σ 2 / d 2 = n 0 Considerando el Factor de Corrección la fórmula ampliada será:
n = N2 . z2 . σ 2 / [d2 + (N . z2 . σ 2)] Ver Problemas Nº 38, 41 y 44 de la Guía de Aplicaciones.
16
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional una Proporción (P)
Determinación de n para estimar la Proporción (P) Con un razonamiento similar a los anteriores para la Media y para el Total, se parte de que se quiere estimar P con un Intervalo, llegándose a: La fórmula reducida:
n = z2 . P.Q / d2 = n0 Considerando el Factor de Corrección, la fórmula ampliada será:
n = z2 . P.Q / [d2 + (z2 . P.Q)] Ver Problemas Nº 39 y 46 de la Guía de Aplicaciones.
17
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra Parámetro Poblacional Total de Casos o Clase (NA)
Determinación de n para estimar la Cantidad de Casos Favorables (NA) Con un razonamiento similar a los anteriores, se parte de que se quiere estimar NA con un Intervalo, llegándose a: Fórmula reducida:
n = N . z2 . P.Q / d2 = n0 Considerando el Factor de Corrección la fórmula ampliada será:
n = N2 . z2 . P.Q / [d2 + (N . z2 . P.Q)] Ver Problemas Nº 40 y 45 de la Guía de Aplicaciones.
18
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra - Conclusiones
Conclusiones respecto al tamaño de la Muestra (n): Muestra aleatoria con un MAS. Otros diseños diferentes o más complejos generan otras formas para calcular el tamaño de la muestra n. Muestra deberá utilizarse para estimar algún Parámetro. Existen otras formas de llegar a la determinación del n, bajo otras condiciones. En los cuatro casos analizados, el tamaño de la muestra se determina a partir de los datos disponibles y de las condiciones o requisitos que se imponen. El análisis lógico coincide con lo que muestran las fórmulas de n: • A mayor exigencia de confianza (1-α ), mayor es la muestra a extraer. • Cuanto mayor es la dispersión de la variable original (σx o su equivalente para la proporción), mayor deberá ser la muestra que la represente. • Cuanto más precisión se pretenda (medida con d o con A), mayor deberá ser n. • Cuanto más grande sea la Población (N), mayor debe ser la muestra a observar. 19
VI. Muestreo Aleatorio Simple (MAS)
3. Determinación del Tamaño de la Muestra - Determinación del Tamaño de Muestra por Motivos Económicos
Determinación de n por motivos Económicos En el caso de que privan las razones económicas, no importan los requisitos sobre niveles de precisión y confianza a cumplir, y el Tamaño de la Muestra es fijado en función de los costos de realización del trabajo de campo. Un Costo Fijo (CF): por ejemplo: compra o alquiler de material para el Trabajo de Campo (planos, carpetas, equipos de carga, etc.). Un Costo Variable (CV): representado usualmente por la cantidad de entrevistas a realizar, o cantidad de unidades a analizar, etc. En este caso se parte del Costo o Presupuesto Total disponible (CT), cifra que debe conocerse por ser la única condición del problema, y siendo n la cantidad de observaciones a realizar, será:
CT = CF + n . CV Resulta muy simple despejar n: n = (CT – CF) / CV Ver Aspectos Conceptuales VI. 3.
20
Fin del Archivo 3 Sigue en el Archivo 4
21