Técnicas de Muestreo 2 Ernesto A. ROSA Universidad Nacional de Misiones Universidad Nacional de Tres de Febrero (UNTREF) Departamento de Metodología, Estadística y Matemática Carrera de Licenciatura en Estadística Maestría en Generación y Análisis de Información Estadística
1
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 2
Capítulo III – Introducción a las Técnicas Muestrales 1. Introducción 2. Tipos o Técnicas de Muestreo Muestreo No Aleatorio Muestreo Aleatorio o Probabilístico Técnicas Muestrales 3. Efectos del Diseño 3
III. Introducción a las Técnicas Muestrales
1. Introducción 2. Tipos o Técnicas de Muestreo
1. Introducción Inferencia Estadística
Muestreo Aleatorio
Error Nivel de Confianza Precisión
2. Tipos o Técnicas de Muestreo
Muestreo Aleatorio o Probabilístico
Muestreo No Aleatorio 4
Capítulo III – Introducción a las Técnicas Muestrales 1. Introducción 2. Tipos o Técnicas de Muestreo Muestreo No Aleatorio Muestreo Aleatorio o Probabilístico Técnicas Muestrales 3. Efectos del Diseño 5
III. Introducción a las Técnicas Muestrales
2. Tipos o Técnicas de Muestreo – Técnicas Muestrales
Técnicas Muestrales Muestreo No Aleatorio:
Circunstancial, Casual o Fortuito Selección Experta Intencional u Opinable Por Cuotas Por Cuotas “cuasi” Probabilístico De Poblaciones en Movimiento Grupos Focales Otros
Ver Planteos Nº 10 y 11 de la Guía de Aplicaciones.
6
III. Introducción a las Técnicas Muestrales
2. Tipos o Técnicas de Muestreo – Técnicas Muestrales
Técnicas Muestrales Muestreo Aleatorio o Probabilístico: Muestreo Aleatorio Simple (MAS) o Muestreo Simple al Azar Muestreo Sistemático (MS) Muestreo Replicado (MR) Muestreo Estratificado (ME o MAE) Muestreo por Conglomerados (MC) Paneles Otras técnicas muestrales Técnicas de Muestreo Combinadas o Complejas Ver Planteos Nº 12 a 22 de la Guía de Aplicaciones.
7
Capítulo III – Introducción a las Técnicas Muestrales 1. Introducción 2. Tipos o Técnicas de Muestreo Muestreo No Aleatorio Muestreo Aleatorio o Probabilístico Técnicas Muestrales 3. Efectos del Diseño 8
III. Introducción a las Técnicas Muestrales
3. Efectos de Diseño
Efecto de Diseño (Deff) “El Efecto de Diseño es un indicador de la eficiencia del Diseño Muestral utilizado en un caso en particular, comparado con el que hubiese resultado en un Muestreo Aleatorio Simple (MAS)”. Debe considerarse que pese a su importancia: No es simple el cálculo de este indicador No se lo computa siempre en las Muestras en las que no se utiliza el MAS No se difunde usualmente su resultado junto con la descripción de los Diseños Muestrales Su expresión básica es la siguiente: Deff (Diseño Muestral Utilizado) =
Dispersión (Diseño Muestral Utilizado) Dispersión MAS 9
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 10
Capítulo IV – Parámetros y Métodos de Estimación 1. Parámetros 2. Estimadores 3. Métodos de Estimación Criterios de Análisis y Comparación de los Métodos de Estimación 11
Y
Parámetros (más comunes) Concepto
Fórmula
Observaciones / Comentarios N
Promedio Poblacional
Y = Σ Yi / N
Total Poblacional
Y = Σ Yi
Proporción Poblacional
P = NA / N = Σ Yi / N
Cantidad de Casos Favorables
NA = Σ Yi
Variancia Poblacional
σx 2 = Σ (xi – μ)2 / N
Cantidad de unidades en la Población.
Es el numerador del Promedio. NA
Cantidad de unidades en la Población que cumplen una cierta condición. Es el numerador de la Proporción Fórmula de definición. Existen otras formas de expresarla. 12
Capítulo IV – Parámetros y Métodos de Estimación 1. Parámetros 2. Estimadores 3. Métodos de Estimación Criterios de Análisis y Comparación de los Métodos de Estimación 13
Y
Estimadores (de los Parámetros anteriores) Estimador Promedio Muestral Del Total Poblacional Proporción Muestral
Fórmula
y = Σ yi / n
Observaciones / Comentarios n
Cantidad de unidades en la Muestra.
nA
Cantidad de unidades en la Muestra que cumplen una cierta condición.
Y=N.y p = nA / n = Σ yi / n
De la Cantidad de Casos Favorables
NA = N . p
De la Variancia Poblacional
sx 2 = Σ (yi – y)2 / (n-1)
Fórmula de definición. Existen otras formas de expresarla. 14
Capítulo IV – Parámetros y Métodos de Estimación 1. Parámetros 2. Estimadores 3. Métodos de Estimación Criterios de Análisis y Comparación de los Métodos de Estimación 15
IV. Parámetros y Métodos de Estimación
3.
Métodos de Estimación
Criterios de Análisis y Comparación de los Métodos de Estimación
La Inferencia Estadística asume por descarte el Método de Estimación por Simple Expansión (MESE): para algunos Estimadores replica en la Muestra, de la misma expresión de los Parámetros, y para otros es la aplicación de una “regla de tres simple”. Algunos de otros métodos son: Método de Estimación por Razón (MERa): Requiere la disponibilidad de una variable auxiliar (X), asociada a la que se analiza (Y), asumiendo una vinculación directa sin desfazajes en el origen. Método de Estimación por Regresión (MERe): Utiliza una función de Regresión, y para su aplicación requiere la disponibilidad de una variable auxiliar (X), asociada a la que se analiza (Y), sin limitaciones de forma. Estimador de Horvitz y Thompson (H-T): desarrollado para los casos en que las unidades se seleccionan con probabilidades variables o diferentes. 16
IV. Parámetros y Métodos de Estimación
3.
Métodos de Estimación
Criterios de Análisis y Comparación de los Métodos de Estimación
La comparación de Métodos de Estimación (usualmente con respecto al MESE), es a través de las Propiedades de los Estimadores, en particular las Propiedades de Insesgamiento (Exactitud) y Eficiencia (Precisión). Ejemplo de los Revólveres (ver gráficos a continuación): El revolver A es: Inexacto e Impreciso, ya que los 6 disparos están dispersos y sesgados hacia una zona del blanco (hacia abajo a la derecha). El revolver B es: Exacto e Impreciso, pues sus 6 disparos, están dispersos pero centrados respecto al blanco. El revolver C es: Inexacto y Preciso, debido a que sus 6 disparos están concentrados pero sesgados hacia una zona del blanco (hacia arriba). El revolver D es: Exacto y Preciso, ya que los 6 disparos están concentrados y centrados respecto al blanco 17
IV. Parámetros y Métodos de Estimación
3.
Métodos de Estimación
Criterios de Análisis y Comparación de los Métodos de Estimación
Diagramas de los 4 revólveres: Revolver A - Inexacto e Impreciso
Revolver B - Exacto e Impreciso
Revolver C - Inexacto y Preciso
Revolver D - Exacto y Preciso
18
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 19
Capítulo V – Recapitulación de lo Desarrollado Una forma de resumir o recapitular lo desarrollado en los 4 Capítulos anteriores, puede hacérselo mediante la enumeración de las Etapas de un Estudio Muestral: a. Descripción genérica del trabajo a realizar: Propuesta de Trabajo. b. Diseño Muestral. c. Actividades previas a la recopilación de información. d. Selección de la Muestra. e. Realización del Trabajo de Campo. f. Procesamiento de las Respuestas. g. Obtención de Resultados. h. Análisis de los resultados y confección de un Informe. Ver Aplicación Capítulo V, Apunte de Aspectos Conceptuales.20
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 21
VI: Muestreo Aleatorio Simple (MAS) 1. Introducción 2. Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar Estimadores por Simple Expansión (MESE) 1. Determinación del Tamaño de la Muestra Introducción Requisitos y Condiciones previas Tamaño de la Muestra para estimar un Parámetro Genérico “θ” Conclusiones 4. Otros Métodos de Estimación en el MAS
Método de Estimación por Razón (MERa) Estimadores Alternativos en el MERa Método de Estimación por Regresión (MERe) 5. Muestreo con Probabilidades Desiguales (MPD) Particularidades del MPD Los Parámetros y sus Estimadores en el MPD Estimador Horvitz y Thompson (H-T) Selección con Probabilidad Desigual y Sin Reposición (SR) Selección con Probabilidades Desiguales (con Variable Auxiliar) y Con Reposición (CR) 22
VI. Muestreo Aleatorio Simple (MAS)
1. Introducción
1. Introducción El MAS es la técnica de muestreo básica, y es la que se toma como base para el desarrollo de la Inferencia Estadística. Además, el MAS es el punto de partida, referencia y comparación para todas las demás técnicas muestrales, comparándose los Estimadores y sus Dispersiones, las bondades y los defectos de las demás técnicas, con los resultantes del MAS. Para la correcta aplicación del MAS, se requiere tener identificadas a todas y cada una de las N unidades que integran la Población (por ej.: con un número individual y unívoco), y aplicando algún sistema aleatorio de selección (Tablas de Números al Azar, procedimientos electrónicos, etc.), elegir cada una de las n unidades que integrarán la muestra. 23
VI. Muestreo Aleatorio Simple (MAS)
1. Introducción
¿ Cuántas son las Muestras diferentes de tamaño “n” que pueden extraerse de una Población de tamaño “N” ?:
CN,n = N! n!.( N − n)!
N n
=
N! n ! . (N – n) !
Ejemplos: N = 5 ; n = 3:
C5,3 = 10
N = 10 ; n = 6: C10,6 = 210
Imaginar la cantidad de posibles Muestras que podrían extraerse de la Población de Posadas de 18 y más años (N = 210.000) si n = 400: C210,000,400 =
210.000 ! 400 ! . 209.600 !
Ver Planteos Nº 25 a 36 de la Guía de Aplicaciones (Estimac. por Intervalos y Pruebas de Hipótesis.
24
VI. Muestreo Aleatorio Simple (MAS)
1. Introducción
Diversas alternativas: Selección Sin Reemplazo (SR) = Situación más lógica Selección Con Reemplazo (CR) = Situación con expresiones algebraicas más simples. Selección con Probabilidades Iguales / Constantes: todas las unidades de la Población tienen la misma probabilidad de ser elegidas, situación que facilita las fórmulas de las Estimaciones y sus Dispersiones. Selección con Probabilidades Distintas / Variables: de mayor complejidad pero más realista en muchos casos.
Como punto de partida, se analizará inicialmente el caso de Selección Sin Reemplazo y Con Probabilidades Iguales, que consiste en “Adjudicar la misma Probabilidad de Selección a todas unidades de la Muestra, o a cada una de las Muestras diferentes posibles de seleccionar de una población, o en otras palabras: todas las combinaciones posibles de tamaño n extraídas de una Población de tamaño N tienen la misma probabilidad”. 25
VI. Muestreo Aleatorio Simple (MAS)
1. Introducción
A partir de estas precisiones, es posible agregar nueva simbología dentro de Muestreo, a la ya presentada en el Capítulo II: Fracción de Muestreo (FM): La FM es la probabilidad que una unidad de la Población integre la Muestra de n unidades.
f=n/N
Tasa de Muestro (TM): Es la FM expresada en Porcentajes. Es la FM multiplicad por 100.
TM = f % = (n / N) . 100
Factor de Expansión (FE) o Ponderador: Es la inversa de la FM. El FE es el número por el cual se deben multiplicar los resultados de la Muestra para expandirlos a la Población.
w=N/n
26
VI: Muestreo Aleatorio Simple (MAS) 1. Introducción 2. Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar Estimadores por Simple Expansión (MESE) 1. Determinación del Tamaño de la Muestra Introducción Requisitos y Condiciones previas Tamaño de la Muestra para estimar un Parámetro Genérico “θ” Conclusiones 4. Otros Métodos de Estimación en el MAS
Método de Estimación por Razón (MERa) Estimadores Alternativos en el MERa Método de Estimación por Regresión (MERe) 5. Muestreo con Probabilidades Desiguales (MPD) Particularidades del MPD Los Parámetros y sus Estimadores en el MPD Estimador Horvitz y Thompson (H-T) Selección con Probabilidad Desigual y Sin Reposición (SR) Selección con Probabilidades Desiguales (con Variable Auxiliar) y Con Reposición (CR) 27
VI. Muestreo Aleatorio Simple (MAS)
2.
Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar
Parámetros a Estimar: Total Poblacional Promedio Poblacional Proporción / Porcentaje Total de Clase / Cantidad de Casos
En Variables Cuantitativas
En Variables Dicotómicas
Estimadores por Simple Expansión (MESE) De la misma forma que el MAS fue tomado para el desarrollo de la Estadística Inferencial, sucede con el Método de Estimación por Simple Expansión (MESE): fue el primero desarrollado y adoptado como el método básico para el desarrollo de la Inferencia Estadística. Para la Selección SR para Variable Cuantitativa (Selección con Probabilidades Iguales): 28
VI. Muestreo Aleatorio Simple (MAS)
2.
Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar
MAS - Estimadores MESE Selección SR para Variable Cuantitativa con Probabilidades Iguales Parámetro Concepto Promedio
Total
1 Y = N
N
∑ yi i =1
N
Y = ∑ yi i =1
Estimador (MESE) n 1 yˆ = ∑ yi n i =1
N Y= n
n
∑ yi i =1
Estimadores de la Variancia del Estimador 2 N − n S σˆ 2 ( yˆ ) = . N n 2 N − n S σˆ 2 ( yˆ ) = . .N 2 N n
29
VI. Muestreo Aleatorio Simple (MAS)
2.
Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar
MAS - Estimadores MESE Donde: n
S*2 = (1/n) ∑ ( yi
− y )2
i =1 n
2 S2 = [(1/(n-1)] ∑ ( yi − y ) i =1
n
= [1/(n-1)]
: Variancia (Sesgada): Fórmula de Definición : Cuasi Variancia (Insesgada): Fórmula de Definición
∑ y- i[1/(n-1)] i =1
2
2 y: Fórmula de Trabajo
30
VI. Muestreo Aleatorio Simple (MAS)
2.
Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar - MESE
Para la Selección CR para Variable Cuantitativa – Selección con Probabilidades Iguales, las expresiones son iguales a la de la tabla anterior, pero se simplifican las fórmulas, ya que en el caso SR se tiene la presencia del Factor de Corrección para Poblaciones Finitas (FCPF) = [(N - n) / N], expresión que cuando se tiene Reemplazo es igual a 1 (N es considerada infinita). Siendo: f = n / N ; será: (1 – f) = [1 – (n / N)] = [(N - n) / N] = FCPF ; y será:
Var SR = (1 – f) Var CR Lo que muestra lógicamente que la Var SR < Var CR (excepto si n = N), lo que no es lógico. 31
VI. Muestreo Aleatorio Simple (MAS)
2.
Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar
MAS - Estimadores MESE Selección SR para Variable Dicotómica con Probabilidades Iguales Concepto
Proporción
Total de Clase
Parámetro
P=
A N
Y=A=N.P
Estimador (MESE)
ˆ a ˆ = p n
yˆ
Estimadores de la Variancia del Estimador
N − n pˆ .(1 − pˆ ) σˆ ( pˆ ) = . N n −1 2
N − n pˆ .(1 − pˆ ) 2 = aˆ = N . pˆ σˆ ( yˆ ) = . .N N n −1 2
32
VI. Muestreo Aleatorio Simple (MAS)
2.
Parámetros, Estimadores y Errores de los Estimadores Parámetros a Estimar - MESE
MAS - Estimadores MESE Para la Selección CR para Variable Dicotómica – Selección con Probabilidades Iguales, como sucede con la Variable Cuantitativa, las expresiones son similares a la de la tabla anterior, pero se simplifican las fórmulas, ya que en el caso SR se tiene la presencia del FCPF = [(N - n) / N], que achica las Variancias de los Estimadores.
33
Fin del Archivo 2 Sigue en el Archivo 3
34