Técnicas de Muestreo 1 Ernesto A. ROSA Universidad Nacional de Misiones Universidad Nacional de Tres de Febrero (UNTREF) Departamento de Metodología, Estadística y Matemática Carrera de Licenciatura en Estadística Maestría en Generación y Análisis de Información Estadística
1
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 2
BIBLIOGRAFÍA OBLIGATORIA Curso de Muestreo para No Estadísticos – Ernesto A. Rosa – UNTREF > Aspectos Conceptuales > Guía de Aplicaciones
RECOMENDADA > Técnicas de Muestreo – William G. Cochran – CECSA > Muestreo de Encuestas – Leslie Kish – Trillas > Muestreo: Diseño y Análisis - Sharon L. Lohr – S. A. Thomson Paraninfo > Curso de Muestreo y Aplicaciones – Francisco Azorín Poch – Aguilar > Sobre Teoría del Muestreo – W. E. Deming – BIETA / IASI > Teoría del Muestreo – Des Raj – Fondo de Cultura Económica > Apuntes de Teoría de Muestreo – A. Hoszowski – Carrera Estadística UNTREF > Métodos Muestrales para Censos y Encuestas – Gonzalo Marí – Maestría en Generación y Análisis de Información Estadística – UNTREF > Estadística para Todos (Capítulo 6) – Diana Kelmansky – Instituto Nacional de Educación Tecnológica – Ministerio de Educación de la Nación > Estadística Interactiva (Traducción de algunos Capítulos de Inferencia Estadística) – Martha Aliaga y Brenda Gunderson – Prentice Hall 3
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 4
Capítulo I – Presentación 1. Los “porqué” de esta Guía 2. ¿ Qué se entiende por Muestreo ? 3. ¿ Cómo se originó el Muestreo ?
5
I. Presentación
CREENCIA:
1. Los “porqué” de esta Guía
Enseñanza de Matemática = Enseñanza de Estadística = Enseñanza de Muestreo
• Muestreo = Estadística Descriptiva + Probabilidades + Estadística Inferencial + Pensamiento Estadístico (Profesionalismo + Ética + Incertidumbre + ….). • PEECA:
destinado básicamente a capacitar en Estadística a quienes no disponen de formación básica en esta disciplina.
• GUÍA enmarcada en el PEECA. 6
I. Presentación
1. Los “porqué” de esta Guía
Bases de un Curso de Muestreo
Muestreo Estadística Inferencial Cálculo de Probabilidades Estadística Descriptiva 7
Capítulo I – Presentación 1. Los “porqué” de esta Guía 2. ¿ Qué se entiende por Muestreo ? 3. ¿ Cómo se originó el Muestreo ?
8
I. Presentación
2. ¿ Qué se entiende por Muestreo ?
Muestreo = Técnica + Arte Fundamentos Teóricos + Utilización de los Resultados
+
Diseño de la Muestra
Se denomina Muestreo al conjunto de técnicas estadísticas cuyo objeto es seleccionar una parte (Muestra) de un total de unidades que componen una Población, con el propósito de inferir (estimar, comprobar, proyectar) en relación a Parámetros o características de esa Población. 9
I. Presentación
2. ¿ Qué se entiende por Muestreo ?
Resumen de un procedimiento Muestral: partiendo de una Población (N), se selecciona aleatoriamente una Muestra (n) de unidades, en las que se miden datos o se realizan observaciones de las variables, y mediante fórmulas matemáticas denominadas Estimadores se realizan inferencias sobre algunos Parámetros de la Población, con niveles de Riesgos vinculados a los Errores de Muestreo.
Población
Muestras
Distribuciones Muestrales Errores provenientes del Muestreo Base a la Inferencia Estadística. 10
I. Presentación
2. ¿ Qué se entiende por Muestreo ?
Otra forma de Resumirlo: la Teoría del Muestreo es la parte de la Estadística que trata sobre las técnicas y particularidades relativas a las formas de seleccionar una Muestra de una Población, con el propósito de inferir sobre Parámetros o características de la misma. Para realizar esas inferencias se recurre a expresiones matemáticas denominadas Estimadores, sobre los cuales interesa conocer también sus Errores provenientes del Muestreo. Partes o Procedimientos dentro del Muestreo: 1. Determinación del tamaño de la Muestra. 2. Forma de seleccionar la Muestra: Diseño Muestral. 3. Forma de realizar las Estimaciones: Diseño de los Estimadores. 4. Medición de los Errores provenientes del Diseño Muestral y de los Estimadores aplicados. Errores no provenientes del Muestreo. 11
Capítulo I – Presentación 1. Los “porqué” de esta Guía 2. ¿ Qué se entiende por Muestreo ? 3. ¿ Cómo se originó el Muestreo ?
12
I. Presentación
3. ¿ Cómo se originó el Muestreo ?
Los hechos principales en la Historia del Muestreo fueron: 1662: J. Graunt, publica “Natural and Political Observations made upon the Bills of Mortality”, investigación sobre registros de algunas parroquias con los que efectúa estimaciones de fallecimientos, nacimientos de ambos sexos, etc. 1713: J. Bernoulli, difunde la “Ley de los Grandes Números”, que establece : “si el tamaño de la muestra es grande, entonces el promedio muestral se aproxima al promedio de la población de la cual se obtuvo la muestra”. 1768:
D’Expilly propone estimar la población de Francia diferenciando registros de zonas urbanas y zonas rurales (precursor de la “estratificación”), y formula un estimador de razón estratificado para la Población Total de una región, relacionando: total de defunciones con total de la Población. 13
I. Presentación
3. ¿ Cómo se originó el Muestreo ?
1895: A. Kiaer, Director de Estadística de Noruega, expone “Observations et Expériences concernants les dénombrements representatifs” en reunión del ISI, propone el primer intento para estimar características de una Población observando solo a una Muestra. Utiliza un método no aleatorio que llamó “representativo” (la Muestra reproduce similares características a la de la Población), con semejanzas a lo que se denomina “Muestreo por Cuotas”. Su propuesta fue debatida y rechazada. 1897 a 1901: Kiaer insiste en obtener estadísticas oficiales a través de muestras “representativas”. Nuevamente su propuesta es rechazada (se consideraba impensado que una investigación parcial sea capaz de sustituir un Censo). En 1901 Kiaer avanza sobre otros temas: Muestreo por Cuotas y Remuestreo. 14
I. Presentación
3. ¿ Cómo se originó el Muestreo ?
1920 a 1932: la revista The Literary Digest, predice acertadamente resultados de varias elecciones presidenciales – sistema “voto de paja o ficticio” (envío de gran cantidad de cartas postales con “boletas” que indagaban la intención del voto, que debían ser devueltas por correo). 1923: A. Tschuprow, anticipó algunos puntos desarrollados luego por J. Neyman sobre la asignación óptima en Muestreo Estratificado (MAE). 1924: Una Comisión del ISI, reconoció la propuesta de obtener una Muestra para inferir a toda una población finita. 1924: Tschuprow y Kowalsky, fueron los pioneros en los métodos aleatorios de Muestreo: Simple al Azar (MAS) y Estratificado (MAE). 1934: J. Neyman publicó en la Revista de la Royal Statistical Society de Londres, el 1º trabajo científico sobre Muestreo de Poblaciones Finitas: “Dos aspectos del método representativo, el Muestreo Estratificado y la selección intencional”, piedra fundadora del Muestreo Probabilístico. 15
I. Presentación
3. ¿ Cómo se originó el Muestreo ?
1935 a 1940: Yates, Zacopancy y Cochran, desarrollaron los Estimadores por Razón y por Regresión. 1936: E. Roper, G. Gallup y A. Crossley son precursores de los actuales Institutos o Centros de Investigación de Opinión. Pronostican correctamente la victoria de F. Roosevelt con muestras mucho más reducidas que las de los envíos postales, mediante la técnica denominada “Muestreo por Cuotas”. 1945: Mahalanobis trabajó en Muestreo Multietápico y Muestreo por Conglomerados, y desarrolló métodos para controlar los Errores No Debidos al Muestreo. l943: Hansen y Hurwitz, introdujeron la teoría general de selección con probabilidad proporcional al tamaño. 16
I. Presentación
3. ¿ Cómo se originó el Muestreo ?
1944: L.H. Madow y M.G. Madow desarrollan una variedad del MAS denominada Muestreo Sistemático (MS), retomada en 1946 por W.G. Cochran. 1945: William E. Deming, realizó diseños muestrales ejemplares para las poblaciones de Grecia y Japón después de la guerra. 1945 a 1948: Se difunden artículos sobre No Respuesta incluyéndose esa temática en la publicación Public Opinion Quarterly (POQ). 1950: Patterson presentó la teoría de Encuestas o Muestras Replicadas (MR). 1950: R. Goodman y L. Kish presentan el desarrollo de la técnica de Selección Controlada (SC). 1952: Horvitz y Thompson implementaron nuevas formas de expresar los estimadores. En la revista JASA, publica un artículo dedicado a un Estimador del Total Poblacional y su Variancia. 17
Técnicas de Muestreo Contenido I. Presentación II. Conceptos Básicos de Muestreo III. Introducción a las Técnicas Muestrales IV. Parámetros y Métodos de Estimación V. Recapitulación de lo Desarrollado VI. Muestreo Aleatorio Simple (MAS) VII. Muestreo Sistemático (MS) VIII. Muestreo Aleatorio Estratificado (MAE) IX. Muestreo por Conglomerados (MC) Monoetápico X. Diseños Muestrales Complejos 18
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 19
II. Capítulo II – Conceptos Básicos de Muestreo
1. Diseño Muestral
Se denomina Diseño Muestral a la forma en que se realizará la selección de la Muestra, y que comúnmente constituye una “descripción o informe escrito, preparado antes de que se realice el “Trabajo de Campo” y se tengan resultados de la Muestra, en el que se exponen los Objetivos del trabajo, se identifica a la Población en estudio y al Marco Muestral bajo el cual se realiza ese trabajo, describiéndose el procedimiento para realizar la Selección (dentro de lo posible aleatoria), de las unidades que constituirán la Muestra, y los procedimientos mediante los cuales se realizarán las Estimaciones. 20
II. Capítulo II – Conceptos Básicos de Muestreo
1. Diseño Muestral
Diseño Muestral: 5 momentos o tipos de procedimientos o acciones diferenciadas: 1. Identificación de la Población y de las variables involucradas. 2. Descripción de la forma de selección de la Muestra. Incluye el cálculo del tamaño de la Muestra. 3. Observación, Medición o realización del “Trabajo de Campo”. 4. Descripción de la forma de hacer la estimación: 1º definición del sistema de estimación, elaboración de fórmulas (Estimadores y Errores debidos al Muestreo) ; 2º aplicación de los Estimadores (hacer estimaciones). 5.
Análisis de los resultados, realización de inferencias sobre la Población en estudio y Conclusiones.
Ver Aplicación Página 9 y Planteos Nº 1 a 4 de la Guía de Aplicaciones. 21
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 22
II. Capítulo II – Conceptos Básicos de Muestreo
2. Conceptos y Comparación entre Censo y Muestra
Censo y Muestra: son cortes trasversales en el tiempo, que describen el estado de situación de una Población en un momento dado. Se realiza un Censo “cuando se observa en forma exhaustiva a todos los elementos de la población en estudio”. Se realiza una Muestra “cuando se observa sólo a una parte de la población”, y la información es de carácter parcial. ¿ Cuál es la causa de que se intente hacer estadísticas a partir de Muestras ? ¿ Porqué no se realizan siempre Censos ? Respuestas: Porque no siempre es posible realizar estudios censales (destructivos). Por costo (motivos económicos) o tiempo (motivos de oportunidad). 23
II. Capítulo II – Conceptos Básicos de Muestreo
2. Conceptos y Comparación entre Censo y Muestra
Desventajas de las Muestras respecto a los Censos: La utilización de Muestras conlleva el riesgo de cometer el denominado Error debido al Muestreo que no es posible anular a menos que la Muestra sea exhaustiva, aunque la teoría del muestreo hace posible su medición e inclusive el análisis de las alternativas para reducir este error.
Ventajas de las Muestras sobre los Censos: • Menor costo operativo. • Menor tiempo de recolección y procesamiento de los datos. • Mayor facilidad de controlar la calidad de la información que se obtiene. • Es alternativa única, en caso de que la observación destruya o modifique al elemento. 24
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 25
II. Capítulo II – Conceptos Básicos de Muestreo
3. Definición de Población 4. Definición de Muestra
POBLACIÓN “Es un conjunto de elementos definidos en el tiempo y en el espacio, sobre los cuales se realizarán las observaciones en el caso de una encuesta exhaustiva o censo, o a los cuales se referirán los resultados de la investigación en el caso de un estudio por muestreo”. Usualmente su cantidad se simboliza con N.
MUESTRA “Es el subconjunto de unidades seleccionadas de la población definida. En esta recae la realización de las observaciones, mediciones, etc.”. Usualmente su cantidad se simboliza con n. 26
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 27
II. Capítulo II – Conceptos Básicos de Muestreo
5. ¿ Y qué es una Unidad Estadística ?
Unidad Estadística Unidad Estadística o Unidad de Análisis o Unidad Elemental: se denominan de esta forma a cada uno de los elementos que integra una Población Objetivo y que serán objeto de observación o medición o entrevista.
Unidad de Muestreo Unidades de Muestreo: son conjuntos o agrupamientos de Unidades Estadísticas, que en ciertos casos se utilizan para lograr llegar a la selección de las n de ellas que integran la Muestra. Los hogares y las manzanas constituyen ejemplos de este concepto, que facilitan llegar a las personas. 28
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 29
II. Capítulo II – Conceptos Básicos de Muestreo
6. Simbología
Inicialmente es posible definir la siguiente Simbología: N: Total de unidades que componen una Población. n: Total de unidades que componen una Muestra. Población Objetivo: una forma de simbolizarla es mediante: {Ui | i = 1...N} = (U1, U2,....,Ui,...UN) Muestra: se puede simbolizar con: {ui | i = 1...n} = (u1, u2,....,ui,...un) Yi: (i: 1 – N): Variable cuantitativa en análisis en la Población. yi: (i: 1 – n): Variable cuantitativa en análisis en la Muestra. 30
II. Capítulo II – Conceptos Básicos de Muestreo
6. Simbología
Simbología (Cont.): Xi: (i: 1 – N): Variable cuantitativa auxiliar en la Población (en el caso de estimadores por razón o regresión). xi: (i: 1 – n): Variable cuantitativa auxiliar en la Muestra (en el caso de estimadores por razón o regresión). NA: Cantidad de Casos Favorables de la Variable dicotómica en la Población. nA: Cantidad de Casos Favorables de la Variable dicotómica en la Muestra. A las Variables usualmente se las simboliza: { Yi ; Xi / i = 1...N } si son Poblacionales { yi ; xi / i = 1...n } si son Muestrales.
31
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 32
II. Capítulo II – Conceptos Básicos de Muestreo
7. Marco Muestral
Puede describirse al Marco de Muestral como un conjunto finito de Unidades de Muestreo sobre las cuales se aplica el proceso de selección y se obtiene la Muestra. Es la parte de la Población sobre la que se realiza el trabajo Muestral. Problemas en los Marcos Muestrales: • Sub enumeración • Sobre enumeración Tipos de Marcos Muestrales: • Marcos de Listado • Marcos de Grupos • Marcos de Áreas • Marcos Mixtos 33
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 34
II. Capítulo II – Conceptos Básicos de Muestreo
8. Dominio 9. Muestras Probabilísticas y No Probabilísticas
8. Dominio Se denomina Dominio a una parte o conjunto de la Población en estudio sobre la cual se pretende que la Muestra proporcione estimaciones con precisión conocida.
9. Muestras Probabilísticas y No Probabilísticas Se denominan Muestras Probabilísticas a aquellas en las cuales las unidades que la integran se eligen mediante procedimientos aleatorios, por lo cual, previo a la elección de las unidades, es posible conocer y asignar a cada una de la población, una probabilidad cierta de ser seleccionada. 35
II. Capítulo II – Conceptos Básicos de Muestreo
9. Muestras Probabilísticas y No Probabilísticas
9. Muestras Probabilísticas y No Probabilísticas Muestras Probabilísticas: son aquellas en las cuales las unidades se eligen mediante procedimientos aleatorios, por lo cual, previo a la elección de las unidades, es posible conocer y asignar a cada una una probabilidad cierta de ser seleccionada. Las muestras son probabilísticas permiten medir el Error debido al Muestreo de los Estimadores, y con ellas mismas, se eliminan los sesgos de selección.
Muestras No Probabilísticas: son aquellas en las que la selección se realiza con criterios no aleatorios, sino que dependen de la decisión de un seleccionador. “LA SELECCIÓN ALEATORIA GARANTIZA IMPARCIALIDAD EN LA SELECCIÓN DE LAS UNIDADES DE MUESTREO” 36
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 37
II. Capítulo II – Conceptos Básicos de Muestreo
10.Errores de Muestreo y No debidos al Muestreo
Errores debidos al Muestreo: Se originan al observar solo una parte de la Población.. Particularidad: El riesgo de cometerlo puede ser medido con el auxilio de la Teoría de las Probabilidades, y se reducen a medida que se agranda el tamaño de la Muestra. Única forma de evitarlo: que la Muestra sea exhaustiva (n = N). Tienen dos componentes: precisión / dispersión (factor intrínseco del Muestreo), y sesgo / exactitud (factor atribuible al Estimador utilizado). Errores No debidos al Muestreo: son difíciles de detectar ya que tienen múltiples causas: cuestionario no respondido total o parcialmente, respuestas erróneas, errores de carga, vicios del marco de selección, defectos del cuestionario, deficiente capacitación, etc. 38
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 39
II. Capítulo II – Conceptos Básicos de Muestreo
11. ¿ Qué es un Parámetro ?
Parámetros Un Parámetro, es una característica medible de los elementos de una población, también llamado valor poblacional, que la caracteriza e identifica con relación a otras poblaciones. Ejemplos: •Promedios •Totales •Proporciones •Cantidad de Casos Favorables / Total de Clase •Razones (Proporciones, Promedios, Tasas, etc.). •Variancias y Desvíos Estándar 40
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 41
II. Capítulo II – Conceptos Básicos de Muestreo
12. ¿ Y un Estimador ?
Estimadores Se denomina Estimador a una expresión matemática, que se construye con los valores correspondientes a los elementos que integran una muestra, y que sirven para obtener estimaciones del correspondiente valor poblacional o parámetro desconocido que se intenta estimar o verificar. Comentarios: Dependiendo del Parámetro que se desee estimar, existen varias fórmulas diferentes que pueden ser consideradas “Estimadores”. Por ejemplo para estimar un Promedio, un Total, un Porcentaje, una Razón, etc., se tienen Estimadores definidos por diferentes métodos: por simple expansión; por razón y por regresión. 42
II. Capítulo II – Conceptos Básicos de Muestreo
12. ¿ Y un Estimador ?
Además, las fórmulas de los Estimadores difieren según la forma de selección de las unidades, o Técnicas de Muestreo utilizadas, con lo cual se tienen Estimadores por el MAS, por el MS, por el ME, por el MC, etc. (aspectos a desarrollar). Los diversos Estimadores cumplen propiedades, lo que no invalida a aquellos que no cumplen algunas de las definidas como “deseables”. No sólo se deben estimar los Parámetros, sino también los Errores debidos al Muestreo o Errores Estándar de los Estimadores. Ya mencionado: siendo los Parámetros considerados constantes, y siendo el conocimiento de estos los principales objetivos del Muestreo:
¿ Por qué un Estimador es una variable aleatoria ? 43
II. Capítulo II – Conceptos Básicos de Muestreo
12. ¿ Y un Estimador ?
Respuesta: Al estar definidos como expresiones matemáticas o condiciones que cumplen los resultados de una Muestra (o se aplican a la Muestra), y pudiéndose extraer de cada Población diversas Muestras diferentes, los Estimadores deben ser considerados variables ya que pueden tomar resultados diferentes de Muestra en Muestra. En particular: El valor de la Estimación depende de las unidades que integran la Muestra y éstas, por ser elegidas aleatoriamente, difieren de una Muestra a otra. Muestras aleatorias del mismo tamaño, extraídas de la misma Población y con la misma metodología, producen diferentes Estimaciones. El conjunto de todas esa posibles Estimaciones constituye una nueva variable (el Estimador), tema estudiado por la Inferencia Estadística. Aunque en la realidad se extrae una sola muestra, puede pensarse que la misma es una seleccionada al azar de todas las que tenían posibilidades de ser extraídas, o que lo que se extrae es una Estimación de todas las posibles que se podrían realizar. 44
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 45
II. Capítulo II – Conceptos Básicos de Muestreo
13. Propiedades de los Estimadores: ¿ para qué sirven ?
Las Propiedades de los Estimadores son “condiciones” que se fueron estableciendo por diversos autores e investigadores de la Estadística, con el fin de poder calificar a los Estimadores y clasificarlos de acuerdo con que las cumplieran o no. Las principales son:
Insesgado: un Estimador es Insesgado de un Parámetro, si su Esperanza coincide con el Parámetro. Si fuera sesgado, la diferencia entre la Esperanza y el Parámetro recibe el nombre de sesgo.
Consistente: un Estimador es Consistente si es Insesgado en el límite.
Eficiente: un Estimador es Eficiente si es el de menor Variancia de todos los Estimadores del mismo Parámetro.
Este tema de Propiedades de los Estimadores no es relevante en un Curso de este tipo sobre Muestreo. Es meramente informativo. 46
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 47
II. Capítulo II – Conceptos Básicos de Muestreo
14. Esperanza, Variancia y Sesgo de los Estimadores
La forma de expresión de la insesgadez y de las diversas formas de medir la Dispersión de los Estimadores deben ser consideradas dentro de Muestreo. Las principales son: Esperanza del Estimador: E(θ) = Σ θ . P(θ) ; si la variable es discreta; si fuese continua, se usaría ∫ en lugar de Σ. Variancia del Estimador: Var (θ) = E [θ - E(θ)]2 = E (θ)2 –θ2 Error Medio Cuadrático = EMC (θ) = E (θ - θ)2 = E[θ - E (θ) + B (θ)]2 = Var (θ) + B (θ)2 Sesgo del Estimador: B (θ) = E(θ) - θ ; lo que deriva en: θ = = E(θ) - B (θ) 48
Capítulo II – Conceptos Básicos de Muestreo 1. Diseño Muestral 2. Conceptos y Comparación entre Censo y Muestra. Los Porqué de las Muestras 3. Definición de Población 4. Definición de Muestra 5. ¿ Y qué es una Unidad Estadística ? 6. Simbología 7. Marco Muestral 8. Dominio 9. Muestras Probabilísticas y No Probabilísticas 10. Errores de Muestreo y No debidos al Muestreo 11. ¿ Qué es un Parámetro ? 12. ¿ Y un Estimador ? 13. Propiedades de los Estimadores: ¿ para qué sirven ? 14. Esperanza, Variancia y Sesgo de los Estimadores 15. El Teorema Central del Límite 49
II. Capítulo II – Conceptos Básicos de Muestreo
15. El Teorema Central del Límite
El Teorema Central del Límite: Es uno de los conceptos de mayor relevancia en la Estadística Inferencial. Las fórmulas de los Estimadores en una Muestra Aleatoria Simple se basan en él, y relaciona la Teoría de las Probabilidades con la Teoría del Muestreo. Su enunciado es:
Se tiene una Población de N unidades, sobre las que se mide una variable cuantitativa que posee un Promedio µ y una Variancia σ 2.
De esa Población se extraen Muestras aleatorias de n unidades, con cuyos resultados se construye otra variable aleatoria: el Promedio Muestral .
Si la muestra es suficientemente grande, el TCL dice que el Promedio Muestral tiende a distribuirse normalmente con una Media que es el Promedio Poblacional µ y una Variancia σ 2/n.
El único requisito es que el tamaño de la Muestra sea suficientemente grande, sin importar cuál es la distribución de la variable original y ni siquiera si ésta es continua o discreta.
Ver Planteos Nº 5 a 9 de la Guía de Aplicaciones.
50
Fin del Archivo 1 Sigue en el Archivo 2
51