¿Qué sabes del Muestreo Probabilístico?
Año 2012. Nº 1. Vol. I 1
2
Tema 1 Pags. La Estadística 4-7 •¿de donde viene la Estadística? •Definición. •Áreas de aplicación. •Tipos
Tema 2 Conceptos Básicos en La estadística. •Elementos o Unidad de análisis. •Población. •Parámetros. •Marco de Muestreo. •Muestra. •Variables. •Datos. •Probabilidad.
Pags. Tema 3 15-20 Muestreo Probabilístico. •Tipos. •Ventajas, Desventajas.
Pags. 8- 14
GLOSARIO.
3
Del
vocablo latino Status, referido fundamentalmente a la recolección de datos útiles al Estado como Nación o Estado de situación de un país, de una empresa, de una industria, etc.
Es un conjunto de métodos para manejar la obtención, presentación y análisis de datos. Sus fines son describir al conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.
4
Áreas de aplicación De la Estadística
El uso de la Estadística es muy amplio. Resulta difícil nombrar un área en la cual no se emplee. Los métodos estadísticos han encontrado aplicación en
Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades de datos numéricos, debido al uso de la tecnología.
5
¿Y además, cuales son? Pues, dos tipos: la Estadística Descriptiva y la Estadística Inferencial o Deductiva
Estadística Descriptiva: Es la encargada de la recolección, presentación, análisis, interpretación y proyección de los datos en tablas, gráficos y del cálculo de medidas numéricas que permitan estudiar los aspectos más importantes. Básicamente, la
Estadística
Descriptiva
coincide, en sus métodos y objetivos, con lo que actualmente se denomina
Análisis de Datos
6
Estadística Inferencial o Inferencia Estadística: Permite a partir de una parte de los datos en estudio (muestra) sacar conclusiones generales o inferencias del total de dicha información investigada (población).
Es decir, induce o extrae conclusiones de un colectivo mediante la observación de una parte mas reducida. Pero en dicho proceso inferencial se cometen errores inherentes al método inductivo, siendo necesario disponer de medidas de la precisión de las conclusiones obtenidas; en este sentido, emplea como herramienta básica el Cálculo de Probabilidades. 7
Conceptos Básicos Los conceptos básicos son pilares fundamentales necesarios para una cabal comprensión de los métodos, técnicas y procedimientos estadísticos. Estos deben definirse sin ambigüedad y con precisión lo que contribuirá notablemente en la comprensión, interpretación y aplicación de la estadística y el uso apropiado de sus técnicas y procedimientos.
Elemento o unidad de análisis es la unidad para la que deseamos obtener información. Aquello en lo cual se toman las mediciones. Pueden ser personas, animales o cosas, como también una familia, una colonia de parásitos o un bloque de viviendas.
8
Población Desde el punto de vista estadístico, se entiende por tal al conjunto de todas las posibles mediciones u observaciones acerca de las cuales se desea obtener información. También se podría definir como el conjunto completo de todas las unidades de análisis cuyas características se van a estimar.
Se clasifica en dos categorías POBLACION FINITA es aquella que incluye una cantidad limitada contable de observaciones, individuos o medidas.
POBLACION INFINITA es aquella que incluye un gran conjunto de observaciones o mediciones que no pueden alcanzarse por conteo. 9
Tamaño poblacional Si la población es finita, el tamaño poblacional es el número de elementos de la misma y generalmente se denota como N. Parámetro
Característica descriptiva global de una población o también un valor numérico que resume o sintetiza los valores de las observaciones obtenidas en una población.
Marco de muestreo o muestral Es una lista enumerada de todas y cada una de las unidades de análisis. Puede ser una lista de personas, de unidades de vivienda o un archivo de registros. Puede ser también un mapa subdividido o una guía de nombres y direcciones impresas.
10
Muestra Es un subconjunto o porción de la población. Es la base que emplea la Estadística Inferencial para extraer conclusiones sobre la población, ahorrándonos el estudio de la población completa que puede ser muy costoso o incluso imposible.
Muestra aleatoria se considera aleatoria siempre y cuando cada observación, medición o individuo de la población tenga la misma probabilidad de ser seleccionado.
Tamaño muestral Desde el punto de vista de las técnicas desarrolladas por la Estadística Inferencial, la muestra debería ser lo mas representativa posible. Esto se consigue básicamente mediante un procedimiento conocido como aleatorio.
Numero de elementos de la población que conforman la muestra. Normalmente se denota con n.
11
Variables Es cada una de las características o cualidades que poseen los individuos de una población. Ej.: sexo, edad, peso, estatura, color de ojos, estado civil, temperatura, cantidad de nacimientos, presión, grosor, diámetro,... Variables Cualitativas Se refiere a características o cualidades que no pueden ser medidas con números.
nominales Aquellas que no admiten un criterio de orden. Por ejemplo el color de pelo, sexo, estado civil, religión, etc.
ordinales Aquellas que sugieren una ordenación. Por ejemplo Medallas de una prueba deportiva nivel de estudios, etc.
Variable Cuantitativa Se refiere a características que se expresa mediante números.
continua Es aquella que puede tomar valor es comprendid os entre dos números. Por ejemplo estatura, peso, tiempo en horas.
Discreta Es aquella que toma los valores aislados, es decir, los valores específicos Por ejemplo el numero de estudiantes o hermanos 12
Datos Son los valores que toma la variable en cada caso.
Datos Cualitativas son datos que solo toman valores asociados a las cualidades o atributos, clasificándolos en una de varias categorías, es decir, no son valores numéricos EJEMPLOS Sexo: femenino/masculino. Hábito de fumar: Fumador/No fumador Color de ojos: negro, azul, marrón, … Estado civil: soltero, casado, …
Datos Cuantitativa Son datos que provienen de variables que pueden medirse o cuantificarse, es decir, se expresan numéricamente. EJEMPLOS Peso: 35.500, 48.100, 46.500, 105.100,… Edad: 6, 8, 12, 23, 46,… Estatura: 1.45, 1.76, 1.66, 1.67,… Cantidad de hermanos: 2,, 3, 4, 6, 7,…
13
Espacio Muestral Es el conjunto de todos los posibles resultados de un experimento y se representa con la letra es posible No puede Ω conocer predecirse Ejemplos por con El lanzamiento de adelantad exactitud un dado. o todos el Ω = {1,2,3,4,5,6,} los resultado
Experimento aleatorio Es aquel experimento donde puede repetirse un numero ilimitados de veces bajo las mismas condicione s
posibles resultado s a que puede dar origen.
en una realización particular de ese experimen to.
Lanzar una moneda Ω = {cara, sello} El genero de un niño recién nacido Ω = {M, F}
Probabilidad Mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientes estables .
14
Es un proceso en el que se conoce la probabilidad que tiene cada elemento de integrar la muestra.
muestreo aleatorio simple. muestreo sistemático. muestreo estratificado. muestreo por conglomerados o áreas.
15
Cálculo rápido de medias y varianzas. Es el que le permite al investigador conformar una muestra de forma que cada elemento de la población o universo tenga la misma probabilidad de ser seleccionado, por lo tanto, se requiere enumerar a cada uno, de 1 a N.
VENTAJAS DEL MUESTREO ALEATORIO SIMPLE Se recomienda cuando la población es pequeña. Sencillo y de fácil comprensión.
Cuando la población está ubicada e un espacio reducido. Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos. DESVENTAJAS DEL MUESTREO ALEATORIO SIMPLE Requiere la identificación y catalogación de la población, lo cual en ocasiones, resulta muy costoso. Requiere una probabilidad de selección igual para todos los elementos que conforman la población. Requiere mayor tamaño de muestra que las otros tipos de muestreo. 16
Este tipo de muestreo, para obtener una muestra sistemática al azar se deben numerar las observaciones de 1 a n. Luego determinar el intervalo de muestreo (IM), que consiste en dividir el número total de observaciones o unidades de muestreo de la población entre el tamaño deseado de la muestra. IM =
N n
= 1,3
VENTAJAS DEL MUESTREO SISTEMATICO Se recomienda cuando la población es numerosa. Cuando se puede disponer de una listado de los elementos de la población. La sencillez de la técnica y que puede ser utilizado con bastante grado de confiabilidad en la práctica. Fácil de aplicar.
N= Población n= Muestra
17
Cuando se trata de elementos poblacional susceptibles a ser clasificados.
En este tipo de muestreo se divide la población o universo en grupos relativamente homogéneos, llamado estratos y después se toma una muestra al azar de cada estrato, y la muestra resultante se llama muestra estratificada.
Cuando interés en obtener información a nivel de las subpoblaciones.
Se obtienen estimaciones más precisas.
VENTAJAS DEL MUESTREO ESTRATIFICADO
Se recomienda cuando se tiene un conocimiento a prioridad de la población.
Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las variables estratificadas se refiere.
Comun aB
Comun aA
Los estratos más grandes Tienen mayor probabilidad de ser representados.
Comun aD
Comun aC
Este método también se conoce como muestreo de áreas y es útil cuando la población se encuentra dispersa. La selección de la muestra puede requerir varias etapas.
No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.
En este método se procede como se indica a continuación: Clasificar o dividir áreas o manzanas.
en
Escoger al azar la muestra donde se va a comenzar el muestreo.
HAY 2 TIPOS DE MUESTREO POR CONGLOMERADOS
Determinar la frecuencia MONOETÁPICO: se del muestreo. estudian todas las residencias de una VENTAJAS DEL manzana. MUESTREO CONGLOMERADOS BIETÁPICO: se escogen Se recomienda cuando la población está diseminada en grandes áreas geográficas.
primero las muestras de manzanas y luego, se elige al azar los elementos dentro de las manzanas seleccionadas. 19
PROBABILÍSTICOS •Todas las unidades tienen igual probabilidad de participar en la muestra. •La elección de cada unidad muestral es independiente de las demás.
•Se puede calcular el error muestra.
NO PROBABILISTICOS •Cada unidad NO tiene igual probabilidad de participar en la muestra.
•No se puede calcular el error muestral. •Alto riesgo de invalidez producido por la introducción de sesgos. 20
A
Cuantitativo: Es aquello que Análisis: Es la descomposición refiere a la cantidad (numérico) del todo en partes de modo tal de o relativo a ella. evaluar cada una para luego integrarlas en la interpretación. D
Análisis de datos: Consiste en Describir: Es explicar, analizar los datos de un problema representar, definir, con detalle, e identificarlos. las cualidades, características o las circunstancias de algo o de C alguien.
Cálculo: Son todas aquellas operaciones (en su mayoría matemáticas) que tienen por objetivo el alcance de cierto dato o información y que requieren el desarrollo de un proceso previo a la obtención de ese resultado.
E
Encuesta: Es un método de recolección de datos. Es llevado a cabo generalmente a través de algún cuestionario que puede o no ser diligenciado por el Censo: Es una investigación encuestado y/o encuestador. estadística que consiste en el recuento de la totalidad de los Entrevista: es un método de elementos que componen la recolección de datos. Consiste población por investigar. en una serie de preguntas realizadas por el entrevistador, Cualitativo: Es aquello que personalmente, a cada uno de refiere a la cualidad o calidad de los entrevistadores. 21 una entidad.
Error de Muestreo: Es la diferencia que existe entre el valor real (parámetros) obtenido con los valores de la población y el valor estimado en base a los valores de una muestra (estimación). F
M Muestreo: es un conjuntos de métodos y procedimiento estadísticos a través del cual se selecciona una muestra S
Subconjunto: Un conjunto Finito: Tiene un final; es decir, A formado por algunos de los que puede ser medido o se le elementos de otro conjunto B es puede dar un valor. un subconjunto de este último. G
U
Grado de confiabilidad: es usado Universo: es la suma de todo lo generalmente para expresar un que existe con sus cierto grado de seguridad de correspondientes leyes físicas. que un dispositivo o sistema opera exitosamente en un ambiente específico durante un cierto período. I
Inferir: Es emitir juicios o conclusiones basados en algún conocimiento o experiencia sobre un evento o suceso. Infinito: Es definible como todo aquello que no posee límites, o que no tiene fin. 22