Poblacion

Page 1

Profesor AndrĂŠs Borja Villanueva


 1.

Población: Es un conjunto de unidades para las que se desea obtener cierta información.

2.

Pueden ser personas, familias, viviendas, escuelas. Organizaciones, artículos de prensa…etc.

3.

Y la información vendría dictada por los objetivos de la investigación( condiciones de habitabilidad de la vivienda, reacción familiar ante el fracaso escolar, la practica de la religión en las escuelas).


Se debe delimitar la población en base al planteamiento del problema.

La población será el conjunto de todos los casos que concuerden con una serie de especificaciones.

Un estudio no es mejor por tener una población grande si no porque este bien delimitada.


Población Infinita: el numero de individuos u objetos que lo conforman es incalculable o extremadamente grande (100 000) unidades.

Población finita: cuando el numero de individuos se puede calcular, es manejable ( menor de 100 000 individuos).


En la definición de la población han de mencionarse características esenciales que la ubiquen en un espacio y tiempo concreto. Ejemplos: en una investigación sobre la ocupación del tiempo tras la jubilación, una posible definición de la población seria: Población de 65 y mas años que residan en el Municipio de Lima


Todo elemento o unidad elemental que pertenezca a la población y se vea afectado por la característica o factor que se desee estudiar. Se desea hacer un estudio sobre el ingreso familiar de Lima Metropolitana. En este caso la población la constituyen las familias de Lima metropolitana, pero el individuo, es cualquier unidad familiar de Lima Metropolitana.


La muestra pertenece a la población.

Dentro de una población hay muchas muestras.

Cuando la muestra es igual a la población es un censo.

La muestra depende de la estrategia de investigación que se ha escogido.

La muestra debe ser representativa.


La muestra es una representaci贸n a peque帽a escala de la poblaci贸n a la que pertenece.


ď‚Ą

Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. Entre las 50 amas de casa entrevistadas, 30 dijeron que preferĂ­an la marca X. quien constituye la muestra? quien constituye la poblaciĂłn?



Es la selección de las unidades concretas de dicha población.

Es la selección de las unidades de observación.

De ello depende la calidad de la información que se recoja.

Debe ser planificado y no se deben escatimar esfuerzos.


Búsqueda del Marco Muestral

Definir el tamaño de la muestra.

Definir el error muestral.

Definir el tipo de muestreo a utilizar.


ď‚Ą

Ha de ser lo mas completo posible, en orden a facilitar la representatividad de la muestra. Se debe tener en cuenta que la muestra solo es representativa de la poblaciĂłn comprendida en el marco muestral elegido; es decir de todos aquellos individuos que han tenido la posibilidad de ser elegidos. De allĂ­ que la comprehensividad se convierte en una exigencia bĂĄsica de todo marco muestral.


La comprehensividad del marco muestral conlleva, necesariamente, la exigencia de su actualización. En la medida que el marco muestral se halle actualizado las posibilidades de omisiones se restringen. Por el contrario, aumenta la probabilidad de que éste contenga a los miembros reales de la población que representa.


Cuando se persigue la generalización de los datos muestrales, es preciso que cada componente de la población este igualmente representado en el marco de muestreo. Se deben evitar las duplicidades. Esto es un problema habitual cuando para la muestra se combinan dos o más listados diferentes.


El marco muestral tampoco ha de incluir unidades que no corresponden a la población que se analiza. La inclusión de estas unidades reduce la probabilidad de elección de las unidades que si pertenecen a la población.


El marco muestral ha de contener información suplementaria que ayude a la localización de las unidades seleccionadas. códigos de matricula, direcciones, mail, numero telefónico, documento de identidad


El marco debe ser fácil de utilizar. Aquellos que están en soporte magnético simplifican y automatizan bastante el proceso de extracción muestral. Además de reducir los costos, también reducen los errores en la selección de la muestra.


El tiempo y los recursos disponibles.

Modalidad de muestreo seleccionada.

La diversidad de los análisis de datos prevista.

La heterogeneidad poblacional.

El margen de error máximo admisible.

El nivel de confianza de la estimación muestral.


El tiempo y los recursos disponibles: en función de cuanta sea la dotación económica y los plazos temporales otorgados para cada fase de la investigación, el tamaño de la muestra se vera aumentado o mermado.


La modalidad de muestreo seleccionada: Los diseños no probabilísticos demandan un tamaño muestral inferior a los diseños probalísticos. Estos últimos están orientados al logro de muestras representativas. Lo que exige aumentar el tamaño de la muestra para reducir el error muestral.


La diversidad de los análisis de datos prevista: En función de la cantidad de variables que serán evaluadas en la muestra, a mayor cantidad de características a evaluar en un población mayor tendrá que ser la muestra para que se considere representativa.


La Heterogeneidad poblacional: Cuanto mas heterogénea sea la población mayor será su varianza poblacional. En consecuencia necesitará un mayor tamaño muestral para que la variedad de sus componentes se halle representada en la muestra.


ď‚Ą

La experiencia adquirida en estudios que se repiten con periodicidad ( Censo de PoblaciĂłn y Vivienda, ENAHO, ENDES, Encuesta de Sueldos y Salarios). Estos estudios proporcionan los valores de las varianzas para distintas variables. Sin embargo que solo es de ayuda cuando ambas poblaciones coincidan.


La realización de estudios pilotos previos a la investigación principal, que ayuden al calculo de las varianzas de las variables de interés.  Cuando se desconoce el valor de la varianza poblacional (una situación muy habitual en las ciencias sociales), recurriremos al supuesto mas desfavorable. 


Los tamaños muestrales del siguiente cuadro se han definido a partir de la formula para poblaciones infinitas, a universo de confianza de 2 sigma que supone un 95,5% de posibilidad de acertar en la estimación.

N=4PQ/ E² Donde E representa el error muestral


01 05 1.0 1.5 2.0 2.5 3.0 3.5 4.0 5.0

1/99 39 600 1 584 396 176 99 66 44 32 25 16

10/90 360 000 14 400 3 600 1 600 900 576 400 294 225 144

20/80 640 000 25 600 6 400 2 844 1 600 1 024 711 522 400 256

30/70 840 000 33 600 8 400 3 733 2 100 1 344 933 686 525 336

40/60 960 000 38 400 9 600 4 267 2 400 1 536 1 067 784 600 384

50/50 1000000 40 000 10 000 4 444 2 500 1 600 1 111 816 625 400


 1. 2.

3. 4.

Margen de error máximo admisible: Hay una correspondencia entre la variable error y tamaño muestral. Los incrementos en el tamaño de la muestra producen una mayor precisión en la estimación de los parámetros poblacionales. Por ende se reduce el error muestral. En cambio en muestras pequeñas el error de muestreo aumenta, manteniendo constante la varianza poblacional.


 1. 2. 3.

4.

Que observamos en el cuadro: Una relación negativa entre las variables error y tamaño muestral. Por ejemplo incrementar de 816 a 2500 unidades disminuye el error en 1,5%. Pero a partir del 2% de error, se disparan los crecimientos en el tamaño de la muestra para alcanzar una minima ganancia en la reducción del error muestral. Por lo que el investigador deberá encontrar un punto intermedio entre el tamaño y el error muestral.


El nivel de confianza de la estimación: Exprese el grado de confianza que el investigador tiene en que su estimación se ajuste a la realidad. 2. Tres son los niveles de confianza comunes en la investigación social; el mas habitual será el 2 sigma que expresa un 95,5% de probabilidad de acertar en la estimación a partir de los datos muestrales.  1.


Valores de la distribuci贸n normal Entre: +/-1 sigma +/- 2 sigma +/- 3 sigma

Probabilidad comprendida en el intervalo 0,683 0,955 0,997


error confianza 10/90 1,0 95,5 3600 99,7 8100

20/80 6400 14400

30/70 40/60 8400 9600 18900 21600

50/50 10000 22500

2,0

95,5 99,7

900 2025

1600 3600

2100 4725

2400 5400

2500 5627

2,5

95,5 99,7

576 1296

1024 2304

1344 3024

1536 3456

1600 3600

3,0

95,5 99,7

400 900

711 1600

933 2100

1067 2400

1111 2500

4,0

95,5 99,7

225 506

400 900

525 1181

600 1350

625 1406


Que observamos en el cuadro anterior:

1.

Como varia el tamaño muestral dependiendo de cual sea el nivel de confianza adoptado.

2.

Incrementos mínimos del nivel de confianza supone añadir mas del doble de unidades de muestra.


Formula para poblaciones infinitas:

M= Z²S² / E² ó N= Z²PQ / E² 

Formula para poblaciones finitas:

M= Z²S²N / E²(N-1) + Z²S² ó M=Z²PQN /E²(N-1) + Z²PQ Z representa las unidades de desviación típica correspondientes al nivel de confianza elegido. S² constituye el valor de la varianza poblacional E² es el error máximo permitido que el investigador establece a priori. N es el tamaño poblacional M= muestra


Ejemplos para extraer una muestra: Se desea conocer el tamaño de la muestra para una encuesta en población mayor de 18 años, con objeto de medir el voto en las próximas elecciones municipales. El error máximo permitido será de +- 2,5%.

1.

Si la encuesta se efectúa en lima, sin información previa sobre el porcentaje de voto. Para un nivel de confianza de 95,5%.

2.

Si se parte de los sondeos realizados con anterioridad de que el APRA puede alcanzar el 24% del total de votos.


El grado de inadecuación existente entre las estimaciones muestrales y los parámetros poblacionales.

Por muy perfecta que sea la muestra, como únicamente se analiza una parte de la población siempre habrá divergencias entre los valores obtenidos de la muestra y los valores correspondientes a la población.

Solo los diseños muestrales aleatorios tienen la capacidad de determinar la precisión de las estimaciones muestrales.


El tamaño muestral:

1.

Es el tamaño de la muestra lo que determina el error muestral.

2.

A medida que aumenta el tamaño de la muestra decrece el error muestral cualquiera que sea el valor de la varianza-


La varianza poblacional:

1.

El nivel de heterogeneidad de una población favorece el error muestral, excepto si se aumenta el tamaño muestral.

2.

El error muestral se halla mas presente en poblaciones heterogéneas que en poblaciones homogéneas.


El nivel de confianza adoptado:

1.

Aumentar el nivel de confianza supone aumentar el tamaño de la muestra, por ende se reducirá el error muestral.

2.

Pero el incremento en el nivel de confianza repercute siempre en aumento de los costos de la investigación.


ď‚Ą

Tipo de muestreo realizado: El muestro estratificado es el que genera un menor error muestral. el muestreo por conglomerados es el que ocasiona un mayor error muestral.


Consideraciones a tener:

1.

El muestreo aleatorio sistemático ocasiona errores equivalentes a muestras aleatorias simples, siempre y cuando no exista ninguna estratificación en la muestra.

2.

Las muestras aleatorias estratificadas presentan mayores errores de muestreo que las aleatorias simples del mismo tamaño; pero solo si existe heterogeneidad entre los estratos.

3.

El muestreo por conglomerados genera un mayor error típico, sobre todo cuando cuanto mayor es el tamaño de los conglomerado en la ultima fase de muestreo.



La representatividad de la muestra depende tanto de la magnitud de la muestra como del procedimiento que se utilizó para su selección.

Se puede dividir en dos formas dependiendo a la intervención del azar: 1. Probabilístico o Aleatorio 2. No probabilístico 


Muestreo Probabilístico: Se fundamenta en la aleatorización como criterio esencial de selección muestral

1.

Cada unidad de la población tiene una probabilidad igual de participar de la muestra. La selección de cada unidad muestral es independiente alas demás. El cálculo del error muestral se hace dentro de los márgenes de probabilidad específicos.

2. 3.


Muestreo no Probabilístico: La extracción de la muestra se efectúa siguiendo criterios subjetivos.

1. 2. 3.

Existe una desigual probabilidad de las unidades de la población de formar parte de la muestra. La dificultad de calcular el error muestral. La introducción de sesgos en la selección de la muestra.


Factores que condicionan la elección de un tipo de muestreo:

La dotación económica de la investigación. 2. El periodo de tiempo programado. 3. La existencia de un marco muestral válido. 4. El grado de precisión que le queremos dar. 1.


Probabilístico

No Probabilístico

1.

Estimación de parámetros.

1.

La indagación exploratoria. Estudios cualitativos. Indagaciones en poblaciones marginales.

2. 2.

Comprobación de hipótesis

3.


 1. 2. 3. 4. 5.

Probabilístico Simple Sistemático Estratificado Por conglomerados De rutas aleatorias

 1. 2. 3.

No Probabilístico Por cuotas Estratégico Bola de nieve



1.

Constituye el prototipo del muestreo.

2.

Tiene que tener un marco muestral.

3.

Se realiza la extracci贸n aleatoria de los individuos que formaran la muestra.

4.

Cada unidad tiene la misma probabilidad de aparecer en la muestra.


ď‚Ą

Cuando el Marco Muestral se halla en soporte magnĂŠtico:

Numera a cada uno de los integrantes del marco muestral. 2. Genera su propia seria de nĂşmeros aleatorios. 3. Selecciona e imprime la lista de las unidades muestrales elegidas. 1.


Cuando el Marco Muestral se halla en forma tradicional: 

Elegir aleatoriamente un punto de partida.

El número de dígitos extraídos de la tabla ha de corresponder con el numero de dígitos de la población contenida en el marco muestral.

El individuo al que pertenezca el número extraído formará parte de la muestra, salvo que no sea localizado.


Ventajas

Desventajas

1.

Facilidad de los cálculos estadísticos. Logra equiparabilidad entre la muestra y la población. Logra correspondencia entre la muestra y la población.

1.

Requiere listar y enumerar las unidades de la población. Resulta arduo en muestras de poblaciones elevadas. La dispersión alcanzada en la muestra repercute negativamente en los costes de la investigación.

2.

3.

2. 3.


1.

De mayor pr谩ctica que el simple.

2.

Exige la existencia de un marco muestral.

3.

Se realiza la extracci贸n aleatoria de los individuos que formaran la muestra.

4.

Cada unidad tiene la misma probabilidad de aparecer en la muestra.


Solo la primera unidad se elige al azar con la condición de que el numero seleccionado sea inferior al coeficiente de elevación.

Los restantes elementos de la muestra se obtienen sumando sucesivamente el coeficiente de elevación, hasta completar al menos el tamaño muestral.


Ventajas

Desventajas

1.

No precisa del uso continuo de una tabla de números aleatorios.

1.

Necesita del recuento constante de las unidades de la población.

2.

No exige que el marco muestral sea un listado.

2.

Antes de la selección muestral hay que desordenar el marco muestral.


La mas utilizada en la investigación social.

Se clasifican las unidades de la población en un número reducido de grupos.

Se agrupan de acuerdo a las características observadas en el marco muestral en razón de su similaridad.

Se persigue que cada estrato este representado en la muestra.


Principios básicos en el diseño de un esquema de estratificación:

1.

Elección de las variables de estratificación.

2.

Orden de las variables de estratificación.

3.

Número de las variables de estratificación.

4.

Tamaño de los estratos


La estratificación persigue el logro de una mayor precisión en la estimación muestral y esto se alcanza con dos condiciones:

1.

Sean máximas las diferencias entre los estratos y mínimas dentro de cada estrato.

2.

Las variables de estratificación se hallen relacionadas con los objetivos de la investigación.


Menú de variables de Estratificación. 

Las más empleadas son sexo y edad.

Le siguen clase social, ocupación, nivel de instrucción.

En los estudios a nivel nacional se puede estratificar por ubicación geográfica, ámbito territorial, tipo y tamaño de hábitat.


Afijación Simple:

Se asigna el mismo tamaño de la muestra a cada estrato.

Para ello se divide el tamaño de la población entre el numero de estratos.

Estarán representados en igual magnitud dentro de la muestra todos los estratos.


Afijación Proporcional:

La distribución de la muestra se hace de acuerdo al peso relativo del estrato en el conjunto de la población.

Es el mas usado dentro de los trabajos de investigación.

Se multiplica lo que representa cada estrato con el tamaño de la muestra a afijar.


Afijación óptima:

Al peso relativo de la población se lo multiplica por la variabilidad del estrato con respecto a la variable de estratificación.

Esta afijación precisa del conocimiento previo de la varianza poblacional de cada estrato.

Es una practica escasa en los trabajos de investigación por la dificultad de conseguir la varianza de las variables de estratificación.


Ventajas

Un menor error muestral. 2. Mayor representatividad. 3. Pueden emplearse procedimientos muestrales variados dentro de cada estrato. 4. Facilita la organización del trabajo de campo. 1.

Desventajas

Precisa mayor información del marco muestral. 2. Resulta mas costoso. 3. Necesita de cálculos estadísticos de mayor complejidad. 1.


  

 

Secciona la población en grupos. Busca la heterogeneidad dentro del estrato. Busca que cada conglomerado sea una representación de la variedad de los componentes de la población. Lo que se extrae es una muestra aleatoria de conglomerados. La unidad de muestro es el conglomerado.


Aspectos a considerar en la elección de los conglomerados:

1. 2.

Han de estar bien definidos y delimitados. El numero de individuos del conglomerado ha de ser conocido previamente. No pueden haber muchos conglomerados. Los conglomerados no tienen porque hallarse idénticamente definidos en todos los lugares. Los conglomerados deberían escogerse de manera que se consiguiera disminuir el aumento del error muestral generado por la agrupación.

3. 4. 5.


Ventajas

Desventajas

No exige un listado de toda la población de interés.

Mayor error muestral.

Requiere cálculos estadísticos complejos.

Disminuye los costos de la investigación al concentrar el trabajo de campo en un numero limitado de puntos de muestreo.


Complemento de los muestreos por cuotas, conglomerados o estratificados.

Se establece una ruta o itinerario que el entrevistador ha de seguir para ubicar las unidades muestrales.

Las rutas se eligen de forma aleatoria ayudándose de un mapa o alguna otra cartografía.


Se debe ubicar múltiples punto de partida en el mapa.

Estos puntos de partida corresponden a un edificio determinado por una dirección.

En pueblos pequeños estos edificios pueden ser las iglesias, plazas de armas o municipios.


Los giros serán siempre a la izquierda o siempre a la derecha.

Se deben numeras los edificios y entrar en los predeterminados.

Se debe especificar la vivienda que será entrevistada en cada planta.


Se debe especificar la persona a entrevista en cada vivienda de acuerdo a las cuotas fijadas.

El entrevistador tiene que registrar todo su itinerario hasta la localización de cada unidad.

Se puede presentar sobrerrepresentación.



Es una de los muestreos mas populares. También involucra la segmentación de la población de interés en grupos.  Por lo que conlleva a la elaboración de una matriz con las características básicas de la población que se analiza.  El propósito es seleccionar una muestra que se ajuste a la distribución de las características fundamentales de la población.  


En la selección de las variables para formar las cuotas intervienen además de los objetivos: 1. La precisión que el investigador desee para su indagación. 2. La accesibilidad de las variables elegidas. 

Las cuotas mas habituales son: sexo y edad en virtud de su mayor accesibilidad.


Luego de confeccionar la matriz:  Se calculan las proporciones relativas (cuotas) para cada celdilla.  En función de lo que representa cada categoría de las variables seleccionadas en la población seleccionada.  El entrevistador tendrá la libertad de elegir las unidades finales de la población a entrevistar. 


Ventajas

Desventajas

1.

Más económico.

1.

Mayor error muestral. No se puede calcular el error típico. Representatividad limitada. Dificultad en el control del trabajo de campo.

2. 2.

Fácil de administrar 3.

3.

No precisa de marco muestral.

4.


  

La selección de la muestra responde a criterios subjetivos, acordes con los objetivos de la investigación. Es llamado también muestreo por conveniencia. Es habitual en estudios cualitativos. En trabajos de experimentación con personas voluntarias.


Se utiliza también en estudios pilotos.

En los estudios de validación de instrumentos de recolección de datos.

Se basta con escoger a individuos que comparten las características de las muestras diseñadas para la investigación definitiva.


Ventajas

Desventajas

1.

Simplicidad y economía en el diseño muestral.

1.

Imposibilidad de estimar el error típico.

2.

Dificultad en la generalización de los resultados.

3.

Presencia de sesgos en la investigación

2.

Fácil de administrar.

3.

No precisa de un listado de la población.


Las unidades muestrales van escogiendose sucesivamente, a partir de las referencias de los individuos a los que ya se accedió. A su vez, los nuevos casos identifican a otros individuos en su misma situación y la muestra va aumentando de tamaño como bola de nieve. Se utiliza cuando se carece de marco muestral, con población generalmente marginal.


Sea que se trate de un tipo u otro de muestreo lo importante es elegir a los informantes o casos adecuados, de acuerdo al planteamiento del problema y el acceso a ellos

Los estudios exploratorios emplean muestras dirigidas aunque podrían usar muestras probabilísticas


Las investigaciones experimentales emplean en su gran mayoría muestras dirigidas.

Los estudios descriptivos, correlacionales y causales emplean muestras probabilísticas porque requieren que sus resultados sean generalizables.



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.