16 minute read
DE MUESTREO
3.3. POBLACIÓN DIANA, POBLACIÓN DE ESTUDIO Y MUESTRA. TÉCNICAS DE MUESTREO
Dr. Francisco García Río
INTRODUCCIÓN
Cuando se pretende estudiar alguna característica de la población, se plantea un problema relacionado con la elección de los individuos. Puesto que en general no resulta posible estudiar a toda la población, se debe elegir una muestra que sea representativa y que permita extrapolar los resultados obtenidos a la población de referencia (Figura 3.3.1).1 Sin embargo, es necesario considerar que el empleo de técnicas de muestreo tiene una serie de ventajas y limitaciones.1-4 Entre las primeras se incluyen mayor efi ciencia en términos de coste y mayor rapidez en la obtención de los resultados. Sus limitaciones vienen dadas por los errores que se pueden cometer con el muestreo, principalmente el error aleatorio y el error sistemático o sesgo.
POBLACIÓN, MUESTRA Y OTROS CONCEPTOS ASOCIADOS
También denominados estudios de seguimiento, de proyección o de incidencia. La palabra cohorte deriva La población es el conjunto de todos los sujetos sobre los que queremos conocer cierta información relacionada con el fenómeno que se estudia. Puede ser el conjunto de pacientes con una enfermedad o los sujetos que viven en una comunidad. Con mucha frecuencia, el investigador no tiene acceso a la totalidad de la población por carecer del censo o por no tener un listado con todos los pacientes que sufren una enfermedad concreta (diagnosticados y no diagnosticados). Por ello, se utiliza el concepto de población de estudio o marco muestral, para referirse al conjunto de sujetos de la población realmente disponibles para la elección de la muestra. Un ejemplo de población de estudio es utilizar el listado telefónico para seleccionar una muestra en lugar del censo poblacional.
La muestra es el subconjunto de la población que se selecciona para el estudio, esperando que lo que se averigüe en la misma nos proporcione una idea sobre la población en su conjunto. Por último, el sujeto es la unidad de la población de la que buscamos información.
Para que las conclusiones obtenidas a partir de una muestra sean válidas para una población, la muestra debe haberse seleccionado de forma que sea representativa de la población a la que se pretende aplicar la conclusión, es decir, si el proceso de selección de la muestra es adecuado, resulta posible realizar una extrapolación de los resultados obtenidos a la población de estudio o marco muestral por inferencia estadística.
Si la población de estudio es representativa de la población diana, los resultados también podrían ser generalizados al conjunto de la misma (Figura 3.3.2).5-6 La mejor forma de asegurar la validez de las inferencias es que la muestra sea sufi cientemente grande (en el siguiente capítulo se explican los cálculos del tamaño muestral) y que se seleccione mediante una técnica aleatoria (Figura 3.3.3).7
MUESTREO PROBABILÍSTICO
Los métodos de muestreo aleatorio o probabilístico se basan en el principio de equiprobabilidad. Es decir, todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra. En la práctica, existen diferentes tipos de muestreo aleatorio: simple, sistemático, estratifi cado y por etapas (Figura 3.3.4 y Tabla 3.3.1).1-2,8 Aunque en los dos últimos no todos los sujetos tienen la misma probabilidad de formar parte de la muestra, se consideran igualmente aleatorios, ya que al conocer qué probabilidad tiene cada sujeto es posible corregir la desviación mediante ponderaciones.8
Muestreo aleatorio simple
Es el procedimiento probabilístico de selección de muestras más sencillo y conocido. Una vez censada la población de estudio, se asigna un número a cada individuo o sujeto y se elige aleatoriamente, de forma manual o electrónica, hasta completar el tamaño muestral establecido. Es muy útil para obtener muestras de poblaciones pequeñas, pero no suele emplearse cuando las poblaciones muestrales son muy grandes, debido tanto a la difi cultad o imposibilidad de contar con un listado de las mismas como a razones de coste. En estas situaciones, el muestreo en etapas es mucho más recomendable.
Muestreo sistemático
Es un procedimiento alternativo al muestreo simple que se usa para la selección de muestras equiprobabilísticas de una población organizada según cierto orden conocido. Se asigna un número a cada sujeto de la población, al igual que en el procedimiento anterior, y se extrae un solo número al azar. A partir de este primer sujeto de la muestra se van tomando los siguientes sujetos dejando un intervalo determinado entre ellos. El tamaño del intervalo (k) se calcula dividiendo el tamaño de la población (N) entre el tamaño de muestra deseado (n) : k = N/n. En función del método empleado para la selección de la muestra, el muestreo sistemático se denomina regular o en fases según se fi je, respectivamente, el tamaño de la muestra que se desea seleccionar o el porcentaje de población que debe quedar incluido en la muestra (equivalentemente, la probabilidad de selección).
Suele utilizarse para grandes poblaciones y requiere disponer de un marco muestral adecuado, aunque su principal limitación es que si la constante de intervalo se asocia al fenómeno de interés puede producirse un sesgo.
Muestreo aleatorio estratifi cado
En este tipo de muestreo, la población de estudio se divide en subgrupos o estratos (clusters) y posteriormente se escoge una muestra al azar de cada estrato. Es frecuente que cuando se realiza un estudio interese evaluar una serie de subpoblaciones (estratos o clusters), siendo importante que en la muestra haya representación de todos y cada uno de los estratos considerados. El muestreo aleatorio simple no garantiza que tal cosa ocurra. Para evitar esto, se obtiene una muestra de cada uno de los estratos. Si la estratifi cación se realiza con respecto a un carácter, se denomina muestreo estratifi cado simple, mientras que si se efectúa con respecto a dos o más, se denomina muestreo estratifi cado compuesto.9
Su principal limitación radica en que debe conocerse la distribución de las variables de estatifi cación en la población. Además, la lógica de los estratos tiene que ser coherente con lo que se busca. Si se estudia la función pulmonar en sujetos sanos, se puede estratifi car por sexo o grupos de edad, pero no tiene sentido estratifi car por si se es zurdo o diestro. Es posible que la función pulmonar sea similar entre miembros de un mismo grupo etario (homogeneidad en el estrato) y difi era con respecto a otros grupos de edad (heterogeneidad entre estratos).
Existen diversas variantes de muestreo estratifi cado. La más común es la afi jación proporcional, en la que el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato dentro de la población. Por otro lado, está la afi jación no proporcional, en la que ciertos estratos están sobrerrepresentados en la muestra. Con la afi jación no proporcional se pretende aumentar la representación de un estrato clave que por su pequeño tamaño podría estar muy poco representado en un muestreo estratifi cado. Por ejemplo, se podría estratifi car por etnias aumentando el tamaño del estrato de la etnia minoritaria. Cuando se opta por afi jación no proporcional, para combinar los datos entre estratos será necesario ponderarlos asignando un peso según la proporción de ese estrato en la población.7
Muestreo aleatorio por conglomerados o en etapas múltiples
Consiste en seleccionar primero subdivisiones de la población (conglomerados) y luego muestrear sujetos de los conglomerados elegidos. Un conglomerado es una subdivisión preexistente o natural de la población, como una provincia, un área sanitaria, etc. Un conglomerado debe ser heterogéneo en sí mismo, puesto que idealmente contiene toda la variabilidad de la población.
El muestreo aleatorio por conglomerados más sencillo consta de una primera etapa en la que se muestrean los conglomerados y una segunda etapa en la que se estudian todos los sujetos de los conglomerados seleccionados (no se muestrea). Por ejemplo, si se pretende evaluar el tabaquismo en la población de estudiantes de primaria de una ciudad, la primera etapa sería escoger unas cuantas escuelas (conglomerados) aleatoriamente y encuestar a todos los alumnos y alumnas de las escuelas seleccionadas.
En muchas ocasiones, hay más etapas (muestreo polietápico) y se muestrea en varios niveles sucesivos. A su vez, el muestreo de cada etapa puede ser simple, sistemático o estratifi cado. Por ejemplo, si la población a estudiar es el alumnado de primaria de todo un país, se pueden crear dos niveles de conglomerado: provincias y escuelas. En una primera etapa, se extrae una muestra aleatoria simple de provincias del país. En una segunda etapa, se extrae una muestra aleatoria de escuelas por cada provincia seleccionada. En la tercera etapa, a partir del listado de cada escuela seleccionada, se extrae una muestra aleatoria de los alumnos a encuestar.
El muestreo por etapas se considera aleatorio si los conglomerados son heterogéneos en sí mismos y homogéneos respecto a otros conglomerados. En el ejemplo anterior de conglomerado de escuelas, esta característica se concretaría en que no existan grandes diferencias entre una escuela y otra pero que exista diversidad dentro de cada escuela.
Debe destacarse que el muestreo por estratos y el muestreo por etapas parten de ideas opuestas. La estratifi cación funciona correctamente cuando dentro del estrato hay homogeneidad, mientras que los estratos son muy diferentes entre sí. Por el contrario, en el muestreo por etapas los conglomerados deben ser parecidos entre sí y presentar heterogeneidad dentro del propio conglomerado.
Este tipo de muestreo se utiliza fundamentalmente en los estudios multicéntricos, en los que primero se debe elegir los centros participantes y después, tras haberlos seleccionado, se realiza el muestreo de pacientes dentro de cada uno.2,6
MUESTREO NO PROBABILÍSTICO
Es aquel en el que no se conoce la probabilidad de que un sujeto de la población pase a formar parte de la muestra, ya que la selección de los elementos muestrales depende en gran medida del criterio del investigador. A diferencia de los métodos probabilísticos, no permiten calcular el error muestral que se está cometiendo (Figura 3.3.4 y Tabla 3.3.2).
Muestreo por cuotas
Como en el muestreo estratifi cado, se establecen estratos, que se suponen homogéneos, y se asigna una cuota o tamaño de muestra a esos estratos, que ha de ser proporcional a su presencia en la población. Sin embargo, el muestreo no se hace a partir de un listado poblacional, sino que se deja al libre albedrío del investigador, que tiene libertad para elegir a los sujetos (normalmente, los primeros a los que tenga acceso), siempre que cumpla con las cuotas de cada estrato.
Este muestreo es muy común en los estudios de mercado y sondeos de opinión para medir la evolución de las preferencias de la gente. Aunque no sea aleatorio, si se mantiene el mismo sistema de muestreo en sucesivos sondeos suele estimar con relativa precisión dicha evolución.1
Muestreo discrecional
También denominado muestreo intencional, opinativo o por selección de experto. Tiene un grado muy bajo de aleatoridad, pues el equipo investigador determina la muestra según su propio criterio, aunque siempre con la intención de obtener una muestra más o menos representativa de la población. Por ejemplo, se podría intentar que haya tantos hombres como mujeres y que haya personas de los distintos grupos sociales. Sería como un muestreo por cuotas, pero en el que no se conoce la proporción de las distintas cuotas en la población.
Es una técnica usada por expertos con la intención de seleccionar especímenes típicos o representativos de un fenómeno en particular, con fi nes fundamentalmente experimentales.3,8 En la medida en que los criterios empleados se aparten de la subjetividad, los resultados que se obtengan serán más fi ables.
Muestreo por bola de nieve
Consiste en ir identifi cando a los sujetos de la muestra a partir de sujetos ya seleccionados. Se parte de unos pocos individuos de la población a los que se pueda acceder, y a través de ellos se logra contactar con otros sujetos con características similares, y así sucesivamente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones minoritarias o marginales.2-3
Muestreo de conveniencia
También denominado muestreo subjetivo, de juicio, casual o incidental. Los sujetos de la muestra se eligen de forma razonada, en función del objetivo perseguido y sin importar la representatividad respecto a la población. Hay muchos tipos de muestreo subjetivo, como el muestreo de casos típicos, la diversidad (sujetos que no se asemejan a la media), de informantes clave o de casos de éxito. El caso más frecuente es utilizar como muestra a los individuos a los que se tiene fácil acceso por proximidad o amistad.
ERROR ALEATORIO Y SESGOS
Aunque el muestreo tiene como fi n obtener una muestra que sea representativa de la población, esto nunca se conseguirá completamente, pues existen dos limitaciones importantes: el error aleatorio y el sesgo de selección.3,7
El error aleatorio es natural e inevitable. Que una muestra aleatoria refl eje más o menos las características de la población es, en parte, cuestión de azar. Habrá siempre una imprecisión en las estimaciones que se realicen. No obstante, gracias a la inferencia estadística, es posible cuantifi car esa imprecisión y dimensionar las muestras para minimizar el error.
Mientras que el error aleatorio es inevitable, el sesgo de selección constituye una limitación metodológica muy importante, es evitable, aunque no se dispone de herramientas para cuantifi carlo y controlarlo. Se refi ere a la distorsión en la estimación del efecto derivada de la forma en que se han seleccionado los sujetos de la muestra, debido a que la muestra no refl eja adecuadamente la población. Existen muchos tipos de sesgos de selección, como el sesgo de inclusión, de autoselección, del trabajador sano, de Berkson o de Neymann, que no es posible desarrollar en la extensión de este capítulo.1-4,9
Como se ha mencionado, los sesgos se deben evitar en la medida de lo posible. Cuando no haya alternativa, es importante reconocer el sesgo de manera transparente a la hora de presentar los resultados de la investigación. Así queda claro sobre qué población se pueden considerar representativos los resultados.
PUNTOS CLAVE
• Identifi que la población diana y la población muestral de su estudio. • ¿Dispone de una lista o censo de su población muestral? En caso afi rmativo: ¿El tamaño de la población es limitado? Si es así, considere un muestreo probabilístico simple. En caso contrario, valore un muestreo sistemático (vigile si la constante de intervalo se asocia al fenómeno que pretende estudiar, para evitar un sesgo) o por etapas. • ¿La población a estudiar no es homogénea? En dicho caso, valore la posibilidad de un muestreo estratifi cado por las variables que interese controlar. • ¿Los individuos de la población se agrupan en grupos naturales (áreas geográfi cas, áreas sanitarias…)? Si es así, puede resultar de interés un muestreo por conglomerados o etapas. • Si se plantea un estudio multicéntrico sin acceso al censo poblacional pero con disponibilidad de listados locales, valore la posibilidad de un muestreo por etapas. • Recuerde que, en la medida de lo posible, es preferible un muestreo probabilístico a uno no probabilístico. • Si no tiene acceso al censo de la población muestral y pretende realizar un estudio multicéntrico, entre las técnicas de muestreo no probabilístico considere en primer lugar el muestreo por cuotas. • Aunque resulta menos deseable, el muestreo discrecional siempre es preferible al muestreo de conveniencia. • En cualquier caso, intente controlar siempre los factores que puedan afectar a la representatividad de la muestra. • Realice una estimación del tamaño muestral para controlar el sesgo aleatorio. • ¿Identifi ca algún posible sesgo de selección? Si es así, siempre es mejor declararlo. • Verifi que que ha completado todas las etapas del diseño de muestra (Figura 3.3.5).
BIBLIOGRAFÍA
1. Th ompson S. Sampling. Nueva York, Wiley, 1992. 2. Silva Ayçaguer LC. Muestreo para la investigación en ciencias de la salud. Madrid, Díaz de Santos, 1993. 3. Scheaff er R L, Mendenhall W, Ott L. Elementary Survey Sampling. Duxbury, Belmont, 1987. 4. Rueda García MM, Arcos Cebrián A. Problemas de muestreo en poblaciones fi nitas. Madrid, Grupo
Editorial Universitario, 2002. 5. Hulley SB, Cummings SR. Diseño de la investigación clínica. Barcelona, Doyma, 1993. 6. Abramson JH. Métodos de estudio en Medicina Comunitaria. Madrid, Ediciones Díaz de Santos, 1990: 74-84. 7. Statistical Services Centre. Some Basic Ideas of Sampling, Statistical Good Practice Guidelines. Reading,
University of Reading, 2001. 8. Cochran W. Técnicas de Muestreo. México, Compañía Editorial Continental, 1985. 9. Azorín F, Sánchez-Crespo JL. Métodos y aplicaciones del muestreo. Madrid, Alianza Universidad Textos, 1994.
TABLAS Y FIGURAS
Tabla 3.3.1. Ventajas e inconvenientes de los distintos tipos de muestreo probabilístico
Aleatorio simple Ventajas Inconvenientes
• Sencillo y de fácil comprensión. • Cálculo rápido de medianas y varianzas. • Disponibilidad de paquetes informáticos para analizar los datos. • Requiere poseer de antemano el listado completo de toda la población de estudio. • En muestras pequeñas, puede no representar adecuadamente a la población.
Sistemático • Fácil de aplicar. • No siempre es necesario tener un listado de toda la población. • Cuando la población está organizada siguiendo una tendencia conocida, asegura la cobertura de unidades de todos los tipos. • Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección.
Estratifi cado • Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables concretas. • Se obtienen estimaciones más precisas. • Pueden aplicarse distintas fracciones de muestreo dentro de cada estrato. • Es necesario conocer la distribución en la población de las variables utilizadas para la estratifi cación.
Por conglomerados o en etapas
• Muy efi ciente cuando la población es muy grande y dispersa. • No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo. • El error estándar es mayor que en el muestreo aleatorio simple o estratifi cado. • El cálculo del error estándar es complejo.
Tabla 3.3.2. Ventajas e inconvenientes de los tipos más frecuentes de muestreo no probabilístico
Muestreo por cuotas
Muestreo discrecional
Muestreo en bola de nieve
Muestreo de conveniencia Ventajas Inconvenientes
• Rápido y efi ciente. • Puede ser una alternativa a las muestras estratifi cadas. • Sesgo del investigador.
• Rápido y de bajo coste. • No requiere entrenamiento de entrevistadores. • Tiene una validez relativa para estudios de casos. • Es muy útil para estudios exploratorios. • Útil para optimizar los instrumentos de observación. • Sirve para ampliar el marco teórico y la formulación de hipótesis. • Problemas en los criterios de selección de los sujetos. • Carece de validez externa y fi abilidad.
• Acumula información enriquecedora para constituir marcos teóricos. • Recomendada en estudios sociológicos. • Requiere entrevistadores profesionales bien entrenados. • La interpretación de los resultados tiene problemas de fi abilidad. • Puede haber sesgo en la selección de los sujetos.
• De bajo coste y no requieren personal entrenado. • Se sacan conclusiones rápidamente. • Carencia de validez externa y fi abilidad. • Presenta sesgos de muestreo por criterios arbitrarios en la selección de sujetos.
Figura 3.3.1.
Población diana
Población de estudio o marco muestral
Muestra
Figura 3.3.2.
Figura 3.3.3.
Defi nir población
Defi nir población de estudio
Determinar procedimiento de muestreo
Estimación del tamaño muestral
Ejecución del diseño de muestra
4
4
4 4
4 4
4
Figura 3.3.4.
4 Probabilístico
Aleatorio simple
Sistemático
Estratifi cado
Por conglomerados Por cuotas
Discrecional
Por bola de nieve
Conveniencia
MUESTREO
4 No probabilístico