La encuesta como técnica de investigación social by German Kannemann

UNIVERSIDAD DE VIGO DEPARTAMENTO DE DIDÁCTICA, ORGANIZACIÓN ESCOLAR Y MÉTODOS DE INVESTIGACIÓN

CURSO DE DOCTORADO

Bienio 2007-2009

INVESTIGACIÓN A TRAVÉS DE LOS CUESTIONARIOS

Prof. Dtor. Adolfo Pérez Abellás

ESQUEMA I.-

INTRODUCCIÓN A LA INVESTIGACIÓN SOCIAL

Introducción 1. Metodología de investigación 1.1.

Metodología

1.2.

Método científico

2. Métodos o tácticas 2.1.

Experimental

2.2.

Correlacional

2.3.

Observacional

3. Técnicas 4. Elección del método y las técnicas 4.1.

Criterios de selección del método y las técnicas

5. Las técnicas en sí mismas II.-

LA ENCUESTA COMO MÉTODO DE INVESTIGACIÓN SOCIAL

Introducción 1. Historia de las encuestas en la investigación social 1.1.

La aritmética política

1.2.

La estadística moral

1.3.

El movimiento de encuestas y monografías sociales

1.4.

Marx y Weber

1.5.

El estudio de las actitudes

1.6.

Las votaciones particulares

1.7.

Gallup, Roper y Crossley

2. ¿Qué son las encuestas? 2.1.

La encuesta y las técnicas de investigación

Investigación a través de los cuestionarios

2.2.

La encuesta: una técnica para explorar, describir y explicar la realidad social

2.3.

Propuesta de una definición de encuesta

3. Tipos de encuesta 3.1.

La encuesta personal

3.2.

La encuesta de correo

3.3.

La encuesta telefónica

3.4.

Otros tipos de encuesta

3.5.

La elección del tipo de encuesta más adecuada en función de sus ventajas e inconvenientes

4. El proceso general de investigación mediante encuestas III.-

SELECCIÓN DE MUESTRAS

1. Abordaje directo de la población 2. Solución: encuestar sólo a una muestra 2.1.

A la búsqueda de una solución

2.2.

Representatividad de las muestras

2.3.

Fases en le obtención de una muestra

2.4.

Conclusión

3. Acerca del tamaño de la muestra 3.1.

Importancia del concepto

3.2.

Algunos consejos

3.3.

Expresiones de cálculo

4. Muestras no aleatorias 5. Muestreo aleatorio 5.1.

Muestreo aleatorio simple

5.2.

Muestreo sistemático con arranque aleatorio

5.3.

Muestreo estratificado

Investigación a través de los cuestionarios

5.4.

Muestreo de conglomerados

5.5.

Variantes

5.6.

¿Cómo escoger un procedimiento de muestreo?

6. Errores de muestreo 6.1.

El error muestral y sus expresiones asociadas

6.2.

El error muestral y la estimación

6.3.

Riesgo en la estimación

6.4.

Un ejemplo concreto

7. Consecuencias del muestreo en el análisis de los datos 7.1.

Ponderación

7.2.

Varianzas

7.3.

Modelos de muestreo en el sotfware al uso

8. Problemas prácticos 8.1.

Problemas con bases de datos

8.2.

Problemas con la ausencia de respuesta

8.3.

Los encuestadores

Anexo I: Tabla de números aleatorios (3.000 dígitos) IV.-

SELECCIÓN DEL ENCUESTADO

Introducción 1. Encuestas por correo 2. Encuestas por teléfono 3. Encuestas cara a cara: muestreo por cuotas 4. Encuestas cara a cara: muestreo por rutas aleatorias 4.1.

Construcción de la ruta aleatoria

4.2.

Selección del encuestado en la vivienda

Anexo I. Tabla de números aleatorios para el encuestador

Investigación a través de los cuestionarios

V.-

ELABORACIÓN DEL CUESTIONARIO

Introducción 1. ¿Qué es un cuestionario? 2. ¿Por qué utilizar un cuestionario? 3. Esquema conceptual para orientar la elaboración del cuestionario 3.1.

Las variables son constructos

4. Pasos para la elaboración del cuestionario 5. El objetivo del cuestionario 5.1.

El contexto de la encuesta

5.2.

Los recursos disponibles

6. El diseño del cuestionario 7. Recomendaciones para hacer las preguntas del cuestionario 7.1.

Recomendaciones para elaborar preguntas factuales

7.2.

Preguntas abiertas comparadas con preguntas cerradas

7.3.

Preguntas llave o filtro

8. Medición de estados subjetivos 8.1.

Tests de ordenación

8.2.

Tests tipo Likert

9. Revisión de las preguntas 9.1.

Procedimientos subjetivos

9.2.

Procedimientos empíricos

10. Preguntas demográficas 11. Orden y disposición de las preguntas en el cuestionario VI. LA CALIDAD DE LA ENCUESTA Introducción 1. Errores asociadas al muestreo

Investigación a través de los cuestionarios

1.1.

La no respuesta

2. Errores asociados con el cuestionario 2.1.

Necesidad de hacer estudios piloto

3. Errores asociados con la entrevista 3.1.

Errores asociados a los encuestados

3.2.

La importancia en la supervisión

3.3.

Repaso de la entrevista y cumplimentación correcta de cuestionarios

4. Errores asociados al tratamiento de datos 4.1.

Errores en la codificación de datos

4.2.

Errores asociados al registro de los datos

4.3.

Errores en la preparación de los datos para el análisis

4.4.

Imputación de datos a las respuestas perdidas y a las no respuestas

5. Conclusión BIBLIOGRAFÍA

Investigación a través de los cuestionarios

I.-

INTRODUCCIÓN A LA INVESTIGACIÓN SOCIAL1 Cristino Pérez Meléndez Antonio J. Rojas Tejada Juan Sebastián Fernández Prados

Introducción Imaginemos a un investigador preocupado por conocer la realidad social de su entorno (léase barrio, ciudad, provincia, comunidad autónoma, país, etc.). Ha escuchado hablar de la existencia de distintas “formas de investigar” y decide buscar en algunas librerías obras que hagan referencia a ese tema. Encuentra algunos textos que hablan de estas formas de investigar: •

Metodología de las ciencias sociales.

•

Métodos en las ciencias sociales.

•

Técnicas de investigación social.

•

Metodología de la investigación.

•

Métodos y técnicas de investigación social.

•

Métodos y técnicas de investigación para el análisis de la realidad social.

•

Los métodos en sociología.

En todos estos textos se habla de distintas “formas de investigar”, pero se confunde la terminología: metodologías, métodos y técnicas. Podemos pensar que estas tres palabras son sinónimas, pero no es así. Una de las primeras lecciones que tiene que aprender este investigador es que debe dominar los conceptos que se utilizan en su campo de estudio. Nada mejor para ello que presentar, de forma breve, qué se entiende por metodología, qué se entiende por métodos y qué por técnicas, sin que esto indique que se trata de elementos independientes, sino muy al contrario, ya que en el proceso científico dichos conceptos están íntimamente ligados. Intentamos definir los términos básicos para una mejor ubicación y desarrollo del tema que nos ocupa: la encuesta como técnica de investigación social. Para ello se 1

Rojas Tejada, A. et al. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Madrid. Síntesis.

Investigación a través de los cuestionarios

delimitarán los conceptos metodología, métodos y técnicas y se establecerán una serie de criterios que nos puedan guiar a la hora de decidir por una determinada “forma de investigar”. 1. Metodología de investigación 1.1.

Metodología

La palabra “metodología” se utiliza habitualmente con dos acepciones o significados: En un sentido amplio, definirnos metodología como el estudio de los métodos. Etimológicamente: logía proviene del griego logos que significa palabra, discurso o tratado sobre. Por su parte método deriva de las raíces griegas metá y odos: metá (hacia, a lo largo) es una preposición que da idea de movimiento y odos significa camino. En un sentido restringido, se aplica el concepto de metodología como la manera o conjunto de pasos que tenemos a la hora de aplicar una determinada programación, proceso o técnica. Existen otras palabras y conceptos más adecuados que metodología para referirse a esta idea como son método, planificación y/o diseño. Atendiendo a la primera acepción, metodología sería el estudio de los métodos –su descripción, explicación y justificación- y no los métodos en sí mismos. Su finalidad es comprender el proceso de la investigación y no los resultados de la misma. Tenemos tantas metodologías como formas y maneras de adquisición de los diversos saberes: saber mítico, saber vulgar, saber científico, etc., los cuales responden de una forma distinta a cada una de las preguntas y cuestiones que se plantea la propia metodología. Pero es desde comienzos del siglo XVII cuando los problemas metodológicos o, para ser más precisos, las cuestiones concernientes a la metodología, comenzaron a adquirir importancia. Es entonces, como consecuencia de la gran expansión y progreso de las ciencias modernas, cuando se hizo necesario desarrollar nuevos procedimientos e instrumentos para hallar caminos de acceso a la realidad. Actualmente los problemas metodológicos han ido adquiriendo un amplio desarrollo como fundamento teórico de los métodos, esto es, como ciencia del método. La metodología adquiere su importancia ante la aparición del saber denominado científico, con su método particular para conocer. En el contexto del proceso de la producción de un conocimiento científico sobre una realidad concreta, es necesaria la articulación de tres esferas fundamentales:

Investigación a través de los cuestionarios

a) Análisis teórico. b) La investigación tecnológica. c) Las investigaciones concretas que tratan de una realidad realidad. Pues bien, este planteamiento, así como la articulación de estas tres esferas son tratadas bajo el prisma de la metodología de cada área de estudio. Dicha metodología se manifiesta, fundamentalmente, al resolver los problemas y las distintas condiciones que surgen, de acuerdo con las características propias de los objetos de estudio correspondientes. Entre ellos podemos destacar la clarificación de los conceptos, la precisión de las observaciones, formas de medida, el paso de los hechos a los datos y, de ahí, a las interpretaciones, la formalización del razonamiento, la estructura de las teorías, las bases empíricas de las mismas, etc. La toma de conciencia y resolución de cada uno de ellos nos permitirá no sólo conectar el trabajo práctico con el teórico, y viceversa, sino un desmenuzamiento de los diferentes componentes de la investigación (Musso, 1979a; 1979b). En consecuencia, según la manera en que se resuelvan dichas cuestiones, podremos situarnos más cerca de la filosofía o de la metafísica o, por el contrario, más cerca de las ciencias naturales y exactas, o de actividades muy particulares que no admiten comparación con otros campos de conocimiento. La importancia de la metodología es tal que actualmente, en casi todos los campos del conocimiento científico, existen áreas dedicadas a la metodología propia de las mismas. Así podemos encontrarnos con trabajos con títulos como Metodología de la Investigación en Sociología, Metodología de la Investigación en Psicología Social, Metodología de la Investigación en Trabajo Social, Metodología de la Investigación en Educación, etc., donde sus diferencias fundamentales están en tener en cuenta las peculiaridades de cada una de estas áreas de conocimiento. De lo que no cabe duda es que la preocupación metodológica en “ciencias” tales como la Psicología, Sociología, etc., más que estar en auge y presente en los investigadores de dichas disciplinas, se encuentra aislada en una especie de “Santuario” al que de manera poco frecuente peregrinan los científicos teóricos y, aún más esporádicamente, los especialistas aplicados. Además, en cada visita buscan objetivos distintos: la primera, a la que le conceden una importancia desproporcionada, está motivada por la necesidad de cumplimentar trámites académicos o administrativos; y, en la segunda y última, el investigador un poco más veterano, trata de justificar el propio punto de vista metodológico de sus investigaciones en curso. Después de ésta, el llamado

Investigación a través de los cuestionarios

investigador “medio” contemporáneo debido a su pretendida y exigida especialización, propia del mundo moderno, termina justificando su metodología adoptando las posiciones metodológicas diseñadas por los antecesores que trataron sus mismos temas de investigación. Todos juntos conforman un grupo, relativamente amplio, fuera del cual será difícil aceptar o entender sus posiciones metodológicas. Se trata de “burbujas aisladas” más o menos voluminosas, en las que se insertan aquellos que abordan un mismo tema y comparten una manera de proceder aunque, a veces, de forma implícita. Esta razón hace que el diálogo metodológico entre investigadores pertenecientes a distintas “burbujas” se traduzca en unas descalificaciones mutuas sostenidas de manera afectiva e ideológica. Así, es posible que en la actualidad se publiquen trabajos de investigación en revistas especializadas sin que por ello se pueda presuponer que el autor de los mismos justifique o pudiera justificar, ni siquiera superficialmente, los criterios metodológicos y, en consecuencia, las implicaciones a las que le lleva el método adoptado. Continuando con el ejemplo de los investigadores sociales, su metodología se consagra exclusivamente (y no en todos los casos y con el suficiente rigor) a: 1. Garantizar la precisión de sus observaciones. 2. Asegurar la precisión de sus instrumentos de medida. 3. Hacer corresponder sus ideas -a veces ni siquiera conceptos- con pobres variables empíricas consideradas por él como su expresión en la realidad (Castells y de Ipola, 1975). Por último, debemos comentar que no vamos a utilizar el concepto metodología en sentido restringido, como se ha utilizado con bastante frecuencia (Clemente, 1992), ya que los autores consideran más adecuado el uso de la palabra metodología en su primera acepción, a saber: como el estudio de los métodos y no en referencia a los métodos en sí mismos. 1.2.

Método Científico

Todo el planteamiento metodológico anterior, propio de la Filosofía de la Ciencia, persigue diferenciar el conocimiento denominado científico de otros tipos de conocimientos a los que denominaremos ordinarios (místico, autoritario o lógico racional). Es decir, el objetivo es establecer unos criterios seguros que nos permitan distinguir entre lo que es ciencia y lo que se presenta como científico sin serlo y, con

Investigación a través de los cuestionarios

ello, poder fijar la superioridad epistemológica de la ciencia sobre otras formas de conocimiento. El conocimiento científico ha sido definido de muchas maneras y distintos autores han determinado, más o menos exhaustivamente, unos criterios que lo caracterizan, de tal manera que el calificativo de “científico” no se le pueda aplicar a cualquier tipo de conocimiento. Pues bien, en opinión de los autores de este trabajo, el conocimiento científico se caracteriza por el método adoptado y no tanto por el objeto de estudio de tal manera que cuando el método aplicado por el investigador es el hipotético-deductivo (con todas sus implicaciones) se deslinda con claridad entre conocimiento científico y no científico (figura 1.1). FORMALIZACIÓN

DEDUCCIÓN

HIPÓTESIS

MÉTODOS DE INVESTIGACIÓN

LEYES / TEORÍAS INTUICIÓN CREATIVIDAD INTUICIÓN

REALIDAD

VALIDACIÓN DE LA LEY, TEORÍA

CONTRASTTE

TÉCNICAS DE RECIGIDA DE DATOS EXPERIMENTOS OBSERVACIONES CUESTIONARIOS, TESTS...

DATOS CIENTÍFICOS

TRANSFORMACIÓN Figura 1.1. Marco general de investigación científica

En dicho método, se establecen una serie de momentos y reglas que deben seguirse en cada caso. No obstante, cabría distinguir por un lado un método general que sirve de guía a todas aquellas disciplinas que aspiren a la categoría de científicas y, por otro, unos métodos particulares o tácticas diferenciadas en función del objeto y complejidad de estudio. Hay que indicar que “método”, en sentido propio, es aquel conjunto de operaciones teóricas, lógico-epistemológicas y procedimentales que permiten validar o justificar las teorías científicas. La esencia del método general (hipotético-deductivo) reside en la posibilidad de

Investigación a través de los cuestionarios

anticipar los conocimientos (aun aquellos más ocultos a la experiencia directa). Ésta es la función de las hipótesis formalmente deducidas de un cuerpo teórico, que posteriormente se tratarán de confirmar o refutar con datos de la realidad. Cualquier otra modalidad de conocimiento no deja de ser una matización más o menos empirista. Los conocimientos así adquiridos (científicos, lo que llamamos ciencia, etc.) se distinguen porque se manifiestan a dos niveles bien interconectados: por un lado un conjunto de conocimientos presentados mediante conceptos (elementos de las leyes y teorías) y, por otro, una integración lógica de dichos conceptos (teorías) que nos conducen a conocimientos nuevos. La integración lógica aplicada a la totalidad de los conocimientos produce un sistema teórico que supera a la suma de conocimientos aislados. Dicho sistema, a su vez, permite sacar nuevas conclusiones sobre la realidad. Éste sería el proceso y el producto de la aplicación del método científico. En este párrafo se muestra la distinción entre ciencia como proceso y ciencia como producto, así como la integración entre ambas. De esta manera, el método hipotético-deductivo posibilita el ordenamiento coherente de conocimientos al aplicar la racionalidad a los pasos lógicos que conducen a este objetivo. Aquí se sitúa todo el debate de la Filosofía de la Ciencia, que trata los temas relativos a la inducción, la deducción, la verificación, las reglas de correspondencia entre los conceptos y los hechos, las teorías o la explicación, entre otros. En cuanto a los métodos particulares, cabría añadir, además de lo dicho para el método general, que se trata de herramientas útiles que el investigador utiliza para comprobar hipótesis de investigación objetivas, deducidas desde el esquema del método general. En este sentido, tanto la táctica experimental como la selectiva, la observacional y las distintas técnicas de recogida de información y procedimentales, también son objeto, al ser métodos y técnicas de investigación, de la metodología y su validez viene determinada en función del grado de adecuación de éstas con la formulación de las hipótesis que se someten a prueba. El uso de una táctica frente a otra, en sí misma no concede status científico a los datos obtenidos por ella. Resumiendo todo lo anterior, podríamos decir que una investigación y, como consecuencia, un conocimiento, se considera científica cuando es posible, siguiendo las reglas del método, presentar los hechos en forma de enunciados, conceptos o teorías explicativas, y a partir de estas reglas, poder deducir unas consecuencias (hipótesis) cuyo grado de comprobación lógica o empírica nos permiten consolidar o reformular las teorías de las que se parte. Investigación a través de los cuestionarios

Para la comprobación empírica hay que poner en marcha una serie de métodos particulares que nos determinen unos procedimientos de observación adecuados (tácticas de investigación) que hagan posible una correcta recopilación de datos que, junto a la clasificación de los mismos -mediante análisis adecuados, estadísticos o nonos conduzcan a unas conclusiones. Éstas harán posible verificar o no aquellas consecuencias derivadas de las teorías (hipótesis); de tal manera que cuando son verificadas dichas hipótesis pasan a ser consideradas como leyes y se introducen en el sistema (teoría). Por este mecanismo se puede decir que los conocimientos así adquiridos (conocimientos científicos) trascienden al sujeto cognoscente: son aceptados por todos, independientemente de los gustos, valores, ideología, etc., dado que pueden ser reproducidos por cualquiera y ser sometidos a la inspección pública. Igualmente son una representación (pactada) de los objetos de la realidad que se estudian -el pacto de la operativización- y adquieren el estado de “verdaderos”, aunque no de infalibles ni autosuficientes. La fase de comprobación empírica de las hipótesis exige, como ya se ha indicado anteriormente, una adecuación de los procedimientos a seguir con los enunciados a verificar. Para que se dé esta adecuación han ido surgiendo a lo largo de la historia de la ciencia diversas tácticas (métodos particulares) de investigación que hacen posible la operativización de los enunciados deducidos de las teorías a verificar. Estas tácticas de investigación son lo que se denomina en la mayoría de los textos especializados “métodos de investigación”, aunque en su connotación más restringida significa: camino a seguir para salvar los obstáculos que nos conduzcan a un fin determinado; en este caso, el fin no es otro que contrastar empíricamente las hipótesis deducidas. Serán las características de dichas hipótesis las que determinen el método de investigación a seguir, de tal manera que uno de ellos no tiene por qué ser válido frente a cualquier hipótesis, es más, no será el tipo de táctica de investigación la que determine el tipo de conocimiento (científico, no científico) obtenido, ya que ese estado viene determinado por el planteamiento más general del método hipotético-deductivo, que para cualquier área de estudio deberá cumplir las siguientes fases (Bunge, 1985): 1. Enunciar preguntas bien formuladas. 2. Establecer conjeturas, fundadas y contrastables con la experiencia, para dar respuesta a las preguntas (leyes y teorías).

Investigación a través de los cuestionarios

3. Derivar consecuencias lógicas de las conjeturas. 4. Arbitrar técnicas para someterlas a contrastación. 5. Someter, a su vez, las técnicas a prueba para comprobar su relevancia e idoneidad. 6. Llevar a cabo el contraste e interpretación de los resultados. 7. Estimar la verdad (sin declararla satisfactoriamente confirmada y considerarla, en el mejor de los casos, como parcialmente veraz). 8. Determinar los dominios en los que valen las conjeturas y las técnicas y formular los nuevos problemas originados por la investigación. En general, podemos decir que toda investigación parte de un problema a estudiar y que por una serie de fases se llega a unos resultados empíricos relevantes para el problema inicialmente planteado, que sirven de base para contrastar las conjeturas realizadas en relación con el problema planteado. La forma de llegar a estos resultados empíricos es diversa, pero el proceso de investigación en sí mismo es, desde un punto de vista lógico-formal, similar (Alvira, 1984). 2. Métodos o tácticas Como ya se ha indicado anteriormente las tácticas de investigación son consideradas como métodos que nos permiten operativizar no sólo hipótesis científicas, sino también objetivos de investigación desconectados del método científico, más o menos formalizados. Por ello, es conveniente enumerar las principales características de cada una de las tres grandes tácticas de investigación y, así, disponer de una guía que nos permita determinar cuál de ellas adoptar de acuerdo con las características de los enunciados que se quieren someter a comprobación empírica. En Ciencias Sociales hay multitud de clasificaciones de los métodos de investigación existentes, pero una de las más útiles, y por ello más empleada, es la siguiente (Arnau, Anguera y Gómez, 1990; León y Montero, 1993, Delgado y Prieto, 1997): •

Táctica, Modalidad o Método Experimental (también llamada explicativa).

•

Táctica, Modalidad o Método Correlacional (también llamada cuasi-experimental, selectiva, diferencial o comparativa).

•

Táctica, Modalidad o Método Observacional (también llamada natural, descriptiva, de campo, exploratoria).

Investigación a través de los cuestionarios

Vamos a ver cada una de ellas brevemente. 2.1.

Experimental

En esta táctica el punto central es la posibilidad de poner a prueba hipótesis que establecen relaciones causales entre las variables sometidas a estudio. Las notas más destacables de este procedimiento serían las siguientes (Arnau, Anguera y Gómez, 1990; Clemente, 1992; León y Montero, 1993; Morales, 1981): •

El procedimiento de operativización de variables está fuertemente sistematizado, exigiendo al investigador una exhaustividad en el cumplimiento de sus fases y condiciones de aplicación.

•

El investigador puede manipular directamente las variables antecedentes (independientes) para comprobar qué efectos producen sobre las variables consecuentes (dependientes).

•

Se puede determinar el tipo de relación causal existente entre las variables antecedentes y consecuentes.

•

Permite controlar bien directamente bien estadísticamente, las variables extrañas previa detección de las mismas por el investigador.

•

Generalmente, se aplica en ambientes muy controlados y muy artificiales.

Para determinar las relaciones causales entre variables, el procedimiento a seguir por el investigador en una comprobación empírica de un enunciado le obliga a manipular y variar de manera directa la/s variable/s antecedente/s y, aun más, le obliga a hacerlo en todos los niveles en los que se manifiesta de manera significativa. El paso inmediato es el de determinar leyes explicativas o al menos predictivas de las mismas. De hecho, como hemos dicho, ésta es la principal ventaja de esta táctica de investigación: establecer relaciones causales entre variables. Los principales inconvenientes están en la dificultad de controlar todas las variables extrañas que pueden influir en la investigación (que se hace mediante el control experimental expresado en el diseño de la investigación) y en el alto grado de artificialidad que se produce en una situación tan controlada. 2.2.

Correlacional

Hay que recordar, una vez más, que es el enunciado hipotético que se quiere someter a comprobación empírica el que determina la táctica a seguir, de manera que serán las Investigación a través de los cuestionarios

características de la táctica las que nos permitirán adoptarla para un enunciado concreto. Así, la táctica correlacional es muy útil cuando los enunciados a contrastar no permiten al investigador una manipulación directa de las variables sometidas a estudio. Esto determina sus principales características (Arnau, Anguera y Gómez, 1990; Clemente, 1992; León y Montero, 1993; Morales, 1981): •

Se intenta descubrir la posible relación existente entre las variables que interesan en la investigación. Este método nos permite establecer sólo relaciones de covarianza (no causales) entre las variables, ya que las variables que contrastamos no permiten la manipulación directa.

•

El investigador selecciona las variables que le interesan. En general, el investigador selecciona una variable (antecedente, predictora o independiente) para conocer la relación que ejerce sobre otra variable (consecuente, criterio o dependiente). No existe la posibilidad de controlar exhaustivamente las variables que pueden influir en la variable predictora, tal y como se hace en el método experimental.

•

Generalmente se aplica en ambientes más naturales que el experimental, aunque también impone un cierto grado de control.

Este método se ha aplicado mucho en el campo de las Ciencias Sociales, ya que el tipo de hipótesis que se desarrolla en estas ciencias está constituido por variables que el investigador no tiene la posibilidad de alterar en los sujetos (sexo, inteligencia, etc.). La estrategia básica que sigue esta táctica de investigación es la de aprovechar las diferencias y semejanzas existentes entre los sujetos como un sistema para la clasificación de los grupos en las variables de interés. Por ello, es destacable el cuidado que hay que tener a la hora de seleccionar a los sujetos y asignarlos a los grupos (diseño de la investigación). En gran medida, esto va a posibilitar el control no sólo de variables extrañas detectadas por el investigador, sino de todas aquellas de menor importancia que juntas pudieran contaminar los resultados. 2.3.

Observacional

El tercer método que vamos a comentar brevemente es el método observacional. Éste se utiliza cuando el problema estudiado no es objeto de una teoría. Se suele usar mucho en los primeros pasos de la investigación y para obtener información destinada a estudios posteriores. Sus principales características son (Arnau, Anguera y Gómez, 1990; Clemente, 1992; León y Montero, 1993):

Investigación a través de los cuestionarios

•

No existe ni manipulación ni selección de variables por parte del investigador. El investigador juega un papel pasivo, ya que se limita a registrar y describir las variables tal y como ocurren en la situación de investigación. Ello hace que exista un menor grado de sistematización en el proceso de recogida de datos que en tácticas como las dos anteriores.

•

Pretende detectar las regularidades o diferencias o ambas de los fenómenos objeto de estudio.

•

Generalmente

aplica

ambientes

naturales,

sin

ningún

grado

control/artificialidad. Como hemos podido observar, los tres métodos de investigación vienen articulados en función del control que ejerce el investigador sobre la situación investigada. Siguiendo a Arnau, Anguera y Gómez (1990) podemos plasmar gráficamente esta relación en un continuum de naturalidad o control por parte del investigador: M. OBSERVACIONAL

M. CORRELACIONAL

M. EXPERIMENTAL

+ GRADO DE NATURALIDAD DE LA SITUACIÓN DE INVESTIGACIÓN - GRADO DE CONTROL DE LA SITUACIÓN DE INVESTIGACIÓN +

Sirva el cuadro 1.1 como resumen de lo dicho para los distintos métodos de investigación. CUADRO 1.1. Características de las tácticas o métodos de investigación EXPERIMENTAL

CORRELACIONAL OBSERVACIONAL

ARTIFICIALIDAD

ALTA

MEDIA

BAJA

MANIPULACIÓN VARIABLES

DIRECTA

POR SELECCIÓN

NO HAY

TIPO DE RELACIÓN

CAUSAL

COVARIANTE

REGULARIDADES

AMBIENTE

LABORATORIO

SEMI-NATURAL

NATURAL

3. Técnicas Por técnicas entendemos los procedimientos específicos que utiliza una determinada área científica para la obtención de los datos de la investigación. Son procedimientos

Investigación a través de los cuestionarios

de actuación concretos y particulares (Sierra, 1982), relacionados con la táctica de investigación que estemos utilizando en nuestra investigación. Mientras las técnicas tienen un carácter práctico y operativo, los métodos se diferencian de ellas por su carácter más global y de coordinación de las operaciones. Las técnicas se engloban dentro de un método y, a la inversa, un método comporta el uso de diferentes técnicas (Ander-Egg, 1995). Las técnicas de investigación también suelen llamarse técnicas de recogida de datos, nombre que es mucho más acertado porque las circunscribe a una etapa concreta dentro del método o táctica de investigación que se utilice. A pesar de la confusión existente entre técnica y método, provocada en parte por la proliferación de textos que se usan en la enseñanza (con títulos como Métodos de investigación en... cuyos contenidos responden básicamente a técnicas de recogida y análisis de datos), para los autores está clara la diferencia entre ellos. Las técnicas son un elemento del método, en virtud de lo cual se debe ir desechando la actitud, todavía común en demasiados investigadores, de interesarse por problemas de investigación en función de la última de las técnicas aprendidas o dominadas, o de aquellos otros investigadores que sólo confían en, por ejemplo, la encuesta y no quieren saber nada de la observación o experimentación, y al contrario. Ante este problema sería más correcto que el investigador que se enfrenta a un tema se preguntara: ¿qué método debo seguir y qué técnicas de recogida de datos es la apropiada para lo que pretendo? En este sentido, las técnicas se han de considerar como un aspecto del método que hacen posible una recogida de datos acorde con el mismo; de ahí que tanto un experimento como un informe verbal sean considerados por los autores de este texto como técnicas de investigación. En definitiva, se trata de ver las observaciones como un encadenamiento lógico entre campo teórico, métodos y técnicas de investigación. Debido al gran número de áreas que se pueden estudiar dentro del campo de las Ciencias Sociales, ha habido una gran especialización y aumento de las técnicas de investigación que se aplican a cada una de estas áreas. En parte por lo anterior, en parte por la diversidad de puntos de vista de los investigadores, no existe una clasificación que sea universalmente aceptada de las técnicas de investigación en Ciencias Sociales (Visauta, 1989). Por tanto, tenemos técnicas distintas que varían según el grado de simplicidad, según la información que proporcionan, según las formas de utilización, según los datos a recoger, etc. Podemos citar entre otras:

Investigación a través de los cuestionarios

•

La observación.

•

La entrevista.

•

La encuesta.

•

Las historias de vida.

•

Los tests, cuestionarios y escalas.

•

Grupos de discusión.

•

La experimentación.

•

Las medidas psicofisiológicas.

Todas las técnicas son, en definitiva, procedimientos o instrumentos para obtener datos y, por tanto, todas deben tener aseguradas los criterios de calidad de dicha medida (nos referimos a su fiabilidad y validez), por lo que deben estar sometidas a criterios metodológicos. Para terminar, aunque podemos decir que la utilización de una u otra técnica está relacionado con el método de investigación que estemos utilizando en nuestro trabajo, es cierto que existen técnicas que se aplican en los distintos métodos (por ejemplo la técnica de observación podemos aplicarla a los tres métodos) y técnicas que se aplican a un solo método (por ejemplo la experimentación como tal sólo la podemos aplicar si utilizamos el método al que da nombre: el experimental). 4. Elección del método y las técnicas En todos los manuales de metodología encontramos los distintos métodos que se pueden utilizar en la investigación, además de un buen número de técnicas; pero la gran mayoría olvidan indicarnos qué criterios nos pueden guiar a la hora de elegir el método y las técnicas que mejor se adecuen a la investigación que nos interesa realizar. En este contexto no queremos olvidarnos de ello y, por eso, mostramos algunas de las consideraciones que se deben tener en cuenta antes de la elección de un determinado método y de una/s determinada/s técnica/s (Pons, 1993): 1. Para una investigación concreta normalmente no existe un sólo método ni una técnica específica; de hecho, es recomendable emplear a la vez técnicas distintas si es posible y se dispone de los medios necesarios (Sierra, 1982).

Investigación a través de los cuestionarios

2. A priori, ningún método ni técnica puede ser considerado el mejor. Lo que define esta situación a favor de un método u otro, o de una técnica frente a otra, es “depende de”, las características del enunciado que se va a someter a prueba. Ahora podemos entender con conocimiento de causa por qué razón muchos manuales no incluyen este apartado entre sus capítulos: no existen recetas mágicas. Bajo este panorama, que pudiera parecer desolador, cobra especial importancia la labor previa de analizar y comparar los diversos métodos y técnicas teniendo en cuenta sus ventajas e inconvenientes, y siempre comprobando si se pueden ajustar a nuestra investigación. En cualquier caso puede servir de guía atender a una serie de cuestiones que nos pueden dar la clave a la hora de decidirnos por alguno en concreto. Estas cuestiones, entre otras, son las siguientes (Sierra, 1982; Pons, 1993): •

El grado de adecuación a las características del objeto de estudio de nuestra investigación y, más concretamente, a las hipótesis, cuando se trata de un objeto científico.

•

El nivel de rigor y de calidad que nos proporcionarán.

•

La posibilidad de llevarlas a cabo depende de, al menos, los siguientes aspectos: -

La capacitación del personal participante en la investigación.

El acceso a las fuentes de información necesarias.

El tiempo.

Los recursos disponibles.

Los costes: humano, social y económico.

Los aspectos éticos.

Detengámoslos en ellos, aunque sea brevemente. 4.1.

Criterios de selección del método y las técnicas

De igual forma que no existe ni un método ni una técnica mejor que otra, tampoco existe un criterio mejor que otro y ninguno es válido por sí solo (Pons, 1993). En cualquier caso hay que tenerlos en cuenta todos y el investigador deberá decidir cuál de ellos es más importante en su investigación concreta. La exposición que a continuación realizaremos de los criterios no se hace con el ánimo

Investigación a través de los cuestionarios

de proporcionar un recetario para obtener el método y la técnica que necesitamos, más bien se hace con el ánimo de tener una serie de cuestiones para reflexionar y que además puedan condicionar nuestra decisión. 1. El grado de adecuación a las características del objeto de estudio de nuestra investigación. Parece un requisito previo a la elección determinar si el método a utilizar y la/s técnica/s se pueden ajustar a los objetivos y al objeto de estudio de nuestra investigación concreta. 2. El nivel de rigor y de calidad que nos proporcionarán. Podemos decir que el rigor es una característica de toda investigación científica, pero no todos los métodos y no todas las técnicas nos proporcionan igual grado de rigor, Por tanto, es necesario determinar el grado mínimo aceptable teniendo en cuenta que los estándares técnicos elaborados en el ámbito científico son en muchos casos simplemente orientativos (Pons, 1993). Debemos poner en una balanza los beneficios o inconvenientes que pueden derivarse de utilizar un determinado nivel de rigor. En todos los casos, las técnicas deben mostrar suficientes criterios de calidad, en términos de validez, para poder hacer una utilización adecuada de los resultados que se obtendrán en la investigación. 3. La capacitación del personal participante en la investigación. Un aspecto que se descuida en muchas ocasiones es la formación del personal que interviene en la investigación. No todo el mundo está capacitado para poner en práctica un determinado método de investigación o técnica y no todas las técnicas o métodos requieren un mismo grado de formación. Este tema es una cuestión de vital importancia en la investigación mediante la técnica de encuestas. 4. El acceso a las fuentes de información necesarias. El acceso a la información es muy importante. A veces nos hemos decidido por un método y justo cuando aplicamos la técnica para la recogida de datos es cuando caemos en la cuenta de que es prácticamente imposible el acceso a la información. Debemos evaluar este aspecto antes de tomar una decisión. 5. El tiempo. En la sociedad actual el tiempo cobra cada vez más importancia y no lo es menos en este contexto. Normalmente, las investigaciones están sujetas a plazos que cumplir, por tanto tendremos que descartar aquellos métodos o técnicas

Investigación a través de los cuestionarios

que superen en su aplicación el tiempo que tengamos para la realización de la investigación. 6. Los recursos disponibles. El presupuesto económico, materiales y aparatos, personal, etc., son cuestiones que nos determinan la elección de un método y/o técnica. En cualquier caso siempre tenderemos a maximizar los beneficios con los mínimos recursos, recordando que no debemos escatimar estos recursos si los tenemos y si son imprescindibles para la realización de la investigación. A veces nos quejamos de la falta de ellos y luego nos sobran. 7. Los costes: humano, social y económico. No sólo tenemos que contar con los costes económicos que generará la utilización de un método u otro o de una técnica u otra, sino que también debemos atender al esfuerzo que deba realizar el equipo investigador, las molestias que se puedan causar a la población objeto de la investigación, etc. Debemos conocer si los costes merecen la pena en función de las necesidades, dimensiones y repercusiones que puede tener la investigación (Pons, 1993). 8. Los aspectos éticos. Hay que tener muy en cuenta aquellos métodos y/o técnicas que planteen problemas éticos en su aplicación. 5. Las técnicas en sí mismas Cualquier método o táctica de investigación necesita, en última instancia, reducir constructos, conceptos, ideas o hipótesis a datos. En este proceso de operativización entran de lleno las técnicas. Estas técnicas van a estar muy relacionadas con todo aquello que tenga que ver con instrumentos y procedimientos para transformar hechos concretos en datos significativos. Lo más genérico con lo que se puede caracterizar a las técnicas es con los procedimientos de medida. De manera resumida, se trata de unas operaciones complejas consistentes en: a) obtener, mediante su aplicación, una medida de una característica observable, que la reduce a una descripción numérica y transforma la característica en datos; b) controlar las variables que, por acción directa sobre la característica observada o por acción del investigador, puedan confundir el valor de dicha característica; y c) interpretar, a la luz de las teorías, el significado del dato. En este sentido, las técnicas traducen la realidad caótica a datos reproducibles y objetivos. Estos datos se filtran a partir de unas concepciones teóricas y unos instrumentos de recogida de información. Sin embargo, por técnica, en muchas

Investigación a través de los cuestionarios

ocasiones sólo se entiende el modo en cómo se usa un instrumento para obtener un dato, sin deseo de interpretarlo. En este otro sentido, los datos que se obtienen con ella son mejores o peores en función de la potencia de la técnica. La técnica por sí misma niega toda verdad definitiva. Todo lo conseguido por ella y, en consecuencia por el sistema científico contemporáneo, es inseguro. A pesar de esto, la técnica pretende construir una segunda naturaleza, y de ahí la contradicción entre conocimiento científico y saber (conocimiento). El principio de manipulación de la naturaleza, a través del método hipotético-deductivo, impone la primacía de la técnica y la convierte por sí misma en la auténtica herramienta de la creación científica. Este principio de manipulación de la realidad es el que ha ido produciendo la primacía o solapamiento de la técnica (como productora de datos e información) sobre la ciencia (como productora de un tipo de conocimiento). La técnica se convierte, por sí misma, en herramienta de creación de conocimientos. El citado científico “medio” contemporáneo, se ocupa de temas muy particulares en espacios muy definidos de investigación. Esto le hace perder el sentido global de la realidad y, por ello, se aleja del proceso general del conocimiento. Muchas de sus actuaciones se concretan en el uso de técnicas en sí mismas y sin conexión con temas de estudio determinados. Si a esto se le añade que participa del pacto de la operativización de los fenómenos y de la aplicación y utilización del conocimiento científico -muy propio de la ciencia moderna-, la técnica y la ciencia se han confundido hasta hacerse, en algunos ambientes, sinónimos. Dicho todo esto, el texto que sigue está dedicado a una técnica de uso cada vez más frecuente: la encuesta. Que ésta sea utilizada en el contexto de la investigación científica (motivada teóricamente) incluida en la fase de recogida de datos de una determinada táctica, o bien sea utilizada por el simple hecho de obtener información (saber) desconectado de cualquier teoría científica, es responsabilidad de cada investigador. Lo que no ponen en duda los autores es que esta técnica se muestra muy potente en ambos ámbitos.

Investigación a través de los cuestionarios

II.-

LA ENCUESTA COMO TÉCNICA DE INVESTIGACIÓN SOCIAL2 Andrés Arias Astray Baltasar Fernández Ramírez

Introducción Se ha descrito el proceso general para acceder a un conocimiento metódico, riguroso, crítico, idealmente objetivo y potencialmente útil de la realidad social. De igual forma, y al enumerar los múltiples y variados propósitos a los que dicho proceso pretende servir, la pluralidad de contextos en los que se lleva a cabo y la bondad diferencial de las estrategias y técnicas que tiene a su disposición, han mostrado el carácter no algorítmico y, por lo tanto, las dificultades y el decisionismo que lo caracterizan. Ahora, y concretando ya un poco más, se profundizará en el análisis de la estrategia de investigación: la encuesta. Estrategia que, sin duda, participa de las características y rasgos que se acaban de enumerar. Para ello, y en primer lugar, se realizará un breve recorrido a lo largo de la historia de la investigación social, al objeto de constatar que la encuesta, tal y como se conoce hoy en día, y a pesar de sus insignes antecedentes, constituye una técnica de investigación relativamente reciente, pues apenas cuenta con un siglo de antigüedad. En segundo lugar se propondrá una definición de encuesta e, intentando no confundir la parte con el todo, se distinguirá del cuestionario, la entrevista y de otras técnicas y procedimientos de los que hace uso. Del mismo modo, se intentará que no se identifique la investigación mediante encuestas con un propósito determinado de investigación, esto es, exploratorio, descriptivo o explicativo. A continuación, y en tercer lugar, se indicarán los principales tipos de encuestas existentes, describiendo, por su importancia, las características, las ventajas y los inconvenientes de las encuestas personales, telefónicas y por correo. Para terminar se ofrecerá una serie de observaciones sobre los aspectos que han de tenerse en cuenta en la planificación y elaboración de un proyecto de investigación mediante encuestas.

Rojas Tejada, A. et al. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Madrid. Síntesis. 2

Investigación a través de los cuestionarios

Pero antes de comenzar, el lector ha de disculpar que, como ya habrá observado, se utilicen ciertas perífrasis para hacer referencia a términos tan familiares como el de “ciencia social” o “conocimiento científico social”. Esto, sin duda, dificulta la lectura del texto, pero permite a quien lo escribe seguir manteniendo su escepticismo ante los rígidos criterios de demarcación entre ciencia y no ciencia -con los que a algunos, por cierto, todavía se les “llena la boca”-, así como defender, de esta forma, que no existen normas universales ni eternas sobre cuál es la manera adecuada de llevar a cabo una investigación y, paralelamente, afirmar que a la hora de conocer la realidad social no “todo vale”. 1. Historia de las encuestas en la investigación social La encuesta, tal y como hoy se define y realiza, constituye una estrategia de investigación relativamente reciente. En este sentido, existe un acuerdo generalizado a la hora de situar su nacimiento y rápida expansión en los años comprendidos entre las dos guerras mundiales (Stoezel y Girard, 1973; Kerlinger, 1987; García Ferrando, 1992; Wert, 1996) en los que destacaron las labores realizadas, entre otros, por Gallup (1935-1971), Crossley y Roper, Lazarsfeld et al. (1944) y Stouffer y otros (1949). No podría ser de otra forma, pues, por una parte, los desarrollos teórico-metodológicos que justifican, conforman y dan sentido a las encuestas y los procedimientos y técnicas de los que hacen uso, no se encontraban disponibles, en su conjunto, hasta esos momentos. Por otra parte, lo que ofrecían y permitían se ajustaba de manera muy satisfactoria a las imperiosas necesidades del momento. Necesidades que no sólo eran de carácter bélico, sino también fruto de los importantes cambios políticos y comerciales que estaban ocurriendo en las sociedades occidentales. Pero con anterioridad a este período, la historia de la investigación social está plagada de innumerables “historias” sobre los antecedentes de las encuestas. “Historias” que tienen que ver, en general, con distintos esfuerzos para obtener un conocimiento preciso de la realidad social, al objeto de anticipar y establecer las medidas más apropiadas para ajustarse o mejorar las condiciones sociales que la conforman (Cfr. los artículos de H. C. Selvin, B. Lécuyer y A. R. Oberschall, M. G. Kendall, y W. E. Deming, recogidos en la edición de 1974 de la obra Enciclopedia Internacional de las Ciencias Sociales). Así, por ejemplo, Stoezel y Girard (1973: 56 y ss.), haciendo ver que el “espíritu” de la

Investigación a través de los cuestionarios

investigación actual mediante encuestas ya se encontraba, desde antiguo, en el “ánimo” de muchos gobernantes, recuerdan como en Las mil y una noches el califa Harún-al-Rashid recorre, disfrazado, alguno de los zocos de Bagdag con la intención de averiguar el sentir general de su pueblo. La misma idea de fondo, esto es, que se puede acceder al conocimiento de la opinión colectiva sirviéndose de una serie de informantes bien escogidos, ha guiado las acciones de otros muchos mandatarios. En ocasiones, y debido a lo que hoy se consideraría una selección inadecuada de la muestra, el resultado no era el más satisfactorio. Este es el caso, por ejemplo, de Luis XIV, quien, desoyendo la correcta impresión de sus ministros y creyendo mejor informadas a sus princesas sobre el parecer de los franceses, decide aceptar para su nieto, el duque de Angevia, la corona de España. En otras circunstancias, sin embargo, el éxito acompaña a estas prácticas rudimentarias de investigación social y política. Una muestra de ello se encuentra en el encargo de Napoleón al conde Lavalette: Doce personas distinguidas de opiniones diferentes: jacobinos, realistas, republicanos e imperiales, que recibían mil francos mensuales, le llevaban cada mes (a Lavalette) relaciones sobre el estado de la opinión pública relativas a los actos de Gobierno y al estado de cosas en Francia. Lavalette recibía estas relaciones selladas y me las traía. Después de leerlas las quemaba. Mis ministros y mis amigos ignoraban que yo recibía estas comunicaciones tan importantes para mí (del Memorial de Santa Elena, citado en Stoezel y Girard, 1973: 57).

Resulta curioso, pero en este párrafo ya se encuentran reflejadas ciertas características que no son difíciles de identificar en alguna de las encuestas que se realizan hoy en día. Los investigadores, en este caso Napoleón y Lavalette, hacían uso de ayudantes a la hora de recoger la información que precisaban. El trabajo de estos últimos estaba remunerado y, todo hay que decirlo, mucho mejor que en la actualidad. Por otra parte, el resultado de la investigación se mantenía en secreto, cosa que sigue ocurriendo con la mayoría de los resultados de las encuestas (Wert, 1996). Sin embargo, y a pesar de la capacidad predictiva y de la utilidad de muchas de estas prácticas intuitivas y asistemáticas, aún restaba mucho camino por recorrer para que los investigadores sociales pudiesen ofrecer, como mostraron George Gallup, Archival Crossley y Elmo Roper, un procedimiento de análisis y anticipación a los fenómenos sociales tan potente, fiable y válido como el de las encuestas actuales. Pero dicho camino no fue, ni mucho menos, unidireccional, pues en él habrían de con-

Investigación a través de los cuestionarios

fluir aportaciones de las más diversas procedencias. De éstas, y debido a las limitaciones de espacio, en este trabajo sólo es posible mencionar alguna de las más importantes. 1.1

La aritmética política

En un principio, no parece descabellado defender que la investigación social en general y las encuestas en particular son consecuencia claramente representativa de uno de los dictums más importantes de la historia social de la modernidad: “el conocer para prever y el prever para poder”. Lema que explicita Augusto Comte, pero que tiene en Bacon uno de sus primeros valedores. De esta forma, y siguiendo a Lécuyer y Oberschall (1974), puede decirse que la idea de que es posible acceder al conocimiento de la realidad social mediante el análisis cuantitativo de los hechos que la conforman tiene su primera e importante defensa en la Inglaterra de la segunda mitad del siglo XVII. La obra de Sir Francis Bacon, unida a la convicción, dominante en aquel momento, de que un buen gobierno debía basarse en una información precisa y al convencimiento de que la población era la primera fuente de poder nacional, crean el clima adecuado para el desarrollo de importantes contribuciones metodológicas. Destaca, en este sentido, el trabajo que realizan los que se dedican a lo que en aquel entonces se conocía con el nombre de “Aritmética Política”. Sin formar una escuela organizada, y con una procedencia tan diversa como la del comerciante de mercería John Graunt, la del médico, marinero y, entre otras cosas, inspector de la propiedad William Petty, o la del famoso astrónomo Edmund Halley, sientan las bases y el patrón de lo que será el trabajo de muchos demógrafos y estudiosos sociales posteriores. Graunt, que fue el primero en razonar de manera estadística sobre material demográfico, publicó, en una fecha tan temprana como la de 1662, su obra Natural and political observations made upon the bills of mortality. En la misma, y sirviéndose de ciertos registros parroquiales (bautizos y defunciones), estimaba, entre otras cosas, diversas tasas de natalidad y mortalidad y el total de la población londinense. Petty, gran amigo de Graunt, fue el primero en acuñar el término “Aritmética política”. Escribió una obra titulada The political anatomy of Irland en la que desarrollaba una teoría del gobierno basándose en sus experiencias personales y en la recogida de datos empíricos concretos. Halley, por su parte, editó, mejorándolas, las “tablas

Investigación a través de los cuestionarios

vitales” de las que hacía uso Graunt, en las que se especificaba la probabilidad de supervivencia de un individuo a una cierta edad. Este tipo de trabajos continuó realizándose con posterioridad, apoyado de manera muy importante por las compañías aseguradoras, las cuales, todo hay que decirlo, han jugado un papel muy destacado en el desarrollo de ciertos tipos de investigación social. Cabe citar los trabajos que realizó Gregory King en Inglaterra y que fueron publicados en su obra Natural and Political Observations upon the state and condition of England (1916). Una obra en la que además de estimar el número de familias del país, calculaba la media de ingresos familiares y, con ello, ofrecía un indicador de la manera en la que los individuos participaban del bienestar nacional. En Francia destacan las investigaciones de Colbert y del Marqués Sébastien le Prestre. El primero de ellos, controlador general de finanzas francés desde 1661 hasta su muerte en 1683, realizó una serie de estudios sobre el estado general del Reino y, bajo la influencia de Graunt, sobre su población. Así mismo, realizó trabajos más específicos sobre las manufacturas francesas. Por su parte, Vauban, comisionado general de las fortificaciones francesas, además de realizar diversos trabajos de investigación, recomendaba que, a diferencia de como se venía haciendo, en la construcción de los censos se utilizase al individuo como unidad de análisis y no a la familia. Para finalizar este breve comentario sobre la aritmética política, es preciso destacar que a partir de 1697, bajo el reinado del mencionado Luis XIV, el duque de Beauvilliers, gobernador del nieto del rey, el duque de Burgundy, promovió la realización de lo que se conoce como la “Gran Encuesta”, con el objeto de demostrar a su superior la inadecuada política bélica y fiscal de su abuelo. Se realizaron 32 “memorias”, cada una de las cuales se basaba en los datos recogidos a través de un cuestionario que se enviaba a los intendentes de cada distrito. Estos últimos, además de elaborar un censo, ofrecían información sobre el territorio, la naturaleza de la población, la reputación de los religiosos y de los nobes, y una serie de cuestiones relativas a la situación económica del distrito. 1.2

La estadística moral

Con unos orígenes más tardíos, y ya en el siglo XIX, otra gran tradición, de notable influencia en la historia antecedente a la investigación mediante encuestas, es la que se conoce con el nombre de “Estadística Moral”. A pesar de que se suele identificar al

Investigación a través de los cuestionarios

francés Le Play y al belga Adolphe Quetelet como sus primeros y grandes defensores, ya con anterioridad André de Guerry de Champneuf -director del Departamento de Justicia Criminal del Ministerio de Justicia francés desde 1821 hasta 1835-, Jean Baptiste Fourier y André de Chabrol de Crousol -con sus Reserches statistiques sur la ville de Paris es le département de la Seine-, el alemán Joham Peter Süssmilch -al constatar que las tasas de algunos comportamientos voluntarios, como por ejemplo las del suicidio, mostraban cierta constancia en el tiempo- y el médico francés ParentDuchalet -con sus estudios sobre salud pública-, habían contribuido al estudio, medición y descripción de las “cualidades morales” y del bienestar social, al prestar atención a temas tales como el crimen, el suicidio, la ilegitimidad, la prostitución y fenómenos similares. Frédéric Leplay (1881: 3), que se había formado como ingeniero de minas, incorpora el espíritu empirista de dicha profesión a las investigaciones sociales que realiza sobre los obreros europeos: Desde tiempo había reflexionado sobre un punto esencial, a saber, que, tanto en la ciencia de las sociedades como en la de los metales, sólo me consideraré en posesión de la verdad cuando mi convicción pueda apoyarse en la observación de los hechos.

Para tal fin desarrolla nuevos procedimientos de recogida y análisis de datos, tanto cuantitativos como cualitativos, que se concretan en su conocido Método Monográfico de investigación. Éste deriva del tipo de informes sistemáticos que los estudiantes de la Escuela de Minas realizaban en sus estudios del terreno, y en los que tenían que destacar aquellos elementos que podían ser contados y tabulados. De esta forma, el contacto directo con los datos y la utilización de una serie de principios selectivos guiados teóricamente para la comparación y presentación de los mismos, constituyen, junto con la utilización de algunas estrategias rudimentarias de muestreo y de ciertos indicadores e índices de tipo económico, las características principales de la monografía de Leplay. Sin embargo, y debido, entre otros factores, a sus posiciones políticas, religiosas y teóricas, la repercusión de la escuela de Leplay en el desarrollo posterior de las ciencias sociales y, en concreto, de la sociología francesa, no ha sido demasiado importante, viéndose ensombrecida, sobre todo, por la centralidad de la figura de Durkheim. Entre las aportaciones de Quetelet, son dignas de mención:

Investigación a través de los cuestionarios

a) La idea de que la materia viva manifiesta distribuciones de frecuencia con patrones reconocibles y similares a las que habían estudiado, a finales del siglo XVIII, Laplace y Gauss; b) La utilización de tablas multivariadas para explorar relaciones entre las tasas de crímenes o de matrimonios y una serie de factores sociodemográficos como la edad o el sexo; c) La aplicación del cálculo de probabilidades para explicar la constancia en el tiempo de las tasas de determinados fenómenos; y d) La ayuda que prestó al establecimiento de la Sociedad Estadística de Londres y a la organización de varios congresos internacionales. 1.3 . El movimiento de Encuestas y Monografías Sociales En los años treinta del siglo XIX se fundó un gran número de Sociedades Estadísticas a lo largo de Inglaterra. Uno de sus principales objetivos era orientar, basándose en el estudio objetivo y cuantitativo de la sociedad, las reformas y mejoras necesarias para solventar los principales problemas sociales del momento. Para ello, y preocupándose por temas tales como la salud, la educación, las prácticas religiosas y las condiciones de vida de las clases trabajadoras, financiaban la realización de laboriosas encuestas. Los datos obtenidos solían presentarse en las reuniones anuales de la Asociación Estadística Británica y con frecuencia se publicaban en el Journal of the Royal Statistical Society. Muchas de estas encuestas utilizaban entrevistadores que, cuestionario en la mano, recorrían puerta a puerta los lugares de los cuales se requería información. El movimiento de las encuestas y monografías sociales, del que los trabajos que se acaban de mencionar constituyen tan sólo un ejemplo, se extendió con rapidez por el resto de Europa y los Estados Unidos. Sin lugar a dudas, es imposible recoger aquí, aunque sea mínimamente, los trabajos más importantes que se realizaron y los autores que con su esfuerzo pretendían aportar información y contribuir a la mejora de los problemas sociales asociados con la creciente industrialización y urbanización, perfilando y mejorando, a la par, los procedimientos e instrumentos de investigación social. No obstante, a partir de 1850 se produce un parón importante en la actividad de las sociedades estadísticas y, con ello, al menos en Inglaterra, una ruptura en la tradición Investigación a través de los cuestionarios

investigadora que conduce a la encuesta actual. La razón principal estuvo asociada, sin duda, al cambio en el clima intelectual propiciado por el desarrollo de las tesis evolucionistas y por un pujante darwinismo social. La raza y la heredabilidad se proponían como categorías fundamentales para el análisis sociológico. De esta forma, el espíritu ambientalista y de reforma social que había primado hasta ese momento y que orientaba, en muchos casos, mejoras sustanciales de las condiciones de existencia, se desvanece. Si en los años treinta lo característico entre las élites intelectuales era pertenecer a una sociedad estadística, a partir de los cincuenta serán las sociedades antropológicas, etnográficas y eugenésicas las que cuenten con un mayor número de afiliados. Pero con el cambio de siglo se constata un renovado interés por los estudios sociales de corte ambientalista. Un ejemplo de ello lo constituye Charles Booth. Sus trabajos, así como los realizados por sus colaboradores Beatrice y Sidney Webb en los primeros años de este siglo, forman parte de una tradición de investigación mediante encuestas que, en Inglaterra, se extiende hasta nuestros días. Booth, preocupado por la afirmación de los socialistas de que la tercera parte de la población londinense vivía en la pobreza, financia y realiza una encuesta dirigida a los obreros del East End de Londres con la que pretendía descubrir las causas de dicho problema. La calidad metodológica de sus trabajos, todo hay que decirlo, dejaba bastante que desear. Habría mejorado, sin duda, si el autor hubiese estado al tanto de los avances estadísticos que en aquel entonces estaban desarrollando Galton, Edgeweorth, Pearson y Yule. Sin embargo, no fue hasta los años veinte de nuestro siglo cuando los investigadores sociales comenzaron a hacer uso de los mismos, influidos por los trabajos que se venían realizando en campos tales como la biología, la agricultura o la psicología. En el mismo período en el que trabaja Booth, pero al otro lado del Estrecho, Emilie Durkheim ofrece, basándose en los datos acumulados por la estadística moral, una explicación sociológica del suicidio. Tampoco en su caso se hace uso de esas nuevas estrategias de muestreo. No es de extrañar, pues el muestreo aleatorio y el muestreo por cuotas no serían admitidos como estrategias de investigación "verdaderamente científicas" por el Instituto Internacional de Estadística hasta 1903, gracias al tesón y al esfuerzo del estadístico noruego A. N. Kiaer.

Investigación a través de los cuestionarios

1.4

Marx y Weber

Rompiendo un poco el hilo conductor de esta exposición, habría que mencionar que otras figuras tan destacadas en la fundación de las modernas ciencias sociales, como Marx y Weber, también tienen su lugar en la historia de la investigación mediante encuestas. El primero de ellos realizó, aunque sin concluirla, una encuesta obrera que pretendía orientar ciertos cambios sociales. Weber, por su parte, participó en una investigación que tenía como objetivo estudiar las condiciones de trabajo en el medio rural. Con posterioridad, volverá a utilizar la encuesta en otras dos investigaciones. La primera sobre el mismo tema. En la segunda se preocupa por el estudio de las actitudes de los trabajadores industriales. En este último trabajo ya se observa la mayoría de los rasgos de la investigación mediante encuestas actual: estudio de la opinión y/o actitud, selección representativa de los sujetos que participan y elaboración cuidadosa del cuestionario que guía la recogida de la información. Pero el caso de Weber es una excepción. La mayoría de los trabajos que se han reseñado hasta el momento, si bien guardan ciertas similitudes con las encuestas actuales, difieren de las mismas en una serie de aspectos importantes. En muchos casos se trata de trabajos, que estudian el total de la población. En otros, si bien se utilizan muestras de individuos, éstas no reúnen, salvo excepciones, un carácter representativo. Por último, se dedican, generalmente, a recoger información sobre características objetivas de la realidad social y no datos sobre opiniones y/o actitudes. Y es que a estos breves retazos de la historia de la investigación mediante encuestas les resta, todavía, tener en cuenta otras dos importantes líneas de trabajo relacionadas, concretamente, con el estudio de la opinión pública. La primera tiene que ver con el trabajo metodológico y técnico realizado en el campo de las actitudes y su medida. La segunda está representada por las “votaciones particulares” que desde principios del siglo XIX promovían algunos periódicos con el fin de anticipar resultados electorales. 1.5. El estudio de las actitudes Poco después de que Thomas y Zaniecki definieran la Psicología Social como la disciplina que se encarga del estudio de las actitudes, Thurstone en 1928 y Likert en 1932 publicaban sendos artículos en los que presentaban técnicas muy precisas y elaboradas a partir de las cuales se demostraba que era posible su medida. Sus escalas y las que en años posteriores desarrollaron autores como Guttman (1950) y

Investigación a través de los cuestionarios

Osgood, Succi y Tannembaum (1957), entre otros, representan, sin duda, una de las técnicas que configuran el arsenal metodológico y técnico con el que cuentan los investigadores sociales cuando planifican sus encuestas. 1.6. Las votaciones particulares Las votaciones particulares constituyen uno de los antecedentes más importantes de las encuestas electorales y, a la par, por su fracaso relativo ante las mismas, el detonante de su éxito y popularidad. Las primeras votaciones particulares datan de 1824, tuvieron un carácter local y fueron realizadas en los Estados Unidos por los diarios Harrisburg Pensylvanian y Raleigh Star. Lo que se buscaba mediante estas estrategias era realizar una especie de “simulacro” electoral. Para ello se utilizaban diversos procedimientos: desde papeletas recortables que los subscriptores rellenaban con el nombre del candidato al que iban a votar y enviaban a la redacción del periódico, pasando por la recolección de votos situando urnas en las calles más concurridas de las ciudades, hasta la realización de encuestas por correo o personales, pero sin una selección representativa de los encuestados. A partir de 1912 adquieren gran popularidad cuando algunas revistas como The Farm Journal las realizan con carácter nacional. 1.7 . Gallup, Roper y Crossley Desde 1916 las votaciones particulares más famosas fueron las de la revista Literary Digest, que predijo con éxito los resultados electorales hasta 1936. Este es, como ya se ha referido, un momento clave para la historia de la investigación mediante encuestas. Lo cierto es que la Literary Digest, después de gastarse una gran suma de dinero en enviar 10 millones de cuestionarios por correo y en procesar las repuestas de los 2 millones de personas que los contestaron, fracasó de forma estrepitosa al anticipar, erróneamente, una victoria aplastante del candidato del partido republicano. En esta misma fecha, George Gallup, Elmo Roper y Archival Crossley, tres recién llegados al campo de los sondeos políticos, de manera independiente y utilizando las respuestas de muestras que rondaban las 4.000 y 5.000 personas, predijeron, de manera adecuada, que Eleanor Roostvelt sería el futuro presidente. De esta forma ponían en evidencia las debilidades inherentes de las votaciones particulares, esto es, su carácter sesgado y la falta de representatividad de los datos que recogían. Hay que recordar que la “base de datos” que utilizó el Literary Digest para remitir sus cuestionarios

Investigación a través de los cuestionarios

estaba conformada por personas que aparecían en listados telefónicos o que eran propietarias de un automóvil. Aspecto éste que, sin duda, “covariaba” con una tendencia de voto muy concreta, esto es, conservadora. Sin embargo, Gallup, Crossley y Roper, seleccionaron de manera muy cuidadosa sus pequeñas muestras, asignando cuotas específicas de hombres y mujeres para sus entrevistas, teniendo cuidado, a la par, de que entre las mismas estuviesen representados los distintos rangos de edad y niveles económicos. Esta forma de trabajo ya había demostrado su eficacia en el campo de los estudios de mercado, pero su aceptación y uso generalizado no se produjo hasta que se aplicó a la predicción de los resultados electorales. A partir de entonces, la investigación mediante encuestas muestrales comienza a generalizarse. Se fundan, primero en los Estados Unidos y, poco después, en toda Europa, un número considerable de Instituciones públicas y empresas privadas que se sirven de las encuestas para el estudio de los más diversos temas. Los departamentos universitarios, que hasta ese momento no habían prestado atención ni a los estudios de mercado ni a los de opinión pública, comienzan a interesarse, desde entonces, por el tema. Destaca, en este sentido, Paul Lazarsferld (Lazarsferld, Barelson, Gandet, 1944), fundador del Instituto de Investigación Social Aplicada de la Universidad de Columbia y figura clave en el desarrollo de las bases teóricas y metodológicas de la investigación social mediante encuestas. La Segunda Guerra Mundial supuso un nuevo aldabonazo en el desarrollo técnico de las encuestas y, de igual modo, en la reafirmación de su utilidad. Los estudios sobre la moral de la tropa (Stouffer y otros, 1949) y sobre la eficacia de la persuasión bélica en las actitudes de la población fueron los más sobresalientes. Desde ese momento, y a pesar del gran desarrollo conseguido, la historia de la investigación mediante encuestas no ha sido un camino de rosas. La oposición de muchos gobiernos y políticos a la realización de determinados tipos de encuestas, en concreto las pre-electorales, y los tropiezos predictivos que se han constatado en algunos momentos son buena prueba de ello. Sin embargo, éstas ya son otras “historias”, por lo que se remite al lector interesado a la literatura existente sobre el tema (por ejemplo Noelle-Neumann, 1986; Wert, 1996). 2. ¿Qué son las encuestas? Alguna de las “historias” que se han ofrecido en el epígrafe anterior habrá servido, sin

Investigación a través de los cuestionarios

duda, para que el lector haya desarrollado -al menos de manera implícita, y si no lo había hecho con anterioridad- su propia definición sobre las encuestas. En la misma, habrá incluido, ordenándolas de una forma u otra, referencias a un conjunto de técnicas adecuadas de muestreo, a la elaboración y/o realización de cuestionarios y/o entrevistas de diverso tipo, cuidadosamente elaborados, para indagar, entre otras cosas, los intereses, preferencias o intenciones de los ciudadanos, al objeto de describir sus características o para predecir su comportamiento futuro. No obstante, se hace precisa una mayor clarificación y una serie de distinciones para ofrecer, como decíamos al principio de este capítulo, una definición adecuada de la encuesta que no confunda la parte con el todo y en la que su función no se restrinja a meras tareas descriptivas. 2.1

La encuesta y las técnicas de investigación

Para ello, y en primer lugar, es necesario recordar la distinción existente entre métodos y técnicas de investigación. Los métodos de investigación (por ejemplo el experimental, el correlacional) son las estrategias generales del trabajo científico. Por su parte, las técnicas de investigación (por ejemplo la encuesta) son los procedimientos específicos que se utilizan durante el proceso de investigación para la recogida y elaboración de los datos. Para entender mejor esta distinción la siguiente comparación es bastante útil. Un viaje desde Almería hasta Barcelona puede realizarse mediante tres procedimientos o “métodos” generales: por tierra, mar o aire. Sin embargo, para viajar por tierra se puede hacer uso de diferentes “técnicas” de automoción: el autobús, el tren o el coche (otros ejemplos similares a éste pueden encontrarse en Manstead y Semin, 1988, y en Robson, 1993). Por lo tanto, es necesario tener claro que la encuesta es una técnica de investigación. Una técnica que hace uso, según los casos y la conveniencia, de un amplio conjunto de procedimientos e instrumentos con los que no se debe identificar ni confundir y que no constituyen los criterios a partir de los cuales se la puede distinguir de otras técnicas de investigación social. Así, lo fundamental del estudio de caso, y lo que lo diferencia de la encuesta y del experimento, es que centra su atención en la recogida de información precisa y detallada sobre un “caso único”, sea este un individuo, una situación, un proceso o un

Investigación a través de los cuestionarios

pequeño número de acontecimientos relacionados. Por su parte, el experimento y la encuesta se distinguen entre sí por la existencia o no de ciertas manipulaciones hechas por los investigadores en la situación objeto de estudio. En el experimento se observan y miden los efectos que produce la manipulación de una o más variables (independientes) sobre otra u otras variables (dependientes) intentando que el resto de los factores que puedan mediar las relaciones que se exploraran estén controlados. En las encuestas no se realiza tal intervención por parte de los investigadores, cuya función consiste, principalmente, en recoger un conjunto de datos (variables dependientes) de un grupo de personas y en estudiar sus relaciones (método correlacional). Para ello se utilizarán diversas técnicas o instrumentos. En la mayoría de los casos serán cuestionarios que, o bien se envían por correo a los encuestados, o sirven como guión para una entrevista personal o telefónica. 2.2

La encuesta: una técnica para explorar, describir y explicar la realidad social

Otro error en el que se incurre con frecuencia es el de identificar las distintas técnicas de investigación con diferentes niveles de análisis de la realidad social, ordenándolos, de esta forma, según su potencia analítica. Al estudio de caso le correspondería un nivel de análisis exploratorio, a la encuesta descriptiva y al experimento explicativo. Sin embargo, el nivel de análisis de cualquier investigación social no viene determinado por las técnicas que utiliza, sino por el tipo de preguntas que plantea. En este sentido, y al igual que ocurre, por ejemplo, con el estudio de caso (véase Yin, 1994), es necesario recordar que, gracias al reciente desarrollo de una serie de técnicas estadísticas de análisis multivariado y a la posibilidad práctica de su aplicación a través del ordenador, la encuesta se puede utilizar no sólo para realizar investigaciones de tipo exploratorio o descriptivo, sino también para analizar y explicar las relaciones existentes entre diferentes y múltiples variables y fenómenos sociales (Marsh, 1982; De Vaus, 1993). Por lo tanto, y mediante la elaboración y realización adecuada de una encuesta, un investigador social puede llegar a responder preguntas sobre el qué, el cuándo, el cómo, el quién y también el porqué de la realidad en la que se ve inserto.

Investigación a través de los cuestionarios

2.3

Propuesta de una definición de encuesta

Con las distinciones anteriores en mente, tan sólo resta ofrecer una definición de encuesta que se ajuste a las precisiones que se acaban de realizar y que aporte, además, información adecuada sobre el resto de los rasgos que caracterizan y distinguen a esta técnica de investigación. La que aquí se adopta, inspirada en la que recientemente ha ofrecido García Ferrando (1992: 141) es la siguiente: La encuesta es una técnica que utiliza un conjunto de procedimientos estandarizados de investigación mediante los cuales se recogen y analizan una serie de datos de una muestra de casos representativa de una población o universo más amplio, del que se pretende explorar, describir, predecir y/o explicar una serie de características.

Si se lee con detenimiento la definición anterior se verá que las dos condiciones que se han comentado hasta el momento se recogen con claridad. Esto es, por una parte se distingue la encuesta de los procedimientos de los que hace uso y, por otra, no se limita su finalidad a la exploración o descripción de los fenómenos objeto de estudio. Así mismo, y a diferencia de García Ferrando, se opta, como hace por ejemplo De Vaus (1993), por no circunscribir las unidades de análisis de las encuestas a los seres humanos, puesto que, si bien son las más frecuentes, la encuesta también puede ser utilizada para realizar investigaciones sobre otros aspectos de la realidad como, por ejemplo, el estado de las obras de arte de un museo o la situación del parque móvil de la policía. Otra de las características centrales de las encuestas es que, a diferencia de los censos, se realizan sobre muestras o partes de la población objeto de estudio. Estas muestras tienen que ser representativas y no sesgadas, esto es, deben poseer, de manera ideal, la misma proporción de casos con características diferentes que se observen en la población. Para satisfacer estas condiciones se han desarrollado diferentes estrategias de muestreo, siendo las más utilizadas la de rutas aleatorias y la de cuotas. 3. Tipos de encuestas En general, suelen distinguirse tres tipos principales de encuestas en función de la forma en la que se administran las técnicas que utilizan para la recogida de datos: la encuesta personal o cara a cara, la encuesta por correo y la encuesta telefónica. A continuación se describen, de forma concisa, las características principales de cada

Investigación a través de los cuestionarios

una de ellas y los aspectos más importantes a tener en cuenta en su selección; a la par que se resumen, al final del texto en los cuadros 2.2 y 2.3, sus principales ventajas e inconvenientes. No obstante, es importante indicar que en otros trabajos como los de Ferber (1980) y Visauta (1989) se clasifican los tipos de encuesta en función de otros criterios, como son, por ejemplo, la población a la que se dirigen (adultos, profesionales de la salud, etc.), la clase de datos que pretenden recoger (actitudes, comportamientos, etc.). El lector interesado en un estudio en profundidad de los diferentes tipos de encuesta puede consultar, entre otros, los trabajos de Frey (1983), Lavrakas (1987) y Bosch y Torrente (1993). 3.1

La encuesta personal

Este tipo de encuesta es la que se utiliza con mayor frecuencia. Implica la participación de uno o más entrevistadores que plantean una serie de cuestiones a los sujetos de investigación o entrevistados. En la mayoría de los casos el entrevistador hace uso de un guión de entrevista y/o cuestionario en el que se incluyen las preguntas que ha de formular. Ha de intentar plantearlas de la misma forma y en el mismo orden para que todas las personas entrevistadas se enfrenten a una situación similar y, de esta forma, sus respuestas puedan ser comparadas y analizadas con cierta fiabilidad. Por ello se hace aconsejable que las personas encargadas de realizar las entrevistas cuenten con cierta experiencia y hayan recibido un entrenamiento específico para realizar su labor. En función del tipo de muestreo que se realice, el entrevistador habrá de “buscar” a los entrevistados de diferentes formas. Cuando el tipo de muestreo que se utiliza es el de rutas aleatorias, el entrevistador recorre, desde un punto fijado de antemano, un itinerario que va construyendo, paso a paso y con la ayuda de una tabla de números aleatorios, hasta que localiza en su vivienda a la persona que debe entrevistar (en el capítulo II del texto de Manzano y otros -1996-, se describe, de manera muy sencilla, este tipo de muestreo). En el caso del muestreo por cuotas, al entrevistador se le dice a cuántas personas y con qué características tiene que entrevistar, cayendo bajo su responsabilidad la selección de las mismas. 3.2

La encuesta por correo

Como su propio nombre indica este tipo de encuesta implica la utilización del servicio de correos para hacer llegar, a una muestra representativa de sujetos, un cuestionario

Investigación a través de los cuestionarios

autoadministrado, unas instrucciones que indican cómo cumplimentarlo y un sobre estampado y con la dirección impresa para que lo remitan de vuelta a los investigadores. En este caso, y a diferencia de las encuestas personales, no se utilizan entrevistadores y, por lo tanto, no existe contacto personal alguno entre los investigadores y los encuestados. Debido a ello es necesario prestar una atención especial a la elaboración y presentación del cuestionario, de forma que su cumplimentación resulte sencilla y que las preguntas que planteen puedan ser claramente entendidas. Una de las principales dificultades que plantea este tipo de encuesta es la baja tasa de respuestas que consigue. Para solventar este problema algunos autores han desarrollado una serie de recomendaciones, que se resumen, con brevedad, en el cuadro 2.1 (véase al final del texto). 3.3 . La encuesta telefónica Al igual que en las entrevistas personales, en las que se realizan mediante el teléfono se hace uso de un entrevistador que, a través de este medio, se dirige al encuestado para realizarle las preguntas que se incluyen en un guión y/o cuestionario. A pesar de que su uso no fue, en un principio, muy generalizado, hoy en día, y gracias a la ampliación de la cobertura telefónica, a la implementación de procedimientos de muestreo automatizados como la RDD (Random Digit Dialing) y al desarrollo de entrevistas telefónicas asistidas por ordenador (CATI, Computer-Assisted Telephone Interviewing), representan la mayor parte de las encuestas que se realizan, debido, sobre todo, a su rapidez. 3.4

Otros tipos de encuesta

Además de los tres tipos de encuesta que se han comentado, cabe distinguir otras dos modalidades más en función de la manera en la que se recogen los datos: la encuesta en grupo que utiliza un cuestionario autoadministrado, y la que se conoce con el nombre de household drop-off. En el primer caso, se reúne a un grupo de sujetos en un lugar determinado y se les solicita que contesten a un cuestionario. Las household drop-off intentan combinar las ventajas de las entrevistas por correo y las de las que se realizan cara a cara con la ayuda de un entrevistador. Este último se dirige al hogar de los entrevistados para entregarles un cuestionario, indicándoles, en ese momento, la fecha en la que volverá a recogerlo o en la que lo tienen que remitir por correo.

Investigación a través de los cuestionarios

De reciente aparición son las encuestas vía Internet, que utilizan la red como medio para la realización de encuestas. Sin duda, este último tipo de encuestas tienen un futuro muy prometedor. 3.5 . La elección del tipo de encuesta más adecuada en función de sus ventajas e inconvenientes Como es lógico, cada una de las diferentes modalidades de encuesta tiene una serie de ventajas e inconvenientes (un resumen de las mismas se ofrece en los cuadros 2.2 y 2.3). De esta forma, y en función de las mismas, en algunos casos su uso estará perfectamente indicado, mientras que en otros su administración puede implicar importantes dificultades y costes muy elevados o, lo que es peor, conducir a graves errores y sesgos. Por lo tanto, el investigador habrá de conocer muy bien cuáles son las ventajas y los inconvenientes que se asocian con cada tipo de encuesta para, en función de los mismos, seleccionar el que más le convenga. Esta elección no es ni mucho menos sencilla y, en muchas ocasiones, depende de la experiencia y buen juicio del investigador. Sin embargo, es posible ofrecer una serie de recomendaciones en función de las características de la población, la muestra, el tema de la encuesta, el tipo de preguntas que se vayan a realizar, los sesgos que se puedan producir y ciertos aspectos relacionados con su administración (Trochim, 1997). A) Aspectos relacionados con la población Con respecto a la población, el investigador puede plantearse una serie de cuestiones que, sin duda, le serán de gran ayuda a la hora de seleccionar el tipo de encuesta más adecuado. En primer lugar ha de preguntarse si dispone de un listado exhaustivo y correcto de las direcciones de los individuos que desea encuestar. Si no es así, tendrá que descartar la posibilidad de realizar una encuesta por correo o por teléfono (si es que no dispone de un sistema RDD). En este caso, parece que la elección más adecuada puede ser la realización de una encuesta personal, sirviéndose, por ejemplo, de un muestreo de rutas aleatorias. En segundo lugar, es necesario que conozca el nivel educativo de la población a encuestar. Como es evidente, si los encuestados son analfabetos o analfabetos funcionales, habrá de renunciar a cualquier encuesta que implique la utilización de Investigación a través de los cuestionarios

cuestionarios autoadministrados. En tercer lugar, habrá de tener en cuenta ciertas peculiaridades relativas a la lengua en la que se expresen los encuestados, como ocurre con algunas de nuestras Comunidades Autónomas en las que existen dos lenguas oficiales. Esto, en un principio, no va a excluir la realización de ningún tipo de encuesta, pero tendrá que ser tenido en cuenta a la hora de disponer de cuestionarios y/o entrevistadores bilingües. En cuarto lugar, es necesario que considere el grado en el que la población objeto de estudio va a cooperar. Piénsese en el caso de los inmigrantes no regularizados o en aquellos sujetos que llevan a cabo prácticas o conductas ilegales. El investigador habrá de ponderar cuáles son las características de cada uno de los tipos de encuesta que mejor se adaptan a estas situaciones. En un principio, parece que la encuesta personal puede ser la mejor elección. Por último, tiene que plantearse si existen restricciones geográficas para la realización de la encuesta. En el caso de muestras muy dispersas, la mejor elección, y siempre que no haya otros inconvenientes, puede ser la realización de una encuesta por correo o por teléfono. B) Aspectos relacionados con el muestreo Con respecto a la muestra de individuos con la que se va a contactar para llevar a cabo la encuesta, el investigador ha de tener en cuenta una serie de cuestiones importantes. En primer lugar, y al igual que se indicaba al hablar de la población, para realizar encuestas postales o por correo tendrá que comprobar si dispone de las direcciones y/o de los números de teléfono correctos de los encuestados. Un segundo aspecto que habrá de tener en cuenta, sobre todo si se realizan encuestas personales o telefónicas, es si las personas de la muestra van a estar disponibles en el momento que se precise (por ejemplo, profesionales de alto nivel y muy ocupados). En caso contrario, una buena solución puede ser una encuesta tipo drop off o por correo. Así mismo, tendrá que considerar cuáles son las personas concretas que se requieren para la encuesta. Si se precisa encuestar a individuos específicos y si se dispone de un listado con su nombre y dirección no va a existir ningún problema para realizar encuestas por correo. Si no es así, será preferible hacer uso de encuestas personales.

Investigación a través de los cuestionarios

C) Aspectos relativos al tema y al contenido de la encuesta En este sentido, entre las cuestiones más importantes que ha de plantearse el investigador para ponderar cuál es el tipo de encuesta que más le conviene destacan las siguientes. En primer lugar, qué tipo de preguntas va a realizar. Por ejemplo, si van a tener un carácter personal, si requieren de un gran número de alternativas de respuesta, si pueden contestarse de manera dicotómica, qué orden tendrán las alternativas (sobre todo por el llamado efecto de memoria, ya que en las encuestas por teléfono se responderán más a las últimas alternativas leídas), etc. Así mismo, deberá anticipar si el cuestionario que redacte va a necesitar de muchos filtros de respuesta. Cuanto mayor sea el número de éstos, más complicada será el cuestionario y, por tanto, lo recomendable será no basar la encuesta en procedimientos auto-adininistrados para no confundir a los encuestados. En tercer lugar, será preciso que tenga en cuenta si es necesario controlar la secuencia en la que los encuestados han de responder a las preguntas, pues, si es así, los procedimientos menos recomendables serán los que hagan uso de pruebas de lápiz y papel. Finalmente, hay que prestar atención a la longitud de las preguntas que se planteen y de las aclaraciones que éstas vayan a precisar. Si las preguntas son muy largas o sus alternativas de respuesta muy numerosas no se aconseja la elección de entrevistas telefónicas, pues será muy difícil mantener la atención de los encuestados durante toda la encuesta. D) Aspectos relativos a ciertos sesgos que se pueden producir en las encuestas En este punto es conveniente atender a tres aspectos principales. El primero tiene que ver con la deseabilidad social que generen las preguntas. Esta siempre se incrementa en las encuestas que utilizan entrevistadores. El segundo implica las distorsiones que puede provocar el encuestador en las respuestas de los individuos o en su registro. En un principio esto se puede evitar mediante un buen entrenamiento y supervisión del trabajo de campo. Por lo tanto, no se ha de descartar, a priori, la realización de encuestas personales cuando se sospeche que esto puede ocurrir. El tercero se relaciona con la posibilidad de que los sujetos no expresen lo que realmente piensan. El tipo de encuesta que mejor evita este sesgo es la que se realiza mediante Investigación a través de los cuestionarios

entrevistas personales. E) Aspectos relacionados con la administración de las encuestas Por último, es necesario atender a cuatro aspectos de considerable importancia en la realización de la encuesta: el presupuesto con el que se cuenta, el material del que se dispone, el tiempo en el que ha de finalizarse y el personal que requiere. Las encuestas más caras y las que requieren un mayor número de colaboradores son las personales. Las que precisan de mayores recursos materiales pero también las más ágiles y rápidas son las que se realizan por teléfono. Por último, las más económicas, las que necesitan menos personal, pero también las más lentas y las que ofrecen una mayor tasa de no-respuesta son las encuestas postales. 4. El proceso general de investigación mediante encuestas Para terminar, realizaremos una descripción esquemática del proceso general que se lleva a cabo al realizar una investigación mediante encuestas, independientemente de cuál sea el tipo que se utilicen. Siguiendo a Oppenheim (1992) se pueden distinguir 14 pasos o etapas fundamentales: 1. Determinar los objetivos generales de la encuesta y, si es posible, los desarrollos teóricos principales relacionados con el tema objeto de estudio. Estos objetivos generales, que pueden venir determinados por un cliente externo o por los propios intereses del investigador, será necesario concretarlos en objetivos de investigación específicos que, a su vez, tendrán que expresarse en una serie de objetivos operacionales, es decir, un conjunto concreto de hipótesis a investigar. 2. Es aconsejable revisar la literatura existente sobre el tema de investigación y, en concreto, cualquier estudio que guarde similitud con el que se va a emprender. 3. Redactar un primer borrador del proyecto de investigación en el que se especifiquen y relacionen, de manera lógica, los diferentes objetivos de la misma, así como las tareas de investigación a partir de las cuales se van a cumplimentar. En este momento puede ser aconsejable realizar un pequeño estudio exploratorio, como por ejemplo, una serie de entrevistas en profundidad o de grupos de discusión. Sin duda alguna, y a partir de los mismos, se realizarán algunos ajustes sobre el borrador inicial de la investigación que se haya confeccionado. 4. Establecer el diseño de la investigación y evaluar su viabilidad en función de los

Investigación a través de los cuestionarios

recursos y tiempo de los que se disponga. Este es un buen momento para abandonar el trabajo o para reducir o hacer más realistas sus objetivos. 5. Decidir cuáles van a ser las hipótesis específicas que se van a investigar, concretarlas en términos situacionales y especificar el tipo de variables que será necesario medir. 6. Diseñar o adaptar las técnicas de investigación mediante encuestas más adecuadas para realizar la investigación. 7. Llevar a cabo un estudio piloto de las técnicas que se hayan desarrollado o adaptado (es decir, realizar ensayos con ellas) así como cualquier otro aspecto de la investigación que se considere necesario. 8. Diseñar y establecer el tipo de muestra o muestras que se va a encuestar. Especificar el tipo de representatividad que deben poseer y las condiciones necesarias para que esto se consiga. Hace un estudio piloto de las estrategias de muestreo que se vayan a utilizar. 9. Construir la muestra, esto es, seleccionar a la gente que debe ser encuestada. 10.Realizar el trabajo de campo. Esto implica la recogida de datos a partir de las técnicas que se hayan diseñado con anterioridad (encuestas personales, postales y telefónicas). Establecer y llevar a cabo estrategias de control adecuadas para asegurarse que todo discurre según se haya establecido. 11. Procesar los datos. Para ello será necesario codificar las respuestas de los encuestados e introducirlas en el ordenador. 12. Realizar los análisis estadísticos que sean pertinentes. 13. Reunir los resultados que se hayan obtenido en los análisis anteriores y contrastar las hipótesis de investigación. 14. Redactar el informe de la investigación. Es aconsejable que las conclusiones que se obtengan se relacionen, si es posible, con los resultados que se hayan ofrecido en otros trabajos similares y con las propuestas teóricas existentes en la literatura especializada. Sin duda alguna, el establecer 14 fases o etapas para describir el proceso de investigación mediante encuestas es completamente arbitrario. Lo que no es arbitrario

Investigación a través de los cuestionarios

es el estudio concienzudo y sistemático de cada uno de los aspectos que implica la realización de una buena encuesta. Por ello, indudablemente, el estudio y la consulta de la abundante literatura sobre las encuestas serán de ayuda al estudioso que desee profundizar más allá de las breves pinceladas que se han ofrecido en este capítulo. CUADRO 2.1. Factores que aseguran una buena tasa de respuestas en las encuestas por correo. FACTORES QUE ASEGURAN UNA BUENA TASA DE RESPUESTAS EN LAS ENCUESTAS POR CORREO (Adaptado de Robson, 1993) 1. La apariencia del cuestionario es de gran importancia. Debe ser sencillo de leer y rellenar y con suficiente espacio para responder a las preguntas. 2. La claridad del lenguaje y la simplicidad del diseño es esencial. De la misma forma, unas instrucciones claras son imprescindibles. 3. Se deben ordenar los contenidos para maximizar la cooperación. Por ejemplo asegurarse de que las primeras preguntas no indiquen a los que responden que la encuesta “no es para ellos”. Diseño y disposición 4. La utilización de páginas de color puede ayudar a identificar la estructura del cuestionario. Por ejemplo se pueden utilizar páginas de distinto color para las instrucciones. 5. Las respuestas que se realizan poniendo marcas en cajas ‘[ ]’ son más familiares y fáciles de responder para la mayoría de las personas. Los sujetos se pueden confundir si tienen que rodear con un círculo respuestas pre-codificadas. 6. La identificación de las preguntas con números y letras es de gran ayuda, sobre todo si se agrupan aquellas que están relacionadas con un tema específico. 7. Si se sospecha que los sujetos pueden confundirse no ha de dudarse a la hora de repetir las instrucciones las veces que sean necesarias. 8. Las respuestas iniciales deben ser más fáciles e interesantes. Las cuestiones de la parte central del cuestionario deben abarcar las áreas más difíciles. Las finales deben de ser, de nuevo, más interesantes (es cuando el sujeto se encuentra más fatigado). 9. La redacción adecuada de las preguntas es de crucial importancia. La presentación es esencial. 10. Al final del cuestionario es aconsejable, además de dar las gracias y ofrecer un resumen de los hallazgos de la investigación, incluir una breve nota en la que se solicite: a) la revisión de las respuestas al cuestionario, por si hay algún error o se ha dejado alguna sin responder; b) la rápida devolución del cuestionario. Correo inicial 11. Utilizar sobres de buena calidad, mecanografiados y si es posible personalizados. 12. Utilizar franqueo de primera clase y sobres que no necesiten sello. 13. Incluir un sobre franqueado para la devolución del cuestionario. 14. Para las encuestas domiciliarias el mejor día para enviarlas es el jueves, para las

Investigación a través de los cuestionarios

relacionadas con empresas y organizaciones el lunes o martes. 15. Evitar el correo en diciembre. Carta acompañante 16. Debe indicar el objetivo de la encuesta y describir su importancia, asegurar la confidencialidad y animar a que los sujetos contesten. Si se utilizan números de serie u otros códigos, indicar el porqué. 17. Describir la encuesta como si estuviese realizada a medida para la audiencia (por ejemplo una encuesta a los padres podría servir para mejorar el cuidado de la infancia). 18. Dar el nombre del organizador o empresa que financia la encuesta, tanto en el encabezamiento de la carta como en su cuerpo. 19. Una carta enviada con anterioridad a la encuesta propiamente dicha, incrementa la probabilidad de la respuesta. Carta de seguimiento 20. Es el factor más importante para asegurar una buena tasa de respuestas (aun cuando se hayan aplicado todo el resto de sugerencias). 21. Enfatizar la importancia del estudio y el valor de la participación de los respondientes. 22. Señalar la sorpresa de que todavía no se haya recibido la respuesta. 23. No sugerir que es común la no devolución. 24. Enviar una copia más del cuestionario y otro sobre franqueado. Cartas de seguimiento adicionales 25. Lo que se recomienda suelen ser tres cartas recordatorias. Utilización de incentivos 26. Los incentivos que acompañan el correo inicial parecen ser más efectivos que los que se utilizan cuando ya se han devuelto los cuestionarios (prometidos con anterioridad).

CUADRO 2.2. Algunos rasgos diferenciales entre los distintos tipos de encuesta. ALGUNOS RASGOS DIFERENCIALES ENTRE LOS DISTINTOS TIPOS DE ENCUESTA Adaptado de Trochim (1997) ¿Permite la presentación de estímulos visuales? ¿Se pueden utilizar categorías de respuesta extensas? ¿Permite la privacidad de las respuestas? ¿Ofrece la suficiente flexibilidad? ¿Es factible la realización de preguntas abiertas? ¿Es necesario que los encuestados sepan leer y escribir? ¿Se puede saber si los encuestados han sido los que ha

Grupo

Correo

Drop-off

Personal

Telefónica

Investigación a través de los cuestionarios

contestado a las preguntas? ¿Se obtienen tasas de respuesta altas? ¿Se pueden explicar personalmente a los encuestados las razones de la investigación? ¿Implica un costo bajo o moderado? ¿Requiere una gran cantidad de personal y recursos? ¿Permite el acceso a muestras dispersas? ¿Dispone el entrevistado de tiempo suficiente para elaborar sus respuestas? Existe contacto personal entre el encuestador y el encuestado? ¿Es factible realizar una encuesta que implique un número elevado de cuestiones?

CUADRO 2.3. Principales ventajas e inconvenientes de los diferentes tipos de encuesta.

PRINCIPALES VENTAJAS E INCONVENIENTES DE LOS DIFERENTES TIPOS DE ENCUESTA (Adaptado de Fowler, 1993)

Ventajas potenciales de la encuesta personal 1. Son las más adecuadas cuando se utiliza determinado tipo de diseños muestrales (por ejemplo el de rutas aleatorias). 2. Son las más efectivas para asegurarse la cooperación de los encuestados. 3. La presencia del entrevistador permite, entre otras cosas, responder las dudas del encuestado y asegurarse la manera en que éste responde a las preguntas. 4. Permite la utilización de estrategias que combinan varias técnicas de recogida de datos (p.e. observación y partes auto-administradas del cuestionario). 5. Permiten la realización de encuestas que implican entrevistas de larga duración.

Inconvenientes potenciales de la encuesta personal 6. Implica un gasto mayor que el resto de las encuestas. 7. Se necesitan encuestadores entrenados y que éstos estén geográficamente próximos a la muestra que se desea encuestar. 8. Requieren más tiempo que las telefónicas para la recogida de los datos. 9. Ciertas muestras pueden ser más accesibles por otros tipos de encuesta (por ejemplo estudiantes, trabajadores, etc.).

Ventajas potenciales de la encuesta telefónica 10. Bajo coste (si se compara con la encuesta personal). 11. Se pueden utilizar la estrategia de Random Digit Dialing, lo que permite el desconocimiento de las direcciones y los nombres de los encuestados. 12. Permite el acceso a determinados tipo de población (si se compara especialmente con las encuestas personales). 13. Muy útiles cuando se necesita realizar la encuesta en un breve período de tiempo.

Investigación a través de los cuestionarios

14. Permite aclarar dudas al encuestado (si se compara con la encuesta por correo). 15. Las cuestiones relativas al personal necesario implican menos problemas que en las encuestas personales (por ejemplo su número es menor, no necesitan estar geográficamente próximos a la muestra, la supervisión y el control de la calidad resultan más sencillas, etc.). 16. Ofrecen una buena tasa de respuestas si se comparan con las encuestas por correo.

Inconvenientes potenciales de la encuesta telefónica 17. Sólo permite el acceso a aquellas personas que disponen de teléfono. 18. Cuando se utiliza el muestreo RDD ofrece unas tasas bastante bajas de respuesta si se las compara con la encuesta personal. 19. Implica limitaciones importantes para la elaboración del cuestionario (por ejemplo en el número de las alternativas de respuesta) y tampoco permite la presentación de estímulos visuales ni la observación de la conducta no verbal del encuestado. 20. Es probable que no sea muy adecuada para realizar encuestas sobre temas delicados, al menos si no ha habido un contacto previo con el encuestado.

Ventajas potenciales de los diferentes tipos de encuesta auto-administrada (correo, en grupo, drop-off) comparadas con las encuestas personales y telefónicas 21. Permite la realización de preguntas que requieren presentaciones visuales (a diferencia de la telefónica). 22. Se pueden realizar preguntas largas y con categorías de respuesta complejas. 23. Permite la realización de baterías de preguntas. 24. El encuestado no tiene que compartir sus respuestas con ningún entrevistador,

Ventajas potenciales de los diferentes tipos de encuesta auto-administrada (correo, en grupo, drop-off) comparadas con las encuestas personales y telefónicas. 25. Permite la realización de preguntas que requieren presentaciones visuales (a diferencia de la telefónica). 26. Se pueden realizar preguntas largas y con categorías de respuesta complejas. 27. Permite la realización de baterías de preguntas. 28. El encuestado no tiene que compartir sus respuestas con ningún entrevistador.

Inconvenientes potenciales de los diferentes tipos de encuesta auto-administrada (correo, en grupo, drop-off) comparadas con las encuestas personales y telefónicas 29. El diseño del cuestionario es muy laborioso. 30. Las preguntas abiertas no suelen ser muy útiles. 31. Se necesita que los encuestados sepan leer y escribir correctamente. 32. No se dispone de un entrevistador que se asegure que las preguntas se comprenden adecuadamente y de su calidad.

Ventajas potenciales de la encuesta auto-administrada en grupo 33. Se suelen conseguir altas tasas de cooperación. 34. Existe la posibilidad de explicar los objetivos del estudio y de aclarar las dudas de los encuestados. 35. En general implica un coste económico bajo.

Inconvenientes potenciales de la encuesta auto-administrada en grupo 36. Muy difícil obtener muestras representativas mediante este procedimiento.

Ventajas potenciales de la encuesta por correo

Investigación a través de los cuestionarios

37. Implica un costo relativamente bajo. 38. Se puede llevar a cabo con pocos recursos y personal. 39. Permite acceder a muestras dispersas y aquellas que no disponen de teléfono. 40. Los encuestados tienen tiempo para elaborar y revisar sus respuestas.

Inconvenientes potenciales de la encuesta por correo 41. Dependiendo de la muestra estudiada, en ocasiones es bastante difícil conseguir una cooperación adecuada. 42. Implica diversos inconvenientes asociados con la no presencia de un entrevistador. 43. Se necesita conocer y elaborar correctamente el listado de las direcciones de los encuestados.

Ventajas potenciales de la encuesta drop-off 44. El encuestador puede explicar las razones del estudio y aclarar las dudas del encuestado (comparada con la encuesta por correo). 45. La tasa de respuestas suele ser similar a la que se obtiene con las encuestas personales. 46. Existe la posibilidad de que los sujetos piense con detenimiento sus respuestas o consulten con sus familiares.

Inconvenientes potenciales de la encuesta drop-off 47. Supone un costo similar al de las encuestas personales. 48. Requiere personal entrenado aunque menos cualificado que en las personales.

Investigación a través de los cuestionarios

I.-

SELECCIÓN DE MUESTRAS3

Vicente Manzano Arrondo

1. Abordaje directo de la población Existen muchas ocasiones durante la lectura de un texto en las que la atención baja sensiblemente y el lector termina entretenido en imágenes y sensaciones que nada tienen que ver con el libro abierto. De hecho, puede ocurrir que pase alguna que otra hoja sin retener absolutamente nada. Quizá sea eso lo que está pasando ahora o lo que ha pasado antes de una segunda lectura. Otra de las variantes en las que se sumerge un lector no muy implicado con la cuestión que se trata en el texto (o la forma de tratarlo), es buscar tareas tangenciales como contar letras, observar los márgenes o el espaciado entre palabras, etc. Un ejercicio de interés puede ser el que consiste en fijarse en la figura 3.1. ¿Podría contar cuántas veces aparece el símbolo ♂? Está claro que se trata de un entretenimiento muy limitado. Con unos minutos de paciencia se puede conseguir una solución. Inténtelo antes de continuar en el siguiente párrafo. El resultado se ha calculado a través del ordenador y la solución correcta es 473. Hay 473 símbolos ♂ en la figura 3.1. Si el lector ha realizado el ejercicio puede haber coincidido su solución. Y puede que no. Lo cierto es que cabe esperar cierta discrepancia puesto que una de las características más interesantes de las personas es nuestra capacidad para no responder siempre del mismo modo, mezcla de error y creatividad. De la tarea que estamos comentando, cabe establecer un par de conclusiones. La primera es que hay quehaceres pesados, tediosos o que requieren un esfuerzo de tiempo y concentración especiales, que podrían ahorrarse si existieran estrategias para ello. La segunda conclusión, derivada de la primera, es que fruto de las características de la tarea las personas cometemos errores durante el proceso. Ante tales quehaceres, por lo tanto, es comprensible que exista una relativa desconfianza acerca del resultado Rojas Tejada, A. et al. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Madrid. Síntesis. 3

Investigación a través de los cuestionarios

obtenido. ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♫ ♫ ♂ ☼ ☼ ♫ ☼ ♫ ♠ ♫ ♠ ♫ ♂ ♫ ♂ ☼ ♂ ♫ ♫ ☼ ☼ ♂ ♂ ☼ ♫ ♂ ♫ ☺ ☼ ☼ ♫ ♂ ♫ ♂ ♫ ☺ ♫ ♂ ♂ ♂ ♫ ☺ ☺ ♂ ♂ ☼ ☼ ♫ ♂ ☼ ♂ ♂ ♫ ☼ ☼ ♂ ♫

☼ ♫ ☼ ♂ ♫ ♫ ☼ ♠ ♫ ☺ ♂ ♫ ♫ ♠ ♂ ♫ ♂ ♫ ♫ ☼ ♫ ♂ ♂ ♂ ♂ ☺ ♂ ♂ ♂ ☼ ♠ ☻ ♂ ♫ ♫ ☼ ♂ ♫ ♫ ♫ ♫ ♂ ♂ ♫ ☼ ♫ ☼ ♫ ♂ ♫ ♫ ♂ ☼ ☺ ♫ ♠ ☼ ♂ ☼ ♂ ☼ ♠ ♫ ♂ ♠ ♫ ♫ ♫ ♫ ☺ ♂

♫ ♫ ☺ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ♫ ♂ ♫ ☼ ☼ ♫ ♫ ♫ ☺ ♂ ☼ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ☼ ♫ ♫ ♠ ☺ ♫ ♫ ♂ ♠ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ♂ ♂ ♂ ♫ ☺ ♂ ☼ ♫ ♫ ♂ ☺ ♫ ♫ ☼ ♂ ♫ ♫ ♠ ☼ ☼ ♫ ♫ ♂

☼ ♫ ☼ ♫ ♠ ♫ ☼ ♂ ♫ ☼ ♫ ♂ ♂ ♫ ☼ ♂ ☼ ♫ ♫ ☼ ♂ ☼ ♠ ♫ ♂ ☺ ♫ ♫ ♂ ☼ ♫ ☼ ♫ ♂ ♂ ☼ ♫ ♫ ♠ ♫ ♫ ♫ ♫ ♂ ☺ ♂ ♫ ♫ ♫ ☼ ☼ ♫ ♫ ♫ ♂ ♫ ☼ ♣ ♫ ♠ ♫ ♂ ☼ ♫ ♫ ♫ ♂ ♠ ♂ ☺ ♠

♫ ♫ ♫ ♫ ♂ ☼ ♂ ☺ ♂ ☼ ☼ ♂ ♂ ♂ ♂ ☼ ☼ ☼ ♂ ♫ ♂ ♫ ♠ ♂ ☼ ♫ ♫ ☺ ♫ ☼ ☼ ☼ ♫ ♂ ♂ ♂ ♫ ♫ ♫ ☼ ♂ ☼ ☺ ☼ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♂ ☼ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ☼ ♂ ☼ ♂ ♠ ♫ ☼ ☼ ☼

♫ ☺ ♫ ☼ ♫ ♂ ♫ ☼ ♂ ♫ ♂ ♂ ♫ ♫ ♂ ☼ ♂ ☼ ♫ ☺ ♫ ♂ ♂ ☼ ☼ ♫ ♫ ☼ ♫ ♫ ☼ ☼ ♂ ♫ ☼ ☺ ♠ ♫ ♫ ♫ ☺ ♂ ☼ ♫ ☻ ☼ ☼ ☺ ♫ ♫ ☺ ☼ ☼ ☼ ♫ ☺ ♫ ♂ ♫ ♠ ♫ ♫ ☺ ♂ ☼ ☺ ♫ ♫ ☼ ♂ ♫

♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ♂ ☼ ♫ ♂ ☺ ♂ ☼ ☺ ☺ ♠ ♫ ☼ ♂ ☼ ♫ ☼ ☼ ☼ ☺ ♫ ♂ ☺ ♫ ☼ ☺ ♂ ☼ ♫ ♫ ♫ ♫ ☼ ☺ ♂ ♫ ♫ ♫ ☼ ☺ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♠ ♫ ♂ ☼ ☼ ♫ ☼ ♫ ♂ ♫ ☺ ♂

☼ ♂ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ☼ ♫ ♂ ☼ ♫ ♫ ♫ ♫ ♠ ☺ ☼ ☼ ☼ ♫ ♂ ♫ ♂ ♫ ☼ ☻ ☼ ♫ ☺ ♂ ♫ ☼ ♂ ♫ ♂ ☺ ♫ ☼ ♫ ☼ ♫ ♫ ♂ ☼ ☼ ♫ ♫ ♂ ☺ ♠ ♫ ♫ ♂ ♫ ♫ ♠ ♂ ♂ ♫ ♫ ♂ ☼ ♂

♫ ♫ ☺ ♫ ♠ ☼ ☼ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♫ ♫ ♫ ♂ ♫ ♂ ☺ ☺ ♂ ♫ ♂ ♫ ☼ ♂ ♂ ♠ ♫ ☼ ♫ ♫ ♠ ♂ ♂ ♫ ♂ ♂ ♫ ☺ ♫ ♫ ♂ ♂ ☼ ♫ ☺ ♫ ☼ ♫ ♫ ♫ ☼ ☼ ☼ ☺ ♫ ♫ ♂ ♫ ♂ ☺ ☼

♂ ♂ ♠ ♂ ☼ ☼ ♠ ☼ ♂ ♫ ♂ ☼ ♫ ♫ ♫ ♂ ♂ ☺ ♠ ☼ ♫ ☺ ♂ ♂ ☺ ♫ ♂ ☼ ♫ ♫ ♂ ♂ ♫ ♂ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼ ☼ ☺ ♂ ☺ ♂ ☺ ☼ ♂ ♫ ♫ ♠ ♫ ☼ ♫ ♂ ♂ ♂ ♫ ♠ ♂ ☼ ♫ ☼

☼ ☼ ☺ ☼ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼ ♫ ♫ ♫ ♂ ♫ ☼ ♫ ♫ ☼ ♠ ♂ ♠ ♂ ♫ ♫ ☼ ♫ ☼ ♫ ☼ ♫ ♫ ♫ ☼ ♣ ☺ ♣ ☺ ♂ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ♂ ♂ ♠ ♫ ♂ ♫ ☼ ♫ ♫ ♫ ☼ ♠ ♂ ♫ ♫ ♂ ♂ ♫ ♫ ♂ ♂ ☼

☼ ☼ ♂ ♫ ♂ ♫ ♫ ♫ ☼ ☼ ☼ ♂ ☼ ♂ ☼ ♫ ♂ ♫ ♂ ☼ ♂ ☼ ☼ ☼ ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♠ ♂ ♫ ☼ ♠ ♂ ☼ ☼ ☼ ♂ ☺ ♫ ☼ ☼ ♫ ☺ ♫ ♫ ♫ ♫ ☼ ♠ ♂ ♫ ☼ ♂ ☼ ♂ ♂ ♫ ☼ ♫ ☼ ☼ ♂ ♫ ♫ ♫ ♂ ♂

♫ ♫ ☼ ☺ ♫ ♠ ♂ ♂ ♫ ♂ ☼ ♫ ☺ ☼ ♫ ♠ ♂ ♫ ☼ ♫ ☼ ♠ ♫ ♂ ☼ ♫ ♂ ♫ ♂ ♫ ☼ ♫ ♫ ♠ ♂ ♠ ♫ ♂ ♂ ♫ ♫ ♂ ♫ ☼ ♫ ♫ ☼ ♂ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ☺ ♂ ♫ ☺ ♠ ♂ ☼ ♂ ♫ ☺ ♂ ♫ ♫ ♫ ☺ ♫

♂ ♫ ☼ ♂ ♫ ♫ ♠ ♂ ♂ ♂ ♫ ♠ ☼ ♫ ♂ ♫ ☼ ♣ ☼ ♂ ♂ ♫ ☼ ☼ ♫ ☼ ♂ ♂ ♂ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼ ☺ ♫ ☼ ♫ ☺ ♠ ♫ ☼ ♠ ♫ ♂ ♫ ☼ ♫ ☼ ☼ ☼ ♫ ♫ ♫ ☼ ♫ ☺ ♂ ☼ ♫ ♂

♫ ♂ ♫ ♂ ♂ ☼ ♫ ☺ ♫ ♂ ♂ ♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ☼ ♂ ♂ ♫ ☺ ♫ ☼ ♂ ♫ ♫ ♫ ♂ ☼ ♂ ☼ ☼ ♂ ☼ ☺ ♂ ♂ ♂ ♂ ♠ ☺ ☼ ☼ ♫ ♠ ☼ ♠ ♫ ☺ ♫ ♫ ♠ ♂ ☼ ♂ ♂ ♂ ☺ ♠ ♫ ☻ ☼ ♫ ☼ ♂

♫ ♂ ♫ ☺ ☼ ♫ ♂ ♂ ♂ ☺ ♫ ♫ ☺ ♂ ☼ ♂ ♫ ☼ ☺ ♫ ♫ ♫ ☼ ♫ ♂ ♫ ♫ ♠ ♂ ♠ ♫ ♠ ♫ ☺ ♫ ♠ ♫ ♫ ♫ ♫ ♂ ♫ ☼ ♫ ♂ ♫ ☼ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ♂ ♂ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ☼ ♫ ♂ ∋ ♫ ♫ ♫ ♫

♂ ♫ ♂ ☼ ♫ ♫ ♫ ♫ ♠ ♂ ♫ ♂ ☺ ♂ ♫ ♠ ☺ ♂ ♫ ♫ ♫ ♫ ♫ ♂ ♫ ☼ ☼ ♂ ☺ ♫ ♫ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ♫ ♫ ♫ ♂ ♫ ♠ ☼ ♂ ♫ ☺ ♠ ☼ ♫ ♂ ♫ ♂ ♂ ♫ ♫ ☼ ♫ ☼ ♠ ♫ ♫ ♫ ♫ ♂ ♫ ♫ ♂ ♫ ♫

♫ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♫ ♫ ☺ ♫ ☼ ☼ ♫ ♂ ☺ ☼ ☺ ♫ ☻ ♫ ♫ ♠ ♠ ♂ ♫ ♫ ♫ ♫ ♫ ☼ ☼ ♂ ♂ ☺ ♂ ♫ ♂ ♂ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♂ ☼ ☺ ♂ ☼ ☼ ☼ ♠ ☺ ♫ ☺ ☼ ♫ ♫ ♠ ♂ ☼ ☼ ☼ ♂ ♫ ♠ ♂ ♠

♫ ♂ ☼ ♠ ☼ ♠ ♫ ☼ ♂ ♫ ☼ ♂ ♫ ♂ ☼ ♫ ♂ ☼ ☼ ☼ ☼ ♫ ♫ ♫ ♫ ♫ ☼ ☼ ☺ ♠ ☼ ♫ ♫ ☼ ☼ ☼ ☼ ♠ ☼ ♫ ♠ ♫ ♫ ♠ ♂ ♂ ♫ ☼ ☼ ☼ ♂ ♫ ☺ ♫ ♂ ♫ ♫ ☼ ♂ ☼ ♂ ☺ ♫ ♫ ♫ ♠ ♂ ♫ ♫ ♠ ♫

Investigación a través de los cuestionarios

♫ ♂ ☼ ☼ ♂ ☼ ♂ ♫ ☼ ♂ ♫ ☼ ☼ ♫ ♫ ☼ ☺ ☼ ♫ ☺ ☼ ♫ ♫ ♫ ♠ ♫ ♫ ☼ ☼ ♂ ♂ ♫ ♫ ♂ ♠ ☼ ♫ ♂ ☼ ♫ ♫ ♫ ☼ ♫ ♂ ♫ ♫ ☼ ♫ ♂ ♠ ♫ ♂ ♂ ♫ ♫ ☺ ☼ ♂ ☼ ♠ ☼ ♫ ♫ ♫ ♫ ♂ ♫ ♫ ♂ ♂

♂ ☼ ☼ ☼ ♫ ☼ ☺ ♂ ♂ ☼ ♂ ☼ ♂ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♫ ☺ ♫ ☼ ♫ ♂ ♂ ☼ ♂ ☺ ☼ ☼ ☼ ♫ ☼ ♂ ♠ ♫ ♫ ♫ ☼ ♂ ☼ ♫ ♫ ♠ ♂ ♫ ♫ ☺ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ☼ ♫ ♫ ♫ ☼ ♫ ♂ ♂ ♂ ☼ ☼ ♫ ♫ ☺

☺ ♫ ♂ ☼ ♠ ☼ ♫ ☼ ♠ ♫ ♂ ☼ ♫ ♫ ☺ ☺ ♂ ♫ ☼ ♂ ☺ ☺ ♂ ☼ ♫ ♫ ♫ ♂ ♠ ☼ ♫ ♠ ♫ ♫ ☺ ♂ ☺ ♂ ☼ ☺ ☺ ♂ ♫ ♫ ♂ ☼ ♂ ♫ ♫ ☼ ♠ ☼ ♫ ☼ ☼ ♫ ♂ ♂ ♫ ♫ ♫ ☼ ♂ ♂ ♂ ☺ ♫ ♂ ♫ ♫ ♫

☼ ♂ ♫ ♂ ☼ ♂ ♣ ☼ ♫ ♫ ♫ ☺ ♂ ☼ ♠ ☺ ♂ ☺ ♂ ♫ ☼ ☼ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ♂ ♫ ♫ ☼ ♂ ♫ ☼ ♫ ♫ ♫ ☺ ♂ ♫ ♂ ♂ ♫ ♫ ♠ ♫ ♠ ♂ ♠ ♫ ♂ ☼ ♠ ♂ ♂ ☺ ♫ ☼ ☼ ♫ ♫ ♫ ☼ ♂

☼ ♫ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ♠ ♫ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ♫ ☼ ♫ ♠ ♂ ♫ ☼ ♠ ♫ ♂ ♂ ♫ ☼ ☺ ♫ ☺ ☼ ♫ ♫ ☼ ♂ ♫ ♫ ♠ ☼ ☼ ☺ ♫ ♂ ♠ ♫ ♫ ☼ ☼ ♫ ♫ ♫ ♂ ♂ ☼ ♂ ♂ ♫ ☼ ♫ ☼ ♂ ☼ ☼ ♂ ♫ ♫

♫ ♫ ☺ ♫ ♫ ♫ ♂ ♫ ♫ ☺ ♫ ☺ ♂ ☼ ♫ ♫ ☻ ♫ ♠ ♂ ♂ ☼ ♫ ♂ ♂ ♫ ♂ ☼ ☼ ♂ ♫ ♫ ☼ ♫ ♂ ♫ ♂ ♫ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♂ ♫ ♫ ☼ ♫ ☺ ☼ ♂ ☼ ♠ ♠ ♫ ☼ ♫ ♫ ♫ ☼ ♂ ☼ ☼ ☺ ☼ ☺ ♂ ♫

♫ ♠ ♫ ☼ ♂ ☼ ☼ ☼ ☺ ♂ ☼ ☼ ♫ ♫ ♫ ☼ ☼ ☼ ♫ ♂ ♂ ♂ ♫ ♂ ♂ ♫ ♫ ☻ ♣ ♫ ☼ ♫ ♫ ♫ ♂ ☼ ☼ ☼ ♫ ♂ ☻ ☼ ♫ ♂ ♂ ☼ ♂ ☼ ♂ ♫ ☼ ♂ ☼ ☼ ♫ ☼ ☼ ♠ ♫ ☼ ♫ ♂ ♫ ♂ ♂ ☼ ♂ ☼ ♫ ☼ ♂

☼ ♫ ♂ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ☼ ♫ ♫ ♫ ☼ ☻ ♂ ♫ ♫ ♂ ♫ ♫ ☼ ♂ ♂ ♂ ♫ ♫ ☼ ♂ ♠ ♂ ☼ ♫ ♂ ☼ ♂ ♫ ☺ ☺ ♫ ☼ ☼ ♂ ☼ ♫ ☼ ☼ ☼ ♫ ♂ ♫ ♫ ♂ ♂ ♂ ♫ ♂ ♫ ♂ ☺ ☼ ♫ ☼ ♫ ☺ ♫ ♂ ♂ ☼ ♠

♫ ♂ ☼ ☼ ♫ ☺ ☼ ♫ ♫ ♂ ☼ ♠ ♫ ♫ ♂ ☼ ♫ ♂ ☺ ☼ ☺ ☼ ☼ ☼ ♫ ♠ ♫ ♫ ♂ ♫ ☼ ♠ ♣ ☼ ♫ ♂ ☼ ☺ ☼ ☼ ☺ ♫ ☺ ♂ ♠ ♫ ♫ ♂ ☼ ♂ ☼ ♂ ☼ ☼ ♂ ♫ ☺ ♫ ♂ ♂ ☼ ♠ ♂ ♫ ☺ ♂ ♠ ♫ ♂ ♫ ☼

☺ ☼

♫

☼ ☼

♂

☺

♫

☼ ☼ ☼

♠

♂

♠

♫

☼

♂

☺

♫

♂

☼

♫

♂

☼

FIGURA 3.1. Disposición espacial de los símbolos ♠ ♣ ♂ ♫ ☼ ☺☻

Pongamos, por ejemplo, que no estamos implicados en contar los simbolitos de la figura 3.1, sino en encontrar cuántos andaluces fuman, al menos, diez cigarrillos al día. Las conclusiones anteriores son también aplicables aquí: 1. Imaginemos por un momento que hay que salir a la calle y preguntar a cada uno de los 7.314.644 andaluces si fuma y, en el caso de una respuesta afirmativa, si la cantidad supera los nueve cigarrillos al día. ¿Cuánta gente y durante cuánto tiempo se necesitaría para culminar con el objetivo de medición? Para la inmensa mayoría de los mortales es una tarea inabordable. 2. Pero si alguien culminara el trabajo, ¿quién iba a creerse el resultado? Posiblemente, para cuando se hubiera terminado el estudio, parte del conjunto de personas encuestadas ya habría fallecido. Quizá ya no exista el tabaco para entonces. Quizá estén todos y en las mismas condiciones, pero los encuestadores hayan suministrado respuestas imprecisas y errores. Algunos encuestados lo han sido varias veces. A otros no ha habido manera de localizarlos. Así pues, si se culminara el estudio, ¿seguro que el porcentaje facilitado es el correcto? La inmensa mayoría de las ocasiones en las que se pone en marcha una investigación mediante encuestas es imposible o no recomendable trabajar directamente con la población. Se ha comentado la limitación en cuanto a tiempo, esfuerzo y credibilidad en los resultados. Pero hay un mayor número de problemas. Pongamos, por ejemplo, que hay que dar una opinión acerca de los productos que suministra una pastelería. Se va al local y se comen los pasteles. Supongamos también que la tienda está en periodo de prácticas y quería saber si ya podría abrir ese día o no sus puertas al público. Ahora el problema ya no tiene sentido. Ya no hay pasteles que vender. El catador ha terminado con todos. ¿Qué ha ocurrido?: al medir las unidades éstas quedan destruidas o transformadas. Si se mide a toda la población se destruye o transforma en su conjunto, con lo cual se pierde el sentido de la investigación. Con las personas ocurre algo parecido a los pasteles: una vez medidas (encuestadas) no son las mismas. Si abordamos a un conjunto de sujetos que están esperando para adquirir la localidad en un cine que proyecta una película violenta, y les preguntamos sobre la influencia nefasta de ésta en la inteligencia útil del espectador, quizá no vean Investigación a través de los cuestionarios

la película con los mismos ojos que si no les hubiéramos preguntado nada. Así pues, por lo general, no es posible encuestar a toda la población. Pero si fuera posible, los resultados no serían creíbles. Y si fueran creíbles, ya no serían aplicables a la población objetivo, pues ésta habría sido transformada. 2. Solución: encuestar sólo a una muestra 2.1.

A la búsqueda de una solución

En el punto anterior nos planteamos encontrar el número de ♂ que contiene la figura 3.1. Surgió el problema de lo costoso del proceso y el problema quedó sin solución. No obstante, cabe esperar que algunos lectores hayan elaborado ya una estrategia concreta para obtener la medida. Una buena salida es cuadricular la figura 3.1, como consta por ejemplo en la figura 3.3. Todas las cuadrículas cuentan con la misma área y el mismo número de símbolos. En el caso de la figura 3.3, hay 3 x 4 = 12 cuadrículas con 12 x 14 = 168 símbolos por cuadrícula. Podemos escoger una cualquiera y contar el número de veces que aparece. ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♫ ♫ ♠ ♫ ♂

☼ ♫ ☼ ♂ ♫ ♫ ☼ ♠ ♫ ☺ ♂ ♫

♫ ♫ ☺ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ♫

☼ ♫ ☼ ♫ ♠ ♫ ☼ ♂ ♫ ☼ ♫ ♂

♫ ♫ ♫ ♫ ♂ ☼ ♂ ☺ ♂ ☼ ☼ ♂

♫ ☺ ♫ ☼ ♫ ♂ ♫ ☼ ♂ ♫ ♂ ♂

♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ♂

☼ ♂ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼

♫ ♫ ☺ ♫ ♠ ☼ ☼ ♫ ♂ ♂ ☼ ♫

♂ ♂ ♠ ♂ ☼ ☼ ♠ ☼ ♂ ♫ ♂ ☼

☼ ☼ ☺ ☼ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼

☼ ☼ ♂ ♫ ♂ ♫ ♫ ♫ ☼ ☼ ☼ ♂

♫ ♫ ☼ ☺ ♫ ♠ ♂ ♂ ♫ ♂ ☼ ♫

♂ ♫ ☼ ♂ ♫ ♫ ♠ ♂ ♂ ♂ ♫ ♠

FIGURA 3.2. Disposición de los símbolos en la cuadrícula 1.

La primera cuadrícula (fila 1, columna 1) aparece separada en la figura 3.2. Su lectura resulta ahora menos compleja que en el primer ejercicio. Si abordamos el objetivo de encontrar cuántos símbolos ♂ aparecen, el resultado al que debe llegarse es 39. La estrategia continúa suponiendo que esa cantidad (39) viene a ser constante para las doce cuadrículas, por lo que el total debe ser, aproximadamente, 39 x 12 = 468. El procedimiento que hemos puesto en marcha para encontrar solución a la pregunta “¿Cuántos ♂ hay en la figura?”, da pie a establecer una serie de reflexiones de gran trascendencia en las investigaciones mediante encuestas: 1. Dado que la población en su totalidad no es abordable, existe una estrategia que

Investigación a través de los cuestionarios

parte de considerar únicamente una porción de la población, porción que denominamos muestra. 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9

1 ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♫ ♫ ♂ ☼ ☼ ♫ ☼ ♫ ♠ ♫ ♠ ♫ ♂ ♫ ♂ ☼ ♂ ♫ ♫ ☼ ☼ ♂ ♂ ☼ ♫ ♂ ♫ ☺ ☼ ☼ ♫ ♂ ♫ ♂ ♫ ☺ ♫ ♂ ♂ ♂ ♫ ☺ ☺ ♂ ♂ ☼ ☼ ♫ ♂ ☼ ♂ ♂ ♫ ☼ ☼

2 ☼ ♫ ☼ ♂ ♫ ♫ ☼ ♠ ♫ ☺ ♂ ♫ ♫ ♠ ♂ ♫ ♂ ♫ ♫ ☼ ♫ ♂ ♂ ♂ ♂ ☺ ♂ ♂ ♂ ☼ ♠ ☻ ♂ ♫ ♫ ☼ ♂ ♫ ♫ ♫ ♫ ♂ ♂ ♫ ☼ ♫ ☼ ♫ ♂ ♫ ♫ ♂ ☼ ☺ ♫ ♠ ☼ ♂ ☼ ♂ ☼ ♠ ♫ ♂ ♠ ♫ ♫ ♫ ♫

3 ♫ ♫ ☺ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ♫ ♂ ♫ ☼ ☼ ♫ ♫ ♫ ☺ ♂ ☼ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ☼ ♫ ♫ ♠ ☺ ♫ ♫ ♂ ♠ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ♂ ♂ ♂ ♫ ☺ ♂ ☼ ♫ ♫ ♂ ☺ ♫ ♫ ☼ ♂ ♫ ♫ ♠ ☼ ☼ ♫

4 ☼ ♫ ☼ ♫ ♠ ♫ ☼ ♂ ♫ ☼ ♫ ♂ ♂ ♫ ☼ ♂ ☼ ♫ ♫ ☼ ♂ ☼ ♠ ♫ ♂ ☺ ♫ ♫ ♂ ☼ ♫ ☼ ♫ ♂ ♂ ☼ ♫ ♫ ♠ ♫ ♫ ♫ ♫ ♂ ☺ ♂ ♫ ♫ ♫ ☼ ☼ ♫ ♫ ♫ ♂ ♫ ☼ ♣ ♫ ♠ ♫ ♂ ☼ ♫ ♫ ♫ ♂ ♠ ♂

5 ♫ ♫ ♫ ♫ ♂ ☼ ♂ ☺ ♂ ☼ ☼ ♂ ♂ ♂ ♂ ☼ ☼ ☼ ♂ ♫ ♂ ♫ ♠ ♂ ☼ ♫ ♫ ☺ ♫ ☼ ☼ ☼ ♫ ♂ ♂ ♂ ♫ ♫ ♫ ☼ ♂ ☼ ☺ ☼ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♂ ☼ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ☼ ♂ ☼ ♂ ♠ ♫ ☼

6 ♫ ☺ ♫ ☼ ♫ ♂ ♫ ☼ ♂ ♫ ♂ ♂ ♫ ♫ ♂ ☼ ♂ ☼ ♫ ☺ ♫ ♂ ♂ ☼ ☼ ♫ ♫ ☼ ♫ ♫ ☼ ☼ ♂ ♫ ☼ ☺ ♠ ♫ ♫ ♫ ☺ ♂ ☼ ♫ ☻ ☼ ☼ ☺ ♫ ♫ ☺ ☼ ☼ ☼ ♫ ☺ ♫ ♂ ♫ ♠ ♫ ♫ ☺ ♂ ☼ ☺ ♫ ♫ ☼

7 ♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ♂ ☼ ♫ ♂ ☺ ♂ ☼ ☺ ☺ ♠ ♫ ☼ ♂ ☼ ♫ ☼ ☼ ☼ ☺ ♫ ♂ ☺ ♫ ☼ ☺ ♂ ☼ ♫ ♫ ♫ ♫ ☼ ☺ ♂ ♫ ♫ ♫ ☼ ☺ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♠ ♫ ♂ ☼ ☼ ♫ ☼ ♫ ♂ ♫

8 ☼ ♂ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ☼ ♫ ♂ ☼ ♫ ♫ ♫ ♫ ♠ ☺ ☼ ☼ ☼ ♫ ♂ ♫ ♂ ♫ ☼ ☻ ☼ ♫ ☺ ♂ ♫ ☼ ♂ ♫ ♂ ☺ ♫ ☼ ♫ ☼ ♫ ♫ ♂ ☼ ☼ ♫ ♫ ♂ ☺ ♠ ♫ ♫ ♂ ♫ ♫ ♠ ♂ ♂ ♫ ♫ ♂

9 ♫ ♫ ☺ ♫ ♠ ☼ ☼ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♫ ♫ ♫ ♂ ♫ ♂ ☺ ☺ ♂ ♫ ♂ ♫ ☼ ♂ ♂ ♠ ♫ ☼ ♫ ♫ ♠ ♂ ♂ ♫ ♂ ♂ ♫ ☺ ♫ ♫ ♂ ♂ ☼ ♫ ☺ ♫ ☼ ♫ ♫ ♫ ☼ ☼ ☼ ☺ ♫ ♫ ♂ ♫ ♂

10 ♂ ♂ ♠ ♂ ☼ ☼ ♠ ☼ ♂ ♫ ♂ ☼ ♫ ♫ ♫ ♂ ♂ ☺ ♠ ☼ ♫ ☺ ♂ ♂ ☺ ♫ ♂ ☼ ♫ ♫ ♂ ♂ ♫ ♂ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼ ☼ ☺ ♂ ☺ ♂ ☺ ☼ ♂ ♫ ♫ ♠ ♫ ☼ ♫ ♂ ♂ ♂ ♫ ♠ ♂ ☼

11 ☼ ☼ ☺ ☼ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼ ♫ ♫ ♫ ♂ ♫ ☼ ♫ ♫ ☼ ♠ ♂ ♠ ♂ ♫ ♫ ☼ ♫ ☼ ♫ ☼ ♫ ♫ ♫ ☼ ♣ ☺ ♣ ☺ ♂ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ♂ ♂ ♠ ♫ ♂ ♫ ☼ ♫ ♫ ♫ ☼ ♠ ♂ ♫ ♫ ♂ ♂ ♫ ♫ ♂

12 ☼ ☼ ♂ ♫ ♂ ♫ ♫ ♫ ☼ ☼ ☼ ♂ ☼ ♂ ☼ ♫ ♂ ♫ ♂ ☼ ♂ ☼ ☼ ☼ ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♠ ♂ ♫ ☼ ♠ ♂ ☼ ☼ ☼ ♂ ☺ ♫ ☼ ☼ ♫ ☺ ♫ ♫ ♫ ♫ ☼ ♠ ♂ ♫ ☼ ♂ ☼ ♂ ♂ ♫ ☼ ♫ ☼ ☼ ♂ ♫ ♫ ♫

13 ♫ ♫ ☼ ☺ ♫ ♠ ♂ ♂ ♫ ♂ ☼ ♫ ☺ ☼ ♫ ♠ ♂ ♫ ☼ ♫ ☼ ♠ ♫ ♂ ☼ ♫ ♂ ♫ ♂ ♫ ☼ ♫ ♫ ♠ ♂ ♠ ♫ ♂ ♂ ♫ ♫ ♂ ♫ ☼ ♫ ♫ ☼ ♂ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ☺ ♂ ♫ ☺ ♠ ♂ ☼ ♂ ♫ ☺ ♂ ♫ ♫ ♫

14 ♂ ♫ ☼ ♂ ♫ ♫ ♠ ♂ ♂ ♂ ♫ ♠ ☼ ♫ ♂ ♫ ☼ ♣ ☼ ♂ ♂ ♫ ☼ ☼ ♫ ☼ ♂ ♂ ♂ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼ ☺ ♫ ☼ ♫ ☺ ♠ ♫ ☼ ♠ ♫ ♂ ♫ ☼ ♫ ☼ ☼ ☼ ♫ ♫ ♫ ☼ ♫ ☺ ♂ ☼

1 ♫ ♂ ♫ ♂ ♂ ☼ ♫ ☺ ♫ ♂ ♂ ♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ☼ ♂ ♂ ♫ ☺ ♫ ☼ ♂ ♫ ♫ ♫ ♂ ☼ ♂ ☼ ☼ ♂ ☼ ☺ ♂ ♂ ♂ ♂ ♠ ☺ ☼ ☼ ♫ ♠ ☼ ♠ ♫ ☺ ♫ ♫ ♠ ♂ ☼ ♂ ♂ ♂ ☺ ♠ ♫ ☻ ☼ ♫

2 ♫ ♂ ♫ ☺ ☼ ♫ ♂ ♂ ♂ ☺ ♫ ♫ ☺ ♂ ☼ ♂ ♫ ☼ ☺ ♫ ♫ ♫ ☼ ♫ ♂ ♫ ♫ ♠ ♂ ♠ ♫ ♠ ♫ ☺ ♫ ♠ ♫ ♫ ♫ ♫ ♂ ♫ ☼ ♫ ♂ ♫ ☼ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ♂ ♂ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ☼ ♫ ♂ ∋ ♫ ♫

3 ♂ ♫ ♂ ☼ ♫ ♫ ♫ ♫ ♠ ♂ ♫ ♂ ☺ ♂ ♫ ♠ ☺ ♂ ♫ ♫ ♫ ♫ ♫ ♂ ♫ ☼ ☼ ♂ ☺ ♫ ♫ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ♫ ♫ ♫ ♂ ♫ ♠ ☼ ♂ ♫ ☺ ♠ ☼ ♫ ♂ ♫ ♂ ♂ ♫ ♫ ☼ ♫ ☼ ♠ ♫ ♫ ♫ ♫ ♂ ♫ ♫ ♂

4 ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♫ ♫ ☺ ♫ ☼ ☼ ♫ ♂ ☺ ☼ ☺ ♫ ☻ ♫ ♫ ♠ ♠ ♂ ♫ ♫ ♫ ♫ ♫ ☼ ☼ ♂ ♂ ☺ ♂ ♫ ♂ ♂ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♂ ☼ ☺ ♂ ☼ ☼ ☼ ♠ ☺ ♫ ☺ ☼ ♫ ♫ ♠ ♂ ☼ ☼ ☼ ♂ ♫ ♠

5 ♫ ♂ ☼ ♠ ☼ ♠ ♫ ☼ ♂ ♫ ☼ ♂ ♫ ♂ ☼ ♫ ♂ ☼ ☼ ☼ ☼ ♫ ♫ ♫ ♫ ♫ ☼ ☼ ☺ ♠ ☼ ♫ ♫ ☼ ☼ ☼ ☼ ♠ ☼ ♫ ♠ ♫ ♫ ♠ ♂ ♂ ♫ ☼ ☼ ☼ ♂ ♫ ☺ ♫ ♂ ♫ ♫ ☼ ♂ ☼ ♂ ☺ ♫ ♫ ♫ ♠ ♂ ♫ ♫

Investigación a través de los cuestionarios

6 ♫ ♂ ☼ ☼ ♂ ☼ ♂ ♫ ☼ ♂ ♫ ☼ ☼ ♫ ♫ ☼ ☺ ☼ ♫ ☺ ☼ ♫ ♫ ♫ ♠ ♫ ♫ ☼ ☼ ♂ ♂ ♫ ♫ ♂ ♠ ☼ ♫ ♂ ☼ ♫ ♫ ♫ ☼ ♫ ♂ ♫ ♫ ☼ ♫ ♂ ♠ ♫ ♂ ♂ ♫ ♫ ☺ ☼ ♂ ☼ ♠ ☼ ♫ ♫ ♫ ♫ ♂ ♫ ♫

7 ♂ ☼ ☼ ☼ ♫ ☼ ☺ ♂ ♂ ☼ ♂ ☼ ♂ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♫ ☺ ♫ ☼ ♫ ♂ ♂ ☼ ♂ ☺ ☼ ☼ ☼ ♫ ☼ ♂ ♠ ♫ ♫ ♫ ☼ ♂ ☼ ♫ ♫ ♠ ♂ ♫ ♫ ☺ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ☼ ♫ ♫ ♫ ☼ ♫ ♂ ♂ ♂ ☼ ☼ ♫

8 ☺ ♫ ♂ ☼ ♠ ☼ ♫ ☼ ♠ ♫ ♂ ☼ ♫ ♫ ☺ ☺ ♂ ♫ ☼ ♂ ☺ ☺ ♂ ☼ ♫ ♫ ♫ ♂ ♠ ☼ ♫ ♠ ♫ ♫ ☺ ♂ ☺ ♂ ☼ ☺ ☺ ♂ ♫ ♫ ♂ ☼ ♂ ♫ ♫ ☼ ♠ ☼ ♫ ☼ ☼ ♫ ♂ ♂ ♫ ♫ ♫ ☼ ♂ ♂ ♂ ☺ ♫ ♂ ♫

9 ☼ ♂ ♫ ♂ ☼ ♂ ♣ ☼ ♫ ♫ ♫ ☺ ♂ ☼ ♠ ☺ ♂ ☺ ♂ ♫ ☼ ☼ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ♂ ♫ ♫ ☼ ♂ ♫ ☼ ♫ ♫ ♫ ☺ ♂ ♫ ♂ ♂ ♫ ♫ ♠ ♫ ♠ ♂ ♠ ♫ ♂ ☼ ♠ ♂ ♂ ☺ ♫ ☼ ☼ ♫ ♫ ♫

10 ☼ ♫ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ♠ ♫ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ♫ ☼ ♫ ♠ ♂ ♫ ☼ ♠ ♫ ♂ ♂ ♫ ☼ ☺ ♫ ☺ ☼ ♫ ♫ ☼ ♂ ♫ ♫ ♠ ☼ ☼ ☺ ♫ ♂ ♠ ♫ ♫ ☼ ☼ ♫ ♫ ♫ ♂ ♂ ☼ ♂ ♂ ♫ ☼ ♫ ☼ ♂ ☼ ☼ ♂

11 ♫ ♫ ☺ ♫ ♫ ♫ ♂ ♫ ♫ ☺ ♫ ☺ ♂ ☼ ♫ ♫ ☻ ♫ ♠ ♂ ♂ ☼ ♫ ♂ ♂ ♫ ♂ ☼ ☼ ♂ ♫ ♫ ☼ ♫ ♂ ♫ ♂ ♫ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♂ ♫ ♫ ☼ ♫ ☺ ☼ ♂ ☼ ♠ ♠ ♫ ☼ ♫ ♫ ♫ ☼ ♂ ☼ ☼ ☺ ☼ ☺

12 ♫ ♠ ♫ ☼ ♂ ☼ ☼ ☼ ☺ ♂ ☼ ☼ ♫ ♫ ♫ ☼ ☼ ☼ ♫ ♂ ♂ ♂ ♫ ♂ ♂ ♫ ♫ ☻ ♣ ♫ ☼ ♫ ♫ ♫ ♂ ☼ ☼ ☼ ♫ ♂ ☻ ☼ ♫ ♂ ♂ ☼ ♂ ☼ ♂ ♫ ☼ ♂ ☼ ☼ ♫ ☼ ☼ ♠ ♫ ☼ ♫ ♂ ♫ ♂ ♂ ☼ ♂ ☼ ♫

13 ☼ ♫ ♂ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ☼ ♫ ♫ ♫ ☼ ☻ ♂ ♫ ♫ ♂ ♫ ♫ ☼ ♂ ♂ ♂ ♫ ♫ ☼ ♂ ♠ ♂ ☼ ♫ ♂ ☼ ♂ ♫ ☺ ☺ ♫ ☼ ☼ ♂ ☼ ♫ ☼ ☼ ☼ ♫ ♂ ♫ ♫ ♂ ♂ ♂ ♫ ♂ ♫ ♂ ☺ ☼ ♫ ☼ ♫ ☺ ♫ ♂ ♂

14 ♫ ♂ ☼ ☼ ♫ ☺ ☼ ♫ ♫ ♂ ☼ ♠ ♫ ♫ ♂ ☼ ♫ ♂ ☺ ☼ ☺ ☼ ☼ ☼ ♫ ♠ ♫ ♫ ♂ ♫ ☼ ♠ ♣ ☼ ♫ ♂ ☼ ☺ ☼ ☼ ☺ ♫ ☺ ♂ ♠ ♫ ♫ ♂ ☼ ♂ ☼ ♂ ☼ ☼ ♂ ♫ ☺ ♫ ♂ ♂ ☼ ♠ ♂ ♫ ☺ ♂ ♠ ♫ ♂

1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9

10 11 12

♂ ☺ ♫ ♂ ☺ ☼ 1 2

♫ ♂ ♫ 3

☺ ☼ ♂ ☺ ☼ ☺ ♫ ♂ ♂ ☺ ♫ ☼ ♠ ☼ ♫ ♂ ♂ ☼ ☼ ☼ ♂ ♫ ♂ ♂ ♫ ♫ ☼ ☼ ♂ ☺ ♫ ☼ ☼ ☼ ♠ ♂ 4 5 6 7 8 9 10 11 12 13 14 1

♫ ♫ ♠ 2

♫ ♫ ♫ 3

♂ ♠ ♫ 4

♠ ♫ ☼ 5

♂ ♂ ♂ 6

♫ ☺ ☺ 7

♫ ♫ ♫ 8

☼ ♫ ♂ ☼ ☼ ♫ 10 ♂ ♫ ♫ ♂ ♠ ☼ 11 ♂ ☼ ♫ ♫ ♂ ☼ 12 9 10 11 12 13 14

FIGURA 3.3. Cuadriculado de la disposición espacial de los símbolos ♠ ♣ ♂ ♫ ☼ ☺☻

2. La investigación se realiza sobre la muestra, no sobre la población. No obstante, es esta última la que interesa, por lo que debe ponerse en marcha algún procedimiento para el camino de vuelta. En otros términos, una vez obtenidos los resultados al nivel de la muestra, debe responderse a la pregunta clave ¿qué se habría obtenido de haber realizado las mediciones directamente en la población? En el ejemplo se han obtenido 39 ocurrencias de ♂ en la muestra y hemos supuesto que, de haber medido directamente la población, se habría obtenido 468 observaciones de ♂. 3. Es razonable pensar que la calidad del camino de vuelta dependa en muy buena medida de cómo se ha realizado el de ¡da. En otros términos, no basta con extraer una muestra, sino que el procedimiento de selección de ésta debe cumplir con determinadas características. El objetivo es garantizar, a través del procedimiento de selección, que la muestra sea representativa de la población, es decir, que los resultados que se consigan al nivel de la muestra sean razonablemente extrapolables a la población a la que representa o sustituye en el estudio. 4. No se ha medido directamente la población. En su lugar se ha puesto en marcha una estrategia. Como resultado final, cabe esperar algún error durante el camino de vuelta, ya que la población no tiene por qué coincidir con la estimación que se hace de ella. En el ejemplo, se supone la existencia de 468 símbolos ♂, cuando realmente hay 473. La diferencia entre el valor de la medida en la población y la medida en la muestra (468 - 473 = 5) se desconoce en la práctica (conocer el valor en la población es el objetivo de la investigación), pero cabe esperar que no sea muy elevado. Esta esperanza es tanto mayor cuanto mejor se ha seleccionado la muestra. 3.2.

Representatividad de las muestras

Hasta el momento hemos hecho explícito la intención de obtener una medida en la población. Dado que esto no ha sido posible, se ha seleccionado una muestra y realizado la medición en ella. La cuestión es que este proceder es recomendable sólo si la muestra es representativa de la población que interesa en el estudio. En el fondo, la representatividad se refiere a que la muestra reúna las características

Investigación a través de los cuestionarios

más importantes de la población de cara a los objetivos del estudio. Pongamos por caso que queremos averiguar la opinión que un colectivo determinado tiene con respecto a la integración de la mujer al mundo laboral. Es razonable suponer que el sexo del encuestado puede influir en las respuestas. Si la muestra contiene una proporción más elevada de mujeres o de hombres que la población de interés, los resultados obtenidos pueden no ser representativos. En tal caso se dice que la muestra está sesgada con respecto a la variable sexo. Una solución puede consistir en forzar que en la muestra existan las mismas proporciones de hombres y mujeres que en la población. Esto es posible. Pero pongamos por caso que existen sospechas de que el nivel socioeconómico sea una variable también influyente en la opinión sobre la integración laboral de la mujer. En tal situación, debería procurarse que la repartición de esa variable en la muestra fuera un fiel reflejo de su distribución en la población. También es posible, si bien el diseño del muestreo comienza a complicarse. Si se establecen cinco categorías para el nivel socioeconómico, se debe conseguir 2 x 5 = 10 subconjuntos de la población en la muestra. ¿Qué ocurre si la edad también quiere ser considerada? ¿Y la experiencia laboral? ¿Y el nivel y tipo de estudios? Es más, quizá existan variables importantes de las que el investigador no suponga influencia alguna. Quizá el color de los ojos o la longitud del cabello, por ejemplo. Está claro que es imposible considerar a todas las variables con algún tipo de repercusión sobre los objetivos de medida en la investigación. Entonces, ¿cómo garantizar una muestra representativa? Respuesta: mediante el azar. Si lanzamos una moneda al aire y dejamos que caiga, una vez que permanece inmóvil mostrará una de sus dos caras. Será la cara A o la cara B. Si realizamos 100 lanzamientos, cabría esperar que aproximadamente en 50 ocasiones se haya obtenido A y en las 50 restantes B. En este último resultado no ha intervenido la intención de quien tira la moneda al aire. Quizá en los tres primeros lanzamientos se ha obtenido sólo A. Pero conforme se ha continuado con la experiencia y si la moneda está equilibrada, el resultado se ha ido acercando progresivamente a un porcentaje del 50% para ambas caras. Se puede repartir a 1.000 personas en dos grupos de 500 personas cada uno. Si la repartición es aleatoria (se lanza una moneda al aire para decidir en qué grupo va cada

Investigación a través de los cuestionarios

sujeto), cabe esperar que las proporciones de mujeres y hombres en cada grupo sean equiparables en ambos grupos. Igualmente debe ocurrir con cualquier otra variable: color de ojos, edad, número de calzado, aspiraciones políticas, cantante preferido, etc. Por esta razón se establece que una muestra, para ser considerada representativa, ha debido de ser obtenida mediante un procedimiento aleatorio. No obstante el azar es eso, azar. Su comportamiento es imprevisible con total exactitud. Por esta razón, los procedimientos de muestreo, aun basándose en la selección aleatoria, establecen ciertas restricciones para garantizar el control específico de algunas variables. Así, por ejemplo, en la investigación que nos ocupa en este punto se pueden extraer dos muestras totalmente aleatorias: una de hombres y otra de mujeres, con la cantidad de sujetos necesaria en cada caso para que la proporción de las categorías de sexo coincidan con exactitud en muestra y población. Más adelante se abordarán los diferentes procedimientos al uso para obtener muestras aleatorias, bien sea con o sin restricciones o controles específicos. Lo que nos importa aquí es comprender la importancia del azar para garantizar la representatividad de una muestra. Esta importancia es la que fundamenta muchos aspectos en la investigación por muestreo, como lo es la selección de los encuestados, el comportamiento del encuestador, incluso el análisis de datos posterior. 3.2.

Fases en la obtención de una muestra

La selección de una muestra concreta y no otra, corresponde a un macroapartado dentro del marco más amplio de la investigación en su conjunto. Como cabe esperar que ocurra, los pasos iniciales de la investigación y la especificación de los objetivos, bañan todo el proceso hasta el establecimiento final de conclusiones, sin que el diseño de la muestra sea una excepción. Así pues, el esquema básico de una investigación por muestreo debe consistir en la culminación de los siguientes puntos (un esquema mucho más completo y extenso puede encontrarse en Campoy, 1980: 1. Definición de los objetivos del estudio. 2. Definición de la población o colectivo de interés, que pasa por responder a cuatro preguntas básicas: - Qué: cuál es el contenido de la población, es una población de qué, cuáles son

Investigación a través de los cuestionarios

los elementos básicos que la conforman. - Cómo: en qué va a ser medida la población, cuál es su unidad de contenido (unidad de muestreo: familias, instituciones, etc.). “Las unidades de muestreo deben ser definidas de forma tal que su identificación sea inequívoca, no exista solapamiento entre ellas, a cada unidad se le pueda asignar una probabilidad para su posible selección, y que la totalidad de las unidades de muestreo coincida con la población que pretendemos estudiar” (Sánchez Crespo, 1967: 24). - Dónde: qué extensión, volumen o número de unidades de muestreo abarca, o bien cuál es el espacio de referencia. - Cuándo: en qué momento del tiempo (período de referencia), sea puntual o especificado en un intervalo. Un caso: alumnos de la Universidad de Sevilla, en grupos de clase, durante el curso académico 1992/1993. 3. Especificación de qué variables deben medirse en las unidades seleccionadas. 4. Consideración de los recursos reales a disposición del equipo investigador: en qué condiciones se desarrolla el trabajo y qué potencial y limitaciones existen a niveles personales, materiales, económicos y temporales. “Cada diseño real representa una adaptación de la teoría de muestreo a los problemas existentes y a los recursos de que se dispone” (Kish, 1982: 46). 5. Obtención, revisión y primeras depuraciones del marco o soporte de información sobre la población (listas, directorios, mapas, referencias de otras investigaciones, etc.). 6. Construcción o selección y modificación de la/s herramienta/s de recogida de datos. 7. Diseño del muestreo: “El diseño de la muestra es una programación preparada de antemano destinada a recopilar y analizar la información necesaria para satisfacer los objetivos del estudio al más bajo costo posible” (Lininger y Warwick, 1984: 69). - En función de los puntos 1 a 5, decisión sobre el modelo o tipo de muestreo que va a ser aplicado. - Decisión acerca del tamaño de la muestra.

Investigación a través de los cuestionarios

- Confección del listado con las unidades de muestreo que se seleccionan, salvo en los diseños de muestreo donde las unidades concretas son seleccionadas sobre la marcha, durante el trabajo de campo. - Redacción del programa de operaciones o planificación temporalizada de la fase de recogida de datos. 8. Formación

capacitación

los

entrevistadores,

encuestadores

experimentadores (en general, agentes). El agente no sólo es la persona que realiza una entrevista personal con quien facilita los datos, puede ser también el encargado de repartir, instruir y recoger cuestionarios en un entorno natural. Las consecuencias de un muestreo inadecuado son igualmente desastrosas en cualquier procedimiento de investigación científica. Asimismo, las implicaciones en el análisis de datos, con respecto a qué diseño de muestreo fue realizado, son idénticas en trabajos de entorno natural o de laboratorio a la hora de manejar estimaciones de los valores poblacionales. 9. Recogida de datos. Supervisión de la labor de los agentes. Resolución de problemas prácticos (problemas de marco, personas que rehúsan responder, errores de los agentes, ...). Antes de esta etapa, puede ser de mucho interés realizar un ensayo previo o estudio piloto donde se prueban el procedimiento, el marco, los agentes y la herramienta. 10. Revisión de los datos recogidos: incoherencias, errores en la codificación o trascripción, decisión sobre nuevos problemas de marco. Si la cantidad de datos es muy voluminosa puede ser recomendable utilizar métodos generales de revisión automática (medios informáticos) para todo el conjunto de datos. Para una muestra aleatoria de éstos se realiza una revisión y seguimiento de errores mucho más minuciosa (Aparicio, 1991). 11. Conclusiones operativas útiles para futuras investigaciones en el mismo o similar entorno, en lo que se refiere a la obtención y trabajo con la muestra. A grandes rasgos, estos puntos son aspectos cronológicamente ordenados. No obstante, los saltos son continuos en función de las necesidades del momento. Así, por ejemplo, la construcción de un cuestionario puede estar en función no sólo directamente de los recursos y definición de la población y variables a medir, sino también del tamaño de la muestra y la preparación de los agentes, aspectos que limitan

Investigación a través de los cuestionarios

sensiblemente la longitud del cuestionario e influyen sobre su estructura. Asimismo, los problemas de marco inundan toda la investigación desde sus fases iniciales; la resolución de inconvenientes fácticos derivados del marco puede durar casi tanto como la investigación misma. Por otro lado, en los estudios de las ciencias sociales, la población (y, por tanto, la muestra) está constituida, en último término, por personas; el marco está construido, facilitado, estudiado y depurado por personas; los investigadores, agentes, entidades financieras, colaboradoras, comerciales, los codificadores y transcriptores, etc. son o están constituidos por personas; y, por último, quienes facilitan los datos de las mediciones son también personas. En este entorno, no es posible realizar un buen estudio, planificación y diseño de muestreo y trabajo de campo, sin plantearse el contacto con todas estas personas, para que llegue a ser lo más exitoso y lo menos problemático posible, a través de la consideración de factores como la motivación, el trato o el refuerzo (Fazeli y otros, 1990). Al respecto, quizá los eslabones más frágiles de la cadena sean los encuestadores y los encuestados (Noelle, 1970). 3.3.

Conclusión

El trabajo de campo es uno de los apartados más voluminosos y costosos en toda investigación no exclusivamente teórica. Es una fase en la que los aspectos prácticos dominan claramente la situación. Las limitaciones temporales y sobre todo económicas, imponen serias restricciones a diseños ideales de recogida de datos (Cochran, 1976; Raj, 1980; Manheim, 1982). Por ello, la obtención de una muestra a través de un diseño de muestreo adecuado no sólo permite ajustarse a las limitaciones prácticas (lo que posibilita el estudio), sino que también permite concentrar los esfuerzos personales, temporales y económicos en un estudio de mayor calidad y exactitud, derivando finalmente en unas conclusiones más fiables (Kalton, 1987). Como señala Raj (op. cit.: 36), “es curioso que se espere que los resultados de una encuesta por muestreo bien planeada y ejecutada sean más exactos (más cercanos al objetivo de estudio) que los que proceden de un censo completo”, afirmación compartida por otros autores (por ejemplo, Yates, 1981). 4. Acerca del tamaño de la muestra 4.1.

Importancia del concepto

Sin duda alguna, uno de los aspectos que antes preocupan a un investigador que se Investigación a través de los cuestionarios

enfrenta a un estudio que requiere selección de una muestra es el tamaño de ésta (Feigl, 1978; Teijeiro, 1990; Sudman, 1983; Kalton, 1987; Fink y Kosecoff, 1989; Czaja y Blair, 1996). La decisión sobre el número de unidades a seleccionar no siempre está bien fundada y, por el contrario, frecuentemente se encuentra en función de criterios como la comodidad o el hábito (Manzano, 1996). Observemos la figura 3.6. En ella se ha realizado un cuadriculado más pequeño que en el caso de la figura 3.3. Como resultado, se han obtenido 8 x 6 = 48 porciones o posibles muestras de la población de símbolos. Indudablemente, seleccionar una muestra compuesta por una única cuadrícula y contar las ocurrencias del símbolo ♂, es mucho más rápido y cómodo en la figura 3.6 que en la 3.3. No obstante, esta comodidad conlleva consecuencias desastrosas. Para obtener una idea de lo que se está tratando, seleccionaremos la primera cuadrícula (figura 3.4). ♫ ♫ ♫ ♂ ♫ ♫

☼ ♫ ☼ ♂ ♫ ♫

♫ ♫ ☺ ♫ ♫ ♫

☼ ♫ ☼ ♫ ♠ ♫

♫ ♫ ♫ ♫ ♂ ☼

♫ ☺ ♫ ☼ ♫ ♂

♫ ♫ ♠ ☼ ☼ ♫

FIGURA 3.4. Ampliación de la primera cuadrícula de la figura 3.6.

En ella, se obtiene un monto de 4 ocurrencias para ♂, de un total de 42 símbolos. Luego la estimación para la población es de 4 x 48 = 192 unidades ♂. Se observa la discrepancia entre la cantidad estimada (192) y la real (473). Dos cuadrículas más a la derecha (figura 3.5) se cuentan 12 ocurrencias para ♂, lo que implica una estimación de 12 x 48 = 576 unidades ♂ para la población. Observemos la enorme distancia entre las estimaciones desde dos muestras provenientes de la misma población: 192 y 576. ♫ ♂ ♫ ♂ ♂ ☼

♫ ♂ ♫ ☺ ☼ ♫

♂ ♫ ♂ ☼ ♫ ♫

♫ ♫ ♂ ♂ ☼ ♫

♫ ♂ ☼ ♠ ☼ ♠

♫ ♂ ☼ ☼ ♂ ☼

♂ ☼ ☼ ☼ ♫ ☼

FIGURA 3.5. Ampliación de la cuadrícula tercera de la figura 3.6.

El problema origen de estas discrepancias es un tamaño de muestra excesivamente pequeño. En el apartado anterior se menciona la utilidad del azar para garantizar la Investigación a través de los cuestionarios

representatividad de la muestra. No obstante, esta garantía decrece rápidamente conforme el número de ensayos disminuye.

1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8

1 ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♫ ♫ ♂ ☼ ☼ ♫ ☼ ♫ ♠ ♫ ♠ ♫ ♂ ♫ ♂ ☼ ♂ ♫ ♫ ☼ ☼ ♂ ♂ ☼ ♫ ♂ ♫ ☺ ☼ ☼ ♫ ♂ ♫ ♂ ♫ ☺ ♫ ♂ ♂ ♂ ♫ ☺ ☺ ♂ ♂ ☼ ☼ ♫ ♂ ☼ ♂ ♂ ♫ ☼

2 ☼ ♫ ☼ ♂ ♫ ♫ ☼ ♠ ♫ ☺ ♂ ♫ ♫ ♠ ♂ ♫ ♂ ♫ ♫ ☼ ♫ ♂ ♂ ♂ ♂ ☺ ♂ ♂ ♂ ☼ ♠ ☻ ♂ ♫ ♫ ☼ ♂ ♫ ♫ ♫ ♫ ♂ ♂ ♫ ☼ ♫ ☼ ♫ ♂ ♫ ♫ ♂ ☼ ☺ ♫ ♠ ☼ ♂ ☼ ♂ ☼ ♠ ♫ ♂ ♠ ♫ ♫ ♫

3 ♫ ♫ ☺ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ♫ ♂ ♫ ☼ ☼ ♫ ♫ ♫ ☺ ♂ ☼ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ☼ ♫ ♫ ♠ ☺ ♫ ♫ ♂ ♠ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ♂ ♂ ♂ ♫ ☺ ♂ ☼ ♫ ♫ ♂ ☺ ♫ ♫ ☼ ♂ ♫ ♫ ♠ ☼ ☼

4 ☼ ♫ ☼ ♫ ♠ ♫ ☼ ♂ ♫ ☼ ♫ ♂ ♂ ♫ ☼ ♂ ☼ ♫ ♫ ☼ ♂ ☼ ♠ ♫ ♂ ☺ ♫ ♫ ♂ ☼ ♫ ☼ ♫ ♂ ♂ ☼ ♫ ♫ ♠ ♫ ♫ ♫ ♫ ♂ ☺ ♂ ♫ ♫ ♫ ☼ ☼ ♫ ♫ ♫ ♂ ♫ ☼ ♣ ♫ ♠ ♫ ♂ ☼ ♫ ♫ ♫ ♂ ♠

5 ♫ ♫ ♫ ♫ ♂ ☼ ♂ ☺ ♂ ☼ ☼ ♂ ♂ ♂ ♂ ☼ ☼ ☼ ♂ ♫ ♂ ♫ ♠ ♂ ☼ ♫ ♫ ☺ ♫ ☼ ☼ ☼ ♫ ♂ ♂ ♂ ♫ ♫ ♫ ☼ ♂ ☼ ☺ ☼ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♂ ☼ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ☼ ♂ ☼ ♂ ♠ ♫

6 ♫ ☺ ♫ ☼ ♫ ♂ ♫ ☼ ♂ ♫ ♂ ♂ ♫ ♫ ♂ ☼ ♂ ☼ ♫ ☺ ♫ ♂ ♂ ☼ ☼ ♫ ♫ ☼ ♫ ♫ ☼ ☼ ♂ ♫ ☼ ☺ ♠ ♫ ♫ ♫ ☺ ♂ ☼ ♫ ☻ ☼ ☼ ☺ ♫ ♫ ☺ ☼ ☼ ☼ ♫ ☺ ♫ ♂ ♫ ♠ ♫ ♫ ☺ ♂ ☼ ☺ ♫ ♫

7 ♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ♂ ☼ ♫ ♂ ☺ ♂ ☼ ☺ ☺ ♠ ♫ ☼ ♂ ☼ ♫ ☼ ☼ ☼ ☺ ♫ ♂ ☺ ♫ ☼ ☺ ♂ ☼ ♫ ♫ ♫ ♫ ☼ ☺ ♂ ♫ ♫ ♫ ☼ ☺ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♠ ♫ ♂ ☼ ☼ ♫ ☼ ♫ ♂

8 ☼ ♂ ♫ ♫ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ☼ ♫ ♂ ☼ ♫ ♫ ♫ ♫ ♠ ☺ ☼ ☼ ☼ ♫ ♂ ♫ ♂ ♫ ☼ ☻ ☼ ♫ ☺ ♂ ♫ ☼ ♂ ♫ ♂ ☺ ♫ ☼ ♫ ☼ ♫ ♫ ♂ ☼ ☼ ♫ ♫ ♂ ☺ ♠ ♫ ♫ ♂ ♫ ♫ ♠ ♂ ♂ ♫ ♫

9 ♫ ♫ ☺ ♫ ♠ ☼ ☼ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♫ ♫ ♫ ♂ ♫ ♂ ☺ ☺ ♂ ♫ ♂ ♫ ☼ ♂ ♂ ♠ ♫ ☼ ♫ ♫ ♠ ♂ ♂ ♫ ♂ ♂ ♫ ☺ ♫ ♫ ♂ ♂ ☼ ♫ ☺ ♫ ☼ ♫ ♫ ♫ ☼ ☼ ☼ ☺ ♫ ♫ ♂ ♫

10 ♂ ♂ ♠ ♂ ☼ ☼ ♠ ☼ ♂ ♫ ♂ ☼ ♫ ♫ ♫ ♂ ♂ ☺ ♠ ☼ ♫ ☺ ♂ ♂ ☺ ♫ ♂ ☼ ♫ ♫ ♂ ♂ ♫ ♂ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼ ☼ ☺ ♂ ☺ ♂ ☺ ☼ ♂ ♫ ♫ ♠ ♫ ☼ ♫ ♂ ♂ ♂ ♫ ♠ ♂

11 ☼ ☼ ☺ ☼ ♫ ☼ ♫ ♫ ☼ ☼ ♫ ☼ ♫ ♫ ♫ ♂ ♫ ☼ ♫ ♫ ☼ ♠ ♂ ♠ ♂ ♫ ♫ ☼ ♫ ☼ ♫ ☼ ♫ ♫ ♫ ☼ ♣ ☺ ♣ ☺ ♂ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ♂ ♂ ♠ ♫ ♂ ♫ ☼ ♫ ♫ ♫ ☼ ♠ ♂ ♫ ♫ ♂ ♂ ♫ ♫

12 ☼ ☼ ♂ ♫ ♂ ♫ ♫ ♫ ☼ ☼ ☼ ♂ ☼ ♂ ☼ ♫ ♂ ♫ ♂ ☼ ♂ ☼ ☼ ☼ ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♠ ♂ ♫ ☼ ♠ ♂ ☼ ☼ ☼ ♂ ☺ ♫ ☼ ☼ ♫ ☺ ♫ ♫ ♫ ♫ ☼ ♠ ♂ ♫ ☼ ♂ ☼ ♂ ♂ ♫ ☼ ♫ ☼ ☼ ♂ ♫ ♫

13 ♫ ♫ ☼ ☺ ♫ ♠ ♂ ♂ ♫ ♂ ☼ ♫ ☺ ☼ ♫ ♠ ♂ ♫ ☼ ♫ ☼ ♠ ♫ ♂ ☼ ♫ ♂ ♫ ♂ ♫ ☼ ♫ ♫ ♠ ♂ ♠ ♫ ♂ ♂ ♫ ♫ ♂ ♫ ☼ ♫ ♫ ☼ ♂ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ☺ ♂ ♫ ☺ ♠ ♂ ☼ ♂ ♫ ☺ ♂ ♫ ♫

14 ♂ ♫ ☼ ♂ ♫ ♫ ♠ ♂ ♂ ♂ ♫ ♠ ☼ ♫ ♂ ♫ ☼ ♣ ☼ ♂ ♂ ♫ ☼ ☼ ♫ ☼ ♂ ♂ ♂ ♂ ☼ ♫ ♫ ♫ ♂ ☼ ♠ ♫ ♂ ♫ ♫ ♂ ☼ ☼ ☺ ♫ ☼ ♫ ☺ ♠ ♫ ☼ ♠ ♫ ♂ ♫ ☼ ♫ ☼ ☼ ☼ ♫ ♫ ♫ ☼ ♫ ☺ ♂

1 ♫ ♂ ♫ ♂ ♂ ☼ ♫ ☺ ♫ ♂ ♂ ♫ ♫ ♠ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ♂ ☼ ♂ ♂ ♫ ☺ ♫ ☼ ♂ ♫ ♫ ♫ ♂ ☼ ♂ ☼ ☼ ♂ ☼ ☺ ♂ ♂ ♂ ♂ ♠ ☺ ☼ ☼ ♫ ♠ ☼ ♠ ♫ ☺ ♫ ♫ ♠ ♂ ☼ ♂ ♂ ♂ ☺ ♠ ♫ ☻ ☼

2 ♫ ♂ ♫ ☺ ☼ ♫ ♂ ♂ ♂ ☺ ♫ ♫ ☺ ♂ ☼ ♂ ♫ ☼ ☺ ♫ ♫ ♫ ☼ ♫ ♂ ♫ ♫ ♠ ♂ ♠ ♫ ♠ ♫ ☺ ♫ ♠ ♫ ♫ ♫ ♫ ♂ ♫ ☼ ♫ ♂ ♫ ☼ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ♂ ♂ ♫ ☼ ♫ ♫ ♫ ♫ ♫ ☼ ♫ ♂ ∋ ♫

3 ♂ ♫ ♂ ☼ ♫ ♫ ♫ ♫ ♠ ♂ ♫ ♂ ☺ ♂ ♫ ♠ ☺ ♂ ♫ ♫ ♫ ♫ ♫ ♂ ♫ ☼ ☼ ♂ ☺ ♫ ♫ ♫ ♫ ♫ ♫ ♫ ♫ ☺ ♫ ♫ ♫ ♂ ♫ ♠ ☼ ♂ ♫ ☺ ♠ ☼ ♫ ♂ ♫ ♂ ♂ ♫ ♫ ☼ ♫ ☼ ♠ ♫ ♫ ♫ ♫ ♂ ♫ ♫

4 ♫ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ♫ ♫ ☺ ♫ ☼ ☼ ♫ ♂ ☺ ☼ ☺ ♫ ☻ ♫ ♫ ♠ ♠ ♂ ♫ ♫ ♫ ♫ ♫ ☼ ☼ ♂ ♂ ☺ ♂ ♫ ♂ ♂ ☼ ♫ ☼ ♫ ♫ ♫ ♫ ♂ ☼ ☺ ♂ ☼ ☼ ☼ ♠ ☺ ♫ ☺ ☼ ♫ ♫ ♠ ♂ ☼ ☼ ☼ ♂ ♫

5 ♫ ♂ ☼ ♠ ☼ ♠ ♫ ☼ ♂ ♫ ☼ ♂ ♫ ♂ ☼ ♫ ♂ ☼ ☼ ☼ ☼ ♫ ♫ ♫ ♫ ♫ ☼ ☼ ☺ ♠ ☼ ♫ ♫ ☼ ☼ ☼ ☼ ♠ ☼ ♫ ♠ ♫ ♫ ♠ ♂ ♂ ♫ ☼ ☼ ☼ ♂ ♫ ☺ ♫ ♂ ♫ ♫ ☼ ♂ ☼ ♂ ☺ ♫ ♫ ♫ ♠ ♂ ♫

Investigación a través de los cuestionarios

6 ♫ ♂ ☼ ☼ ♂ ☼ ♂ ♫ ☼ ♂ ♫ ☼ ☼ ♫ ♫ ☼ ☺ ☼ ♫ ☺ ☼ ♫ ♫ ♫ ♠ ♫ ♫ ☼ ☼ ♂ ♂ ♫ ♫ ♂ ♠ ☼ ♫ ♂ ☼ ♫ ♫ ♫ ☼ ♫ ♂ ♫ ♫ ☼ ♫ ♂ ♠ ♫ ♂ ♂ ♫ ♫ ☺ ☼ ♂ ☼ ♠ ☼ ♫ ♫ ♫ ♫ ♂ ♫

7 ♂ ☼ ☼ ☼ ♫ ☼ ☺ ♂ ♂ ☼ ♂ ☼ ♂ ♫ ♫ ♫ ♂ ☼ ♫ ♫ ♫ ☺ ♫ ☼ ♫ ♂ ♂ ☼ ♂ ☺ ☼ ☼ ☼ ♫ ☼ ♂ ♠ ♫ ♫ ♫ ☼ ♂ ☼ ♫ ♫ ♠ ♂ ♫ ♫ ☺ ♫ ♂ ♂ ☼ ♫ ♫ ♫ ☼ ♫ ♫ ♫ ☼ ♫ ♂ ♂ ♂ ☼ ☼

8 ☺ ♫ ♂ ☼ ♠ ☼ ♫ ☼ ♠ ♫ ♂ ☼ ♫ ♫ ☺ ☺ ♂ ♫ ☼ ♂ ☺ ☺ ♂ ☼ ♫ ♫ ♫ ♂ ♠ ☼ ♫ ♠ ♫ ♫ ☺ ♂ ☺ ♂ ☼ ☺ ☺ ♂ ♫ ♫ ♂ ☼ ♂ ♫ ♫ ☼ ♠ ☼ ♫ ☼ ☼ ♫ ♂ ♂ ♫ ♫ ♫ ☼ ♂ ♂ ♂ ☺ ♫ ♂

9 ☼ ♂ ♫ ♂ ☼ ♂ ♣ ☼ ♫ ♫ ♫ ☺ ♂ ☼ ♠ ☺ ♂ ☺ ♂ ♫ ☼ ☼ ♫ ♫ ♫ ☼ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ♂ ♫ ♫ ☼ ♂ ♫ ☼ ♫ ♫ ♫ ☺ ♂ ♫ ♂ ♂ ♫ ♫ ♠ ♫ ♠ ♂ ♠ ♫ ♂ ☼ ♠ ♂ ♂ ☺ ♫ ☼ ☼ ♫ ♫

10 ☼ ♫ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ♠ ♫ ♫ ♫ ♂ ☼ ☼ ♂ ♂ ♫ ♫ ☼ ♫ ♠ ♂ ♫ ☼ ♠ ♫ ♂ ♂ ♫ ☼ ☺ ♫ ☺ ☼ ♫ ♫ ☼ ♂ ♫ ♫ ♠ ☼ ☼ ☺ ♫ ♂ ♠ ♫ ♫ ☼ ☼ ♫ ♫ ♫ ♂ ♂ ☼ ♂ ♂ ♫ ☼ ♫ ☼ ♂ ☼ ☼

11 ♫ ♫ ☺ ♫ ♫ ♫ ♂ ♫ ♫ ☺ ♫ ☺ ♂ ☼ ♫ ♫ ☻ ♫ ♠ ♂ ♂ ☼ ♫ ♂ ♂ ♫ ♂ ☼ ☼ ♂ ♫ ♫ ☼ ♫ ♂ ♫ ♂ ♫ ♠ ♫ ♫ ♫ ♂ ♫ ♫ ☼ ♂ ♫ ♫ ☼ ♫ ☺ ☼ ♂ ☼ ♠ ♠ ♫ ☼ ♫ ♫ ♫ ☼ ♂ ☼ ☼ ☺ ☼

12 ♫ ♠ ♫ ☼ ♂ ☼ ☼ ☼ ☺ ♂ ☼ ☼ ♫ ♫ ♫ ☼ ☼ ☼ ♫ ♂ ♂ ♂ ♫ ♂ ♂ ♫ ♫ ☻ ♣ ♫ ☼ ♫ ♫ ♫ ♂ ☼ ☼ ☼ ♫ ♂ ☻ ☼ ♫ ♂ ♂ ☼ ♂ ☼ ♂ ♫ ☼ ♂ ☼ ☼ ♫ ☼ ☼ ♠ ♫ ☼ ♫ ♂ ♫ ♂ ♂ ☼ ♂ ☼

13 ☼ ♫ ♂ ☼ ☼ ♫ ♂ ♫ ♫ ♫ ☼ ♫ ♫ ♫ ☼ ☻ ♂ ♫ ♫ ♂ ♫ ♫ ☼ ♂ ♂ ♂ ♫ ♫ ☼ ♂ ♠ ♂ ☼ ♫ ♂ ☼ ♂ ♫ ☺ ☺ ♫ ☼ ☼ ♂ ☼ ♫ ☼ ☼ ☼ ♫ ♂ ♫ ♫ ♂ ♂ ♂ ♫ ♂ ♫ ♂ ☺ ☼ ♫ ☼ ♫ ☺ ♫ ♂

14 ♫ ♂ ☼ ☼ ♫ ☺ ☼ ♫ ♫ ♂ ☼ ♠ ♫ ♫ ♂ ☼ ♫ ♂ ☺ ☼ ☺ ☼ ☼ ☼ ♫ ♠ ♫ ♫ ♂ ♫ ☼ ♠ ♣ ☼ ♫ ♂ ☼ ☺ ☼ ☼ ☺ ♫ ☺ ♂ ♠ ♫ ♫ ♂ ☼ ♂ ☼ ♂ ☼ ☼ ♂ ♫ ☺ ♫ ♂ ♂ ☼ ♠ ♂ ♫ ☺ ♂ ♠ ♫

1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8

9 ☼ ♫ 10 ♂ ☺ 11 ♫ ♂ 12 ☺ ☼ 1 2

♫ ♫ ♂ ♫ 3

♂ ☼ ☼ ♫ ♂ ♂ ☼ ♂ ♫ ♫ ☼ ♫ ☺ ☼ ♂ ☺ ☼ ☺ ♫ ♂ ♂ ☺ ♫ ☼ ♠ ☼ ♫ ♂ ♂ ☼ ☼ ☼ ♂ ♫ ♂ ♂ ♫ ♫ ☼ ☼ ♂ ☺ ♫ ☼ ☼ ☼ ♠ ♂ 4 5 6 7 8 9 10 11 12 13 14 1

♫ ♫ ♫ ♠ 2

♂ ♫ ♫ ♫ 3

♠ ♂ ♠ ♫ 4

♫ ♠ ♫ ☼ 5

♫ ♂ ♂ ♂ 6

♫ ♫ ☺ ☺ 7

♫ ♫ ♫ ♫ 8

♫ ♂ ☺ ♫ ♂ ♂ 9 ☼ ♫ ♂ ☼ ☼ ♫ 10 ♂ ♫ ♫ ♂ ♠ ☼ 11 ♂ ☼ ♫ ♫ ♂ ☼ 12 9 10 11 12 13 14

FIGURA 3.6. Cuadriculado de la disposición espacial de los símbolos en 48 porciones ♠ ♣ ♂ ♫ ☼ ☺☻

Así, al lanzar un millón de veces una moneda al aire, cabe esperar un porcentaje de cada cara del 50%. Pero si la moneda es lanzada sólo cuatro veces, nadie se echaría las manos a la cabeza si apareciera la cara A en las cuatro ocasiones. Son resultados esperables por mero azar cuando el número de ensayos es tan pequeño. Está claro, pues, que una muestra demasiada pequeña no puede considerarse representativa. Pero ello no debe llevar a la creencia de que la mejor regla para el tamaño de una muestra es mejor que sea más bien grande (Jollife, 1986). Si bien las muestras son, con frecuencia, demasiado pequeñas (Kachelmeier y Messier, 1990), otras veces son demasiado grandes, y ambos extremos son usualmente fatales (Stuart, 1984). Si es pequeña (con respecto a lo que debería), no confiamos suficientemente en el control inespecífico del azar y los resultados son poco creíbles. Si es grande (con respecto a lo que debería), implica un despilfarro innecesario de medios personales, temporales y económicos e, incluso, una disminución del control efectivo sobre la situación del trabajo de campo, por lo que los resultados también serían poco creíbles. En definitiva, se requiere obtener un tamaño óptimo. 4.2.

Algunos consejos

La solución sobre el tamaño más apropiado de la muestra en la investigación mediante encuestas es harto complicada, puesto que requiere el conocimiento y el control de múltiples variables (Manzano, 1996). No obstante, sí que se pueden indicar algunos principios generales útiles: 1. Debe considerarse el procedimiento de muestreo utilizado. Los procedimientos difieren entre sí en varios aspectos, entre los que se encuentra la variación de resultados posibles que son capaces de generar. Un procedimiento que suministre un intervalo reducido de variación es preferible a otro con el que se puede obtener cualquier cosa. En la comparación de procedimientos que se abordarán posteriormente se entrará de nuevo en esta cuestión. Lo importante aquí es que en función del procedimiento utilizado debe recurrirse a una u otra expresión de cálculo para el tamaño de la muestra.

Investigación a través de los cuestionarios

2. Debe quedar bien definido el grupo de variables importantes del estudio. En las investigaciones mediante encuestas se recurre a cuestionarios con multitud de preguntas. No todas son igualmente relevantes. Incluso, siempre hay algunas que se pregunta por si acaso y considerando que son fáciles de hacer y responder. En principio debería calcularse un tamaño de muestra para cada objetivo de medida (estimar la proporción de respuestas afirmativas a la pregunta 12, estimar una diferencia entre las medias de respuesta a la pregunta 8 por sexos, etc.). Pero tal proceder es muy laborioso, especialmente sin el auxilio de herramientas de software. Sin embargo, sí debería realizarse una estimación independiente del tamaño de muestra para cada una de las preguntas u objetivos de medida que se consideren especialmente importantes. No debe ocurrir que, tras realizar el trabajo de campo, nos encontremos con que la estimación para un objetivo de interés especial, es muy frágil, pues la muestra era demasiado pequeña para ese objetivo (si bien, puede ser adecuada para otras estimaciones, dentro del mismo estudio). 3. La exigencia sobre la cuantía concreta del tamaño óptimo no es ciega al contexto. Unas pocas entrevistas más o menos no representan ninguna diferencia apreciable ni en el tiempo empleado en la recogida de los datos, ni en el coste del trabajo de campo, ni en la seguridad en los resultados. A su vez, ese intervalo de variación aceptable para el tamaño de la muestra crece conforme disminuyen las exigencias de control en el estudio. Así, por ejemplo, en los estudios piloto las exigencias de control están relajadas, por lo que carece de sentido emprender la búsqueda de un tamaño de muestra preciso. Los estudios piloto se realizan como un ensayo general que pretende probar el cuestionario, los encuestadores y cualquier otro elemento del proceso. También se utiliza para recoger información previa de la población, necesaria para calcular el tamaño de la muestra definitiva, como lo es alguna medida de variación de las características en la población. 4. La utilización de tablas para calcular el tamaño no es muy recomendable. Fomentan la salida fácil o cómoda, en detrimento de una solución adecuada. El cálculo del tamaño más recomendable no implica mucho tiempo. Incluso la fórmula más compleja llevará pocos minutos a un inexperto. Algo más difícil es tomar decisiones previas al cálculo del tamaño, como las cuantías para el nivel de significación, el error de precisión, las varianzas poblacionales, etc. En definitiva, no merece la pena escatimar esfuerzos en la fase para el cálculo del tamaño de la muestra. Lo único

Investigación a través de los cuestionarios

que implica es un poco de tiempo para el investigador responsable de esta decisión. Si no se culmina adecuadamente, las consecuencias sí pueden ser negativas, en términos de costes y/o credibilidad en los resultados obtenidos. 5. Por último, uno de los aspectos que los investigadores noveles suelen pasar por alto es la previsión de estimaciones independientes para diversos colectivos. Cuando se establecen distinciones entre elementos de la población puede ser para aumentar la representatividad de la muestra (como en el muestreo estratificado) o para establecer conclusiones del estudio en cada uno de los subcolectivos o dominios considerados en la población. En este segundo caso debe considerarse que cada dominio o subconjunto es una población en sí y que, por tanto, requerirá una muestra por separado. Tal circunstancia elevará con mucha diferencia el tamaño final de la muestra. 4.3.

Expresiones de cálculo

Seguidamente se explicitan algunas expresiones de cálculo. Corresponden a cuatro modelos básicos de selección de muestras que se tratarán algo más adelante en este mismo capítulo. Se supone que la estimación es de una media. En el caso de que sea una proporción bastará con sustituir la varianza S 2 por la que corresponde a las proporciones π (1 − π ) . Las expresiones contemplan tamaños finitos en la población. Es lo que ocurre en investigación mediante encuestas. Sólo en las situaciones de poblaciones muy grandes (y lo grandes que deben ser depende del contexto de estimación) son aplicables las expresiones de cálculo para poblaciones infinitas. Pero recogerlas aquí implicaría duplicar el espacio dedicado al tamaño de muestra en un texto cuyos objetivos son más amplios. En las siguientes expresiones de cálculo se utilizan los siguientes símbolos: N : número de elementos en la población.

N c : número de conglomerados en la población. N i : número de elementos en el estrato i poblacional.

n : número de elementos en la muestra. nc : número de conglomerados en la muestra.

σ 2 : varianza de la característica en la población. Investigación a través de los cuestionarios

σ i2 : varianza de la característica en la población, en el estrato i. σ e2 : varianza de la característica entre los conglomerados de la población. σ d2 : varianza de la característica dentro de los conglomerados de la población. Z α 2 : medida estandarizada del riesgo de errar en la estimación. Así, con una

probabilidad de errar de = 0,05, en una distribución normal, corresponde una distancia estandarizada de 1,96. e p : error de precisión o radio del intervalo de estimación.

δ : grado de correlación u homogeneidad entre conglomerados. Muestreo aleatorio simple: n=

N e ( N − 1) 2 p

σ 2 ⋅ Z α2 2

Muestreo estratificado:

[∑ ( N

−σi )

]

 ep ⋅ N    + N − σ i2  Zα 2  ∑ i  

(

)

Muestreo de conglomerados monoetápico (la segunda expresión corresponde al caso en el que se desconozca un valor aproximado para δ ): n=

Nc e ⋅ ( N c − 1) 2 p

  N   − 1 + 1     Nc

σ 2 ⋅ Z α2 2 δ 

NC e ⋅ ( N c − 1)

= +

Nc N

2 p

 N / 2 − Nc  N    − 1 + 1    N − Nc  Nc

σ 2 ⋅ Z α2 2 

Nc N

Muestreo de conglomerados con submuestreo (bietápico):

N ⋅ nc ⋅ σ d2   e 2  p 2 2 N c − nc     N c ⋅ σ d + ( N − N c ) nc −σe Nc −1    Z α 2   

Si se desconoce σ d2 , sustituir por σ 2 − σ e2 .

Investigación a través de los cuestionarios

Si se desconoce σ e2 , sustituir por

σ 2 Nc  N / 2 − Nc  N N

   − 1 + 1     N − Nc  Nc

5. Muestras no aleatorias Los procedimientos de obtención de muestras mediante estrategias no aleatorias no suelen estar muy bien vistos en ciencia. La razón es sencilla: no sólo la representatividad está en tela de juicio, sino que no se cuenta con un procedimiento objetivo de extrapolar los resultados a la población. La estrategia preferida en ciencia para el camino de vuelta es el cuerpo de conocimiento que se ha denominado inferencia estadística. No es posible hacer inferencia estadística si la muestra no se ha obtenido mediante un procedimiento aleatorio. No obstante, las muestras no aleatorias tienen su función especial. Por un lado, existen ocasiones en que no es posible extraer una muestra aleatoria, como es el caso de poblaciones cuyas unidades se desconocen o se trasladan continuamente. Además, los procedimientos no aleatorios suelen implicar menos tiempo, esfuerzo y dinero. Por esta razón, se aplican en situaciones en las que se exige un bajo control a la investigación, especialmente si la intención es tener una primera impresión de la situación, como en estudios piloto y en multitud de estudios en el ámbito comercial. Una posible taxonomía de muestreos no aleatorios es: 1. Sin norma, circunstancial o errático (Azorín, 1969): la muestra se toma sin seguir un criterio claro, sin tener en cuenta consideraciones especiales para la obtención de la muestra (Cyert y Davidson, 1965). El control por parte del investigador sobre las fuerzas que actúan en la selección es nulo o casi inexistente. Es un muestreo casual y fortuito (los primeros en llegar ... ). Es, únicamente, un trozo de población. Para Ostle (1970), este apartado no es un tipo de muestreo, ya que por definición una muestra es una parte de la población seleccionada de acuerdo con algún criterio, regla o plan. Un tipo con un criterio muy cuestionable es el deliberado o por segmentos (Chou, 1972): se escoge el segmento más accesible de la población. Criterio: la comodidad. Un ejemplo de selección basada en la accesibilidad es la selección de subpoblaciones previamente dispuestas, como los grupos de clase o colectivos definidos en un espacio y estructura concretos: determinados pacientes en un hospital, un barrio concreto, etc. Otro tipo de muestreo fortuito, muy Investigación a través de los cuestionarios

extendido especialmente en el ámbito académico, es el de voluntarios, calificado de “muestreo realmente terrible” por Bradburn y Sudman (1988: 137). 2. Selección experta o de juicio (Särndal y otros, 1992), donde el investigador acude a un experto (que puede ser él mismo) que utiliza sus prejuicios, experiencia y conocimientos previos, para decidir qué unidades deben ser incluidas en la muestra por ser los elementos más representativos de la población. La selección experta es preferida a la aleatoria en los casos en que la muestra debe poseer muy pocos elementos y no se aspira a una inferencia probabilística (por ejemplo, en algunos estudios piloto). Cuando la muestra es pequeña, la estimación probabilística es muy imprecisa (el intervalo de estimación es muy amplio) y pierde utilidad. En esta situación se confía más en la apreciación de un experto que en el azar. El conocimiento de experto no desaparece en los modelos de muestreo aleatorio, aunque no puede sustituir otros procedimientos de medida objetivos (Hansen y otros, 1993). Es un componente de gran utilidad, pues consigue reunir información pertinente para aumentar la representatividad de la muestra. La diferencia estriba en que en el muestreo de experto, el conocimiento de éste es el componente decisorio, mientras que en los modelos aleatorios, el conocimiento del experto es una información complementaria con respecto al procedimiento que es, en esencia, aleatorio. La selección propiamente de experto y algunas variantes de ésta son denominadas también modelo intencional u opinático (Azorín, 1969) o aplicando criterio (Raj, 1980). 3. En el muestreo por cuotas se combina el muestreo de experto con el circunstancial (Barnett, 1974), generando un procedimiento no aleatorio, pero sofisticado, de amplio uso (Derdo, 1980; Särndal y otros, op. cit.). Inicialmente se recoge información sobre algunas variables poblacionales con respecto a las que podría realizarse un muestreo estratificado. No obstante, la etapa de selección aleatoria es sustituida por un procedimiento basado en la subjetividad del encuestador. A éste se le suministra una tabla de contingencia, en la que figura el número de encuestados que debe conseguir con perfiles determinados. Si bien se puede recoger información más o menos compleja acerca de la distribución de bastantes variables poblacionales, en la práctica esta información se circunscribe únicamente a la edad y el sexo (Rodríguez Osuna, 1991). Dentro de cada subpoblación (por ejemplo, varones de 25 a 35 años), la selección se realiza por juicio del

Investigación a través de los cuestionarios

encuestador e intervienen factores ajenos a éste y no aleatorios, como por ejemplo sus preferencias personales. Es un tipo de muestreo muy utilizado en sondeos comerciales y que suele dar resultados satisfactorios. Pero si bien puede ser más rápido y barato que un muestreo probabilístico, presenta la desventaja de que no permite que se realicen inferencias científicas en función de la estadística, por lo que no es recomendable en estudios a partir de los cuales deban tomarse decisiones importantes (Rodríguez Osuna, 1991). 4. Muestreo por bola de nieve (Noelle, 1970; Harvatopoulos, Livan y Sarnin, 1992): se comienza a encuestar a unos pocos seleccionados, bien sea por su condición de expertos o por criterios de disponibilidad. Tales contactos llevan a otros, aumentando progresivamente el tamaño de la muestra hasta completar la cantidad prefijada. Un caso paradigmático sobre cómo un muestreo no aleatorio puede resultar muy útil es el de la selección necesaria de colegios electorales durante un sondeo de intención de voto el mismo día de las elecciones: existen determinados colegios electorales que han mostrado, en ocasiones similares anteriores, resultados muy parecidos a los totales de su provincia. Los expertos (en este caso los especialistas de la empresa consultora) seleccionan estas unidades necesariamente, es decir, sin que medie un procedimiento aleatorio

precisamente,

intención

este

proceder

aumentar

representatividad de la muestra. 6. Muestreo aleatorio Los diseños aleatorios, probabilísticos o al azar se caracterizan básicamente por dos aspectos (Sánchez Crespo, 1967; Raj, 1980; Aparicio, 1991; Harvatopoulos y otros, 1992; Särndal y otros, 1992; Czaja y Blair, 1996): -

Las unidades de muestreo de la población tienen una probabilidad conocida y distinta de cero de ser seleccionadas.

La selección se realiza mediante un procedimiento que respeta tales probabilidades.

El objetivo “respetar las probabilidades” transciende el contexto teórico del diseño. De hecho, para que el muestreo sea probabilístico no sólo hay que respetar las probabilidades cuando se diseña un método de selección, sino también cuando se realiza el estudio en el trabajo de campo. Es en el trabajo de campo cuando las Investigación a través de los cuestionarios

circunstancias prácticas puede llegar a distanciar tanto el muestreo diseñado del real y provocar que se pierda la condición de muestra probabilística (Rodríguez Osuna, 1991), lo que puede ocurrir, por ejemplo, si el comportamiento de los encuestadores es subjetivo. En la práctica de la investigación por encuestas se parte de una misma probabilidad de selección para todas las unidades de la población. El procedimiento de construcción de la muestra debe comportarse de tal modo que la probabilidad de selección de un habitante de un pueblo sea la misma que la de alguien que vive en la ciudad, la misma para hombres y mujeres, zonas de la periferia o del centro, etc. En tales casos se habla de muestras autoponderadas. Es una forma de indicar que el peso de todos los individuos es el mismo. Si los de la ciudad tuvieran mayor probabilidad de pertenecer a la muestra que los del medio rural, los primeros se encontrarían sobre representados, frente a la subrepresentación de los segundos. En tales casos, la muestra ya no sería autoponderada y debería ponerse en marcha un proceso de ponderación o equilibración previo al análisis de datos, tal y como se abordará más adelante en el apartado específico sobre este tema. El proceso de inferencia o estimación estadística es un procedimiento establecido en función de criterios probabilísticos. Para que pueda aplicarse una inferencia estadística sobre los resultados obtenidos con una muestra, es necesario que la selección de ésta se haya efectuado por algún proceso aleatorio (Aparicio, 1991: 11). En caso contrario no puede realizarse una estimación probabilística; es decir, no puede conocerse el margen de error, en términos de probabilidad, al afirmar que la estimación es o no acertada (Deming, 1966; Sánchez Crespo, 1967; Chou, 1969; Mills, 1969; Stoetzel y Girard, 1973; Cochran, 1976; McRae, 1978; Kish, 1982; Rodríguez Osuna, 1991). Existe una amplia variedad de muestreos probabilísticos, especialmente los diseños mixtos y multitud de variaciones. Sin embargo, unas pocas categorías abarcan, con mejor o peor suerte, a todos estos modelos. Éstas serán las tratadas en el presente apartado: muestreo aleatorio simple, estratificado y de conglomerados monoetápico, con las variantes del muestreo de dominios y de conglomerados con submuestreo. 6.1.

Muestreo aleatorio simple

La denominación muestreo aleatorio simple es la más usual en la literatura. No obstante, se encuentran otros sinónimos como muestreo irrestricto aleatorio o muestreo

Investigación a través de los cuestionarios

probabilístico de elementos. Es el modelo más simple de la serie (Babbie, 1973; Barnett, 1974; Frankel, 1983; Sudman, 1983; Morsy, 1989; Silva, 1993) y, a su vez, la base teórica sobre la que se asienta el resto (Yates, 1981; Martínez Arias, 1995b), de forma que constituye el fundamento más trascendente de la teoría de muestreo (Kish, 1982; Stuart, 1984; Mirás, 1985; Levy y Lemeshow, 1991; Rodríguez Osuna, 1991). Es, sin duda alguna, el procedimiento más simple de concebir, si bien en la práctica es quizá el más difícil de implementar al enfrentarse con las imperfecciones del marco o base de datos (Gorden, 1980; Bradburn y Sudman, 1988), según se verá en el último apartado de este capítulo. Tal es el caso que “en investigación por encuestas es virtualmente imposible producir la muestra aleatoria perfecta” (Hutton, 1992: 9), por lo que no es un modelo utilizado usualmente (Hansen y otros, 1993) más que en poblaciones pequeñas (Abad y Servín, 1978). El procedimiento estándar para la consecución de una muestra aleatoria simple parte de contar con un marco, listado o base de datos perfecta en la que se encuentra toda la información necesaria sobre la identidad de las unidades de la población. Mediante un procedimiento aleatorio son seleccionadas n unidades de la base de datos, de la que se obtiene también la información sobre dónde se encuentran localizadas estas unidades. El trabajo de campo consiste en establecer comunicación (personal, telefónica o por correo) con las unidades y realizar la encuesta. Así, por ejemplo, las unidades pueden corresponder a personas concretas, identificadas y numeradas. Un procedimiento automático, como un programa de ordenador o la consulta repetida a tablas de números aleatorios, genera una secuencia de n números aleatorios: son las identificaciones numéricas de los sujetos seleccionados. Para realizar una selección aleatoria existen, pues, varios recursos. Con la intención de ser útiles, en el anexo 1 se encuentra una tabla de números aleatorios. En el muestreo aleatorio simple, las unidades de muestreo coinciden con los elementos de la población. Además, todos son equiprobables. Estas dos características simplifican mucho los cálculos y las expresiones sobre las estimaciones. Suelen distinguirse únicamente dos tipos: 1. Sin reemplazo o sin reposición: los elementos de una muestra son todos diferentes, no existen repeticiones. 2. Con reemplazo o con reposición: los elementos de la población pueden ser

Investigación a través de los cuestionarios

seleccionados, en teoría, más de una vez para la misma muestra, es decir, existe la posibilidad de encontrar en una muestra el mismo elemento en más de una ocasión. Desde el punto de vista de las deducciones teóricas, los modelos con o sin reemplazo se traducen en independencia o dependencia, respectivamente, en las probabilidades de selección, aspectos que llevan a expresiones diferentes para la estimación de las medidas poblacionales. Pero desde la práctica de la investigación de encuestas, un modelo con reemplazo carece de sentido. Se argumenta que conforme el tamaño de la población tiende a ser infinito, la probabilidad de repetición de unidades tiende a ser cero. Considerando que las expresiones algebraicas para el muestreo con reposición son más sencillas, se entiende la tendencia a escoger este modelo, especialmente cuando el tamaño de la población es relativamente grande. Sin embargo, la distinción con/sin reemplazo es artificial y de difícil aplicación conceptual en la práctica de la investigación por encuestas. Partiendo de un modelo sin reposición, el único coherente en investigación social, se llega a expresiones que contienen al tamaño de la población como variable independiente. Deducidas las expresiones cuando N → ∞ , se llegan a los formatos que corresponden para modelos con reemplazo. Con ello, el dilema con/sin reposición es totalmente sustituido desde la discusión de tamaños de población grandes o pequeños, aspecto este último que sí resulta planteable en investigación por encuestas. Un ejemplo real concreto puede consistir en seleccionar alumnos desde la base de datos de una universidad. En tal estudio, el marco es bueno: contiene la identificación de cada alumno así como su localización tanto particular como del centro, curso y asignaturas en las que se encuentra matriculado. 6.2.

Muestreo sistemático con arranque aleatorio

Si de una población que consta de N elementos (tamaño N) se quiere conseguir una muestra de tamaño n, el muestreo sistemático selecciona, a partir del elemento j-ésimo inclusive, n elementos separados entre sí por la misma cantidad de k elementos ordenados aleatoriamente. Por ejemplo, si N = 500, n = 50, y se comienza por el sexto sujeto (j=6) de la lista, marco o base de datos, serán seleccionadas las unidades que ocupan las posiciones

Investigación a través de los cuestionarios

6, 16, 26,36 ... 476, 486 y 496 La extracción no implica, pues, n selecciones aleatorias, sino tan sólo una: la primera unidad. Además, el arranque j también es un número aleatorio entre 1 y k = N/n. La expresión N/n es denominada coeficiente de elevación. Suele indicarse que el período o salto sistemático (que coincide con el número de muestras posibles) es k = N/n. No obstante, puede ocurrir que N/n no sea un número entero, es decir, que N no sea múltiplo exacto de n. En ese caso k debe aproximarse a la parte entera de N/n (simbolizado por I(N/n) o de esta cantidad más uno. Para cualquier caso, las expresiones que hemos deducido son: - Período (opcionales): k = I ( N n ) o k = I ( N n ) + 1 - El tamaño real de la muestra n' será, para cualquiera de los anteriores valores de k:

n' = N k o n' = I ( N k ) + 1 si N k ≠ I ( N k ) - El número k de muestras totales estará dividido en:

N − k (n'−1) muestras de tamaño n' kn'− N muestras de tamaño n' - 1

Cuando N/n = I(N/n) y el marco se encuentra dispuesto de forma aleatoria, el muestreo sistemático es equivalente al aleatorio simple. Con el marco en disposición aleatoria, pero con N/n ≠ I(N/n), se puede producir un sesgo en favor de unas muestras (más numerosas, con un elemento más) que con otras. No obstante, cuando n ≥ 50 (Mirás, 1986) estas diferencias son despreciables. Si el marco no está dispuesto aleatoriamente en su conjunto, pero sí por estratos, el sistemático da los mismos resultados que el estratificado. Otra perspectiva asemeja el muestreo sistemático con el de conglomerados (Jolliffe, 1986). Por último, si el marco no está dispuesto aleatoriamente, sino que puede guardar algún tipo de periodicidad o tendencia, el muestreo sistemático, aunque posea arranque aleatorio, no es aleatorio ni representativo y, por tanto, no resulta válido para realizar inferencias probabilísticas. Por ejemplo, si la mayoría de las familias de una población están compuestas por dos padres y dos hijos y constan en el padrón por ese orden, ocurrirá que un periodo de k = 4 llevará a seleccionar mayoritariamente padres o

Investigación a través de los cuestionarios

mayoritariamente hijos, con lo que la muestra resultante estará sesgada en cualquiera de ambas direcciones. 6.3.

Muestreo estratificado

En el muestreo estratificado se establecen restricciones a la selección enteramente aleatoria. La conciencia de que existen variables con influencia sobre la característica que se pretende medir, lleva a ejercer un control específico. Con respecto a la variable con influencia (sexo, edad, nivel de estudios ... ) se establecen h categorías. Para cada categoría se extrae una muestra aleatoria de la población. Por ejemplo, si la variable que interesa controlar es la edad, considerando las categorías joven, adulto y anciano, se extraerá una muestra de J jóvenes, D adultos y A ancianos. De esta forma, la muestra final tendrá un tamaño de cuantía n = J + D + A. Cada uno de los subconjuntos generados por la variable de control se denomina estrato. La denominación recuerda al ámbito de la geología, donde un estrato se corresponde con una capa homogénea. De hecho, cabe esperar que los individuos se parezcan más entre sí dentro de los estratos y difieran más de unos estratos a otros, con respecto a la característica que se pretende medir. La distinción entre estratos, si se conocen medidas poblacionales en éstos, permite reducir el error tipo (Gorden, 1980; Levy y Lemeshow, 1991) y, con ello, disminuye el tamaño requerido para la muestra (American Institute of Certified Public Accountants, 1973; 1974b) Conocer las medidas de los estratos poblacionales puede ser uno de los objetivos del estudio, con independencia de que también interesen medidas del conjunto de la población. No obstante, en tal caso, cabría utilizar con más propiedad la denominación muestreo de dominios. El objetivo de la estratificación es aumentar las garantías de representatividad y reducir la variación posible de la característica, consiguiendo un tamaño de muestra más reducido. Si se pretende establecer conclusiones independientes

por

estratos,

éstos

deben

considerarse

como

poblaciones

independientes, definición del muestreo de dominios. Se llama afijación al procedimiento de reparto de las unidades de muestreo en los diferentes estratos que componen la muestra. Existen varios procedimientos de afijación, cada uno de ellos con determinadas consecuencias para la estimación: 1. Uniforme o igual: todos los estratos son del mismo tamaño en la muestra. Rara vez Investigación a través de los cuestionarios

se utiliza, pues ignora los tamaños poblacionales, información de la que puede disponerse. En términos de precisión en la estimación, esta afijación favorece a los estratos poblacionales pequeños y perjudica a los de mayor tamaño. Si la población cuenta, por ejemplo, con 10.000 mujeres y 500 hombres y son seleccionados 100 sujetos de cada colectivo, de cada cinco hombres será seleccionado uno, mientras que sólo se contará con una de cada cien mujeres. Queda clara la diferencia en términos de representatividad de los colectivos en la muestra. 2. Proporcional: el tamaño del estrato i en la muestra ni es proporcional al tamaño del estrato en la población N i . Es decir: ni N i = n N

ni n = = f Ni N

donde n / N = f es denominada fracción de muestreo que, se observa, coincide con el inverso del coeficiente de elevación. En el ejemplo de hombres y mujeres, si son seleccionadas 105 personas para la muestra, éstas deberían corresponder a 100 mujeres y 5 hombres, de tal forma que en ambos colectivos se respeta la misma fracción de muestreo ( f = 0,01 o 1%). Gracias a la estrategia de mantener la fracción de muestreo constante para todos los estratos, ocurre que todas las unidades de la población tienen la misma probabilidad f de ser seleccionadas. Así, en la estimación de la población en su conjunto, no es necesario ponderar las unidades de la muestra en función del estrato al que pertenezcan. Por esta razón, se denomina a estas muestras estratificadas con afijación proporcional muestras autoponderadas. Más adelante abordaremos el tema de la ponderación. 3. De varianza mínima (también llamado afijación de Neyman): para un determinado tamaño fijo de la muestra, se calculan los tamaños de cada estrato ni de tal forma que la varianza de la muestra sea la más pequeña posible. El método establecido para el cálculo de estos ni necesita de las varianzas poblacionales, es decir, hay que conocerlas o estimarlas de algún modo (estudios previos, por ejemplo). Consigue mayor precisión que la afijación proporcional, pero sólo bajo la suposición de que las varianzas de los estratos poblacionales están bien estimadas. Como indica Cochran (1976) y Frankel (1983), si bien es el trabajo de Neyman (1934) el

Investigación a través de los cuestionarios

que justifica la denominación de este procedimiento, la obra de Tschuprow (1923) es la primera en donde se utiliza el recurso de la varianza mínima. Aunque las expresiones matemáticas de esta afijación pueden ser algo más complejas, lo cierto es que su comprensión es bastante intuitiva. Si contamos con una población sin varianza, es que todas las unidades tienen el mismo valor de la característica que se pretende medir. Bastará con seleccionar a una única unidad y generar una estimación sin error. En el caso contrario, con una varianza muy elevada se puede obtener casi cualquier cosa en una muestra. Por esta razón, ésta deberá contar con un tamaño suficientemente grande como para generar un error lo más pequeño que parezca razonable. Así, en poblaciones con estratos de varianzas sensiblemente diferentes, una forma de reducir el tamaño de la muestra necesaria es escoger más unidades de los estratos con mayor varianza y menos de los que cuenten con menor varianza. Como efecto secundario, los cálculos se complican al perderse la autoponderación de la muestra. 4. De compromiso: el muestreo proporcional posee un inconveniente importante si los estratos poblacionales cuentan con tamaños muy desiguales. La submuestra del estrato poblacional más pequeño puede contar con un ni excesivamente bajo, de tal forma que no pueda mantenerse la hipótesis de que se trata de una submuestra representativa (la estimación al nivel de ese intervalo dará lugar a intervalos desmesuradamente amplios). El ejemplo de 100 mujeres y 5 hombres es claro al respecto. Una muestra de 5 unidades es ridícula para la casi totalidad de las investigaciones imaginables e inadmisible en investigación por encuestas. Una solución consiste en aumentar el tamaño total de la muestra hasta conseguir que todos los ni sean de cuantía satisfactoria. Pero esta medida puede generar un tamaño de muestra demasiado grande, con un coste prohibitivo. Otra solución es la afijación de compromiso. En ésta se establece un tamaño mínimo para toda submuestra. El resto de los elementos que son seleccionados hasta completar el n muestral se reparten por estratos de forma proporcional. Como efecto secundario, los cálculos se complican al perderse la autoponderación de la muestra. 5. Optima: es una variación de la afijación de mínima varianza, considerando además un coste particular en la obtención de cada submuestra. En la afijación óptima se busca la mínima varianza para un coste dado o el mínimo coste para una varianza dada. No obstante, es éste último un tipo de muestreo infrecuente, salvo en el

Investigación a través de los cuestionarios

contexto de instituciones especializadas (institutos de estadística, empresas de sondeos de opinión, etc.). En tales casos, sucesivos estudios sobre la misma población y las mismas variables centrales ayudan a concretar medidas aceptablemente fiables sobre las varianzas de los estratos poblacionales, con respecto a esas variables centrales. Una vez que se considera que las varianzas se conocen

suficientemente,

está

disposición

realizar

muestreos

estratificados con afijación de Neyman u óptima, lo que permite aspirar a la misma precisión en las estimaciones, reduciendo costes. Hay muchos modelos que consiguen una afijación óptima (mínima varianza para un n dado, mínimo n para un coste dado, etc.), depende de los objetivos que se persigan (Koti, 1988). En cualquier caso, los sistemas de afijación diferentes al proporcional requerirán de una fase de ponderación previa al análisis de datos definitivo (Hedges, 1980). Mirás (1986) realiza algunas comparaciones de precisión entre las afijaciones proporcional y óptima, con respecto al muestreo simple aleatorio, concluyendo que: - La afijación proporcional genera mayor precisión que el muestreo aleatorio simple. Esta afirmación es tanto más cierta cuanto más diferentes son las medias de los estratos. - Las afijaciones óptimas y de Neyman son más precisas que la proporcional. Esta afirmación es tanto más cierta cuanto más diferentes sean los errores típicos de los estratos. Lo usual es que no se considere una única subdivisión en estratos de la población, sino que existan varias simultáneas. Lo frecuente es que el muestreo estratificado se conciba como polidimensional. Puede establecerse una primera partición en función de la dimensión sexo, generando las clases mujer y hombre. A su vez, se considera una segunda dimensión, la edad categorizada en tres intervalos, generando las clases menos de 25 años, de 25 a 50 años y más de 50 años. La consideración de varias dimensiones de estratificación no complica el proceso de conceptualización del modelo, puesto que observando éste en un nivel más globalizador puede considerarse la existencia de una única subdivisión, cuyas categorías surgen de las intersecciones entre las categorías de las dimensiones de estratificación contempladas. Así, la subdivisión final puede contar con la categoría: hombre ∩ de 25 a 50 años.

Investigación a través de los cuestionarios

6.4.

Muestreo de conglomerados

Los conglomerados se corresponden con subdivisiones de la población, al igual que ocurría con los estratos. No obstante, la característica que define a un conglomerado es que sus unidades coinciden en una localización común, no necesariamente que son homogéneas en algo. Cuando la definición se establece en términos geográficos (municipios, comarcas, distritos, barrios, ...), suele hablarse de muestreo de áreas. Resulta comprensible que los adultos varones de 35 a 45 años (un estrato) se parezcan más entre sí y se diferencien más del resto de subdivisiones de la población que los habitantes de un municipio concreto (un conglomerado o área). Los conglomerados pueden considerarse como miniaturas, no aleatorias, de la población, por lo que cabe esperar que sean más parecidos unos conglomerados con respecto a otros que los elementos dentro de cada conglomerado. En primer lugar se considera una subdivisión de la población en k conglomerados (familias, colegios, barrios, ...). En un segundo momento se establece una selección de conglomerados, no de las unidades elementales que los componen. La muestra se construye, pues, con la unión de los conglomerados completos seleccionados. Una unidad elemental que pertenezca al subconjunto muestra no ha sido seleccionada aisladamente, sino que su extracción implica la selección del resto de unidades elementales que forman el conglomerado al que pertenece. Si la probabilidad de selección de los conglomerados es proporcional al número de unidades elementales que los componen, se trata de un modelo de muestra autoponderada, por lo que la inferencia puede realizarse sin operaciones especiales intermedias. De esta forma, un conglomerado con 400 unidades debe tener el doble de posibilidades de ser seleccionado en la muestra, con respecto a un conglomerado de 200 unidades. Un concepto útil para estudiar la eficacia del muestreo por conglomerados es δ , el coeficiente de homogeneidad: N

∑∑ (X δ=

− X i )( X ik − X t )

i =1 j ≠ k

NM (M − 1)σ 2

donde: N = número de conglomerados. Investigación a través de los cuestionarios

M = tamaño medio de los conglomerados. X ij = unidad i del conglomerado j . X t = media de las medias de los conglomerados.

σ 2 = varianza total. δ es máximo (δ = 1) con la máxima homogeneidad de los conglomerados, es decir, cuando la varianza intraconglomerados es cero (dentro de cada conglomerado todas las unidades han suministrado el mismo valor). Es mínima (δ = −1 / (M − 1)) cuando existe una máxima heterogeneidad, es decir, cuando la varianza Inter-conglomerados es cero y las únicas variaciones se observan dentro de los conglomerados. La eficiencia del muestreo por conglomerados frente al aleatorio simple va a depender de la homogeneidad de los conglomerados, de tal forma que (Mirás, 1986; Azorín y Sánchez Crespo, 1986): a) Si δ < 0 es más eficiente el muestreo de conglomerados. b) Si δ > 0 es más eficiente el aleatorio simple. c) Si δ = 0 las varianzas coinciden. El caso más usual es b), puesto que cabe esperar mayor homogeneidad dentro de los conglomerados que entre ellos. Así pues, usualmente el muestreo de conglomerados implica una pérdida de precisión en las estimaciones, frente al muestreo aleatorio. No obstante, presenta dos ventajas muchas veces decisivas para la planificación del trabajo de campo: 1. Hace más viable la solución de marcos imperfectos pues, contando con un marco de conglomerados, sólo deben definirse los elementos de los conglomerados seleccionados. 2. Las unidades a medir se encuentran menos dispersas en la población, lo que facilita sensiblemente la fase de recogida de datos por los agentes. Estas ventajas definen al muestreo de conglomerados como un modelo de bajo coste (Sudman, 1976; Hedges, 1980; Stuart, 1984; Levy y Lemeshow, 1991), al menos si los conglomerados coinciden con áreas geográficas (Derdo, 1980). Tanto es así que un muestreo por conglomerados puede llegar a ser más preciso que el aleatorio simple, a

Investigación a través de los cuestionarios

pesar de que δ > 0 , puesto que la disminución de los costes por unidad encuestada permite aumentar el tamaño de la muestra lo suficiente como para poder reducir la cuantía de los errores típicos, por debajo de lo que correspondería a un muestreo aleatorio simple. 6.5.

Variantes

Las variaciones que pueden realizarse partiendo de los modelos básicos expuestos en las anteriores páginas, son muchas. Aquí expondremos las variantes más comunes: los llamados muestreos de dominios y bietápico. Muestreo de dominios Las denominaciones que recibe este modelo no son unívocas. Quizá la más extendida sea la de muestreo de dominios (Kish, 1982; Chaudhuri y Stenger, 1992; Särndal y otros, 1992). Existen algunas ocasiones en las que los objetivos de inferencia implican dos niveles de conjuntos de referencia. Las poblaciones en las que se pretende aplicar las inferencias cambian según el nivel de análisis. Este tipo de muestreo tiene la apariencia de un modelo estratificado, con la salvedad de que las clases son también, y a determinado nivel de análisis, poblaciones. Así pues, en el muestreo de dominios interesa concluir tanto a nivel de toda la población como a nivel de cada uno de los dominios contemplados (Särndal, 1984). Un ejemplo concreto de este tipo de procedimiento de muestreo es el caso de una investigación a nivel de una comunidad autónoma, en la que no sólo se pretende extraer conclusiones (realizar inferencias) a nivel de toda la comunidad, sino también en cada provincia. En una primera actuación cada provincia es una población. Por tanto, dentro de cada provincia se realiza un muestreo que puede utilizar cualquiera de los procedimientos descritos hasta el momento. Una vez finalizada la fase de recogida de datos y realizadas las inferencias a nivel de provincia, éstas pasan a ser consideradas estratos de la población global o comunidad autónoma, estableciendo las inferencias al nivel de ésta. Lo esperable en tales casos es que la representación de las provincias en la muestra final no sea proporcional al tamaño de cada una, puesto que la selección se ha

Investigación a través de los cuestionarios

realizado procurando una inferencia con suficiente poder a nivel de cada provincia. Esta circunstancia requiere que, previo al proceso de inferencia a nivel de toda la región, deba realizarse una ponderación de los datos en función de la provincia de procedencia: las provincias sobrerrepresentadas en la muestra final (de menor tamaño poblacional) deberán ponderarse con pesos inferiores a la unidad, mientras que las provincias infrarrepresentadas en la muestra final (de mayor tamaño poblacional) deberán ponderarse con pesos superiores a la unidad. De esta forma, un muestreo de dominios puede conceptualizarse como un muestreo estratificado con afijación óptima o de Neyman, donde el tamaño de muestra es tal que permite estimaciones independientes por clase. Debe considerarse que el objetivo de inferencia en el muestreo estratificado no es cada una de las clases, sino la población en su conjunto, por lo que las estimaciones por clase generan errores de precisión muy grandes. La utilización de este modelo de muestreo se encuentra tan extendida que Hedges (1980: 61) afirma que “en la práctica, el determinante principal del tamaño de muestra es casi siempre la necesidad de observar separadamente los resultados de los diferentes subgrupos en la muestra total”. B) Muestreo de conglomerados bietápico o con submuestreo En principio cabe esperar que un muestreo bietápico sea aquél que se realiza en dos etapas. No obstante, aunque esto es cierto, se utiliza la denominación para referirse a un dos-etapas en particular. La muestra final se obtiene como resultado de seleccionar unidades elementales de los conglomerados que, en una primera actuación, han sido seleccionadas de la población. Así, en la primera etapa se realiza un muestreo de conglomerados cuyo resultado es una muestra intermedia de gran tamaño. En la segunda etapa, llamada submuestreo se consigue la muestra definitiva con una selección de unidades elementales utilizando como conjuntos de referencia a las clases seleccionadas en la primera etapa. El proceso permite resolver problemas de marco referentes a la falta de información, razón por la cual es sin duda uno de los modelos de muestreo más extendidos (Jolliffe, 1984; Särndal y otros, 1992). Para culminar la primera etapa basta con tener información sobre la identidad y tamaño de los conglomerados (no de sus elementos constituyentes). En la segunda etapa únicamente interesa reunir información útil de los conglomerados seleccionados (no del resto). La existencia de submuestreo hace del

Investigación a través de los cuestionarios

modelo bietápico un diseño de selección de muestras especialmente poderoso, “no en el sentido de que sea más preciso para iguales tamaños de muestra, sino en el sentido práctico: se puede introducir donde otros esquemas no tienen cabida prácticamente” (Abad y Servín, 1978). En el ejemplo de las provincias, en una primera etapa son seleccionados municipios dentro de cada provincia. En la etapa de submuestreo, son seleccionadas unidades elementales únicamente dentro de cada uno de los conglomerados que han sido seleccionados. En el muestreo llamado polietápico, cada etapa consiste en la consecución de una muestra cada vez más pequeña y de tales características que la información que se posee de ella es cada vez más precisa. Por ejemplo, en un muestreo de conglomerados con tres etapas, se obtendría una muestra de conglomerados en la primera etapa (por ejemplo, municipios); en un momento posterior se seleccionan conglomerados de menor tamaño dentro de los que han sido seleccionados en la etapa anterior (por ejemplo, secciones censales dentro de los municipios seleccionados); y, por último, de estos últimos conglomerados serán obtenidas las unidades finales que constituirán la muestra (personas dentro de las secciones censales seleccionadas). 6.6.

¿Cómo escoger un procedimiento de muestreo?

Como suele ocurrir no hay una regla fácil. En principio y desde la teoría estadística, el muestreo estratificado es el más recomendable porque permite obtener las muestras de menor tamaño posible, manteniendo fijas el resto de exigencias en el proceso de inferencia. No obstante hay algunos inconvenientes claros frente a este consejo: 1. En primer lugar, es posible que no se tenga información sobre las variables de estratificación, en cuyo caso no es posible estratificar. Puede ocurrir también que aunque se puede acceder a esta información, se sospecha que las variables consideradas no tienen influencia sobre la característica a medir, por lo que no existirán diferencias entre estratos y el esfuerzo de la estratificación será en vano. En ambas ocasiones, será más recomendable el muestreo aleatorio. 2. No obstante, el muestreo aleatorio simple tampoco es posible en multitud de ocasiones, puesto que requiere una base de datos especial y unas condiciones propicias de aplicación que no se encuentran habitualmente. Una posible solución es improvisar aleatoriamente sobre la marcha mediante la aplicación de las rutas

Investigación a través de los cuestionarios

aleatorias de las que nos ocuparemos en el próximo capítulo. Otra es aplicar un muestreo de conglomerados con submuestreo en donde se emplee el espacio entre ambas etapas para completar la base de datos de los conglomerados seleccionados. Aun así, los párrafos anteriores sólo consideran la relación entre el procedimiento de muestreo y los problemas con el marco o listado de unidades. Por lo general, existen muy serias limitaciones económicas para decidir tamaños de muestra, pagos de encuestadores, tiempo implicado en el trabajo de campo, material invertido, etc. Si se incluye el argumento del coste, indudablemente el procedimiento más barato es el de conglomerados monoetápico, puesto que disminuye el tiempo del trabajo de campo (menos gastos en dietas y sueldos fijos) y las distancias que deben recorrerse para realizar las encuestas (menos gastos en concepto de desplazamiento). No obstante, cuando se combinan todos los argumentos, la solución no es única ni fácil. El muestreo de conglomerados es más barato, pero genera mayor variación de la característica en el muestreo, por lo que requiere un tamaño de muestra sensiblemente mayor que en el estratificado, por ejemplo. En cada caso se verá si la limitación económica puede más o menos que la precisión. Así hay tres grupos principales de argumentos que no van en la misma dirección a la hora de aconsejar un modelo u otro: los costes, la precisión y la información de base. Así, ordenando a los cuatro procedimientos específicos abordados según las tres variables mencionadas, se obtiene el resultado del cuadro 3.1. En las encuestas que se realizan por un procedimiento diferente al cara a cara, la selección del modelo de muestreo es más sencilla por cuanto los procedimientos que implican la consideración de conglomerados carecen de interés. Los conglomerados son artilugios a los que se recurre para completar el marco o para reducir costes en las encuestas cara a cara. Cuando la entrevista se va a realizar por teléfono o por correo, se parte de una base de datos completa o suficiente al menos para la selección de encuestados, por lo que no tienen sentido los conglomerados para recoger información por etapas, como ocurre en la encuesta cara a cara. Por otro lado, en las encuestas por teléfono y correo no existen gastos por desplazamiento. Cuadro 3.1. Ordenación de cuánto consigue un procedimiento de selección de muestras, con respecto a tres variables de interés.

Coste

Precisión

Investigación a través de los cuestionarios

Información

Estratificado Aleatorio Monoetápico Submuestreo

4 3 1 2

1 2 4 3

requerida 4 3 1 2

En las encuestas por teléfono, el procedimiento de selección de muestras más viable es el aleatorio simple. Al respecto, lo esperable es que sea un programa de ordenador el que seleccione los números mediante un procedimiento pseudo-aleatorio con restricciones. Así, se suministra información al programa con respecto a las limitaciones de prefijos, longitud en número de dígitos, etc. Con esta información el ordenador realiza una selección de números concretos, si bien puede ocurrir que algunos de ellos no tengan ningún abonado o éste sea una oficina o cualquier entidad diferente a un domicilio particular. Para poner en marcha este procedimiento no es necesario contar con información sobre la población más que las restricciones explícitas a la variación posible en cuanto a los números de teléfono. En las encuestas por correo se cuenta con una base de datos que facilita la estratificación. Mayoritariamente este tipo de encuestas bebe de las bases de entidades comerciales donde consta no sólo la identidad y localización postal del posible encuestado, sino también algunas variables de interés como su status socioeconómico. De esta forma puede establecerse una estratificación y, con ello, reducir el tamaño requerido para la muestra. 7. Errores de muestreo 7.1.

El error muestral y sus expresiones asociadas

El primer error que aparece en la mente del investigador es la diferencia entre el resultado obtenido en la muestra y el que se habría obtenido de haber trabajado en la población. Es el principal, sin lugar a dudas, y justifica el resto de los errores abordados en este punto. Por esta razón se le denomina, sencillamente, error muestral o error de muestreo. El mayor deseo del investigador sería poder establecer una afirmación tan categórica como, por ejemplo, que 11 de cada 23 ciudadanos fuman al menos un paquete al día. Pero esto es imposible. En el ejemplo, el investigador considera que la proporción de fumadores de al menos un paquete de tabaco es p = 11 / 23 = 0,478 con respecto al total de los ciudadanos (de no importa dónde). No obstante, puede que el verdadero valor en la población sea

Investigación a través de los cuestionarios

≠ 0,356 . La diferencia entre ambos

em = 0,478 − 0,356 = 0,122

es el error muestral (em ) . Primera observación: si conociéramos la cuantía del error muestral bastaría con sumar tal cantidad a la estimación puntual que se realiza desde la muestra y el investigador daría con seguridad en el valor exacto en la población. Por supuesto, esto no ocurre. Así que el valor concreto de em es desconocido. No obstante, existe alguna alternativa que permite avanzar en el proceso para conocer los valores poblacionales. Antes de entrar de lleno en ello es necesario compartir una misma simbología entre texto y lector. Pongamos que lo que interesa es averiguar el valor de una función poblacional: la media de una variable, la proporción de una variable, una correlación entre dos variables, etc. Simbolizaremos esta función poblacional con δ (aunque usualmente, la función poblacional se ha bautizado como parámetro, este último es un término no unívoco, puesto que también se recurre a él para otros menesteres). Para estimar su valor a partir de las mediciones realizadas en una muestra se calcula una función de los datos de ésta, que llamaremos estimador y que será simbolizada con

δ ∗ . Por ejemplo, se utiliza la media aritmética de los datos de la muestra para estimar el valor de la media aritmética de los datos de la población. Así pues: em = δ ∗ − δ

Una primera aproximación al manejo del error muestral es plantear una medida de su varianza, es decir, cómo varía el error de una muestra a otra. Si ocurriera que existe una gran variabilidad, entonces el investigador debería sentir bastante indefensión a la hora de establecer sus conclusiones, ya que su muestra puede ser una de las muy abundantes nuestras raras de la población (es decir, que suministran valores para δ ∗ muy alejados de δ ). La varianza de δ ∗ con respecto a δ , es decir, el error muestral al cuadrado por término medio (al igual que ocurre con la justificación para la expresión de cálculo de una varianza, en ECM , se eleva la diferencia entre los elementos para transformar las diferencias en cantidades positivas), recibe el nombre de error cuadrático medio, con la expresión:

Investigación a través de los cuestionarios

( )

ECM δ ∗ =

∑ (δ

∗

−δ

)

i −1

donde k indica el número de muestras que pueden ser obtenidas de la misma población, con el mismo tamaño y siguiendo el mismo modelo de muestreo. La forma empírica de obtener el valor del error cuadrático medio es: 1. Obtención de todas las muestras posibles de la misma población, con el mismo modelo de muestreo y el mismo número de unidades seleccionadas.

(

2. Cálculo de δ ∗ en la muestra, del error muestral δ ∗ − δ

)

y su cuadrado (em2 ) . De

esta forma se construye la distribución muestral de los errores muestrales al cuadrado. 3. Cálculo del promedio del error muestral al cuadrado (media aritmética de todos los em2 obtenidos).

Como resulta obvio, este proceso empírico no se hace. Primero porque si somos capaces de obtener todas las muestras posibles de la población, es que podemos medir directamente a ésta, con lo que el muestreo carece de sentido. Y, segundo, porque en la práctica no se pueden obtener todas las muestras posibles (por ejemplo, de una población de tan sólo 40 unidades, pueden obtenerse alrededor de 140.000 millones de muestras diferentes de tamaño n = 20, con un muestreo aleatorio simple). Luego la siguiente expresión del error cuadrático medio es más correcta que la anterior, puesto que no indica una extracción empírica real, sino que se muestra en función de valores esperados:

( )

(

ECM δ ∗ = E (em ) = E δ ∗ − δ 2

)

Al igual que ocurre con cualquier varianza, su manejo resulta incómodo, puesto que, utiliza unidades cuadráticas. La solución más sencilla es calcular la raíz cuadrada del error cuadrático medio. El resultado tiene la sugerente denominación de error total del muestreo:

( )

(

ETM δ ∗ = E δ ∗ − δ

)

Investigación a través de los cuestionarios

Así pues, el error total del muestro indica una medida de la dispersión que cabe esperar en el error muestral. Cuanto mayor sea su cuantía, más esperable resulta obtener una muestra cuyo δ ∗ esté alejado de δ .

( )

¿En qué medida es útil ETM δ ∗ ? Lo cierto es que no para mucho. El problema del error muestral es que resulta desconocido a los ojos del investigador. El error cuadrático medio y su derivado, el error total del muestreo, no sólo manejan el error muestral, sino que añaden otro problema más: el total de las muestras posibles (con las restricciones señaladas). No obstante, si bien directamente es inmanejable, de forma indirecta puede obtenerse alguna información de utilidad práctica. Para ello, vamos a definir el concepto de sesgo en un estimador como la diferencia entre su valor

(

( ) )

esperado y la función poblacional que se pretende estimar B = E δ ∗ − δ . Con ello:

( ) ( ) E (δ − E [δ ]) + E (B ) ECM δ ∗ = E δ ∗ − δ ∗

∗

[ ( ) ]) + 2 E (B[δ − E (δ )]) (

= E δ∗ − E δ∗ −B

∗

([

(

) ])

= E δ ∗ − E δ ∗E + B

(1)

∗

Como el sesgo, B, es una constante, entonces: E (B ) = B 2 2

([

( )]) = B ⋅ E[δ

E Bδ∗ −E δ∗

∗

[

(

( )])] = B ⋅ 0 = 0

−E δ∗ −Eδ∗ −E δ∗

Sustituyendo ambas expresiones en (1):

( )

[ ])

(

ECM δ ∗ = E δ ∗ − E δ ∗

( )

+ B2 = V δ ∗ + B2

De esta forma, se observa que el error cuadrático medio (el cuadrado del error total del muestreo) puede subdividirse en dos elementos más. Por un lado, la varianza del

( [ ]) y, por otro, su sesgo al cuadrado (B ) . Ambos son también medidas de error, no sólo por participar de ECM (δ ), sino también por méritos propios:

estimador V δ ∗

∗

1. La varianza del estimador tiene una fácil interpretación: cuanto mayor sea su cuantía, mayor dispersión de valores suministra el estimador y, por tanto, menos fiable es su medida, menos creíble es el resultado δ ∗ como sustituto o representante del verdadero valor poblacional δ . Por las mismas razones que hemos comentado en la traducción de ECM a ETM, es preferible manejar la raíz

( )

cuadrada de V δ ∗ , función que recibe la denominación de error tipo, error típico o error estándar: Investigación a través de los cuestionarios

σ δ = V (δ ∗ ) = E ((δ ∗ ) − E (δ ∗ ))

∗

2. Para el sesgo, existen expresiones que muestran su cálculo, si bien están también en función de variables poblacionales. Fijémonos que el sesgo de un estimador podría ser bautizado como error muestral medio o valor esperado del error muestral:

(

)

( )

B = E (em ) = E δ ∗ − δ = E δ ∗ − δ

Uniendo los conocimientos adquiridos hasta el momento: etotal =

(e ) + (e 2

tipo

medio

¿Cómo obtener una utilidad de los resultados teóricos presentados hasta el momento? Es fácil compartir la idea de que lo ideal es reducir al máximo el error total del muestreo. Una vía indirecta es tomar decisiones tales que reduzcan sus dos componentes: error típico y sesgo. Para reducir el error tipo se puede recurrir al diseño de la muestra. Así por ejemplo, y siguiendo lo expuesto en el segundo capítulo, un muestreo estratificado genera un error tipo menor (o, como muy alto, igual) que el aleatorio simple. Para el sesgo lo ideal es considerar estimadores insesgados (B = 0) . Así, en todas las muestras autoponderadas (aleatorio simple, estratificado con afijación proporcional, etc.), es decir, en todas las muestras obtenidas mediante procedimientos que respetan el que todas las unidades de la población tengan la misma probabilidad de pertenecer a la muestra, la media aritmética de la muestra es un estimador insesgado de la media aritmética de la población. Otro ejemplo: en un muestreo aleatorio simple la cuasivarianza de la muestra es un estimador insesgado de la cuasivarianza en la población. El error total del muestreo es un concepto interesante, tal y como se ha visto. No obstante, cuando el investigador ha recogido los datos e, incluso, ha concluido los análisis de inferencia, suministra otros valores de error a la comunidad científica. Veamos de qué se trata y qué relación guarda con el error muestral. 7.2.

El error muestral y la estimación

El error muestral tiene sentido en el ámbito de una estimación puntual: se calcula una función de los datos de la muestra, que llamamos estimador, y se afirma que la función poblacional de interés tiene ese mismo valor. El error en la estimación puntual es el Investigación a través de los cuestionarios

error de muestreo. Pero en la práctica, cuando interesa estimar un valor poblacional, no se recurre a una estimación puntual, sino por intervalo. Así, se establecen conclusiones como la que sigue: “la media de consumo de bebidas alcohólicas durante la Feria de Sevilla, dentro del recinto ferial, se encuentra entre 3 y 4 litros por visitante y día”. “Entre 3 y 4” es equivalente a “3,5±0,5”. En este último caso, 3,5 representa el valor del estimador, mientras que 0,5 es el radio del intervalo de estimación. Es obvio que conforme el radio sea mayor, más difícil será que el investigador se equivoque en la inferencia. El radio del intervalo de estimación ha recibido varias denominaciones. Se puede encontrar incluso “error muestral”. Grave error, puesto que su cuantía es desconocida, tal y como se ha visto en el subapartado anterior. Hay quien lo denomina “error de estimación” con cierta lógica lingüística. Sin embargo, también se puede encontrar la expresión “error de estimación” para referirse a la discrepancia entre δ ∗ y δ . Nosotros preferimos la expresión error de precisión (e p ) (Manzano, 1996). Cuanto mayor es e p , más imprecisa es la estimación, puesto que el intervalo es mayor. Usualmente se define el proceso de estimación por intervalo indicando que existe cierta dosis de confianza (probabilidad) en que el valor de la función poblacional de interés δ se encuentre dentro del intervalo de estimación. Si denominamos a ese valor de probabilidad con la letra griega λ , entonces:

( (

))

p δ ∈ δ ∗ ± ep = λ Esta misma información puede expresarse de otra forma, indicando: p (em ≤ e p ) = λ

Es decir, si bien el error muestral es desconocido, se espera que su cuantía no rebase la del error de precisión. Esta esperanza se mide en términos de probabilidad con el valor λ . Así pues, dentro de la estimación por intervalo, el error de precisión puede ser conceptualizado como “el máximo valor esperado para el error muestral”. 7.3.

Riesgo en la estimación

En el subapartado anterior se ha mencionado el valor de probabilidad λ . Si en la literatura estadística no es posible encontrar unicidad de criterios con respecto a los errores muestral y de estimación, el caos es total con respecto a ese valor de

Investigación a través de los cuestionarios

probabilidad. Lo más fácil es encontrar una sencilla letra p para representarlo (lo que se confunde con una proporción, por ejemplo). Si bien no es inusual encontrar la letra griega ( α como alternativa). No es tampoco una buena alternativa: ( α aparece también en la teoría de la decisión estadística, como nivel de significación estadística). Es un valor que el investigador decide antes de la obtención de los datos y que representa el máximo riesgo que está dispuesto a asumir cuando rechaza la hipótesis nula. Así pues, es un valor de probabilidad que aparece antes que los datos. Muy relacionado con él está el grado de significación estadística. Es un valor de probabilidad que se calcula con los datos del estudio y que representa el riesgo calculado de errar al rechazar la hipótesis nula. El investigador procederá al rechazo si ocurre que el riesgo calculado (grado de significación) es inferior al máximo establecido (nivel de significación). Así pues, el grado es un valor de probabilidad que aparece después que los datos. En la estimación estadística, la confianza en que δ se encuentre en el intervalo puede ser calculada o establecida. En la situación más frecuente, el investigador decide un valor para λ y, tras obtener los datos, calcula e p , construyendo seguidamente el intervalo. No obstante, resulta viable (y así se ejercita con no poca frecuencia), construir primero el intervalo estimación (es decir, definir primeramente un valor para e p ) y después calcular λ .

No es éste el lugar más apropiado para sugerir diferentes símbolos para las diferentes situaciones, no obstante, sí es deseable que el lector sepa discriminar que encontrará tanto valores de λ calculados como pre-establecidos, y tanto con el símbolo p, como

α. 7.4.

Un ejemplo concreto

Hasta el momento se han tratado diversos errores. Se comenzó con el total del muestreo, desglosable en el error tipo y en el medio. Tras ese discurso teórico, pasamos a situaciones más prácticas: el contexto de estimación, en el que apareció el error de precisión y los riesgos asociados. Es el momento de ver tales conceptos con algún ejemplo práctico. Para ello, consideramos una población de 7 unidades y la selección de una muestra de 4 elementos. Son posibles, por tanto

7 4

= 35 muestras diferentes. En cada una de ellas

Investigación a través de los cuestionarios

vamos a calcular la media aritmética, el error muestral y el cuadrado de ambos valores para posteriores operaciones. Con respecto a la población: Datos: 5, 3, 8, 7, 4, 5, 3

Media: 5

Como se observa en la quinta columna del cuadro 3.2, la suma de los errores muestrales es cero, por lo que estamos ante un estimador insesgado, por esta razón su valor esperado coincide con la media poblacional y el error total del muestreo con el error tipo.

( )

E X =

( )

V X =

175 = 5 = µ ; E (em ) = 0 35

888,75 13,75 2 = 5 2 = 0,3929 = = E (em ) 35 35

( )

ETM X = ECM X = V X = σ x = 0,6268 La distribución muestral de la media en este ejemplo no sigue una ley normal. Pero estos datos concretos nos resultan útiles no sólo para ejercitar los conceptos y sus expresiones asociadas, sino también para observar la relación entre los errores muestral y de precisión en una estimación por intervalo. Supongamos que el investigador decide un error de precisión de ½. Su intención es, por tanto, realizar una estimación por intervalo con una “anchura” de una unidad. Al realizar la selección de unidades obtiene la muestra identificada con el número de orden 16 en la tabla anterior (5, 8, 5, 3). La media correspondiente es 5,25. Luego, construye el intervalo:

4,75

5,25

5,75

CUADRO 3.2. Ejemplo de una población de 7 unidades y la selección de una muestra de 4 elementos.

muestra

em2

5387

5,7500

33,0625

0,7500

0,5625

5384

5,0000

25,0000

0,0000

Investigación a través de los cuestionarios

53 85

5,2500

27,5625

0,2500

0,0625

5383

4,7500

22,5625

-0,2500

0,0625

5374

4,7500

22,5625

-0,2500

0,0625

5375

5,0000

25,0000

0,0000

5373

4,5000

20,2500

-0,5000

0,2500

5345

4,2500

18,0625

-0,7500

0,5625

5343

3,7500

14,0625

-1,2500

1,5625

5353

4,0000

16,0000

-1,0000

1,0000

5874

6,0000

36,0000

1,0000

5875

6,2500

39,0625

1,2500

1,5625

5873

5,7500

33,0625

0,7500

0,5625

5845

5,5000

30,2500

0,5000

0,2500

5843

5,0000

25,0000

0,0000

5853

5,2500

27,5625

0,2500

0,0625

5745

5,2500

27,5625

0,2500

0,0625

5743

4,7500

22,5625

-0,2500

0,0625

5753

5,0000

25,0000

0,0000

5453

4,2500

18,0625

-0,7500

0,5625

3874

5,5000

30,2500

0,5000

0,2500

3875

5,7500

33,0625

0,7500

0,5625

3873

5,2500

27,5625

0,2500

0,0625

3845

5,0000

25,0000

0,0000

3843

4,5000

20,2500

-0,5000

0,2500

3853

4,7500

22,5625

-0,2500

0,0625

3745

4,7500

22,5625

-0,2500

0,0625

3743

4,2500

18,0625

-0,7500

0,5625

3753

4,5000

20,2500-

-0,5000

0,2500

3453

3,7500

14,0625

-1,2500

1,5625

Investigaci贸n a trav茅s de los cuestionarios

8745

6,0000

36,0000

1,0000

8743

5,5000

30,2500

0,5000

0,2500

8753

5,7500

33,0625

0,7500

0,5625

8453

5,0000

25,0000

0,0000

7453

4,7500

22,5625

-0,2500

0,0625

175

888,75

13,75

Total

El centro del intervalo es 5,25, valor al que suma y resta el error de precisión e p = 0,5 para obtener los extremos (4,75; 5,75). Se observa que el valor µ = 5 se encuentra en el intervalo, por lo que la estimación es un acierto (em = 0,25 < 0,5 = e p ) . Supongamos ahora que la muestra obtenida es la 22 (3, 8, 7,5), cuya media es 5,75. Por tanto:

5,25

5.75

6,25

Como se observa, la función poblacional µ = 5 no se encuentra en el intervalo

= 75 > 0,5 = e p ) , por lo que la estimación no acierta en el valor poblacional.

8. Consecuencias del muestreo en el análisis de los datos 8.1.

Ponderación

Lo esperable, en investigación mediante encuestas, es que el investigador esté interesado en establecer conclusiones a nivel de la población, sin otorgar mayor importancia a unos colectivos que a otros. En investigación comercial puede ocurrir que determinados grupos sean de mayor interés (por ejemplo, el de mayor poder adquisitivo o una laguna de edad en cuanto al consumo de un producto) que otros. En tal caso la muestra y las conclusiones pueden estar sesgadas en el sentido de contar con mayor participación de unidades que provienen de los colectivos de mayor interés. No obstante, en la mayoría de las ocasiones, las conclusiones se redactan en términos similares a estos: “un X% de los españoles fuma, al menos, diez cigarrillos al día”, “X de cada diez niños andaluces desconoce quién fue Blas Infante”, “Un sevillano consume una media de X litros de vino fino durante la Feria de Abril”, etc. Las

Investigación a través de los cuestionarios

conclusiones se establecen al nivel de la población que interesa, en su globalidad, por lo que un peso diferencial de los subcolectivos implicados en la muestra es indeseable. Esta idea trae consigo el que los elementos constituyentes de la población tengan una representación acorde a su relevancia: aquellos con mayor representación en la población deben tener un peso también mayor en la muestra. Cuando el procedimiento de selección consigue respetar este principio, se habla de muestras autoponderadas. Si, por el contrario, los elementos tienen en la muestra una importancia desigual con respecto a la población de origen, procede realizar una manipulación previa al análisis de datos, que recibe el nombre de ponderación de casos (Adams, 1989). En el contexto de los modelos de muestreo considerados en el presente trabajo, dos son las situaciones en las que puede violarse la autoponderación: 1. Selección mediante muestreo estratificado con afijación óptima y varianzas desiguales por estratos, lo que origina que los estratos con mayor varianza cuenten con una representación mayor en la muestra de la que corresponde a su tamaño. 2. Muestreo de dominios. Dado que cada uno de éstos debe contar con una muestra independiente representativa con los mismos parámetros definitorios (por ejemplo, el mismo riesgo y el mismo error de precisión), los dominios con menor tamaño tendrán una representación porcentual mayor que los dominios mayores. La ponderación de casos consiste en aplicar un peso a cada dato que puede diferir de 1. En el análisis de datos, el peso sustituye a la frecuencia tradicional o, en otros términos, la frecuencia habitual de cada dato (1) constituye un caso particular de peso en el que todo caso tiene la misma importancia. Denominando wi al peso en la muestra del dato i, podemos distinguir tres situaciones, según el grupo de procedencia del dato: 1.

(wi

> 1) . El colectivo se encuentra sobrerrepresentado. La proporción de

participación del colectivo en la muestra es superior a la proporción que le corresponde en la población. Ocurre con estratos de mayor varianza que el resto o dominios pequeños. Luego el peso de estos datos, durante el análisis estadístico, debe ser menor que la unidad, de tal forma que la suma de pesos corresponda a la frecuencia total teórica en una muestra autoponderada. 2. (wi < 1) . El colectivo se encuentra subrepresentado. La razón de participación del colectivo en la muestra es inferior a la proporción que le corresponde en la

Investigación a través de los cuestionarios

población. Ocurre con estratos de menor varianza que el resto o dominios grandes. Luego el peso de estos datos, durante el análisis estadístico, debe ser mayor que la unidad, de tal forma que la suma de pesos corresponda a la frecuencia total teórica en una muestra autoponderada. 3. (wi = 1) . Las frecuencias de los datos de este colectivo no requiere ninguna manipulación previa. Si tal peso coincide en todos los grupos, se trata de una muestra autoponderada. Llamaremos ni a la representación del colectivo i en la muestra. Si ésta fuera autoponderada: ni N i = n N

Luego, las frecuencias de los datos del colectivo i deben someterse a la transformación (aquí utilizamos wi como el peso que debe tener el dato): ni

∑w

= ni wi =

j =1

Nin Nn ⇒ wi = i N Nni

Veamos un ejemplo. Se ha realizado un muestreo en un municipio, distinguiendo entre los estratos E1, E2, E3 y E4. El procedimiento de selección ha consistido en un estratificado con afijación de mínima varianza. En la tabla que sigue se muestra la identidad del estrato (E), el tamaño en la población (N), el tamaño en la muestra (n), las operaciones de cálculo para el peso de cada estrato (Cálculo) y el peso resultante (Peso): ni N i Nn = ⇒ ni = i n N N

E E1 E2 E3 E4 Total 8.2.

N 5630 3500 2800 9875 21805

n 150 148 125 157 580

Cálculo (5630 580)/(21805 150) (3500 580)/(21805 148) (2800 5 80)/(21805 125) (9875 580)/(21805 157)

Peso 0,998 0,629 0,596 1,673

Varianzas

Investigación a través de los cuestionarios

Una vez realizado el muestreo y analizados los datos al nivel de la muestra, procede establecer las inferencias y concluir consecuentemente. Para realizar estimaciones se requiere construir un intervalo de valores alrededor del estadístico calculado (una proporción, por ejemplo). La estimación por intervalo requiere, entonces, un valor central (el estadístico), una medida de variación de la distribución muestral (el error típico, en función del tamaño de la muestra y del modelo de muestreo) y una medida de seguridad en la estimación (distancia estandarizada en la distribución teórica de probabilidad). En el caso de estimación de una proporción:

π ∈ ( p ± Z α / 2σ p ) El valor σp corresponde al error típico o desviación tipo de la distribución muestral de proporciones. Depende del tamaño de la muestra y del modelo de muestreo. Para no resultar innecesariamente redundantes, basaremos la exposición en las fórmulas de Azorín Sánchez Crespo (1986), donde se encuentra la que se refiere a la estimación de medias ira el muestreo aleatorio simple en poblaciones finitas (página 65), estratificado (página 5) y de conglomerados bietápico (página 187). a) Muestreo aleatorio

σx =

S n −1

N −n N

donde S es la desviación tipo de la característica en la muestra, N es el tamaño de la población y n es el tamaño de la muestra. b) Muestreo estratificado

σ xi = S i

N i − ni N i (n − 1)

donde S i es la desviación tipo de la característica en el estrato i (en la muestra), N i es el tamaño del estrato i en la población y ni es el tamaño del estrato i en la muestra. c) Muestreo de conglomerados monoetápico

σx =

Se nc − 1

N c − nc Nc

donde S e es la variación entre las medias de los conglomerados en la muestra. N c es

Investigación a través de los cuestionarios

el número de conglomerasdos en la población y nc es el número de conglomerados en la muestra. d) Muestreo de conglomerados monoetápico  nc  N c − n c 2 N ⋅ n  σ d + σ e2 1 − c   N c ⋅ n  nc N ⋅ nc  

σx =

donde N c es el número de conglomerados en la población, nc es el número de conglomerados en la muestra, n es el número de unidades elementales en la muestra, N es el número de unidades elementales en la población y los estimadores de las

varianzas poblacionales entre y dentro conglomerados ( σˆ e2 y σˆ d2 , respectivamente), corresponden a los componentes típicos del análisis de la varianza: ni

σˆ d2 = 8.3.

1 nc

∑ i

∑ (X

− Xi

(ni − 1)

)

∑ n (X

σˆ e2 =

− Xt

)

nc − 1

Modelos de muestreo en el software al uso

No se dispone de soporte informático para realizar las estimaciones, en el software estadístico convencional, considerando el procedimiento de extracción de la muestra. La asunción de un modelo de muestra aleatorio simple para poblaciones de gran tamaño (o sin reemplazo o reposición) es la base para los desarrollos de los métodos estadísticos (Kish y Frankel, 1974), así como para los programas de análisis estadístico (Martínez Arias, 1995a). Como expresa Särndal (1984), el diseño utilizado para la obtención de la muestra tiene efecto sobre las conclusiones extraídas del análisis de datos, pero la mayoría de los programas de ordenador no consideran el modelo de muestreo. Es más, si el modelo de muestreo no ha sido el aleatorio simple para poblaciones de gran tamaño, las estimaciones de las varianzas suelen ser erróneas e invalidar las conclusiones. Ante el problema o deficiencia planteada, pueden plantearse dos soluciones factibles. La primera de ellas es confeccionar utilidades informáticas que contemplen el procedimiento concreto que se ha utilizado en la extracción de la muestra, adecuando los procesos de estimación y decisión a cada contexto concreto. No obstante, la mayoría de las ocasiones, el software específico de tratamiento de datos que corrige las deficiencias originadas al salir del patrón estándar apenas existe o bien es

Investigación a través de los cuestionarios

confeccionado para instituciones que no facilitan su uso (Aparicio, 1991). Una buena excepción es el programa para ordenadores compatibles IBM PC denominado PC CARP, que permite el análisis de datos provenientes de modelos de muestra con estratificación y conglomerados polietápico (y modelos de complejidad inferior a éste), realizando estimaciones para el total de la población y para los colectivos contemplados (Fuller y otros, 1986). La segunda de las soluciones consiste en ingeniar estrategias tales que permitan utilizar el software estadístico convencional, de tal forma que los resultados de la inferencia sean sensibles al procedimiento de extracción de muestras utilizado. Existe una estrategia para conseguir que el software estadístico comercial realice inferencias, considerando el procedimiento de extracción de muestras utilizado en la investigación cuyos datos se analizan (Manzano, 1996). Consiste en modificar la varianza de los datos de la muestra antes de hacer la inferencia. Para ello, si la intención es estimar la media o la proporción (u otra medida poblacional) de la característica X, bastará con generar la variable derivada Y mediante una transformación simple de X consistente en:

Y = k (X − X ) + X La expresión anterior permite multiplicar por k 2 la varianza de la muestra sin variar su media aritmética. La cuestión, pues, es contar con la expresión de cálculo para la variable k, según sea procedimiento de encuesta utilizado. Así, si se ha realizado un muestreo aleatorio simple considerando una población de tamaño infinito, k = 1. En todos los demás casos, el valor de k debe ser calculado. Veamos las expresiones concretas, suponiendo en todo caso que las poblaciones (elementos y conglomerados) tienen tamaños finitos y utilizando los mismos símbolos del subapartado anterior sobre varianzas: a) Muestreo aleatorio simple

N −n N

b) Muestreo estratificado

1 NS

(n − 1)∑ N i (N i − ni ) S i2 ni − 1

Investigación a través de los cuestionarios

c) Muestreo de conglomerados monoetópico

Se S

Nc − n n −1 ⋅ Nc nc − 1

e) Muestreo de conglomerados con submuestreo

1 S

 nc (n − 1) N c − nc 2 N ⋅n  σˆ d − σˆ e2 1 − c  Nc ⋅ n nc  N ⋅ nc 

9. Problemas prácticos La puesta en práctica de una investigación por muestreo cuenta con algunos problemas específicos en lo referente a la selección de muestras. Durante el presente apartado abordaremos los más importantes, observando algunas soluciones. 9.1.

Problemas con la base de datos

Como vimos, la selección de muestras necesita de la existencia de una buena base de datos, listado o marco de la población en la que se desea aplicar los resultados del estudio. Pero ocurre que, en la práctica, existen abundantes imperfecciones de marco. Podemos considerar la existencia de tres tipos de marco de interés desde una investigación por encuestas: •

Basadas en los censos. Son los listados oficiales de que disponen las instituciones públicas: los ayuntamientos e institutos de estadística nacional o por comunidades autónomas. Una de las funciones de los institutos de estadística es facilitar información a la población. Por ello, cuentan con servicios específicos de atención e información. Por un lado publican los resultados censales periódicamente y en varios formatos. Alguno de ellos nos será de utilidad. Inclusive, algunos institutos cuentan también con una base informatizada, implementada en software que se puede adquirir o consultar y que permite construir un archivo de salida, como por ejemplo el programa SIMA, del Instituto de Estadística de Andalucía. La información más actual, no obstante, se encuentra en el padrón municipal, pero éste no siempre está disponible ni organizado convenientemente. Depende del ayuntamiento de que se trate, pueden tenerse más o menos facilidades para obtener información. A pesar de su carácter oficial, los censos no son perfectos. Por ello y con el objetivo de adecuarse lo más posible a los hechos, los datos referidos a la población se

Investigación a través de los cuestionarios

encuentran divididos u organizados en dos categorías: población de derecho (la que debería encontrarse) y población de hecho (la que parece que se encuentra realmente). No obstante la actualización de los datos oficiales se realiza con relativa lentitud considerando la motilidad de las poblaciones. Pero es muy útil y aunque no coincida con total exactitud (aspiración imposible) los errores entran en el saco de las imprecisiones admisibles. Por lo general, los datos oficiales se estructuran en tablas de contingencia con abundantes subdivisiones donde constan las frecuencias por zonas, edades, sexo, nivel de estudios y año de actualización. Los problemas más frecuentes se derivan de cambios en la estructura de los municipios (uniones y disgregaciones completas o parciales), la ausencia de información en el censo con respecto a variables de interés y problemas de colaboración con los ayuntamientos. Ante cualquiera de ellos, una salida viable y fácil, que además permite obtener una información aproximada, es la estimación lineal. Pongamos por caso que se carece de la repartición de frecuencias, por categorías de edad, para un municipio, pero sí se cuenta con su total poblacional (número total de empadronados). A partir de la tabla de contingencia o de estratificación de la provincia (que consta en la información pública del instituto nacional y de la comunidad), se puede reproducir la repartición al nivel del municipio, manteniendo los mismos porcentajes, proporciones o razones que a nivel de la provincia. Por ejemplo, si de 450.000 habitantes de la provincia, 198.000 son hombres (un 44%), se estimará que de los 3.500 empadronados en el municipio, 1.540 serán hombres (aplicando 3.500 x 44). No obstante y por lo general, existe una buena disposición por parte de los ayuntamientos para facilitar información global (número de mujeres, por ejemplo, no identificaciones personales), por lo que en algunas ocasiones basta incluso con una llamada por teléfono para obtener la información necesaria. •

Basadas en listados comerciales. Existen empresas cuyo único cometido es almacenar datos de posibles compradores. Cuentan con esta información y la venden a quien esté dispuesto a comprarla. La información cuenta con nombres, apellidos, dirección y algunas características de interés como el estado civil, sexo y edad, y una idea del poder adquisitivo a partir de la zona de residencia, tipo de ocupación o, directamente, nivel de ingresos.

Investigación a través de los cuestionarios

100

Si bien el origen de estas bases de datos puede ser muy variado, un procedimiento frecuente consiste en aprovechar el consentimiento de la persona a registrar por medio de un regalo seguro o un sorteo. Así, por ejemplo, para recibir en casa una mantelería, un muñeco de peluche, un libro de recetas o una casita de plástico, el interesado rellena un cupón con sus datos personales y lo envía por correo. Al respecto, cada vez es más frecuente observar en tales cupones un pequeño texto donde se indica algo así como “si usted desea que sus datos sean borrados de nuestra base, por favor, indíquelo tachando la casilla adjunta”. Estos marcos son de interés puesto que cuentan con información actualizada y específica. Pero suelen ser propiedad de la marca que ha gestionado su obtención. Por esta razón, la entidad comercial que desee hacer uso de una base de datos similar, deberá comprar la información a una empresa especializada. •

Ligadas al contexto: cuando la población de interés no es la población global sino una de características muy específicas, puede existir un marco asociado de fácil localización. Por ejemplo, si se desea hacer una encuesta en una cadena de comercios, la entidad tiene la identificación exacta de todos sus empleados. Otro caso:

estudio

con

estudiantes

universitarios.

las

dependencias

administrativas de la universidad que se trate, tienen la identificación y localización de cada uno de los estudiantes matriculados durante el curso académico actual. Otro más: una encuesta sobre satisfacción con el producto, promovida por una empresa de coches. La entidad cuenta con una base de datos donde figura, incluso, el número de teléfono de los clientes. En las bases de datos ligadas al contexto es donde menos problemas se encuentra el investigador en el caso, claro está, de que el estudio esté promovido por la entidad propietaria de la información. Las investigaciones mediante encuestas por teléfono y por correo son las que disponen de un marco más fácil de conseguir, si bien más difícil de actualizar. En las encuestas por teléfono la exigencia mínima es contar con la definición o características de los números de teléfono de interés. Pueden corresponder sólo a un prefijo determinado y variar únicamente parte de los dígitos situados más a la derecha. Es difícil contar con una base de datos de números de teléfono aparte de las empresas de teléfono, obviamente. Por lo que la selección de números mediante un procedimiento automático

Investigación a través de los cuestionarios

101

debe hacerse mediante generación aleatoria. Por otro lado, la existencia de un listín telefónico no facilita la tarea en el sentido de que la selección aleatoria es tediosa, exige esfuerzo y está sujeta a error. Si se utilizara el listín, un procedimiento aconsejable es poner en marcha un muestreo sistemático con arranque aleatorio. Se supone que la distribución de los abonados es, en la práctica, aleatoria, ya que se disponen por orden alfabético, característica que cabe esperar que no correlacione con ninguna de las variables de interés. La utilización del soporte impreso, frente al informático, tiene la ventaja de que permite descartar los números que no corresponden a domicilios particulares. Por último, existe una limitación muy criticada con respecto a las encuestas telefónicas: el sesgo de cobertura. Mientras que todos los habitantes habitan en algún sitio, no todos tienen un teléfono de localización. No obstante, este problema decrece con velocidad, de tal forma que las encuestas por teléfono se muestran como una poderosa alternativa (en tiempo y, sobretodo, en costes) a las personales o cara a cara. En referencia a las encuestas por correo, si éstas se realizan con direcciones concretas, las imperfecciones del marco corresponden a problemas de recogida o actualización de la información por parte de las empresas dedicadas a ello. No obstante suele estar en vigor un acuerdo entre las dos partes interesadas según el cual la comunicación de una dirección errónea desde la entidad encuestadora a la propietaria de la base de datos, es gratificada de alguna forma. La mínima recompensa se traduce en una nueva dirección, pero pueden existir variantes como descuentos en el presupuesto, direcciones extra, etc. Consideremos que ambas entidades están interesadas en que la base de datos sea actual: quien encuesta porque ello aumenta las garantías de una muestra aleatoria, quien suministra la base porque aumenta la calidad de ésta. Con respecto al sesgo de cobertura, cabe señalar que las encuestas por correo no pueden aspirar a encuestar a cualquier tipo de población (inicialmente al alcance del procedimiento cara a cara). Sin embargo, en la práctica no interesa cualquier tipo de población, de tal forma que el procedimiento es seleccionado si existe un marco adecuado a la población de interés. 9.2.

Problemas con la ausencia de respuesta

La famosa expresión popular “del dicho al hecho hay mucho trecho” tiene una

Investigación a través de los cuestionarios

102

aplicación directa en investigación mediante encuestas cuando se trata de obtener la muestra que se ha diseñado. El primer problema ha sido abordado en el subapartado anterior: el marco del que se dispone no es perfecto. Pero el problema más grave con el que se encuentra el investigador viene después, cuando debe contarse con la colaboración de la población y recoger la información de interés. Hay gente que no se encuentra, otros que se localizan pero que no responden y otros que responden pero no a todo. En cualquier caso, tales sucesos se aglutinan en tomo a un problema común, omnipresente y de gran trascendencia en investigación mediante encuestas: el fenómeno de la no-respuesta. No es de extrañar, pues, que sea “éste uno de los problemas de no muestreo que más atención ha recibido por parte de los investigadores del método de encuestas” (Martínez Arias, 1995a: 499). Y ello principalmente por dos inconvenientes de peso que genera: disminuye el tamaño de la muestra y provoca un sesgo importante en los resultados (Adams, 1989: 105; Aparicio, 1991: 60; Levy y Lemeshow, 1991: 303) al no contar con la información proveniente de subpoblaciones concretas (a las que representan las unidades faltantes en el conjunto final de datos). Cuando alguien no responde a una encuesta, cabe sospechar que exista alguna variable que pueda explicar tal acontecimiento y es posible que esa variable tenga relación con la característica que se pretende medir. Pongamos por ejemplo que no se consiguiera la colaboración de buena parte de los empresarios en una investigación sobre el futuro laboral. ¿Quién creería los resultados del estudio? Es preceptivo el facilitar una medida de éxito en la participación de la población, a la hora de facilitar los resultados del estudio. Esta medida es conocida como tasa de respuesta (tr): número de unidades que han sido encuestadas con respecto al número de unidades que deberían haber sido encuestadas. tr =

encuestados encuestables

Pero ¿cómo de alta debe ser la tasa de respuesta? La contestación es muy sencilla: “la regla general es cuanto más alta mejor” (Fink y Kosecoff, 1989). Pero la aspiración al 100% es utópica. Groves y Kahm (1979: 3-4) facilitan algunas explicaciones al respecto: -

La gente no está y cuando está, está ocupada.

No creen que el estudio tenga consecuencias positivas o sospechan que tenga Investigación a través de los cuestionarios

103

consecuencias negativas o ambas cosas. -

Desconfían de abrir la puerta de casa a extraños.

Aspectos a los que podríamos añadir la influencia negativa que sobre la actitud de la población frente a las encuestas se ejerce desde la venta a domicilio (Manzano y otros, 1996). De hecho, si una investigación no pública alcanza una tasa de respuesta superior al 90% puede considerarse un verdadero éxito. Con mucha frecuencia, lo esperable es trabajar con tasas inferiores al 90% incluso en estudios donde se realizan revisitas. En general, cabe señalar una falta de máxima motivación o implicación en responder, lo que explica en parte el éxito de los censos precedidos por campañas de concienciación (Aparicio, 1991). Por otro lado, la conciencia de este problema lleva a los investigadores, especialmente en Psicología Social, al estudio de los conceptos de altruismo y conformidad como factores explicativos de la cooperación de los potenciales entrevistados en las encuestas (Groves, 1990). Por otro lado, la ausencia de respuesta puede ser debida a diferentes categorías de carácter técnico que tienen influencia en el modo en que son calculados los índices descriptivos de la no respuesta. Así, Lessler y KaIsbeek (1992:123-125) indican las siguientes categorías: - Determinadas subpoblaciones no pueden ser elegidas. Se encuentran en la población geográfica pero no pertenecen a la población objetivo. Es el caso de alguien que abre la puerta pero no debe ser encuestado (no corresponde al intervalo de edad de interés, corresponde a una categoría ya completa ...). - El seleccionado es elegible, pero se encuentra ausente del domicilio. - El seleccionado es elegible, se encuentra en su domicilio, pero rehúsa responder. - El seleccionado es elegible, se encuentra en su domicilio, accede a responder, pero existen impedimentos físicos, mentales, emocionales o de lenguaje que impiden la respuesta (por ejemplo, una enfermedad temporal que dificulta la expresión oral). De las cuatro, la segunda (ausencia o no contacto) y la tercera (rechazo o no cooperación) son las más comunes (Martínez Arias, 1995a) como fenómenos básicos para el cálculo de la no respuesta. Existe una muy abundante literatura sobre cuantías concretas para tasas de respuesta.

Investigación a través de los cuestionarios

104

Pero esta amplitud de información no va seguida de una calidad ni utilidad parejas. Ocurre que existe cierta reticencia a facilitar tasas de no respuesta en general, puesto que conforme ésta es mayor, disminuye la credibilidad en los resultados facilitados por el investigador. Por otro lado, los contextos de aplicación de las encuestas son muy variados y dispares espacio-temporalmente. Así, la mayoría de los estudios sobre el tema provienen de Estados Unidos, lugar muy peculiar en términos de frecuencia y actitud frente a las encuestas. Otro problema relacionado es la amplia y muy extensa cantidad de tasas de respuesta que se facilitan en los diferentes estudios. Dependen del tipo de investigación, medios disponibles, preparación de los encuestadores, cuestionario utilizado, contexto social en el que se realiza la encuesta, entorno geográfico y cultural, etc. La única conclusión con una validez amplia, pero con excepciones, es cualitativa y se refiere a que la tasa de respuesta es mayor en la entrevista personal, seguida muy de cerca por la telefónica y, bastante lejos ya, la entrevista postal. No obstante, algunos estudios comparativos otorgan el primer lugar a la encuesta por teléfono (Groves y Lyberg, 1988) lo que hace suponer que, al menos en Estados Unidos, el desarrollo técnico y la acumulación de experiencia para la encuesta por teléfono la sofistica y permite un mayor aumento del control de las respuestas. Los problemas de no-respuesta en los tres procedimientos de encuestas son diferentes. En términos generales, la cuestión es la misma: no se ha obtenido respuesta por parte del seleccionado. No obstante, existen ciertas particularidades. En la entrevista cara a cara, el encuestador cuenta con información y habilidades para resolver dudas, motivar e indagar respuestas, por lo que aumenta la probabilidad de obtenerlas. En la entrevista por teléfono, no existe la invasión de la intimidad y la seguridad que el encuestado puede sentir o temer ante una entrevista cara a cara, por lo que el acto de coger el teléfono resulta más fácil que el de abrir la puerta. Pero igualmente, es menos agresivo colgar el teléfono que cerrar la puerta, cuando no se desea continuar con la conversación. En general, depende mucho de las habilidades del encuestador, características de su voz, tipos de pregunta y longitud del cuestionario. La entrevista por correo es, sin duda, la que muestra menor tasa de respuesta. La sensación de compromiso con el encuestador (por teléfono o cara a cara) no existe,

Investigación a través de los cuestionarios

105

puesto que es el procedimiento menos personal. Por otro lado, cuando una persona es entrevistada por teléfono o cara a cara, ése es el momento y el lugar, mientras que responder a un cuestionario que se ha enviado por correo puede aplazarse indefinidamente. Se han puesto en marcha procedimientos para reducir la no-respuesta que pasan principalmente por facilitar la tarea (cuestionarios breves y fáciles de responder que impliquen poco esfuerzo y que incluyan el sobre sellado para su devolución) y motivar al encuestado (con textos de interés e incentivos económicos o regalos). En el capítulo próximo, sobre selección del encuestado, volveremos brevemente sobre esta cuestión, que, por otro lado, ya fue tratada en el capítulo anterior. Pero sea cual fuere el procedimiento aplicado y mientras no existan fundamentadas razones para suponer lo contrario, el colectivo de unidades que no responden cuenta con unas características definitorias cuya ignorancia puede invalidar con facilidad los resultados del estudio, al menos si se mantiene la misma población objeto inicial. De este modo, la tasa de respuesta no debería influir en el cálculo del tamaño óptimo de la muestra. La estrategia más recomendable es insistir en las unidades seleccionadas pero no entrevistadas. Al respecto, el encuestador tiene instrucciones precisas para insistir en la entrevista, quedar con los que comparten la vivienda con el seleccionado para pasar más adelante... Una estrategia muy recomendable, desde la teoría del muestreo (que no desde la práctica de las limitaciones económicas), es tratar al colectivo de unidades de norespuesta como una población de la que debe obtenerse una muestra, por lo que se debe poner en marcha una investigación paralela a la principal, incluyendo especialmente la fase de recogida de datos. 9.3.

Los encuestadores

Se supone que el investigador que diseña un estudio mediante encuestas tiene un conocimiento teórico suficiente como para abordar la tarea. Pero puede elaborar el diseño de la investigación en general y de la muestra en particular desde el sillón de un despacho. Pero llega el momento de la verdad: un grupo de gente debe salir a la calle (o llamar por teléfono) y realizar las encuestas. Son los encuestadores. Sobre sus espaldas recae buena parte de la credibilidad en los resultados finales del estudio. El trabajo de

Investigación a través de los cuestionarios

106

campo cuenta con abundantes oportunidades para relajar la atención, tomar decisiones incorrectas y provocar errores. Un encuestador puede seleccionar una calle a la izquierda en lugar de la derecha sencillamente por que ésta es cuesta arriba mientras que la otra no. En tal caso, las familias residentes en barrios altos tendrían menos oportunidades de pertenecer a la muestra que las de los barrios más bajos, con lo que se obtendría una muestra sesgada. El encuestador ideal es aquél que conoce su trabajo, sabe cómo hacerlo y lo hace bien. Tales características globales idílicas serán concretadas en un capítulo posterior, sobre la selección del encuestado. Para garantizar, en la medida de las posibilidades del investigador, que el encuestador cuenta con tales características, debe ponerse en marcha un proceso de formación o reciclaje de encuestadores antes del trabajo de campo. Igualmente y sobre todo si el estudio tiene cierta envergadura, cabe estructurar un sistema de supervisión que puede aconsejar, inclusive, la repetición, por parte del inspector, de alguno de los movimientos del encuestador. Por ejemplo, visitar a una persona encuestada y preguntarle acerca de la entrevista realizada.

Investigación a través de los cuestionarios

107

Anexo 1: Tabla de números aleatorios (3.000 dígitos) 36277

79771

94055

23255

49454

22163

93562

98683

42152

22210

76459

91204

04215

29993

74085

61350

51503

55988

01460

58420

61227

96936

20829

38453

63391

99242

21806

44058

14949

81895

81029

30004

04018

77008

53445

24195

75678

05639

34327

40161

80735

31209

37643

18394

39341

63075

37564

63356

98888

43497

36762

21307

60822

14555

32165

04437

64665

61742

30179

32208

73689

27868

13743

09724

92884

89141

67393

09781

96951

14046

62714

05451

59100

56413

77772

33694

44399

74915

16115

68373

76768

20772

31183

88984

59289

98936

55063

44884

89058

13725

44858

78454

66003

70234

16827

82521

35748

78810

22303

36587

65788

91988

64696

36094

41215

84685

64744

18991

33736

46748

72526

16617

03882

94036

98521

43993

00952

03760

39468

63362

80986

05923

41775

64340

86591

57482

24428

23561

72537

46551

19541

95979

66728

18210

48173

76861

82694

23268

73742

80176

60927

81874

05607

80098

05888

41420

86030

79295

63840

03355

57088

74698

46970

07197

04274

72712

74741

16221

70401

56276

52257

35416

31673

09925

52315

39483

56579

05246

47985

01633

98946

20304

76228

86932

17447

58648

10906

19300

63305

73716

31516

01821

41468

97596

87417

31591

56259

87391

20986

08535

12766

59360

25053

78281

21342

64836

79120

08320

34520

07228

78627

83748

27217

07276

61524

76269

89281

15058

59150

46415

36569

41053

86526

43485

46293

82001

05895

23519

48457

84308

06872

29123

00015

66961

66095

15069

89084

62074

38511

09260

60743

90706

19393

25227

65801

16274

22709

03460

24406

48140

22630

48421

83953

28563

21828

06372

45888

99621

17230

89503

49730

46807

15244

17273

58755

12933

98809

94790

77950

74207

52458

94848

82017

99112

47780

90518

44166

41478

62837

18760

29464

59980

01181

53439

61833

05837

16248

74049

44354

84001

40129

29949

74124

98792

29923

63520

51068

55299

01893

67586

20813

63875

07368

21653

50854

77053

49762

21159

26281

69751

49809

04056

18802

31814

57592

01683

88949

79102

83586

29059

86018

88826

24534

48428

66052

90990

26840

49405

71657

42548

09493

08627

57602

31616

04606

81044

51794

03276

33238

61926

67760

08333

58808

65242

45993

66939

90674

65163

90955

26485

71096

64361

48905

88421

42153

59764

32036

92263

89340

57778

59807

01287

55467

41342

37323

20482

16739

94992

37380

24549

41645

90313

33050

86699

84011

05370

61293

71998

02512

43714

95972

04366

48370

16581

86888

26533

82662

72482

16656

41324

72457

06052

93602

97833

44426

10119

63346

06408

49902

64186

93387

19585

92295

63693

68814

12283

92342

46590

61335

74347

00124

44216

31481

21634

26119

71592

28551

31358

67067

90961

08584

33522

69373

91938

14189

85081

52026

51160

00135

74150

47139

23577

94327

45809

75771

04458

10292

50867

01340

07774

88526

09472

33206

07695

33487

69019

13628

06893

91439

30954

84687

02296

74569

34796

31873

00310

43820

98000

83875

79856

63015

59272

37524

79913

67082

84178

32845

75583

29232

26544

47903

03825

14530

45046

38504

46899

90904

01314

59115

29420

69067

25194

15015

59189

83857

14989

48585

36134

40365

86959

52652

05879

48941

92435

06718

35919

62119

34827

06225

11346

54816

34875

89123

03867

16879

42657

86749

74014

64167

68652

14124

71084

73892

09599

33493

51117

76055

11906

34471

56722

27613

94560

93693

42668

16682

89673

66110

36859

88342

18304

46992

52825

93400

43873

50308

31058

52005

75739

50229

76020

11551

56162

49426

33971

73487

27219

44829

17101

77329

74406

42843

44872

86354

40532

26407

22388

05547

01804

80057

22446

09614

26710

75378

18116

71765

69077

90436

46359

57063

87579

28779

81038

89432

33436

43847

01647

71953

11599

67727

57548

01722

26390

57522

91118

78667

82898

29491

95185

48412

91474

34967

49251

78452

04651

77360

48758

53879

97349

77408

31655

46400

59412

85190

29281

16546

06700

11184

Investigación a través de los cuestionarios

108

IV.- SELECCIÓN DEL ENCUESTADO4 Vicente Manzano Arrondo Andrés González Gómez Introducción La última acción correspondiente a la selección de muestras es entrar en contacto con cada una de las unidades seleccionadas. En investigación mediante encuestas hablamos de la selección del encuestado. La selección de un encuestado en concreto y el procedimiento que envuelve esta acción se encuentran en función del tipo de encuesta que se está realizando: por correo, teléfono o cara a cara. Vamos a abordar esta cuestión, distinguiendo entre procedimientos. Con mucho, la mayor dificultad se centra en las encuestas cara a cara, especialmente en la recreación de un proceso aleatorio con desconocimiento del marco (rutas aleatorias). Existen ocasiones en las que las encuestas cara a cara exigen determinadas implementaciones peculiares. No es posible tratar todas aquí. Por ejemplo, en una encuesta sobre la calidad de la docencia universitaria, los alumnos son encuestados en sus grupos de clase, de forma colectiva, y el investigador cuenta con una base de datos actualizada y completa a los objetivos del estudio. Las instrucciones se harán en el aula, en voz alta, etc. En una encuesta realizada a los operarios de una fábrica, éstos pueden ser citados uno a uno para realizar una entrevista personal en una dependencia aislada. En definitiva, pues, puede llegar a observarse multitud de casuísticas en la investigación mediante encuestas. No obstante, en la práctica, se observa que los dos procedimientos multitudinarios, cuando se abordan poblaciones de gran tamaño y objetivos de amplia aplicación, son el muestreo por cuotas (especialmente en investigación comercial) y el muestreo por rutas aleatorias (especialmente en investigación social). Ambas estrategias serán las únicas que abordaremos dentro de las encuestas cara a cara. 1. Encuestas por correo Una vez que tengamos una base de datos útil y disponible, la selección del encuestado se reduce a realizar n decisiones aleatorias, siendo n el número de encuestas a realizar. 4

Rojas Tejada, A. et al. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Madrid. Síntesis.

Investigación a través de los cuestionarios

109

En investigación comercial es comprensible que no se realice un muestreo propiamente dicho, sino más bien una selección de subpoblaciones. Así, si la base de datos cuenta con información sobre posibles compradores de características muy dispares, en lugar de realizar un muestreo aleatorio de todos, puede interesar mucho más el encuestar a todos los que se encuentran en la base que cumplen con ciertas características peculiares, como es el tener un coche cuando la entidad que encuesta es una empresa de seguros, por ejemplo. En investigación social sí que se requiere la extracción de una muestra en su sentido más estricto. Con el marco a mano puede resultar fácil realizar una estratificación previa y seleccionar a los encuestados (con su identificación completa) desde un despacho. Una vez realizada la selección, lo más complicado del proceso consiste en poner en marcha una estrategia que aumente la probabilidad de obtener respuesta. Por ello se han de cumplir las siguientes condiciones: 1. El cuestionario debe reunir determinadas características, como es la brevedad en el número de preguntas y la claridad en su redacción y forma de respuesta. 2. La documentación que se adjunta debe ser suficientemente clara y atractiva como para que se garantice, en la medida de lo posible, que va a ser leída. En tal sentido una buena decisión (no en términos económicos) es utilizar formatos variados en tamaño y forma, así como jugar con los colores de los diferentes documentos y apartados dentro de éstos. 3. La documentación que se envía al seleccionado debe contener: a) El cuestionario con las instrucciones para su correcta cumplimentación. Información relativa a los objetivos del estudio, las entidades que colaboran, deciden, organizan o financian; trascendencia de los resultados; y cuanta información se considera que aumenta la percepción de un estudio bien hecho y en el cual el seleccionado tiene un papel importante. b) Información de contacto sobre dónde dirigirse, cómo y a quién, para recabar más información, resolver dudas o aportar sugerencias o comentarios. c) Sobre con dirección y franqueado (a ser posible con solapa autoadhesiva), de tal forma que el encuestado únicamente tenga que introducir el cuestionario

Investigación a través de los cuestionarios

110

resuelto, presionar la solapa y echar en el buzón. d) Es muy recomendable incluir un incentivo independiente de la motivación que haya podido crear el texto específico de información (que posiblemente no sea mucha). El incentivo puede medirse en términos de dinero en metálico o un regalo material. Al respecto existe cierta controversia acerca de si es mejor recompensar antes o después de que el encuestado envíe sus respuestas. Ocurre que al hacerlo antes, el seleccionado no tiene que responder para obtener su regalo. Si se hace después, puede que tampoco responda pues no tiene seguridad de que vaya a recibir su regalo después de que la empresa responsable ya tiene lo que quería (sus respuestas). Los incentivos económicos tienen, como cabe esperar, un efecto positivo en el sentido de que aumentan la tasa de respuestas (Scott, 1975; Church, 1993), pero en términos globales son preferibles pequeños incentivos, puesto que permiten el mejor equilibrio entre tasa de respuesta y coste de la investigación (James y Bolstein, 1992). 4. Buena parte de los encuestados no responden en un primer intento (según Ortega Martínez, 1981, las tasas de respuesta en España en las encuestas por correo varían entre un 10% y un 20%). Luego, es recomendable poner en marcha algún procedimiento de insistencia. Lo habitual es enviar, pasado un tiempo (por ejemplo un mes tras el envío del material), una tarjeta postal recordatoria y repetir la operación, si fuera necesario, tras un nuevo periodo de espera. 2. Encuestas por teléfono Cómo seleccionar al encuestado en una investigación mediante encuestas telefónicas pende de las características del marco y del procedimiento de selección de los números. Si el marco está compuesto por un listado de números reales de teléfono (un listín oficial, por ejemplo), la selección es fácil, aunque tediosa. El procedimiento ideal es realizar un muestreo sistemático con arranque aleatorio, bien sea distinguiendo o no entre poblaciones o prefijos específicos. Si no se parte del listado telefónico sino que los números son generados dígito a dígito por algún producto de software (Bradburn y Sudman, 1988; Burkheimer y Levinsohn, 188; Massey, 1988; Nicholls II, 1988), puede ocurrir que: 1. El número marcado no exista. Investigación a través de los cuestionarios

111

2. El número corresponda a un abonado de otra población. El segundo de los problemas tiene una solución fácil si los números de la población de interés se encuentran claramente delimitados, con un mínimo y máximo o mediante prefijos. Para el problema 1 no existen repercusiones en el análisis al considerar el hecho como una unidad ficticia que es ignorada, con lo que no incrementaría la tasa de no respuesta. En la generación por ordenador, si se encuentra conectado a la red puede hacerse que sea éste el que marque el número e, inclusive, dé una señal acústica y/o visual al encuestador con respecto al hecho de que se ha establecido contacto. Una vez con el número seleccionado y marcado se requiere un procedimiento mediante el cual se realice contacto con quien va a ser finalmente encuestado. Es posible que nadie coja el teléfono, en cuyo caso éste debe ser anotado (o registrado en una base específica en el caso de llamada por ordenador) para repetir la llamada en otra ocasión. Es posible que alguien coja el teléfono pero que no reúna las características necesarias para ser encuestado e, incluso, que no las reúna nadie de la vivienda. Es posible que exista una persona en la vivienda con el perfil adecuado para la encuesta, pero que no pueda acceder teléfono en esos momentos (no está o se encuentra indispuesto). En definitiva, la selección del número no implica selección del encuestado, sino que se trata de un paso previo. Como señala Fowler (1993), la decisión sobre qué persona en concreto entrevistar depende en primer lugar del tipo de investigación que se está realizando. Si la información es genérica sobre el domicilio y fácil de transmitir (por ejemplo cuántos trabajan, si disponen otra vivienda, etc.) puede servir cualquier adulto que se encuentre disponible. Si la información es genérica pero especializada, conviene preguntar por la persona con mayores conocimientos sobre el tema. En el caso de que la investigación verse sobre temas particulares y sea previsible, por tanto, que diferentes personas en un mismo domicilio darían distintas respuestas, será necesario establecer el mecanismo para seleccionar a una persona en particular. Dadas las similitudes que presenta esta situación con la que se produce en las encuestas a domicilio, postergamos su descripción a un apartado posterior. 3. Encuestas cara a cara: muestreo por cuotas Este procedimiento de selección de muestras: es una estrategia no aleatoria, que

Investigación a través de los cuestionarios

112

descarga en el encuestador buena parte de la representatividad de la muestra, si bien se intenta garantizar un mínimo mediante la utilización de tablas de contingencia. En la práctica, la entidad que gestiona el estudio obtiene un marco de la población de interés con algunas características definidas para determinadas variables o subpoblaciones. Usualmente, se cuenta con la repartición de la población en una doble estratificación: por sexos y edades. El investigador elabora x tablas de contingencia como la que figura en el cuadro 4.1, generalmente por zonas de encuesta. Estas tablas de contingencia, de estratos de cuotas, son suministradas a los encuestadores. El encuestador, por tanto, sabe qué cantidad de personas a encuestar se corresponden con los perfiles que figuran en la tabla de cuotas que le han suministrado. Se puede decidir asignar sólo determinados perfiles a determinados encuestadores (por ejemplo, que Juan Javier Gómez encueste a las mujeres de 50 o más años de la zona), pero esta decisión acarrea importantes inconvenientes con respecto a los sesgos introducidos por el encuestador, tanto en la selección concreta del encuestado como en la forma de preguntar y anotar las respuestas. Por ello, es preferible que todos los encuestadores cubran todos los perfiles, de tal forma que el posible efecto del encuestador se difumine por igual en las subpoblaciones contempladas. CUADRO 4.1. Ejemplo de una tabla de cuotas Años <18 18-25 26-40 >40 Hombre 12 15 18 15 60 Mujer 13 17 21 20 71 25 32 39 35 131 Así pues, el encuestador cuenta con una tabla de cuotas y una zona a encuestar. Sale a la calle y comienza su andadura... ¿Cómo seleccionar al encuestado? En un principio, la única limitación es que la persona a entrevistar encaje en alguno de los perfiles que le han sido asignados. Una estrategia que puede dar buenos resultados es intentar realizar la entrevista a las personas con el perfil que más entrevistas necesitemos para completar la cuota. En una investigación realizada así, la representatividad de la muestra no tendría ningún fundamento aleatorio sino que se basaría exclusivamente en la adecuada determinación de las cuotas. Cabe la posibilidad de “aleatorizar” en alguna medida el proceso instruyendo al entrevistador en el desarrollo de rutas aleatorias. Con esto estaríamos acercando el procedimiento al

Investigación a través de los cuestionarios

113

que describimos a continuación, ganando quizá en representatividad, pero a costa de reducir una de las principales ventajas del muestreo por cuotas, como es su sencillez. 4. Encuestas cara a cara: muestreo por rutas aleatorias Cuando interesa obtener una muestra aleatoria de una población, para realizar una investigación mediante encuestas y con el procedimiento cara a cara, si no se cuenta con información precisa que identifique las unidades a seleccionar, pueden aplicarse algunas de siguientes soluciones: 1. Realizar un muestreo por etapas. Siempre se cuenta con alguna información a algún nivel. Por ejemplo, sí se sabe el tamaño de cada provincia dentro de una región o comunidad autónoma. En la primera etapa se realiza un muestreo de conglomerados con el tamaño de éstos. En un momento posterior, se completa el marco de los conglomerados seleccionados, hasta el máximo nivel de información posible. Y así se continúa hasta que el nivel de información coincide con la identificación completa de las unidades a seleccionar. 2. Se limita geográficamente la zona a encuestar y se pone en marcha un procedimiento aleatorio de selección in situ, lo que conforma el procedimiento denominado rutas aleatorias. 3. Se pone en marcha una estrategia mixta que combine x etapas y una última en la que se aplican rutas aleatorias. Además, en la inmensa mayoría de las ocasiones, se lleva a cabo una estratificación de la población, de tal forma que, en la última etapa, durante la consecución de las rutas aleatorias, el encuestador debe cubrir determinados perfiles de encuestados. Con diferencia, el procedimiento más ampliamente utilizado es el tercero. Ahora nos centraremos en la construcción de rutas aleatorias. Así pues, la existencia de las rutas aleatorias queda justificada por la necesidad de contar con un procedimiento que seleccione unidades de la población en la frecuente situación la que se desconocen tanto las identidades como las localizaciones de las unidades. El procedimiento de las rutas aleatorias va a consistir básicamente en construir, sobre la marcha y por parte del encuestador, una ruta, camino o trayectoria por las calles o senderos de la zona, seleccionando sentidos de marcha, aceras, edificios, portales,

Investigación a través de los cuestionarios

114

escaleras, pisos y viviendas, siguiendo una estrategia aleatoria. Durante la consecución de la ruta, el encuestador irá seleccionando viviendas, en una primera fase, y encuestados dentro de cada vivienda seleccionada, en un momento posterior. Ambos aspectos van a ser tratados a continuación y en el mismo orden. 4.1.

Construcción de la ruta aleatoria

El muestreo por cuotas y el que se realiza mediante rutas aleatorias son aparentemente idénticos. En ambos se parte de una tabla de contingencia, estratos o cuotas que los encuestadores deben completar con entrevistas. Igualmente se aplican en situaciones donde no se cuenta con un marco completo que permita llegar directamente a las unidades seleccionadas. No obstante, desde la perspectiva del conocimiento científico, son procedimientos muy diferentes. En el muestreo por cuotas, el encuestador decide a quién encuestar en cada ocasión. Es cierto que debe conseguir x personas con un determinado perfil, pero ¿quiénes? Un encuestador, en el desarrollo de un muestreo por cuotas, puede encontrar varias personas con perfil de interés y seleccionar subjetivamente a unas en lugar de otras. El procedimiento subjetivo puede sistematizarse, pero se realizará de tal forma que dependerá finalmente del encuestador. De esta forma, si en lugar de ser Rosa María la encuestadora, fuera Carlos José, el grupo de encuestados (la muestra) estaría compuesta por otras unidades. El procedimiento es, por tanto, claramente subjetivo ya que depende del encuestador. En el muestreo por rutas aleatorias, por el contrario, el principio general, básico y omnipresente es el de conseguir una selección objetiva, en el sentido de que la selección de un encuestado concreto y no de otro no depende del encuestador que realiza la selección. No importa que sea Rosa María o Carlos José quien esté realizando la selección, el encuestado será el mismo. Por esta razón, no es el encuestador quien debe tomar las decisiones, sino un procedimiento independiente: una estrategia aleatoria. Para ello, contará con unas tablas aleatorias (o cualquier otro soporte operativamente similar) a las que acudirá en ida ocasión en la que deba tomar una decisión. Así pues, interesa reconstruir el procedimiento mediante el que se consigue la selección de una vivienda y, dentro de ella, la de un encuestado, y aislar los momentos en los que el encuestador debe tomar una decisión. Tales momentos son:

Investigación a través de los cuestionarios

115

Punto de partida en la zona. Sentido de la marcha desde el punto de partida. Selección de un edificio. Selección de una vivienda dentro del edificio. Selección de un posible encuestado, dentro de la vivienda. El quinto punto será abordado en el siguiente apartado. Ahora nos ocupa dar solución las situaciones 1 a 4. A) Decisión sobre un punto de partida El encuestador recibe una ficha de campo donde constará la zona que le ha sido asignada para la realización de las entrevistas, además de otras informaciones de interés. Si ya se encuentra en la zona, ¿por dónde comenzará? En alguna ocasión, en la ficha de campo puede figurar la identificación del punto de partida (una plaza, un límite, una calle concreta o una distancia). En tal caso, el investigador cuenta con información sobre la zona (idealmente, un plano) y ha tomado ya la decisión. Si no es así, el encuestador deberá decidir el punto de partida. Al respecto, carece de sentido elaborar aquí una lista extensa de posibles alternativas para decidir el punto de comienzo para el itinerario. El objetivo es que la decisión sea aleatoria. Por ejemplo, se dibujan algunos puntos dispersos en el plano de la zona y se escoge uno de ellos según la tabla de números aleatorios. O bien, si se carece de plano, puede comenzarse la ruta sin realizar entrevistas durante un tiempo estipulado con antelación (por ejemplo, durante cinco claves de conteo, según veremos más adelante), de tal forma que la ruta comienza en un punto aleatorio. B) Decisión sobre el sentido de la marcha: construcción del itinerario La siguiente decisión a tomar es hacia dónde se comienza el itinerario. Cabe esperar que existan varias alternativas, algunas de las cuales pueden asemejarse a las que constan en la figura 4.1. El procedimiento comienza identificando y numerando las alternativas y tomando una decisión aleatoria. Esta decisión consistirá en seleccionar al azar un número comprendido entre 1 y la cantidad de alternativas. Lo que se facilita mediante el uso de la tabla aleatoria para encuestadores, de la que tenemos un ejemplo en el anexo 1.

Investigación a través de los cuestionarios

116

Si el encuestador se encuentra realizando la encuesta número k del día, de la investigación o de la zona, consultará la fila k de la tabla. Si el número de alternativas es h, consultará la columna h. Luego, la alternativa seleccionada será la que se encuentra en la casilla de la fila k, columna h. Este procedimiento es único para cualquier decisión a tomar durante la construcción de la ruta. Una vez que ha seleccionado el sentido de la marcha, tomará una vía con dos lados (usualmente, una calle con dos aceras). Luego, deberá seleccionar una de las dos alternativas, volviendo a tomar una decisión aleatoria. O bien, puede estar estipulado de antemano que, una vez decidido el inicio de la marcha, comenzará, por ejemplo, por la acera de la derecha.

Ahora, el itinerario se construirá siguiendo la acera seleccionada y cambiando de lado o acera cada vez que tenga lugar un giro. La figura 4.2 muestra un itinerario construido siguiendo esta regla: sigue la acera seleccionada y cambia en cada giro. El lado sombreado de cada manzana corresponde a la acera seleccionada, mientras que la línea continua representa el itinerario construido.

FIGURA 4.2. Itinerario en el que se sigue la acera seleccionada (dibujo sombreado) y cambia en cada giro.

Investigación a través de los cuestionarios

117

La observación de la figura 4.2 puede llevar a la conclusión de que el procedimiento no es aleatorio, sino sistemático. No obstante, es ambas cosas. Inicialmente, las instrucciones siguen una sistemática clara. Sin embargo, las abundantes excepciones en el trazado de las calles (figura 4.3) darán al trayecto una apariencia y comportamiento aleatorios. En efecto, los municipios, con sus distritos, secciones censales y barrios, están construidos con una apariencia caótica: manzanas de tamaño y forma muy dispares se entrelazan con calles rectas y curvas, largas y breves. A su vez, aparecen muros, plazas, glorietas, callejones, ríos, puentes, desniveles, etc. Por ello, la regla de seguir la acera y cambiar el sentido con ésta, debe matizarse en función de las excepciones a un trazado monótono de los municipios:

FIGURA 4.3. Excepciones en los trazados de las calles.

1. Un callejón será considerado una entrada en una acera, de manera que forma parte de ésta y no varía el sentido de la ruta (figura 4.3a). 2. La decisión de cambiar de acera como procedimiento sistemático al variar el sentido de la marcha, podrá aplicarse cuando existan dos aceras (dos alternativas). La figura 4.3b muestra una situación en la que, al girar, la otra alternativa no es tal: en el lugar opuesto se encuentra una zona no habitada (sin viviendas): la tapia de una fábrica o edificio público, un puente, un río, una plaza, etc. En tal caso, el encuestador insiste en la acera en la que se encuentra, hasta que puede aplicar de nuevo la regla del cambio de acera. 3. Las variaciones progresivas de sentido son conflictivas por cuanto varían la dirección de la marcha pero no muestran un cambio brusco tal que permitan definir con

Investigación a través de los cuestionarios

118

claridad un cambio de acera. Tal situación se muestra en las figuras 4.3c y 4.3d. La decisión puede mantenerse en el sentido de variar únicamente ante un cambio brusco (e) o, ante la percepción del cambio gradual, escoger la otra acera como referencia (d). Cualquiera de ambos procederes debe ser indicado al encuestador antes de abordar la zona, pues de lo contrario estaría mediatizado por la situación. Recordemos que la regla general es tomar decisiones aleatorias, por lo que ante cualquier duda acerca de qué camino y acera considerar, bastará con consultar la tabla para el encuestador. C) Selección del edificio Mientras se construye el itinerario, se van realizando las entrevistas requeridas. Ello implica que el encuestador debe ir seleccionando viviendas a lo largo de la ruta (cuadro 4.2). Considerando que las viviendas se insertan en edificios concretos, el procedimiento pasará por seleccionar primeramente éstos. CUADRO 4.2. Operaciones a realizar con respecto a la selección de los edificios de la figura 4.4, con C = 15.

Edificio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

E 2 4 7 12 6 6 5 4 9 3 3 3 3 8 10 15 10 14

S 2 6 13 25 16 7 12 16 10 13 16 4 7 15 10 25 20 19

Operación ---S=10 (e.) S= (e.) --S=1 (e.) --S=1 (e.) --S=0 (e.) -S=10 (e.) S=5 (e.) S=4 (e.)

En términos generales, el encuestador recorrerá el itinerario contando y acumulando las viviendas por las que pasa. Cada C viviendas, realizará una entrevista. Así, al pasar por un edificio con un portal, dos escaleras, cuatro pisos por escalera y

Investigación a través de los cuestionarios

119

tres viviendas por piso, contará 2 x 4 x 3 = 24 viviendas y las acumulará al conteo previo. En el cuadro 4.2 se simboliza con S el monto o suma de viviendas contadas durante el trayecto y E al número de viviendas del edificio en cuya entrada o acceso se encuentra el encuestador. El procedimiento implicaría los siguientes pasos: 1. Se dirige al siguiente edificio y cuenta sus viviendas (E). 2. Realiza la operación S = S + E. 3. Si S < C entonces continúa por el paso 1, en caso contrario (S ≥ C) continúa por el paso 4. 4. Realiza la operación S = S - C y hace una entrevista en el edificio. Vuelve al paso 3. El proceso continúa hasta que se ha completado el número de entrevistas a realizar en la zona asignada.

FIGURA 4.4. Ejemplo de selección de edificios (marcados con un punto).

La constante C, que llamaremos constante de conteo, obedece a una decisión del investigador o diseñador del trabajo de campo. Cuanto mayor sea el valor de C, el itinerario será más largo (más tiempo empleado y mayor cansancio del encuestador con la consiguiente falta de atención y/o motivación). Cuanto menor sea el valor de C, la muestra estará más aglutinada en tomo a una sub-zona, con el consiguiente peligro de sesgo. C debe estar en función de la densidad de viviendas de la zona y el número de encuestas a realizar. En general, conforme mayor sea la densidad y menor el número de entrevistas a realizar, mayor deberá ser el valor de C, puesto que se puede

Investigación a través de los cuestionarios

120

abarcar una amplia zona en términos de número de viviendas, sin recorrer grandes distancias. Lo ideal al respecto es que el investigador realice un ensayo sobre un plano real o simulado con la información disponible, de tal forma que observe que el itinerario final abarca satisfactoriamente la zona de interés. La figura 4.4 muestra un ejemplo de selección de edificios, marcados con un punto. Por otro lado, en el cuadro 4.2 se muestran las operaciones pormenorizadas que justifican a selección de los edificios. D) Selección de la vivienda Dentro de cada edificio se contarán P portales, E escaleras por portal, N niveles o pisos por escalera y V viviendas por nivel. En cada caso se deberá tomar una decisión. Respectivamente, un número entre 1 y P, otro entre 1 y E, otro entre 1 y N y otro entre 1 y V. En todas estas decisiones, por tanto, se consultará la tabla de números aletatorios para el encuestador. El proceso, si bien parece complicado, corresponde a una de esas situaciones en las que se emplea mayor tiempo y esfuerzo en explicar las acciones que en realizaras. La experiencia demuestra que un encuestador convenientemente formado, realiza estas tareas con soltura y sin implicar un esfuerzo especial salvo en los primeros ensayos, ya que el encuestador lleva consigo la tabla para el trabajo de campo y la identificación de las alternativas. Además, las consultas a la tabla llevan sensiblemente menos tiempo que el empleado en cubrir el itinerario. En la figura 4.5 aparece un edificio y las selecciones realizadas utilizando la tabla del anexo 1. En este caso, en un edificio con dos portales, con cuatro pisos por escalera y con tres viviendas por planta, se ha seleccionado el P = 1, N = 1 y V = 3.

FIGURA 4.5. Selecciones en un edificio en función de la tabla del anexo

Investigación a través de los cuestionarios

121

4.2.

Selección del encuestado en la vivienda

Como vimos antes, la situación que se produce cuando alguien abre la puerta de su vivienda es similar a la que se produce cuando descuelga el teléfono. En ambos casos, suele ser necesaria una selección de las personas dentro del domicilio hasta determinar la persona la que finalmente se realizará la encuesta. No debemos olvidar que en ambos casos nos encontramos ante procedimientos de muestreo aleatorios y que debemos respetar esta aleatoriedad hasta el final del proceso si no queremos desvirtuarlo. En este sentido, la regla general de actuación consistiría en (Fowler, 1993, op. cit.): 1. Determinar el número de potenciales encuestados que habitan en el domicilio. 2. Numerarlos de una forma consistente en todos los domicilios. 3. Disponer de procedimiento objetivo para seleccionar a uno de ellos. Esta forma de proceder tiene el inconveniente de que aumenta la probabilidad de selección de las personas que viven en domicilios con menor número de habitantes. Por tanto, en investigaciones en las que la variable de estudio pueda estar relacionada con el número de personas que viven en el domicilio, puede ser necesario realizar algún tipo de ajuste sobre los datos. Por ejemplo, ponderando las respuestas en función del número de personas. De esta manera, es desaconsejable utilizar estrategias como realizar la entrevista a la persona que abre la puerta o descuelga el teléfono. Tal proceder podría sesgar la muestra al encontrarse sobre representadas las personas más dispuestas, en contra, por ejemplo, de las que prefieren seguir sentadas viendo el televisor. Por otro lado, hemos visto cómo el proceso hasta seleccionar la vivienda o el número teléfono estaba totalmente estructurado, no dejando cabida a la subjetividad del entrevistador. Es conveniente que esta estructuración se mantenga hasta el final, por lo que el procedimiento suele quedar recogido en un documento conocido como guía de la entrevista. Se trata de un esquema que permite al encuestador conducir con éxito el inicio de la entrevista (Harvatopoulos, Livan y Sarnin, 1992). Aunque esta guía comprende desde el momento en que alguien abre la puerta hasta el momento de finalizar la entrevista (Manzano y otros, 1996), en este punto nos limitaremos a la parte

Investigación a través de los cuestionarios

122

destinada a la selección definitiva del encuestado. No existe un formato universal de guía de la entrevista. Cada investigación concreta requerirá del desarrollo de una guía propia. Sin embargo, en el apartado dedicado a la sección del encuestado, todas compartirán un esquema similar, encaminado a desarrollar los tres pasos señalados con anterioridad. 1. Determinación del número de posibles encuestados que habitan el domicilio. Para ello, el entrevistador debe tener claramente definido el perfil válido del entrevistado. Éste puede ser constante (por ejemplo cualquier persona mayor de 18 años) o no. Esto último sucede en los muestreos estratificados, a medida que el entrevistador desarrolla su trabajo irá completando estratos, con lo que el perfil válido se irá reduciendo. Si en el primer caso la información se puede obtener mediante una sencilla pregunta, en caso de múltiples estratos una sola pregunta podría resultar excesivamente compleja. Imaginemos por ejemplo una pregunta como “¿cuántos hombres entre 25 y 35 años o más de 65 y cuántas mujeres de menos de 25 o entre 35 y 45 años viven en esta casa?” En estas situaciones, puede resultar mejor hacer una pregunta para cada estrato y que el propio entrevistador sume las respuestas hasta encontrar la cantidad total. 2. Numeración de los candidatos. Se debe escoger un procedimiento de numeración y mantenerlo durante toda la investigación. Un criterio sencillo es, por ejemplo, numerarlos en orden creciente de edad. 3. Selección final de la persona a entrevistar. Bosch y Torrente (1993) recogen métodos de selección del encuestado propuestos por Trodahl y Carter (1964); y por Dillman (1978) y Yish (en Guenzel, Berkaris y Cannel, 1983). Los dos procedimientos realizan la selección con el fin de averiguar el número de adultos de cada género que conviven en el domicilio. Con esta información, los entrevistadores disponen de una tabla (como la del cuadro 4.3) para seleccionar al encuestado. La diferencia entre los procedimientos de Dillman y Trodahl y Carter radica en que en el del primero la tabla es constante, mientras que en el de los segundos varía de encuesta a encuesta.

Nº de hombres

CUADRO 4.3. Selección del encuestado Nº de adultos 1 2 3 mujer más mujer más 0 mujer mayor joven

Investigación a través de los cuestionarios

4 o más mujer más joven

123

hombre hombre hombre más mayor

2 3

hombre hombre más joven hombre más joven

4o más

mujer más joven hombre más joven hombre más mayor hombre más mayor

Estos procedimientos son relativamente sencillos, pero plantean el problema de que sólo seleccionan a personas con edades extremas en el domicilio. El procedimiento propuesto por Kish soluciona el problema al identificar uno a uno a todos los miembros del hogar. En cambio es más costoso al requerir mayor número de preguntas. Implica conocer la edad, género y relación con la persona que recibe o responde al entrevistador de todos los habitantes del domicilio. A continuación, éstos son numerados y el entrevistador dispone de una serie de tablas de números aleatorios que le indican el número de la persona que ha de entrevistar. Otra forma de proceder, bastante simple y que otorga a todos los componentes del hogar la misma probabilidad de ser seleccionados, consiste en preguntar por la próxima persona en el domicilio en cumplir años. Sin embargo, implica que el interlocutor del entrevistador conozca esa fecha para todos los potenciales encuestados. Nosotros proponemos otro procedimiento, basado en el de Kish, pero que implica realizar menor número de preguntas. Por ejemplo, un entrevistador desea realizar la cuarta entrevista y el perfil válido comprende a todos los hombres mayores de edad y todas las mujeres entre 18 y 45 años. La forma de proceder podría quedar como sigue: 1. Saludo y presentación. 2. Pregunta: ¿Cuántos hombres mayores de edad viven en esta casa? 3. Respuesta: 2 (por ejemplo) 4. Pregunta: ¿Y cuántas mujeres entre 18 y 45? 5. Respuesta: 3. 6. El entrevistador suma las dos respuestas, obteniendo 5 posibles encuestados. Por tanto, consulta en una tabla como la del anexo 1 el cruce de la fila 4 (número de entrevista) y la columna 5 (número de candidatos), el resultado es el número 2.

Investigación a través de los cuestionarios

124

7. Pregunta: ¿Podría hablar con la segunda más joven de esas personas? Los procedimientos que acabamos de ejemplificar nos llevan hasta la determinación de la persona a entrevistar, pero no garantiza que finalmente podamos llevar a la práctica la entrevista. Cabe la posibilidad de que la persona seleccionada no se encuentre en ese momento en el domicilio. En este caso el proceder ortodoxo consistiría en averiguar el momento en que dicha persona estará disponible para realizar la entrevista. Si este proceder es relativamente sencillo y económico en el caso de las encuestas telefónicas, no lo es tanto en las encuestas a domicilio. El investigador responsable debe plantearse la investigación en términos realistas. Una excesiva demanda de trabajo hacia los entrevistadores obligándoles a realizar sucesivas visitas a un mismo domicilio, puede llevar a una desmotivación o fatiga de éstos, llevándoles a realizar peor su tarea. Por tanto, quizá sea conveniente dotar al entrevistador de procedimientos para sustituir a un entrevistado ausente por otro. Este criterio, con poca o ninguna justificación metodológica, cuenta con un buen sustento económico y psicológico. El lector puede encontrar un desarrollo similar al de este apartado (encuestas cara a cara: muestreo por rutas aleatorias), más orientado a la perspectiva del encuestador, en Manzano y otros (1996).

Investigación a través de los cuestionarios

125

Anexo 1: Tabla de números aleatorios para el encuestador 1

Investigación a través de los cuestionarios

126

V.- ELABORACIÓN DEL CUESTIONARIO5 José Luis Padilla García Andrés González Gómez Cristino Pérez Meléndez Introducción A simple vista, la tarea de elaborar un cuestionario no parece complicada. Los ejemplos de las encuestas publicadas en los medios de comunicación confirman esa impresión: “¿Qué periódico compra habitualmente?”, “¿cuál es su profesión?”, “¿dónde vive?”, etc. Las preguntas anteriores no son “complejas” ni “sofisticadas”. Pues bien, las primeras impresiones como en tantas situaciones pueden engañarnos. No es exagerado decir que gran parte del éxito y solvencia de la encuesta depende de la calidad del cuestionario. Gallup (1935) alertó ya sobre la magnitud de las variaciones introducidas en las encuestas por el diseño del cuestionario, variaciones que pueden ser semejantes e incluso superiores a las provocadas por el diseño y elección de la muestra. Esperamos haber desterrado la imagen habitual que reduce la elaboración del cuestionario a la mera redacción, intuitiva y apresurada, de las preguntas, para favorecer la utilización de un procedimiento sistemático y flexible. Los contenidos que presentamos abarcan desde la decisión inicial de elaborar un cuestionario hasta los posibles controles sobre su calidad, pasando por la aclaración del objetivo u objetivos que se pretenden conseguir, el diseño del instrumento, la redacción y elaboración de las preguntas y otros instrumentos de medida, para terminar con la edición del cuadernillo. No existe una teoría consolidada que guíe la elaboración del cuestionario y la redacción de las preguntas. Foddy (1996) recoge las razones apuntadas por Gallup en numerosos escritos: a) la presión por obtener resultados inmediatos en las investigaciones por encuesta ligadas a intereses prácticos, no favorece el estudio de la técnica de redacción Rojas Tejada, A. et al. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Madrid. Síntesis. 5

Investigación a través de los cuestionarios

127

de las preguntas; b) durante mucho tiempo la utilización de medidas subjetivas no ha estado de moda entre los investigadores sociales; y c) la investigación social ha tenido que enfrentarse a unas pocas reglas basadas en el sentido común y la experiencia colectiva acumulada. Este capítulo pretende contribuir a consolidar el cuerpo de conocimientos sobre la elaboración del cuestionario en la investigación mediante encuesta. Los objetivos del mismo son: - Tomar una decisión adecuada sobre si procede o no la elaboración de un

cuestionario. - Utilizar el esquema conceptual sobre la medición como criterio durante el proceso de

elaboración. - Formular en términos operativos el objetivo e información que el cuestionario debe

aportar. - Diseñar el cuestionario de forma que responda a los objetivos de la encuesta. - Redactar preguntas precisas y relevantes sobre las variables y componentes

recogidos en los objetivos de la encuesta. - Comprobar la calidad del cuestionario. - Ser conscientes de las consecuencias que puede acarrear la utilización de un

cuestionario. 1. ¿Qué es un cuestionario? La pregunta es oportuna. La literatura sobre métodos de investigación social está repleta de definiciones diferentes de lo que es un cuestionario y de una serie de términos con los que suele coincidir, y por tanto, ser confundido: encuesta, entrevista, test, escala, etc. No es este el lugar para intentar una clarificación terminológica. Sí lo es para fijar el significado que a lo largo del capítulo asignaremos al término “cuestionario”. La mayoría de los autores (por ejemplo Santesmases, 1997) coincidirían en la siguiente definición: “Un cuestionario es el documento que recoge de forma organizada las preguntas sobre el objetivo de la encuesta”.

Investigación a través de los cuestionarios

128

La definición requiere dos modificaciones para adaptarla al contenido. Primera, podemos sustituir la palabra “preguntas” por “indicadores”. El término “indicadores” engloba tanto las preguntas sobre hechos como los tests diseñados para medir estados subjetivos, opiniones, creencias, valoraciones, etc. Segundo, más que referimos al “objetivo de la encuesta” debemos aludir a las variables implicadas en el objetivo de la encuesta. La definición quedaría así: “Un cuestionario es el documento que recoge de forma organizada los indicadores de las variables implicadas en el objetivo de la encuesta”. La definición tiene la virtud de la generalidad: abarca todas las posibles formas de administración de la encuesta (“cara a cara”, por teléfono o autoadministrada); y recoge todo el conjunto de posibles preguntas (demográficas, factuales, de opinión, etc.). La delimitación conceptual de otros términos cercanos ha sido tratada en capítulos anteriores, no obstante, a continuación se presentan algunas definiciones simples para quienes estén realizando una lectura independiente de los capítulos. - Encuesta. Sistema de recogida de información sobre una amplia variedad de temas para una gran diversidad de objetivos. Se suele identificar con un sondeo o medición masiva de la opinión pública mediante un cuestionario. - Entrevista. Nombra la interacción entre el encuestador y el encuestado. El encuestador desaparece en el caso de los cuestionarios auto-administrados. - Test. Instrumento estandarizado de medición psicológica diseñado para cuantificar la cantidad de una variable que presenta una persona. - Escala. El conjunto de valores numéricos que resultan del proceso de medición. 2. ¿Por qué utilizar un cuestionario? La pregunta está ligada a una previa: ¿por qué utilizar una encuesta? El cuestionario es el instrumento de recogida de información en la encuesta. Las razones que hayan llevado a realizar la encuesta son las que motivan la elaboración del cuestionario. No obstante, la respuesta a la pregunta “¿por qué utilizar una encuesta?” debe tener en cuenta las ventajas y limitaciones del cuestionario como instrumento de recogida de información. De manera escueta, podemos recoger las ventajas e inconvenientes apuntados por Munn y Drever (1995). Las ventajas son las siguientes: -

Aporta información estandarizada. Los encuestados responden al mismo conjunto

Investigación a través de los cuestionarios

129

de cuestiones, por lo que es más fácil comparar e interpretar sus respuestas. -

Ahorra tiempo. El cuestionario contribuye a realizar un uso eficiente del tiempo de diferentes formas: 1. Permite encuestar a un gran número de personas de una vez. 2. El encuestado puede responder en algunas ocasiones en el momento más adecuado. 3. Agiliza el análisis estadístico de las respuestas.

Facilita la confidencialidad. El encuestado puede responder con franqueza y sinceridad, contribuyendo el cuestionario a asegurar su anonimato.

En cuanto a las limitaciones cabe mencionar: - Responde a objetivos descriptivos. Resulta difícil diseñar el cuestionario para

contribuir a la explicación de relaciones entre variables. - Superficialidad de la información. Es la contrapartida a la estandarización. La

formulación de preguntas homogéneas impide profundizar en las respuestas de los encuestados. - Difícil elaboración. El proceso de elaboración del cuestionario lleva tiempo y requiere

experiencia y conocimientos específicos. No es fácil elaborar cuestionarios de calidad. Estas ventajas e inconvenientes deben ser ponderados atendiendo al tipo de encuesta de la que el cuestionario sea el instrumento (por ejemplo, telefónicas, cara a cara, etc.). 3. Esquema conceptual para orientar la elaboración del cuestionario El cuestionario es un instrumento de medida. La mayoría de las encuestas persiguen cuantificar de una forma u otra la información aportada por los encuestados. Cuantificar las respuestas de las personas es “medir” las variables implicadas en el objetivo de la encuesta. La elaboración del cuestionario es un proceso en el que, explícita o implícitamente, intervienen concepciones e ideas sobre la medición de variables psicológicas y sociológicas. Es importante conocer estos argumentos, ya que justifican la dinámica del proceso de elaboración del cuestionario. El objetivo de este apartado es introducir al lector en el conjunto de ideas y conceptos sobre la medición que orientan la elaboración del cuestionario. Este conjunto teórico

Investigación a través de los cuestionarios

130

forma un esquema que da sentido a las recomendaciones para la redacción de las preguntas, valorándolas por su contribución a la fiabilidad y validez del proceso de medición. 3.1.

Las variables son constructos

La mayoría de las variables que se pretenden medir con los cuestionarios no se pueden observar de forma directa. A diferencia de las variables físicas (por ejemplo longitud, peso, altura, etc.), las variables psicológicas y educativas (por ejemplo intención de voto, salud, autoestima, etc.) son elaboraciones teóricas denominadas “constructos”. Rocker y Algina (1986) atribuyen al “constructo” un papel de etiqueta que resume todo un conjunto de comportamientos relacionados. Por ejemplo, el constructo “liderazgo” puede resumir comportamientos como “repartir tareas”, “fijar objetivos”, “resolver problemas”, etc. Resulta obvio que la medición de un constructo debe empezar enumerando los comportamientos que el constructo engloba, tarea tradicionalmente denominada “definición operacional”. Lord y Novick (1968), para superar una limitación clara de esta visión operacionalista de la medida, plantearon la necesidad de incluir en la definición del constructo el conjunto de las relaciones del constructo con otros constructos y/o v variables comportamentales. Esta doble aproximación a la definición de los constructos es hoy día ampliamente aceptada por los profesionales de la medida. ¿Qué papel juega el cuestionario? Para responder a este interrogante, además de considerar el cuestionario como un todo, necesitamos prestar atención a las preguntas y tests que lo forman. Todos compartiremos la idea de que el proceso de medida no es una situación “natural”. No podemos esperar a que las personas muestren de manera espontánea los comportamientos fijados como representativos de la variable. Debemos provocar la aparición de esos comportamientos. Esta es la función de las preguntas y tests del cuestionario: “provocar” las respuestas que servirán de indicadores del constructo a medir. La figura 5.1 reproduce esta argumentación. Este esquema permite utilizar una definición de medición muy adecuada para la elaboración del cuestionario. Sullivan y Feldman (1994) consideraron que la medida en las Ciencias Sociales es el proceso de “ligar” los conceptos abstractos de las teorías con indicadores empíricos, o de otra forma, la puesta en práctica de un plan sistemático, explícito, para “clasificar” y en la mayoría de los casos “cuantificar” los

Investigación a través de los cuestionarios

131

datos particulares en términos de los conceptos más generales del esquema teórico.

CONSTRUCTO Comportamientos C1

CUESTIONARIO Respuestas R1

MEDICIÓN

INTERPRETACIÓN Figura 5.1. Esquema general de la medida.

Sin embargo, el proceso de “conectar” los indicadores empíricos con los conceptos teóricos dista de ser fácil. Torgerson (1958) analizó una de las dificultades más evidentes: la falta de acuerdo sobre los indicadores empíricos de la mayoría de los constructos psicológicos. Foddy (1996) recoge una serie de problemas que podrían desanimar a cualquiera que iniciara la elaboración de un cuestionario. Sólo se apuntan algunos: -

Las preguntas sobre hechos y datos biográficos pueden generar respuestas inválidas.

No hay una relación fuerte entre lo que los encuestados dicen que hacen y lo que hacen.

Las opiniones, creencias, actitudes e intereses de las personas son muy inestables.

Pequeños cambios en la redacción de las preguntas pueden producir cambios importantes en las respuestas.

Investigación a través de los cuestionarios

132

Los encuestados habitualmente interpretan mal las preguntas

En fin, sólo con buenas dosis de optimismo y falta de pudor se puede alguien embarcar en la tarea. La mayoría de los problemas apuntados inciden sobre la relación entre la respuesta y el constructo en la que la pregunta o test juega un papel de “mediador”. Esta relación se puede debilitar por factores que introduzcan una variabilidad no deseada en las respuestas. No olvidemos que el responsable de la medición pretende atribuir las diferencias en las respuestas sólo a diferencias en la variable que se pretende medir. De ahí la denominación de “errores de medida” para estas fuentes indeseables de variación. El estudio de los errores de medida ha sido tradicionalmente responsabilidad de dos áreas de investigación: la fiabilidad y la validez. El tratamiento detallado de ambas cuestiones queda fuera del alcance de este capítulo. Ahora sólo nos interesa apuntar su significado, ya que serán los criterios que nos conducirán en la elaboración de las preguntas. Detengámonos un momento en cada uno: a) Fiabilidad. La relación entre las respuestas y los constructos puede resultar “contaminada” por fuentes de variación que actúen sin un patrón sistemático. Por ejemplo, la redacción ambigua de una pregunta, la inclusión de una palabra con un significado técnico, la situación en que la persona responde al cuestionario (“ruido”, “temperatura”, “tranquilidad”, etc.). Resulta difícil predecir cómo estos factores pueden influir en las respuestas. Desde una perspectiva pragmática el mandato de este criterio durante la elaboración del cuestionario podría resumirse así: por un lado, dos encuestados con el mismo valor en la variable deberían darnos la misma respuesta; y por otro, un encuestado preguntado en dos ocasiones distintas debería darnos la misma respuesta, si no ha cambiado su valor en la variable. b) Validez. El responsable de la encuesta persigue atribuir las diferencias en las respuestas de los encuestados sólo a la variable que pretende medir. Por ejemplo, las diferencias en las respuestas a la pregunta “¿a qué partido votaría si mañana hubiera elecciones?” sólo se explicarían por la diferente “intención de voto” de los encuestados. Durante la elaboración del cuestionario debemos procurar no “abrir la puerta” a fuentes sistemáticas, variables distintas a la que queremos medir, que adulteren la interpretación de las mediciones. La meta que debemos alcanzar con la elaboración del cuestionario ha quedado despejada: la elaboración de preguntas y tests que proporcionen respuestas fiables y

Investigación a través de los cuestionarios

133

válidas de las variables implicadas en el objetivo de la encuesta. Además, disponemos de un criterio para valorar cualquier alternativa (por ejemplo: pregunta abierta frente a pregunta cerrada) durante la elaboración del cuestionario: la opción que más contribuya a la fiabilidad y validez de las mediciones. Para completar este apartado es necesario comentar dos cuestiones, más “domésticas” pero muy relevantes, que debemos tener presentes en la elaboración del cuestionario. A) De lo que se pregunta es de lo que responden

La forma en que se hacen las preguntas determina las repuestas que se obtienen. Dicho así puede parecer una obviedad: preguntas diferentes obtendrán, naturalmente, respuestas diferentes. Pero es importante caer en la cuenta del efecto sobre las respuestas producidas por pequeños cambios en la redacción de las preguntas. Fink (1995a) propone un ejemplo ilustrativo de cómo pequeños cambios -una o dos palabras- en la redacción de las preguntas pueden cambiar las respuestas. El ejemplo compara estas tres preguntas sobre una hipotética subida de impuestos pensiones: - ¿Apoyaría un aumento de los impuestos para financiar las pensiones? - ¿Apoyaría un aumento de sus impuestos para financiar las pensiones? - ¿Apoyaría un aumento del 10% en sus impuestos para financiar las pensiones? La cursiva indica el elemento de las preguntas que puede cambiar el sentido de las respuestas. Las tres preguntas podrían formar parte de encuestas con el mismo objetivo. No sería aventurado apuntar una progresiva disminución en la frecuencia de respuestas afirmativas a medida que se concreta la formulación de la pregunta. La recomendación está clara: todas las palabras utilizadas al redactar una pregunta cuentan. Además un consejo: al leer los resultados de una encuesta no se ha de mirar únicamente los gráficos, hay que prestar un poco de atención a la redacción de las preguntas. B) Las respuestas no nos interesan en sí mismas

El impacto del epígrafe es menor si revisamos de nuevo el esquema de la figura 5.1. El valor de las respuestas depende de su relación con la variable que pretendemos medir y, en última instancia, de que tengan una relación predecible con hechos o comportamientos relevantes.

Investigación a través de los cuestionarios

134

La investigación mediante encuesta no termina con la presentación “bruta” de los resultados. Siempre hay una tarea de interpretación que conecta los resultados con el objetivo de la encuesta. Sin la interpretación la encuesta no tiene sentido. La interpretación no sólo ocurre cuando la encuesta es la técnica de recogida de datos para examinar una hipótesis. Pensemos qué ocurre con encuestas para objetivos más prácticos. Por ejemplo, una encuesta para conocer la valoración de un nuevo modelo de coche. La encuesta plantea preguntas sobre la “seguridad”, la “potencia”, la idea de “libertad e independencia”, los “colores más atractivos”, etc. El receptor de esta información está interesado en estos aspectos por estar relacionados con un comportamiento predecible: comprar el nuevo modelo de coche. ¿Qué ocurre con las encuestas que miden estados subjetivos? ¿Tienen en ese caso las respuestas un interés en sí mismas? Tampoco. Pensemos en una encuesta que intenta conocer la “credibilidad” que tienen los líderes políticos para los votantes. Los entrevistadores piden a los encuestados que ordenen a los líderes políticos desde el que tiene más credibilidad hasta el que tiene menos. Las ordenaciones concretas tienen interés si reflejan de forma adecuada la variable “credibilidad”; variable que, a su vez, puede predecir parcialmente determinados comportamientos, por ejemplo, el voto en las siguientes elecciones. El autor del cuestionario no puede ignorar que las respuestas obtenidas serán después interpretadas. Anticipar las interpretaciones le proporcionará otro elemento clave para valorar la calidad de las preguntas e instrumentos que desee incluir en el cuestionario. 4. Pasos para la elaboración del cuestionario La elaboración del cuestionario no empieza con la redacción de las preguntas. Esta declaración no debería sorprender a nadie: la construcción de una casa tampoco se inicia levantando las paredes de las habitaciones. Seguro que nadie viviría, si lo pudiera evitar, en una casa construida sin los planos de un arquitecto; tampoco nadie debería elaborar o utilizar un cuestionario sin hacer o disponer de una planificación del mismo. Además, las casas antes de ser habitadas deben pasar una serie de inspecciones y controles; los cuestionarios deben salvar también una serie de controles que puedan detectar errores o defectos en su elaboración. La analogía entre la elaboración del cuestionario y la construcción de una casa debe servir para consolidar la idea de que estamos ante un proceso con una serie de pasos,

Investigación a través de los cuestionarios

135

algunos de los cuales son “controles de calidad” del producto. Los pasos que proponemos para este proceso son: 1. Determinación precisa de los objetivos del cuestionario. 2. Planificación del cuestionario. 3. Elaboración y/o selección de las preguntas y/o tests. 4. Análisis de la calidad de las preguntas y/o tests. 5. Disposición provisional de las preguntas y/o tests en el cuadernillo. 6. Análisis de la fiabilidad y validez del cuestionario. 7. Edición final del cuestionario. Los atributos más destacables del proceso son la “sistematicidad” y “flexibilidad”. Sistematicidad por existir un orden “lógico” en las tareas a realizar, y flexibilidad porque las actividades realizadas en un paso pueden modificar el trabajo realizado en pasos anteriores. Por ejemplo, el análisis de la calidad de las preguntas puede aportar información relevante para modificar la redacción de algunas de ellas. Dedicaremos ahora un apartado a los pasos más relevantes del proceso, dejando, por ejemplo, el análisis de la fiabilidad y validez para más adelante. 5. El objetivo del cuestionario El primer paso en la elaboración del cuestionario es describir con el mayor detalle posible el objetivo u objetivos que pretende lograr. Obviamente, la primera fuente de información es el objetivo de la encuesta. No olvidemos que el cuestionario de recogida de información de la encuesta: el objetivo de la encuesta es el objetivo del cuestionario. Los problemas pueden aparecer si el objetivo de la encuesta no está definido con precisión. Dada la continua interacción entre los pasos de la investigación por encuesta, el inicio de la elaboración del cuestionario puede ser un momento oportuno para rertomar el objetivo de la encuesta. Harvatopoulos, Livan y Sarnin (1992) consideran que un cuestionario puede responder a tres objetivos: - Estimar magnitudes. Por ejemplo, para estimar el porcentaje de votantes de un partido político en unas elecciones. - Describir una población. Describir las características de un determinado grupo social (por ejemplo intereses, problemas, composición étnica, etc.).

Investigación a través de los cuestionarios

136

- Verificar hipótesis. Se trata de obtener los datos para examinar hipótesis sobre relaciones entre variables (por ejemplo varía la intención de voto con la edad, la importancia atribuida al trabajo depende del género, etc.). Sea cual sea el objetivo, debe estar definido con precisión. Ahora bien, ¿cómo saber si el grado de precisión de la definición es suficiente? Nos atrevemos a proponer dos criterios que pueden ayudar a valorar la claridad de los objetivos: - Cualquier persona que lea la declaración del objetivo debe coincidir con las variables que es necesario medir para alcanzarlo. - En el caso de una hipótesis, se debe conseguir el mayor consenso posible en el tipo de resultados que confirmaría o rechazaría la hipótesis. Somos conscientes de que el problema es mucho más complejo, pero los criterios anteriores pueden ayudar a caminar por un territorio más confuso de lo que se suele reconocer. A pesar de su importancia, la formulación del objetivo se suele hacer en términos muy vagos: situación educativa, calidad de la enseñanza, conservadurismo, necesidades sanitarias o de salud, etc. Términos confusos que más adelante será necesario definir. Las siguientes declaraciones presentan ejemplos de objetivos: conocer los juicios de los alumnos sobre la calidad de la enseñanza universitaria, predecir la intención de voto en las próximas elecciones, describir las opiniones con respecto a la despenalización del aborto, etc. ¿Por qué insistir tanto en la necesidad de tener un objetivo claramente definido? El objetivo es el “foco de la encuesta”, es decir, todas las decisiones que afectan a la elaboración del cuestionario se deben tomar por su contribución al objetivo de la encuesta. La función que desempeña el objetivo de la encuesta es tan importante que debemos detenernos hasta no tener una declaración precisa del mismo. El autor debe iniciar ahora la planificación del cuestionario, pero antes, debemos apuntar el efecto que sobre el cuestionario tienen dos conjuntos de factores que hemos agrupado bajo las denominaciones del “contexto de la encuesta” y los “recursos disponibles”. Son tratadas en este apartado por que pueden llegar a condicionar el objetivo de la encuesta, y por tanto, del cuestionario.

Investigación a través de los cuestionarios

137

5.1.

El contexto de la encuesta

Las encuestas se administran en un contexto social, económico y cultural. Las características de este contexto influirán claramente en la redacción de las preguntas. Numerosos autores han prestado atención a la importancia del contexto de realización de la encuesta en la elaboración del cuestionario (Fink, 1995a, 1995b; Foddy, 1996; Fowler, 1993). Sin duda, el elemento más importante del contexto son las características de los propios encuestados. Fundamentalmente, el nivel de compresión del lenguaje utilizado en el cuestionario y el grado de conocimiento sobre el tema de la encuesta. Imaginemos, por ejemplo, la realización de una encuesta en una localidad con personas de diferente procedencia y dominio del lenguaje. La formulación de las preguntas deberá adaptarse a estas circunstancias. La redacción de las preguntas debe atender a nuestras necesidades de información, pero también a que los encuestados las puedan responder de forma fácil y precisa. Es necesario examinar la adecuación del lenguaje utilizado en las preguntas al nivel del lenguaje de los encuestados. Por ejemplo, si la habilidad lectora varía considerablemente entre los encuestados es necesario formular las preguntas de manera que puedan ser leídas y comprendidas por el mayor número de encuestados. También hay que estar seguro de que los encuestados tienen un conocimiento suficiente para responder a las preguntas. Plantear preguntas que no sepan contestar puede ser extremadamente frustrante. Imaginemos que a personas de un nivel cultural bajo les hacemos la siguiente pregunta: “¿qué opina de la fluctuaciones del producto interior bruto de España en la última década?” Preguntas que los encuestados no sepan responder lleva a éstos a contestar al azar o a rechazar las respuestas. Los encuestados también pueden tener dificultades para responder preguntas sobre sus comportamientos o acciones pasadas o futuras, por ejemplo: “¿cuántas veces fue al médico especialista durante los dos últimos años?” Otro factor relevante del contexto es si las respuestas serán o no anónimas. Las respuestas a preguntas comprometedoras dependerán fuertemente de las condiciones en que se administre y responda a la encuesta, y la formulación de las preguntas deberá adaptarse también a estas circunstancias. Las características de los encuestados, la redacción de las preguntas, la

Investigación a través de los cuestionarios

138

confidencialidad posible de las respuestas... son elementos que el autor del cuestionario debe considerar en la misma formulación de los objetivos del cuestionario y en su planificación. 5.2.

Los recursos disponibles

El número de preguntas incluidas en la encuesta depende primero de lo que necesitemos conocer y de cuántas preguntas sean necesarias para obtener una medida adecuada de las variables implicadas en el objetivo de la encuesta. Pero, desgraciadamente, no son éstas las únicas consideraciones. Influirá también el tiempo disponible para hacer la encuesta, tiempo que estará en función del tamaño de la muestra, medios económicos, modelo de muestro, etc. Es obvio que en una administración de media hora podemos hacer más preguntas que en una de 10 minutos. La planificación del cuestionario no es ajena al número de preguntas que se podrá hacer durante la encuesta. Otro factor, directamente relacionado con los recursos disponibles, es la elección y formación de los encuestadores. El encuestador ideal es aquel que siempre hace las preguntas de la misma manera a todos los encuestados. De esta forma, el encuestador no se convertirá en una fuente de error que impida la comparación y generalización de la información. Además de su propia formación y experiencia, las preguntas deben contribuir a que el encuestador no se vea obligado a dar información, interpretar el sentido de las preguntas, intuir la orientación y las respuestas previstas, etc. Esto sólo se puede conseguir con preguntas concretas, relevantes y fáciles de entender por los encuestados. La experiencia y formación de los encuestadores influirá también en el formato y complejidad de las preguntas del cuestionario. 6. El diseño del cuestionario La finalidad del diseño es plasmar el objetivo o propósitos del cuestionario en un conjunto de preguntas relevantes y en la elaboración o selección de los tests necesarios para medir las variables. Podemos retomar una analogía anterior. Una vez que hemos aclarado con los propietarios la relación de habitaciones y sus características -los objetivos- ha llegado el momento de dibujar los planos: el diseño del cuestionario. El autor del cuestionario debe abordar en el momento del diseño dos actividades:

Investigación a través de los cuestionarios

139

A) Clarificar las declaraciones sobre los objetivos del cuestionario La tarea ahora es “diseccionar” los enunciados sobre el objetivo del cuestionario hasta aislar todas las áreas de contenido e identificar las variables implicadas en cada una. Este proceso obliga también a clarificar los términos utilizados para definir los objetivos. Es posible que se deba volver al paso anterior para precisar el significado atribuido a algunos de los términos. Para clarificar los objetivos del cuestionario es necesario: -

Detallar las áreas de contenido. Por ejemplo, supongamos que deseamos conocer la calidad de la enseñanza universitaria. Antes de nada, necesitamos “diseccionar” el concepto “calidad de la enseñanza”, dividiéndolo en los siguientes aspectos: profesorado, planes de estudio, medios disponibles, niveles de éxito académico, satisfacción de los alumnos, formación previa de los alumnos, etc.

Especificar los aspectos concretos de cada área. Siguiendo con el ejemplo anterior, respecto a cada una de las áreas deberemos especificar los aspectos que la componen. Por ejemplo, para el área “profesorado”: edad, género, antigüedad en el puesto, nivel profesional, formación para las asignaturas, satisfacción con el trabajo, etc. De igual modo habría que proceder con cada una de las áreas anteriores.

El resultado de esta primera actividad de la planificación debe ser una relación exhaustiva de las variables o contenidos que el cuestionario debe incluir. Por supuesto, la exhaustividad y nivel de detalle estarán en función, principalmente, del objetivo de la encuesta, pero también de los aspectos mencionados antes: contexto y recursos disponibles. B) Identificar los indicadores necesarios para cada área de contenido La redacción de las preguntas es una tarea difícil y lenta. Si no disponemos de una relación exhaustiva de los indicadores que debemos elaborar y/o seleccionar, lo más probable es que nos centremos en aquellos contenidos más fáciles de medir y descuidemos los que requieran preguntas más complejas. El castigo es claro: descuidar aspectos clave para alcanzar el objetivo de la encuesta. Los recursos y el esfuerzo invertido pueden caer en saco roto por una mala planificación del cuestionario. Fink (1995a) recomienda conseguir una relación estructurada de las variables que va a

Investigación a través de los cuestionarios

140

medir el cuestionario y de las preguntas y tests necesarias para cada una de ellas. Para ilustrar la tarea podemos recurrir a uno de los objetivos apuntados en ejemplos anteriores: la evaluación de la calidad de la enseñanza universitaria. El cuadro 5.1 muestra la relación de variables e indicadores necesarios para una del sus áreas de contenido: el profesorado. CUADRO 5.1. Ejemplo de diseño de un cuestionario. Área de contenido: profesorado VARIABLES

INDICADORES TIPO

Edad

1 Pregunta abierta

Género

1 Pregunta cerrada

Antigüedad en el puesto

2 Preguntas cerradas

Nivel profesional

1 Pregunta cerrada

Formación para la asignatura

2 (1 abierta y 1 cerrada)

Satisfacción con el trabajo

1 Test tipo Likert

La especificidad con la que se realice esta tarea es una decisión del autor del cuestionario. Por ejemplo, nada impide “desmenuzar” la información anterior incluyendo qué tipo de preguntas se debe emplear en cada caso, e incluso, si es necesaria más de una pregunta para un aspecto, indicando el elemento de información que cada una debe plantear. Este podría ser el caso en el ejemplo anterior para la “antigüedad en el puesto”: una pregunta pediría información sobre la “antigüedad en el grado académico” (licenciado o doctor); y otra sobre la “antigüedad” en la categoría profesional (contratado o funcionario). Un consejo: se debe invertir todo el tiempo necesario hasta tener una planificación precisa del cuestionario. Por otra parte, el rigor en las especificaciones no se debe entender como un “corsé” a la creatividad: la interacción continua a lo largo del proceso de elaboración permite en todo momento rectificar decisiones anteriores. Siempre se está a tiempo de hacer una “modificación de los planos” en la casa. 7. Recomendaciones para hacer las preguntas del cuestionario Las recomendaciones persiguen sobre todo redactar preguntas fiables: dos

Investigación a través de los cuestionarios

141

encuestados en la misma situación deben dar la misma respuesta a la pregunta; y válidas: relacionadas con el objetivo del cuestionario. La mayoría de estas recomendaciones son resultado de la experiencia acumulada y tienen un carácter “colectivo”: suelen aparecer con ligeras variantes en todas las monografías sobre la elaboración del cuestionario (Bosh y Torrente, 1993; Harvatopoulos, Livan y Sarnin, 1992; Fink, 1995a, 1995b; Fowler, 1993; Santesmases, 1997). Estos consejos prácticos no garantizan en términos absolutos la redacción de preguntas adecuadas. Al igual que con los instrumentos musicales, no podemos asegurar que la encuesta “suene perfecta”, pero al menos debemos intentar construir un “buen instrumento”. Por otra parte, el autor de las preguntas no debe estar atenazado por la responsabilidad de atenerse a estos consejos “al pie de la letra”: las preguntas serán después revisadas para detectar posibles errores cometidos en la redacción. Es necesario hacer una distinción antes de presentar las recomendaciones habituales para la redacción de las preguntas. Por razones didácticas vamos a distinguir entre “preguntas factuales” y “preguntas subjetivas”. Las preguntas factuales están diseñadas para medir hechos o sucesos que podrían ser medidos de manera objetiva. Son aquellas preguntas en las que se podría comprobar la precisión de la respuesta por algún tipo de observación independiente. Por ejemplo, la pregunta “¿cuántas veces ha ido al médico la última semana?” es una pregunta factual. Teóricamente, el investigador podría obtener este dato de forma precisa -sin necesidad de preguntarle al encuestado- recurriendo a los registros del centro de salud. Las preguntas subjetivas pretenden medir actitudes, opiniones, sentimientos y creencias de las personas. Es evidente que no hay un medio objetivo de comprobar la precisión de las respuestas de las personas, ya que sólo el encuestado tiene acceso a sus estados subjetivos. La comprobación de las respuestas sólo es posible de forma indirecta por su asociación con otros patrones de respuesta. Hay, sin duda, preguntas que difícilmente podríamos localizar en una de estas dos categorías por estar entre ambas, por ejemplo, “¿a qué partido votaría si se celebraran hoy las elecciones?” No obstante, la distinción es adecuada para valorar el alcance de las recomendaciones a seguir en la redacción de las preguntas. Empezaremos con las recomendaciones dirigidas a la redacción de preguntas

Investigación a través de los cuestionarios

142

factuales, por ser las más utilizadas en los cuestionarios. 7.1.

Recomendaciones para elaborar preguntas factuales

Antes de entrar en las recomendaciones concretas, recordemos el tipo de pregunta que debemos intentar redactar. Las preguntas deben facilitar la consistencia en la medida, es decir, que cada encuestado de la muestra responda al mismo conjunto de preguntas. Debemos procurar que las diferencias entre las respuestas sean atribuibles a diferencias de los encuestados en las variables de interés, y no a fuentes de variación no deseadas (errores de medida). A) Hacer preguntas relevantes La relevancia de las preguntas depende de su relación con los objetivos de la encuesta. No se deben hacer preguntas superfluas. Por ejemplo, en una encuesta sobre el transporte por autobús, los encuestados esperan preguntas sobre la rapidez, comodidad, número de autobuses, etc. Si se hacen preguntas que no parezcan tener relación con los autobuses (edad, hábitos de lectura, etc.), habrá que justificar explícitamente su necesidad, por ejemplo, indicando que esta información es necesaria para saber si la empresa de transportes está cubriendo las necesidades de todos sus clientes. B) Hacer preguntas concretas Las cuestiones deben ser precisas y no ambiguas. Una pregunta precisa es aquella que dos encuestados diferentes entienden de la misma forma. Por ejemplo, supongamos que estamos preguntando sobre el estado de salud. Dos personas con historias de salud diferentes (una habitualmente sana pero con problemas de salud en los últimos días y otra con una enfermedad crónica) pueden responder en términos similares a una pregunta ambigua. Ejemplo: - Mala redacción: ¿cómo describiría su salud? Introduciendo un periodo de tiempo se puede hacer más precisa: - Mejor: ¿cómo describiría su estado de salud en las últimas dos semanas? En definitiva, cuanto más detalles podamos aportar más precisa será la respuesta.

Investigación a través de los cuestionarios

143

C) Emplee periodos de tiempo proporcionales a la importancia de la pregunta Preguntar a las personas sobre hechos poco relevantes en un periodo largo de tiempo suele conducir a respuestas poco fiables porque intentan adivinar. Así, es recomendable utilizar periodos de un año o más para los principales hechos de la vida (comprar una casa, padecimiento de enfermedades serias, nacimiento de un niño, etc.) y periodos de un mes o menos para hechos o acontecimientos menores. Sin embargo, los periodos de tiempo no pueden ser tan cortos como para que los acontecimientos puedan no haber ocurrido. - Mala redacción: ¿cuánto ha tardado en dormirse, en promedio, durante los últimos seis meses? - Mejor: ¿cuánto tiempo ha tardado en dormirse, en promedio, en las últimas dos semanas? D) Utilice un lenguaje convencional La encuesta no es una conversación. Para obtener información precisa es necesario redactar las preguntas con una estructura gramatical, puntuación y vocabulario estándar. La redacción de las preguntas debe perseguir que el mayor número de personas las entienda. Algunos consejos habituales son: Utilizar frases completas: el ejemplo más simple de redacción inadecuada es la utilización de frases incompletas. Ejemplo: -

Mala redacción: ¿edad?

Comentario: la pregunta parece simple pero las personas pueden entenderla de diferentes formas (edad actual, número de años que va cumplir, “metido en 54”, etc.) -

Mejor: ¿Cuántos años cumplió en su último cumpleaños?

Examinemos también este otro: Ejemplo: -

Mala redacción:¿lugar de residencia?

Comentario: significa distintas cosas para diferentes personas. Por ejemplo: región, ciudad, barrio, residencia familiar, etc.

Investigación a través de los cuestionarios

144

Mejor: ¿cuál es el nombre de la ciudad en la que vive actualmente?

Ante preguntas incompletas, el entrevistador probablemente (o el encuestado) tendrá que añadir palabras o expresiones para hacer más inteligible la pregunta o la respuesta, introduciendo fuentes de variabilidad no deseadas. En definitiva, las frases completas expresan mejor una idea o pensamiento completo y claro. Podemos analizar otro caso de redacción incompleta que presenta algunos problemas. Ejemplo: -

De los siguientes aspectos de su ciudad, ¿qué valoración general (muy malo, malo, regular, bueno, muy bueno) le merece en cuanto a la calidad de...? Espacios verdes y jardines, instalaciones deportivas, transporte público, policía y seguridad ciudadana.

Presenta varios problemas: a) El orden del enunciado. Si las alternativas de respuesta son leídas antes de pensar en el contenido específico del ítem, lo más probable es que el encuestado olvide las alternativas y el entrevistador tenga que repetírselas; b) El encuestado no va a seguir un patrón consistente de evaluación. Evitar abreviaturas: deben evitarse al menos que se esté seguro de que todas las personas conocen su significado. Ejemplo: -

Mala redacción: ¿cree que el IPC refleja la carestía de la vida?

Mejor: ¿cree que el índice de precios al consumo refleja la carestía de la vida?

Evitar expresiones coloquiales y tecnicismos: las primeras se deben evitar, ya que cambian rápidamente y no todo el mundo está al tanto de las últimas expresiones. Su utilización está justificada sólo cuando estemos seguros de que todo el grupo de encuestados conoce los términos de las preguntas. Hay, otro problema añadido: la comunicación de los resultados a una audiencia general puede ser más difícil. La misma consideración es aplicable a las expresiones técnicas: sólo deben utilizarse cuando estemos seguros de que todas las personas las conocen. Ejemplo: -

Mala redacción: ¿cuántas veces ala semana va usted ala plaza? Investigación a través de los cuestionarios

145

Mejor: ¿cuántas veces a la semana va usted al mercado?

E) Utilice preguntas que hayan sido utilizadas con éxito en otras encuestas. Las encuestas del INE (instituto Nacional de Estadística) y las EPA (Encuestas de Población Activa) son unas fuentes de preguntas muy utilizadas y reconocidas, por ejemplo, para preguntar por las profesiones. Esto nos asegura mayor fiabilidad y mejor comunicación de los resultados. F) Utilice preguntas breves Las preguntas breves requieren menos tiempo y menos atención lectora, aunque también aportan información menos detallada. Las preguntas largas generalmente dan antecedentes a los encuestados y les ayudan a recordar o pensar en las razones por las que hacen algo o mantienen una opinión. - Breve: ¿cómo influiría en su decisión de recurrir a la cirugía estética el que su pareja haya sido operada? - Larga: habrá oído hablar de que cada vez más personas recurre a la cirugía... Las preguntas largas son útiles para obtener información sobre temas “sensibles” (salud o hábitos personales) o cuestiones objeto de debate social (control de armas). Al utilizar preguntas largas en cuestionarios autoadministrados es necesario contar con el tiempo necesario para leer la pregunta y responder. G) Redactar con cuidado las preguntas comprometidas Preguntas de este tipo son las relativas a temas como ingresos, situación laboral, consumo de sustancias ilícitas, hábitos sexuales, etc. Si es necesario hacer este tipo de preguntas (después de haber reflexionado seriamente sobre su pertinencia), hay diversos procedimientos para “suavizar” la pregunta. Por ejemplo, utilizar intervalos amplios en las respuestas sobre ingresos económicos, introducir mensajes que ayuden a poner en situación al encuestado, aproximarse sucesivamente a la pregunta, etc. Veamos algunos ejemplos. Los autores de encuestas en ocasiones “cargan” una pregunta para obtener información sobre temas embarazosos o polémicos. El objetivo de “cargar” una pregunta es animar al encuestado a que dé una respuesta verdadera en lugar de una “socialmente aceptable”. Por ejemplo: - Mala redacción: ¿se ha llevado alguna vez algo de un supermercado sin pagar?

Investigación a través de los cuestionarios

146

- Mejor: ¡usted no es el único! Todo el mundo ha pensado alguna vez en llevarse algo sin pagar de un supermercado. En la pasada semana: ¿se ha llevado algo sin pagar de un supermercado? Sí

Aproximación sucesiva - Habrá oído comentar que los supermercados pierden anualmente millones de pesetas por pequeños robos o hurtos. Las empresas del sector quieren proponer al gobierno que se endurezcan las penas por este tipo de delitos. Esta propuesta está provocando una fuerte polémica. Algunas personas están a favor y otras en contra. ¿Qué piensa usted sobre el endurecimiento de las penas a las personas que se llevan cosas sin pagar de los supermercados? Totalmente en desacuerdo

Bastante de acuerdo

Ni de acuerdo ni en desacuerdo

Bastante de acuerdo

Totalmente de acuerdo

- Muchas personas se han llevado alguna vez algo sin pagar del supermercado. ¿Conoce a alguna persona de su entorno laboral, vecinos o familia que lo haya hecho? Sí

Trate ahora de recordar. ¿Alguna vez ha pensado usted en llevarse algo sin pagar del supermercado?

Sí

¿Lo ha llegado a hacer?

Sin duda, la aproximación sucesiva es más costosa, pero es el precio a pagar por una mayor sinceridad en las respuestas. Debemos saber que este tipo de preguntas pueden inducir a que el encuestado deje de responder o a que directamente tire el cuestionario a la papelera (sobre todo si están al principio del cuestionario). H) Evitar palabras y frases sesgadas Las frases y palabras sesgadas pueden elicitar respuestas emocionales que no tengan nada que ver con el tema objeto de la encuesta. Palabras como: aborto, pro-vida, “rojo”, etc., pueden generar respuestas emocionales o prejuicios. También hay que advertir que el sesgo en las palabras tiende a cambiar con el tiempo.

Investigación a través de los cuestionarios

147

El sesgo puede evitarse fácilmente con una revisión de las preguntas por expertos o posibles encuestados. I)

Evitar preguntas con más de una idea

Las preguntas con más de una idea en su redacción, por ejemplo “¿el gobierno debe seguir financiando la educación y la sanidad?”, pueden introducir confusión en los encuestados, ya que realmente se trata de dos preguntas. Ejemplo: 4. Mala redacción: ¿cree que la política económica y exterior del gobierno son adecuadas? 5. Mejor: ¿cree que la política económica del gobierno es adecuada? 6. Mejor: ¿cree que la política exterior del gobierno es adecuada? J) Evitar redacciones negativas Suelen ser difíciles para los encuestados, ya que requieren un ejercicio de pensamiento lógico. Imaginemos que estamos pidiendo que la persona nos diga si está de acuerdo o en desacuerdo con el siguiente enunciado: las Naciones Unidas no deberían inhibirse de los asuntos internos de los países. Algunas personas podrían dejar de leer el no y responder en sentido contrario a su opinión; y otras, primero traducirían el enunciado a términos afirmativos y luego responderían. K) Utilizar indicaciones opcionales Hay circunstancias en las que es recomendable aportar una redacción opcional de la pregunta. Siempre debe estar indicado como tal, entre paréntesis, y el entrevistado la utilizará cuando sea necesario. Ejemplo: -

¿Ha sido usted (o alguien que viva con usted) atacado por un extraño en el último año?

¿Informó usted (él o ella) del ataque a la policía?

En general, las indicaciones entre paréntesis permiten al entrevistador hacer preguntas que tengan sentido, teniendo en cuenta la información obtenida con otras preguntas con objeto de adaptarlas a las circunstancias individuales del encuestado. El uso de indicaciones debe hacerse con precaución, ya que la indicación no está

Investigación a través de los cuestionarios

148

prevista para aclarar el significado de preguntas confusas o ambiguas. Ejemplo: -

Mala redacción: ¿qué piensa de su barrio? (Nos interesa su opinión sobre vivienda, zonas verdes, infraestructura, etc.)

7.2.

Preguntas abiertas comparadas con preguntas cerradas

Las preguntas del cuestionario se suelen agrupar en dos categorías principales: preguntas abiertas y preguntas cerradas. Las preguntas cerradas son aquellas en las que las respuestas han sido previstas por el investigador y son ofrecidas al encuestado para que elija la que considere más adecuada. Las preguntas abiertas no ofrecen respuestas al encuestado y es él quien tiene que responder con sus propias palabras. En general, las preguntas cerradas son consideradas más fiables y eficaces que las preguntas abiertas, pero ambas tienen sus ventajas e inconvenientes. A) Preguntas abiertas El encuestado tiene que dar las respuestas con sus propias palabras. Son útiles cuando se pretende obtener respuestas no previstas. Algunos encuestados (los de mayor nivel cultural o con mayor conocimiento del tema) pueden sentirse más cómodos con las preguntas abiertas que con las cerradas. El inconveniente principal es que las respuestas a las preguntas abiertas deben ser categorizadas e interpretadas. Ejemplo: -

¿Cuántas veces ha tenido problemas para dormirse en el último mes?

Respuestas posibles: -

No demasiadas veces.

Sobre el 10% de las noches.

Mucho menos que el mes anterior.

La utilización de preguntas abiertas plantea una pregunta inevitable: ¿hasta qué punto las respuestas anteriores son equivalentes? B) Preguntas cerradas Son más difíciles de escribir que las preguntas abiertas ya que debemos anticipar las Investigación a través de los cuestionarios

149

posibles respuestas. Sin embargo, algunos encuestados prefieren este tipo de preguntas por no estar dispuestos o no ser capaces de expresarse sobre el tema objeto de la encuesta. Además, las preguntas cerradas facilitan la categorización y análisis de las respuestas. ¿Cómo podemos decidirnos por un tipo de pregunta u otro? El cuadro 5.2 puede ayudar en el proceso de decisión: CUADRO 5.2. Comparación de preguntas abiertas y cerradas ABIERTA

CERRADA

Objetivo

Obtener información directa de Obtener datos de juicios u los encuestados con sus propias ordenaciones palabras

Características de los encuestados

Nivel cultural medio-elevado y con conocimiento y opinión sobre el tema

No disponer de las posibles Forma de hacer respuestas. las preguntas Posibles respuestas muy numerosas

Nivel cultura medio-bajo y sin conocimiento y opinión sobre el tema

Respuestas previstas

Análisis de los resultados

Posibilidad de categorizar y analizar respuestas muy heterogéneas

Comunicar los resultados

Descripción individual de los Información estadística de las tipos y categorías de respuestas respuestas

7.3.

Descripción meramente cuantitativa de las respuestas

Preguntas llave o filtro

Las preguntas filtro o llave son aquellas que en función de la respuesta dirigen a unos encuestados, pero no a otros, hacia unas preguntas concretas del cuestionario y no a otras. De una encuesta sobre la adicción a los juegos de azar podemos extraer la siguiente pregunta filtro: 1. ¿Con qué frecuencia juega al bingo? a) Nunca.

Si contesta a) pasar a la pregunta 3.

b) Una vez al mes.

Si contesta b), c) o d) pasar a la pregunta 2.

c) Varias veces al mes.

Investigación a través de los cuestionarios

150

d) Varias veces a la semana. 2. ¿Cuánto dinero se gasta aproximadamente cada vez que juega al bingo? a) Menos de 6 Euros. b) De 6,001 a 18 Euros. c) De 18,001 a 25 Euros. d) Más de 25 Euros. Esta práctica divide la muestra entre los encuestados con unas determinadas características y los que no las tienen. Por ejemplo, los que contestan a la pregunta 2 de la encuesta sobre la adicción al juego y los que no la contestan. Esta disminución en el tamaño de la muestra habrá de ser considerada en el análisis de los resultados. Como regla general se recomienda evitar este tipo de preguntas, especialmente en los cuestionarios auto-administrados, donde no esta el entrevistador para solucionar posibles problemas. Es difícil dejar claro a unos encuestados y a otros lo que tienen que hacer. Si tienen que saltar por secciones enteras del cuestionario, el problema se complica aún más. En caso de tener que utilizarlas se recomienda utilizar flechas indicadoras del “trayecto”, justificar las preguntas a la derecha para que se puedan distinguir, presentar instrucciones precisas sobre cuál es la siguiente pregunta a la que tiene que responder, etc. 8. Medición de estados subjetivos La denominación “estados subjetivos” es estrictamente metodológica. Hace referencia a los sentimientos, actitudes, creencias, etc. de las personas.. Por comodidad y tradición, podemos referimos a este conjunto heterogéneo de variables con el nombre de “actitudes”. Dejando a un lado discusiones no relacionadas con nuestro interés principal -la medición de actitudes- podemos recurrir a la definición de actitud elaborada por Lambert (1989:217): “una actitud es “una respuesta evaluativa, relativamente estable, en relación a un objeto, que tiene componentes o consecuencias cognitivas, afectivas y probablemente comportamentales”. Morales y Moya (1996) inciden en la estructura de las actitudes en tomo a los

Investigación a través de los cuestionarios

151

componentes cognitivo, afectivo y comportamental, que es de gran utilidad durante la elaboración del cuestionario ya que proporciona la base de su diseño. Al ser nuestro interés fundamentalmente metodológico, podemos utilizar el concepto de actitudes para nombrar un conjunto difuso formado por sentimientos, creencias, opiniones, afectos, juicios, etc., dadas las similitudes que comparten las metodologías para medir esos tipos de variables. Los objetivos de la encuesta pueden hacer necesario elaborar un “test” para medir alguna variable de este tipo. Necesidad que se debe reflejar en el diseño del cuestionario. La medición de actitudes presenta algunos problemas peculiares y otros comunes a la medición de variables psicosociales. Conocer estos problemas es básico para afrontar la tarea de medir actitudes: - El concepto de actitud (en general y en particular cuando se refiere a una actitud determinada) es un constructo. Sirve para “ver” orden y consistencia en lo que las personas dicen, piensan y hacen; y así, dados ciertos comportamientos, intentar hacer predicciones de comportamientos futuros. Tal constructo no puede medirse directamente, sino que debemos inferir su presencia a partir de determinadas muestras de conducta. - Los comportamientos, creencias y sentimientos (en definitiva, las tres fuentes fundamentales para inferir las actitudes) no siempre coinciden, incluso aunque supongamos que reflejan una única actitud. El estudio de La Pière (1934) reveló de forma dramática la incongruencia entre declaraciones y comportamientos de prejuicio racial. Esta “incongruencia” puede hacer que si nos centramos en una sola manifestación (comportamiento, creencias o sentimiento), nuestra descripción de la actitud pueda resultar distorsionada. - Las actitudes son variables especialmente inestables, tanto que no tenemos garantías de que la actitud que pretendemos medir permanezca estable el tiempo suficiente para que la medida en una sola ocasión resulte fiable. - La medida de la mayoría de las actitudes suele hacerse sin que exista un acuerdo universal sobre su naturaleza. La importancia de estos problemas depende del objetivo, contexto y nivel de análisis al que se necesite realizar la medición. Por ejemplo, las mediciones de actitudes a nivel grupal requieren menor precisión que las mediciones a nivel individual.

Investigación a través de los cuestionarios

152

Hay numerosos instrumentos disponibles para medir actitudes. Sólo nos vamos a referir a los dos que con más frecuencia se utilizan en la investigación por encuesta. 8.1.

Tests de ordenación

Los tests o escalas de ordenación son un conjunto de frases o enunciados actitudinales que expresan el rango de posibles actitudes sobre un objeto. La utilización de esta estrategia tiene sus primeros antecedentes en los trabajos de Thurstone para medir las actitudes de una persona (Thurstone, 1928). No obstante, la utilización más común de este procedimiento en el contexto de la investigación mediante encuesta persigue meramente la descripción de las opiniones o juicios de una población. Por ejemplo, un test de ordenación para medir la actitud hacia la escuela de niños en edad escolar podría estar formado por las frases siguientes: - La escuela enseña cosas que ayudan a conseguir trabajo. - En general, los profesores se preocupan de sus estudiantes. - La escuela es interesante. - La escuela es aburrida. - Hay demasiadas reglas en la escuela. La tarea de la persona es leer cada frase y ordenarlas en función de su opinión o valoración. La redacción de las frases debe procurar que sea posible “localizarlas” en diferentes puntos de una sola dimensión por su valoración del objeto actitudinal. Dos criterios ayudan en este objetivo: 1. el contenido de todas las frases se debe referir al mismo objeto; y 2. deben expresar distinto grado de actitud hacia el objeto. Aunque hay procedimientos analíticos sofisticados para analizar este tipo de respuestas (Crocker y Algina, 1986), lo más común es que el investigador se limite a un análisis descriptivo de la ordenación más frecuente o común en la población o de la posición de cada elemento en diferentes grupos demográficos. 8.2.

Tests tipo Likert

Propuesto por Likert en los años treinta es, sin duda, el modelo de medición de actitudes, más popular e intuitivo. Es más, hoy día cualquier escala en la que la puntuación de una persona se obtenga por la suma de sus respuestas graduadas a los ítems que la forman, recibe el nombre de escala “sumativa” o escala tipo Likert

Investigación a través de los cuestionarios

153

(Spector, 1992). El modelo puede describirse brevemente de la forma siguiente: 1. Se presenta a un grupo de personas un conjunto de ítems formado por aproximadamente el mismo número de ítems favorables y desfavorables al objeto actitudinal. 2. A continuación, se pide a las personas que respondan a cada una de las frases en función de su grado de acuerdo o desacuerdo con ellas. 3. El último paso es combinar las respuestas de las personas de manera que aquellos que tienen una actitud más favorable obtengan las puntuaciones más altas y los que tienen una actitud más desfavorable las puntuaciones más bajas. El modelo de escalamiento implica un único tipo de estímulos y un único tipo de respuestas. El modelo asume unos supuestos sobre la naturaleza de los items y de la escala final que pueden resumirse en: 1. Las variaciones sistemáticas en las respuestas de las personas a los items se deben únicamente a las diferencias entre las personas. Es decir, los items no aportan nada a la variabilidad sistemática de las respuestas, cada item es considerado una replicación de los otros. 2. Los ítems están relacionados monotómicamente con la variable actitudinal que se supone que miden. Cuanto más favorable (o desfavorable) sea la actitud de la persona, mayor (o más baja) será su puntuación en el item. 3. Los ítems miden una única variable, es decir, forman una escala unidimensional. En la mayoría de las aplicaciones del modelo los supuestos no son sometidos a examen. El proceso para elaborar una escala de este tipo sigue una serie de pasos bien establecidos (Morales, 1988). Sólo vamos a incidir en las recomendaciones para la redacción de las preguntas, por su interés para los objetivos del capítulo. Podemos enumerar cinco reglas que ayudarán a escribir buenos items: 1. Cada ítem debe expresar una y solamente una idea. Si el item expresa más de una idea lo más probable es que consigamos confundir a las personas. Será muy fácil que la persona no sepa a cuál de las dos ideas expresadas en el enunciado no, referimos.

Investigación a través de los cuestionarios

154

2. Utilizar ítems redactados deforma favorable y desfavorable. Es una recomendación generalizada. El escritor de items debe redactar enunciados que representen posiciones favorables y otros desfavorables al constructo. El objetivo de esta recomendación es evitar las denominadas tendencias de respuesta (aquiescencia, deseabilidad social, etc.). Por ejemplo, en el caso de la aquiescencia si todos los items están redactados de forma positiva, una persona que muestra un sesgo en su respuesta -aquiescencia- obtendrá puntuaciones muy altas -o muy bajas- inflando el cálculo de los estadísticos del item y del test. Cuando hay items redactados de forma favorable y desfavorable, estas personas tienden a situarse en los valores centrales produciendo un efecto mucho menor. El precio a pagar por intentar evitar el sesgo en la respuesta es confundir a las personas (al tener que cambiar su forma de responder), sobre todo en tests largos. a) Ejemplo de ítem favorable: Los inmigrantes deberían tener derecho a la seguridad social Muy en desacuerdo

En desacuerdo

Ni en desacuerdo ni de acuerdo

De acuerdo

Muy de acuerdo

b) Ejemplo de ítem desfavorable: La presencia de inmigrantes hace que aumente el paro entre los españoles Muy en desacuerdo

En desacuerdo

Ni en desacuerdo ni de acuerdo

De acuerdo

Muy de acuerdo

3. Evitar coloquialismos, expresiones y jergas. Debe utilizarse un lenguaje estándar y no sujeto a modas temporales que hagan que con el paso del tiempo los ítems pierdan sentido. 4. Adecuar la estructura gramatical a las características de las personas que responderán al test. Es necesario buscar un equilibrio entre una redacción del item que garantice la medida del constructo (por ejemplo utilizando frases subordinadas) y el nivel lector de las personas. Es obvio que si las personas dudan sobre el significado del item no estaremos midiendo de forma adecuada el constructo. 5. Evitar redacciones negativas. Es una recomendación muy particular. Pero la evidencia acumulada constata que es más difícil para las personas entender las frases negativas que las que expresan la misma idea pero de forma positiva. No se deben confundir ítems que representen posiciones desfavorables con ítems Investigación a través de los cuestionarios

155

redactados de forma negativa. Ejemplo: a) Mala redacción: cuando entro en un autobús no me agrada sentarme al lado de inmigrantes. Muy en desacuerdo

En desacuerdo

Ni en desacuerdo ni de acuerdo

De acuerdo

Muy de acuerdo

b) Mejor: cuando entro en un autobús me molesta sentarme al lado de inmigrantes Muy en desacuerdo

En desacuerdo

Ni en desacuerdo ni de acuerdo

De acuerdo

Muy de acuerdo

9. Revisión de las preguntas El análisis de la calidad del cuestionario se puede hacer por procedimientos empíricos y por procedimientos subjetivos. La literatura sobre elaboración de cuestionarios no trata con detalle ninguna de las dos aproximaciones. Nuestro objetivo es dar algunas pautas que ayuden en el proceso de revisión. Los contenidos de este apartado están dirigidos a la revisión de las preguntas factuales. Las preguntas o tests diseñados para medir estados subjetivos se pueden revisar mediante procedimientos más formales que están ampliamente descritos en la literatura especializada (Crocker y Algina, 1986). La finalidad general de la revisión es identificar defectos en la redacción de las preguntas que puedan disminuir su fiabilidad y validez. 9.1.

Procedimientos subjetivos

El autor del cuestionario puede recurrir a personas familiarizadas con las técnicas de investigación por encuesta o con el tema objeto de la investigación para revisar las preguntas. Para sacar más partido a la tarea es conveniente “guiar” la revisión de las preguntas hacia aspectos concretos. Los trabajos sobre el tema suelen agrupar las cuestiones a revisar en los apartados siguientes: - Contenido: ¿Es necesaria esta pregunta? ¿Son necesarias más preguntas sobre esta cuestión? ¿Es necesario concretar más la pregunta?

Investigación a través de los cuestionarios

156

- Redacción: ¿Se podría expresar de un modo más claro? ¿Cómo? ¿Puede tener varias interpretaciones? ¿Presenta algún sesgo o prejuicio? ¿Las alternativas son exhaustivas? ¿Se solapan las alternativas de respuesta? -

Ubicación: ¿Está situada en el lugar adecuado? ¿Pueden influir las preguntas precedentes?

También se puede recurrir a un grupo de encuestados potenciales para plantearles cuestiones sobre la claridad de las preguntas. Por supuesto, el responsable de la revisión puede plantearla en términos más formales requiriendo a los expertos, por ejemplo, que examinen la adecuación entre la pregunta y el contenido o variable que pretende medir, que propongan alternativas a los elementos defectuosos, que califiquen la pertinencia de cada pregunta... 9.2.

Procedimientos empíricos

La información procede de una administración del cuestionario a un grupo de personas. La calidad de las preguntas es juzgada a partir de algunas propiedades estadísticas de las respuestas obtenidas. No es necesario recurrir a un procedimiento formal de muestreo para determinar el número y seleccionar a las personas; basta con que sean suficientes para asegurar la estabilidad de los estadísticos y de características semejantes a las de la población de personas que responderán a la encuesta. Las dos propiedades estadísticas base del análisis son: a) Proporción de elección de la alternativa “No sabe / no contesta”. Las preguntas cerradas suelen incluir como alternativa una opción para las personas que no conocen las respuestas, no encuentran una alternativa adecuada entre las que se les ofrecen o, simplemente, no quieren contestar. Parece evidente que una proporción elevada de respuestas en esta opción está relevando algún problema en la redacción de la pregunta: ambigüedad, falta de exhaustividad en las alternativas de respuesta, etc. El procedimiento para obtener la proporción de elección de esta alternativa “saco” es

Investigación a través de los cuestionarios

157

bastante sencillo: Proporción de elección NS/NC =

Frecuencia de elección NS/NC Total de respuestas

Si el valor obtenido excede las expectativas del autor del cuestionario debe revisar las preguntas para intentar determinar el origen de este problema. b) Proporción de elección de las alternativas. No es fácil predecir a priori el patrón de elección "adecuado" de las alternativas de respuesta en las preguntas cerradas. Depende, por supuesto, de la distribución de la variable en la población. No obstante, el investigador puede sospechar que hay algún problema en aquellas preguntas con alternativas poco elegidas o con una alternativa mayoritariamente elegida. La obtención de los datos es sencilla: Proporción de elección Alternativas =

Frecuencia de elección Total de respuestas

Los resultados estadísticos no deben ser interpretados como “pruebas de valor”: una proporción inesperada en la elección de una alternativa no indica necesariamente que la pregunta sea defectuosa. El resultado se debe utilizar como una señal de alarma que lleve a una nueva revisión de las preguntas. 10. Preguntas demográficas Las preguntas demográficas tienen como objetivo general “conocer” a los encuestados. Están diseñadas para obtener información sobre variables como edad, género, lugar de residencia, estado civil, situación laboral, ingresos medios, antecedentes étnicos, etc. Por su contenido común se suelen agrupar bajo la denominación “variables demográficas”. Se deben redactar con precaución y justificar su necesidad al encuestado, pensemos que podemos dar sensación de falta de anonimato en las respuestas. Por la misma razón, suelen ubicarse al final de la encuesta, cuando el encuestado ha comprendido ya su objetivo y está comprometido con la participación en la encuesta. Las variables demográficas son utilizadas especialmente para obtener grupos de comparación con los que interpretar las respuestas a las preguntas: diferencias por género, edad, nivel económico, etc.

Investigación a través de los cuestionarios

158

11. Orden y disposición de las preguntas en el cuestionario La disposición de las preguntas persigue dar la sensación de facilidad y poco consumo de tiempo para responder a la encuesta. La primera pregunta debe ser fácil y general para implicar al encuestado en la respuesta al cuestionario y en el objetivo de la investigación. Deben evitarse las preguntas abiertas o con muchas alternativas de respuesta. Debe ser una pregunta aplicable a todo el mundo, lo que facilitará crear la impresión de que la encuesta le concierne y que está preparado para responder. La ubicación del resto de las preguntas en el cuestionario responde algunos criterios básicos: - Los aspectos previsiblemente más importantes para el encuestado deben ir al principio. - Las preguntas de contenido similar deben estar agrupadas. - Hay que evitar que el encuestado tenga que realizar saltos de página o seguir indicaciones complejas. - Dentro de cada área temática las preguntas deben ir de las menos a las más comprometidas - Las preguntas relativas a variables demográficas deben ir al final.

Investigación a través de los cuestionarios

159

VI. LA CALIDAD DE LA ENCUESTA6 Andrés González Gómez José Luis Padilla García Cristino Pérez Meléndez

Introducción La calidad de la encuesta puede entenderse de dos maneras íntimamente relacionadas y unidas a lo largo de todo el proceso de la investigación, bien como todos aquellos cuidados que han de tenerse en cuenta durante el planteamiento y desarrollo de la investigación o bien referidos a los indicadores que mostrarían la calidad de los resultados una vez finalizada la encuesta. En la actualidad la mayoría de los autores aglutinan ambas perspectivas. Fowler (1988) diferencia tres aspectos en el desarrollo de la investigación mediante encuesta a la hora de abordar la calidad de la misma: el muestreo, el diseño de instrumentos de medida y la recogida de datos. Gómez (1990) distingue dos grandes grupos de errores: los debidos al muestreo y los ajenos al mismo; diferencia a su vez para ambos los errores aleatorios de los sistemáticos. Martínez Arias (1995) encuadra muy acertadamente la calidad de la encuesta bajo el rótulo general de la validez de las investigaciones en términos de lo que Cook y Campbell (1979) establecen como amenazas a la validez interna y externa de cualquier investigación. En este sentido, la autora diferencia tres grandes bloques, tomados de Groves (1989), bajo los cuales analiza la calidad de la encuesta: a) errores de no observación, b) errores de medida y c) errores de procesamiento; introduciendo los apartados más característicos de cada uno de ellos tales como errores de no respuesta, errores de muestreo, del entrevistador, el cuestionario, etc. Groves (1989), apoyándose en la perspectiva de Kish (1965), se aproxima al error total

Rojas Tejada, A. et al. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Madrid. Síntesis. 6

Investigación a través de los cuestionarios

160

contenido en los resultados de una encuesta, como la suma de todos los errores variables y todos los sesgados. A su vez, cada uno de ellos queda diferenciado por los errores de no observación y los errores de observación. Con los errores de no observación se hace referencia a la parte de la población que no ha sido medida. Vamos a distinguir tres tipos de errores de no observación. En primer lugar, el error muestral, que es el que más claramente limita a los sujetos de una población que serán medidos. En segundo lugar, el error de cobertura, ya no tan evidente, es el que se provoca por el hecho de que algunos sujetos no formen parte de la lista de los que son previamente identificados como pertenecientes a la población. Y, por último, el error de la no respuesta, provocado por aquellos sujetos que no han podido ser localizados por el encuestador o aquellos localizados que rehusan ser entrevistados. Con los errores de observación se hace referencia a las desviaciones que presentan las respuestas de los sujetos del verdadero valor en la variable que se pretende medir; por situaciones tales como la falta de capacidad del sujeto, la deseabilidad social de la respuesta, etc., distorsionan la respuesta de tal forma que provocan que no se ajuste fielmente a lo que se le pregunta. Igualmente, la desviación podría haber sido producida por la actitud de los encuestadores con los encuestados, por la estructura y características del instrumento, así como por la manera de recoger los datos (correo, cara a cara, teléfono, etc.). Como puede comprobar el lector a través de estas limitadas pero significativas referencias, se está produciendo un cambio importante de perspectiva en relación con la calidad de la encuesta. Tradicionalmente la calidad se conectaba con los errores de muestreo propiamente dichos, pero en la actualidad es cada vez más aceptado que los errores ajenos al muestreo son tan decisivos como aquellos a la hora de valorar la calidad de los resultados obtenidos con este enfoque. De ahí que no sólo se preste atención al diseño de la muestra y a su error correspondiente, sino que se dedica mucho esfuerzo al procedimiento de recogida de datos, a quienes responden, no responden o no pueden responder, a la supervisión, a los encuestadores, al cuestionario, etc., todos ellos bajo el rótulo de errores ajenos al diseño de la muestra. Este capítulo se tratará desde la perspectiva de la previsión de los errores en la investigación mediante encuestas, más que desde la preocupación por medirlos o estimarlos. Se contará con lo ya expuesto en capítulos anteriores que introducen

Investigación a través de los cuestionarios

161

elementos específicos de control. Por ello, la fiabilidad y validez del instrumento, así como el error de muestreo propiamente dicho, entre otros aspectos, no serán tratadas específicamente, en cambio nos detendremos en cuestiones tales como errores debidos al encuestador, codificación y escritura de datos, imputación de datos perdidos, etc., que no han sido tratados en ninguno de los capítulos anteriores. Para seguir la línea expositiva del texto, se han englobado las posibles fuentes de error en: errores asociados al muestreo, errores asociados con el cuestionario, errores asociados con la entrevista y errores asociados con el tratamiento de datos. 1. Errores asociados al muestreo Los errores derivados de la obtención de muestras han sido clasificados de formas muy variadas y, lo que es peor, se utilizan los mismos términos para conceptos diferentes. En multitud de ocasiones no es posible o recomendable trabajar con la población y se recurre al estudio de una muestra, supuestamente representativa de aquélla. Los procedimientos que se siguen para la obtención de muestras pueden ser muy rigurosos, meticulosos, estrictos, etc.; pueden respetar hasta el límite de lo respetable los algoritmos de selección de unidades, los principios rectores para el muestreo, las probabilidades asociadas, etc.; pueden ser catalogados como perfectos por un observador externo al estudio, pero hay algo innegable e inevitable: se ha trabajado con una muestra y no con la población. No existe una seguridad absoluta de lo que se habría obtenido de haber realizado las mediciones en la población en lugar de en una porción de ésta (especial, pero porción). Así que el fantasma del error está presente desde el momento mismo en el que se decide obtener una muestra. Este error de muestreo propiamente dicho fue tratado con suficiente amplitud con anterioridad, por lo no nos detendremos en él a lo largo de esta exposición. 1.1.

La no respuesta

La no respuesta es una importante fuente de error en la investigación mediante encuesta. Ésta da lugar a importantes sesgos en la estimación de los resultados, atentando contra la exactitud de la misma. En la actualidad se dedica una atención considerable a esta problemática y a pesar de ello no se conoce con detalle la naturaleza de la no respuesta y, por tanto, el efecto de la misma en los datos resultantes. La no respuesta es la causa principal por la que en ocasiones, cada vez más numerosas, no se ajustan los resultados pronosticados a los obtenidos en la

Investigación a través de los cuestionarios

162

realidad. El término no respuesta es una especie de cajón de sastre en el que caben realidades claramente diferenciadas, aunque todas ellas tengan en común que no se dispone de un dato determinado, debido, eso sí, a razones distintas. Se habla de tasa de no contacto (sujetos de la muestra de los que no se tiene constancia de que fueran abordados en el estudio), tasa de cobertura, tasa de no respuesta de una unidad muestral (persona, casa, institución, etc.), tasa de respuesta en el cuestionario (dejar una o varias preguntas sin respuesta). Como puede observarse, se trata de distintos niveles y unos implican a otros. Así, de una persona (o unidad de muestreo) que no responde, no se dispone de ninguna información, cosa diferente a que una persona o unidad de muestreo deje sin responder una o varias preguntas del cuestionario. Las tasas de respuesta/no respuesta pueden referirse a toda la muestra, a un conglomerado, a un encuestador, a un grupo con ciertas características, etc. El lector interesado en este tema puede comenzar consultando el texto de Platek (1986), en donde se definen formalmente los diferentes tipos de tasas de respuesta/no respuesta y su conexión matemática con las estimaciones de los parámetros poblacionales. La idea general que subyace bajo esta problemática se entronca con la preocupación de la fidelidad con la que la muestra resultante representa a la población. En esto, no sólo influyen precisos y meticulosos diseños y procedimientos muestrales, sino otras circunstancias, si cabe más importantes y con menor posibilidad de someter a control: los datos finales de una encuesta dependen de la actitud de personas concretas, de forma tal que no se puede asegurar nada en el diseño muestral de la manera en que deben y tienen que contestar. En toda encuesta hay personas que colaboran y otras no tanto (se dejan preguntas sin contestar, rehúsan ser entrevistados, enmascaran consciente o inconscientemente sus respuestas, etc.); esta realidad atenta claramente contra estimaciones realizadas desde los datos finalmente obtenidos. A continuación se enumeran distintas situaciones de no respuesta: 1. Personas que no son accesibles por el procedimiento adoptado en la recogida de datos y ni siquiera se tiene la posibilidad de contar con sus respuestas. Estas personas dan lugar al llamado error de no cobertura. Una fuente general de error de no cobertura radica en la utilización de marcos incompletos o erróneos. Es el caso de contar con censos anticuados o listas de correo o números de teléfono

Investigación a través de los cuestionarios

163

incompletas. Las personas que no figuren en el marco jamás podrán ser seleccionadas. Incluso cuando: el muestreo se realiza sin la utilización de marcos, el error de cobertura puede estar claramente presente. Esto puede ocurrir especialmente en las encuestas telefónicas. Aunque utilicemos algún sistema de marcación automática, resulta evidente que las personas que no dispongan de teléfono nunca podrán ser seleccionadas lo que origina un claro error de cobertura. 2. Personas que rehúsan responder a todas o a parte de las preguntas que se les plantean. Aquéllas que, por alguna razón física o mental, no pueden responder a las tareas que se les indica, bien directamente o bien a través de cuestionarios que deben rellenar solos. Es el caso de personas que no saben leer, están en el hospital, han dejado de vivir en esa casa, etc. Todas estas situaciones añaden al error de muestreo propiamente dicho otra fuente de error que puede introducir, como ya se ha indicado, sesgo en los datos globales, de tal manera que provocan diferencias sistemáticas en relación con la población de interés. Debido a esto, durante los últimos años se está prestando una atención especial, independientemente de los errores de muestreo propiamente dicho, al desarrollo de procedimientos que intenten atenuar esta fuente de error, con una doble finalidad: a) Conseguir tasas de respuesta lo más elevadas posible. b) Desarrollar métodos para adjudicar valores a las posibles no respuestas. La tasa de respuesta es también usada como un indicador para evaluar los resultados obtenidos tras la definitiva recogida de datos. Este indicador viene dado por la proporción de sujetos que respondieron en relación con aquellos que fueron seleccionados. Ahora bien, a veces un tipo de diseño muestral conlleva que sujetos con los que se cuenta no puedan ni siquiera ser seleccionados y no se cuenta con ellos para el cálculo de dicha tasa de respuesta; esto obliga, para un ajustado uso de la tasa de respuesta, a contar para su cálculo con supuestos adicionales relacionados con el número estimado de sujetos con los no se puede contactar. Una vez que se dispone de la tasa de respuesta, se puede contrastar con el porcentaje de la población que representa la muestra. Se considerará como valor despreciable una tasa de respuesta menor que el porcentaje que representa la muestra en la población. Investigación a través de los cuestionarios

164

Otra utilidad de la tasa de respuesta es la de comprobar si la no respuesta obtenida es aleatoria, es decir, si los sujetos que no responden se concentran o no en un grupo de la población con unas características determinadas (rurales, hombres, nivel socio-económico, etc.). En estos casos, al tratarse de una no respuesta sistemática, aunque la tasa de no respuesta fuera baja, la no contestación de estos sujetos colaboraría en aumentar el error de estimación de los valores poblacionales de interés; la valoración de estos indicadores es diferente en función del tipo y procedimiento de recogida de datos (una tasa de no respuesta del 20% no indica lo mismo en una encuesta por correo que en otra realizada por teléfono). Su significación y naturaleza es también claramente diferente: en una encuesta por correo es razonable inferir que los sujetos que antes responden son los que están más interesados en el tema encuestado y, en consecuencia, tasas de no respuesta bajas en relación con lo habitual nos indican que la muestra seleccionada bien pudiera estar sesgada en relación con los sujetos encuestados y llevar al investigador a conclusiones erróneas. Igualmente, se ha comprobado que en las encuestas por correo hay una mayor colaboración cuando se utilizan grupos de personas de nivel cultural alto frente a personas de nivel cultural bajo. Por todo ello, estos aspectos hay que tenerlos en cuenta a la hora establecer las conclusiones finales en relación con poblaciones de interés heterogéneas. En cambio, la disponibilidad de unas personas en una encuesta telefónica realizada en horario laboral estará sesgada en relación con amas de casa, parados, jubilados, y personas en general no pertenecientes al mundo del trabajo. Es interesante tener en cuenta razonamientos similares para aquellos procedimientos de recogida de datos que se realizan a través de entrevistas cara a cara. Por último, cabe recordar una vez más que existe sesgo asociado con personas de la muestra que no son accesibles, tales como enfermos, personas sin teléfono, viajantes, presos, extranjeros, etc., aunque ellos representen una pequeña proporción de la población. Los párrafos anteriores nos llevan a la conclusión de que una reducción de la tasa de no respuesta favorecerá la fiabilidad y la calidad de las estimaciones. En líneas generales, una encuesta con una mayor tasa de respuesta permitirá mejores estimaciones y serán menos sesgadas que otra con una tasa de respuesta menor. De manera que, para mejorar la calidad de la encuesta, el investigador debe poner en marcha todos los medios a su alcance para reducir la tasa de no respuesta. He aquí algunas iniciativas:

Investigación a través de los cuestionarios

165

1. En las encuestas por teléfono es aconsejable, frente a teléfonos que no responden, realizar entre 6 a 10 llamadas repartidas entre las tardes y los fines de semana. 2. Seleccionar encuestadores con una gran flexibilidad para trabajar a cualquier hora y día. Esto permite poder adaptarse a las exigencias de cualquier persona que no está dispuesta a contestar en un momento dado pero que accede a concertar una cita para cuando él lo indique. 3. Enviar, siempre que sea posible, información previa a los sujetos que posteriormente serán encuestados, esto facilita la labor de los encuestadores y da mayor seguridad al encuestado frente a la situación anunciada. 4. Resaltar, antes de iniciar la entrevista, la importancia y utilidad del trabajo, tratando a su vez que el entrevistado sienta que su colaboración es fundamental. Es igualmente importante hacerles notar que su no colaboración atenta contra la exactitud y fiabilidad del estudio. Groves (1989) concluye de los análisis realizados con los sujetos que no responden en un primer contacto, que después de las explicaciones indicadas, un porcentaje significativamente alto cambian de opinión y se prestan a colaborar. Este resultado debe motivar a los entrevistadores para que pongan el máximo empeño en el primer contacto para, al menos, informar exhaustivamente del objetivo de la encuesta, su importancia, la confidencialidad de las respuestas, proponer otro momento para realizar la entrevista, etc. En muchas ocasiones, después de una conversación relajada y aparentemente desinteresada, el sujeto que en un principio rechazó contestar el cuestionario accede a su realización. 5. Hacer comprender a los entrevistadores la importancia de contar con una tasa de respuesta elevada para la relevancia de los resultados obtenidos, el esfuerzo y el gasto que conlleva todo el trabajo y que lo más importante del mismo recae en ellos. 6. Identificar a los entrevistadores que obtienen tasas de respuestas bajas y adoptar alguna estrategia que subsane la situación detectada: entrenarlos nuevamente o apartarlos momentáneamente de su cometido. 7. En las encuestas por correo, hay que cuidar elementos tales como la claridad del texto, el uso de colores en la elaboración del cuestionario con cabeceras adecuadas y atractivas, el envío de regalos antes o después de la colaboración del

Investigación a través de los cuestionarios

166

sujeto, cuestionarios fáciles de leer y de rellenar y cualquier otro detalle que al sujeto le sugiera que el cuestionario es serio, atractivo y lo más personalizado posible. Todo ello rebaja la tasa de no respuesta 8. Incluir todos los detalles necesarios que comuniquen al entrevistado que sus respuestas se mantendrán en el más absoluto anonimato. A pesar de seguir al pie de la letra las recomendaciones indicadas en los puntos anteriores, de una manera u otra tendremos inevitablemente una tasa de no respuesta más o menos alta. ¿Qué hacer al objeto de reducir lo más posible el error de medida que esta situación produce en los resultados de la encuesta? Fowler (1993) aconseja tres aproximaciones para la reducción de dicho error: 1. Sustituir al sujeto que no desea responder por otro de parecidas características. En los casos que las unidades de muestreo son las casas, tratar que alguno de los que viven en ella acceda a ser entrevistado. 2. Utilizar un ajuste estadístico de los datos. Se trata de imputar respuestas a los sujetos que no responden a la totalidad de las preguntas o a una parte de ellas. La estrategia de cálculo que esta aproximación sigue es la siguiente: si disponemos sólo de un tanto por ciento de respuestas en un grupo específico del que sabemos su tanto por ciento de presencia en la población objetivo, hay que ponderar las respuestas obtenidas de estos sujetos -bajo el supuesto de que las respuestas de los que no respondieron hubieran sido semejantes a las disponibles- para hacer que su influencia en la estimación se acerque a lo real. 3. Determinar una muestra de entre los que no respondieron y tratar de conseguir su colaboración, con métodos más intensivos y directos. Estas nuevas respuestas pueden ser usadas por los investigadores de dos formas: - Para estimar la cantidad, dirección y naturaleza del sesgo de la muestra inicial. - Si en las respuestas de estos sujetos se obtienen respuestas semejantes a las dadas por los sujetos que respondieron de la muestra inicial, se pueden ponderar los datos obtenidos de manera que puedan ser añadidos al conjunto de datos iniciales. Imaginemos que en una fase inicial de recogida de datos hubo 40 sujetos que no respondieron de un total de 120, que constituían la muestra inicial. Al diseñar una muestra de los 40 no respondientes se consigue que 20 contesten. Al incluir estos datos en el grupo inicial como si Investigación a través de los cuestionarios

167

de los 40 se tratara habrá que ajustar sus respuestas a partir de la siguiente ponderación: [(Respuestas de los 80 iniciales) + 2 x (Respuestas de los 20)]/120. 2. Errores asociados con el cuestionario Un elemento esencial incluido en el apartado de errores no muestrales que se considera como una fuente de error que amenaza la validez de los estudios mediante encuesta es el cuestionario. Aunque en el capítulo dedicado a ese tema se trata la fiabilidad y la validez, parece interesante incluir en el presente capítulo una serie de recomendaciones específicas en relación con distintos aspectos del cuestionario, que tienen como objetivo prevenir posibles errores conceptualizados como errores de no muestreo. Dichas recomendaciones, ampliación de las ya indicadas en el capítulo correspondiente al cuestionario, son fáciles de seguir y, en muchas ocasiones, de sentido común. De ellas vamos a informar a continuación: 1. Una manera sencilla de evitar errores, tanto en cuestionarios autoadministrados como a través de entrevistador, es situar las posibles categorías de respuestas verticalmente y cada una de ellas unida con puntos espaciados hasta el que ha de marcarse como respuesta. Es muy común, fundamentalmente con la idea de reducir espacio de] cuestionario, colocar la posible respuesta horizontalmente. Esta costumbre eleva la probabilidad de error ya que a veces la contestación se realiza marcando bien a la derecha o bien a la izquierda de la respuesta. Ejemplo inadecuado: ¿Con qué frecuencia lee usted La Voz de Almería? - nunca o casi nunca - alguna vez al mes - alguna vez a la semana - todos los días Ejemplo adecuado: ¿Con qué frecuencia lee usted La Voz de Almería? nunca o casi nunca ...................... (1) alguna vez al mes . ...................... (2) alguna vez a la semana ............... (3) todos los días ........ ...................... (4) 2. Las categorías de respuesta a las preguntas deberán ser todo lo exhaustivas que sea posible y, además, mutuamente excluyentes, así como contar con la inclusión de una categoría de respuesta del tipo otros/as.

Investigación a través de los cuestionarios

168

La inclusión de esta categoría de respuesta es fundamental al tomar las medidas de pretest del cuestionario. El análisis de las respuestas dadas a la categoría “otros/otras” nos permitirá detectar categorías de respuesta no anticipadas e incluirlas en el cuestionario definitivo. Pasar por alto esta estrategia provocana que en la recogida de datos definitiva la categoría otros/as se llenará de respuestas que necesariamente deberemos codificar, con el consiguiente riesgo de error. 3. Otra de las categorías de respuesta que merece una atención especial es la relativa a la categoría “no sabe/no contesta”. La manera de decidir sobre este tipo de respuesta está en función de aspectos tales como el objetivo de la encuesta, el tipo de información solicitada en la pregunta, etc. En cualquier caso, es de sumo interés establecer un método para resaltar en el fichero de datos las contestaciones a las preguntas que se dejaron de responder y distinguirlas de aquellas en las que se eligió la alternativa no sabe/no contesta. Es muy distinto que la respuesta de un sujeto sea la de no sabe/no contesta de aquella otra situación en la que el sujeto deja de contestar la pregunta (porque no se le formula, el sujeto la omite, etc.); esto deberá estar claramente diferenciado en el fichero de datos. 4. Seleccionar el tipo de pregunta (abierta o cerrada) que se pide a los sujetos, además de para conseguir el objetivo propuesto, en función de las necesidades del análisis de los datos. En este sentido siempre es preferible una pregunta abierta que preserve un nivel de escala de intervalos a otra cerrada que lo limite a una escala ordinal o nominal. Ejemplo: ¿Qué edad tiene usted? Entre 0 y 25 años…………1 Entre 26 y 45 años………..2 Más de 46 años .. ………..3 Este es un claro ejemplo de pregunta que hubiese sido preferible hacerla abierta, a fin de no perder nivel de medida y de esa manera poder hacer uso de análisis estadísticos acordes con dicho nivel. En muchas ocasiones, y a veces por el simple hecho de mantener en el cuestionario una uniformidad en el tipo de preguntas, se utilizan preguntas cerradas para recoger datos de carácter continuo. Para estos casos se hace uso de muchas

Investigación a través de los cuestionarios

169

categorías de respuestas, creyendo, con esta actitud, que es una manera de ayudar a los sujetos que tienen un vago recuerdo de lo que se les pregunta, a pesar de que así los valores sólo preservan el orden. Con ello se acepta de antemano una perdida de información útil y válida. Además de lo indicado, una ventaja de las preguntas abiertas es que ahorrará espacio y tiempo en el uso del cuestionario y son una excelente alternativa para cuando no se conoce de manera exhaustiva el rango y variedad de las categorías de respuesta. 5. Los códigos usados para categorías de respuesta repetidas en las distintas preguntas del cuestionario, tales como no sabe/no contesta, sí, no, muchas, a veces, etc., deberán codificarse siempre igual. En éste sentido, se han establecido normas en relación con los códigos que se asignan a las categorías de respuesta que más habitualmente se incluyen en los cuestionarios. Así, se usan los números 7, 8 y 9 respectivamente para las categorías de no sabe/no contesta, para cuando no se realiza la pregunta al sujeto y para cuando se pierde el dato por alguna razón (cuadro 1). CUADRO 1. Códigos para categorías de respuestas. No sabe/no No se hizo la Dato perdido contesta pregunta códigos con sólo un digito 7 8 9 códigos con más de uno 97 98 99 códigos con más de dos 997 998 999

Estas indicaciones evitan posibles errores, a la vez que facilitan los análisis de la calidad de los datos una vez procesados. 6. También es de interés resaltar, en aras a la calidad de los resultados, que los distintos números que se usen para codificar las restantes categorías de respuesta no deben de determinarse de cualquier manera, sino más bien tratando de que el número que se use represente lo mejor posible, en términos relativos, el sentido de la categoría de respuesta. Así, los códigos deben relacionarse con los cuantificadores de respuesta tales como ninguno, alguno, bastante, mucho, etc., de manera que los códigos vayan igualmente incrementándose. La idea general que se persigue con todo esto, es, por un lado, facilitar cualquier tipo de transformación que se desee realizar y, por otro, el preservar al máximo el nivel de escala de los datos recogidos.

Investigación a través de los cuestionarios

170

El lector interesado en cuestiones particulares relativas a las opciones de respuesta puede consular el trabajo de Bourgue y Clark (1994). 2.1.

Necesidad de hacer estudios piloto

Uno de los aspectos que mejor nos sirve para evaluar la calidad de los datos recogidos en una encuesta, independientemente del procedimiento seguido para obtenerlos, es el que se haya desarrollado un estudio piloto del mismo. En este estudio se pone en escena el instrumento entero así como todas las etapas del proceso de recogida de datos, utilizando para ello un grupo de sujetos más reducido. Si un instrumento, así como el proceso de recogida de datos en sí, no ha sido utilizado en una ocasión anterior (pretest) a la recogida de datos definitivos, bien podría pensarse que la calidad de la encuesta debe presentar graves deficiencias. Esta etapa básica, aunque frecuentemente no desarrollada, es fundamental porque en ella se evalúan los siguientes aspectos: 1. Cómo son de entendibles las distintas preguntas, así como las instrucciones en general. Igual ocurre con las distintas categorías de respuesta para el caso de preguntas cerradas. 2. Cuál será la mejor secuencia de preguntas en el cuestionario y cual será el orden de recogida de los distintos aspectos que pretende cubrir la encuesta. 3. Cómo de adecuada y fiable es la forma de recoger los datos. 4. Cuál será el coste, en tiempo y dinero, del trabajo definitivo. 5. Cuánto tiempo medio será necesario solicitar del sujeto para completar el cuestionario. 6. Qué preguntas se eliminarían si el tiempo de recogida de datos por sujeto resultase demasiado largo. 7. Cómo se comportan las preguntas de filtro, las de control, etc. El no haber dado respuesta a cada una de estas preguntas y el no incorporar en el proceso de recogida de datos definitivos los cambios correspondientes, es uno de los aspectos básicos para una baja evaluación de la calidad de la encuesta definitiva. Si no se realiza un estudio piloto adecuado de todo el proceso de investigación lo más probable es que en la recogida de datos definitiva surjan situaciones no previstas que

Investigación a través de los cuestionarios

171

habrán de resolverse sobre la marcha. Esa falta de previsión provocará distorsiones en los datos, introduciendo sesgos y errores innecesarios que serán las causas de una baja validez y fiabilidad de los mismos y de la encuesta en general. Todos estos elementos adquieren una mayor o menor preponderancia en función del grado de implicación del investigador en el proceso general de la encuesta. En unas ocasiones, parte de este proceso ya ha sido realizado (casos en los que la recogida de datos fue llevada a cabo por otros investigadores) y, en otras, es realizado por personas contratadas por el propio investigador. En cualquiera de estas situaciones, dicho investigador deberá tener conocimientos de primera mano (informes exhaustivos) de las actividades desarrolladas por otras personas. Ni que decir tiene que si el instrumento ha sido desarrollado por él, se verá obligado a informar de todas las incidencias recogidas mediante el estudio piloto. 3. Errores asociados con la entrevista 3.1.

Errores asociados a los encuestadores

Otro aspecto de vital importancia para la calidad de la encuesta es el de los encuestadores (entrevistadores, personas encargadas de recoger los datos en general) y por esta razón debe cuidarse especialmente. No debe caerse en la habitual selección de personas por la cercanía o por la facilidad de disponer de ellas, tales como alumnos de una facultad, miembros de asociaciones vinculadas al investigador, familiares, amigos, etc. Si este es el caso deberán ser instruidos adecuada y específicamente. En relación con la calidad de la encuesta bien valdría una respuesta a la pregunta ¿quién o quiénes realizaron la recogida de datos? La respuesta será valorada en función del objetivo de la encuesta. A veces, con que los encuestadores tengan una educación primaria, es suficiente; en cambio, si el tipo y objetivo de la encuesta necesita de datos muy específicos, no sólo deberán tener una educación más elevada, sino una experiencia concreta del campo en cuestión. Por ejemplo, si el objetivo de una encuesta estuviera relacionado con los materiales y las condiciones óptimas para la práctica del golf, los encuestadores deberán acreditar un conocimiento específico relacionado con este deporte. Sea cual fuere el caso, se necesita un entrenamiento específico, un contacto previo con el cuestionario, haberlo administrado en una ocasión vigilada, etc. El lector, puede encontrarla una agenda básica de entrenamiento de encuestadores en Weinberg (1983).

Investigación a través de los cuestionarios

172

3.2.

La importancia en la supervisión

Como se ha dicho en el capítulo 6, la persona encargada de hacer la entrevista ha de ser ineludiblemente supervisada, independientemente de los procedimientos de recogida de datos utilizados (entrevista cara a cara, por correo, por teléfono, por ordenador, etc.). Esta situación ha de ser tenida en cuenta no en negativo (comprobar que el entrevistador de una manera u otra haya falseado los datos) sino en positivo, es decir, como ayuda a la buena realización de su trabajo. La supervisión deberá hacerse con mayor intensidad al comienzo del estudio, ya que es entonces cuando el encuestador dispone de menos experiencia. El supervisor deberá estar muy pendiente de todo lo que ocurra: no sólo verificará completamente los primeros cuestionarios, sino que además deberá comprobar cómo fueron recogidos, cómo se realizaron los contactos, cómo seleccionaron a los sujetos, etc. Una vez que la valoración emitida sea aceptable y pueda considerarse que el entrevistador realiza bien el trabajo y controla todas las situaciones surgidas, el supervisor se limitará a verificar sólo a unos pocos entrevistadores (entre un 10% y un 15%). Para ello es fundamental hacer uso de la hoja de resultados o incidencias que el entrevistador rellenará cada vez que intenta o realiza una entrevista. Esta hoja permite al supervisor detectar y comprobar errores, conscientes o inconscientes, cometidos por el entrevistador. Cuando se detectan fallos en el entrevistador es obligatorio renunciar a todo el trabajo realizado por él y repetir una recogida semejante a la que él tenía asignada. Cualquier otra solución es rebajar la calidad de la encuesta. 3.3.

Repaso de la entrevista y cumplimentación correcta de cuestionarios

Todo el proceso de preparación de los datos para su puesta a punto para los posibles análisis comienza en la recogida de datos realizada por el encuestador. En esta fase el encuestador deberá, una vez realizada la entrevista, repasar lo reseñado en el cuestionario, ya que es cuando más reciente tiene lo sucedido y podrá completar todos aquellos aspectos que no pudo anotar al tiempo que realizaba la entrevista. Cabe destacar a modo de guía los siguientes: -

Repasar lo escrito para detectar palabras poco legibles.

Repasar todas las preguntas y comprobar que no se olvidó ninguna.

Determinar si las preguntas filtro se realizaron correctamente.

Investigación a través de los cuestionarios

173

Comprobar que los datos de identificación se recogieron adecuadamente.

Cualquier otra incidencia que se diera durante la entrevista.

Estos pequeños detalles colaboran fuertemente a eliminar muchas fuentes de error y a elevar la calidad de la encuesta, Por regla general los cuestionarios o las respuestas codificadas serán enviados al responsable de la investigación que a su vez determinará quién o quiénes los procesarán; por lo general, personas que no vivieron la recogida de datos directamente se limitarán a transcribir lo que formalmente queda recogido en los cuestionarios u hojas de respuesta y, por lo tanto, todos los datos deberán presentarse con claridad y sin ambigüedades. 4. Errores asociados al tratamiento de datos 4.1.

Errores en la codificación de datos

Otra fuente de error que rebaja la calidad de las encuestas está íntimamente ligada a la codificación de las respuestas de las preguntas abiertas. Esta codificación trata de la transformación de las respuestas escritas a un código que las represente. Este proceso se realiza después de recoger la información y de analizar el contenido de todas las respuestas obtenidas para cada una de las preguntas abiertas del cuestionario. Este proceso no es tan intuitivo como en principio puede parecer y de no realizarse convenientemente, provoca una serie de informaciones erróneas que atentan contra la validez de la encuesta. Ejemplo: cómo codificar las distintas respuestas que pueden obtenerse ante la pregunta ¿cuántos amigos tienes? Veamos: si responde 1, 3 ó 7 parece que la situación es fácil, con sólo codificarla con el número correspondiente es suficiente y correcto. Pero si contesta con un rango, por ejemplo entre 8 ó 10, o si usa como respuesta “muchos”, “pocos”, etc., la situación se complica. En estos casos hay que determinar, una vez analizada toda la información requerida, qué códigos deberán usarse, de manera que se preserve el sentido de las respuestas dadas por los sujetos a las preguntas abiertas. De los ejemplos anteriores el mayor problema lo plantean las respuestas verbales (no numéricas); en estos casos se determinarán códigos arbitrarios y sólo relacionados con las respuestas en forma de correspondencia: usar valores más altos para codificar “muchos” que para codificar “pocos”. En relación con las respuestas a modo de rangos, Sonquist y Duntelberg (1977) aconsejan usar como código el punto medio del intervalo. Esto, al igual que se determinó para las categorías de respuesta no sabe/no contesta, etc., facilitará la labor en los análisis que

Investigación a través de los cuestionarios

174

posteriormente se realicen a partir de los datos procesados. Es necesario mantener especial atención a la hora de la codificación de las respuestas abiertas. Cuando se trata de respuestas cortas y concisas tales como preferencias, ocupación, etc., es aconsejable utilizar algún índice publicado por organismos públicos o privados. En cambio, para respuestas más complejas es imprescindible que el investigador cree su propia estructura de códigos. Básicamente se trata de recoger por categorías, de manera fiel y aceptable, las distintas respuestas dadas por los sujetos. Para esto se tendrán en cuenta las reglas indicadas para la codificación de las categorías de respuesta en las preguntas cerradas. Además de éstas, Bourque y Clark (1994) añaden las siguientes reglas específicas para determinar el sistema de códigos: -

Especificar los objetivos para los que va a usarse el sistema de códigos.

Mantener un equilibrio entre recoger muchos y no demasiados detalles para cada código.

Crear el suficiente número de códigos, variables o dimensiones, tal que el codificador no tenga necesidad de forzar algunas respuestas a la hora de asignar un código.

Mantener un mismo código para los datos perdidos. Sobre este punto ya se dieron indicaciones anteriormente.

Agrupar categorías relacionadas y utilizar para esas unos códigos de tal manera que se usen uno/s mismos dígito/s que las representen, seguidos de otros que a su vez diferencien a las distintas categorías incluidas en la agrupación.

Además de lo indicado, una buena estrategia para la creación de nuestro sistema de codificación que facilita el cumplimiento de las reglas indicadas es desarrollar dicho sistema tomando como base una muestra de respuestas comprendida entre el 20% y el 50%. 4.2.

Errores asociados al registro o grabación de los datos

Una vez codificados y registrados los datos el investigador puede y debe comprobar la idoneidad y consistencia de las respuestas dadas por los sujetos; si eran las adecuadas, si las preguntas filtro se realizaron correctamente, valorar las preguntas de control, etc. Para ello puede editar el fichero donde se registraron los datos y con una simple inspección detectar fuentes de error que hasta ese momento pasaron

Investigación a través de los cuestionarios

175

inadvertidas, tales como el número de registros completos, la dimensión y características, de la muestra, errores claros en el cuestionario, sesgos en las respuestas, etc. Esto permitiría al investigador introducir cambios en el procedimiento que le lleven a subsanar los errores detectados antes de iniciar el análisis de los mismos. Éstos pueden consistir en volver a entrevistar a algunos sujetos del estudio, aumentar el número de entrevistadores, recoger muestras adicionales que cubran aspectos y características no recogidas en el ensayo realizado, etc. Como el lector podrá imaginar todas estas indicaciones favorecerán la calidad de los resultados definitivos, que sin duda serán menos costosos en tiempo y dinero que unos datos de baja calidad. Aún queda una tercera y definitiva inspección a los datos registrados que permite determinar indicadores formales de la calidad de los mismos. En esta fase hay que atender a aspectos tales como el rango de puntuación de cada una de las variables procesadas o la existencia de datos que muestren claras inconsistencias. Las tablas de contingencia, en las que es posible combinar uno o varios datos entre sí de tal manera que los valores que aparecen en cada casilla de cruce, pueden ayudar a detectar y determinar dichas inconsistencias. En cualquier caso los errores localizados deberán ser subsanados antes del inicio de los análisis correspondientes. Esta tercera fase se completará lo más próxima posible a la fase de recogida y registro de los datos. El abordar estas tareas pasado un tiempo considerable (4 ó 5 meses después) complica enormemente la tarea de depuración de datos erróneos. 4.3.

Errores en la preparación de los datos para el análisis

Después de completar todo el proceso de codificación y registro de los datos es necesario, antes del análisis de datos definitivo, indagar sobre distintos aspectos que sin duda favorecerán el análisis, al tiempo que se eliminan fuentes de error, lo que mejora la calidad de la encuesta. Veamos: 1. En la hoja o libro de códigos es conveniente indicar de qué manera fueron grabados. En dicha hoja deberán incluirse los campos en donde se sitúan las variables así como el significado de los distintos códigos que puedan representar a la variable. De acuerdo con la hoja de códigos que representa el cuadro 2a, se muestran los registros correspondientes a cuatro personas (2b).

Investigación a través de los cuestionarios

176

CUADRO 2a. Hoja de códigos Nº

Localización C. Inicio C. Fin

Nombre

Etiqueta variable

Valores 00001 a 05351

ide

Número de identificación

sex

Sexo

cls

Clase social

eda

Edad

0 1 0 1 2 00 a99

Etiquetas Número sujetos mujer hombre baja media alta Nº años

CUADRO 2b. Fichero de datos ... 000951234 000961045 000970027 000981135 ...

Con la sola inspección de la hoja de códigos y el fichero de datos sería fácil para todos aquellos investigadores que intentaran analizar los datos el identificar con nitidez los valores de una variable en particular o de todas ellas. El registro de fichero de datos del ejemplo hace referencia a los sujetos 95, 96, 97 y 98 de la muestra. El sujeto 96 es hombre, con clase social baja, de 45 años de edad. La hoja de códigos nos permite igualmente establecer el rango de valores posibles para cada variable y a partir de ellos subsanar los errores ocurridos durante la introducción de los datos, ya que al comprobar los valores más pequeños y más altos que aparecen en los distintos campos, identificaríamos aquellos registros en los que es imposible que un número determinado apareciera en una variable concreta. Por ejemplo 3 en la variable sexo. Su comprobación nos llevaría a corregir el valor real de dicha variable una vez que repasáramos los datos del sujeto en cuestión, 2. Descripción de las características de la muestra obtenida. Esto nos indicará el grado de representación de la misma en relación con la población de interés. En el caso en el que algunos estratos de población no estén bien representados habría que determinar si es aconsejable el recoger datos de los no representados antes del inicio de los análisis o bien hacer uso de procedimientos estadísticos para determinar el peso de cada aspecto sobre representado en relación con las características de la población y de esta manera contrarrestar su influencia en el análisis de los datos originales. 3. Eliminación de registros a causa de datos perdidos, incompletos o inconsistentes.

Investigación a través de los cuestionarios

177

4. Transformación de variables y, a partir de ellas, crear nuevos ficheros desde los que realizar análisis específicos: crear, del fichero original, dos ficheros (uno en el que están todos los hombres entre 20 y 35 años y otro entre los 36 y 50 años), por ejemplo. 5. Evaluar las distintas escalas de medida de las variables en relación con su fiabilidad y validez. 6. De acuerdo con el fichero de documentación, realizar unos cálculos simples a mano con sólo los 10 primeros sujetos del fichero de datos y comprobar que el cálculo resultante al ejecutar el programa informático específico utilizando los mismos sujetos coincide con los obtenidos a mano. Esta estrategia asegura que la forma en que el ordenador ha leído los datos se corresponde en lugar y espacio con los del fichero correspondiente. Cualquier paquete informático contiene un programa que facilita el desarrollo y comprobación de la mayoría de los puntos comentados anteriormente, proporcionando información del número de casos analizados, valores máximos y mínimos leídos para cada variable, el número de casos perdidos en cada variable o categoría de respuesta, los valores de tendencia central y dispersión de las variables introducidas, etc. Como resultado de los pasos anteriores, en muchas ocasiones el investigador debe enfrentarse al problema de la no respuesta detectada en los análisis indicados. Por ejemplo, hay 120 sujetos de 230 pertenecientes al nivel socioeconómico medio que no responden el apartado de ingresos anuales. Parte de esta falta de respuestas puede haber sido debida bien a que el sujeto no quiso responder, bien a que se perdió el dato correspondiente. Para el primero de los casos se han determinado distintas estrategias estadísticas que tratan de dar solución al problema. El esquema básico de todas ellas es el siguiente: se establecen grupos de sujetos distintos en función de alguna o algunas variables desde las que no hay razones para que las proporciones de respuestas obtenidas en otras variables sean claramente diferentes. A partir de aquí se establece la tasa de respuesta en cada uno de los grupos y se usa el valor obtenido como ponderación de todos los datos presentados en cada grupo. En el caso de los datos perdidos, las distintas estrategias se han tratado en apartados anteriores de este capítulo así como en capítulos específicos de este texto.

Investigación a través de los cuestionarios

178

Por último, un breve comentario en relación con los datos fuera del rango o los datos inconsistentes con el resto. En cuanto a los primeros queda el problema resuelto volviendo a inspeccionar los datos originales del sujeto correspondiente, aunque como es obvio hay que identificar el dato como fuera del rango. Esta tarea se facilita con el uso de programas informáticos. Respecto a las variables nominales y ordinales, cualquier valor fuera del rango indica al investigador el posible error; para variables con nivel de escala de intervalos, el problema ya no es tan simple. En estos casos se ha de tomar como referencia las distribuciones de las variables y la probabilidad de aparición de un dato en concreto. Serán entonces los tests estadísticos los que catalogarían los datos inconsistentes. Para esta catalogación a veces es suficiente con sólo el percentil de cada valor. Por otra parte, en la actualidad la mayoría de los análisis presentan una opción para el tratamiento y detección de este tipo de datos. Una última decisión sobre este tipo de datos: ¿qué hacer con ellos una vez detectados? La mayoría de los investigadores no dudan en eliminar y sólo se plantean mantenerlos en aquellas ocasiones en las que el criterio de dato inusual no está del todo claro. En estos casos, antes de eliminarlo se consideran las características del sujeto y se valora la importancia del mismo como componente de la población a la que se quieren referir los resultados y, si es muy importante, se mantiene. En tal caso deberemos determinar con qué valor. 4.4.

Imputación de datos a las respuestas perdidas y a las no respuestas

Por imputación se quiere indicar el proceso o método que se sigue para asignar un valor a los registros perdidos de uno o unos sujetos determinados, bien porque no quisieron responder bien porque su contestación no fue anotada por el entrevistador o por cualquier otra causa. Existen diversos procedimientos de imputación. La base conceptual justificativa de todos ellos radica en experiencias anteriores, en la deducción, en el tratamiento estadístico, a veces en la intuición y en datos anteriores del mismo o parecido fenómeno. Su objetivo es el de no tener que eliminar elementos de la muestra que pudieran romper la representatividad de la misma. A veces se dispone de uno o de varios elementos muestrales, de todos sus datos menos uno. En estos casos, ¿es conveniente eliminarlos y perder el resto de su información? Si se mantienen es necesario establecer un criterio para rellenar los datos perdidos, de tal manera que dicha sustitución provoque el menor error posible a la vez que se evita el sesgo que

Investigación a través de los cuestionarios

179

pudiera suponer la no presencia del mismo o de los mismos en la muestra definitiva. Sin embargo, ningún procedimiento de imputación de datos asegura la reducción del sesgo. Mirándolo fríamente, lo que se hace en definitiva es generar datos, no recuperarlos; la cantidad de información disponible es la misma. Lo que sí se consigue, de adoptar el procedimiento adecuado, es conservar toda la información recogida al tiempo que se espera conseguir mejores estimaciones al incluir datos imputados. La estrategia más adecuada de imputación es la que se sigue a partir de la información que se tiene del conjunto de datos. Desde ellos se puede deducir el valor que falta en un registro específico apoyándose en sus características concretas. Si de un registro falta el dato de si el sujeto dispone o no de coche, y en otras de sus contestaciones se recoge el dinero que gasta en gasolina, el que gasta en transporte público y cuál es su tipo de trabajo, se podría rellenar el dato perdido con cierto grado de seguridad. Otro método de imputación, para aquellos datos no disponibles que por alguna razón no puedan ser deducidos, consistiría en duplicar un valor de los existentes, la elección del valor a duplicar se obtiene, básicamente, después de clasificar a todas las unidades muestrales en grupos homogéneos en sí mismos y a la vez heterogéneos entre sí, y a cada dato que falte se le asigna el de su grupo correspondiente. También es muy útil, aunque costoso teórica y materialmente, el recurrir a técnicas estadísticas, tales como la regresión a partir de unas variables de control. Lo estimado se tomaría como el dato a imputar a una unidad muestral concreta de la que no se tuviera información, Por último, cabe citar el método de ponderación de grupos de datos ya recogidos. Se trata de otro método bastante extendido al que ya se ha hecho referencia anteriormente en este capítulo. 5. Conclusión Para finalizar este apartado se van a enumerar esquemáticamente los distintos aspectos resaltados a lo largo del mismo. Dicha enumeración servirá al lector para disponer de una serie de apartados de los que deberá obtener respuesta puntual a la hora de valorar la calidad de los datos de la muestra: a) El Diseño de la muestra. Bajo este epígrafe se engloba todo lo referente a la descripción de la muestra, del método de muestreo, procedimiento seguido para obtener la muestra, la muestra resultante, variables usadas y ponderación, en su Investigación a través de los cuestionarios

180

caso, de las mismas. b) El instrumento de recogida de datos. Copia de todos los instrumentos de recogida de datos, con su referencia bibliográfica, si se trata de instrumentos ya desarrollados. En el caso de instrumentos y procedimientos ideados por el investigador responsable de la encuesta se deben presentar los resultados del estudio piloto y de los cambios realizados a partir del mismo. También hay que señalar las indicaciones sobre los procedimientos seguidos para el cálculo de la fiabilidad y la validez. c) Procedimientos utilizados para el control de calidad de los datos obtenidos por los encuestadores, tipos de supervisión y materiales usados para el entrenamiento de los entrevistadores. d) Libro de códigos en donde queden recogidos todos los códigos asignados a las distintas variables utilizadas en el estudio, así como los campos que ocupan cada una de ellas. e) Las decisiones tomadas en relación con los valores “perdidos” y con los valores “extraños”, así como las transformaciones realizadas con los datos originales y las estructuras de los nuevos ficheros. Sobre estos últimos se debe disponer de un fichero documentado semejante a lo realizado con los ficheros originales.

Investigación a través de los cuestionarios

181

BIBLIOGRAFÍA Abad de Servín, A. y Servín Andrade, L. (1978). Introducción al muestreo. México: Limusa. Adams, L. (1992). Gráficos en C y ensamblador. Madrid: Anaya. Adams, R. C. (1989). Social survey methods for mass media research. Communication textbook Series. New Jersey: Lawrence Erlbaum Associates Publishers. AEDEMO (1986). Código internacional CCI/ESOMAR de prácticas legales en materia de investigación de mercado y opinión. Barcelona: AEDEMO. AEDEMO (1997). Anuario 1996-97. Madrid: AEDEMO. Alaminos, A. (1993). Gráficos. Cuadernos Metodológicos. Madrid: CIS (Centro de Investigaciones Científicas). Álvaro, J. L. y Garrido, A. (1995). Análisis de datos con SPSS/PC+. Cuadernos Metodológicos. Madrid: CIS (Centro de Investigaciones Científicas). Alvira, F. (1984). La investigación sociológica. En S. del Campo (Ed.) Tratado de Sociología, Madrid: Taurus. 61-94. American Institute of Certified Public Accountants (1974a). Sampling for attributes: estimation and discovery. An Auditor’s approach to statistical sampling. Vol 2. Nueva York: American Institut of Certified Public Accountants. American Institute of Certified Public Accountants (1974). Field manual for statistical sampling. Colección An Auditor’s approach to statistical sampling. Vol 6. Nueva York: American Institute of Certified Public Accountants. Ander-Egg, E. (1995). Técnicas de investigación social. Buenos Aires: Lumen. Aparicio, F. (1991). Tratamiento informático de encuestas. Madrid: Ra-ma. Arnau, J. (Ed.)(1978). Métodos de Investigación en Ciencias Humanas. Barcelona: Omega. Arnau, J., Anguera, M. T. y Gómez, J. (1990). Metodología de la Investigación en Ciencias de Comportamiento. Murcia: Universidad de Murcia. Arnau, J. (1995). Metodología de la investigación psicológica. En M. T. Anguera y otros (Eds.) Métodos de Investigación en Psicología. Madrid: Síntesis. Ato, M. y López, J. J. (1994). Fundamentos de estadística con SYSTAT. Madrid: Ra-ma. Azorín, F., Sánchez Crespo, J. L. (1986). Métodos y aplicaciones del muestreo. Colección Alianza Universidad Textos. Madrid: Alianza. Azorín, F. (1969). Curso de muestreo y aplicaciones. Madrid: Aguilar. Babbie, E. R. (1973). Survey research methods. Wadsworh Belmont, California: Publishing Company. Bacon, F. (1991). Novum Organum. 4ª Ed. México: Porrúa. Barnett, V. (1974). Elements of sampling theory. London: The English University Press. Bingham, W. V. D. y Moore, B. V. (1924). How to interview. Nueva York: Harper and Row. Botella, J., León, O. y San Martín, R. (1993). Análisis de datos I. Madrid: Pirámide. Bosch, J. L. C. y Torrente, D. (1993). Encuestas telefónicas y por correo. Cuadernos Metodológicos. Madrid: CIS (Centro de Investigaciones Científicas). Bourgue y Clark (1994). En M. S. Lewis (ed.). Beck International Handbooks of quantitative applications in the Social Sciences. Vol. 6. Sage.

Investigación a través de los cuestionarios

182

Bradburn, N. M; Sudrnan, S. (1988). Polls and surveys. Understanding what they tell us. The Jossey-Bass Social and Behavioral Science & Public Administration Series. Nueva York: John Wiley & Sons. Bunge, M. (1985). La investigación científica. Barcelona: Ariel. Burkheimer, G. J. y Levinsohn, J. R. (1988). Implementing the Mitofsky-Waksberg sampling design with accelerated sequential replacement. En R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls II y J. Walsberg (Eds.). Telephone survey methodology (pp. 99-112). Wiley series in probability and mathematical statistics. Nueva York: John Wiley & Sons. Campoy, P. (1980). Esquema de realización de una encuesta por muestreo. Estadística Española, 86, 27-43. Cannel, C., Marquis, K. y Laurent, A. (1977). A summary of studies. Vital and health Statistics, Series 2, 69. Whasington, DC: Government Printing Office. Castells, M. y de Ipola, E. (1975). Metodología y epistemología de las ciencias sociales. Madrid: Ayuso. Chaudhuri, A. y Stenger, H. (1992). Survey sampling. Theory and methods. Statistics: textbooks and monographs, 130. New York: Marcel Dekker Inc. Chou, Y. L. (1972). Análisis estadístico. México: Nueva Editorial Interamericana. Church, A. H. (1993). Estimating the effect of incentives on mail surveys response rates: a meta analysis. Public Opinion Quartely, 57, 1, 62-79. CIS (1996). Catálogo del Banco de Datos 1996. Madrid: CIS (Centro de Investigaciones Científicas). Clemente, M. (Ed.) (1992). Psicología social: métodos y técnicas. Madrid: Eudema Universidad. Cochran, W. G. (1976). Técnicas de muestreo. México: Compañía Editorial Continental S.A.. Cook, T. D. y Campbell, D. T. (1979). Quasi-experimentation: Design and Analysis Issues for Field Settings. Chicago, IL.: Rand McNally. Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. Nueva York. Holt, Rinehart and Wilston. Cyert, R.M. y Davidson, H. J. (1962). Statistical sampling for accounting information. Nueva York: Prentince Hall. Czaja, R. y Blair, J. (1996). Designing surveys. A guide to decisions and procedures. Thousand Oaks, California: Pine Forge Press. Dader, J. L. (1990). Repercusión política y social de los sondeos de opinión. En Muñoz Alonso (1990). Opinión pública y comunicación política. Madrid: Eudema: 488-507. De Miguel, A. (1996). El manual del perfecto sociólogo. Madrid: Espasa. De Vaus, D. A. (1993). Surveys in social research. 3ª ed. London: UCL Press Delgado, A. y Prieto, G. (1997). Introducción a los métodos de investigación de la psicología. Madrid: Pirámide. Deming, W. E. (1966). Some theory of sampling. Nueva York: Dover Publications. Derdo, M. (1980). Practique et analyse des enquètes par sondage. Études de marché. Test de produits. París: Presses Universitaires de France. Diliman, D. (1978). Mail and the telephone survey: the total design method. New York: John Wiley. Equipo de Investigaciones Sociológicas (1995). Las condiciones de vida de la población pobre

Investigación a través de los cuestionarios

183

de la provincia de Almería. Madrid: Fundación FOESSA. Etxeberria, J., Joaristi, L. y Lizasoain, L. (1991). Programación y análisis estadísticos básicos con SPSS/PC+. Madrid: Paraninfo. FAJER (1996). Estudio sobre la prevalencia sobre los jugadores de azar de Andalucía. Sevilla Consejería de Asuntos Sociales. Junta de Andalucía. Fazeli, H., Granado, M. C., López Herrador, M., Manzano, V. y Sánchez García, E. F. (1991). Tratamiento del factor humano en la investigación sobre la Calidad de la Enseñanza Universitaria. En Actas Primer Congreso Internacional sobre la Calidad de la Enseñanza Universitaria (pp. 87-97). Cádiz: Instituto de Ciencias de la Educación. Feigl, P. (1978). A graphical aid for determining sample size when comparing two independent proportions. Biometrics, 34, 111-122. Fink, A. (1995a). How to design surveys. Thousand Oaks, California: Sage. Fink, A. (1995b). How to ask survey questions. Thousand Oaks, Califofflia: Sage. Fink, A. (1995c). How to report on surveys. Thousand Oaks, Califomia: Sage. Fink, A. y Kosecoff, J. (1989). How to conduct surveys: a step-by-step guide. Beverly Hills California: Sage. Foddy, W. (1996). Constructing questions for inteviews and questionnaires. Cambridge, UK Cambridge University Press. Fowler, F. J. (1993). Survey Research Methods. Newbury Park, California: Sage. Fourez, G. (1994). La construcción del conocimiento científico. Madrid: Narcea. Fowler, F. J. y Mangione, T. W. (1990). Standarized survey interviewing: Minimizing interviewer related error. Newbury Park, California: Sage. Frankel, M. (1983). Sampling Theory. En P. H. Rossi, J. P. Wright y A. B. Anderson (Eds.) Handbook of survey research (pp. 21-67). Quantitative Studies in Social Relations. Orlandc Florida: Academic Press. Frey, J. H. (1983). Survey research by telephone. 2ª ed. Newbury Park, California: Sage. Frey, J. H. y Oishi, S. M. (1995). How to conduct interviews by telephone and in person. Thousani Oaks, California: Sage. Fuller, W. A., Kermedy, W., Sclinell, D., Sullivan, G. y Jin, H. (1986). PC CARP. Ames, lowa Statistical Laboratory (lowa State University). Gallup, G. (1935-197 l). The Gallup poll 1935-1971. Nueva York: Random House. García Ferrando, M. (1993). La entrevista. En M. García Ferrando; J. Ibáñez y F. Alvira (Comp.) El análisis de la realidad social. Métodos y técnicas de investigación. Madrid: Alianza. Ghiglione, R. y Matalon, B. (1989). Las encuestas sociológicas. Teoría y práctica. México: Trillas. Gómez, J. (1990). Metodología de encuesta por muestreo. En J. Arnau; M. T. Anguera y J. Gómez. Metodología de la Investigación en Ciencias del Comportamiento. Murcia: Universidad d Murcia. González Río, M. J. (1997). Metodología de la investigación social. Alicante: Aguaclara. Gorden, R. L. (1980). Interviewing: strategy, techniques and tactics. Illinois: The Dorsey Press. Groves, R. M. (1989). Surveys errors ans survey costs. Nueva York: Wiley. Groves, R. M. (1990). On the path to quality improvement in social measurement: developing indicators of survey errors and survey costs. En Proceedings of the section on survey

Investigación a través de los cuestionarios

184

research methods (pp. 1-10). Alexandria, Virginia: American Statistical Association. Groves, R. M., Lyberg, L. E. (1988). An Overview of nonresponse issues in telephone surveys. E R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls 11 y J. Walsberg (Eds.: Telephone survey methodology (pp. 191-211). Wiley series in probability and mathematical statistics. Nueva York: John Wiley & Sons. Grzib, G. (1991). Introducción a la psicología: aspectos conceptuales y metodológicos. Addendi Madrid: UNED. Guenzel, P. J., Berkmans, T. R. y Cannell, C. F. (1983). General interviewing techniques. Ann Arbor, N. J.: Institute for Social Research. Guttman, L. (1950). The basis for scalogram analysis. En S. A. Stouffer (Ed.) Measurement and prediction. Priceton, N. J.: Priceton University Press. Hague, P. N. y Jackson, P. (1994). Cómo hacer investigación de mercados. Bilbao: Deusto. Hansen, M. H., Hurwitz, W. N. y Madow, W. G. (1953). Sample survey. Methods and theory. Vol I: Methods and applications. Serie Wiley Classics Library. Nueva York: John Wiley & Sons. Harvatopoulos, Y., Livan, Y. F. y Sarnin, Ph. (1992). El arte de la encuesta. Principios básicos para no especialistas. Bilbao: Deusto. Hedges, B. (1980). Sampling. En G. Hoinville y R. Jowell (Eds.). Survey research practice (pp. 55-89). Londres: Heinemann Educational Books. Hutton, P. F. (1990). Survey research for managers: how to use surveys in management decision making. Londres: Macmillan. Jacoby, W. G. (1997). Statistical graphics for univariate and bivariate data. California: Sage. James, J. M. y Bolstein, R. (1992). Large monetary incentives and their effect on mail survey response rates. Public Opinion Quartely, 56, 4: 442-453. Jiménez, F. (1986). Psicología social. Madrid: UNED. Jolliffe, F. R. (1986). Survey Design and Analysis. Mathematics and it’s applications. Chichester: Ellis Horwood Limited. Juárez, M. (Dir.) (1994). V Informe sobre la situación social en España. Madrid: Fundación FOESSA. Kachelmeier, S. J. y Messier, W. F. Jr. (1990). An investigation of the influence of a nonstatistical decision aid on auditor sample size decisions. Accounting review, 65, 1. 209-226. Kalton, G. (1987). Introduction to survey sampling. Beverly Hills, California: Sage. Kendall, M. G. (1968). The history of statistical method. En International Encyclopedy of the social sciences. vol 8. McMillan and Free Press Kerlinger, F. N. (1987). Investigación del comportamiento. Técnicas y metodología, 2ª ed. México: Interamericana. Kisb, L. (1982). Muestreo de encuestas. México: Trillas. Koti, K. M. (1988). Optimun stratified sampling using prior information. Ann Arbor, Michigan: UMI Dissertation services. La Perre, R. T. (1934). Attitudes versus actions. Social Forces, 13, 230-237. Lambert, J. (1989). Psicología Social. Madrid: Pirámide. Lavrakas, P. J. (1987). Telephone survey methods. Sampling, selection and supervision. Beverly Hilis, California: Sage.

Investigación a través de los cuestionarios

185

Lazarsfeld, P., Berelson, B. y Gaudet, H. (1944). The people’s choice. How the voter makes up his mind in a presidential campaign. New York: Columbia University Press. Lécuyer, y Oberschall (1974). Los orígenes de la investigación social. En Enciclopedia Internacional de las Ciencias Sociales. Madrid: Aguilar. León, O. G. y Montero, I. (1993). Diseño de Investigaciones. Madrid: McGraw-Hill. Leplay, F. (1881). La constitution essentielle de l’humanité. Exposé des principes et des costumes qui créent la prosperité ou souffrance des nations. París. Lessler, J. T., Kalsbeek, W. D. (1992). Non sampling error in survey. Wiley Series in probability and mathematical statistics: applied probability and statistics section. Nueva York: John Wiley & Sons. Levy, P. S., Lemeshow, S. (1991). Sampling of populations. Methods and applications. Wiley Series in probability and mathematical statistics: applied probability and statistics section. Nueva York: John Wiley & Sons. López Pintor, R. (1992). El análisis de los datos de encuesta. En M. García Ferrando; J. Ibáñez y F.Alvira (Eds.). El análisis de la realidad social. Madrid: Alianza Editorial, 359-382. Manheim, H. L. (1982). Investigación sociológica. Filosofía y Métodos. Barcelona: CEAC. Manzano, V. (1989). Domine el SPSS/PC+. Madrid: Ra-ma. Manzano, V. (1993). Análisis Estadístico con el SPSS/PC+. Madrid: Ra-ma. Manzano, V. (1995). Inferencia Estadística: Aplicaciones con SPSS/PC+. Madrid: Ra-ma. Manzano, V. (1996). Tamaño óptimo de muestra en investigación mediante encuestas. Fundamentos e implementación de un sistema de ayuda a la decisión. Tesis doctoral no publicada. Facultad de Psicología. Universidad de Sevilla. Manzano, V., Rojas, A. J. y Fernández, J. S. (1996). Manual para encuestadores. Barcelona: Ariel. Manzano, V., Rojas, A. J., Padilla, J. L. González, A. y Pérez, C. (1994). Metodología de la Encuesta. Dpto. de Sociología y Psicología Social. Área de Metodología de las CC. Del Comportamiento. Granada: Universidad de Granada (Texto no publicado). Manzano, V. (1997). SOTAM: Sistema de optimización para tamaños de muestra. V Congreso de Metodología de las Ciencias Humanas y Sociales. Sevilla: Universidad de Sevilla. Manzano, V. (1998). La calidad del muestreo en las investigaciones sociales. Revista Electrónica de Metodología Aplicada (REMA). Vol. 3, nº 1, pp. 16-29. Marsh, C. (1982). The survey method: the contribution of surveys to sociological explanation. London: George Allen and Unwin. Martínez Arias, R. (1995a). Las decisiones posteriores al muestreo. En M. T. Anguera, J. Aman, M. Ato, R. Martínez, J. Pascual y G. Vallejo (Eds.). Métodos y técnicas de investigación en Psicología (pp. 485-510). Síntesis Psicológica. Madrid: Síntesis. Martínez Arias, R. (1995b). Diseños muestrales probabilísticos. En M. T. Anguera, J. Arnau, M. Ato, R. Martínez, J. Pascual y G. Vallejo (Eds.). Métodos y técnicas de investigación en Psicología (pp. 433-484). Síntesis Psicológica. Madrid: Síntesis. Martínez Arias, R. (1995c). El método de encuestas por muestreo: conceptos básicos. En M. T. Anguera y otros (Eds.). Métodos de investigación en psicología. Madrid: Síntesis. Massey, J. T. (1988). An overview of telephone coverage. En R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls II y J. Walsberg (Eds.). Telephone survey methodology (pp. 3-8). Wiley series in probability and mathematical statistics. Nueva York: John Wiley & Sons.

Investigación a través de los cuestionarios

186

McRae, T. W. (1974). Statistical sampling for audit and control. Nueva York: John Wiley & Sons. Meliá, J. L. (1990). Introducción a la medición y análisis de datos. Valencia: Cristóbal Serrano. Miguel, A de. (1997). Manual del perfecto sociólogo. Madrid: Espasa. Mills, F. C. (1969). Métodos estadísticos. Madrid: Aguilar. Mirás, J. (1986). Elementos de muestreo para poblaciones finitas. Madrid: Instituto Nacional de Estadística. Morales, J. F. (1981). Metodología y Teoría de la Psicología. Madrid: UNED. Morales, P. (1988). Medición de actitudes en psicología y educación. San Sebastián: Ttarttalo. Morales, J. F. y Moya, M. C. (1996). Tratado de Psicología Social (vol. l). Madrid: Síntesis. Morsy, M. A. F. (1989). Multivariate sampling models. Ann Arbor, Michigan: UMI Dissertation services. Munn, P., y Drever, E. (1995). Using questionnaires in small-scale research. Glasgow: SCR. Musso, R. (1979a). Problemas y mitos metodológicos de la Psicología y Psicoterapia, Buenos Aires: Psique. Musso, R. (1979b). Falacias y mitos metodológicos de la Psicología. Buenos Aires: Psique. Neyman, J. (1934). On the two different aspects of the representative method: the method of stratified sampling and the method of purposive selection. Journal of the Royal Statistical Society, 97, 558-606. Nicholls II, W.L. (1988). Computer-assisted telephone interviewing: a general introduction. En R. M. Groves, P. P. Biemer, L. E. Lyberg, J. T. Massey, W. L. Nicholls II y J. Walsberg (Eds.). Telephone survey methodology (pp. 377-385). Wiley series in probability and mathematical statistics. Nueva York: John Wiley & Sons. Noelle, E. (1970). Encuestas en la sociedad de masas. Introducción a los métodos de la demoscopia. Madrid: Alianza Editorial. Noelle-Neumann, E. (1986). The spiral of Silence: Public Opinion. Our social skin. Chicago: University of Chicago Press. Ortega Martínez, E. (1981). Manual de investigación comercial. Madrid: Pirámide. Osgood, C. E., Succi, C. J. y Tannenbaum, P. H. (1957). The measurement of meaning. Urbana III: University of Illinois Press. Ostle, B. (1970). Estadística aplicada. Técnicas de la estadística moderna, cuándo y dónde aplicarlas. México: Limusa-Wesley. PC Magazine (1996). Informe programas gráficos, PC Magazine, nº 91: 110-176. Pereda, S. (1987). Psicología Experimental: Metodología. Madrid: Pirámide. Pérez, C. (1995). Análisis estadístico con Statgraphics. Madrid: Ra-ma. Pérez Cebrián, F. (1987). La planificación de la encuesta social. Zaragoza: Universidad de Zaragoza. Pons, I. (1993). Programación de la Investigación Social. Cuadernos Metodológicos. Madrid: CIS (Centro de Investigaciones Científicas). Raj, D. (1980). Teoría del muestreo. México: Fondo de Cultura Económica. Reher, D. S. y Valero, Á. (1995). Fuentes de información demográfica en España. Madrid: CIS (Centro de Investigaciones Científicas). Rincón Igea, D., Amal, J., Latorre, A. y Sans, A. (1995). Técnicas de investigación en ciencias sociales. Madrid: Dykinson. Investigación a través de los cuestionarios

187

Robson, C. (1993). Real world research. A resource for social scientist and practioner researchers. Oxford: Blackwell. Rodriguez Osuna, J. (1991). Métodos de muestreo. Colección Cuadernos metodológicos, nº 1. Madrid: Centro de investigaciones sociológicas. Rodríguez, E. (1997). Cómo redactar bien informes económicos y financieros, Madrid: Inversor ediciones. Rodríguez Lara, (1992). La publicación de encuestas preelectorales y los MCM, Reis, nº 57: 191-213. Rogers, C. (1942). Counselling and psychoterapy. Boston: Hounghton Mifflin. Sánchez Carrión, J. J. (1988). Análisis de datos con SPSS/PC+. Madrid: Alianza. Sánchez Carrión, J. J. (1989). Análisis de tablas de contingencia. Madrid: CIS (Centro de Investigaciones Científicas). Sánchez Crespo, J. L. (1967). Diseño de encuestas por muestreo probabilístico. Madrid: Instituto Nacional de Estadística. Sans, W. E. (1991). Computer assisted interviewing. Newbury Park, CA: Sage. Santesmases, M. (1997). DYANE. Madrid: Pirámide. Särndal, C. E. (1984). Inférence statistique et analyse des données sous des plans d’echantillonnage complexes. Montréal: Les presses de L’Université de Montréal. Särndal, C. E., Swetisson, B. y Wretman, J. (1992). Model assisted survey sampling. Springer. Series in Statistics. Nueva York: Springer-Verlag. Scott, A. J. (1975). Monetary incentives in mail surveys. Public Opinion Quartely, 39, 1: 111-116. Sierra Bravo, R. (1982). Técnicas de investigación social. Madrid: Paraninfo Silva, L. C. (1993). Muestreo para la investigación en ciencias de la salud. Madrid: Díaz de Santos. Sonquist, J. A. y Duntelberg, W.C. (1977). Survey and Opinion Rescarch: Procedures for Procesing and Analysis. Prinec-Hall, N.J.: Englewood Cliff. Spector, P. E. (1992). Sunimated reting scale construction. Newbury Park, California: Sage. Stemberg, R. J. (1996). Investigar en psicología, Barcelona: Paidós. Stoetzel, J. y Girard, A. (1973). Las encuestas de opinión pública. Madrid: Instituto de la Opinión Pública. Stouffer, S. A., Suchman, E. A., De Vinney, L. C., Star, S. A. y Williams, R. M. (1949) The American soldier: combat and its aftermath. vol II. Studies in social psychology in World War II. Princeton, NJ: Princeton University Press. Stuart, A. (1984). The ideas of sampling. High Wycombe, England: Charles Griffin. Sudrnan, S. (1983). Applied sampling. En P. H. Rossi, J. P. Wright y A. B. Anderson (Eds.). Handbook of survey research (pp. 145-197). Quantitative Studies in Social Relations. Orlando, Florida: Academic Press. Sullivan, J. L. & Feldrnan, S. (1994). Multiple indicators. En M. S. Lewis-Beek, (ed.). Basic Measurement. Thousand Oaks (CA): Sage Publications. Teijeiro, F. (1990). Técnicas de muestreo. En E. Ortega (Eds.). Manual de investigación comercial (pp. 312-343). Madrid: Pirámide. Trodahl, V. y Carter, R. E. (1964). Random selection of respondents within houscholds in phone

Investigación a través de los cuestionarios

188

surveys. Journal of Marketing Research, 1: 70-74. Thurstone, L. L. (1928). Attitudes can be measured. American Journal of Sociology, 33: 529-544 Thurstone, L. L. (1929). Fechner’s law and the method of equal appearing intervals. Journal of Experimental Psychology, 12: 214-224. Torgerson, W. S. (1958). Theory and methods of scaling. Nueva York: John Wiley and Sons. Trochim, W. M. K. (1997). Survey Research. (Online). http://trochim.human.comell.edu/ kb/survey.html (1997, 22 de Mayo)

Disponible:

Tschuprow, A. A. (1923). On the mathematical expectation of the moments of frequency distributions in the case of correlated observation. Metron, 2, 646-683. Velilla Barquero, R. (1995). Guía práctica para la redacción de informes, Barcelona: Edunsa. Visauta, B. (1989). Técnicas de investigación social I: Recogida de datos. Barcelona: PPU. WalIgren, A. y otros (1996). Graphing statistics & data, London: SAGE. Weinberg, (1983). en P. H. Rossi, J.D. Wright y A. B. Anderson (Eds.). Handbook of Survey Research. Academic Press. Wert, J. I. (1996) Carta a un incrédulo sobre las encuestas y su muy disputado crédito. Barcelona: Península. Yates, F. (1981). Sampling methods for censures and surveys. High Wycombe, Inglaterra: Charles Griffin.

Investigación a través de los cuestionarios

189