Metodos de encuesta

Page 1



Consulte nuestra página web: www.sintesis.com En ella encontrará el catálogo completo y comentado

MÉTODOS DE ENCUESTA TEORÍA Y PRÁCTICA, ERRORES Y MEJORA

M. a Ángeles Cea D'Ancona

,. UNIVERSIDAD ALBERTO HURTADO BIBLIOTECA

v{~~ -JO/t. 6'tbS}]1

~ EDITORIAL SINTESIS


.(

A mis hijos Irene y Adrián por su paciencia y beneplácito

Reservados todos los derechos. Está prohibido, bajo" las sanciones penales y el resarcimiento civil previstos en las leyes, reproducir, registrar transmitir esta publicación, íntegra o parcialmente, por cualquier" sistema de recuperación y por cualquier medio, sea mecánico, electrónico, magnético, electroóptico, por fotocopia o por cualquier otro, sin la autorización previa por escrito de Editorial Síntesis, S. A.

°

© M. a Ángeles Cea D'Ancona © EDITORIAL SÍNTESIS, S. A. Vallehermoso, 34 - 28015 Madrid Teléf.: 91 5932098 http://www.sintesis.com Depósito Legal: M. 42.101.2004 ISBN: 84-9756-250-X Impreso en España - Printed in Spain

r


ÍNDICE

INTRODUCCIÓN

11

CAPÍTULO 1: LA ENCUESTA COMO ESTRATEGIA DE INVESTIGACIÓN SOCIAL 1.1. 1.2. 1.3. 1.4. 1.5.

Orígenes de la encuesta Características esenciales de la encuesta: sus posibilidades y límites Articulación de la encuesta con otras estrategias de investigación Fases de la encuesta Errores en la aplicación de la encuesta 1.5.1. Errores de "no observación" 1.5.2. Errores de observación o de medición Lecturas complementarias Ejercicios propuestos

13 28 30 33 40 41 43 45 46

CAPÍTULO 2: LA ELECCIÓN DEL MÉTODO DE ENCUESTA: SU EFECTO DIFERENCIAL EN LOS ERRORES DE ENCUESTA 2.1. Encuesta cara a cara 2.2. Encuesta telefónica 2.3. Encuesta autoadministrada .. 2.4. Combinación de métodos de encuesta .. Lectura.s complementarias Ejercicios propuestos

51 64 80 93 99 99


u

lV1eroaos ae encuesta

indice

CAPÍTULO 3: EL DISEÑO DE LA MUESTRA Delimitación del universo de estudio La elecciÓn del marco muestral y su repercusión en el error de no cobertura El tamaño de la muestra La selección de las unidades de la muestra: métodos de muestreo probabilísticos y no probabilísticos 3.4.1. Muestreo aleatorio simple 3.4.2. Muestreo aleatorio sistemático 3.4.3. Muestreo aleatorio estratificado 3.4.4. Muestreo aleatorio por conglomerados 3.4.5. Muestreo de áreas y rutas aleatorias 3.4.6. Métodos de selección de individuos en una misma vivienda 3.4.7. Muestreo por cuotas 3.4.8. La aplicación de otros muestreos no probabilísticos en la investigación mediante encuesta 3.4.9. La especificidad de la encuesta telefónica 3.5. El error muestral, uno de los integrantes del error total de encuesta Lecturas complementarias Ejercicios propuestos 3.1. 3.2. 3.3. 3.4.

102 105 115 124 125 130 132 140 149 158 165 170 173 177 187 188

CAPÍTULO 4: EL DISEÑO DEL CUESTIONARIO 4.1. De los conceptos teóricos a los indicadores empíricos: el error de especificación 4.2. La formulación de las preguntas: sus efectos en el error de medición 4.2.1. Recomendaciones para la redacción de las preguntas 4.2.2. El formato de la pregunta: abierto versus cerrado 4.2.3. La especificidad de la medición de actitudes 4.3. La ubicación de las preguntas en el cuestionario 4.4. La presentación del cuestionario 4.5. La prueba del cuestionario y su redacción final.................................................. Lecturas complementarias :..................................... Ejercicios propuestos

CAPÍTULO 5: LA ADMINISTRACIÓN DEL CUESTIONARIO 5.1. La contribución del entrevistador a los errores de encuesta 5.1.1. Características sociodemográficas 5.1.2. Factores psicológicos 5.1.3. Actuación inadecuada del entrevistador 5.2. La supervisión del trabajo de campo 5.2.1. Revisión de los cuestionarios 5.2.2. Verificación de los cuestionarios 5.2.3. Observación del desarrollo de la entrevista 5.3. La no respuesta 5.3.1. Factores que inciden en la participación en la encuesta 5.3.2. La reducción del error de no respuesta

. .. . . . .. .. .. . . .

192 208 218 241 262 280 286 298 307 307

5.3.2.1. Actuaciones preventivas para la reducción de la tasa de no respuesta 5.3.2.2. Ajustes estadísticos de la no respuesta: la ponderación y la imputación Lecturas complementarias Ejercicios propuestos

. .. . .

CAPÍTULO 6: EL TRATAMIENTO DE LA INFORMACIÓN 6.1. La preparación de los datos para su análisis 6.1.1. Edición de los cuestionarios 6.1.2. Codificación de las respuestas 6.1.3. Grabación de los datos 6.2. El análisis de los datos de encuesta 6.2.1. La exploración univariable 6.2.2. La elaboración de tablas 6.2.3. Opciones analíticas multivariables 6.3. La calidad de los datos de encuesta y su evaluación 6.3.1. La validez de los datos de encuesta 6.3.2. La comprobación de su fiabilidad 6.4. La redacción del informe de los resultados de la encuesta Lecturas complementarias Ejercicios propuestos

. .. . . . . . .. .. .. .. . . .

ANEXO. Tabla de números aleatorios

.

BIBLIOGRAFÍA

.


INTRODUCCIÓN

Hoy día son pocas las personas que no saben qué es una encuesta, aunque sea de forma aproximada. La televisión, la radio y la prensa suelen hacerse eco de las encuestas que despiertan su interés, ya sea por su temática, su ámbito de ejecución o por sus hallazgos sorprendentes. En las citas electorales es cuando las encuestas adquieren un especial protagonismo y, también, cuando más se pone en cuestión la metodología de éstas, sobre todo, si yerran en el pronóstico electoral. Entonces se suceden los debates sobre las encuestas, se indaga en las causas de sus "fallos", se destacan las buenas y las malas prácticas de encuesta y aumenta el escepticismo hacia ellas, haciéndose común el comentario "las encuestas siempre fallan". Pero, ¿por qué fallan?, ¿cuáles son los errores?, ¿cómo superarlos? Éstas son las cuestiones más generales que han espoleado esta monografía. Ciertamente, del título y del índice del libro el lector ya habrá vislumbrado su contenido. No trata de la encuesta en singular, sino de los métodos de encuesta en plural. De sus especificidades, coincidencias y complementariedades. Es un libro ambicioso, más extenso de lo inicialmente programado, por el deseo de ofrecer una visión panorámica y pormenorizada de la metodología de encuesta, en cada una de sus fases, y especificando por método de encuesta. El libro está estructurado en seis capítulos, de extensión dispar, en función de la complejidad de los contenidos temáticos que se abordan. Los dos primeros tienen un carácter más genérico. El capítulo 1 presenta la encuesta como estrategia de investigación social fundamental én la metodología cuantitativa. Si bien, precisa de un uso articulado con otras estrategias de investigación. Se describe la génesis y el desarrollo de la encuesta, sus potencialidades y límites, destacándose los distintos errores que deterioran su calidad y la consiguiente significatividad de la información que aporta.


12

Métodos de encuesta

La elección del método de encuesta a aplicar tiene un efecto diferencial en los errores de encuesta. De ello se habla en el capítulo 2. En él se destacan las ventajas y los inconvenientes de cada método, su empleo combinado, cómo pueden resolverse sus debilidades y la aportación de los avances tecnológicos en la reducción de los distintos errores de encuesta, aparte de reducir sus costes económicos y temporales. Los cuatro capítulos siguientes abordan aspectos concretos en la ejecución de la encuesta, desde sus preámbulos hasta la redacción del informe, con el que se concluye su realización. Todas las fases de la encuesta son decisivas en su desarrollo y no están exentas de errores, que pueden empañar los esfuerzos realizados en estadios precedentes y posteriores. Para comprender mejor su incidencia y qué los origina, los errores de encuesta se analizan en la fase en que aparecen. Los errores de no cobertura y de muestreo, en el capítulo 3, dedicado al diseño de la muestra. Allí se insiste en la concepción del error total de encuesta. Los errores de especificación (debidos a la no correspondencia de la pregunta con los objetivos de la encuesta) y de medición (ocasionados por la redacción de la pregunta, sus opciones de respuesta, su ubicación en el cuestionario) en el capítulo 4. El capítulo 5 trata de la contribución del entrevistador a los diversos errores de encuesta; de cómo pueden solventarse con una adecuada selección, formación y supervisión de los entrevistadores. Se hace mención específica al error de no respuesta, en los distintos métodos de encuesta, y a las diferentes actuaciones preventivas y paliativas de dicho error. El capítulo 6 se ocupa de los errores de medición debidos al tratamiento de la información. Además, ofrece una visión genérica de posibilidades analíticas con datos de encuesta. Concluye con el análisis conjunto de los distintos errores de encuesta y su incidencia en la calidad. Sin duda, esta calidad depende, también, de los recursos (económicos, materiales y humanos) con los que se cuente. Aquí nos ocupamos de los aspectos más técnicos de la calidad de la encuesta, relacionados con el diseño y su ejecución. Por ello, en cada fase se destaca la teoría (qué debe hacerse), la práctica (qué se hace), los errores que surgen por actuaciones "impropias", en cada método, y recomendaciones para su mejora. Cada capítulo concluye con una selección de referencias bibliográficas, a modo de lecturas complementarias, y una propuesta de ejercicios. Con su realización puede comprobarse si realmente se han asimilado los contenidos esenciales del capítulo. Para ayudar a la comprensión de los contenidos teóricos, éstos se acompañan de ejemplos ilustrativos y de referencias a estudios teóricos y empíricos. La intención última es contribuir a un mejor conocimiento de las debilidades de los distintos métodos de encuesta y los modos de prevenirlas.

1 LA ENCUESTA COMO, ESTRATEGIA DE INVESTIGACION SOCIAL \

En la metodología cuantitativa, la encuesta continúa siendo la estrategia más popular en la investigación social. A ello contribuyen sus amplias posibilidades para la obtención de información, diversa, de un conjunto amplio de la población. Pero la calidad y la consiguiente significatividad de los datos de encuesta están supeditadas al rigor aplicado en su diseño y ejecución, al control de los distintos errores que puedan darse en su realización. A la descripción p0f1!lsmorizada de cada una de las fuentes de error en la encuesta, y su resolución propia, se dedican los capítulos siguientes. Este primer capítulo quiere, en cambio, ofrecer una visión general de la encuesta, que ayude en la contextualización de los posteriores. La calidad de la encuesta ha de comprobarse no de forma aislada, sino mediante la conjunción de cada una de sus partes. Por ello, este texto comienza con una presentación genérica de la encuesta para después proceder al detalle, por separado, de sus integrantes. En su presentación no puede faltar una breve descripción de sus orígenes, ni de las características que la diferencian de las demás estrategias de investigación social.

1.1. Orígenes de la encuesta .L.a. ne~esidad de ~ecabar información de la población se remonta a los orígenes de la cIvIlizacIón. Los pnmeros recuentos "censales" datan de los tiempos del emperador Yao en ~hi~a y, con post~rioridad,de las civilizaciones asiria, egipcia, griega y romana. Su fmalIdad era esencIalmente tributaria y militar. El conocer los recursos humanos y económicos de los que se disponía, con fines bélicos y de fiscalidad. Pero no es


14

Métodos de encuesta

hasta el siglo XVII cuando estas "cuantificaciones" adquieren carácter científico, gracias a los avances en el campo de la estadística. En especial, al desarrollo de la teoría de la probabilidad (por Galilei, Fermat, Pascal o Bernoulli); y a la aportación de dos escuelas estadísticas principales: los aritméticos políticos ingleses (Graunt, Petty, Davenant, King, Halley) y la escuela estadística alemana (Seckendorff, Conring, Achenwall). Movidos por el deseo de aplicar modelos estadísticos al conocimiento de la realidad social. En el siglo XVIII aparecen las primeras investigaciones sociales empíricas, de la mano de los llamados reformadores sociales. Un conjunto de profesionales de distintas áreas de conocimiento (médicos, ingenieros, naturistas), unidos por un mismo propósito: aportar evidencia empírica de los problemas sociales de su época, consiguientes al desarrollo de la Revolución Industrial y al rápido crecimiento de las ciudades. Su finalidad era eminentemente política: movilizar a la opinión pública para exigir medidas concretas de reforma social. De ahí su denominación de "reformadores sociales". La recogida de información a través de parroquias y de las inspecciones fiscales, que hasta entonces había imperado, ahora se muestra insuficiente. Con la Revolución Industrial las parroquias dejaron de existir como unidades administrativas y comienza a promoverse la realización de encuestas sociales, desde distintas sociedades estadísticas que fueron creándose en varios estados europeos. Principalmente, en Inglaterra, Francia y Alemania. Se pedía la cumplimentación de un cuestionario "estandarizado", más sobre aspectos objetivos (o de hechos) que subjetivos (actitudes, opiniones, valores). Incluía información variada sobre las condiciones de vida y de vivienda de la clase trabajadora, preferentemente. También, de su práctica religiosa, escolarización, hábitos de higiene y de salud, en general. Los "entrevistadores", o personas responsables de su administración, obtenían la información mediante la observación "directa" de los barrios obreros y la proporcionada "verbalmente" por los propios afectados o por terceros (empresarios, personal escolar, sanitario, religiosos). En el desarrollo de los censos de población (el primero data de 1801 en Inglaterra y Francia; en España, de 1857) y en la elaboración de los "cuestionarios" tuvo una gran repercusión -destacada por Kovaliova (1989) y Garrigós (2003)- el estudio de John Sinclair, The statistical account of Scotland (1791-1825). Una monumental investigación, de 21 volúmenes, sobre los problemas de la población rural en Escocia. La información se obtuvo de un cuestionario diseñado ex profeso. Contenía 116 preguntas referentes a diversas características sociodemográficas de la población (sexo, edad, ocupación, mortalidad, práctica religiosa), de su entorno (orografía, recursos minerales y agrícolas) y de la actividad económica de la región (desempleo, producción agrícola, ganadera). Para su realización, el autor contó con la colaboración del clero escocés, que le proporcionó información de 881 parroquias de Escocia. Pero no es a esta investigación, sino a la realizada por Charles Booth, de 1889 a 1897 (Labour and the life of the people of London. Macmillan and Co. Londres, 1902-1903), a la que Easthope (1974) sitúa en los orígenes de la encuesta moderna. Esta investigación fue realizada y financiada por el mismo Booth, un acaudalado naviero británico. Describe, con minuciosidad, las condiciones de vida de la población traba-

Capítulo 1: La encuesta como estrategia de investigación social

15

jadora londinense. La información se obtiene del uso combinado de distintas fuentes de datos: el Censo de Población británico de 1881; informes policiales, de organizaciones de beneficencia, de inspectores escolares y sanitarios; la observación directa, por el mismo autor, de varios barrios obreros, donde vivió durante algún tiempo; la realización de entrevistas a hombres de negocios ya asistentes escolares (school attendance officers), para indagar en las condiciones de vida de los escolares y de sus familias. Además, procedió a la selección aleatoria de representantes de familias de los diferentes grupos sociales, excluyendo al inferior. I A Booth se le reconoce el acierto de perfeccionar "la metodología de sondeos, rechazando la ayuda de los intermediarios -observadores de la clase media- y apelando directamente a los obreros, cuya situación estudiaba" (Kovaliova, 1989: 131). El hecho de haber entrevistado directamente a las familias le convierte en "uno de los primeros en llevar a cabo una encuesta mediante entrevista cara a cara" (De Leeuw y Collins, 1997: 199). Además, se le atribuye la introducción de "un estándar científicamente definido de necesidades básicas con respecto a los que medir la incidencia de la pobreza" (Plat, 2000: 85). En 1901, también en la editorial Macmillan, se edita una investigación similar llevada a cabo por uno de los seguidores de Booth: Benjamín Seebohm Rowntree. El estudio de la pobreza ahora se circunscribe a la ciudad de York, de donde era originario el autor. Se edita con el título Poverty. A study of town life. El cuestionario que se aplicó incluyó, igualmente, información descriptiva variada, referida a las condiciones de trabajo (salarios, jornada laboral) y de vida (características de las viviendas, condiciones de higiene, de salubridad, necesidades alimenticias), de las clases sociales más desfavorecidas en la Inglaterra de finales del siglo XIX. Distinguió la pobreza primaria (familias que carecían de recursos para cubrir las necesidades mínimas) de la secundaria (que disponían de recursos suficientes, pero los malgastaban, quedándose en la pobreza). Otra aportación notoria fue la obra de Fréderic Le Play, Les ouvriers européens (su primera edición, de 36 monografías, data de 1855; la segunda, en seis volúmenes, de 1877 a 1879, e incluye 57 monografías de familias). Una investigación que ha sido calificada por Nisbet (1966: 61) como "el primer trabajo sociológico genuinamente científico del siglo XIX", Y que puede encontrarse recensionada en la monografía de Garrigós (2003). Destaca por la elección de la familia como unidad de observación. Le Play describe las características externas y "morales" (sentimientos, valores, deseos) de varias familias obreras (de trabajadores de la industria, la agricultura, la artesanía y el comercio), con las que convivió, él o sus colaboradores (también ingenieros de minas), en sus viajes por varios países europeos (España, Inglaterra, Francia, Suiza, Austria, Hungría, Prusia, los Países Nórdicos e, inclusive, Rusia). Un total de 22 familias, en cuya selección se primó que fuesen "representativas" de una población concreta. Los "encuestadores" o colaboradores debían permanecer con la familia de 8 a 10 días. Durante ese tiempo de convivencia cumplimentaban un cuestionario con preguntas referidas a vivienda (muebles, utensilios, animales domésticos, propiedades familiares), hábitos alimenticios y de trabajo de los miembros de la familia. Esta infor-


.lU

lVi eloaos

ae encuesta

mación recabada mediante observación directa, por los colaboradores, se complementó con la obtenida de la interacción y entrevista a los integrantes de la familia. También se interrogó a personalidades de la localidad, de gran ayuda para la selección de familias "representativas". Otro de los defensores de extraer la información de los propios trabajadores, para saber de sus condiciones de vida y de trabajo, fue Karl Marx. A él se le atribuye la primera encuesta por correo, que data de 1880. Cuando envía 25.000 cuestionarios a obreros franceses, pensaba que éstos eran quienes mejor podrían describir sus condiciones sociolaborales. No obstante, la respuesta a esta primera iniciativa fue mínima. La investigación quedó paralizada. Más éxito tuvo otro de los padres fundadores de la sociología: Max Weber. Aunque su obra fue determinante en el desarrollo de la metodología cualitativa, realizó una importante contribución empírica al desarrollo de la encuesta. Principalmente, en dos aspectos metodológicos clave: la correcta selección de los informantes y la mejora del cuestionario. Sus aportaciones han sido resaltadas por Lazarsfeld y Oberschall (1965), y cabe sintetizarlas en las cuatro que se exponen a continuación. 1. Su participación en una investigación sobre las condiciones del trabajo rural en Alemania, promovida por la Verein für Sozialpolitik, una asociación creada en 1892 por un grupo de profesores universitarios, preocupados por el creciente antagonismo de los trabajadores alemanes (organizados en sindicatos socialistas) hacia el Estado alemán. Además de solicitar reformas sociales, querían minimizar la influencia del pensamiento marxista en los trabajadores. Algo más de 3.000 terratenientes recibieron un cuestionario detallado para que describiesen su situación particular. El 700/0 lo respondió. Asimismo, se enviaron 600 cuestionarios a personas que se creía ofrecerían una visión más general. Aproximadamente el 500/0 lo devolvió rellenado. Era costumbre de esta asociación clasificar las respuestas por región geográfica y pedir a cada miembro que, voluntariamente, realizase cada serie. Weber hizo el informe de Prusia del Este, en 1892, y fue el único que efectuó un análisis comparativo. Comparó su material con los resultados de estudios anteriores. El propósito era proporcionar una perspectiva histórica. De este estudio Weber criticó que sólo se utilizase, como informantes, a los terratenientes; además del contenido del cuestionario: demasiado énfasis en las condiciones materiales de los trabajadores y escaso análisis de los aspectos subjetivos. 2. En 1893 Weber lleva a cabo otra encuesta, sobre trabajadores del campo, encargada por el Congreso Social Evangélico. Éste demandaba un mayor conocimiento de las condiciones de vida de los grupos de población de renta más baja. Envió 10.000 cuestionarios a clérigos por dos razones principales: una, el Congreso tenía un registro central de todas las parroquias; dos, pensaba que éstos podrían mejor informar de problemas psicológicos. El cuestionario fue más breve que el de la encuesta anterior. Se centró más en la movilidad social y laboral, y en los orígenes de los distintos grupos de campesinos. También, quiso conocer las actitu-

Capítulo 1: La encuesta como estrategia de investigación social

17

des de los trabajadores hacia formas no tradicionales de trabajo. Le fueron deyueltos 1.000 cuestionarios. Los resultados de esta investigación se publicaron en periódicos y en informes del Congreso Social Evangélico. 3. En 1907 Weber participó en una serie de investigaciones, efectuadas por Verein für Sozialpolitik, sobre la selección y adaptación de los trabajadores en las grandes industrias. Esta vez la información ~e obtuvo combinando datos disponibles, en las oficinás de las fábricas seleccionadas, con observación participante y entrevistas "directas" a los trabajadores. Para estas entrevistas se diseñó un cuestionario de 27 preguntas relativas a la ocupación de los padres, actividades de tiempo libre, elección ocupacional o metas en la vida. 4. Sobre esta misma temática, en 1908 Weber realiza un estudio detallado de la productividad de los trabajadores en una fábrica textil, que pertenecía a la familia de su esposa. Los resultados los publica en un informe que titula La consideración de los aspectos psicofísicos del trabajo en la industria textil en Alemania al Este del Elba. Este estudio destaca por su cuidadoso análisis estadístico de los resultados: la tabulación cruzada. También, porque demuestra que las personas de renta baja pueden ser "buenos" informantes. Otro ejemplo ilustrativo de la prevalencia de los sondeos a la población trabajadora en la investigación empírica alemana es el estudio de Adolf Levenstein, de 1912, con el título genérico La cuestión obrera. Describe la situación de los obreros de la industria alemana, a partir de los resultados de una encuesta por correo, enviada a 8.000 obreros, de tres categorías (de la industria minera, metalúrgica y textil), de ocho regiones industriales, a razón de 1.000 cuestionarios por cada región, desde 1907 a 1911. Para aquel entonces, obtuvo un porcentaje de cuestionarios devueltos elevado: el 63% de los enviados. Pero la encuesta carecía de rigurosidad. Presentaba serios errores (Lazarsfeld y Oberschall, 1965; Kovaliova, 1989), desde la óptica actual. De ellos destacan los referidos a la población analizada. En un principio, los cuestionarios se enviaban a amigos y conocidos entre los obreros. Después se pedía, a quienes respondían, que lo distribuyesen entre sus conocidos o amigos. El cuestionario incluía 26 preguntas clasificadas en cuatro apartados. Uno, de datos personales: nombre, edad, ocupación, estado civil, número de hijos, ingresos (remuneración, duración,jomadalaboral). Dos, de actitud ante el trabajo: cansancio, monotonía, tipo de remuneración que preferían, los pensamientos durante el trabajo, esperanzas y deseos relacionadoscon el trabajo. Tres, de asuntos culturales y políticos: lectura, intereses políticos, creencias religiosas. Y cuatro, de problemas relacionados con el ocio. En su análisis, Levenstein siguió la recomendación de Weber, publicada en su artículo, de 1909, "Zur methodik sozialpsychologischer enqueten und ihrer bearbeitung" ("Sobre la metodología de las encuestas socio--psicológicas y sobre su análisis"). En él le pedía que hiciese un análisis estadístico de sus datos, indicándole la manera de hacerlo. Levenstein siguió su asesoramiento, aunque se negó a que su codificación y tabulación fuese comprobada por estudiantes y profesores universitarios, como le pedía

'''-.


18

Métodos de encuesta

Weber. A destacar, su uso de tipologías en la clasificación de los obreros. Si bien, Lazarsfeld y Oberschall (1965: 191) puntualizan: Puede legítimamente considerarse uno de los más tempranos esfuerzos para estudiar las actitudes. Pero ni él ni Weber hicieron explícita la idea de que las actitudes pueden medirse, que los materiales de cuestionario pueden ser combinados para formar variables a lo largo de los cuales clasificar a la gente.

Ninguna de las encuestas sociales aquí expuestas se adecuan a lo que hoy se entiende por encuesta ("encuesta por muestreo"). Más bien se asemejaban a censos. Intentaban cubrir las poblaciones totales de las comunidades que se analizaban. Aunque tienen un importante valor como primera aproximación al estudio empírico de la sociedad de su tiempo. En concreto, de la situación de la clase trabajadora. Los avances de la encuesta precisó de aportaciones varias, procedentes de distintos ámbitos de conocimiento. En 1883, Galton delimita (en Inquiries into the human faculty) algunos requisitos básicos de los cuestionarios. Éstos han de cubrir los objetivos de la investigación siendo, al mismo tiempo, fáciles de entender y de contestar. Pero los beneficios más notorios proceden del área de la estadística, de la aplicación de la teoría de la probabilidad en la selección de las unidades de observación. Arthur L. Bowley, el primer profesor de estadística en la London School of Economics and Political Science, fue quien introdujo el muestreo probabilístico en la práctica de encuesta. A él se le atribuye la primera encuesta que se realiza mediante selección aleatoria de los informantes. Se trata de la investigación que realiza junto con A. R. Burnett-Hurt, financiada por organizaciones caritativas, y que publica en 1915 con el título Livelihood and poverty (en la editorial londinense Bell). En publicaciones precedentes había defendido la necesidad de aplicar muestras aleatorias representativas en la investigación mediante encuesta. A destacar: • "Presidential address to the Economic Section of the British Association for the Advancement of Science", de 1906 (Journal ofthe Royal Statistical Society, 69: 540-558). • "Working class households in Readings", de 1913 (Journal olthe Royal Statistical Society, 76: 672-691). • O su texto sobre la medición de los fenómenos sociales, de 1915, The nature and purpose of the measurement 01 social phenomena (~ S. King and Son, Ltd., Londres), con el que contribuyó a la definición de los parámetros de calidad de los datos de encuesta, además de al desarrollo de la encuesta por muestreo. Aunque fue A. N. Kiaer (el director de Norwegian Bureau of Statistics de Oslo) quien primero defendió la exigencia de que la encuesta se hiciera sobre muestras representativas, en 1897, en su libro Representative method ofstatistical surveys (en la editorial Kristinia, de Oslo). En él expone que, de la información extraída de una muestra relativamente pequeña de la población, pero cuidadosamente seleccionada

Capítulo 1: La encuesta como estrategia de investigación social

19

mediante algún procedimiento aleatorio, pueden estimarse los parámetros poblacionales, sin necesidad de elaborar un censo completo de la población, como hasta entonces se creía. Si bien, ello exige que la muestra sea "representativa";.que constituya una representación en miniatura de la población de estudio. Además, propone un procedimiento para evaluar los resultados de encuesta: la replicación. El repetir la operación de muestreo, el extraer una serie de submuestras comparables. Dos años ántes, en 1895 introdujo, por vez primera, el término investigación representativa, en un informe para el Instituto Nacional de Estadística (ISI: International Statistical Institute) que, a finales del siglo XIX, era el centro de debate para estadísticos oficiales. La propuesta de Kiaer de aplicar la estratificación en la selección aleatoria de la muestra fue posteriormente desarrollada por Jerzy Neyman, en 1934. En un artículo, ya clásico: "On the different aspects of the representative method: the method of stratified sampling and the method of purposive selection" (Journal ofthe RoyalStatistical Society, 97: 558-606). Junto con la estratificación óptima y el muestreo por conglomerados, en él desarrolla el muestreo en poblaciones finitas, la distribución muestral (la serie de resultados posibles en el diseño de la muestra) y el error de muestreo (o variabilidad de las estimaciones muestrales). Demuestra que este último puede medirse calculando la varianza del estimador. A partir de los años cuarenta del siglo xx se diferencia el error de muestreo del error total de encuesta. Con posterioridad, la replicación adquiere un nuevo desarrollo de la mano del estadístico hindú ~ C. Mahalanobis. En dos de sus publicaciones principales, de 1944 ("On the large scale sample surveys". Royal Society Phil. Trans. B., 231: 329-451) y de 1946 ("Recent experiments in statistical sampling in the Indian Statistical Institute". Journal ofthe Royal Statistical Society, 19: 325-378), aboga por el uso de la replicación. A lo que denomina "interpenetrar muestras", para medir la precisión de estimaciones derivadas de una encuesta. En esta última publicación también enfatiza la necesidad de incluir los "errores humanos" (la variabilidad introducida por entrevistadores, codificadores y supervisores), junto a los de muestreo, en la estimación de la precisión de una encuesta. La aportación de estos estadísticos notorios es continuada por la publicación de célebres manuales de muestreo. Entre los cuales sobresalen: • F. Yates (1949): Sampling techniques ofcensuses and surveys. Griffin. Londres. • W. E. Deming (1950): Sorne theory of sampling. Wiley. Nueva York. • M. H. Hansen, W. N. Hurwitz y W. G. Madow (1953): Sample survey methods and theory. Wiley. Nueva York. • W. G. Cochran (1953): Sampling techniques. John Wiley and Sonso Nueva York. • ~ \Z Sukhatme (1953): Sampling theory ofsurveys with applications. The lndian Society of Agricultural Statistics. Nueva Delhi. • L. Kish (1965): Survey sampling. John Wiley and Sonso Nueva York. En todos ellos se mide el efecto del diseño de la muestra en la imprecisión de las estimaciones de encuesta. El primero, destaca por su influencia en la Encuesta Mun-


lY.l.t;;tUUU~·

ue encueSla

dial de Población de 1950. Pero, el primer manual de Cochran (segunda edición en 1963, tercera en 1977) fue, de acuerdo con O'Muircheartaigh (1997: 7) el de mayor éxito, "el más matemático y menos influido por intereses no estadísticos y no de muestreo". No obstante, habría asimismo que destacar el texto igualmente clásico de Kish de 1965 (de gran repercusión en España), que ha tenido una nueva edición, aún reciente, de 1995, en la misma editorial. Desde la psicología, la aportación al desarrollo de la investigación mediante encuesta se focaliza en la medición de los conceptos teóricos, en su fiabilidad y validez. Entre las primeras publicaciones que comprueban los efectos de cambiar la formulación de la pregunta mediante experimentos destacan: • A. Hobson (1916): "The use of the correspondence method in original research". Journal o/ the American Statistical Association, 15: 210-218. Contrasta diferentes tipos de cuestionarios y.su formulación en encuestas por correo. • B. Muscio (1917): '·'The influence of the form of a question". The British Journal of Psychology, 8: 351-389. Sobre medición de actitudes fueron clave las aportaciones de los siguientes investigadores, quienes demuestran que no sólo lo objetivo, sino también lo subjetivo (las actitudes), puede medirse con preguntas estandarizadas, en un formato de encuesta: • E.S. Bogardus (1925): "Measuring social distances". Journal of AppliedSociology, 9: 299-308 / (1933): "A social distance scale". Sociology and Social Research, 17: 265-271. • L. L. Thurstone (1928): "Attitudes can be measured". American Journal of Sociology, 33: 529-544/ (1931): The measurement o/social attitudes. University of Chicago Press. Chicago. • L. L. Thurstone y E. J. Chave (1929): The measurement o/attitudes. University of Chicago Press. Chicago. • R. Likert (1932): "A technique for the measurement of attitudes". Archives of Psychology, 140: 44-53. • L. Guttman (1944): "A basis for scaling qualitative data". American Sociological Review, 9: 139-150/ (1947):-"The Cornell techniques for scales and intensity analysis". Educational and Psychological Measurement, 7: 247-280. • C. E. Osgood y E H. Tannembaum (1955): "The principIe of congruence in the prediction of attitude change". Psychological Bulletin, 62: 42-55. • C. E. Osgood, G. J. Suci y E H. Tannenbaum (1957): The measurement o/meaning. University of Illinois Press. Urban II!. A finales de los años veinte y principios de los treinta del siglo xx comienzan a aparecer, en Estados Unidos, empresas de investigación de mercados para la investigación comercial y la realización de sondeos preelectorales. Precisamente fue el acierto en la

Capítulo 1: La encuesta como estrategia de investigación social

21

predicción de un resultado electoral, las elecciones presidenciales de 1936, lo que supuso un. fuerte impulso a la encuesta mediante muestreo. Una macroencuesta, por correo, para la revista The Literary Digest (que defendía la práctica de a mayor número de personas encuestadas, mejor es la predicción), a miles de suscriptores con teléfono fracasó en su predicción electoral, frente a una encuesta más modesta bajo la dirección de Gallup y Crossley. Esta última encuesta predijo la victoria de Roosevelt, tras sólo con haber entrevistado a 1.500 votantes norteamericanos, elegidos al azar, y establecidas unas cuotas por edad y sexo. Mostró que una muestra pequeña, pero cuidadosamente extraída, podía reflejar mejor la realidad social que una gran encuesta de "una muestra parcial, con poco o ningún esfuerzo para alcanzar porcentajes de respuesta razonables" (Rossi, Wrigth y Anderson, 1983: 5). Los encuestados para The Literary Digest no fueron aleatoriamente seleccionados del conjunto de electores norteamericanos, sino extraídos del listín telefónico de suscriptores a la revista y de propietarios de automóviles. Ello introdujo un importante sesgo en los resultados del sondeo. Según estimaciones de Biemer y Lyberg (2003), en aquellas fechas sólo un 350/0 de los hogares norteamericanos disponían de teléfono. Además, esta población se caracterizaba por ser desproporcionadamente republicana. Lo que explica la preferencia de sus sondeados por el republicano Landon. Se excluyó a las personas de nivel de renta más bajo, que fueron quienes más votaron por el programa de recuperación económica defendido por Roosevelt. A este importante error de cobertura hay que sumar otros, igualmente decisivos, com~ el relacionado con el bajo porcentaje de respuesta obtenido. Tan sólo un 220/0 de los diez millones de cuestionarios enviados fueron contestados y devueltos por correo. A partir de entonces, los sondeos realizados por Gallup, Crossley y Ropper adquieren un mayor protagonismo en el análisis de la opinión pública. Comienzan a expandirse los institutos de opinión pública en Estados Unidos y Gran Bretaña. Asimismo, Gallup volvió a acertar en su pronóstico electoral, con muestreo por cuotas, en las elecciones presidenciales de 1940 y 1944. Pero no en 1948, debido a la no correspondencia de los datos del Censo de Población de Estados Unidos de 1940, utilizado para el muestreo por cuotas, con la población real de 1948. La Segunda Guerra Mundial supuso, además de pérdida de población, el desplazamiento de habitantes del campo a las ciudades, donde se registró una mayor preferencia por los demócratas. En el período de 1936 a 1949 Gallup llevó a cabo aproximadamente 400 experimentos sobre los efectos de la redacción de preguntas en cuestionarios. Muchos de estos experimentos fueron diseñados por Hadley Cantril, quien en 1940 crea The Office of Public Opinión Research, en la Universidad de Princeton. Quería que éste se convirtiera no sólo en centro de referencia en el estudio de la opinión pública y de las técnicas a seguir en su análisis, sino también en un archivo de sondeos de opinión para cualquier investigador que estuviese interesado. Junto con sus colaboradores publica, en 1944, en la editorial de la Universidad de Princeton, un compendio de estudios sobre el diseño de la encuesta, su ejecución y análisis, y que titula Gauging public opinion. De los temas en él tratados destacan, en especial, los referidos a la formulación de la§ preguntas, su significado, el efecto de las baterías de preguntas y la medición de la in-


22

Métodos de encuesta

tensidad de las opiniones. Además, se analizan los sesgos debidos al entrevistador y a su formación. Por aquel entonces, Paul E Lazarsfeld funda The Bureau of Applied Social Research, en la Universidad de Columbia. Anteriormente había creado The Office of Radio Research, en la Universidad de Newark. En 1944, Lazarsfeld publica, en la editorial de la Universidad de Columbia, una investigación que había realizado junto con H. Gaudet y B. Berelson: The people's choice: how the voter makes up his mind 'in a presidential compaing. Esta publicación adquiere una gran trascendencia en la investigación social por ser pionera en tres aspectos clave para la investigación mediante encuesta: 1. El estudio de la conducta de voto mediante encuesta por muestreo (desde la sociología académica). 2. La aplicación de una encuesta panel (un mismo cuestionario se pasa a la misma muestra de individuos en varias fechas sucesivas). La investigación tiene por objetivo principal el análisis de las intenciones de voto de los electores del condado de Erie (Ohio), en las elecciones presidenciales de 1940. Para ello, los autores pasaron tres veces un mismo cuestionario a una muestra de electores extraída al azar. La primera vez, antes del nombramiento de los electores. La última, momentos antes de la elección. Mediante este seguimiento de la muestra querían comprobar el efecto de la campaña electoral en la intención de voto. Unas mismas personas son seguidas en el transcurso de la campaña electoral. A su vez, utilizaron otras tres muestras como grupos de control, con el propósito de comprobar los efectos de aplicar varias veces el mismo cuestionario a la muestra principal. 3. El análisis de datos de encuesta. En concreto, por su introducción de las tablas cruzadas, de más de dos variables, y por su contribución a la realización de tipologías. Pese a los aciertos de esta investigación, se observan algunas debilidades metodológicas. Rossi, Wright y Anderson (1983: 6) critican la no aplicación de modelos de inferencia estadística. Ninguna prueba de significatividad estadística ni estimación de intervalos de confianza aparecen en la monografía del estudio. Asimismo, censuran el procedimiento de muestreo seguido: "visitar cada cuatro viviendas". Durante la Segunda Guerra Mundial se crea The National Opinion Research Center (NüRC) y un departamento de investigación del ejército norteamericano. Este último bajo la dirección de Samuel A. Stouffer de 1941 a 1945. Entre sus colaboradores estaban los sociólogos Louis Guttman, Edwards A. Suchman, Robin Williams, Shirley Star o John Clausen; junto con los psicólogos Carl Hovland, Arthur Lumsdaine y William Bennet, quienes después proseguirían su andadura en distintos departamentos universitarios. Este equipo investigador llevó a cabo una investigación, de gran envergadura, sobre la moral, opiniones y actitudes del soldado americano durante la Segunda Guerra Mundial: The American Soldier (1949). Éste es el nombre comúnmente utilizado en

Capítulo 1: La encuesta como estrategia de investigación social

23

referencia al susodicho estudio. Sus resultados fueron publicados por la editorial de la Universü)ad de Princeton en cuatro volúmenes, de 1947 a 1950, bajo el título genérico Studies in social psychology in World War ll. Su propósito inicial era eminentemente práctico: proporcionar información a las autoridades gubernamentales de las opiniones y actitudes de su personal militar. Pero acabó teniendo una gran repercusión en el desarrollo de la metodología de encuesta. En especial, en el diseño de las encuestas autocumplimentadas (a una muestra aleatoria de 5.000 soldados se les pidió que rellenasen un cuestionario diseñado al efecto), en la práctica de formular varias preguntas para medir un mismo concepto teórico y en el análisis de los datos de encuesta. Robert K. Merton y Paul F. Lazarsfeld (1950), quienes habían estado muy próximos al equipo investigador, aunque formalmente no participaron en el estudio, se refieren a esta investigación como el primer trabajo que capacita al lector no especializado en la investigación socio-psicológica, para aprender los detalles de los métodos más avanzados en el campo, relativamente nuevo, de las encuestas de actitudes. Platt (1996) destaca su contribución a la consideración de la encuesta como el método líder en la recogida de información. Pese a los contenidos dados por Hovland, Lumsdaine y Sheffield, y a los comentarios repetidos de Stouffer sobre la superioridad del método experimental. La monografía de Merton y Lazarsfeld (1950) sobre la investigación tuvo mucho que ver en ello, por la orientación que se hizo de la encuesta y de su accesibilidad. En los años cincuenta aparecen dos monografías sobre la entrevista, de gran influencia en la práctica de encuesta mediante entrevista: • H. Hyman y colaboradores (1954): Interviewing in social research. Chicago University Press. Chicago. Analiza cómo las expectativas del entrevistador afectan a los datos de encuesta. • R. L. Kahn y C. F. Cannell (1957): The dynamics of interviewing: theory, techniques and cases. John Wiley and Sonso Nueva York. Destaca la responsabilidad del entrevistador en el resultado de la encuesta. Ambas consolidan los fundamentos de la entrevista de encuesta, llamada la entrevista estandarizada. Del entrevistador se espera que se convierta en un "instrumento neutral"; en un profesional que se limite a leer las preguntas del cuestionario tal y como están redactadas, sin implicar ningún favoritismo, sorpresa o satisfacción hacia alguna respuesta concreta. "El entrevistador 'ideal' es descrito como una persona bastante estructurada, reforzado por una formación rigurosa y con ninguna característica de rol extra que pudiese ser saliente para las preguntas que se formulan" (O'Muircheartaigh, 1997: 13). Pero no fueron éstas las primeras monografías sobre la entrevista de encuesta. En 1934 aparece una edición revisada (en la editorial Harper, de Nueva York) de How to interview, de w. ~ Bingham y B. ~ Moore. En esta publicación se defiende, igualmente, la necesidad de estandarizar la actuación del entrevistador en la encuesta. Además, se multiplican los artículos en los que se analizan los efectos de la actuación del


24

Métodos de encuesta

entrevistador en los resultados de encuesta, y se establecen pautas para su mejora. Algunos de los más citados son:

• S. A. Rice (1929): "Contagious bias in the interview". American Journal of Sociology, 35: 420-423. Analiza posibles influencias de los entrevistadores que "contaminan" la encuesta. . • J. Wechsler (1940): "Interviews and interviewers". Public Opinion Quarterly, 4: 258-260. Sobre el papel de los entrevistadores durante la entrevista. • D. Katz (1942): "Do interviewers bias poll results?". Public Opinion Quarterly, 6: 248-268. Comprueba el efecto diferencial del estatus de los entrevistadores. Los llamados de "cuello blanco" registran una mayor proporción de actitudes y opiniones conservadoras que los de "cuello azul" o de clase trabajadora. • D. Williams (1942): "Basic instructions for interviewers".- Public Opinion Quarterly, 6: 634-641. Detalla las instrucciones seguidas por los entrevistadores que trabajan para The National Opinion Research Center (NORC). . • M. T. Orne (1969): "Demand characteristics and the concept of quasI-controls", en R. Rosenthal y R. L. Rosnow, Artifacts in behavioral research. Academic Press. Nueva York. Analiza cómo las características de la demanda afectan a la conducta de los entrevistadores y los entrevistados. Ésta es la época de mayor expansión de la encuesta como estrategia metodol?gica. Coincide con los años de hegemonía delfuncíonalísmo en la sociología norteamencana. Wells y Picou (1981) ponen cifras a dicha expansión: el 48,2% de l~s. artículos publicados en la revista The American Sociological Review, de 1936 a 1949, utilIZan la encuesta. Entre 1950 y 1964 el porcentaje asciende al 70,50/0. Entre 1965 y 1978, hasta el 80,30/0 . L~s métodos de interpretación descienden, por el contrario, del 50,4 al 27 y 17,1 %, ~~spectI­ vamente. En la revista American Political Scíence Review, WaW.ke (1979) contabilIZa que la mitad de los 180 artículos sobre comportamiento político se basan en datos de encuesta. Un 20% complementa la encuesta con otras estrategias de investigación. Asimismo, se suceden las publicaciones que tratan de los "errores" ~e .l~ encuesta y, en general, de la calidad de sus dato~. Cronol~gicamen~e, d.esde sus 1ll1CIOS hasta el momento presente, una selección abreVIada de dIchas publicaCIones, de acuerdo con su impacto en la literatura de encuesta, incluye las siguientes: • J. L. Gillin (1915): "The social survey and its further developme~t".Journalof the American Statistical Association, 14: 603-610. Alerta de los peligros de la falta de control de la calidad de la encuesta. • W. E. Deming (1944): "On errors in surveys". American Sociological Review, 9: 359-369. Lista trece factores que pueden afectar a la calidad de la encuesta. Incluye los errores de muestreo, los debidos a la act~ación del entre~sta~or, al procedimiento seguido en la recogida de datos, al dIseño del cuestIonarlo, a la no respuesta, a la codificación y procesamiento de la información, además de los errores de interpretación.

Capítulo 1: La encuesta como estrategia de investigación social

25

• H. J. Parry y H. M. Crossley (1950): "Validity of responses to survey questions". Public Opinion Quartely, 14: 61-80. Sobre la validez de la medición mediante encuesta. • M. H. Hansen, W. N. Hurwitz y W. G. Madow(1953): Sample survey methods, vol 11. Wiley. Nueva York. Diferencia los errores variables de los sesgos sistemáticos, y propone el concepto de error total de encuesta. • C. F. Cannell y"F: J. Fowler (1963): "Comparison of a self enumerative procedure and a personal interview: a validity study". Public Opinion Quartely, 27: 250-264. Comprueba la validez de la entrevista personal frente al procedimiento "autoenumerativo". • S. Sudman y N. Bradburn (1974): Response efffects in surveys: a review and synthesis. Aldine Publishing Co. Chicago. Un texto clave sobre los efectos de respuesta, en el que se proponen pautas o actuaciones en su resolución. • H. Schuman y S. Presser (1981): Questions and answers in attitudes surveys. Academic Press. Nueva York. A partir de investigación propia (experimentos), complementada por la llevada a cabo por otros investigadores, analizan los efectos debidos a la forma de la pregunta, su redacción y contexto en los resultados de encuesta. • R. M. Groves (1989): Survey errors and survey costs. John Wiley. Nueva York. Un clásico, en la actualidad, que ofrece una revisión comprehensiva de los errores de encuesta y sus causas, relacionándolos con los costes de la investigación. Reconoce que el "coste" es un componente esencial de la calidad de los datos. • L. E. Lyberg y colaboradores (1997): Survey measurement and process control. John Wiley and Sonso Nueva York. Una compilación de artículos sobre las diversas fuentes de error de medición y sus efectos en la calidad de la encuesta. • E E Biemer y L. E. Lyberg (2003): Introduction to survey quality. John Wiley and Sonso Nueva Jersey. Sintetiza las distintas fuentes de error de la encuesta, insistiendo en su visión conjunta. En los últimos años la literatura sobre metodología de encuesta ha crecido enormemente, como puede verse en la bibliografía adjunta al final del libro. Aunque algo extensa y limitada al mundo anglosajón e hispano, no recoge ni siquiera toda la producción habida hasta el presente. En los capítulos siguientes se irá, no obstante, informando de estudios notorios específicos a los distintos aspectos de la encuesta, en cada una de sus fases, y podrá mejor comprobarse cuál es el estado actual de la investigación sobre la encuesta. Además de la decisiva aportación de las nuevas tecnologías en su desarrollo y expansión. Para concluir, se hace una sucinta referencia a los orígenes de la encuesta en España. Se destaca la siguiente relación de fechas de estudios clave, aunque pocos cumplen el rigor metodológico que en la actualidad se exige a la encuesta. • La gran encuesta, a escala nacional, de 1901 a 1902, sobre temas antropológicos y sociales, promovida por la Sección de Ciencias Morales y Políticas del Ateneo


26

Métodos de encuesta

de Madrid. Trata de las costumbres populares y de los tres hechos más característicos de la vida: nacimiento, matrimonio y defunción. R. Salina fue el promotor de la encuesta, pero contó con la colaboración de Puyol, Bernardo de Quirós, García Herreros, Pedregal y Camarón. Fueron devueltos al Ateneo 289 cuestionarios debidamente cumplimentados, distribuidos entre las .distintas provincias españolas. Con anterioridad, y desde 1882, las distintas sociedades antropológicas españolas habían editado cuestionarios, de ámbito local, que ayudasen a la recogida de datos (Lisón, 1968). En 1895, J. Costa dirigió en el Ateneo La encuesta sobre tutela social y, en 1901, promovió, también en el Ateneo, La encuesta sobre oligarquía y caciquismo como forma actual de gobierno en España. Esta última encuesta contó con la colaboración de Pardo Bazán, G. Azcárate, Ramón y Cajal, Unamuno, Pi y Margall. . • En 1904 se crea el Instituto de Reformas Sociales. Desde él se promueven vanos estudios "reformistas" sobre la sociedad española. Destaca la investigación relativa al trabajo en las minas, de 1910, o la primera encuesta a escolares, de Eugenio d'Ors, de 1921. • La encuesta a estudiantes universitarios de Madrid realizada por Manuel Fraga Iribarne y Tena Artigas en 1949. Sus resultados se publican en 1953, en la Revista de Educación y la Revista Internacional de Sociología. • La encuesta a estudiantes universitarios españoles de José Luis Pinillos, de 1955. La primera que incluye preguntas de índole política. • La encuesta a estudiantes de la Universidad de Valencia, de Francisco Murillo Ferrol y José Jiménez Blanco, de 1956. • La encuesta sobre la familia española, de Enrique Gómez Arboleya y Salustiano del Campo, de 1957. La muestra la integran 127 estudiantes en Madrid y 112 en Salamanca. En 1959 se publica con el título Para una sociología de la familia española. • La encuesta sobre la profesión médica en España, de José Mariano López Cepero, Amando de Miguel, Luis González Seara y José Castillo (con el asesoramiento de Juan J. Linz). La muestra la componen 500 médicos, una muestrade élites y un panel de estudiantes de Medicina. • La encuesta a empresarios de Juan Linz (con la colaboración de Amando de Miguel), de 1959. Financiada por la Escuela de Organización Industrial de ~a­ drid. La muestra la forman 460 empresarios. Algunos de los resultados prIncipales del estudio se publican en 1966 con el título Los empresarios ante el poder público . • La primera encuesta de juventud, de 1960 (aunque el período de investigación se extiende de 1958 a 1965). Dirigida por José Mariano López-Cepero, un colaborador de Enrique Gómez Arboleya. Contó con un amplio equipo investigador, entre quienes se encuentra el propio Gómez Arboleya (que se incorpora tardíamente), José Bugeda, José Castillo, Luis González Seara, Juan J. Linz y Amando de Miguel. En el más reciente informe sobre juventud (A. de Miguel,

Capítulo 1: La encuesta como estrategia de investigación social

27

2000), se detalla la relación de todos los participantes en la investigación, sus avatares y los resultados principales del estudio. Esta encuesta, junto a las realizadas por una parte de su equipo investigador (las encuestas a médicos y empresarios antes citadas), representan "el punto de arranque fundamental del análisis 'empírico' de la realidad social española, con nuevos métodos importados en esa época fundamentalmente de Estados Unidos, Francia y tJran Bretaña. Aunque las tres encuestas se llevan a cabo desde Madrid" (J. de Miguel, 1999: 188). • La encuesta a amas de casa, de Juan José Castillo, de 1962, relativa a hábitos de consumo. En 1963 se crea, a instancia de Manuel Fraga Iribarne, el Instituto de la Opinión Pública (que en 1976 se transforma en el actual Centro de Investigaciones Sociológicas). Un centro oficial de investigación sociológica empírica, con clara hegemonía de la investigación mediante encuesta. Dispone de un banco de datos de libre acceso a toda persona interesada en alguna de sus encuestas. La Revista Española de la Opinión Pública se convierte en un medio de difusión de referencia de la investigación en España. Después se transformaría en la Revista Española de Investigaciones Sociológicas (REIS). En la esfera privada comienzan a aparecer institutos de investigación de mercados y de sociología aplicada. En 1958 se crea el Instituto ECO, vinculado a Jesús Ibáñez. En 1965 surge DATA, unido a la figura de Amando de Miguel y Juan J. Linz. Bajo la dirección de Amando de Miguel se realiza el primer informe FOESSA, en 1966, y el segundo, en 1970. Ambos informes son calificados por Lamo de Espinosa (1992: 127-128), como "la prueba de madurez de la sociología española". En concreto, el segundo Informe FOESSA (1970) "se convierte en el mejor de los estudios sociológicos globales y, sin duda, el estudio sociológico sobre la estructura social española más avanzado para la época" (J. de Miguel, 1999: 195). Si bien, padece de problemas de censura al e~iminarse, en su publicación, el capítulo quinto sobre "vida política y asociativa", capItulo que ahora puede leerse en una reciente publicación de Amando de Miguel (2003) sobre el final del franquismo, en el que incluye fragmentos de su diario personal sobre su paso por la cárcel en los últimos años de la dictadura. La serie de informes FOESSA prosigue en años posteriores, pero bajo la dirección de otros investigadores y sin una periodicidad concreta. En el tercero, la encuesta se realiza en 1973, aunque el informe se publica en 1976. El cuarto, entre 1981-1983, dirigido por Juan Linz. El quinto, de mayo a junio de 1995, bajo la dirección conjunta de Miguel Juárez. Con la instauración de la democracia, la encuesta paulatinamente va adquiriendo un mayor protagonismo en la investigación social empírica en España. En 1979, año de elecciones, en España se gastaron ~OOO millones de pesetas en encuestas de opinión (según estimaciones de López Pintor, 1982). Veinte años después, la facturación de estudios cuantitativos asciende a 18.953 millones de pesetas. En el año 2000 a 22.882 millones (Alós, 2001).


28

Métodos de encuesta

1.2. Características esenciales de la encuesta: sus posibilidades y límites La encuesta se presenta como la estrategia de investigación caracterizada por la aplicación de un procedimiento estandarizado para la obtención de informació~ (oral y/o escrita), de una muestra amplia de sujetos. La muestra debe ser representatIva de la población de interés. La información se limita a la delineada por las preguntas que componen el cuestionario precodificado diseñado al efecto. Entre sus características definitorias destacan: a) Su adecuación al estudio de un amplio abanico de cuestiones: aspectos objetivos (de hechos) y subjetivos, no directamente observables (actitudes, valores, opiniones), del presente, pasado y futuro. b) La información se obtiene de las respuestas verbales (oral o escritas) pronunciadas por los encuestados (observación "indirecta"). Por esta razón, cabe la posibilidad de que la información recabada no sea un fiel reflejo de la realidad que se analice. De ahí la exigencia de comprobar "siempre" la veracidad de los datos, antes de su interpretación. c) Para que las respuestas puedan compararse, ha de seguirse un procedimiento estandarizado en la recogida y en el análisis de los datos. La estandarización se justifica por la necesidad de proceder a una medición "científica" de los fenómenos sociales. Ello exige que las diferencias en las respuestas se deban a divergencias entre los encuestados y no a una aplicación diferencial de la encuesta, en cualquiera de sus fases. Han de formularse las mismas preguntas, en el mismo orden, a cada uno de los encuestados. Asimismo, cuando medie la intervención de entrevistadores en la recogida de información, ha de evitarse que su actuación sea desigual con los entrevistados. La estandarización restringe los errores de medición que, como después se verá, afectan directamente a la calidad de la encuesta. d) Las respuestas se agrupan y cuantifican para, con posterioridad, examinar (mediante técnicas estadísticas de análisis) las relaciones entre ellas. El interés del investigador va más allá del individuo del que obtiene la información. Se extiende a la población a la que éste pertenece. Por ello es necesario que la muestra observada sea "representativa" de dicha población. En el tercer capítulo se insiste en la exigencia de seguir un riguroso procedimiento aleatorio de selección de la muestra. Incide, directamente, en la validez externa (o posibilidad de generalización de los resultados de la encuesta) y en la validez de conclusión estadística (o significatividad estadística de los resultados). Ambas están afectadas por el tamaño de la muestra y por el procedimiento seguido en la elección de las unidades que la componen.

Al protagonismo de la encuesta en la investigación social (cuantitativa) contribuye las muchas posibilidades que ofrece al investigador. Comparada con otras estrategias de inv'estigación, la encuesta permite:

Capítulo 1: La encuesta como estrategia de investigación social

29

a) La obtención de información variada de un conjunto amplio de personas, uoicadas en distintas áreas geográficas, en un plazo de tiempo relativamente breve. Depende del método de encuesta aplicado (mediante entrevista personal, telefónica, autoadministrada o una combinación de varios), como se verá en el capítulo 2. Aunque su coste sea elevado, generalmente es inferior al necesario en la materialización de otras estrategias de investigación para la consecución del mismo volumen de información. b) La comparación de datos obtenidos en encuestas· realizadas en fechas, países o áreas geográficas diferentes. Siempre que las encuestas sean "comparables", en su diseño (muestra, cuestionario) y aplicación. Esta posibilidad de la encuesta, propiciada por la estandarización que la define, amplía su utilidad en la investigación social. Parafraseando a López Pintor (1989: 360), la utilidad de la encuesta aumenta "cuanto mayor sea la posibilidad de poder comparar los datos (obtenidos) con otros similares y anteriores en el tiempo o procedentes simultáneamente de otras poblaciones". La consulta de bancos de datos de encuesta es de gran utilidad para la realización de estudios comparativos y de tendencias (longitudinales). c) La generalización de sus resultados, dentro de los límites marcados en el diseño y en cada fase de la ejecución de la investigación. d) La evaluación de la calidad de sus resultados, del cumplimiento de los criterios de validez y de fiabilidad. Dependerá de la magnitud y variedad de los errores que se detecten en su ejecución. Agrupados en los llamados errores de no observación (de no cobertura, de muestreo y de no respuesta) y de observación o medición, como se verá en el apartado 1.S.

Pese a sus ventajas, la encuesta se enfrenta a una serie de obstáculos que impiden su autosuficiencia como estrategia de investigación: a) Al obtener la información de declaraciones verbales, su empleo no se recomienda en poblaciones con dificultades para la comunicación verbal (niños pequeños, personas analfabetas o con escasos recursos lingüísticos). b) La información que se recoge está condicionada por la formulación de las preguntas y la veracidad de las respuestas dadas por los encuestados. e) La mediación del entrevistador (ett-encuestas mediante entrevista cara a cara y telefónica) puede provocar efectos de carácter reactivo en las respuestas de los entrevistados. Los problemas de reactividad pueden, no obstante, reducirse con un buen diseño del cuestionario, junto con una adecuada selección y formación de los entrevistadores (capítulo S). d) Al predominar, en la investigación social usual, las encuestas transversales (la recogida de información se produce en un único momento en el tiempo) sobre las encuestas panel (o encuestación repetida en una misma muestra en tiempos diferentes), y carecer de un control experimental a priori, pueden confundirse simples correlaciones entre variables con verdaderas relaciones causales. Si bien


30

Métodos de encuesta

Capítulo 1: La encuesta corno estrategia de investigación social

31

esta inexactitud puede, en parte, reducirse mediante el uso de técnicas analíticas multivariables (control a posteriori). e) La realización de una encuesta precisa de la organización de un trabajo de campo (para la recogida de información) complejo y costoso. De manera especial, cuando se abarcan segmentos amplios y espaciados de población mediante entrevista personal o cara a cara.

Años más tarde, Sieber (1973) destaca los beneficios mutuos de dicha integración, tanto en las fases exploratorias de la investigación (la elaboración del marco teórico del estudio, el diseño de la muestra y del cuestionario), como en las de verificación (en la validación e interpretación de los resultados de la encuesta). De las contribuciones del trabajo de campo a la investigación mediante encuesta resaltan las siguientes:

El cuadro 1.1 resume las ventajas e inconvenientes principales de la encuesta como estrategia de investigación social.

a) La estructura te6ric~ que guía el análisis de encuesta puede derivarse, total o plenamente, del trabajO de campo cualitativo. Ello exige que éste preceda (en el diseño de la investigación) a la encuesta. b) Los resultados de la encuesta pueden ser validados mediante el recurso a observaciones y entrevistas informales. De manera especial, cuando los resultados que se obteng~n de la encuesta sean inesperados o sorprendentes; o cuando la encuesta conSIga un bajo porcentaje de respuesta. Para que el trabajo de campo cumpla la función de aclaración de los resultados de la encuesta, ésta ha de precederle en el tiempo. c) L.as relaciones ~stadísticas, obtenidas con la encuesta, pueden interpretarse mediante referencIas a observaciones y entrevistas informales. d) El trabajo de campo también ayuda a la identificación de los sujetos más adecuados para ser encuestados. ~ veces, existen suj~tos especiales cuya existencia se descubre gracias a que pr~vIam:~te se ha ~eahzado un trabajo de campo exploratorio. Ello posibilita su mclUSlOn en el dIseño de la muestra a ser encuestada. e) El trabajo de campo contribuye, igualmente, a la elaboración del cuestionario:

CUADRO 1.1. Ventajas e inconvenientes de la encuesta Ventajas

Inconvenientes

• Permite abarcar un amplio abanico de cuestiones (objetivas y/o subjetivas) en un mismo estudio. • Facilita la comparación de resultados, al basarse en la estandarización y cuantificación de las respuestas. • Los resultados del estudio pueden generalizarse dentro de los límites marcados en el diseño y la ejecución de la investigación. • Posibilita la obtención de una información "significativa", cuando no acontezcan graves errores en su realización. • Ventaja económica: puede conseguirse un volumen importante de información a un relativo mínimo coste económico y temporal.

• No recomendable en poblaciones con dificultades para la comunicación verbal. • La información se restringe a la proporcionada por el individuo (a preguntas generalmente cerradas, con opciones de respuesta previamente fijadas). • La mediación del entrevistador puede provocar efectos reactivos en las respuestas. • La carencia de referencias contextuales y vitales de los encuestados limita la interpretación de los resultados. • Acusa imprecisión para el estudio de la causalidad. • El desarrollo de una encuesta amplia resulta complejo y costoso (principalmente en encuestas cara a cara).

1.3. Articulación de la encuesta con otras estrategias de investigación

Algunos de los límites de la encuesta pueden solventarse con el uso complementario de otras estrategias de investigación. En 1955 Vidich y Shapiro defienden la necesidad de integrar la encuesta con el trabajo de campo cualitativo (observación participante, entrevistas informales y uso de datos disponibles). La encuesta contribuye a la generalización de los hallazgos del trabajo de campo. "Sin los datos de encuesta, el observador sólo puede realizar conjeturas sobre su área de ignorancia'" (Vidich y Shapiro, 1955: 31).

• En la formulación de los ítems (o preguntas) que forman el cuestionario. • Clarificando aquellas preguntas que hayan quedado confusas. , En ESp'.aña, I?áñ:~ (1989) se suma a quienes defienden que ha de hacerse -lo que el llama-: mveStIg~clO.n estructural" (normalmente.algún grupo de discusión) como f~se preVIa a la.r~~aclón .de una encuesta. El objetivo es evitar que la encuesta se conVIerta en la opmlOn de qUIen redacta el cuestionario. La indagaci?n_cualitativa ?rev~a a la encuesta proporciona información, de gran ayuda, pa:~ el dISeno ~~l cuestlOnarlO: qué preguntas incluir y qué lenguaje emplear en su redacclOn para fac!htar la comunicación con la población de estudio. Fuller y colaboradores (1993) anaden otras dos contribuciones del grupo de discusión al diseño del cuestionario: a) Ayuda a la identificación de los conceptos teóricos relevantes. b) Colabora en la formulación de hipótesis.

Pero, también ha de destacarse la gran utilidad de la indagación cualitativa en la interpretación y validación de los resultados de encuesta. Desde su experiencia en la


32

Capítulo 1: La encuesta como estrategia de investigación social

Métodos de encuesta

investigación social comparada, Allardt (1990) defiende que por medio de datos cuantitativos el investigador es capaz de explorar los fenómenos estudiados. Si bien, para que los resultados obtenidos sean más interpretables, es preciso que se efectúen estudios cualitativos, mediante los cuales pueda profundizarse en el tema de estudio. En el mismo sentido se pronunció, con anterioridad, Walker (1988: 22), para quien "la investigación cualitativa más generalmente puede ayudar a interpretar, ilustrar y cualificar las relaciones determinadas estadísticamente". Y ésta viene siendo cada vez más extendida en la investigación sociológica contemporánea en los distintos ámbitos de conocimiento. La comprensión de las relaciones estadísticas entre variables precisa de información más detallada de las experiencias vitales de las personas y de su contexto sociofamiliar. Información no siempre obtenida con la aplicación exclusiva de la encuesta. A la inversa, la encuesta favorece -siguiendo a Sieber (1973)- al trabajo de campo cualitativo: a) Identificando los casos relevantes e irrelevantes para ser posteriormente ana-

lizados mediante indagación cualitativa. b) Demostrando la generalidad de las observaciones de campo.

c) Verificando las interpretaciones de campo. d) Aclarando las observaciones "mal interpretadas" o "inexplicables". Por ejemplo, proporcionando información de informantes o individuos que fueron, previamente, pasados por alto.

33

En general, cuando se conjugan estrategias de investigación que provocan un grado diferente de reactividad, en los sujetos observados, se obtienen mejores resultados, si las estrategias que generan mayor reactividad (caso de la encuesta mediante entrevista cara a cara) se aplican con anterioridad a las "no reactivas" (como el uso de fuentes documentales y estadísticas). • Dividir la muestra en submuestras, o extraer varias muestras, y en cada una de ellas aplicar una técnica diferente de recogida de información. De esta forma puede evitarse el efecto directo de un método sobre otro, al no exponerse a los mismos sujetos a más de un método. Para que no acontezcan sesgos derivados del conocimiento, por parte de los integrantes de una de las muestras, de las experiencias de investigación de las otras muestras (si pueden comunicarse entre ellos), conviene aplicar cada técnica de recogida de información de manera escalonada. O bien, proceder de forma rápida y simultánea en las distintas muestras. El requisito de la independencia no es, por el contrario, imprescindible, cuando la finalidad de la articulación metodológica es exploratoria: una primera aproximación a fenómenos poco conocidos, con el propósito de identificar variables relevantes y, a partir de ellas, extraer hipótesis a comprobar en indagaciones empíricas posteriores. El cuadro 1.2 resume ventajas e inconvenientes de la articulación de la encuesta con otras estrategias de investigación.

1.4. Fases de la encuesta

Asimismo, el uso de datos disponibles también puede contribuir a la mejora de la encuesta. Tanto en las fases previas (en la elaboración del marco teórico y en la operacionalización del problema de estudio), como en las posteriores (en la interpretación de sus resultados). Además, son imprescindibles en los estudios comparativos, tanto transversales como longitudinales. Pese a los grandes beneficios de la articulación de la encuesta con otras estrategias de investigación, ha de insistirse en la exigencia de que: a) Mediante las diversas estrategias se estén midiendo, realmente, los mismos con-

ceptos teóricos, si se quiere comparar sus resultados. b) Se practiquen de forma independiente unas de otras. Cuando la finalidad de la

articulación metodológica es comprobar la validez de los resultados, la clave está en garantizar la independencia en todo el proceso. Para ello es de gran utilidad seguir alguna de las actuaciones recomendadas por Brewer y Hunter (1989):

• Realizar la recogida de datos escalonadamente. De manera que la información que sea más vulnerable a la influencia del investigador, o de los sujetos analizados, sea recabada primero.

Todo proceso de investigación comienza con unalase inicial de formulación del problema de investigación. "No importa en qué problema quieras trabajar y no importa qué método eventualmente vayas a utilizar, tu trab'ajo empírico deberá comenzar con una consideración cuidadosa del problema de investigación" (Simon, 1978: 98). A veces, es la propia entidad o institución que financia la investigación quien propone el problema o tema de estudio. En otras ocasiones, es el propio investigador quien lo sugiere, en respuesta a sus inquietudes intelectuales o a intereses atribuidos a quienes se espera que financien la encuesta. Sea como fuere, la idea o problema de investigación se presenta, al principio, vaga y genérica. El investigador deberá, después, precisarla y configurarla en un diseño de la investigación. Para lo cual tendrá que adentrarse en el campo concreto de conocimiento donde se ubique el problema en cuestión. A tal fin, una actuación exigida es la revisión bibliográfica. Ésta ha de ser exhaustiva, refiriéndose no sólo al tema concreto de estudio, sino también a otros con él relacionados, que puedan orientar en su indagación. Esta revisión de temas relacionados adquiere mayor relevancia, cuando apenas se encuentre bibliografía (teórica y metodológica) específica del tema en cuestión. Ya sea por su carácter novedoso, ya por su escasa repercusión en la trayectoria investigadora precedente.


34

Métodos de encuesta

Capítulo 1: La encuesta como estrategia de investigación social

CUADRO 1.2. Ventajas e inconvenientes de la articulación de la encuesta con otras estrategias de investigación Ventajas

Inconvenientes

• Al cubrir más dimensiones de la realidad social, se consigue una información más profunda y diversificada. • Mejora la configuración del marco teórica de la investigación y su operacionalización (la identificación de conceptos teóricos y su traducción en hipótesis). • Enriquece el diseño del cuestionario: qué preguntas incluir y cómo redactarlas. • Ayuda a la identificación de sujetos de ÍUterés para ser encuestados (diseño de la muestra). • Amplía la interpretación y validación de los datos de encuesta (cuando se llega a los mismos resultados).

• Supone un mayor coste económico y temporal que obtener la información por una única vía. • Mayor dificultad para repetir la investigación. • Precisa de un equipo investigador con formación adecuada en las distintas metodologías. • La aplicación de una técnica de recogida de información anterior puede sesgar los datos que se recaben por otras técnicas posteriores(1). • Problemas de comparabilidad de los resultados, al estar afectados por diferentes fuentes de error (si éstas no han sido debidamente controladas). • La incompatibilidad metodológica de algunos métodos(2).

(1) Bien porque la experiencia alcanzada con el primer método puede llevar al investigador a utilizar el segundo de forma diferente, e inclusive mejor; bien debido a la influencia en los sujetos (a la que ya se ha hecho mención). (2) La principal objeción a la combinación metodológica con frecuencia se expresa en términos de "pertinencia epistemológica". Autores como Blaikie (1991) consideran a ésta la barrera fundamental para integrar formas de conocimiento que él califica "incompatibles".

El propósito de dicha revisión bibliográfica Dankhe (1989) lo resume en uno fundamental: obtener información para, a partir de ella, analizar y discernir si la teoría existente y la investigación previa sugieren una respuesta (aunque sea parcial) a las preguntas de investigación, o una dirección a seguir en su estudio. Más concretamente, la revisión bibliográfica contribuye a: a) La estructuración de la idea originaria del proyecto de investigación. Lo contextualiza en una determinada perspectiva teórica y metodológica. b) Inspirar cómo diseñar la encuesta, considerando la experiencia de otras encuestas similares. Se quiere:

• Prevenir posibles errores cometidos en estudios anteriores.

35

• No ser redundantes. Bien planteando otros interrogantes para cubrir aspectos menos observados; bien tratando el mismo tema, pero dándole un enfoque diferente. Excepto que se quiera realizar un estudio comparativo. Éste precisa de la replicación exacta del estudio anterior, con el cual se pretende comparar los resultados. En todo caso, con la encuesta se desea avanzar en el conocimiento del problema de investigación. • Extraer ideas para el diseño de la muestra y del cuestionario. En el capítulo 4 se insiste en la importancia de revisar encuestas que hayan abordado el tema de estudio, antes de proceder a redactar las preguntas del cuestionario. Además de la exigida revisión bibliográfica, la concreción y estructuración del problema de investigación requiere el complemento de indagaciones exploratorias. Puede consistir en: a) Discutir el tema con amigos, colaboradores o con expertos en dicho tema. Éstos pueden aportar ideas de qué aspectos tratar y cómo llevar a cabo la investigación. b) Entrevistas a algunos de sus protagonistas (aquellos implicados en el problema a investigar). De ellos se busca recabar información que ayude al diseño de la encuesta. Pueden incluso aportar datos discordantes con preconcepciones del ¡ investigador. Los investigadores pueden encontrar que algunas consideraciones que pensaban eran importantes parecen ser irrelevantes a la gente con la que está hablando (Sheatsley, 1983: 203).

Ya se insistió en el apartado 1.3 en la gran aportación de la metodología cualitativa (entrevistas en profundidad, grupos de discusión, observación participante, uso de documentos) en las fases previas de la encuesta. También, en las posteriores. De manera especial, en la configuración del marco teórico, el diseño de la muestra (la identificación de los sujetos más adecuados para ser encuestados) y del cuestionario (la determinación de los conceptos teóricos y los indicadores más relevantes en su medición, y qué presencia tendrán en el cuestionario). Con la indagación exploratoria se busca la familiarización con el problema de investigación y la metodología a aplicar en su análisis. De lo exhaustivo que se sea en esta fase inicial de la investigación depende el buen resultado de la encuesta. Como se irá viendo en los distintos capítulos del libro, muchos de los errores de encuesta pueden obviarse dedicando más tiempo y recursos a esta fase exploratoria inicial, de la que resulta la configuración del marco teórico de la investigación. A veces se partirá de una teoría. Otras veces, se decidirá imbricar el problema de estudio en varias perspectivas teóricas para, de este modo, poder cubrir sus aspectos varios. Máxime cuanto más complejo sea el problema de investigación. Pero, en más ocasiones de las deseables, el marco teórico de la encuesta se fundamenta en genera-


36

Métodos de encuesta

lizaciones empíricas. Es decir, en proposiciones que han sido comprobadas en indagaciones precedentes, si bien no han logrado cristalizar en una perspectiva teórica determinada. En cualquier caso, el marco teórico contribuye a: a) Proporcionar un marco de referencia en la interpretación de los resultados de la investigación. b) Concretar los objetivos de la encuesta. Incluye los generales (que expresan la finalidad principal de la encuesta, lo que se pretende analizar) y los especificas (más concretos, relacionados con cada dimensión del problema de estudio). Es extremadamente importante precisar qué se quiere con la encuesta. Los objetivos han de ser claros, no ambiguos. De esta forma se evitan errores de especificación. Cuanto más claros estén los objetivos del estudio, más fácil será la traducción de conceptos a preguntas concretas y pertinentes en el cuestionario. Además, téngase presente que la adecuación del cuestionario suele medirse en relación con los objetivos de la investigación, junto con las características de la población que se analiza. c) Formular las hipótesis: realizar previsiones a partir de descubrimientos aún no verificados (Lazarsfeld, 1973a). Las hipótesis representan respuestas probables que el investigador avanza a las preguntas iniciales de la investigación. Suelen formularse como proposiciones en las que se afirma o niega la existencia de relación (esperada), al menos entre dos variables, en una situación determinada. Generalmente se recomienda extraer más de una hipótesis para poder abarcar los aspectos varios del objeto de estudio (incluidos en el marco teórico). Además, han de ser concretas y estar relacionadas con los objetivos de la investigación. Las hipótesis contienen conceptos que han de operacionalizarse, traducirse en preguntas concretas en un cuestionario (como se verá en el capítulo 4). También hacen referencia, aunque genérica, a las unidades de observación, contextualizándolas espacial y temporalmente (capítulo 3). Las unidades pueden ser individuales o agregados (hogares, empresas, instituciones). En la encuesta, lo más habitual es el individuo. De él se extrae información sobre sus características personales y de.su entorno sociocultural.

La elección de una población u otra puede tener implicaciones significativas en el contenido de la encuesta y en sus costes (económicos y temporales). Por esta razón, Hakim (1994) recomienda que la población de estudio se establezca en los objetivos de la investigación, porque ésta determina la información a extraer y la naturaleza de los resultados del estudio. La delimitación de la población (jóvenes, amas de casa, jubilados, profesores universitarios) afecta a todo el diseño de la encuesta. Desde la elección del método de encuesta a aplicar, el diseño de la muestra y del cuestionario, hasta la administración del cuestionario. Los días y horas más adecuados para la realización del trabajo de campo. Especialmente, cuando la encuesta es mediante entrevista personal o telefónica.

Capítulo 1: La encuesta como estrategia de investigación social

37

La elección del método de encuesta (mediante entrevista personal, telefónica, por corr~o u otra forma autoadministrada) está afectada por los objetivos de la investigación y la población a estudiar. También, por los recursos económicos y el plazo de tiempo que se disponga para su ejecución. Además de la continuidad que quiera darse a la encuesta. Éstos son los tres elementos clave que marcan cualquier proceso de investigación: a) Los objetivos del estudio. b) Los recursos económicos, humanos, materiales, que la hagan factible. c) El tiempo concedido para su realización.

En la encuesta la conjunción de estos tres elementos determina el·tamaño de la muestra y el procedimiento a seguir en su selección (capítulo 3). Asimismo, en la elección del método de encuesta (capítulo 2), el diseño del cuestionario (capítulo 4), la ejecución y supervisión del trabajo de campo (capítulo 5) y en el análisis de la información (capítulo 6), como refleja la figura 1.1, que resume las fases esenciales de la encuesta. Graves (1989) analiza el coste como una restricción del diseño de la encuesta. Pero, a su vez, considera su efectividad como un componente de la calMad del diseño. En la figura 1.1 puede, asimismo, verse que la elección del método de encuesta se ubica entre los factores que determinan la encuesta. En función de qué método de encuesta se elija, se diseña la muestra y se elabora el cuestionario. De la muestra se exige que sea representativa de la población de interés. Del cuestionario, que se adecue a los objetivos de investigación, a las peculiaridades de la población a encuestar (nivel educativo, conocimiento del tema, interés) y a los conceptos a medir. Éstos han de traducirse en preguntas apropiadas, que sean fáciles de comprender por las personas a quienes van dirigidas. Una vez confeccionado, el cuestionario ha de ser chequeado o pretestado, antes de pasarse a la muestra seleccionada para la encuesta. Se puede pasar a expertos para que evalúen en qué medida el cuestionario se ajusta a los objetivos de investigación y puede considerarse un instrumento "válido" y "fiable" en la medición del problema de estudio. Aunque la opinión "especializada" puede ser de gran ayuda, es imprescindible pretestar el cuestionario en la población a la que está dirigido (amas de casa, jubilados, estudiantes, profesores universitarios). No es necesario que la muestra sea elevada. Normalmente, los pretests se realizan con menos de 100 casos. Tampoco se requiere que éstos se elijan siguiendo procedimientos aleatorios, al no estar dirigidos a la inferencia estadística y generalización de los hallazgos de la indagación. Sólo se precisa que compartan las mismas características de la población de estudio. En el pretest se comprueba la adecuación del cuestionario: la redacción de las preguntas (si éstas son fácilmente comprendidas y provocan las respuestas"esperadas), su disposición conjup.ta en el cuestionario (si la ubicación de las preguntas puede ser causa de alguno de los errores de respuesta), las instrucciones que en él se den o el formato de las preguntas filtro. La finalidad principal es identificar cualquier problema que pue-


38

Capítulo 1: La encuesta como estrategia de investigaci6n social

Métodos de encuesta

1) Formulaci6n del problema: elaboración del marco teórico y definición de los objetivos de la encuesta

J

Consulta a expertos

~I

Indagación exploratoria. cualitativa con sus protagomstas Formulación de hipótesis

~

I

2) Operacionalizaci6n del problema de investigaci6n

I

Operacionalización de conceptos teóricos clave

I

I I

'--

3) Diseño de la encuesta

r--

I~

f) g) h)

Diseño de la muestra

I~

i)

Elaboración del cuestionario

I~

Pretest cuestionario I~

l-.j

4) Administraci6n del cuestionario

r-----

Selección y formación de entrevistadores (encuesta personal y telefónica)

I~

El trabajo de campo: la

I~

I recogida de información

~I

I

Elección método de encuesta

~I

~

Supervisión del trabajo de campo

Objetivos Recursos Plazo temporal

~

Preparación de los cuestionarios para el anális.i~: codificación de las preguntas abiertas, depuraclOn de los cuestionarios, grabación de los datos (excepto en modos informatizados)

It

5) Tratamiento de la informaci6n

a) b) c) d) e)

\

Delimitación de la población de estudio

~I

da afectar al correcto desarrollo de la encuesta. Ya referido a la administración del cuestionario, ya a las peculiaridades de la población que va a responderlo (capítulo 4). Tras su realización, el ínvestigador puede volver a las fases anteriores en el diseño de la encuesta, a su revisión (objetivos, muestra, cuestionario), teniendo presente los resultados del pretest o precomprobación del cuestionario. Además, proporciona información para las fases posteriores (admínistración del cuestionario, codificación, grabación y análisis de los datos). En concreto, del pretest puede extraerse información referida a:

R eVlSlon .., bibliográfica

~I

.1

Análisis de los datos

I

Evaluación de los datos de encuesta Redacción del informe

Figura 1.1. Fases esenciales de la encuesta.

39

...

La redacción del cuestionario. La idoneidad del marco muestral empleado en la investigación. La variabilidad de la población respecto al tema de estudio. La adecuación del método de encuesta elegido para la recogida de información. El porcentaje aproximado de no respuesta que se obtendrá en la encuesta. De especial relevancia en la encuesta por correo. La codificación de las preguntas abiertas del cuestionario. La preparación de los entrevistadores (en encuestas personales y telefónicas). El coste aproximado del trabajo de campo, en términos económicos y temporales (período de tiempo que se precisa para su realización). El plan de análisis.

Concluida la redacción final del cuestionario, procede su administración a la muestra que se ha diseñado para la encuesta. Esta fase de recogida de información,conocida como trabajo de campo, es la más delicada y costosa en el desarrollo de la encuesta. Su coste aumenta dependiendo de la complejidad de la encuesta y de la amplitud y peculiaridades de la muestra a la que se pasa el cuestionario. De mayor relevancia en encuestas cara a cara (mediante entrevista personal). Cuando media la presencia de entrevistadores, previamente ha de procederse a su selección y formación para la encuesta en cuestión. En el capítulo 5 se analiza la influencia en la calidad de la encuesta de la actuación de los entrevistadores, de sus habilidades para localizar, motivar y registrar las respuestas de los encuestados. Además, se exponen distintas estrategias para reducir la no respuesta, de gran relevancia en la calidad de los datos de encuesta. El correcto cumplimiento del trabajo de campo ha de ser supervisado, bien in situ (encuestas telefónicas), bien después de rellenarse los cuestionarios. Con ello se quiere evitar errores que afecten a la calidad de la información recabada. A la supervisión le sigue la fase de edición y de procesamiento de los datos. Se procede al cierre de las preguntas abiertas (si las hubiere), al chequeo y la depuración de los cuestionarios y a su grabación, salvo que se haya empleado un modo informatizado en la recogida de información. El capítulo 2 trata de los distintos métodos de encuesta, destacándose las diferencias entre ellos. Especial referencia se hace a los nuevos métodos informatizados de encuesta. Con la información ya grabada y depurada se procede a su análisis estadístico. Primero exploratorio, mediante gráficos y estadísticos univariables. Le sigue el análisis bi-


40

Métodos de encuesta

variable, generalmente a través de tablas de contingencia o del cruce de los atributos de dos o más variables. A veces se incluyen terceras y cuartas variables, a modo de variables de control. Es deseable que la fase analítica concluya con la aplicación de alguno de los modelos de análisis multivariable, que permita un estudio de las interrelaciones conjuntas entre la serie de variables. En el capítulo 4 se insiste en la importancia de prever qué análisis estadísticos piensan realizarse antes de proceder a redactar las preguntas. Esta previsión facilitará bastante las posibilidades analíticas de los datos de encuesta. De ellos se exige que sean "significativos" desde la vertiente estadística, pero también desde la lógica sustantiva. Han de ser interpretables y tener un significado lógico, que responda a los objetivos e hipótesis principales de la investigación. , La encuesta concluye con la redacción del informe. Este cumple la función de presentación, de comunicación, de la investigación materializada. De él se exige que sea una exposición pormenorizada del estudio, en cada una de sus fases, y del alcance de sus resultados. Su redacción ha de ser objetiva, transparente y lo más fidedigna posible respecto a los contenidos de la investigación:

Capítulo 1: La encuesta como estrategia de investigación social

41

CUADRO 1.3. Errores en el desarrollo de una encuesta Errores de "no observación". No representatividad de la población en la muestra finalmente observada, por errores de:

1. No cobertura ·2. Muestreo 3. No respuesta

Errores de "observación" o medición. Desviaciones de las respuestas obtenidas de los valores "verdaderos", debido a:

1. El método de encuesta. 2. El diseño del cuestionario. 3. La intervención del entrevistador. 4. La actitud del encuestado. 5. El tratamiento de la información.

El informe tiene que dar cuenta del cómo, cuándo y con qué resultados se han cumplido los objetivos del proyecto. Un informe debe explicar los procesos seguidos, las divergencias o cambios en lo proyectado (si los hubiere) y la confirmación o refutación de las hipótesis de partida que dieron lugar al proyecto de investigación (Alvira, 1995: 246-247).

Representa, en suma, la síntesis, la culminación del ejercicio investigador, en forma de documento para su lectura y evaluación. Documento del que se exige que sea "honesto" sobre los hallazgos del estudio y que ofrezca el suficiente detalle que haga posible su replicación. La especificación de los "límites" de la investigación se estima crucial para la interpretación de la información aportada y para su credibilidad. La documentación debería ser tan detallada que un equipo de investigación debería ser capaz de replicar un estudio basado en la documentación oficial (Biemer y Lyberg, 2003: 364).

1.5. Errores en )a aplicación de la encnesta

La calidad de la encuesta y sus posibilidades de inferencia dependen de su diseño y de cómo éste se ejecute en cada una de sus fases. En el apartado 1.1 se reseñó el interés creciente, por parte de los metodólogos de encuesta, en la detección y tratamiento de los errores que en ella pueden darse y que deterioran su calidad. El cuadro 1.3 ofrece una tipología de los distintos errores que pueden surgir en una encuesta. Éstos se agrupan atendiendo a si se deben a "no observación" o si se trata de errores de "observación" o de medición. A continuación se detalla en qué consiste cada tipo de error.

1.5.1. Errores de "no observación"

Propiciados por la no obtención de información de toda la variedad de unidades que componen la población objeto de estudio. Ello afecta a la representatividad de la muestra finalmente observada; es decir, de las unidades de las que se extrae la información. Esta carencia de representatividad de la muestra puede deberse a tres tipos de errores: de no cobertura, de muestreo y de no respuesta. Error de no cobertura

Se refiere a la idoneidad del marco muestral (o listado que incluye a las unidades de la población) utilizado para la selección aleatoria de las unidades muestrales, si cubre a todos los integrantes de la población de interés. La no cobertura surge por la utilización de listados con erróneas inclusiones u omisiones de las unidades de la población. Debido bien a su no actualización (el registrar datos no recientes), bien a la existencia de duplicidades (en especial, cuando el marco muestral es una combinación de una serie de listados), bien a su no correspondencia con el objeto de estudio. Por ejemplo, en una investigación sobre las condiciones de vida de la población mayor en España, el emplear para la extracción de la muestra los listados de usuarios de centros de día y de residencias, públicas y privadas, supondría la existencia de errores de


~y..a.JL"""'"

UNIVERSIDAD

42

Métodos de encuesta

no cobertura cuando se pretendiese analizar al conjunto de la población española mayor

de 65 años. No cuando el estudio se limitase a la población atendida en dichos centros.

La influencia del error de no cobertura (el no haber dado a todos los integrantes de la población la oportunidad de participar en la investigación) en la calidad de la encuesta depende de: a) La proporción de población no cubierta en el marco muestral. b) Las diferencias entre las características de la población cubierta y la no cubierta. En la medida en que los "no incluidos" en el marco muestral presenten características diferentes de los incluidos, las estimaciones de la encuesta estarán sesgadas. Error de muestreo Normalmente éste es el error más medido en la investigación mediante encuesta. Es el aspecto de la calidad de la encuesta examinado a través de estadísticos inferenciales aplicados a resultados de encuesta muestral de los que se obtienen conclusiones sobre diferencias significativas en la población (Dillman, 1991: 227).

Toda encuesta presenta error muestral porque únicamente se extrae información de una parte de la población. A su vez, ésta tan sólo representa una de todas las posibles muestras que pueden extraerse de la misma población. Por lo que siempre habrá alguna divergencia entre los valores obtenidos de la muestra (estimaciones m uestrales) y los correspondientes valores poblacionales (parámetros poblacionales). Su magnitud depende del tamaño de la muestra y de su representatividad. Si todos los integrantes de la población han tenido igual probabilidad de ser seleccionados para la muestra. En el capítulo 3 se analizan los efectos diferenciales, en el error muestral, debidos al tamaño de la muestra, el procedimiento seguido en la elección de las unidades muestrales, la heterogeneidad de la población y el nivel de confianza adoptado en la inferencia de las estimaciones muestrales. Error de "no respuesta" Lamentablemente, este tipo de error también está presente en la generalidad de las encuestas, aunque en distinta magnitud. ·Se debe a que no se ha recabado información de todas las unidades que componen la muestra inicial del estudio. Bien por su no localización, bien por su negativa a participar en la encuesta, en su totalidad o parcialmente (no se responde a algunas de las preguntas del cuestionario). A esto último se llama no respuesta de ítem. Se diferencia entre: a) No respuesta total o de unidad. Supone la exclusión de la unidad de la muestra original en toda la encuesta. No se ha podido establecer contacto con la misma o ésta ha rehusado a participar en la investigación.

ALBERTO HURTADO BIBLIOTECA

Capítulo 1: La encuesta como estrategia de investigación social

43

b) No. respuesta de ítem. La unidad muestral sí participa en la encuesta, pero opnte contestar a algunas de las preguntas del cuestionario. Puede deberse a su desconocimiento sobre el tema que se le pregunta, a la complejidad de la pregunta, al temor o inhibición que le produce dar una respuesta a determinadas cuestiones o, simplemente, porque quiere acabar de rellenar el cuestionario lo más pronto posible y no quiere dedicar tiempo a meditar algunas de las preguntas del cuestionario. El e~ecto de la no respuesta en la calidad de la encuesta depende, igualmente, de la magnItud que represente en la muestra inicial. También, de las características diferenciales e~tre qui.enes r~spo?den y aquellos q~e no lo hacen. De manera especial, cuando sus dIferenCIas estan dIrectamente relaCIonadas con el problema de investigación. La no respuesta de ítem sí es proporcionada en la generalidad de las encuestas (los "no sabe/no contestan"~. No sucede así con la no respuesta total (o de unidad). Son escasas las encuestas que Informan de la proporción y las características de las unidades de la muestra no contactados o que se negaron a participar en el estudio. Esta información es imprescindible en el análisis de la calidad de la encuesta. Afecta a la "representati:idad" de !os datos en ella aportados. En el capítulo 5 se exponen algunas de las actuaCIones habItuales en su reducción y control.

1.5.2. Errores de observación o de medición Conciernen a la adecuación de la información que se ha recabado en la encuesta a su correspondencia con los valores "verdaderos" en la población. Algunos auto;es --como Bradbum, (1983)- emplean el término "errores de respuesta" en referencia a esta va~edad de err~res d~ en~uesta. Otros -Groves (1989), por ejemplo- prefieren, en cambIO, reservar dICho termIno para aludir a errores asociados con el encuestado con el cuestionario o con la actuación del entrevistador. En general, los errores de obs;rvación pueden deberse al método de encuesta aplicado, al diseño del cuestionario la intervención del entrevistador, la actitud del encuestado y el tratamiento de la inforr:zación. Método de encuesta Su p~rtinencia en la c?nsecución de los objetivos de la investigación. En el capítul~ 2 s..e vera que, ante un mIsmo problema de investigación, la aplicación de uno u otro metodo afecta a los resultados de la encuesta. Tanto en su cantidad como en su calidad. No se consigue la mima cantidad y calidad de información cuando el cuestionario se r~sponde, precipitadamente, a la salida del metro o por teléfono (mientras se está reah~ando alguna tarea doméstica ~ de otro orden), que cuando se cumplimenta (por él nnsmo o con ayuda de un entreVIstador) tranquilamente en el domicilio del encuestado por ejemplo. '


44

Métodos de encuesta

Cada método de encuesta presenta unas ventajas y unos inconvenientes. El investigador deberá valorarlos en su decisión de cuál utilizar, consciente de los errores a los que son más vulnerables.

Capítulo 1: La encuesta como estrategia de investigación social

45

errónea comprensión; de su desconocimiento del tema sobre el que se le pregunta; su precipi,tación en la respuesta; o la presencia de errores de memoria, también tratados en el capítulo 4. En él se proponen algunas actuaciones referidas al diseño y la administración del cuestionario, que contribuyen a reducir su incidencia en la encuesta.

Cuestionario Tratamiento de la información

Sudman y Bradburn (1974) destacan el diseño del cuestionario como la principal fuente de error en las estimaciones de encuesta. Fowler y Mangione (1990) lo consideran una vía clave en la minimización de los efectos debido a la entrevista. El formato de la pregunta y de sus opciones de respuesta (en preguntas cerradas), así como su ubicación en el cuestionario, pueden afectar a la respuesta, a su validez. Puede haber errores de especificación, debidos a la no correspondencia de la pregunta con el concepto que trata de medir. Pero, también, pueden darse otros tipos de errores, como el llamado de aquiescencia o tendencia al acuerdo indistintamente del contenido de la pregunta. Esta variedad de error y otros debidos al diseño del cuestionario se analizan en el capítulo 4 donde, además, se dan propuestas para su corrección. Entrevistador

La intervención del entrevistador (cuando la encuesta no es autoadministrada), en la captación de información, puede tener efectos no deseados en la calidad de las respuestas. No sólo afecta su forma de administrar el cuestionario: cómo formula las preguntas, registra las respuestas, sus reacciones ante dificultades que tenga el encuestado para responder (aclaraciones), o su reacción a respuestas que éste pronuncie, y si le concede tiempo suficiente para contestar las preguntas. También, puede influir en la respuesta sus propias características personales, como se verá en el capítulo 5. La introducción de mejoras en el diseño del cuestionario y la estandarización de la actuación del entrevistador se avanzan como posibles remedios para limitar los errores debidos al entrevistador. Encuestado

La actitud del encuestado que, deliberadamente o no, proporciona información incorrecta. La falta de veracidad en su respuesta puede deberse a la imagen que de él mismo quiera proyectar, en busca de aprobación soci.al. El capítulo 4 incluye el sesgo llamado de deseabilidad social y propuestas para evitarlo. Como son el motivar al encuestado a responder con sinceridad, el aleatorizar las respuestas, o el crear las condiciones para que todas las respuestas se perciban como igualmente aceptables. Además, se explicitan varias recomendaciones para la formulación de las preguntas y su disposición en el cuestionario, que ayudan a una mejor captación de lo "latente" y no sólo de lo "manifiesto". La falta de veracidad en la respuesta puede, asimismo, resultar de la incapacidad involuntaria del encuestado para proporcionar información "correcta". Como consecuencia de una mala redacción de la pregunta (confusa, ambigua), que favorece su

Comprende la edición, la codificación de preguntas abiertas, la grabación de los datos en el ordenador, la ponderación y la imputación de respuestas, la tabulación de los datos y su modelado estadístico. Errores que resultan de actuaciones incorrectas por parte de los procesadores y los analistas de datos. El personal que codifica las respuestas puede desviarse de los criterios fijados. También pueden cometerse errores en la grabación de los datos, en el cálculo de los coeficientes de ponderación (que compensan estadísticamente los errores de no observación: de muestreo, de no cobertura, de no respuesta), en la tabulación y demás análisis estadísticos, tratados en el capítulo 6. Todo ello incide en la calidad de la encuesta, en la existencia de errores en las respuestas, con la consiguiente imagen distorsionada de la realidad social que se analiza. En palabras de uno de los autores que más han contribuido al análisis de los errores de encuesta: Las omisiones más importantes son aquellas que surgen de las respuestas a las preguntas de encuesta que han sido obtenidas por los entrevistadores: la codificación, la edición, la imputación y otras actividades del procesamiento de datos que siguen a la fase de recogida de datos (Groves, 1989: 12).

Hasta aquí la reseña de los principales errores que repercuten, negativamente, en la calidad de la encuesta. En los capítulos que siguen se irá desgranando y analizando cada uno de ellos. Para ayudar en su comprensión, cada variedad de error se incluye en el momento del desarrollo de la encuesta'en que puede aparecer, como resultado de incorrecciones en su diseño' y/o en su ejecución. Aunque se comparte una visión conjunt~ d~ la encuesta, de las interrelaciones entre sus distintas fases y entre los errores C?nsIguIentes..Una mala decisión inicial puede tener una repercusión negativa inmedIata en la calldad de la encuesta. También afecta a actuaciones posteriores. Por esta razón se precisa analizar con precisión las repercusiones de decisiones incorrectas que afectan al error total de encuesta.

LECTURAS COMPLEMENTARIA'S Bericat, E. (1998): La integración de los métodos cuantitativos y cualitativos en la investigación social. Ariel Sociología. Madrid. Biemer, E ~ y Lyberg, L. E. (2003): lntroduction to survey quality. John Wiley and Sonso Nueva Jersey.


112

Métodos de encuesta

El error de no cobertura afecta a la "representatividad" de la muestra. Las estimaciones muestrales únicamente serán inferibles a la población incluida en el marco muestra/. En la medida en que ésta coincida con la población de interés, su repercusión en la calidad de los datos de encuesta será menor. De ahí que se insista en la recomendación, ya destacada por Fowler (1988: 22), de Cuando se informen resultados, el investigador debe decir a los lectores a quién se dio y a quién no se dio una oportunidad de ser seleccionado, cómo aquellos omitidos diferían de los otros y si había o no algunas personas muestreadas para quienes las oportunidades de selección no eran conocidas.

Los remedios ante el error de no cobertura inevitablemente exigen tener información sobre el marco de muestreo, en qué medida incluye al conjunto de la población de interés. Para ello se precisa disponer de datos de la población de estudio en su conjunto, aparte de la proporcionada en el marco muestra!. En concreto, las actuaciones comunes son: a) En la definición de la población de estudio, restringirse a aquella incluida en el marco muestral. Porque el·error de no cobertura desaparece cuando ambas po-

blaciones coinciden. Por ejemplo, si en un estudio sobre delincuencia sé piensa únicamente utilizar el listado de personas recluidas en centros penitenciarios, como marco muestral, limitar el ámbito de la encuesta a la población reclusa, en la actualidad y/o en fechas precedentes. Depende de los objetivos de la encuesta. En el caso de que así se procediese, no habría error de no cobertura en la medida en que el listado cumpliese los requisitos anteriormente señalados de comprehensividad, actualización, omisiones e inclusiones erróneas y duplicidades. En cambio, sí habría error de no cobertura, y de gran magnitud, si únicamente se utilizase, como marco muestral, el listado de población reclusa y se quisiese generalizar los resultados de la encuesta al conjunto de la población delincuente. No sólo no describiría a la población delincuente "no oficial", la aún no censada. Ni siquiera al conjunto de la población delincuente oficial. Se excluye a aquellos que, aun habiendo sido detenidos por agentes de control social (policía, guardia civil), no han sido juzgados por tribunales de justicia. Y, si lo han sido, no se les ha aplicado la pena máxima de reclusión en un centro penitenciario.

b) Conocer los criterios seguidos en la elaboración del marco muestral, en la clasificación de las unidades de la población, y la periodicidad en su actualización. El acceso a esta información contribuye a calibrar la incidencia del marco muestral en el error de no cobertura. Por ejemplo, en datos referidos a la población inmigrante, averiguar qué población incluye dicho marco: si se restringe, exclusivamente, a la población con permiso de residencia o, también, abarca a la no regularizada; si los oriundos de otros países de la Unión Europea están incluidos (debido al acuerdo de libertad de fronteras entre los paí-

Capítulo 3: El diseño de la muestra

113

ses miembros); si incorpora a aquellos que acaban de obtener la nacionalidad españo~a, etc. En suma, habría que definir qué se considera inmigrante. Además, adviértase que en el estudio de la población inmigrante, la actualización del marco es un requisito prioritario, al encontrarse esta población más expuesta a ·cambios en su situación, por la propia "transitoriedad" que caracteriza a la experiencia migratoria.

c) Utilizar "conjuntamente" varios marcos de muestreo, cuando se prevea que un único marco no cubre a toda la población de interés. Por ejemplo, si se quiere analizar a la población delincuente oficial, utilizar datos procedentes de la Dirección General de la Policía, de los Tribunales de Justicia y de la Dirección General de Instituciones Penitenciarias.

Cuando se utilicen varios marcos de muestreo combinadamente, es exigida la eliminación de duplicidades, además de los chequeos por inclusiones erróneas. La supresión de duplicidades (unidades de población repetidas) se agiliza bastante si los marcos muestrales están en soporte magnético. Mediante un programa informático se "casan" los datos incluidos en los distintos marcos: nombre, dirección, teléfono, DNI y demás referidos a las unidades de población que incluye cada marco muestral. d) Identificar las ((omisiones" del marco muestral y utilizarlas como variables de cuota en el diseño de la muestra. Para ello se precisa información complementaria, que ayude a calibrar la cobertura del marco. Por ejemplo, para comprobar en qué medida los directorios de los colegios profesionales de sociólogos "cubren" al conjunto de licenciados y doctores en sociología, puede accederse a los registros de las distintas facultades de sociología en España, en un período de tiempo concreto. De la comparación de los distintos listados, podría conocerse la proporción de licenciados que están colegiados. Pero, si además se desea acceder a más información referida a las características diferenciales entre los sociólogos colegiados y aquellos no colegiados, podría extraerse (mediante alguno de los procedimientos aleatorios descritos en el apartado 3.4) una muestra de cada marco muestra!.. A ambas muestras se les pasaría el mismo cuestionario, ya mediante entrevista (personal o telefónica) o por correo. Recuérdese que en encuestas a poblaciones especializadas (como es el colectivo de licenciados en sociología), la encuesta por correo da mejores resultados que cuando ésta se dirige a la población en general. Asimismo, supondría un abaratamiento en los costes económicos de la investigación. Aunque no en los temporales, al precisar de un mayor plazo de tiempo para la ejecución del trabajo de campo que los otros métodos de encuesta. Las respuestas en ambas muestras se compararían, para comprobar si los sociólogos colegiados difieren de los no colegiados. Esta información es clave, si quiere estimarse la incidencia del error de no cobertura en los resultados de la encuesta. En qué medida las estimaciones muestrales obtenidas en la muestra extraída del directorio de sociólo~os colegiados logra representar al conjunto de los sociólogos españoles (si ésta constItuyese la población de interés), y no exclusivamente a los colegiados.


114

Capítulo 3: El diseño de la muestra

Métodos de encuesta

En referencia a la encuesta telefónica, Keeter (1995) propone el uso de "hogares transitorios". Por ellos se entiende aquellos que han experimentado un cambio en su situación de usuario de telefonía fija: o acaban de incorporarse al directorio telefónico (si éste fuese el marco muestral) o han dejado de estar registrados. El acceso a esta población en parte permite conocer las características de los hogares "sin teléfono". Aunque el 57% de los hogares sin teléfono por él analizados eran "transitorios", el mismo autor reconoce que éstos no logran representar, plenamente, al conjunto de los hogares sin teléfono. De todas formas, cuando se quiera extraer información de la población no cubierta en encuestas telefónicas, puede optarse por aplicar, conjuntamente, otros métodos de encuesta (cara a cara e, inclusive, por correo). Por correo, si se dispone de un marco muestral que incluya el nombre y la dirección completa del conjunto de la población. Permitiría conocer la cobertura telefónica y las características diferenciales de la población con y sin teléfono (estén o no registrados en el listín telefónico) en las variables concretas que se analizan. Indudablemente, ello supondría incrementos en los costes de la investigación. Aunque éstos podrían amortizarse, si la información referida a la población no cubierta por el marco muestral pudiese utilizarse en encuestas posteriores, pero próximas en el tiempo. e) Ajustes post-encuesta para compensar "en parte" los errores de no cobertura. Como en el error de no respuesta (subapartado 5.3.2), los efectos del error de no cobertura pueden reducirse mediante la ponderación. Para ello se precisa disponer de información complementaria "actualizada", bien de otras encuestas que incluyan a los "no cubiertos", bien de datos censales. En la medida en que las variables utilizadas en la ponderación estén relacionadas con el problema de investigación y diferencien a la población cubierta de la no cubierta, se conseguirá mejorar las estimaciones muestrales. En caso contrario, no. Habitualmente, las variables más utilizadas en ·la ponderación son las proporcionadas en los registros censales. Preferiblemente, las relativas a estatus social (educación, ocupación, ingresos), edad, género, hábitat, etnia. Si la elegida está relacionada con la variable de estudio, se habrá conseguido reducir la incidencia del error de no cobertura y la obtención de mejores estimaciones. muestrales. Con la ponderación se persigue "equilibrar" la muestra, adecuarla a la población de estudio, "ponderando", es decir, dando un mayor peso a las unidades de población "menos cubiertas" en el marco muestral. Como indica Wert (2000: 208), en referencia a la encuesta telefónica, Si no se introduce un factor ·de equilibrio o una cuota ad hoc, dadas las diferencias de equipamiento.telefónico que se dan en los distintos grupos de estatus, se podría esperar una diferencia resultante en la distribución por estatus de una muestra en encuestas telefónicas en la que la sobrerrepresentación de la clase alta y media-alta fuera de 2·a 3 puntos, la clase media estaría sobrerrepresentada en un punto y la clase media-baja y baja tendría una subrepresentación en la muestra telefónica de entre 3 y 4 puntos.

115

El coeficiente de ponderación resulta de la estimación del peso de la población cubierta en el marco respecto del conjunto de la población de interés, en la variable analizada. Se obtiene dividiendo el porcentaje de la población total entre el porcentaje de la población cubierta, en cada categoría de la variable elegida para la ponderación. Obviamente, la variable seleccionada debe diferenciar a la población cubierta de la no cubierta. Las estimaciones muestrales se multiplicarían por los coeficientes de ponderación respectivos. De la ponderación se habla con más detenimiento en los subapartados 3.4.3 (en referencia a la ponderación de muestras estratificadas no proporcionales) y 5.3.2 (como estrategia para la reducción del error de no respuesta). En este último subapartado se incluyen distintos métodos de ponderación. Éstos son extensibles a los ajustes por no cobertura, sustituyendo la tasa de no respuesta por la de no cobertura, razón por la cual se recomienda su lectura. Aunque se insiste en que estos ajustes "post-encuesta" no logran eliminar los errores de no cobertura, únicamente compensan, y sólo en parte, su efecto en las estimaciones muestrales.

3.3. El tamaño de la muestra

A la elección del marco muestral sigue la determinación de cuántas unidades de la incluir en la muestra. En esta decisión interviene una conjunción de factovarios, que cabe resumir en los seis siguientes:

'IJ'V'~""'A""''''''-'''''''''

a) El tiempo y los recursos disponibles para la realización de la encuesta. b) La modalidad de muestreo seleccionada en orden a alcanzar los objetivos esenciales de la investigación. c) La diversidad de los análisis de datos previstos. d) La varianza o heterogeneidad poblacional. e) El margen de error máximo admisible para la estimación de los parámetros poblacionales. f) El nivel de confianza de las estimaciones muestrales.

tiempo y los recursos disponibles

Sin duda, dos componentes esenciales en cualquier investigación son el tiempo y recursos (económicos, materiales y humanos), concedidos al equipo investigador, la materialización del estudio propuesto. En función de cuánta sea la dotación económica y los plazos temporales para cada fase de la investigación, el tamaño final de la muestra se verá aumentado o mermado. Además, repercute directamente en el método de encuesta finalmente elegido. Disponer de pocos recursos puede llevar a reducir el tamaño de la muestra, a elegir el método de encuesta más económico (la encuesta au-


116

Capítulo 3: El diseño de la muestra

Métodos de encuesta

tocumplimentada con preferencia a la encuesta cara a cara y telefónica, como se vio en el capítulo 2), y a rebajar la dificultad en la selección de las unidades de la muestra. En la encuesta telefónica, por ejemplo, la muestra puede ser más amplia (que en la encuesta cara a cara) y abarcar a distintos grupos de población, al ser su coste menor. Lo mismo sucede en la encuesta por correo (capítulo 2). En encuestas a poblaciones específicas, como profesionales (profesores, sociólogos, médicos, jueces) u organizaciones (universidades, hospitales, empresas), el mayor esfuerzo en su contactación y en el logro de su cooperación suele ir acompañado de una reducción en el tamaño de la muestra. Mayor que cuando la encuesta es a la población en general y si se trata de una encuesta cara a cara. No necesariamente cuando se recurre a la encuesta por correo, que suele alcanzar mayor éxito (medido en porcentaje y cal~dad de las respuestas) en poblaciones con un nivel cultural superior.

117

En el análisis multivariable, la repercusión del tamaño de la muestra en la signide las estimaciones muestrales depende del número de variables incluidas en el análisis. En regresión múltiple, por ejemplo, cuando se aplican procedimientos secuenciales de estimación de parámetros poblacionales, se aconseja que al menos 40 casos por cada variable independiente o predictora (Tabachnick y Fidell, 1989; Cea D'Ancona, 2002a/2004a). En caso contrario, habrá que eliminar variables independientes o proceder a su agrupación para garantizar la debida proporcionalidad de casos por variables. Para análisis bivariables, como el habitual en el análisis de datos de encuesta, de tablas de contingencia (o cruces de variables), también se precisa de un tamaño muestral elevado. Especialmente, si las variables comprenden un número amplio de categorías y se quiere ver la incidencia de terceras y de cuartas variables en la relación entre dos variables. Cuanto más se segmente la muestra, mayor tamaño muestral se precisa para que las estimaciones muestrales satisfagan los criterios de significatividad estadística. ficativid~d

La modalidad de muestreo seleccionada

La elección de uno o varios métodos de muestreo depende, igualmente, de la conjunción de los tres determinantes clave de cualquier proceso de investigación: los objetivos, los recursos y el tiempo disponible para su ejecución. Además, cada método de muestreo conlleva unas exigencias específicas en tamaño y selección de la muestra. En general, los métodos no probabilísticos, no enfocados a la inferencia estadística, se asocian a tamaños muestrales inferiores a los exigidos en los métodos probabilísticos. Estos últimos persiguen la consecución de muestras "representativas", razón por la cual precisan de un mayor tamaño muestral, porque éste incide en un menor error muestral, que afecta a la significatividad estadística de las estimaciones muestrales. En cada agrupación hay variaciones entre las diferentes modalidades de muestreo. Dentro de los muestreos probabilísticos, el aleatorio estratificado precisa de un mayor tamaño muestral que los otros modos. El error muestral es también menor. En los no probabilísticos, el muestreo por cuotas suele ir acompañado de tamaños muestrales mayores que el muestreo estratégico o el llamado bola de nieve. También, por las características de las investigaciones en que suelen aplicarse, no tan enfocadas a la inferencia estadística.

La diversidad de los análisis de datos previstos

Cuando se proyecta cualquier investigación, antes de diseñar la muestra y la estrategia a seguir en la obtención de información, hay que anticipar la variedad de análisis para la consecución de los objetivos de la investigación. Si el equipo de investigación cree de' interés la aplicación de alguna (o varias) técnicas estadísticas multivariables, deberá procurar que la muestra sea aleatoria e incluya un número elevado de casos. Ello contribuye a la reducción de los errores de predicción y al aumento, consiguiente, del poder predictivo del modelo obtenido.

La varianza o heterogeneidad poblacional

Si la muestra pretende ser una representación, a pequeña escala, de la población de estudio, en su tamaño también incidirá la varianza poblacional. Cuanto más heterogénea sea una población, mayor será su varianza poblacional. En consecuencia, se precisará de un mayor tamaño muestral para que cada uno de sus diversos integrantes tengan representación en la muestra. En universos homogéneos, caracterizados por una baja varianza poblacional, se reducen, en cambio, las exigencias en el tamaño de muestra. Se precisan menos casos para representar a la población. El conocimiento de la homogeneidad o heterogeneidad poblacional resulta, por tanto, primordial en la decisión del tamaño muestral. Si bien, no siempre resulta factible. Precisa de la existencia de algún estudio previo sobre esa misma población y aún tenga vigencia. Esta información puede obtenerse de encuestas que se repiten con una cierta periodicidad (los barómetros del Centro de Investigaciones Sociológicas, los eurobarómetros de la Unión Europea, la Encuesta de Población Actidel INE), siempre que ambas poblaciones (la del estudio previo y aquella de la encuesta que se proyecta) coincidan. Quiere decir, que tengan proximidad temporal, abarquen la misma población y traten la misma temática. En caso contrario, las estimaciones de la varianza poblacional en las variables de interés no serán aplicables en cálculo del tamaño muestral. También, puede utilizarse la información proporcionada en el pretest del cuestionario (apartado 4.5) en la estimación de la varianza poblacional. El conocimiento de la varianza poblacional siempre supondrá una reducción del tamaño de la muestra porque, cuando se desconoce, se aplica el supuesto de máxima heterogeneidad del universo. Éste es el supuesto más desfavorable y de práctica habitual en la investigación social. El desconocimiento de la varianza poblacional supone tomar el producto de las probabilidades P (de aparición de un suceso) y Q (que indica


118

Métodos de encuesta

Capítulo 3: El diseño de la muestra

la no ocurrencia del suceso o evento; siendo su valor igual a "1 - P") como equivalente a la varianza poblacional, en igual magnitud. Ambas probabilidades valdrían 0,50. Como puede verse en el cuadro 3.1, ello implica un mayor tamaño muestral (con el consiguiente incremento de los costes de la encuesta), que cuando se parte del conocimiento de los valores reales de dichas proporciones en la población, y éstos se alejan del valor 0,50. Como ilustración, en el cuadro 3.1 se incluyen tamaños muestrales correspondientes a poblaciones infinitas (mayores de 100.000 unidades), al nivel de confianza más empleado (2o-sigma- o unidades z, de desviación típica, que supone una probabilidad de acierto en la estimación de los parámetros poblacionales del 95,5% ), para distintos valores de P y Q (expresados en porcentajes) y limites de error establecidos. En él puede observarse que el tamaño muestral aumenta, conforme los valores de P y Q se aproximan al valor de 50 (que significa máxima heterogeneidad poblacional), indistintamente del margen de error fijado. Por ejemplo, para un margen de error de ±2,5%, el tamaño de la muestra para una población de más de 100.000 unidades es de 576 unidades si P = 10 Y Q =90. Si P YQ fuesen, respectivamente, 30 y 70, la muestra aumentaría más del doble. Exactamente, a 1.344 unidades. Para el supuesto de máxima heterogeneidad (P y Q igual a 50), el tamaño de la muestra sería de 1.600 unidades. Es decir, casi el triple del supuesto inicial de elevada homogeneidad poblacional (P =10 Y Q = 90). Este incremento reduce, no obstante, las posibilidades de errar en la estimación de los parámetros poblacionales para las variables de estudio. Por esta razón se adopta este supuesto de máxima heterogeneidad, siempre que se desconozca el valor de la varianza poblacional en las variables que se analizan.

119

CUADRO 3.1. Tamaño muestral para poblaciones infinitas a un nivel de confianza del 95,5% (2 a) Valores estimados de P y Q (%)

Límites de error (%) para ±2a

0,1 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 5,0

1199

.

10/90

20/80

30/70

40/60

50/50

39.600 1.584 396 176 99 63 44 32 25 16

360.000 14.400 3.600 1.600 900 576 400 294 225 144

640.000 25.600 6.400 2.844 1.600 1.024 711 522 400 256

840.000 33.600 8.400 3.733 2.100 1.344 933 686 525 336

960.000 38.400 9.600 4.267 2.400 1.536 1.067 784 600 384

1.000.000 40.000 10.000 4.444 2.500 1.600 1.111 816 625 400

5

Los tamaños muestrales incluidos en el cuadro 3.1 se han obtenido aplicando la fórmula habitual para el cálculo del tamaño muestral en universos infinitos y a un nivel de confianza de 2o(que implica un 95,5% de probabilidad de acierto en la estimación de

4,5

4

3,5

4PQ

parámetros poblacionales): n = - 2 E Donde E representa el error muestral o error típico. Las fórmulas del tamaño muestral se comentan al final de este apartado.

Error (%)

El margen de error máximo admisible

En el cuadro 3.1 puede también observarse la correspondencia entre el error y el tamaño muestral. Los incrementos en el tamaño de la muestra repercuten en una mayor precisión en la estimación de los parámetros poblacionales, con la consiguiente reducción del error de muestreo. Por el contrario, en muestras pequeñas, el error aumenta, manteniéndose constante la varianza poblacional. La figura 3.1 representa, de forma gráfica, la relación negativa existente entre el error y el tamaño de la muestra. Para su elaboración se han tomado los valores que apa-

Tamaño muestra) (unidades)

Figura 3.1. Representación gráfica de la relación entre las variables error y tamaño muestral para P = Q = 50 Ynivel de confianza del 95,5%.


120

Capítulo 3: El diseño de la muestra

Métodos de encuesta

recen en el cuadro 3.1, correspondientes a la situación más habitual en la práctica investigadora: desconocimiento del valor de la varianza poblacional (P = Q = 50). Como puede observarse, conforme aumenta el tamaño de la muestra, desciende el error muestral. Si el tamaño de la muestra se amplía, por ejemplo, de 816 a 2.500 unidades, el error disminuye del 3,5 al ±2%. También se advierte que a partir del 2% de error se disparan los aumentos en tamaño de la muestra para alcanzar una misma ganancia en reducción del error muestral. Pasar del 2 all % de error supone un incremento de 2.500 a 10.000 unidades en la muestra, con el consiguiente aumento de los costes de la encuesta (económicos y temporales). A cambio, sólo se logra una leve mejora en la precisión de la estimación de los parámetros poblacionales (una unidad porcentual). En consecuencia, el investigador deberá encontrar un punto intermedio entre el tamaño y el error muestral, ante la tendencia observada en muestras grandes a proporcionar mínimos incrementos en adecuación en la estimación de parámetros poblacionales. En los diseños muestrales probabilísticos el error muestral interviene en el cálculo del tamaño de la muestra. El investigador fija a priori el error de las estimaciones de los datos de la encuesta proyectada, sopesando la precisión que desea con los costes que supondría la reducción del error muestral. Errores comprendidos entre ±2,5 y 2% son los más frecuentes en la investigación social. No es deseable errores superiores a ±4 %.

El nivel de confianza de la estimación

Un último elemento que interviene en la decisión del tamaño de la muestra -aunque igualmente sólo en diseños probabilísticos- es el nivel de confianza que el investigador concede a sus estimaciones de los parámetros poblacionales. Como su nombre indica, el nivel de confianza expresa el grado de "confianza" (o de "probabilidad") de que las estimaciones muestrales se ajusten a la realidad. Tres son los niveles de confianza comunes en la investigación social. Corresponden a áreas bajo la curva normal acotadas por distintos valores de desviación típica (denominada sigma (a) en referencia a la desviación poblacional). De ellos el más habitual es 20, que supone un 95,5% de probabilidad de acertar en la estimación muestral. La distribución normal se aplica en estadística inferencial para la estimación de la probabilidad de que un determinado evento acontezca. Representa una curva perfectamente simétrica, en forma de campana, que admite infinitos valores (unidades Z o unidades de desviación típica). El área total bajo la curva normal es 1 (dado que la probabilidad siempre es un valor positivo comprendido entre Oy 1). En función de cuál sea el valor Z variará la probabilidad concedida al evento en cuestión. Si se toma una unidad de desviación típica, la probabilidad de acierto en la estimación es de 68,3% (véase figura 3.2). Con dos unidades de desviación, la probabilidad de acierto se incrementa hasta el 95,5%. La plena seguridad en la estimación (exactamente un 99,7% ) se adquiere si se fijan en tres las unidades de desviación típica. Pero

"-3, -¡a -t

68;%

:t

121

0

+1 +fO

~95,5%~ 99,7%

Figura 3.2. Niveles de probabilidad en el área bajo la curva normal.

no es éste el nivel de confianza usual en la práctica investigadora, sino el 95,5% (equivalente a 20). La pregunta inmediata es ¿por qué? La respuesta se encuentra en el cuadro 3.2. En él se ejemplifica cómo (para una misma varianza poblacional) varía el tamaño de la muestra, dependiendo del nivel de confianza adoptado. Incrementos mínimos en nivel de confianza (del 95,5% de probabilidad de acierto al 99,7%) suponen aumentar la muestra a algo más del doble. Si para un error de ±2% y varianza P = Q = 50, el tamaño de la muestra es de 2.500 unidades, para un nivel de confianza CUADRO 3.2. Tamaño muestral para poblaciones infinitas a un nivel de confianza del 95,5% (20) y 99,7% (30) Valores estimados de P y Q (%)

Límites de error (%)

Nivel de confianza (%)

10/90

20/80

30/70

40/60

50/50

±1,0

95,5 99,7

3.600 8.100

6.400 14.400

8.400 18.900

9.600 21.600

10.000 22.500

±2,0

95,5 99,7

900 2.025

1.600 3.600

2.100 4.725

2.400 5.400

2.500 5.627

±2,5

95,5 99,7

576 1.296

1.024 2.304

1.344 3.024

1.536 3.456

1.600 3.600

±3,0

95,5 99,7

400 900

711 1.600

933 2.100

1.067 2.400

1.111 2.500

±4,0

95,5 99,7

225 506

400 900

525 1.181

600 1.350

625 1.406


122

Métodos de encuesta

Capítulo 3: El diseño de la muestra

de 99,70/0, la muestra pasaría a estar integrada por 5.627 unidades. La ganancia en precisión es ínfima, mientras que los costes de la encuesta (en tiempo y dinero) supondrían más del doble de los presupuestados para un nivel de confianza del 95,50/0. Todos los aspectos referidos participan en el cálculo del tamaño de una muestra probabilística. La fórmula genérica para una muestra aleatoria (simple o sistemática) sería la siguiente, cuando el universo o población estuviese compuesto por más de 100.000 unidades:

123

a) Si la encuesta se realizase en el conjunto de las universidades españolas, para un error máximo de ±2,50/0. Se carece de información previa sobre la varianza poblacional. Para un nivel de confianza del 95,5%, el tamaño de la muestra sería:

z

2pO 2 2 X 50 x 50 . n = -E = = 1.600 unidades 2 2,5 2 Elevar el nivel de confianza al 99,70/0 supondría, como es usual, incrementar el tamaño de la muestra en más del doble. Exactamente a 3.600 unidades.

o

Z2pO

n = -= 2 E

Donde: Z

= valor de la variable aleatoria normal típica en el área bajo la curva nor-

mal. Representa las unidades de desviación típica correspondientes al nivel de confianza elegido (2a o 3a). El nivel de confianza que el in'"""' vestigador tiene en que sus estimaciones se ajusten a la realidad. S2 = varian~a poblacio~al estin:!ada. Equivale al producto de las proporciones p y Q, siendo Q = 1- P (o 100 - p, en términos porcentuales). E = error máximo permitido que el investigador establece a priori. La precisión buscada en .la estimación de los parámetros poblacionales.

b) Si se parte de la predicción (a partir de un sondeo efectuado con anterioridad) de que el 680/0 de los estudiantes son favorables a la reducción de los años de licenciatura, los tamaños muestrales serían 1.393 y 3.133, respectivamente.

Z 2 pQ 2 2 n = -E = 2

n

Si el universo estuviese integrado por 100.000 unidades o menos, se trataría de una población finita. En este caso, habría que introducir un factor de corrección, quedando las fórmulas transformadas de la siguiente manera:

Z 2S2N . E2(N -1) + Z2S2

n=-------

o

siendo N el tamaño de la población. En muestras aleatorias estratificadas y por conglomerados se introducen otras variaciones que se comentarán cuando se describan ambas modalidades de muestreo (subapartados 3.4.3 y 3.4.4).

3 2 x50x50 . 2 = 3.600 unidades 2,S

=

Z2pO

-E · 2

=

x 68 x 32

2,S2

32x 68 x 32 2,5 2

= 1.393 unidades

=

3.133 unidades

El tamaño muestral preciso ha descendido, al tener información previa sobre la "'varianza poblacional en la variable que se analiza. Todo conocimiento sobre varianza poblacional va a conllevar un descenso en tamaño muestral porque su desconocimiento implica calcular el tamaño de la muestra para el supuesto más desfavorable: 'máxima heterogeneidad poblacional. Es decir, P = Q = 50. La mitad de la población co~parte una opinión y la otra mitad la contraria. El descenso será tanto mayor, cuan~o·.más homogénea sea la población. e) Si la encuesta se hiciese en una universidad en la que están matriculados 86.729 alumnos:

n= n=

Z 2P O N 2 2 2

2

~~ =

SO x 50 x 86.724 (2,S2 x 86.723) + (2 2 x 50 x SO)

=

1 571 unidades .

=

2 2 x 68 x 32 x 86.724 (2,5 2 X 86.723) + (2 2 x 68 x 32)

=

1.371 unidades

E (N -1) + Z pQ

Z 2 PON

~~

E 2 (N -1) + Z 2 pQ

..

X

(

d) Si la encuesta se circunscribiera a la facultad de Ciencias Políticas y Sociología, donde están matriculados 5.112 alumnos: Se quiere conocer la opinión de los estudiantes universitarios españoles sobre la reforma universitaria para la convergencia con Europa. Calcular el tamaño de la muestra para los supuestos siguientes:

)

n

=

Z 2 pQN

~ ~ =

E 2 (N -1) + Z 2 pQ

2 2 xSOx50x5.112 . = 1.219 unidades (2,S2 x 5.111) + (2 2 x 50 x 50)


124

Capítulo 3: El diseño de la muestra

Métodos de encuesta

_

Z 2PON

n - e(N -1) + Z 2 pO

_

-

2

2 x 68 x 32 x 5.112 (2,5 2 x5.111) + (2 2 x68 x 32)

=

125

b) La dificultad para estimar el error muestra/. No proporciona medidas de precisión de las estimaciones muestrales. c) La introducción desesgos en el proceso de elección de la muestra. Esto redunda en riesgos superiores de invalidez de los hallazgos de la investigación.

1.095 unidades

En el ejemplo puede constatarse que, cuanto más pequeña es la población de ~stu­ dio, mayor tamaño muestral se precisa, en proporción, para un mismo nivel de conftanza y error típico (o precisión de la estimación).

3.4. La selección de las unidades de la muestra: métodos de mnestreo probabilísticos y no probabilísticos La representatividad de la muestra no es sólo función de la magnitud de su !a~año (que afecta a los errores de estimación), también está determinada ~or el proced~ento seguido en la selección de las unidades que compondrán la muestra: SI todos los IDlembros de la población tienen la misma probabilidad de ser elegidos para formar la muestra. Los procedimientos a seguir en la selección son varios, como puede verse en el cuadr~ ~.3. ~n mismo diseño muestral puede incluir dos o más métodos de muestreo. Una clasifIcaclOn básica entre los métodos diferencia entre métodos de muestreo probabilísticos y no probabilísticos. Depende de si la selección de las unidades de la muestra se efectúa mediante algún procedimiento aleatorio o se aplican otros criterios diferentes al az~r. . / Los métodos de muestreo probabilísticos se fundament~n en la aleatonzac~o~ como criterio para la selección de las unidades de la muestra. Esta no depende del JUlcio o determinismo humano, sino del "azar". Ello posibilita que: a) Cada unidad de la población del marco muestral tenga la misma probabilidad (conocida a priori) de participar en la muestra. b) La elección de cada unidad sea independiente de las demás. c) El cálculo de la precisión de las estimaciones muestrales (el error muestral) respecto a los parámetros poblacionales pueda hacerse dentro de unos márgen~s de probabilidad específicos. Sólo en las muestras probabilísticas pued~ cuantificarse la proporción del error total de encuesta que se debe a vananza de muestreo. Esto la adecua a propósitos de inferencia estadística: estimación de parámetros y comprobación de hipótesis (pruebas de significatividad).

En los métodos de muestreo no probabilísticos la elección de las unidades de la muestra se realiza, por el contrario, sin que medie el "azar". La conveniencia, el juicio o detenninismo humano, u otros criterios subjetivos, son los que intervienen en el proceso de selección. Ello da cabida a discrecionalidades por parte del equipo investigador y repercute en: a) La desigual probabilidad de las unidades de la población para formar parte de la muestra.

)

En consecuencia, se adecuan a investigaciones no dirigidas a la inferencia esta• dística: a) La indagación exploratoria (estudios piloto, el pretest del cuestionario). b) Estudios cualitativos, más interesados en profundizar en la información aportada que en su representatividad estadística. c) Investigaciones sobre población "marginal" (prostitutas, drogadictos, homosexuales, inmigrantes ilegales e, incluso, miembros menos "marginales" como parejas cohabitantes, por ejemplo), de las que no se dispone de un registro exhaustivo que abarque a toda la población y facilite su localización. Lo cual complica la aplicación de diseños muestrales probabilísticos.

Pese a ello, el muestreo no probabilístico presenta dos ventajas notorias que le hacen atractivo en la práctica investigadora. Una, no precisa de la existencia de un marco muestral, a diferencia de los métodos de muestreo probabilísticos. Dos, su ejecución resulta más sencilla y económica. El cuadro 3.3 incluye la variedad de métodos de muestreo. Aunque hay que precisar que no forman compartimentos estanco. Un mismo diseño muestral puede compaginar diferentes variedades de muestreo en las distintas fases de su desarrollo. La elección de un método u otro depende de la confluencia de cuatro factores básicos: a) La dotación económica de la investigación. b) El período de tiempo programado para su ejecución. c) La existencia de un marco muestral válido que haga factible la selección muestral aleatoria. d) El grado de precisión que el investigador quiere dar a la indagación.

3.4.1. Muestreo aleatorio simple

Constituye el prototipo de muestreo, en referencia al cual se estiman las fórmulas básicas para el cálculo del tamaño y del error de la muestra. Es de fácil realización. Como muestreo probabilístico su ejecución exige la existencia de un marco muestral que cumpla las condiciones expuestas en el apartado 3.2. Ha de ser un marco nominativo, que proporcione información que ayude a contactar a las unidades de la población que sido aleatoriamente elegidas (nombre, dirección, número de teléfono). Además, cada unidad de la población del marco ha de tener un número de identificación y que éste siga un orden consecutivo. En caso de que no figure anexo al marco, el investi-


126

Capítulo 3: El diseño de la muestra

Métodos de encuesta

CUADRO 3.3. Métodos de muestreo Métodos de muestreo probabilístico

1. Muestreo aleatorio simple 2. Muestreo aleatorio sistemático 3. Muestreo aleatorio estratificado • Estratificación proporcional • Estratificación no proporcional: afijación simple, óptima y otras no proporcionales 4. Muestreo aleatorio por conglomerados: monoetápico, bietápico y polietápico 5. Muestreo de áreas y rutas aleatorias 6. Métodos de selección de personas en una misma vivienda • • • •

No selección: primera persona que contesta Método de Kish de selección aleatoria Método de selección de cuota sistemática Método del cumpleaños

127

dades de la población de interés (jóvenes que han dejado de ser estudiantes universitarios o personas mayores que ya no asisten a centros de la tercera edad, por ejemplo), bien porque no se ha podido contactar con ellos, o bien porque han rechazado participar en la encuesta. Si las sustituciones han sido previstas con antelación, no se precisa de nuevo volver al marco muestral y repetir el procedimiento de selección aleatoria de la muestra para las sustituciones. La elección de las unidades de la muestra puede hacerse sin reemplazamiento (cuando cada unidad de la población puede ser elegida sólo una vez) o con reemplazamiento (si participa en elecciones sucesivas). Lo habitual es que el proceso de selección se efectúe sin reemplazamiento. Cuando el marco muestral se halla en soporte magnético, se agiliza bastante el procedimiento de selección aleatoria de la muestra mediante algún programa informático. En este caso, es el programa de ordenador configurado el que ejecuta todas las tareas correspondientes a: a) Numerar consecutivamente a cada uno de los integrantes del marco muestral. b) Generar la serie de números aleatorios. e) Seleccionar e imprimir la lista de las unidades finalmente elegidas para formar la muestra. Aquellas a las que correspondan los números que han surgido al azar.

Métodos de muestreo no probabilístico

1. Muestreo por cuotas 2. Muestreo estratégico o de "juicio" 3. Muestreos circunstanciales: de "voluntarios", "bola de nieve"

gador deberá asignárselo, antes de proceder a la extracción aleatoria de los integrantes de la muestra. Ésta se hará de acuerdo a una serie de números que han sido seleccionados siguiendo algún procedimiento aleatorio. Una tabla de números aleatorios, mediante generación aleatoria de números mediante algún programa informático específico, u otro procedimiento que garantice que: a) Cada unidad de la población tenga la misma probabilidad de participar en la muestra. Esta probabilidad viene determinada por la fracción de muestreo. Se define como el cociente entre el tamaño de la muestra y la población total en el marco muestral. Es decir, n/N. b) La selección muestral sea totalmente aleatoria hasta alcanzar el tamaño muestral fijado. No obstante, se aconseja extraer un número mayor de unidades que las inicialmente prefijadas en el tamaño de la muestra para agilizar la inevitable realización de "sustituciones" de integrantes originales de la muestra. Es totalmente improbable que todas las unidades de la población elegidas para formar la muestra acaben participando en la encuesta. Bien porque han dejado de ser ur-

Si el uso del ordenador no resulta viable, se recurre al procedimiento tradicional: utilizar una tabla de números aleatorios. Estas tablas comprenden múltiples combinaciones de números extraídos al azar (o por sorteo), de forma que cada dígito tiene igual probabilidad de figurar en cualquier punto de la tabla. La actuación, en este caso, sería: a) Elegir aleatoriamente un punto de partida: una columna o una fila cualquiera de la tabla. Puede comenzarse por cualquier lugar y moverse en cualquier direétión (hacia arriba, hacia abajo, a la derecha o a la izquierda). La única condición que se exige es que la elección no responda a un conocimiento previo de la distribución de los números en la tabla. Ello introduciría sesgos en la muestra. b) El número de dígitos extraídos de la tabla ha de corresponder con el número de dígitos de la población contenida en el marco muestral. Por ejemplo, si el marco estuviese compuesto por 10.000 unidades (5 dígitos), habría que n,~erar a cada unidad ~e la población con 5 dígitos: desde el primero (00001) hasta el últ1ll10 (10.000), correlativamente. A continuación, se escogerían números con 5 dígitos, desconsiderándose aquellas cifras que superen la última unidad poblacional numerada en el listado (10.000).

e) La unidad de la población del marco al que pertenezca el número extraído pasará a formar parte de la muestra. Salvo que en el marco no se adjunte información que permita su localización (dirección postal, teléfono).


128

Capítulo 3: El diseño de la muestra

Métodos de encuesta

Supóngase que va a realizarse una encuesta a licenciados en Ciencias Políticas y Sociología. El equipo investigador elige tomar como marco de muestreo el directorio de "colegiados" (en el Ilustre Colegio Nacional de Doctores y Licenciados en Ciencias Políticas y Sociología). A fecha de la investigación hay registrados un total de 6.428 colegiados. Para un margen de error de ±2,5% y un nivel de confianza de 95,5% la muestra estaría integrada por 1.281 colegiados. Si se tomase el número de colegiado como número de identificación, no habría que asignar a cada unidad de la población un número consecutivo. En caso contrario, sí. Para la extracción de las unidades de la muestra puede seguirse el sistema tradicional de una tabla de números aleatorios o el sistema más rápido de generación informatizada de números de forma aleatoria. En cualquier caso los números elegibles han de ser inferiores o iguales al tamaño total de la población del marco. En este ejemplo, todo número igualo menor de 6.428. En una tabla, la extracción de números se comenzaría por una fila o columna de la tabla elegida al azar. En el cuadro 3.A figura un extracto de la tabla de números aleatorios adjunta en el Anexo. Del cuadro se deduce que la decisión tomada ha sido comenzar en la primera columna, escogiendo los cuatro primeros dígitos, continuar hacia abajo hasta el final de la columna, e ir alternando los cuatro primeros con los cuatro últimos dígitos. El procedimiento continúa hasta que, al menos, se alcanza el tamaño de la muestra fijado. Se decide extraer 120 colegiados más para posibles sustituciones de la muestra inicial. Descartando los números superiores a la cifra de 6.428 (número total de colegiados en el marco muestral), los sujetos seleccionados serían aquellos cuyo número de identificación (número de colegiado) se correspondiese con las cifras siguientes: 3.435, 631, 6.211, 4.753,2.485,5.516,6.040,2.820,5.993,3.648,2.479, 1.472,5.565,5.336,4.992,724,4.489, 4.281,4.105, 1.726, así se proseguiría hasta completar al menos el tamaño muestral. La probabilidad de selección de cada unidad de la población en el marco muestral es n 1.281 0,199, al ser la fracción de muestreo = N = 6.428 = 0,199

129

La exigencia de disponer de un listado de la población de interés y que cada unidad de la población del marco esté numerada consecutivamente hace desaconsejable este procedimiento de selección muestral en poblaciones de elevada magnitud. Por ejemplo, sería totalmente impracticable el manejar un listado con todos los hogares de un país, no cuando se trata de un municipio específico y pequeño. La selección aleatoria de las unidades de la muestra se agiliza y es más practicable cuando el marco muestral está en soporte magnético y se sigue un procedimiento informático de generación de números aleatorios. El muestreo aleatorio simple se aplica, preferentemente, en poblaciones pequeñas o circunscritas a un espacio delimitado, no en poblaciones espacialmente desperdigadas, si la encuesta es mediante entrevista cara a cara. Encarecería bastante el trabajo de campo, tanto en tiempo como en dinero. No en los otros métodos de encuesta (telefónica y por correo), que se beneficiarían, por el contrario, de una muestra más heterogénea que en otros métodos de muestreo (como el aleatorio por conglomerados, por ejemplo). Enviar a un entrevistador a una barriada apartada u otro núcleo de población aislada para hacer una o dos entrevistas y, después, desplazarse a otro lugar para realizar otra es impracticable, por el elevado coste que ello supone en tiempo (la razón de número de entrevistas por día será menor) y dinero (desplazamiento, dietas). En cambio, la mayor dispersión de la muestra consiguiente a este método de muestreo no supondrá un coste añadido si la encuesta es telefónica o por correo. Apenas habría variaciones en los costes del trabajo de campo con una muestra dispersa y, por el contrario, se ganaría en representatividad. Cuanto más heterogénea y dispersa sea la muestra, más probable es la consecución de una muestra "representativa": que toda la variedad que forma la población de estudio esté "representada" en la muestra. Las ventajas y los inconvenientes principales del muestreo aleatorio simple se resumen en el cuadro 3.4.

CUADRO 3.4. Ventajas e inconvenientes del muestreo aleatorio simple

Ventajas

Inconvenientes

• Facilidad de los cálculos estadísticos. • Elevada probabilidad de lograr equiparabilidad entre las características de la muestra y las correspondientes a la población. • Consecución de una muestra autoponderada (igual probabilidad de selección de cada unidad de la población del marco muestral).

• Requiere listar y enumerar consecutivamente a las unidades de la población del marco muestral. • En muestras y poblaciones de considerable magnitud resulta un método de selección muestral monótono y arduo. Especialmente, cuando se emplean procedimientos manuales, no informatizados. • La dispersión alcanzada en la muestra repercute negativamente en los costes de la investigación en encuestas mediante entrevista personal.

CUADRO 3.A. Extracto de una tabla de números aleatorios

96754 34357 06318 6211 1 47534

17676 86040 37403 52820 09243

55659 53364 49927 07243 67879

44105 71726 57715 79931 00544

47361 45690 50423 89292 23410

34833 66334 67372 84767 12740

98614 24856 96887 90801 55165

75993 03648 12479 21472 77312

84460 44898 80621 42815 83666

62846 09351 66223 77408 36028

59844 98795 86085 3739 O 28420

14922 18644 78285 76766 70219

)


130

Capítulo 3: El diseño de la muestra

Métodos de encuesta

3.4.2. Muestreo aleatorio sistemático Una variedad de muestreo probabilístico con frecuencia descrito como "muestreo aleatorio pseudosimple" (Sudman, 1983: 170). Pero, siempre y cuando el marco muestral esté aleatoriamente ordenado. Otros autores prefieren considerarlo "una forma de muestreo por conglomerados" (Lohr, 2000: 43), aunque matizando "desde el punto de vista tecnológico". Esta consideración responde a la imposibilidad de que dos unidades del marco muestral consecutivas sean extraídas para constituir la muestra. Excepto, lógicamente, que el coeficiente de elevación fuese "1". Lo cual es bastante improbable. Pero, ¿en qué consiste el muestreo aleatorio sistemático? ¿Qué diferencias y similitudes tiene con otros métodos de muestreo? Como el muestreo aleatorio simple, el sistemático exige la existencia de un marco muestral nominativo, que incluya datos de identificación que posibiliten la contactación de las unidades de población que aleatoriamente han sido elegidas para integrar la muestra. Aunque no precisa que éste sea un listado, ni que esté numerado. Pueden ser fichas de alumnos, papeletas, expedientes de pacientes, incluso la propia presencia física de unidades de la población (por ejemplo, personas que salen de una discoteca, bajan de un avión o entran en un centro comercial). Del muestreo aleatorio simple difiere en el procedimiento seguido en la extracción de la muestra. Sólo la primera unidad de la muestra se elige al azar. Mediante una tabla de números aleatorios, por sorteo, pidiendo a alguien que diga al azar un número o cualquier otro procedimiento que garantice la igual probabilidad de selección de los números incluidos en el coeficiente de elevación. Una vez calculado el tamaño de la muestra, para unos niveles de probabilidad y de error determinados, se procede a la estimación del coeficiente de elevación. Se divide el tamaño de la población en el marco muestral entre el tamaño de la muestra (N / n). De esta forma se secciona el marco en distintas agrupaciones, dependiendo del tamaño muestral, para que todas sus unidades tengan igual probabilidad de ser seleccionadas, desde el inicio hasta el final del marco muestral. El coeficiente de elevación expresa el número de veces que la muestra se halla contenida en la población del marco muestral. El número aleatoriamente elegido, con la única condición de que sea inferior al coeficiente de elevación, determina la elección de los siguientes. A él se va sumando, sucesivamente, el coeficiente de elevación hasta completar el tamaño de la muestra. Para agilizar el trabajo de campo, se recomienda extraer un "excedente" de unidades muestrales para las sustituciones (de aquellos a quienes no ha podido contactarse o han rechazado participar en la encuesta). Este excedente se consideraría previo a la extracción de la muestra, en la estimación del coeficiente de elevación. Ello evitaría I!e.ner que "volver" al marco muestral para buscar sustitutos a los no respondientes. ~n caso contrario, habría que repetir, de nuevo, el proceso para la selección de los susti~ tutos, garantizando su elección aleatoria. Es decir, habrá que calcular un nuevo coeficiente de elevación. A ser posible, considerando sólo las unidades de la población en el marco no seleccionadas en la fase inicial de extracción de la muestra (muestreo aleatorio sin reemplazamiento). Éstos se dividirán entre el número total de unidades que

131

aún se precisan para completar la muestra. En consecuencia, la nueva selección sistemática de unidades muestrales para "sustituir" a los no respondientes se restringirá a aquellos que queden para ser elegidos. Por esta razón, habría que eliminar del marco muestral a los ya contactados, antes de repetir el proceso de selección.

~i la selec.ci.ón de licenciados en Ciencias Políticas y Sociología colegiados, del ejemplo antenor, se hiCiese de forma aleatoria sistemática, en principio la actuación sería la siguiente:

a) Se calcula el intervalo de selección, determinado por el coeficiente de elevación = N 6.428 = 1.281 = 5,018. El marco quedaría seccionado en 1.281 conglomerados de

n

5 unidades (por el efecto del redondeo quedarían 23 unidades). b) Mediante un procedimiento aleatorio se elige un número igualo inferior a "5". Por ejemplo, el "~" ..L~ unid~d de la población en el marco a la que corresponda dicho número constltUlra la pnmera unidad elegida para formar la muestra. e) La extracción de las 1.280 unidades de la muestra restantes se hará sumando "siste~áticament~" el coeficiente de elevación a los números elegidos a partir del primer numero extr~ldo al azar. AI41e seguiría el 9, 14, 19,24,29,34,39, hasta completar las 1.281 u~ldades de la muestra. En consecuencia, se estaría eligiendo 1 unidad cada 5, a part~r del arranque aleatorio marcado por el número 4. O sea, todos los números terminados en 4 y en 9.

Para que .la m~~s,tra extraída. se asemeje a una muestra aleatoria simple es condique la dlSposlclOn de las umdades de población en el marco muestral sea "alea. Es decir, que su orden no siga un criterio que pueda estar relacionado con el probJlerrla de investigación. . Por eje~plo, en un l~stado de alu~nos se descartaría su ordenamiento por calificación ~edla en el ex~~dlente ~~adémlco porque no es aleatoria. Sí se aceptaría, por el c.ontrar~o: su ordenaclOn alfabetica, por el primer apellido, u otro criterio como los úl~~os dlg1~OS ~e su DN.I (D~cumento Nacional de Identificación). Cualquiera de estos ultImos cntenos permite eliminar la introducción de sesgos debidos a la periodicidad constante marcada por el coeficiente de elevación.

Las ventajas y los inconvenientes principales del muestreo aleatorio sistemático se en el cuadro 3.5.

re~;unlen


132

Capítulo 3: El diseño de la muestra

Métodos de encuesta

CUADRO 3.5. Ventajas e inconvenientes del muestreo aleatorio sistemático Inconvenientes

Ventajas o

o

Fácil aplicación. No precisa del uso continuo de una tabla de números aleatorios u otro procedimiento de asignación aleatoria. No exige que el marco muestral sea un listado. El marco puede adoptar formas varias: fichas, papeletas, expedientes, incluso la presencia física de unidades de la población.

o o

Necesita del recuento constante de las unidades de la población. Antes de la selección muestral, hay que desordenar el marco muestral (si éste se encuentra ordenado de acuerdo con algún criterio que favorezca la mayor representación de determinados segmentos de la población en la muestra).

3.4.3. Muestreo aleatorio estratificado Un método de muestreo probabilístico muy aplicado cuando se dispone de información sobre características de la población de interés. Consiste en la clasificación de la población del marco muestral en grupos o "estratos" mutuamente excluyentes (que son internamente homogéneos y diferentes de los otros grupos), con respecto a las características registradas en el marco muestral. Con ello se persiguen tres metas principales: a) Garantizar la presencia en la muestra de determinados grupos de población que, por su menor representación en la población, tienen escasa probabilidad de ser elegidos para formar la muestra por otros procedimientos aleatorios (simple, sistemático u otros). Y, en cambio, su estudio es de interés. Por ejemplo, en una encuesta sobre la calidad de la enseñanza universitaria, si no se clasifica previamente a la población por universidades, facultades y/o curso académico, en función del ámbito de estudio, no se asegura que los grupos de población menos numerosos (alumnos de universidades, de facultades o de cursos con un menor número de alumnos, como son los de doctorado) tengan suficiente presencia en la muestra, que posibilite su análisis separado. Y es objetivo de la encuesta el captar el estado de opinión de los distintos grupos de población afectados, no limitándose a aquellos que, por contar con un mayor volumen de población, tienen más probabilidad de ser elegidos en la muestra.

b) Poder aplicar diferentes métodos aleatorios para la selección de la muestra e, inclusive, métodos de encuesta, en los distintos grupos de población, dependiendo de la dificultad para su contactación.

133

c) La consecución de estimaciones de parámetros poblacionales más precisas en los distintos grupos de población, al reducirse su variabilidad. Siempre que se consigan grupos (o estratos) internamente muy homogéneos y diferentes de los otros grupos, en variables clave en la explicación del problema de investigación. De no ser así, se obtendrán estimaciones de similar precisión a la alcanzada sin proceder a la estratificación. La efectividad de la estratificación (medida en reducción del error muestra!) depende de cómo afecte la variable elegida para la estratificación al fenómeno que se estudia. Y, cuando se utilice más de una variable para la estratificación, es mejor que sean variables poco correlacionadas entre sí para conseguir grupos heterogéneos unos respecto de otros. Es condición que los estratos se formen de acuerdo con variables que se prevé afecten a la varianza de las variables cuya variabilidad quiere analizarse. Por ejemplo, por curso académico, si se espera que la opinión sobre la calidad de la enseñanza universitaria varía en función de los años cursados en la universidad. La estratificación por conveniencia de variables no relacionadas con el problema de investigación no contribuye, por el contrario, a la obtención de estimaciones de parámetros poblacionales más precisas porque su error muestral sea pequeño. Como la elección de las variables de estratificación está condicionada a aquellas incluidas en el marco muestral, las de uso más común son las variables sexo y edad. Éstas son las más presentes en la mayoría de los marcos muestrales. A ellas se suman otras variables sociodemográficas (como ocupación o estudios), cuando están presentes en el marco muestral. En estudios de ámbito nacional e internacional, primero se procede a la estratificación por ubicación geográfica: ámbito territorial (país, comunidad autónoma, provincia, municipio), tipo de hábitat (urbano, semiurbano, rural) o tamaño de hábitat (número de habitantes). Después, se realizan otras estratificaciones, en función de los objetivos de la encuesta y de la información proporcionada en los marcos muestrales que se utilicen para la extracción de la muestra. De acuerdo con Lynn y Lievesley (1991), para la mayoría de los objetivos de investigación no se precisa diferenciar tres o cuatro estadios o fases de estratificación. Tampoco se requiere la adopción de las mismas variables de estratificación para todas las muestras. Puede alcanzarse una mayor eficacia siguiendo un esquema de estratificación distinto para las variables incluidas en los diversos estadios de estratificación. De haber distintas fases en la estratificación, el orden de las variables dependerá de su relevancia en la explicación del problema de investigación. Como la primera variable de estratificación es la que más discrimina, en la primera fase de la estratificación ha de elegirse la variable de mayor relevancia. En la segunda fase, la segunda más importante y, así, consecutivamente, debido al poder decreciente de la estratificación. Las variables elegidas han de ser categóricas. En caso contrario, habrá que proceder a su categorización. Una vez clasificada la población en estratos, se afija la muestra en cada estrato. Por afijación se entiende la distribución del tamaño muestral global entre los estratos diferenciados. Existen distintas formas de realizar dicha distribución. Éstas se agrupan en dos amplias modalidades de estratificación: proporcional y no proporcional.


134

Métodos de encuesta Capítulo 3: El diseño de la muestra

Estratificación proporcional

Para la afijación simple se divide el tamaño total de la muestra entre el número de estratos. La cantidad obtenida expresará las unidades a observar en cada estrato.

Como su nombre indica, la afijación o distribución de la muestra se hace "proporcional" al peso relativo del estrato en el conjunto de la población. De modo que, a aquellos estratos que reúnan un mayor número de unidades de población les corresponderá un tamaño muestral superior al de aquellos que representen un porcentaje inferior. Por lo que la distribución de la muestra entre los estratos guarda correspondencia con el peso o representación de éstos en la población de estudio. Éste es el criterio de afijación más aplicado en la investigación mediante encuesta. Para su cálculo se multiplica la proporción que representa el estrato en la población por el tamaño de la muestra a afijar.

• Afijaci~n óptima. En la distribución de la muestra se considera, además del peso relativo deJ estrato en la población, su variabilidad (o heterogeneidad) respecto a la variable utilizada para la estratificación. De modo que, a los estratos de mayor peso poblacional y heterogeneidad les corresponderá un tamaño muestral superior al de aquellos más homogéneos y de menor volumen de población. Por ejemplo, la consideración de las zonas rurales como más homogéneas que las urbanas lleva al lNE (Instituto Nacional de Estadística) a "cargar" la mu~str~ ~n esta~ últimas, como indica Rodríguez Osuna (1991: 28). Su reahzaclOn preCisa del conocimiento previo de la varianza poblacional, respecto de las variables empleadas para la estratificación, en cada estrato. Esta información es difícil de conocer (los marcos muestrales no la proporcionan). A ~en?s que se haya analizado, con anterioridad, a la misma población (en un estudiO piloto ex profeso o en investigaciones periódicas). Esto explica su escasa práctica, pese a su consideración de "óptima". Sobre todo, cuando los estratos presentan distinta varianza. En caso contrario, se obtendría una distribución de la muestra similar a la proporcional. Para su cálculo se multiplica, en cada estrato, la proporción (o el porcentaje) q~e ~~pr~s~nta el estrato e.n el conjunto de la población por la varianza (o la desVlaClOn tlplca) ~orrespondiente. Después, se suman todos los productos y se calcula la proporCión que representa cada producto en el total. A continuación, cada una de estas proporciones se multiplica por la muestra a afijar. De este producto resulta el número de unidades de la población a observar en cada estrato. • Otr,a varie.dad de affjación ~o proporcional es aquella que se aplica cuando, por algun motivo, se qUiere realIZar un número determinado de entrevistas en un estrato concreto y el resto se afija "proporcionalmente" en los otros estratos. Aunque el tamaño muestral restante se distribuya en los demás estratos de acuerdo a su proporcionalidad, la distribución del conjunto de la muestra en los estratos ha ~lterado ~u debida proporcionalidad en el conjunto de la población (como se vera en el ejemplo de la ponderación).

Estratificación no proporcional

La que se hace, cuando la representación de los estratos en la muestra global no es proporcional a su peso en el conjunto de la población. Por el contrario, se ha dado una probabilidad desigual de selección en cada estrato. Bien porque se quiere analizar, con un mayor detalle, unos estratos concretos a los que proporcionalmente les correspondía un tamaño muestral inferior, bien para propiciar la representatividad de estimaciones muestrales en todos los estratos, o bien porque se considera la variabilidad en cada estrato, aparte de su peso en el conjunto de la población, entre otras causas. Las principales opciones de estratificación no proporcional son: • Afijación simple. Consiste en asignar el mismo tamaño muestral a cada estrato, indistintamente del peso que tenga en la población de estudio. La finalidad es que todos los estratos tengan la misma representación en la muestra, que posibilite la consecución de estimaciones muestrales igualmente significativas en cada uno de los estratos. Esta equidistribución del tamaño de la muestra conlleva, no obstante, un inconveniente importante: favorece a los estratos de menor volumen de población en menoscabo de aquellos de mayor magnitud. Se les adjudica un tamaño muestral superior al que les correspondería por su volumen de población. Para análisis por separado de cada estrato, esta mayor asignación de tamaño muestral contribuye al logro de estimaciones muestrales estadísticamente significativas en estratos que, por su menor presencia en la población, no la tendrían, si la muestra hubiese sido distribuida de forma proporcional a su peso real en la población. Pero, para el análisis conjunto de los estratos, habría que proceder a la previa ponderación de la muestra, para devolverla su debida proporcionalidad, como después se verá. En todos los estratos se ha administrado el mismo número de cuestionarios, cuando a unos les hubiese correspondido más y a otros menos, en función de su peso en la población.

135

..

. En la .Faculta~ de Ciencias Políticas y Sociología de la Universidad Complutense de Madnd se ~U1ere ~eahza.r una encuesta ~ara conocer el grado de satisfacción de los alumnos por en.s~nanza Impartida. Para garantizar que en la muestra estén representados alumnos de distintos cursos académicos, incluidos los alumnos de doctorado, se decide estratificar la


Capítulo 3: El diseño de la muestra

137

136· Métodos de encuesta población por curso. En un estudio previo se obtuvo que el 57% de los 5.014 al.umno.~ matriculados estaban satisfechos por la enseñanza recibida. Si bien, el grado de satlsfacclon se reducía al 41% entre los alumnos de primer curso y aumentaba hasta el 72% entre los de quinto curso. Para un error máximo de ±2% y un nivel de confianza del 95,5%, se obtiene un tamaño muestral de 1.646 alumnos a entrevistar. Su distribución en los estratos, de acuerdo con los tres criterios principales de afijación (simple, proporcional y óptima) se da en el cua-

dro 3.B.

Z 2PON - E 2 (N -1) + Z 2 pO

n_

2

=

(2

2

2

x 57 x 43 x 5.014 5.013) + (2 2 x 57 x 43)

x

=

1.646 unidades

Afijación óptima:

(A)

(B)

(C)

(D)

(E)

Porcentaje Población

Varianza

(A) x(B)

Proporción (C)

Afijación óptima

18,0 15,8 17,8 15,3 26,3 6,8 100,0

(O) x 1.646

.

2.419 2.499 2.139 2.275 2.016 2.449

43.542,0 39.484,2 38.074,2 34.807,5 53.020,8 16.653,2

0,193 0,175 0,169 0,154 0,235 0,074

317,68 288,05 278,17 253,48 386,81 121,80

2.451

225.581,9

1,000

1.645,99

CUADRO 3.B. Distribución de la muestra en estratos Afijación Curso

Varianza

Población

Simple

Proporcional

Óptima

Primero Segundo Tercero Cuarto Quinto Doctorado

903 792 891 769 1.316 343

2.419 2.499 2.139 2.275 2.016 2.449

274 274 274 274 274 274

296 260 293 252 433 112

318 288 278 253 387 122

Total

5.014

2.451

1.644

1.646

1.646

Afijación simple:

1.~46

Afijación proporcional:

=

274,33 unidades en cada estrato

0,180 0,158 0,178 0,153 0,263 0,068

x x x x x x

1.646 = 296,28 1.646 = 260,07 1.646 = 292,99 1.646 = 251,84 1.646 = 432,90 1.646 = 111,93

Si se considera la proporción que representa cada estrato, en el conjunto de la población la encuesta se hará a más alumnos matriculados en quinto curso (a 433 alumnos elegido~ aleatoriamente) y a menos de doctorado (112 alumnos). Estos últimos representan tan sólo el 6,8% de los alumnos inscritos en dicha facultad, mientras que el 26,3% son de quinto curso.

De acuerdo con la afijación óptima, también habría que encuestar a más alumnos de quinto curso, aunque en menor cuantía que si la afijación es proporcional. Exactamente, a 387 alumnos, que serán elegidos aleatoriamente de entre los matriculados en dicho curso académico. Ello se debe a que es el estrato de mayor volumen de alumnos matriculados en la facultad (el 26,3% de los 5.014 alumnos inscritos). Aunque su presencia en la muestra se reduce, respecto a la estratificación proporcional (de 433 pasa a 387 unidades muestrales), por ser el estrato de mayor homogeneidad de los diferenciados atendiendo a la variable de clasificación elegida: curso académico. Es decir, el de menor varianza poblacional (2.016). Por el contrario, aumenta la presencia en la muestra de los estratos más heterogéneos. Éstos obtienen una mayor presencia en la muestra que los estratos más homogéneos. Tanto más, cuanto mayor es la conjunción de heterogeneidad y proporción que representa en el conjunto de los alumnos de dicha facultad. De todas formas, compárense las cifras obtenidas con los tres tipos de afijación expuestas en el cuadro 3.B.

Cuando se realiza una estratificación no proporcional y se quieren estimaciones para el conjunto de la población (no para los estratos por separado), previamente ha de procederse a la ponderación de la muestra. Quiere esto decir, que ha de devolverse a la muestra final su debida proporcionalidad en el conjunto de la población; que su presencia sea acorde con su peso en la población total. Por el contrario, no se precisa de la ponderación, cuando sólo se realizan análisis individuales (de cada estrato por separado) o comparativo (de unos estratos respecto de otros). Por ponderación comúnmente se entiende el proceso de asignación de "pesos" a cada estrato de manera que logre compensar la desigual probabilidad de selección que, con la estratificación no proporcional, se ha dado a cada unidad de la población que compone el estrato. Mediante ella se quieren corregir las discrepancias entre la muestra y la población. Para ello se divide el porcentaje o proporción que representa el estrato en la población (de acuerdo con los datos censales tomados de referencia) entre el porcentaje o proporción que representa en la muestra, obteniéndose los "pesos" o coeficientes de ponderación. Éstos se multiplicarán por cada estimación muestral de los


138

Métodos de encuesta

estratos correspondientes para la obtención de estimaciones en la muestra en su conjunto. Para ello se sumarán los productos del coeficiente de ponderación por la estimación muestral en cada estrato, dividiéndose la suma total de los productos por el tamaño total de la muestra. En los ficheros de datos de la mayoría de los paquetes estadísticos se fijan los pesos a asignar a cada estrato o subconjunto de la población. El programa automáticamente cumplimentará la ponderación, antes de proceder a la tabulación conjunta y posterior análisis de la información obtenida. En la muestra "real", no en la ponderada, será en la que después se calculen los errores de muestreo y la consiguiente precisión de las estimaciones muestrales, como se verá en el apartado 3.5.

Para ilustrar el cálculo de los coeficientes de ponderación, se plantea el supuesto de una estratificación no proporcional consistente en afijar una porción determinada de la muestra total en un estrato concreto. El resto de la muestra se asignaría de forma proporcional entre los demás estratos. En el ejemplo anterior se decide incrementar la presencia en la muestra de los alumnos de doctorado para tener una base muestral mayor que contribuya a la significatividad de las estimaciones muestrales. En vez de seleccionar a 112 estudiantes de doctorado, como habría que hacer siguiendo la afijación proporcional, se opta por incrementar las unidades de la muestra en este estrato a 200. Las 1.446 unidades de la muestra restantes se distribuirán entre los cinco estratos que quedan de forma proporcional a su peso en el conjunto de la población, excluyendo a los alumnos de doctorado. Ello supondrá una dismihución del número de entrevistas a realizar en estos cinco estratos, al haberse aumentado la presencia en el total de la muestra de los alumnos de doctorado, como puede verse en el cuadro 3.C. Para análisis segmentados de los alumnos de cada curso académico no se precisa de la ponderación. Sí para dar estimaciones muestrales para la población en su conjunto. Exige "equilibrar" la muestra, devolverle su debida proporcionalidad, de acuerdo con la proporción "real" que representa cada estrato diferenciado en el conjunto de la población, antes de proceder al análisis conjunto de la muestra. Los coeficientes de ponderación se calculan dividiendo el porcentaje que representa cada estrato en la población entre el porcentaje que representa en la muestra extraída de forma no proporcional (al haberse asignado un mayor número de entrevistas en el sexto estrato que las debidas por su peso "real" en la población total). Como en el último estrato las unidades de la muestra son 200, en vez de 112 que le hubiese correspondido por representar sólo el 6,84% de los alumnos matriculados en dicha facultad, el coeficiente de ponderación es inferior a "1". Exactamente, 0,563 porque el número de unidades de la muestra, en dicho estrato, se tia casi duplicado. Lo que ha supuesto una reducción de la presencia en la muestra final de los cinco estratos restantes. Por esta ra-

Capítulo 3: El diseño de la muestra

139

CUADRO 3.C. Cálculo de los coeficientes de ponderación en una muestra estratificada no proporcionalmente

Curso

Población

.

(A) Porcentaje población

(B)

Afijación no Afijación proporcional proporcional'

Coeficiente Porcentaje ponderación muestra no (AlB) proporcional

Primero Segundo Tercero Cuarto Quinto Doctorado

903 792 891 769 1.316 343

18,01 15,80 17,77 15,34 26,25 6,84

296 260 293 252 433 112

280 245 276 238 407 200

17,01 14,88 16,77 14,46 24,73 12,15

Total

5.014

100,01

1.646

1.646

100,00

1,059 1,062 1,060 1,061 1,061 0,563

• Afijación no proporcional consistente en extraer 200 unidades de la muestra ent~e los alumnos d.e doctorado. Las 1.446 unidades de la muestra restantes se distribuyen de forma proporcional entre los CinCO estratos. Para ello se calcula, de nuevo, la proporción que representa cada uno de los cinco estratos rest~ntes en el conjunto de los alumnos, excluidos los de doctorado. Es decir, entre los 4.671 alumnos de los cinco cursos de licenciatura. La proporción así obtenida (por ejemplo, 903/4.671 =0,1933 Y 792/4.671 = 0,1696, etc.) se multiplica por la muestra que queda por afijar en estos cinco estratos: 1.446. Por ejemplo, 0,1933 x 1.446 = 280 Y 0,1696 x 1.446 = 245. En su conjunto es una afijación no proporcional po~que se ~a alterado el ~~­ so real de cada estrato en la población total de interés. Los alumnos de doctorado tienen mas representaclon en la muestra que la correspondiente a su peso en el conjunto de la población y ello ha supuesto una reducción de la muestra en los cinco estratos restantes.

zón sus coeficientes de ponderación son mayores de "1". Tanto más, cuantas menos unidades de la muestra se les ha asignado en relación con aquellas que debería habérseles asignado mediante una estratificación proporcional. Los coeficientes de ponderación también deberían calcularse con otros modos de estratificación no proporcional: la afijación simple y la óptima. El proceso habría sido el mismo. La división entre el porcentaje de la población real entre el porcentaje de la muestra. Los coeficientes de ponderación obtenidos se introducen en el paquete estadístico al uso para que, antes del cálculo de las estimaciones muestrales en el conjunto de la población, se sumen los distintos productos de los coeficientes de ponderación por las estimaciones muestrales en cada estrato y, después, se dividan por el tamaño total de la muestra. De esta forma se obtienen estimaciones "equilibradas" para el conjunto de la muestra.

Una vez delimitadas cuántas unidades de población extraer en cada estrato para formar la muestra, se procede a su elección por alguno de los procedimientos aleatorios que garantice la igual probabilidad de todos los integrantes del estrato para integrar la muestra. A diferencia del muestreo por cuotas, en el estratificado la selección de las unidades finales de la muestra se hace siguiendo procedimientos aleatorios (muestreo simple, sistemático, rutas aleatorias y otros incluidos en el subapartado 3.4.6), y no cri-


140

Capítulo 3: El diseño de la muestra

Métodos de encuesta

terios subjetivos. Ésta es la diferencia principal entre ambos métodos de muestreo, como se verá en el subapartado 3.4.7. Por último, el cuadro 3.6 resume las ventajas y los inconvenientes más destacados en el muestreo aleatorio estratificado. De las mencionadas, destacan sus beneficios en precisión de las estimaciones muestrales y para la organización del trabajo de campo. La creación de estratos o grupos de población de acuerdo con una característica, o conjunción de ellas (preferiblemente relacionadas con el problema de investigación), no sólo permite garantizar la presencia en la muestra de los distintos grupos de población, cuya variabilidad trata de analizarse. También, posibilita la aplicación de distintos marcos muestrales en cada estrato, de diferentes métodos de muestreo e, incluso, de encuesta, en consonancia con la dificultad en su contactación. Para cada estrato se extrae una muestra diferente. Las estimaciones globales para el conjunto de la población se obtienen de la conjunción de la extraída en cada estrato, tras haber sido "ponderada", sólo cuando se ha procedido a una estratificación no proporcional. Es condición que los estratos no se solapen, que comprendan al conjunto de la población de interés y que las unidades que constituyen el estrato sean muy homogéneas, respecto de la variable de estudio. De esta forma, la variabilidad dentro del estrato se reduce, obteniéndose estimaciones de parámetros poblacionales más precisas.

CUADRO 3.6. Ventajas e inconvenientes del muestreo aleatorio estratificado Ventajas

Inconvenientes

• Obtención de estimaciones muestrales más precisas, al reducirse el error muestral. • Garantiza la presencia, en la muestra, de distintos grupos de población en variables clave para el problema de investigación. • Pueden utilizarse distintos marcos muestrales, métodos de muestreo y de encuesta en cada estrato, en función de la información disponible y de la dificultad de acceso a los distintos grupos de población. • Facilita la organización del trabajo de

• Requiere más información del marco muestral que el muestreo aleatorio simple (para identificar a la población de cada estrato). Lo cual puede resultar costoso. • Supone cálculos estadísticos de cierta complejidad.

campo.

3.4.4. Muestreo aleatorio por conglomerados

Un método de muestreo probabilístico de gran aplicación en la encuesta personal a poblaciones espacialmente dispersas, debido a su menor coste, es el muestreo aleatorio por conglomerados. Como en el muestreo aleatorio estratificado, en el de con-

141

glomerados también se procede a la selección aleatoria de conjuntos de población. Pero ahora ~e les llama "conglomerados", en vez de "estratos". Los conglomerados pueden ser demarcaciones territoriales de la población de interés (país, comunidad autónoma, municipio, distrito, áreas censales, viviendas). También, organizaciones o instituciones (colegios, hospitales, tribunales, centros penitenciarios), e incluso conglomerados artificiales como, por ejemplo, las urnas electorales. Se trata de extraer, mediante algún procedimiento aleatorio, una muestra de conglomerados y, en los elegidos, seleccionar, igualmente al azar, las unidades que compondrán la muestra. Al igual que el muestreo estratificado, el de conglomerados implica la agrupación de las unidades de la población (ahora en conglomerados) como fase previa a la extracción de la muestra. Si bien, difiere del muestreo estratificado en varios aspectos importantes: a) En el muestreo estratificado la unidad de muestreo es unitaria (el individuo). En el muestreo por conglomerados, el conglomerado (o conjunto de individuos). b) En el muestreo estratificado se procede a la extracción muestral en todos los grupos o estratos formados de acuerdo con las variables (o conjunción de variables) de estratificación. En el muestreo por conglomerados se extrae una muestra aleatoria de conglomerados. Los integrantes de los conglomerados elegidos constituirán la muestra. c) En el muestreo estratificado se busca la homogeneidad dentro del estrato y la heterogeneidad entre los estratos. Los grupos se forman para crear grupos de población internamente homogéneos respecto de la(s) variable(s) de interés. Lo que contribuye a la precisión de las estimaciones muestrales. En el muestreo por conglomerados es a la inversa. El error muestral disminuye, conforme aumenta la heterogeneidad dentro del conglomerado. Como sólo se seleccionan algunos de los conglomerados existentes, se busca que los elegidos sean internamente heterogéneos. Es decir, que constituyan una adecuada representación de la variedad de los componentes de la población. Pero, como esto no siempre es posible, al tratarse generalmente de divisiones naturales de la población, el muestreo por conglomerados resulta en pérdida de precisión de las estimaciones muestrales. Tanto más, cuanto menos heterogéneas sean las unidades que compongan el conglomerado.

Pese a ello, se opta por la conglomeración principalmente para abaratar los costes de la encuesta. En encuestas a hogares mediante entrevista cara a cara, por ejemplo, los costes del trabajo de campo en tiempo y dinero (dietas a los entrevistadores, costes de desplazamiento y demás) se desorbitan, conforme aumenta la dispersión espacial de las unidades de la población a ser entrevistadas. Con la conglomeración se busca reducir los desplazamientos de los entrevistadores, haciendo un mayor número de entrevistas en un mismo espacio territorial delimitado. Por ejemplo, si en un bloque de viviendas (la unidad de muestreo primaria o conglomerado) se entrevista a 10 familias (la unidad de muestreo secundaria), en vez de a


142

Métodos de encuesta

una sola familia y las nueve restantes se eligen de otros bloques de viviendas (porque se ha procedido a un muestreo aleatorio simple o sistemático), sin duda se ahorra en tiempo y dinero en la ejecución del trabajo de campo. Pero, a cambio de incrementar el error muestral, al ser más probable la homogeneidad entre las 10 familias aleatoriamente extraídas de un mismo bloque que de 10 bloques diferentes. Lo mismo sucedería si hubiese que entrevistar "cara a cara" a médicos de centros de salud. Es más barato extraer una pequeña muestra aleatoria de centros de salud y, en los centros seleccionados, entrevistar a un mayor número de médicos, que enviar a un entrevistador a centros de salud dispersos para sólo realizar una o dos entrevistas.

El ahorro en costes económicos y temporales en la ejecución del trabajo de campo en la encuesta cara a cara, junto con la dificultad de elaborar una lista exhaustiva de todos los integrantes de la población de estudio, son las dos principales razones para la aplicación de un muestreo aleatorio por conglomerados. Para la selección de los conglomerados pueden seguirse las recomendaciones destacadas por Sudman (1976): a) Los conglomerados han de estar bien definidos y didimitados. Cada unidad de la población sólo puede pertenecer a un único conglomerado. b) El número de elementos que componen el conglomerado ha de ser conocido previamente, aunque sea de manera aproximada. c) Los conglomerados elegidos han de ser pocos, si realmente se quiere reducir los costes de la investigación. Pero adviértase que esto es cuando se prima la "rentabilidad". Si se busca, por el contrario, reducir el error muestral, habrá que aumentar el número de conglomerados, reduciendo el número de unidades de la muestra a seleccionar en cada uno de ellos. d) Los conglomerados deberían escogerse de manera que se consiga reducir el aumento en error muestral consiguiente a la conglomeración. e) Los conglomerados no tienen por qué estar idénticamente definidos en todos los lugares. Cuando se muestrean individuos u hogares en áreas urbanas o semiurbanas, los conglomerados suelen ser bloques o conjunto de bloques. En cambio, en áreas rurales, los conglomerados suelen ser segmentos geográficos limitados por carreteras y fronteras naturales (como ríos y lagos).

El muestreo aleatorio por conglomerados puede ser singular o monoetápico (si todas las unidades de población en los conglomerados elegidos integran la muestra), bietápico o polietápico. Bietápico, cuando la selección muestral prosigue dentro de cada conglomerado, en una segunda fase. Quiere esto decir que, en cada uno de los conglomerados elegidos aleatoriamente se procede a la extracción aleatoria de una nueva muestra. Si el proceso de selección concluye aquí, se está ante un muestreo por conglomerados de dos etapas o fases. Pero, si la selección aleatoria de las unidades últimas de la muestra prosigue, se está ante un muestreo por conglomerados polietápico de tres, cuatro e, inclusive, más fases. Estos últimos no son diseños muestrales infrecuentes. Precisamente, como subrayan Lynn y Lievesley (1991), lo usual es que el número de fases o etapas comprendidas en el muestreo polietápico sean tres o cuatro.

Capítulo 3: El diseño de la muestra

143

En el muestreo por conglomerados polietápico o polifásico, la unidad de muestreo final no son los conglomerados, sino subdivisiones de éstos. No se toma a cada uno de los integrantes de los conglomerados elegidos mediante algún procedimiento aleatorio, sino subdivisiones de éstos. Únicamente se toma una parte de los conglomerados, también seleccionados de forma aleatoria. Ello supone muestrear (como su nombre indica) en varias fases o niveles. Implica varios procedimientos de selección muestral, incluyendo la estratificación. Por ejemplo, si se quisiese encuestar a médicos de centros de salud, se podría proceder, primero, a seccionar los distintos municipios que constituyen el ámbito de la encuesta en áreas sanitarias. La primera fase de muestreo consistiría en la selección aleatoria de áreas sanitarias. La segunda fase, la selección aleatoria de centros de salud en las áreas sanitarias que hayan sido seleccionadas. Cuando se entrevista a todos los médicos de los centros elegidos, se está ante un muestreo de conglomerados de dos fases (bietápico). Si, por el contrario, se procede a la selección aleatoria de médicos, en cada centro de salud de los elegidos, la muestra por conglomerados tendrá tres fases (trietápico). Los centros de salud constituyen los conglomerados y los médicos las unidades de observación.

UNIVERSIDAD

ALBERTO

HURTADO

'3\1------=B~I"=B":'""LIOTECA

Se desea encuestar cara a cara a 1.300 profesores universitarios españoles, con el propósito de conocer su opinión sobre los nuevos planes de estudio. Como la encuesta es de ámbito nacional, la selección de la muestra siguiendo el procedimiento aleatorio simple elevaría considerablemente los costes de la investigación. A la dificultad de encontrar un marco incluyera a todos los profesores universitarios españoles (tanto de universidades públi(~as como privadas), se sumaría el aumento de los costes por desplazamiento de los entrevistadores a puntos dispersos del país. Lo más fácil será acceder a un listado que incluya al conjunto de las universidades españolas (públicas y privadas) para, a continuación, proceder a la extracción muestral polie(ápica por conglomerados. Ésta podría consistir en:

a) Listar todas las universidades españolas, tanto públicas como privadas. Este listado constituirá el marco inicial para la extracción de la muestra. En la selección de la muestra nacional de universidades podría estratificarse por tipo de universidad (pública y privada y, dentro de esta última, diferenciándose por confesionales y no confesionales) y por ubicación geográfica (Comunidad Autónoma). Ello asegura la representación de las unidades de muestreo primarias (las universidades) en conformidad con las variables de estratificación elegidas: dispersión geográfica y tipo de universidad.


144

Capítulo 3: El diseño de la muestra

Métodos de encuesta

También conviene -para alcanzar una mayor precisión- que las unidades primarias de muestreo elegidas sean bastante heterogéneas respecto a las características que se analizan. De esta forma se facilita que la variedad del universo de estudio quede reflejada en la muestra. Asimismo, se recomienda que -como regla- no proceda más del 7% de la muestra total de una sola unidad de muestreo primaria (Lynn y Lievesley, 1991). Interesa que las unidades de muestreo primarias sean bastante heterogéneas respecto al problema de investigación. La heterogeneidad es más probable que se dé cuanto más ampliamente se definan las unidades primarias. b) Elegir (de las universidades seleccionadas) una muestra de facultades mediante alguno de los procedimientos de selección aleatoria (simple, sistemática, estratificada). c) Para cada una de las facultades escogidas, extraer una muestra aleatoria de profesores. A tal fin se acude a un nuevo marco de muestreo: el listado de los p r9fe sores pertenecientes a las facultades que han resultado elegidas. Éstos podrían, a su vez, muestrearse conforme a los criterios de categoría profesional (catedrático, titular, profesor asociado, ayudante), dedicación (a tiempo completo o parcial), yantigüedad docente, aplicando un muestreo aleatorio estratificado o por cuotas. Si se opta por el estratificado, la elección de los profesores cuyas características se ajusten a los estratos diferenciados será totalmente aleatoria (muestreo simple, sistemático). En cambio, si se decide el de cuotas, la elección de los profesores será arbitraria, con la única condición de que compartan las características fijadas en las cuotas. Pero también podría extraerse una muestra aleatoria de departamentos y entrevistar a todos los profesores que lo integran. Esto último supondría reducir el número de departamentos elegidos. O podría optarse por una selección aleatoria de profesores en cada departamento. Lo cual permitiría ampliar el número de departamentos en la muestra y conseguir que ésta fuese más heterogénea, con la consiguiente reducción en el error de muestreo. Es más probable encontrar más heterogeneidad entre profesores de departamentos y de facultades diferentes que entre aquellos de un mismo departamento y facultad. El diseño muestral que resulte de la conjunción de estas fases se corresponderá con la precisión que el investigador quiera dar a las estimaciones muestrales. Esto tiene una repercusión directa en los costes de la investigación. Por ejemplo, en la elección del número de facultades y de profesores a entrevistar en cada facultad las opciones posibles son diversas. Dependerá del presupuesto destinado a la realización del trabajo de campo y de la heterogeneidad de los conglomerados, principalmente. El investigador tendrá que decidir si aumentar el número de facultades, disminuyendo el número de profesores a entrevistar en cada una de ellas, o proceder a la inversa (reducir el número de facultades, incrementando el número de profesores a encuestar). La primera opción supone aumentar -para un mismo tamaño muestral (1.300 unidades)- los costes (en tiempo y dinero) de la investigación. A continuación se exponen algunas de las opciones posibles:

Número de facultades

Número de profesores

5 10 15 20 30 40

260 130

.

145

87

65 43 33

Si fuesen 5 las facultades elegidas (entrevistándose a 260 profesores, en cada una de ellas), los costes del trabajo de campo serían inferiores, pero también sería mayor el error muestral que cuando se eligiesen 40 facultades y, en cada una de ellas, se entrevistase a 33 profesores. En general, se recomienda aumentar el número de conglomerados (en este caso de facultades) con preferencia a elevar el número de individuos a observar en cada uno de ellos (los profesores). La razón está en la probable hom9geneidad de los conglomerados elegidos, aunque se haya hecho de forma aleatoria. Cuando éstos son bastante homogéneos, no se precisa añadir más elementos del conglomerado a la muestra porque se obtendría una información redundante, al ser similares las características de las unidades que forman el conglomerado. En este caso (cuando los conglomerados son homogéneos), se aconseja ampliar el número de conglomerados para, de esta forma, abarcar una mayor variedad de la población de interés. Por el contrario, si los conglomerados fuesen heterogéneos, la mejor opción (entendida como reducción del error muestra~ sería la opuesta: reducir el número de conglomerados, aumentando las unidades a observar en cada uno de ellos. En suma, la varianza (homogeneidad o heterogeneidad) del conglomerado afecta al número de conglomerados a elegir. La probabilidad de selección de cada uno de los integrantes de los conglomerados será igual al número de unidades a elegir de cada conglomerado dividido por el número de unidades contenidas en el conglomerado.

En encuestas nacionales a la población en general, lo usual es aplicar un muestreo por conglomerados polietápico, que incluye la previa estratificación de la población de estudio. Primero, la población se estratifica por región y tamaño de hábitat. En España, para la estratificación por región se aplica la actual división política administrativa del país en comunidades autónomas. Normalmente, la asignación del tamaño la muestra se hace proporcionalmente, de acuerdo con su peso en el conjunto de la población. Después, se procede a la extracción aleatoria de los municipios o puntos de muestreo, con probabilidad proporcional al peso de la población de cada municipio. Para la selección de los puntos de muestreo lo común es utilizar datos agregados (frecuencias absolutas acumuladas de la población en cada estrato diferenciado por su tamaño poblacional) y la tabla de números aleatorios, como se ilustra en el ejemplo a continuación.


146

Métodos de encuesta

En los municipios elegidos se procede a la selección aleatoria de áreas o secciones estadísticas (como pueden ser las secciones censales en los municipios extraídos para la muestra) dentro de los municipios. En las áreas seleccionadas se elegirán, mediante algún procedimiento aleatorio, las viviendas u hogares (habitualmente aplicando el muestreo por rutas aleatorias) y los individuos (las unidades últimas de muestreo) en ellas. La selección de los individuos se hará siguiendo el muestreo por cuotas u otro de los mencionados en el subapartado 3.4.6, ya de forma aislada, ya combinada. En las encuestas a la población en general, el nivel de agregación habitual suelen ser las viviendas o los hogares. La unidad familiar o del hogar se presenta como un conglomerado. En él habrá que proceder a la selección aleatoria de uno o varios de sus integrantes. Generalmente se desaconseja la realización de más de una entrevista en un mismo hogar o vivienda porque se prevé una mayor homogeneidad entre sus integrantes que entre aquellos elegidos de hogares diferentes. Y, como ya se ha dicho de forma reiterada, en la consecución de una muestra "representativa" se prima la heterogeneidad, como estrategia para reducir el error muestral. El Centro de Investigaciones Sociológicas (CIS), según información proporcionada por uno de sus anteriores responsables del diseño de las muestras para encuestas personales, Rodríguez Osuna (1991: 40), utiliza las secciones censales (unidades de segunda etapa) para seleccionar las unidades de la muestra. Normalmente, en torno a 10 entrevistas por sección, porque se prefiere seleccionar un número elevado de secciones. Las entrevistas se realizan sólo en las secciones censales elegidas y únicamente en las viviendas. El éxito de la encuesta radicará en la rigurosa aplicación de la aleatoriedad y en evitar el recurso fácil a la sustitución de los no contactados. De nuevo, se insiste en la necesidad de hacer, al menos, hasta tres revisitas previo a la sustitución. El Instituto Nacional de Estadística (INE), al tener acceso a la información completa por los Censos de Población, utiliza, en cambio, los listados sobre la composición de las secciones censales (viviendas, hogares, individuos), en sus encuestas a hogares.

Para ilustrar el procedimiento habitual seguido en la selección de los puntos de muestreo (municipios), en encuestas a la población en general, a nivel provincial, autonómico, nacional e intemacional, se plantea el siguiente supuesto: una encuesta a la población de 65 y más años en la Comunidad Autónoma de Madrid, para conocer sus condiciones de vida. El ámbito de la encuesta se restringe a la población mayor que reside en hogares propios o ajenos. Se excluye a la población en residencias para la tercera edad u otros centros asistenciales. La encuesta se hará mediante entrevista personal en domicilios. De acuerdo con el reciente Censo de Población y Vivienda de 2001, en la Comunidad de Madrid residen, a dicha fe-

Capítulo 3: El diseño de la muestra

147

cha, 771.683 personas de 65 y más años. Para un error muestral máximo de ±2%, un nivel de confianza del 95,5% y el supuesto de máxima heterogeneidad poblacional (P = Q =50), al no disponer de información previa de la varianza poblacional en la variable de estudio, se fija el tamaño muestral en el conjunto de la Comunidad de Madrid en 1.600 unidades muestrales. Éstas se extraerán de forma proporcional al peso de los municipios elegidos en el conjunto de la población de Madrid. Los municipios de la Comunidad de Madrid se estratifican por tamaño de hábitat para proceder a la afíjación proporcional de la muestra, en función de su tamaño y el número de entrevistas a afijar. Para la formación de los estratos, según tipo de hábitat, se decide segmentar la población en cinco estratos. Como el municipio de Madrid agrupa al 72,42% de la población de 65 y más años, podría plantearse una estratificación no proporcional, reduciendo el número de entrevistas a hacer en dicho municipio para incrementar el tamaño de la muestra en los otros estratos. Pero, como en el caso más desfavorable, el primer estrato diferenciado (de menos de 1.000 habitantes), supone un tamaño muestral de 130 por afijación proporcional, se acaba haciendo una estratificación proporcional. CUADRO 3.0. Determinación del número de puntos de muestreo de acuerdo con la estratificación proporcional, según la distribución de la población de 65 y más años residente en la Comunidad de Madrid

..

Tamaño del municipio por población de 65 y más años residente

Número de municipios

Población total de 65 y más años

Proporción que representa

Afijación proporcional

Número de puntos de muestreo

Menos de 1.000 hab. De 1.000 a 5.000 De 5.001 a 10.000 De 10.001 a 50.000 Más de 50.000

145 21 7 5 1

40.057 47.501 45.241 80.022 558.862

0,0519 0,0616 0,0586 0,1037 0,7242

130 154 147 259 1.810

8 6 3 2 1

Total

179

771.683

1,0000

2.500

20

El número de puntos de muestreo se determina considerando el número de municipios en cada estrato y su población. Obviamente, en el quinto estrato sólo hay un municipio, que es Madrid. Por consiguiente, no habría que proceder a la selección aleatoria de municipios en dicho estrato. Pero sí en los cuatro restantes. Para ilustrar el proceso seguido en la elección de los municipios se toma el cuarto estrato (aquel que agrupa a los municipios de 10.001 a 50.000 habitantes de 65 y más años), por ser el siguiente que reúne un menor número de municipios. En los demás estratos, el procedimiento a seguir sería el mismo. Primero, se listan los municipios incluidos en el estrato. Segundo, se calcula la frecuencia absoluta acumulada de su población, sumando la habida en los estratos precedentes. Después, se seleccionan números aleatorios. Tantos como puntos de muestreo se tengan que elegir. En el cuarto estrato son sólo dos. De la lista de números aleatorios del Anexo, se extraen los dos primeros de la primera columna, que cumplen la condición de ser igualo inferior a 80.022. Cantidad que representa a la población total agrupada en dicho estrato. En el cuadro 3.E puede verse que, de acuerdo


148

Capítulo 3: El diseño de la muestra

Métodos de encuesta

con las frecuencias absolutas acumuladas, los dos municipios elegidos (las unidades de muestreo de segunda etapa) son aquellos que primero incluyen al número aleatorio seleccionado: Móstoles y Alcorcón. CUADRO 3.E. Elección aleatoria de los municipios (o puntos de muestreo) en el cuarto estrato

De 10.001 a 50.000 habitantes

Población de 65 y más años

Frecuencia absoluta acumulada

Número aleatorio

Móstoles Getafe Alcalá de Henares Alcorcón Leganés

14.863 15.617 15.921 15.929 17.692

14.863 30.480 46.401 62.330 80.022

06318

Total

80.022

47534

El número de entrevistas a realizar en cada municipio será proporcional a su peso. Asimismo, partiendo de la hipótesis de que las condiciones de vida pueden estar afectadas por la edad de la persona, se decide la distribución proporcional de la muestra en cada municipio por cuotas de género y edad. La distribución de las entrevistas en los municipios de Madrid, Móstoles y Alcorcón se da en el cuadro 3.F.

CUADRO 3.F. Distribución proporcional de la muestra en los municipios del cuarto y quinto estrato por cuotas de género y edad

Población total de 65 y más años

65-69

70·80

Más de 80

65-69

70-80

Más de 80

Móstoles Alcorcón

14.863 15.929

2.350 2.890

2.856 2.932

1.016 1.074

2.533 2.994

3.946 3.785

2.162 2.254

Total

30.792

5.240

5.788

2.090

5.527

7.731

4.416

558.862

73.878

107.118

39.048

94.640

157.775

86.403

Municipios

Madrid

Varones

Mujeres

149

Si la encuesta se realiza en las viviendas donde residen las unidades de la población a encuestar (personas de 65 y más años), pueden seleccionarse aleatoriamente los hogares partir de la elección, también aleatoria, de secciones censales (las unidades de muestreo de segunda etapa) por distrito. Alcorcón, por ejemplo, administrativamente se halla seccionado en cuatro distritos con las siguientes secciones censales: 17, en el distrito 1; 34, en el distrito 2; 29, en el distrito 3; y 28, en el distrito 4. Madrid cuenta con 21 distritos y las secciones censales van desde 27, en el distrito 21, hasta 217, en el distrito 10. Debería concretarse el número de entrevistas a realizar en cada sección. En encuestas a la población general, el CIS, como antes se indicó, fija en un número alrededor de 10 las entrevistas a hacer por sección. Ello propicia una mayor heterogeneidad en la muestra conjunta. En el supuesto aquí ilustrado, al tratarse de una población más restringida (de 65 y más años), podría elevarse el número de entrevistas a hacer por sección. Por ejemplo, a 15, e inclusive 20, dependiendo de lo que se prime: ahorro de costes en el ~rabajo de campo o mayor precisión de las estimaciones de los parámetros poblacionales. Esta se alcanza cuanto más heterogénea sea la muestra. Es decir, cuanto menos concentrada esté en unos conglomerados concretos. La elección de los individuos (unidades muestrales de tercera etapa) se haría mediante la realización de muestreos de áreas y de rutas aleatorias en cada sección que resulte elegida (como se indica en el subapartado 3.4.5). Su aplicación requiere el conocimiento preciso de las secciones censales seleccionadas. Elegida la vivienda, se procedería a la elección, también aleatoria, de la persona dentro de la vivienda, siguiendo alguno de los procedimientos aleatorios incluidos en el subapartado 3.4.6, a cuya lectura se remite.

El cuadro 3.7 resume las ventajas y los inconvenientes principales del muestreo aleatorio por conglomerados. Se insiste en su aplicabilidad en: a) Encuestas personales de ámbito nacional e internacional, que supongan una considerable dispersión de la muestra. b) Cuando exista dificultad para la obtención de un marco muestral exhaustivo, que incluya a todos los componentes de la población de estudio. Lo cual imposibilitaría la práctica de otro método de muestreo probabilístico, que sí podría aplicarse en conglomerados concretos (con un muestreo por conglomerados polietápico). c) Se quiera reducir los costes económicos y la duración del trabajo de campo en la encuesta personal, especialmente.

Unidades muestrales Móstoles Alcorcón

125 134

20 24

24 25

9 9

21 25

33 32

18 19

Total

259

44

49

18

46

65

37

1.810

239

347

126

307

511

280

Madrid

3.4.5. Muestreo de áreas y rutas aleatorias

El muestreo de áreas comúnmente se aplica para la selección aleatoria de viviendas, cuando las unidades de muestreo son personas y familias. Pero también se aplica para la selección aleatoria de granjas, cosechas (en encuestas agrícolas), empresas u otras edificaciones distintas a las viviendas. Su realización exige la existencia de mapas


150

Capítulo 3: El diseño de la muestra

Métodos de encuesta

CUADRO 3.7. Ventajas e inconvenientes del muestreo aleatorio por conglomerados Ventajas

Inconvenientes

• Simplifica la elaboración del marco muestral. No exige un listado de todas las unidades de la población de interés. Sólo de los conglomerados aleatoriamente elegidos. • Al concentrarse el trabajo de campo en un número limitado de puntos de muestreo, se reducen los costes económicos y temporales de la encuesta personal.

• Mayor error muestral y la consiguiente menor precisión de las estimaciones de los parámetros poblacionales, al haber más homogeneidad que heterogeneidad en los conglomerados*. • Requiere cálculos estadísticos complejos en la estimación del error muestral, principalmente. También de pesos para compensar distintas probabilidades de selección y de errores de no cobertura. • Para muestreos por conglomerados polietápicos se requieren marcos muestrales específicos para cada etapa en la selección de la muestra.

* El error muestral puede reducirse aumentando el número de conglomerados. Además, los conglomerados grandes suelen ser más heterogéneos que los pequeños.

que cubran el área del ámbito espacial de la encuesta. Éstos actúan como marcos de muestreo. La zona geográfica de interés (país, comunidad autónoma, provincia, municipio) se divide en áreas, que constituyen unidades de muestreo primarias. Después, se procede a la selección aleatoria de áreas. En las elegidas se crean nuevos mapas, que ayuden en la elección aleatoria de subáreas, hasta concluir en la extracción, igualmente aleatoria, de las unidades últimas de muestreo. En la selección de viviendas, los mapas han de especificar claramente los límites de las áreas de la población de estudio. Se excluirá, por tanto, toda área que no contenga edificios de viviendas (parques, colegios, iglesias, estaciones ferroviarias, de autobuses, hospitales, centros de internamiento). Si bien, Kish (1965/1995) advierte que estos lugares pueden contener viviendas de las personas que están a su cuidado; es decir, trabajadores que pueden pertenecer a la población de interés en la encuesta. A continuación, el área se divide en bloques porque contienen viviendas y tienen límites claramente identificados. Los bloques se estratifican de acuerdo con su similaridad para que en la muestra estén representados los diversos vecindarios del municipio. Se parte del supuesto de que los habitantes de un mismo vecindario comparten un perfil sociodemográfico similar. Además, permite utilizar diferentes grados de conglomeración en distintos estratos. De modo que, "en estratos con elevados costes por bloque de la muestra, podamos seleccionar menos bloques, con submuestras más grandes por bloque de la muestra" (Kish, 1965: 306). Los bloques se numeran y se

151

les asignan medidas de tamaño, en función de las viviendas que incluyan, según la información disponible. En caso contrario, puede asignársele un número aproximado, en consonancia con el tamaño promedio de las viviendas en los vecindarios en los que se procederá a la elección aleatoria de viviendas. A este respecto, el procedimiento más sencillo consiste en la selección sistemática de los bloques de la muestra, con el intervalo de selección aplicado a una lista de números de bloque. Este proceso de extracción muestral es, en palabras de Kish (1965: 308-309), "más fácil y adecuado" en la mayoría de los casos. Por el contrario la se' lección "a pares" de bloques precisa más cuidado.' En las encuestas personales en domicilios en las que se utilizan las secciones censales como unidades de segunda etapa (en un muestreo por conglomerados polietápico), como hace el CIS, la selección aleatoria de viviendas en las secciones elegidas se hace -colUo indica Rodríguez Osuna (1991)- de dos formas principales. Una consiste en el estudio detallado, previo a la selección, de las secciones. El coordinador de la zona ~cula; de fo.~a aproximada, el número de viviendas y las refleja en un croquis. A partir de el, se flJa la ruta y la frecuencia de selección de los entrevistados: uno cada 100 \yiviendas,p0r. ejemplo. Después, se extrae un número aleatorio, que es el que marca . la ruta a segun para la elección aleatoria de la vivienda. \ El segundo procedimiento al que se hace referencia es el específicamente conocido fomo método de rutas aleatorias. Persigue la selección aleatoria de viviendas procuran.do mantener el principio de "equiprobabilidad", presente en todo muestreo aleatono. '< ~e denomina muestreo de rutas porque se establece la "ruta" o itinerario que el entrevlstador ha de seguir en la selección de las unidades muestrales. Las rutas se eligen de forma "aleatoria", sobre un mapa del municipio concreto donde han de realizarse s~mtrevistas. En el mapa se indican múltiples puntos de partida o de inicio de rutas slbl.es. ~~rmalme~te, el punto de partida corresponde a un edificio determinado por a dlrecclOn (por ejemplo, la calle Serrano n.O 22). Pero, en entidades de población equeñas (núcleos rurales), el punto de inicio de la ruta suele corresponder a edificios <;entr~les, com~ ,el ayunt,amiento, la iglesia o la plaza del pueblo. La longitud de la rutaesta en funclOn del numero de entrevistas a realizar en el área demarcada. Su ori~l':n es la direcció,n o punto de pa~tida de la ruta. Su final, la última vivienda en la que Se completa el numero de entrevlstas a hacer en dicha área. ; . . Una vez que se ha elegido aleatoriamente el comienzo de la ruta el entrevisfador d,eberá tomar una dirección.u o.tra, siguiendo las normas fijadas po; el equipo inves-{lgador. En estas normas se mdlcan: a) Los giros que han de realizarse: a la izquierda o a la derecha. b) Los edificios a entrar: como los terminados en una cifra específica (por ejemplo los acabados en 2). ' c) Si el edificio comprende más de una vivienda, se especifica la elección de la escalera (si hay más de una), de la planta, de la vivienda en la planta (siguiendo una tabla de números aleatorios específica) y, por último, de la persona a en-


152

Métodos de encuesta

trevistar en cada vivienda (de acuerdo con las cuotas fijadas u otro de los procedimientos indicados en el subapartado 3.4.6 para la selección de personas en un mismo hogar o vivienda). En las hojas de ruta el entrevistador registra las actuaciones seguidas hasta la localización de los sujetos de la muestra, así como cualquier incidencia de utilidad para la supervisión del trabajo de campo. Normalmente incluye el número de entrevista, la dirección seguida (giro, calle o plaza, número), la selección de la vivienda (número total de plantas en el edificio, la planta elegida, número total de puertas en la planta, la puerta elegida). Si la entrevista se llevó a efecto, la hora de realización, el sexo y la edad del entrevistado. En caso contrario, se anota el motivo de su no realización (no respuesta por no contacto o por rechazo).

Como ilustración de un muestreo de rutas aleatorias se extractan criterios seguidos por el Centro de Estudios de Mercado Socioeconómicos y de Opinión, S. A. (Emopública), incluidos en un Manual_del Entrevistador elaborado por dicho centro.

Dirección de partida La dirección de partida corresponderá a un edificio, que vendrá determinado por una dirección (por ejemplo, calle Capitán Haya n.o 65). En entidades pequeñas de población es un edificio concreto (por ejemplo, el Ayuntamiento). En la localización d~ la dirección de partida pueden producirse las siguientes situaciones: 1. Que el número designado como punto de partida no exista en la calle. En este caso, se tomará, como punto de partida, el edificio cuya numeración corresponda al primer número correlativo inferior que se encuentre (siendo éste par o impar, según el número dado como punto de partida). 2. Que el número designado se encuentre repetido. Pueden darse tres casos: • Números bis: se considera el número primitivo. • Números repetidos: el punto de partida será aquel número que ocupe el primer lugar, teniendo en cuenta el orden creciente de la numeración de la calle. • Numeración doble (antigua y moderna): siempre se considera la más moderna. 3. Que termine la numeración de la calle antes de llegar al número dado como punto de partida. En este caso se tomará el edificio, dentro de la misma calle y acera, cuya numeración sea la más elevada.

Capítulo 3: El diseño de la muestra

153

Detenninaci<5n de valores de "X" Normalmente dos, que son previamente definidos por el departamento de campo, y que utilizan para seleccionar los edificios en los que hacer las entrevistas a lo largo de la ruPor ejemplo, todo edificio cuya numeración sea 3, 7 o su terminación coincida con dichos

Sel'lui¡niento de la ruta Par~ iniciar .Ia ruta e! entrevistador deberá colocarse de espaldas al punto de partida y coenzara a caminar hacia la derecha hasta encontrarse con la primera bocacalle, por la cual ~irará a la derecha (primer giro). Seguirá la ruta. recorriendo la manzana correspondiente hastaencontrarse con la segunda bocacalle. En ella girará a la izquierda (segundo giro) y, así, sucesivamente (derecha-izquierda) hasta completar el número de entrevistas a realizar en la zona (véase la figura 3.A).

o

O

O

O

O

O

O

to

~

O O

O

--. L*D

tO O

tD O

O

O

O

O

*Punto de partida --.. Seguimiento de la ruta Figura 3.A. Croquis para el seguimiento de la ruta.

La ruta puede transcurrir, a lo largo de su itinerario, por ambas aceras, según esté situada

nellas la numeración de las calles por las cuales va pasando. Algunas situaciones que pueen dar a confusión en la ejecución del itinerario son las siguientes: 1. Que la calle por la que se avanza se bifurque. La bifurcación siempre se considera giro y éste se efectuará a la derecha o a la izquierda, según corresponda. 2. ~~e en la ruta se encuentre una plaza. Al desembocar en ella, se procederá en funclon del orden de giro que corresponda efectuar. Por ejemplo, si es a la derecha se correrá el tramo de la plaza correspondiente hasta llegar a la primera bocac~lIe por la cual se saldrá de la plaza girando también a la derecha. Del mismo modo se procederá, pero a la izquierda, en caso de que haya que girar a la izquierda. Como norma general, en la plaza sólo se realizarán dos giros: el que corresponda al desembocar en ella y el que se realice para salir de la plaza.


154

Métodos de encuesta

Capítulo 3: El diseño de la muestra

155

3. En caso de encontrarse, siguiendo la ruta, con un descampado, una valla prolongada o algún obstáculo que impida realizar el giro, éste se hará en el sentido completamente opuesto al que se tenía que hacer. Después, se proseguirá la ruta respetando el orden de giros (derecha e izquierda), a partir del último efectuado. Dicha operación se llama "inversión de ruta". 4. Si se trata de un callejón pueden darse dos situaciones. Una, que el callejón tenga salida a otra calle (figura 3.8). En este caso el callejón se recorrerá considerándolo como una bocacalle más en la ruta, y teniendo en cuenta el giro realizado a su entrada, exclusiva.mente. Dos, callejón sin salida a otra calle (figura 3.C). Si es así, éste se recorrerá sin afectar en absoluto al orden de giros.

o OtD o

Figura 3.0. Punto de partida en el interior.

D DOtO

O 0-8 O DD~O ~t

O

I

10

OODO Figura 3.B. Callejón con salida a otra calle.

O O

tD D

D D

O O

Figura 3.C. Callejón sin salida a otra calle.

Figura 3.E. Punto de partida en el exterior.

La aplicación del "sistema de zona", cuando se haya tenido quehacer, se reflejará igualmente en la hoja de ruta. Sustitución de edificios

Sólo cuando el entrevistador haya agotado todas las posibilidades para evitar su aplicación. Se trata de evitar alteraciones en la muestra que afecten a su representatividad. Como norma general, un edificio se sustituirá siempre por el siguiente edificio siguiendo la ruta en la misma acera, aunque la numeración del mismo no corresponda con los valores de Xa aplicar. Ejemplo, valores de X = 3 Y7.

G~0G Sustitución

La sustitución del edificio se hará cuando coincidan algunos de los casos siguientes: Sistema de zona

Se emplea cuando las viviendas no forman calles con una disposición más o menos regular. Es decir, cuando no es posible seguir la ruta convencional. 1. Si el punto de partida se encuentra en el interior del grupo de población/viviendas (figura 3.0). El entrevistador se situará en el edificio determinado como ~unto de p.artida (por ejemplo, el Ayuntamiento). Comenzando en este punto se hara un recorndo envolvente (enespiral), alrededor de dicho punto de origen y en el sentido de la aguja del reloj. De "dentro" a "fuera", comenzando por la primera vivienda/edificio de la derecha. 2. Si el punto de partida se encuentra en un lugar situado en el exterior del núcleo de población/viviendas (figura 3.E). Se procederá del mismo modo, pero el recorrido de la espiral será ahora de "fuera" a "dentro".

1. No sea un bloque de viviendas: instituciones (organismos oficiales, colegios, hospitales), hoteles, oficinas, comercios, fábricas y similares. 2. Que sea una vivienda unifamiliar en la cual la totalidad de los miembros que la componen se encuentren ausentes, rehúsen colaborar o que se encuentre deshabitada. 3. Un edificio de varias viviendas en el que, por diversos motivos (viviendas deshabitadas, hogares que rehúsan participar en la encuesta) no se haya podido hacer la entrevista en ninguna de las viviendas del edificio.

Selección de plantas en el edificio

Si éste tiene más de unaplanta. Para que sea aleatoria, la selección de las plantas se hace utilizando una tabla de números aleatorios (o selector), como la incluida en el cuadro 3.G.


156

Capítulo 3: El diseño de la muestra

Métodos de encuesta

• Si el edificio tuviese 2 o más escaleras, se procederá como si se tratase de un edificio con varios módulos. Se ordenarán las escaleras y se procederá a seleccionar las plantas correspondientes dentro de cada módulo.

CUADRO 3.G. Tabla de números aleatorios para la selección de plantas en un edificio

Número de la entrevista

a realizar

1

2

3

4

5'

6

7

8

9

10

11

12

13

14

15

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

1

2

1

2

1

2

1

2

2

1

1

2

1

2

2

1

2

fJ)

~ Q) ::.

3

3

1

3

1

2

2

3

2

1

2

2

2

3

2

3

el.

4'

4

3

2

1

3'

3

2

2

1

4

1

4

4

1

3

.i.9 t::

5

3

5

1

5

5

4

3

5

2

1

4

1

2

1

3

el.

6

6

4

3

5

2

1

3

4

2

1

3

5

4

3

6

e

7

6

4

6

3

3

1

5

4

6

1

5

7

7

2

5

E o::.

8

2

4

8

2

6

7

2

5

5

1

3

8

7

6

2

9

2

8

8

5

1

9

4

2

6

9

6

7

4

3

3

10

5

8

8

5

9

7

5

1

3

6

4

7

2

6

9

"fJ)

.!!l

~

157

Sustitución de plantas

.

Se llevará a cabo en la planta inmediatamente superior y así, sucesivamente, en el ca· que fueran necesarias nuevas sustituciones. Si se llegase a la última planta del edificio o módulo (o ésta hubiera correspondido inicialmente en la selección), la sustitución se hará en 1/3. primera planta del edificio o módulo. Si fuese necesario, se continuará el ciclo de sustitución hasta llegar de nuevo a la planta inicialmente seleccionada. En caso de no haber podido realizar ninguna entrevista, se procederá a la sustitución por el siguiente edificio siguiendo la ruta. En él se procederá a seleccionar, de nuevo, planta y puerta.

Q)

:<:

Planta o puerta seleccionada

Por ejemplo, Entrevista a realizar: quinta

G

Plantas en el edificio: cuatro

~

Planta seleccionada: tercera

Q]

. . • Selección de viviendas Si en la planta elegida hubiese más de una vivienda, habrá que proceder a la selección aleatoria de una vivienda. Para ello se utilizará el mismo selector que para la selección de planta: se cruzará el número de orden de la entrevista a realizar con el número de puertas (o viviendas) que tiene la planta seleccionada. Previamente, habrá que ordenar las puertas en las plantas. • Si éstas estuviesen ya numeradas, se repetiría dicha numeración. • Si la ordenación fuese alfabética, se traduciría en su equivalente numérico (por ejemplo, la letra A con el número 1; B, con e12; y así sucesivamente). • Si las puertas no tuviesen ningún tipo de numeración, habría que ordenarlas de izquierda a derecha, siempre en función del punto por el cual se ha llegado a la planta, teniendo como punto de referencia la escalera.

Sustitución de viviendas Cruzando en la tabla el número de orden de la entrevista a realizar con el número de plantas del edificio o módulo seleccionado, se obtiene la planta seleccionada aleatoriamente dentro del edificio. Por "módulo" se entiende la agrupación de plantas dentro de un mismo edificio, cuando éste sobrepase cinco alturas.

Se hará cuando la vivienda seleccionada sea una oficina, pensión o similar. Es decir, no una vivienda familiar. También, cuando se encuentre deshabitada o sus inquilinos rehúsen participar en la encuesta.

• Es frecuente que en los edificios que tengan más de 5 plantas se realicen tantas entrevistas como módulos contenga el edificio. Para lo cual, se divide el número de plantas habitadas que tiene el edificio en módulos de 5 plantas. Si el número· de plantas no fuese múltiplo de 5, las últimas plantas restantes se considerarán, a efectos de selección, como un módulo más. Cada módulo se considera, e efectos de selección aleatoria de planta, un edificio "independiente". En la hoja de ruta se anotará si el edificio contenía más de 5 plantas y qué plantas y puertas se seleccionaron.

• Si la vivienda fuese unifamiliar, la sustitución se realizará, lógicamente, en la siguiente vivienda (o edificio), siguiendo la ruta. • En edificios o módulos de varias plantas, con una única vivienda por planta, la susti· tución se hará en la vivienda de la planta inmediatamente superior. • En edificios con varias plantas o módulos y más de una vivienda por planta, la sustitución se hará en la puerta inmediata de la derecha a la izquierda, según proceda en función de la ordenación que se haya dado a las mismas para su selección.


158

Métodos de encuesta

Cualquier sustitución que se haga a lo largo de una ruta deberá reflejarse, con todo detalle, en la hoja de ruta. Para la selección de las personas en la vivienda se aplicará alguno de los procedimientos enunciados en el subapartado 3.4.6. En todo caso, se ajustará a las características de la persona a entrevistar, delimitadas en el diseño de la muestra. Éstas se adjuntan en el Manual del Entrevistador.

La selección muestral por rutas aleatorias, aunque trate de garantizar el principio de equiprobabilidad en la elección de las viviendas, no garantiza que todas las unidades de la población tengan la misma probabilidad de ser elegida. Y ello a pesar de que la ruta se haya designado de forma aleatoria. Este handicap, que puede traducirse en una sobrerrepresentación, en la muestra final, de aquellas personas que están más frecuentemente en casa (amas de casa, jubilados, personas en paro, estudiantes), podrá obviarse en la medida en que no se proceda a la rápida "sustitución" de los no respondientes (por no contacto o rechazo). Se reitera en la recomendación de, al menos, tres revisitas, en la vivienda aleatoriamente elegida, en caso de no contacto. Éstas y otras actuaciones se especifican en el apartado 5.3, dedicado al error de no respuesta en la encuesta.

3.4.6. Métodos de selección de individuos en una misma vivienda

Cuando la unidad de análisis es la vivienda y todos sus integrantes, que se ajusten a la población de estudio, se consideran "válidos", el proceso de selección muestral se da por concluido. También, cuando hay que entrevistar a una persona concreta. Por ejemplo, al cabeza de familia o a amas de casa. Pero,cuando hay que elegir a uno o varios de los integrantes que forman el hogar, en encuestas cara a cara y telefónicas existen varios procedimientos alternativos de selección de entrevistados. En su mayoría buscan garantizar la "aleatoriedad" en la selección del entrevistado. Los más populares son el método de "no selección", el método de Kish de selección aleatoria, el método de selección de cuota sistemática y el del cumpleaños. A continuación se concretan sus características diferenciales. Método de "no selección"

De los métodos propuestos éste es el peor, por los sesgos que puede introducir en la muestra: las personas finalmente entrevistadas. No puede considerarse un método probabilístico, aunque resulta poco intrusivo y de fácil realización. Consiste en entrevistar a la primera persona que abra la puerta (encuesta cara a cara) o conteste al teléfono (encuesta telefónica). La única condición que se impone es que cumpla las características de la población de estudio. Por ejemplo, persona de 18 años y más.

Capítulo 3: El diseño de la muestra

159

En su contra está la mayor probabilidad de selección que concede a las personas que están en casa y contestan al teléfono o abren la puerta. Según estimaciones de Dillman (1978), referidas a la encuesta telefónica, dos de cada tres veces que se llama al teléfono es una mujer quien responde. Los hombres, sólo una de cada tres veces. Inclusive en las horas habituales del trabajo de campo y de mayor captación de varones en los hogares. Quiere esto de~ir·que este método propicia un desequilibrio en la muestra, a favor de las personas mas probables a contestar al teléfono o abrir la puerta. Para evitarlo habría que emplear un método que equilibre la muestra, al menos en características soeiodemogr~ficas básicas, como son las variables género y edad, en igual proporción a su presencIa en la población de estudio. Aplicando un método de selección sistemático por género, consistente en ir alternando varones y mujeres, podría corregirse el sesgo en la muestra por género, aunque no por edad, dada la mayor probabilidad a responder (al teléfono y a la puerta) de personas de menos edad. ~~r lo que habría que arbitrar un método que al menos ajustara la muestra a la poblacIOn en estas dos características sociodemográficas básicas y que fuese "probabilístico". Método de Kish de selección aleatoria

.•.•• En 1949 Leslie Kish (en "A procedure for objective respondeni selection within .the house~ol~".Jo~rnal of~h~ American Statistical Association, 44: 380-387) propone un procedlmlent~ aleatono de selección de personas en un hogar. A él Lavrakas (1993: 108) se refIere como '.'el método de selección del respondiente más riguroso ~ue es aceptado para entrevIstas en persona". Su uso preferente es en encuestas ca.raa cara en, d?mici1.io~, aunque puede aplicarse tanto en encuestas personales co•.• mo ~n telefomcas. SI bIen, en encuestas telefónicas puede llegar a ser incluso más intruslvo que en la personal, con el consiguiente aumento de la no respuesta por rechazo. i Una vez ~ue el entrevistador se ha presentado, ha de solicitar, a la persona que resRonda al tele.fon.o o abra la puerta, que enumere a los individuos en el hogar que satIsfagan el cnteno de edad de la población de estudio. Por ejemplo personas de 18 a ?5 añ.~s. Pero no sólo se excluye a aquellas personas que no cumplan dicho criterio, .... ~~~~Ien a aquellos .que presenten alguna incapacidad que les inhabilite para la realiz~ClO~, de la entrevIsta (como alguna enfermedad mental o dificultad para la comu111ca.cIOn verbal norm~1), además de los ausentes en el domicilio por un largo período de tIempo (por cuestIOnes laborales, educativas o de otro orden). Las personas que se ajustan a la población de estudio se ordenan por su relación de R~rentescoco~ el c~be~a de familia (cabeza de familia, esposa, padre del cabeza de faIDlha, madre, hIJO, hIJa, tIa de la esposa u otro familiar en el hogar). Después, se pregunta por la e~ad de c~da person~ list~da para ordenarlos de acuerdo con su género edad. El varon de mas edad sera el numero 1, el siguiente varón de más edad el nú-


160

Capítulo 3: El diseño de la muestra

Métodos de encuesta

mero 2, Yasí, de más a menos edad, hasta incluir a todos los elegibles varones. Se sigue la ordenación de las mujeres en la misma disposición, en orden de edad decreciente. Primero la mujer de más edad y, por último, la de menor edad. Para garantizar la selección aleatoria de respondientes, entre los elegibles, se aplica una tabla de números aleatorios. Esta tabla se imprime, junto con el cuestionario, en su portada o adverso, y su composición se alterna, de forma aleatoria, en los distintos cuestionarios. Existen ocho versiones de la tabla de selección de entrevistados de Kish, cuya aplicación aleatoria alternativa se facilita bastante en las encuestas informatizadas (CAP!, CATI). Si la persona que resulta elegida no está en el domicilio, en ese momento, deberá preguntarse cuándo podrá localizarse e intentar concertar una cita con ella. Lo que no debe hacerse es sustituirla por otro miembro del hogar que sí esté en ese momento y quiera ser entrevistado. Las negativas, de producirse, bien por la imposibilidad de contactar con la persona que haya resultado elegida aleatoriamente en el período de tiempo asignado al trabajo de campo, bien por el rechazo manifiesto de ésta a ser entrevistada, deberán considerarse "entrevistas negativas" y, en consecuencia, proseguir con el proceso de selección en otra vivienda también elegida al azar.

161

CUADRO 3.H. Disposición de los miembros del hogar por relación con el cabeza de familia

Relación con el cabeza de familia

(1) Cabeza de familia Esposo/a Madre del cabeza de familia Hijo Hija Hija Sobrina

Sexo (2)

Edad

Varón Mujer Mujer Varón Mujer Mujer Mujer

59 56 82 18 21 19 17

(3)

Adulto número (4) 1 4

3 2 5 6 7

CUADRO 3.1. Tabla de selección para elegir al encuestado

Si el número de adultos en la vivienda es...

Entrevistar al adulto con el número

1 2

1 2 2

3 4 5 6 o más

3 4 4*

* El adulto con el número 4 es el elegido al haber listados 7 personas

adultas.

Después de una breve presentación de la encuesta, el entrevistador solicita, a la persona con la que primero establece contacto en la vivienda, que liste a aquellos que residen en la vivienda en ese momento. Dicha solicitud la puede hacer, por ejemplo, en los términos siguientes: Para determinar a quién entrevistar, necesito listar a las personas de 16 y más años que habitualmente residen en esta vivienda. Sólo preciso conocer su edad y sexo, no sus nombres, y la relación de parentesco que tienen con usted. Comencemos por usted, ¿cuántos años tiene? ¿ y las otras personas?

Con la información que dé el informante, el entrevistador completa los datos que figuran en el cuadro 3.H. Después, se aplica la tabla de selección, propuesta por Kish en 1949 (1965/1995), para elegir al respondiente (cuadro 3.1). De acuerdo con ella, la persona seleccionada para ser entrevistada es la que ocupa el número 4 en la ordenación incluida en el cuadro 3.H. Es decir, la esposa. Si no es ésta la persona con la que primero se ha establecido contacto, preguntar al informante si se puede hablar con ella en ese momento o cuando estime mejor. Intentar concertar una cita con la persona seleccionada, un día y hora concreta para realizar la entrevista.

El mérito principal del método de Kish es el propiciar la "equiprobabilidad" en la selección de los entrevistados en una misma vivienda. No obstante, presenta los límites o inconvenientes siguientes: a) Como en cualquier método de selección, si existe sólo una persona elegible en

el hogar, esa persona automáticamente se convierte en el sujeto seleccionado (Lavrakas, 1998). En consecuencia, obtiene desiguales probabilidades de selección para personas por tamaño del hogar. De modo que aquellas que viven solas tienen una mayor probabilidad de ser elegidas frente a aquellas que viven con 6, 7 o más personas, por ejemplo. No garantiza, por tanto, la eliminación de dicho sesgo. Su aplicación lleva, en suma, a una pequeña subrepresentación de los más jóvenes entre los elegibles en hogares con un mayor número de personas que se ajustan a la población de estudio. No obstante, este método minimiza, de acuerdo con Lavrakas (1993), la no cobertura dentro de las unidades de muestreo, comparado con otros métodos menos rigurosos de selección.


162

Métodos de encuesta

b) Su aplicación exige que la persona que responde al teléfono o abre la puerta dé información referida a los otros integrantes del hogar. Esta solicitud puede suscitar recelos en el respondiente, que puede considerarla "impertinente", propiciando un aumento de la no respuesta por rechazo, antes de comenzar propiamente la entrevista. De la destreza y capacidad del entrevistador para transmitir la finalidad que se persigue con la información solicitada depende el éxito de la aplicación de este método de selección; que se reduzcan las "negativas" en un método en el que se coincide en calificar de "intrusivo". Asimismo, está el problema de la veracidad de la información que se proporcione de los otros miembros del hogar. En la comprobación de la veracidad sobre la composición del hogar llevada a cabo por Groves y Kahn (1979) se constató que en un 9% de los hogares se dio información discrepante sobre el número de adultos que residían en la vivienda. c) Añade minutos extra al proceso de selección de entrevistados. En mayor medida, cuantas más personas habiten en la vivienda.

Capítulo 3: El diseño de la muestra

Puede preguntarse, indistintamente, por varones o por mujeres. La edad la marca la blación a estudiar en cada encuesta concreta. En la mayoría de los casos es la población 18 años y más. También, puede ser de 16 y más años u otros grupos de edad. La persona a entrevistar se obtiene del cruce de la respuesta a ambas preguntas en a tabla de selección como la incluida en el cuadro 3.8. Se escoge una de las cuatro maces o versiones de selección. Las versiones se aplican en el siguiente orden: 1°, 2°, 3°, '2° 3° 4°' 1° 2° 3d' 4°' 2° 3° 4° etc Es decir se emplean de forma alternativa para e ~n ;ad~ c~nt~ct~ se' apiiq~e ~na diferente ~ consecutiva a la anterior. Con ello se retende garantizar que la selección de individuos sea aleatoria.

CUADRO 3.8. Tabla para la selección aleatoria del entrevistado de Troldahl y Carter Número total de personas de X años en el hogar

1

La aplicación de este método de selección de personas en una misma vivienda se considera "algo complicada" y ha propiciado -como señalan Paisley y Parker (1965: 438)- "salidas ocasionales del procedimiento correcto en el campo". En general, se defiende la necesidad de que la selección de encuestados en un mismo hogar sea sencilla, rápida y no invasiva o "impertinente". Su uso parece más desaconsejable en la encuesta telefónica (véase Frey, 1989), porque exige más del entrevistador que la encuesta cara a cara, al perderse el contacto visual.

• ¿ Cuántas personas de _X_ años o mayores viven en su casa incluyéndose Ud. ? • ¿Cuántos de ellos son varones?

3

40más Mujer menor edad Mujer mayor edad Varón menor edad Varón mayor edad Varón mayor edad

Mujer Varón

Mujer mayor edad Mujer menor edad Varón Varón Varón mayor edad Varón menor edad Varón menor edad

Mujer Varón

Mujer menor edad Varón Varón mayor edad

Mujer Varón

Mujer menor edad Mujer mayor edad Mujer Varón Varón menor edad Varón mayor edad Varón mayor edad

Mujer mayor edad Mujer menor edad Varón mayor edad Varón menor edad Varón menor edad

Mujer Varón

Mujer mayor edad Mujer mayor edad Mujer Mujer menor edad Varón menor edad Mujer Varón mayor edad

Mujer menor edad Varón Mujer menor edad Mujer o mujer mayor edad Varón menor edad

1993: 110).

En 1964, Verling C. TroldaW y Roy E. Carter (en "Random selection ofrespondent within households in surveys". Joumal of Marketing Research, 1: 71-76) proponen un método de selección de entrevistados, especialmente dirigido a la encuesta telefónica, que pretende ser menos invasivo y más rápido que el ideado por Kish. Con posterioridad, fue modificado por Bryant (1975). Para la selección aleatoria del encuestado, el entrevistador ha de hacer sólo dos preguntas para conseguir la información precisa para su aplicación:

2

1

En una entrevista en persona el informante del hogar puede ver lo que el entrevistador está haciendo. Cuando el método de Kish se utiliza por teléfono es prudente que los entrevistadores hagan un breve comentario que avise al oyente de que existe una pequeña pausa en el tiempo en que el ordenamiento se lleva a cabo (Lavrakas,

Métodos de selección de cuota sistemática

163

Mujer menor edad Mujer mayor edad Mujer Varón menor edad

Mujer mayor edad Varón Varón mayor edad Mujer o mujer mayor edad Varón mayor edad

Versión 3 O

1 2 3

40más Versión 4 O

1 2 3

40más


164

Capítulo 3: El diseño de la muestra

Métodos de encuesta

Preguntando por el número de mujeres más que por el de varones, Czaja, Blair y Sebestik (1982) obtuvieron una mayor tasa de respuesta en la aplicación de este método. Método que, al igual que con el método de Kish, en teoría y mezclando las versiones de las matrices de selección, una encuesta concluirá con una muestra equilibrada (respecto a la población de interés), de mujeres y varones, de adultos más jóvene~ y más mayores. Si bien, en la práctica Lavrakas (1993: 114; 1998: 448) reconoce que "Incluso la combinación prescrita de versiones típicamente resulta en una ligera subrepresentación (submuestreo) de varones, a menos que se hagan ajustes a través del período de encuesta". Para que el método de selección sea menos intrusivo, Hagen y Collier (1982) proponen que, después de la presentación de la encuesta, el entrevistador pregunte por uno de los cuatro tipos de respondientes: la mujer más joven, la mujer mayor, el varón más joven, el varón mayor. De esta forma se evita la necesidad de <i.eter minar el número de posibles elegibles en el hogar al principio del contacto del entrevistador. Por su parte, Lavrakas (1993) propone, para facilitar su práctica, que los entrevistadores meramente pidan hablar con un hombre o una mujer en hogares con una de tales personas, o pida hablar con el varón o la mujer más joven en hogares con más de una persona del mismo género. Aunque reconoce que se precisa llevar un recuento diario, para, ajustar la proporción de los contactados y los que habría que seleccionar, y también que no se logra obtener una muestra de probabilidad en el hogar. En su contra está, igualmente, el ser un método intrusivo. Las dos preguntas que exige su realización pueden considerarse personales. Asimismo, muestra imprecisión en hogares que tienen más de tres varones o tres mujeres.

Método del cumpleaños

165

dos precedentes. Además, es algo menos intrusivo, lo que favorece un menor error de no respuesta por rechazo. En su favor está, asimismo, el propiciar una muestra heterogénea, al concederse igual probabilidad de selección a cada miembro del hogar. Su aplicación reduce sesgos debidos a las variables género y edad. Además, siempre podrá entrevistarse a alguien en el hogar, porque ~iempre habrá alguien que haya cumplido años o los cumpla próximamente. En junio de 1982, O'Rourke y Blair (1983/2002) realizan un experimento como parte de una encuesta telefónica ómnibus, desde The Survey Research Laboratory de la Universidad de Illinois. La encuesta incluía preguntas sobre seguridad vial, educación superior, atención médica y planificación familiar. Se comparó el método de selección de Kish con el método del "cumpleaños más reciente", en relación al porcentaje de negativas y características demográficas de la muestra. También, para validar el método del cumpleaños. Se obtuvo un menor porcentaje de negativas (o rechazos), cuando se aplicó el método del cumpleaños que cuando la selección del entrevistado se hizo con el método de Kish: un 6,9% frente al 10,3% del método de Kish.E1830/0 de los entrevistadores estuvo de acuerdo en que el método del cumpleaños resultó más fácil de aplicar. El 750/0 que fue mejor en términos de cooperación del respondiente. El 250/0 restante no encontró ninguna diferencia.

........

Estos cuatro son los métodos para seleccionar a personas dentro de una vivienda u de práctica más habitual en la investigación mediante encuesta. Persiguen que elección no se haga de forma arbitraria o subjetiva, sino que introduzca una cierta ~' en el proceso de selección. A ellos cabe sumar otros métodos, como el baen "votantes probables", aunque sea de escasa aplicación, salvo en encuestas elec(sobre todo en las postelectorales). En él se pregunta, a la primera persona con que se contacta en la vivienda (de 18 años o más), si votó en las elecciones pasadas. _u .. se le pregunta si piensa votar en las próximas elecciones. Si responde sí, se entrevista. En caso contrario, no. A continuación, se intenta contactar con otra perque cumpla dichos criterios en el mismo hogar, o en otro que se elija, igualmente, forma aleatoria. También, puede preguntarse por una persona que se ajuste a unas cuotas concrede edad, género, etnia u otra característica que se considere relevante en relación el problema de- investigación. ...........".&. ......." ' _ ..... -

-'-'''''UIJ .....

Propuesto a principios de los años ochenta por Salman y Nicholls (1983) y de amplia aplicación en encuestas telefónicas debido, según Lavrakas (1998: 448), a que es un "método de selección superior a los demás". Aunque, en opinión de Biemer y Lyberg (2003: 197), "estos métodos no producen muestras aleatorias y no deberían utilizarse en la investigación científica rigurosa". Tras una presentación breve de la encuesta, el entrevistador pregunta por la persona, de los elegibles en el hogar (por pertenecer a la población de estudio), cuyo cumpleaños fue "el más reciente" o será "el próximo". Por ejemplo, "Para esta encuesta, ¿podría entrevistar a la persona de 16 años o más que vaya a cumplir años próximamente?". En caso de no estar en casa en ese momento, se procura concertar una cita (día y hora) para la realización de la entrevista. Asimismo, en hogares unipersonales, se entrevistará a su único integrante, siempre que pertenezca a la población de estudio. Al reducirse las preguntas y simplificarse el proceso de selección del entrevistado, su aplicación resulta más fácil y rápida a los entrevistadores respecto a los dos méto-

7. Muestreo por cuotas

Desarrollado en los años treinta del siglo xx por Gallup y Ropper, obteniendo un gran éxito en la predicción de los resultados de las elecciones presidenciales norteamericanas de 1936, aunque falló en la predicción de las celebradas en 1948, como se dien el apartado 3.2. Kish (1965/1995: 563) niega a este método el carácter de "cien. En su opinión, "más parece ser una producción artística difícil de definir o


166

Métodos de encuesta

describir". Por su parte, Lohr (2000: 115) insis~e en su adecuación "a la investigación comercial, pero no a otros tipos de encuesta". Estas y otras valoraciones negativas del método de muestreo por cuotas se asientan en su carácter de método de muestreo no probabilístico, que no concede a todas las unidades de la población la misma probabilidad de ser incluidas en la muestra. No obstante, este método es, de los no probabilísticos, el que proporciona mejores resultados. Se debe a que al menos "obliga" a incluir en la muestra a unidades de la población, de acuerdo con su "proporcionalidad" en las variables de cuota establecidas para su selección. El muestreo por cuotas es uno de los más populares y de mayor aplicación en la investigación de mercados. Favorecido por su menor coste económico y temporal, en relación con los métodos de muestreo probabilísticos, junto a su fácil administración. De acuerdo con Groves (1989: 248), "el coste promedio de las entrevistas de muestras de probabilidad es casi tres veces el coste promedio de los métodos muestrales de cuotas". Como el muestreo aleatorio estratificado, el de cuotas parte de la segmentación de la población de estudio en grupos, en función de variables sociodemográficas relacionadas con los objetivos de la encuesta. Se busca la homogeneidad dentro de los grupos diferenciados y, en cambio, la heterogeneidad de unos respecto de los otros grupos. Si bien, la selección de las unidades de la muestra no se realiza siguiendo un procedimiento aleatorio. Sólo se precisa que la persona elegida se ajuste a las "cuotas" marcadas. Su ejecución supone la elaboración de una matriz de las características básicas de la población que se analiza (proporciones de población diferenciadas por sexo y edad, nivel de instrucción, clase social), a modo del muestreo estratificado proporcional. La información se obtiene de datos censales (Censo de Población, Padrón de Habitantes u otras fuentes estadísticas referidas a la población de estudio). El propósito es extraer una muestra que se ajuste a la distribución de las características fundamentales de la población.

Capítulo 3: El diseño de la muestra

167

espacial (país, región, comunidad autónoma, municipio, distrito), aunque no estén relacionadas con el problema de investigación. Por ejemplo, en el estudio de las actitudes ante la inmigración, la variable género apenas es relevante en la explicación de las actitudes diferencÍales ante los inmigrantes. Cea D'Ancona (2ÜÜ4b) comprueba que las diferencias entre varones y mujeres apenas son perceptibles. No así las diferencÍas por edad, estatus social (nivel educativo, ocupación, ingresos), práctica religiosa, ideología política y hábitat.

Utilizar muchas variables de cuota haría, no obstante, el trabajo de campo poco practicable, dificultando en exceso su ejecución. Por esta razón, las cuotas suelen reducirse a unas pocas variables de clasificación y que sean "accesibles". Las variables género y edad están presentes en la generalidad de los marcos muestrales empleados para la fijación de cuotas. A ello se suma la relativa facilidad (para el entrevistador) de localizar "visualmente" a personas que pertenezcan a los diferentes subgrupos formados cruzando las variables género y edad. Lo mismo no puede decirse de otras variables, como las referidas a estatus social. Aunque el estatus social de una persona pueda medirse, de forma objetiva, combinando las variables renta, ocupación y nivel de estudios, también operan factores subjetivos en la atribución de estatus (apariencia física, forma de vestir, de hablar), como destacan Moser y Kalton (1989). Además, no se olvide que las unidades muestrales se eligen si "parece" que se ajustan a las cuotas marcadas. Una vez confeccionada la matriz, sigue un proceso similar a la estratificación proporcional. Se calculan las proporciones relativas (las cuotas) para cada celdilla de la matriz, a partir de la proporción que representa cada categoría de las variables de cuota seleccionadas en la población de estudio. Se quiere equiparar la muestra a la población de interés lo más posible. Tras la delimitación de las cuotas, se proporciona a cada entrevistador su asignación correspondiente: el perfil y el número de personas entrevistar en cada cuota. Éstos han de proceder a su localización.

Por ejemplo, si el objetivo de la encuesta es comprobar la influencia del nivel educativo de las personas en sus actividades de ocio, la población de estudio deberá, al menos, estratificarse por nivel educativo. De esta forma se garantiza que en la muestra estén representados los distintos grupos de población, diferenciados por nivel educativo, pudiéndose realizar comparaciones entre los distintos grupos de población.

Junto con los objetivos principales de la encuesta, en la elección de las variables de cuota intervienen otros factores. Destacan dos. Uno es la precisión que el investigador busca en su indagación. Otro, la accesibilidad de las variables elegidas. Ésta dependerá de la facilidad de su obtención en el marco muestral elegido, además de su practicabilidad. Es decir, si el entrevistador puede acceder fácilmente a los grupos de población definidos por las variables escogidas. Las cuotas más habituales son las determinadas por la conjunción de las variables género y edad, junto con las referidas al componente

En una encuesta a la población de 18 años y más, se decide establecer unas cuotas por sexo, edad y actividad. Se calcula, como en el muestreo estratificado proporcional, proporcionalmente a su peso en el conjunto de la población que se analiza. Después, se asigna a cada entrevistador un número total de entrevistas a realizar, acordes con las cuotas fijadas, como la incluida en el cuadro 3.J. El entrevistador deberá localizar a personas que se ajusten a cada casilla de la matriz dada.


168

Métodos de encuesta

Capítulo 3: El diseño de la muestra

CUADRO 3.J. Asignación de cuotas a un entrevistador Ocupado Varones 18-29 30-44 45-64 65 Y más

Parado

Jubilado

3 6 7

-

-

-

1 6

2 3 5

1 2 1

-

1 2

Mujeres 18-29 30-44 45-64 65y más

-

-

Total

26

7

-

Ama de casa

-

169

pletarlas). Esta última picaresca también resulta difícil de controlar. Todo lo cual nos lleva a la reflexión expresada por Kish (1965/1995: 562):

Estudiante

3

-

Total

6 7 10 6

7

2 4 5 1

-

7 9 11 8

14

12

5

65

2

-

Lo que diferencia al muestreo por cuotas, respecto del estratificado, es la libertad que se da al entrevistador para la elección de las unidades finales de la población a entrevistar. Aunque el azar intervenga en las fases iniciales del diseño muestral (en la elección de áreas o zonas geográficas, por ejemplo), la selección de los elementos concretos de la población es totalmente arbitraria. Es el propio entrevistador quien selecciona al entrevistado, en cualquier momento y lugar (en una calle comercial, a la salida del metro, en la parada del autobús, en un mercado, en un parque). La única condición que se le impone es que la persona se ajuste a las cuotas fijadas por el equipo investigador. Este margen de libertad que se concede al entrevistador representa la principal debilidad de esta modalidad de muestreo: a) El entrevistador es libre de entrevistar a quien quiera o pueda. Esta libertad dada al entrevistador puede propiciar la introducción de sesgos importantes en el proceso de selección de la muestra, no siempre detectables por el equipo investigador. Así, por ejemplo, puede haber escogido a personas de su propio entorno sociofamiliar, a aquellas que haya estimado más propensas a participar en la investigación, o simplemente a las más accesibles. Generalmente, el muestreo por cuotas tiende a subrepresentar a las personas más difíciles de ser entrevistadas y éstas suelen presentar un perfil no coincidente con el de aquellos más accesibles. También es fácil que, dentro de una misma cuota, se escoja a unos individuos con preferencia a otros. Por ejemplo, si se controla por edad, es probable que se entreviste más a personas de edades intermedias en los intervalos diferenciados, y no a aquellas situadas en los límites del intervalo. Asimismo, el entrevistador puede ubicar a los sujetos en cuotas diferentes a las que realmente pertenecen, en aquellas donde se precisen casos (para com-

No es suficientemente sencillo establecer que el muestreo de cuotas se utilizó en una encuesta y esperar que alguien tenga más que una idea muy general de cómo la muestra se extrajo.

b) El desconocimiento de las probabilidades de selección no permite evitar los errores generados por ponderaciones incorrectas en el proceso de estimación; ni tampoco la estimación de los errores de muestreo. No tienen ninguna base probabilística para la inferencia estadística, no pudiéndose afirmar que las estimaciones de los parámetros poblacionales sean insesgadas. A diferencia del muestreo estratificado, no puede esperarse que la repetición de la muestra permita obtener resultados similares a los alcanzados en el estudio inicial, al no haber estado presente la aleatoriedad en todo el proceso de selección de la muestra. Todo lo cual repercute en el principal inconveniente de este tipo de muestreo: la muestra finalmente obtenida puede no ser representativa de la población que se analiza, aunque la muestra diseñada coincida con la distribución de la población en los controles de cuotas fijados. . Puede ocurrir que la muestra represente muy bien a la población para ciertas varIables, y no la represente en absoluto en cuanto a opiniones (Azorín y Sánchez Crespo, 1986: 21). En la primavera de 1985, Marsh y Scarbrough (1990/2002) llevaron a cabo un experimento en el marco .de una encuesta sobre desempleo. Los respondientes se eligieron e? muestras aleatorIas y de cuotas (edad y estatus de actividad) por los métodos conv~nclO~ale~: 374 por cuotas y 284 aleatorios. En este estudio se concluyó que la discreclOnahdad dada a los entrevistadores que siguen el muestreo por cuotas es la principal fuente de sesgo de la muestra: • La muestra por cuotas se extrajo de una serie menos heterogénea de vecindarios qu~ la muestra aleatoria: ocho tipos de vecindarios en la muestra aleatoria no apareCIeron en la muestra por cuotas. El número promedio de entrevistas en cada tipo de ve~dario fue mucho más alto en la muestra por cuotas que en la aleatoria. • Los ent;eVlstadores de cuotas fueron selectivos en las zonas en las que trabajaron. Ademas, se esforzaron menos en conseguir que los seleccionados acabasen contestando a la encuesta. • El muestreo por cuotas está sesgado hacia personas que están con frecuencia en casa. Además, en apoyo a lo sostenido por Sudman (1976), el número de noches que los respondientes han estado fuera en la última semana no es una medida fiable de accesibilidad. • Por últ.imo, el estudio confirmó la literatura previa, con respecto a la renta de los entrevistados: el muestreo por cuotas tiende a localizar a menos personas en los extremos de renta económica.


170

Métodos de encuesta

Capítulo 3: El diseño de la muestra

Para mejorar la calidad de los datos obtenidos habría, por tanto, que restringir el "criterio" del entrevistador en la selección de las unidades de la muestra. Por ejemplo, complementándolo con el muestreo de rutas aleatorias, en el que se fijasen itinerarios a seguir para contactar a los posibles entrevistados. Ha de limitarse, lo más posible, la arbitrariedad del entrevistador en la selección de las unidades muestrales.Asimismo, habría que insistir en la importancia de las "revisitas" y que los entrevistadores se esfuercen en convencer a los contactados para que acaben respondiendo en la encuesta. Debe procurarse reducir, al máximo, el error de no respuesta, tanto por no contacto como por rechazo, por su gran incidencia en la calidad de los datos de encuesta, como se verá en el apartado 5.3. En el cuadro 3.9 se resumen las principales ventajas e inconvenientes del muestreo por cuotas. CUADRO 3.9. Ventajas e inconvenientes del muestreo por cuotas Ventajas

Inconvenientes

• Su ejecución resulta más económica, en tiempo y dinero, que la de muestreos probabilísticos. • La selección de las unidades de la muestra es sencilla y no precisa de un listado que incluya a las unidades de la población de estudio.

• Al no ser un muestreo probabilístico, no puede precisarse el error típico o muestra!. • Carece de base probabilística para la inferencia estadística y la libertad dada al entrevistador propicia la introducción de sesgos en la selección de las unidades de la muestra. • Límites en la representatividad de la muestra para las características no especificadas en los controles de cuotas. • Dificultad para el control del trabajo de campo de la encuesta.

3.4.8. La aplicación de otros métodos de muestreo no probabilisticos en la investigación mediante encuesta

Aparte del muestreo por cuotas, existen otros métodos de muestreo no probabilísticos que pueden también aplicarse en la investigación mediante encuesta, aunque no con fines inferenciales. Porque no son probabilísticos, no interviene el azar en la selección de las unidades de la muestra, y ni siquiera son "proporcionales" como el muestreo por cuotas. En este último se procura que la composición de la muestra mantenga la "proporcionalidad" habida en la población en variables que pueden ser "clave" en la investigación (variables de cuota). Por el contrario, los métodos de muestreo aquí

171

agrupados no persiguen esa proporcionalidad en la composición de la muestra respecto de la población de estudio, sino acceder a unidades concretas de la población que "pueden" o "quieren" dar información sobre el tema de estudio. La selección de la muestra se rige por criterios ajenos al azar: la tipicidad, la conveniencia o la pertinencia, la oportunidad y la disponibilidad o la accesibilidad. Las distintas modalidades cabe agruparlas en dos amplias categorías: los muestreos estratégicos o de "juicio" y los circunstanciales. En este último se incluye el llamado muestreo bola de nieve, el de voluntarios y el ocasional. Veamos en qué difieren unos de otros. Muestreo estratégico o de "juicio"

Llamado así porque el investigador sigue su propio "juicio" en la elección de las unidades de la población que compondrán la muestra. Su elección depende de la creencia de que pueden aportar información de "interés" o relevante para los objetivos de la encuesta. Han de ser informantes heterogéneos (que representen distintos puntos de vista sobre el problema de investigación) y "accesibles" (que quieran hablar). Por ejemplo, en una encuesta a profesores universitarios se elige, deliberadamente, a determinados profesores porque se piensa que son "representativos" de diferentes corrientes de pensamiento y pueden dar información "valiosa" para los objetivos de la investigación. Su éxito dependerá del grado en que los informantes elegidos ex profeso sean realmente "representativos" de la heterogeneidad de la población. Antes de su aplicación, conviene especificar las dimensiones de variabilidad en la población que se consideran relevantes para los objetivos de la encuesta.

En estudios de limitado presupuesto (como tesis doctorales u otras investigaciones académicas de escasos recursos económicos), que quieran comprobar alguna teoría o profundizar en la medición de algunos conceptos teóricos, el recurso a este tipo de muestreo quizá sea el único factible. En muestras muy pequeñas, por ejemplo inferiores a 30 casos, el muestreo estratégico puede favorecer la consecución de información más relevante que la obtenida de una muestra del mismo tamaño extraída al azar de la población de estudio. Pero, siempre que se escoja a informantes que representen distintas vertientes del tema que se analice (que reflejen la opinión de aquellos a quienes se cree que representan) y que la finalidad del estudio no sea la representatividad "estadística", sino de la "información", la captación de layariedad opinática sobre el tema en cuestión. Como se verá en el apartado 3.5, en muestras aleatorias de muy pequeño tamaño, el error muestral se dispara, en su magnitud, limitando las posibilidades de inferencia, de generalización, de los resultados de la encuesta. También, la posibilidad de que la muestra logre representar a la heterogeneidad de la población. No así, cuando la muestra aumenta progresivamente de tamaño.


172

Capítulo 3: El diseño de la muestra

Métodos de encuesta

Muestreos circunstanciales

Cuando es la "accesibilidad" el criterio fundamental en la selección de las unidades de la muestra. Por ejemplo, las encuestas realizadas a estudiantes universitarios que se ofrecen "voluntarios" a participar en un experimento. Pero, igualmente los sondeos realizados en un programa de televisión o de radio e, incluso, una encuesta por Internet no cumplimentada por personas seleccionadas al azar, sino por aquellas que se ofrecen voluntariamente: deciden llamar al programa de televisión o de radio, para dar su opinión sobre el tema en cuestión, o deciden rellenar un cuestionario que está en la red, sin que se les haya solicitado a ellos de forma explícita. Estos sondeos pueden proporcionar información de utilidad para conocer distintas opiniones sobre un tema concreto, pero no para medir su "representatividad" en el conjunto de la población de estudio. Los "voluntarios" no suelen representar a toda la variedad de los integrantes de la población de interés. Más a unos segmentos específicos de la población que a otros. Lo mismo cabe decir de las encuestas autocumplimentadas por los huéspedes de un hotel, antes de dejar la habitación, para conocer su grado de satisfacción con la atención prestada. Como el cuestionario no suele ser rellenado por todos los huéspedes, en proporciones similares, sino más por aquellos que se sienten insatisfechos y quieren dejar constancia de su "queja", la muestra no puede considerarse representativa de todos los huéspedes del hotel. No se puede, a partir de la información recabada, inferir el grado de satisfacción con el servicio prestado. Excepto que el cuestionario hubiese sido cumplimentado por todos los huéspedes del hotel. Únicamente permite conocer motivos de queja, a efectos de mejorar la atención a los huéspedes. También incluye el muestreo de bola de nieve, de gran utilidad en encuestas a población marginal (como inmigrantes ilegales), no registrados en un marco fiable. En él, las unidades de la muestra van escogiéndose, de forma sucesiva, a partir de las referencias dadas por sujetos a los que ya se ha accedido. Su contactación se convierte en doblemente valiosa, porque contribuye a localizar a otras unidades de la población. Para ello se les pregunta si conocen a otros en su misma situación. Como unos contribuyen a la localización de los otros y éstos, a su vez, a la de otros, la muestra va aumentando, de manera progresiva, como una "bola de nieve" hasta que el investigador decide cortar, generalmente cuando se llega a la "saturación teórica". Es decir, cuando la información comienza a ser redundante, no aportando ningún punto de vista analítico nuevo, por lo que se decide dar por concluida la recogida de información. A medida que se van viendo casos similares, una y otra vez, el investigador adquiere confianza empírica en que una categoría está saturada (Glaser y Strauss, 1967: 61). El cuadro 3.10 resume las ventajas y los inconvenientes de los muestreos no probabilísticos. Se insiste en su uso restringido en la investigación mediante encuesta, cuando no se persiga la representatividad "estadística". Como,por ejemplo, en elpretest del cuestionario y en estudios en los cuales la carencia de recursos y de marcos

173

muestrales "fiables" imposibilitan la práctica de alguno de los muestreos probabilísticos.

CUADRO 3.10. Ventajas e inconvenientes de los muestreos no probabilísticos Ventajas

Inconvenientes

• Simplicidad y economía del diseño muestral. • Fáciles de ejecutar. • No precisan de un listado de la población de estudio.

• Imposibilidad de estimar el error típico o muestra!.

• Dificultad en la generalización de los resultados de la investigación más allá de los casos analizados, por la introducción de sesgos en la elección de la muestra.

3.4.9. La especificidad de la encuesta telefónica

En la encuesta telefónica la muestra puede extraerse de un directorio o listín telefónico, siguiendo un procedimiento aleatorio, o mediante algún procedimiento de generación aleatoria de números de teléfono. Las distintas opciones se explican a continuación. La extracción "directa" aleatoria de/listín telefónico

Los números de teléfono se extraen de cada una de las guías o listines telefónicos que cubran la población de estudio (en los puntos de muestreo aleatoriamente seleccionados) de forma sistemática. Puede hacerse bien eligiendo al azar unas terminaciones numéricas concretas y extrayendo los números de teléfono que la incluyan, bien aplicando el método aleatorio sistemático, principalmente. Cualquiera de estos procedimientos posibilita la obtención de muestras probabilísticas. Sin embargo, se enfrentan al generalmente mayor error de no cobertura atribuido al uso de guías o listines telefónicos. Dependerá, como se dijo en el apartado 3.2, de la "cobertura" de la guía telefónica de la población de estudio. En qué medida abarque a la población de interés y a las diferencias entre los cubiertos y los no cubiertos por el marco muestra!. Cuando se quieren estimar parámetros de la población en general, es cuando más error de no cobertura se detecta por las razones ya expuestas en el susodicho apartado. El marcado aleatorio de números de teléfono

El método popularmente llamado RDD (Random-Digit-Dialing). Primero propuesto por S. L. Cooper en 1964 (en "Random sampling by telephone: an improved


174

Capítulo 3: El diseño de la muestra

Métodos de encuesta

method". Journal of Marketing Research, 1 (4): 45-48) y, con posterioridad, matizado por M. Mitofsky en 1970 (en "Sampling of telephone households". B. S. News Memorand), hasta el punto de ser común su referencia como "método de MitofskyWaksberg". Su finalidad principal es paliar parte del error de no cobertura del método anterior, dando, a todos los hogares con teléfono, la misma probabilidad de participar en la muestra, con independencia de que su número de teléfono esté registrado en la guía telefónica. No obstante, su práctica muestra que este propósito básico no se satisface plenamente. Investigadores posteriores (Lavrakas, 1993; Couper y Hansen, 2002) matizan que RD D en realidad no proporciona "igual" probabilidad de alcanzar a todos los hogares con teléfono en un área de muestreo. La razón dada es que algunos hogares tienen más de un número de teléfono, por lo que tienen una mayor probabilidad de ser seleccionados para integrar la muestra. Dependiendo del propósito de la encuesta habrá, en consecuencia, que proceder a ajustes posmuestreo que corrijan la desigual probabilidad de selección (es decir, ponderar la muestra), antes del análisis de los datos de encuesta. En RDD los números de teléfono no se extraen de guías o listines telefónicos, sino de la generación aleatoria de números, habitualmente mediante un algoritmo integrado en CATI. Los primeros dígitos corresponden al área que abarque la encuesta. Los cuatro o cinco últimos dígitos son los que se generan de manera aleatoria. Su aplicación supone: a) Delimitar el área geográfica de la población de estudio. En los puntos de muestreo seleccionados (siguiendo un muestreo estratificado o por conglomerados polietápico) habrá que concretar los números de teléfono a generar. b) Determinar el número de líneas por prefijo telefónico, para que los números de teléfono aleatorios se generen en la proporción en que cada prefijo existe dentro del área de muestreo. Para este propósito habrá que conocer el número de líneas de acceso telefónico residenciales operativas para cada prefijo en el área de muestreo. La muestra final estará, en consecuencia, estratificada por pre"fijo telefónico. Para mejorar la eficacia del "pool" de muestreo RDD, Lavrakas (1993) recomienda tener, además, información referida a los rangos numéricos (de los números de teléfono) que no operan o no incluyen líneas telefónicas de acceso a hogares. c) Aunque los números de teléfono, dentro de cada área, pueden generarse manualmente, mediante el uso de tablas de números aleatorios, lo común es hacerlo mediante un programa integrado en CATI. Es bastante más rápido y reduce la mediación del investigador y del entrevistador. Los cuatro últimos dígitos son los que se seleccionan de forma aleatoria. A cada zona le suelen corresponder 9.999 líneas telefónicas y los códigos de provincia (por ejemplo, 91 Madrid, 94 Bilbao, 952 Málaga, 983 Valladolid) y de zona, que pueden constar de tres (en provincias con prefijos telefónicos de dos

175

dígitos, como Madrid) o dos dígitos (en provincias con prefijos de tres dígitos, como Málaga), están ya delimitados en la estratificación de la muestra por áreas. Por ejemplo, habría que generar números de teléfono del 91-394-0000 al 91-394-0099, añadiendo, de forma aleatoria, cuatro dígitos a cada prefijo hasta completar la cantidad determinada, en el diseño de la muestra, en el estrato delimitado por el prefijo.

En suma, son los últimos 9.999 dígitos los que se generan de forma aleatoria hasta cubrir las unidades de la muestra en la zona correspondiente (definidos por los códigos de provincia y de zona). Si un número aleatorio, en dicho conglomerado de números de teléfono (o montones de 100 definidos por los códigos de área), corresponde a una vivienda residencial, el conglomerado se retiene en la muestra. En caso contrario, no. Al menos ha de haber un número de teléfono de un hogar que funcione. Después, se procede al marcado aleatorio del resto hasta cubrir el número de entrevistas fijadas para hacer en la zona, aunque no siempre llega a cubrirse. El inconveniente principal es el no saber adónde se llama. Precisa de varias llamadas de teléfono, a un mismo número, en diferentes días y momentos del día, para poder determinar si el número de teléfono, generado al azar, es o no residencial. Sólo donde se pueden discriminar efectivamente los números particulares y otros de negocios es algo más práctica esta estrategia. En caso contrario (como sucede en España, donde la asignación de números entre abonados particulares y abonados de negocios o comerciales no tiene códigos de discriminación), la productividad de este sistema resulta altamente cuestionable (Wert, 2000: 209).

Esta crítica principal se suma a otras tres: a) Como se trata de un muestreo por etapas, en el que se selecciona un número determinado de números de teléfono residenciales en cada grupo de 100 retenidos para que la muestra sea autoponderada, habría -siguiendo la recomendación expresada por Brick y colaboradores (1995: 219)- que "controlar la muestra obtenida en cada conglomerado para asegurarse que un número específico de hogares es entrevistado en cada conglomerado". Puede darse que algunos conglomerados no reúnan el número suficiente de hogares para satisfacer este requisito. Sin duda, el disponer de información específica de las líneas por prefijo de zonas enla muestra ayudará a obviar este inconveniente principal. b) Los números de teléfono que no corresponden a viviendas deben ser reemplazados. El reemplazamiento puede producirse en cualquier momento durante el período de recogida de datos, incluyendo el final del período de estudio. En caso de que el reemplazamiento de los números de teléfono se efectúe al final del período de tiempo destinado al trabajo de campo, hay que tener presente que no se tendrá la misma oportunidad de ser llamados ·en distintos días de la semana y momentos del día y su estatus residencial sería, en consecuencia, más di-


Capítulo 3: El diseño de la muestra

176Métodos de encuesta

fícil de establecer. Ello contribuye, de acuerdo con Tucker, Lepkowski y Pickarski (2002: 322), a complicar el cálculo de los porcentajes de respuesta porque "un pequeño residuo de números de estatus residencial sin resolver permanece al final del estudio". c) Con la agrupación de la muestra en conglomerados de números de teléfono, habrá un mayor error muestral, respecto al muestreo aleatorio simple y estratificado. Extracción aleatoria de números de teléfono asistido por directorios telefónicos (List Assisted Method)

Una propuesta alternativa a RDD, que comienza a utilizarse a finales de los años ochenta y principios de los noventa del siglo xx, en especial por empresas de ~n­ vestigación de mercados. Pretende solventar la deficiencia más destacada en el m~todo RDD: el "no saber adónde se llama". Lo que se traduce en un gran número de llamadas improductivas a números de teléfono inactivos o no residenci~les. Su aplicación precisa de un marco de números de teléfono listados. Este puede confeccionarse de directorios de teléfono proporcionados por empresas comerciales o elaborados por el propio equipo investigador, a partir de estudios precedentes. Al extraerse el número de teléfono de un listín telefónico se sabe "adónde se llama". Los problemas de cobertura comúnmente atribuidos al uso de directorios telefónicos, como marco muestral, se resuelven muestreando números de teléfono de montones de 100, que contengan, al menos, un número de teléfono listado en el directorio telefónico. Puede aplicarse un muestreo simple sistemático, estratificado (de acuerdo con la información proporcionada en el marco muestral), para mejorar la efectividad de la muestra, u otro método muestral que dé igual probabilidad de selección a las unidades de la población: los números de teléfono. Aquellos números de teléfono, en montones de 100, que no tengan ningún número de teléfono listado quedan, en consecuencia, excluidos de la muestra. En el estudio comparativo efectuado por Brick y colaboradores (1995), de este método de selección muestral en relación con el de Mitofsky-Waksberg, se confirma que con el método asistido por directorios telefónicos se logra reducir la tasa de llamadas telefónicas "improductivas". El porcentaje de llamadas a números de teléfono que eran residenciales (hogares) superó al logrado con el método de Mitofsky-Waksberg. Además, se redujo el error de no cobertura. Sólo alrededor del 3 al4 % de todos los hogares residenciales quedaron excluidos de la muestra. Recuérdese que los hogares, incluidos en los montones de 100, en los que no existe algún número de teléfono registrado en el listín telefónico quedan excluidos para la selección de la muestra. Es decir, no se les da oportunidad para participar en la encuesta.

Otro procedimiento muy popular, practicado con anterioridad (Landon y Banks, 1977), es el que Wert (2000: 209) llama "plus one". Consiste en añadir una unidad a cada número de teléfono extraído del directorio. Con ello se busca que la muestra no só.:.

177

números de teléfono listados, sino también aquellos que no figuran expredecir, la reducción del error de no cobertura común al uso de guías o de ditorios telefónicos. ,También puede aplicarse otra variedad que consiste en añadir un número aleatorio úmero de teléfono extraído del directorio telefónico. Ésta contribuye, igualmen";/a la inclusión de números de teléfono no listados en el directorio telefónico. ,éfEn resumen, el uso de directorios o de guías telefónicas para la extracción de la mues'(como marco de muestreo) permite saber "adónde se llama", pero no siempre "cubre" 'da la población objeto de estudio. Su uso preferente dependerá de su "cobertura", de ;:~austividad y actualización de dicho marco muestra!. Lavrakas (1993: 32) concreta que "@ó como marco muestral no es recomendable cuando el porcentaje de hogares con teppo no registrado en el directorio telefónico supere del lO alISO/o. En especial, cuan$e quieren estimaciones de parámetros para la población en general.

'!i,EI error muestral, uno de los integrantes del error total de encuesta ~Cuando

se diseña una muestra, el propósito fundamental es' conseguir que la

estra extraída de la población de interés logre ser una representación, lo más

:,. .~tada posible, a la misma. Ello contribuye a la precisión de las estimaciones mues;;..;~~es,a sus posibilidades de inferencia al conjunto de la población que es objeto de es<,~io. Pero, por muy perfecta que sea la muestra, como únicamente se analiza una par~.;i>,~?e la población (y esa muestra sólo representa una de todas las posibles muestras que B~den extraerse de una misma población), siempre habrá alguna divergencia entre los ~9res obtenidos en la muestra (las estimaciones muestrales) y los valores corres.ic~I1dientes en la población (los parámetros poblacionales). Esa disparidad se llama :!~rermuestral o error típico de muestreo. Ambos términos se utilizan indistintamen--~n la literatura especializada. Por ellos se entiende el grado de inadecuación entre ;~~timaciones muestrales y los correspondientes parámetros poblacionales. los errores de encuesta (clasificados en el apartado 1.5), éste es el tradicional:;;~:~:nte más medido. Se incluye dentro de los errores de no observación y su magnitud :,gende, principalmente, del tamaño de la muestra (no del tamaño de la población) y ':<,:su;representatividad; es decir, si se ha dado a todos los integrantes de la población >'misma probabilidad de ser seleccionados para constituir la muestra. Su valor sólo reJáJa variabilidad en las estimaciones debidas a diferencias entre muestras. Ha de evise su interpretación errónea como una medida de resumen de todos los errores de in:Iación de una encuesta. Sólo representa uno de los componentes del error total de :ff~esta y, ni siquiera, refleja los otros errores de no observación (el error de no cortara y de no respuesta). Y"i _ '~rComo ,ya se dijo en el apartado 3.4, el error muestral sólo es estimable en muestras :!!i~()babilísticas, aplicando la teoría de la probabilidad. En ellas el error típico mide la 'i,;~~tensión en que las estimaciones muestrales se distribuyen alrededor del parámetro J)oblacional. Concretamente, se especifica que, aproximadamente, el 68,3% de las es-

;Spe


178

Métodos de encuesta

Capítulo 3: El diseño de la muestra

timaciones muestrales están comprendidas en el intervalo definido por ±1 vez el error típico del parámetro poblacional; el 95,5%, entre ±2 veces el error típico y, finalmente, el 99,7%, entre ±3 veces el error típico. O sea, el error típico o de muestreo se informa en términos de probabilidad. Mide la variabilidad en las estimaciones muestrales al haberse extraído información de una única muestra, de todas las posibles, de las ~smas características, que pueden extraerse de la población de estudio. Depende de la muestra seleccionada. Si ésta hubiese sido otra, las estimaciones de los parámetros poblacionales no hubiesen sido exactamente las mismas. Esas variaciones en las estimaciones es lo que expresa el error típico o de muestreo. En su cálculo intervienen los siguientes elementos: el tamaño de la muestra, la varianza poblacional, el nivel de confianza adoptado y el método de muestreo aplicado.

179

Q. Incluso, véase que para reducir el error típico a la mitad, habría que cuadruplicar 1tamaño de la muestra. Por ejemplo, una muestra compuesta de 500 unidades en la situación más desfavorable (P = Q = 50) presenta un error típico de ± 4,5% (a un nivel de confianza del 95,5%). Para reducir dicho error a ±2,2%, habría que multiplicar el tamaño muestral por 4, obteniéndose una muestra de 2.000 unidades. Si el tamaño de la muestra se amplía de 1.000 a 4.000 unidades, el error también se reduce a la mitad (de ±3,2% a ±1,6%). Esto significa que, incrementando el tamaño de la muestra, tanto como lo permitan los recursos (económicos, materiales, humanos) y los plazos temporales para la realización de la encuesta, podría reducirse el error muestra/. Su reducción supondrá una mayor precisión de las estimaciones de los parámetros poblacionales a partir de la información extraída de la muestra.

El tamaño de la muestra valeiaJ17a

No es la proporción de la población que constituye la muestra (la fracción de muestreo = n/N) lo que determina el error muestral (salvo cuando lafracción es elevada), sino el tamaño de la muestra. A medida que aumenta su tamaño, decrece el error muestral (cualquiera que sea el valor de la varianza poblacional). Esta afirmación puede comprobarse en el cuadro 3.11. En él figuran los errores típicos correspondientes a determinados tamaños muestrales. Estos errores típicos disminuyen, conforme se incrementa el tamaño de la muestra, indistintamente de los valores presupuestos de P

CUADRO 3.11. Errores típicos para distintos tamaños muestrales para un nivel de confianza, en la inferencia, del 95,5% Valores presupuestos de P y Q (%)

Número de unidades en la muestra

1199

10/90

20/80

30/70

40/60

50/50

50 100 200 500 1.000 1.500 2.000 3.000 4.000 5.000 10.000 50.000

2,8 2,0 1,4 0,9 0,6 0,5 0,4 0,4 0,3 0,3 0,2 0,1

8,5 6,0 4,3 2,7 1,9 1,6 1,3 1,1 1,0 0,9 0,6 0,2

11,4 8,0 5,7 3,6 2,6 2,1 1,8 1,5 1,3 1,1 1,8 0,3

13,0 9,2 6,5 4,1 2,9 2,4 2,0 1,7 1,4 1,3 1,0 0,4

13,9 9,8 7,0 4,4 3,1 2,5 2,2 1,8 1,5 1,4 1,0 0,4

14,2 10,0 7,1 4,5 3,2 2,6 2,2 1,8 1,6 1,4 1,0 0,4

poblacional

La heterogeneidad de la población, respecto de la variable de estudio (aquella cuvariabilidad se analiza), favorece el error muestra/. Como ha podido constatarse en cuadro 3.11, para un mismo tamaño muestral, conforme aumenta la varianza pob/tlcÍf?mll (heterogeneidad máxima cuando P = Q = 50), sube el error muestral, tanto cuanto más heterogénea sea la población. Se debe ala mayor probabilidad de que la muestra no estén representadas toda la variedad de unidades que componen la ¡j(jbl.~ci.ón. Su reducción exigirá incrementar el tamaño de la muestra para incluir a los cm,tintos integrantes de la población. de confianza adoptado

Como aumentar el nivel de confianza supone ampliar el tamaño de la muestra, obiamente un mayor nivel de confianza conllevará la reducción del error muestral. Pee a ello, hay que insistir en que, cuando se diseñe una muestra, se valoren conjuntaente distintos aspectos, buscando el equilibrio entre precisión y coste. Incrementos en el tamaño de la muestra conllevan una ampliación del nivel de conpanza en la estimación muestral (descendiendo el error). Pero esta mejora en precisión .[ypercute en unos costes superiores de la investigación. Por esta razón, el nivel de con{i(J,fl za más empleado es el ya referido de 95,5%. Expresa que hay un 95,5% de propabilidad de que la estimación del parámetro poblacional esté comprendida en el in~~rvalo definido por dos veces el error típico. Elmétodo de muestreo aplicado

El error muestral también se halla afectado por el procedimiento de selección de unidades de la muestra. En general, el muestreo aleatorio estratificado es (de los dimuestrales probabilísticos)el que genera un menor error muestral. En cambio, muestreo aleatorio por conglomerados es (de los probabilísticos) el que ocasiona un


180

Capítulo 3: El diseño de la muestra

Métodos de encuesta

mayor error de muestreo. Aunque la agrupación de la muestra en conglomerados presenta la gran ventaja de reducir los costes (en tiempo y dinero) del trabajo de campo, a su vez repercute en una desventaja importante: incrementa el error típico de la muestra, con la consiguiente disminución en precisión de las estimaciones de los parámetros poblacionales. A estas afinnaciones genéricas cabe añadir -de acuerdo con Fowler (1988)-las precisiones siguientes: a) El muestreo aleatorio sistemático ocasiona errores de muestreo equivalentes a las muestras aleatorias simples, siempre y cuando no exista ninguna estratificación

en la muestra. b) Las muestras aleatorias estratificadas presentan menores errores de muestreo que las muestras aleatorias simples del mismo tamaño. Pero, sólo si existe heterogeneidad entre los estratos. c) El muestreo aleatorio por conglomerados genera un mayor error típico, sobre todo cuanto mayor es el tamaño de los conglomerados en la última fase de muestreo. Resumiendo, el error muestral puede reducirse no sólo incrementando el tamaño de la muestra, sino también asegurando su representatividad. Para ello se precisa aplicar un procedimiento para la selección de las unidades de la muestra "aleatorio", que dé a todas las unidades de la población (del marco muestral) la misma probabilidad de formar parte de la muestra. El muestreo aleatorio estratificado permite reducir el error muestral, porque se ajustan las probabilidades de selección en los distintos grupos o estratos constituidos con los integrantes de la población. Pero, siempre y cuando la estratificación se haya realizado de acuerdo a una variable clave en la investigación (como se destacó en el subapartado 3.4.3). El cálculo del error muestral ha de hacerse en consonancia con el método de muestreo aplicado. Las fórmulas de uso más extendido para el cálculo del error típico o muestral son las correspondientes al muestreo aleatorio simple y sistemático, que se incluyen en el cuadro 3.12. En él se distingue entre error típico de la media de Y (o variable cuya variabilidad se analiza) y de una proporción (P). A su vez se diferencia entre universo finito e infinito (o de más de 100.000 unidades). El error típico de la estimación de la media ( Se y ) es, en consecuencia, una medida de dispersión de la distribución de muestreo de la media muestra!. Se define como la raíz cuadrada de la varianza de la distribución de muestreo de la media muestra!. Lo mismo es extensible a proporciones muestrales. En este caso, las proporciones P y Q pueden expresarse tanto en términos porcentuales como en tantos por uno, obteniéndose los mismos resultados. Para poblacionesfinitas (aquellas de 100.000 unidades amenos), se aplica el factor de corrección (1-

~ ) . Normalmente se considera aceptable ignorar dicho factor de

181

corrección, cuando la fracción de muestreo (f = n/N) es menor de 0,1. Es decir, cuando menos del 10% de la población ha de ser muestreada. En poblaciones infinitas, la aplicación de este factor de corrección no es de utilidad, al ser la corrección prácticamente 1. En ellas es el tamaño de la muestra, no el porcentaje de la población muestreada, lo que determina la precisión del estimador. Una muestra de 1.500 unidades tiene la misma precisión indistintamente de que la población esté formada por 100.000 , unidades o por 1.000:000 e, inclusive, más.

CUADRO 3.12. Fórmulas del error típico para muestras aleatorias simples o sistemáticas Población infinita (> 100.000 unidades)

Población finita (s 100.000 unidades)

Error típico de la media

. Error típico de una proporción

Se(p) =

~PxQ N-n - - x-n

N-l

El error típico de la estimación (Se), indistintamente de que sea de la media, de una proporción o de otro estadístico estimado en una muestra, permite el cálculo de los in~ervalos de confianza. Éstos constituyen la medida más popular de la precisión de las estimaciones muestrales. Indican el intervalo de valores que comprende al parámetro Lpoblacional a partir de la estimación muestra!. Como en toda inferencia estadística, los ¿intervalos de confianza se estiman para un nivel de confianza concreto. Si es 99,7%, el ,error se multiplicará por 3; si es 95,5%, por 2; y si fuese 95%, por 1,96. , El intervalo de confianza es igual al valor estimado en la muestra menos (límite inferior del intervalo) y más (límite superior del intervalo) el producto de Z por el error típico de estimación (Se). Es decir, ± (Z x Se(Y)) o P± (Z x Se(p»). Cuanto mayor . sea el error, menos precisa será la estimación del parámetro poblacional, al ser más amplio el intervalo de confianza. Toda estimación muestral es inferible a la población de ,la que procede la muestra, dentro de los límites marcados por el intervalo de confianza. Cuanto menor sea su amplitud, más se aproximará la estimación muestral al parámetro poblacional correspondiente. Los intervalos de confianza deberían informarse, junto con el estadístico muestral, para que el lector pueda apreciar la precisión de las estimaciones muestrales. 0, al menos, informarse de la magnitud exacta del error de es-

Y

timación.


182

Métodos de encuesta

Capítulo 3: El diseño de la muestra

183

En muestras aleatorias estratificadas proporcionales se introducen las siguientes moficaciones en el cálculo del error típico o muestral: n

¿ni x S? A} En una encuesta por correo a 890 sociólogos de los 6.428 colegiados, se obtuvo que la edad media en la que consiguieron su primer puesto de trabajo fue los 27 años, con una desviación típica 2,8 años. Conociendo el error de la estimación, inferir el parámetro poblacional correspondiente a un nivel de confianza del 95,5%. La fracción de muestreo es 0,138 (f = n/N =890 / 6.420 =0,138). Razón por la cual se aplica el factor de corrección para población finita (N = 6.428), siendo la fórmula a aplicar: Se(Yj =

~.§2

n

N-n ~2,82 6.428 - 890 x N -1 = 890 x 6.428 -1 = 0,0871

A partir de este error muestral puede inferirse, con una probabilidad de acierto en la inferencia del 95,5%, que la edad media de inicio en la actividad laboral del conjunto de la población de sociólogos colegiados (el parámetro poblacional) será una edad comprendida entre 26,83 años y 27,17 años. Este intervalo de confianza resulta de restar y sumar a la edad media muestral (27 años) el producto del error (0,0871) por el valor Z correspondiente a un nivel de confianza del 95,5% (Z =2):

y ± (Z x Se(Y)} =

27 ± (2 x 0,0871). Al ser la amplitud del intervalo muy pequeña, el error es bajo y, por consiguiente, la precisión de la estimación muestral es muy elevada. B} En la misma encuesta se obtiene que el 43% de los sondeados dice estar satisfecho con la enseñanza que recibieron en la universidad. En este caso, el error muestral es de ±1,54%, habiendo una probabilidad del 95,5% de que el porcentaje de sociólogos colegiados satisfechos con la enseñanza recibida sea un porcentaje comp~endido entre 39,92% y 46,08%. El intervalo de confianza es ahora más amplio: P ± (Z x Se(p)}

=

• Error típico de estimación de la media: Se(-Ypropl¡ -

i-l

n

¿ni xi>; XQi Error típico de estimación de una proporción: Se(pprOI1

_nz

= \1 =i==l_--

P¡ = proporción de la muestra en el estrato i que posee el atributo en cuestión. Qi = 1 - i>; = proporción que no posee dicho atributo.

S? = i>; x Q"

= estimación de la varianza de la variable de interés para la población en el estrato i.

n

¿ =sumatorio de todos los estratos, desde 1 hasta n. i=l

ni

= tamaño de la muestra en el estrato i. n = tamaño de la muestra total.

43± (2 x 1, 54) . La estimación muestral es menos precisa, al haber

mayor varianza poblacional.

~ P x Q N-n ~ 43 x 57 6.428 - 890 Se(p) = - n - x N -1 =---a9Q x 6.428 -1 = 1,54 C) Si la encuesta se hubiese realizado a sociólogos españoles, independientemente de que estén o no colegiados, y se hubiese obtenido ese mismo porcentaje de satisfechos (43%), el error muestral para ese mismo tamaño de la muestra (890 unidades) habrfa sido mayor: ±1,659%. El intervalo de confianza, 43 ± (2 x 1, 659), va del 39,68 al 46,32%. Una amplitud muy ligeramente superior a la obtenida en el supuesto anterior. Prácticamente es similar. El error muestral se habrfa reducido, incrementando el tamaño de la muestra.

.

~P xQ

~43X57

Se(p) = --n- = ---a9Q = 1,659

Re qu~ere ~on.ocer el_grado de ~ceptación de los Nuevos Planes de Estudio por la poIon Unlversltana espanola. A tal fin se escoge una muestra integrada por 2.439 alumnos la Universidad Complutense. La muestra se afija entre las distintas facultades de maneIJroporc~~nal al número de alumnos registrados en dichas facultades. Para ello se multiplica proporclon que representa cada uno de los estratos (facultades) -columna (2), en el cuaro.3.K- por el tamaño muestral (2.439), obteniéndose las cifras en la columna (3). En la cort1na (4) figuran las proporciones de alumnos que en cada facultad afirman estar satisfechos n los Nuevos Planes de Estudio. Para estimar el error típico de esta muestra aleatoria estratificada proporcional se procede .. multipli~~ el número de alumnos que componen la muestra en cada estrato (columna 3) por ~pr~porclon de alumnos a favqrde los ~uevos Planes de Estudio (columna 4) y por la pro?rclon de alumnos en contra (Qi = 1- P¡), en cada estrato. Como resultado se obtienen las ~Ifras que aparecen en la columna (5). Después, se suman dichos productos y se sustituyen en la fórmula correspondiente:


184

Métodos de encuesta

Capítulo 3: El diseño de la muestra

n L:n¡ xp¡ xQ¡ ¡=1

Se(pprop) =

n2

deff = (0,0095)2 = 0,921

= ~536,84 = 0,0095

(0,0099)2

2.4392

CUADRO 3.K. Distribución proporcional de la muestra por estratos (facultades universitarias)

Población

Facultades

(1 )

Proporción población

(2)

n¡P,{1 - Pi)

r¡=n¡P¡

(3)

(4)

(5)

(6) 55 43 32 326 281 72 49 102 76 203 95 28 47

Medicina Farmacia Veterinaria Derecho Económicas y Empresariales Políticas y Sociología Psicología Filología/Filosofía/Pedagogía Geografía e Historia Ciencias de la Información Química y Física Ciencias Exactas Biología y Geología

4.535 4.983 2.682 18.600 13.755 6.888 4.567 10.613 6.063 13.900 5.568 2.411 4.388

0,046 0,050 0,027 0,188 0,139 0,070 0,046 0,107 0,061 0,141 0,056 0,024 0,044

112 122 66 459 339 171 113 261 149 344 137 59 107

0,49 0,35 0,49 0,71 0,83 0,42 0,43 0,39 0,51 0,59 0,69 0,47 0,44

27,99 27,76 16,49 94,51 47,83 41,66 27,70 62,09 37,24 83,21 29,30 14,70 26,36

Total

98.953

1,000

2.439

0,58

536,84

j

1.409

Para demostrar que el muestreo estratificado genera un menor error típico que el muestreo aleatorio simple, se calcula el error típico que se tendría si la muestra hubiera sido aleatoria simple. Con este propósito se estima la proporción de los alumnos encuestados que afirman estar a favor de los nuevos planes de estudio. En la columna (6) figura el número de alumnos que contestaron estar a favor en cada uno de los estratos considerados. Si se suman dichas cantidades (r¡) y se divide por el total de sujetos analizados (2.439), se obtiene la proporción global de alumnos a favor: el 57,8% de los encuestados.

p =

Por tanto, Se(p) =

/PxQ.

V-n-

185

L:r¡n = 1.409 = °578 2.439 '

De esta forma se concluye que la varianza de la muestra estratificada proporcionalmente es un 8% más pequeña que la varianza de la muestra aleatoria simple. Por consiguiente, si se quiere alcanzar la misma precisión en la estimación de los parámetros poblacionales mediante un muestreo aleatorio simple, habría que ampliar el tamaño muestral a 2.648 (esta ci'fra se obtiene dividiendo 2.439/0,921). Con ello se demuestra la mayor precisión alcanzada •.. mediante un muestreo aleatorio estratificado. La diferencia entre ambos tipos de errores crece a medida que aumentan las variaciones observadas en los estratos respecto a la variable considerada.

Trujillo (2000) muestra los beneficios, en la estimación del error típico, en el muestreo estratificado (estratificando por secciones censales), respecto al muestreo aleatorio simple, en encuestas a la población en general. Para el cálculo del error muestral con replicación utiliza el programa Wesvar. Logra hasta un 50% de reducción en error muestral en la muestra estratificada respecto a la aleatoria simple.

En el muestreo aleatorio por conglomerados, el error típico depende de la correlación de los valores entre los integrantes de un mismo conglomerado, además del número . de unidades de la muestra elegidas en el conglomerado. La correladón intraconglomerado mide la covariación entre los pares de unidades en el mismo conglomerado, icalculada por desviaciones de la media global. La fórmula correspondiente al error típico para la estimación de la media poblacional sería:

Se(-

)(1 _~) M

2

x

Sb m

= número de conglomerados en la población. m = número de conglomerados seleccionados en la muestra. Sb 2 = varianza de los valores del conglomerado xi" Se obtiene:

Sb 2

N-n _ 10,58xO,42 98.953-2.439 -O 0099 x N _1 - ~ 2.439 x 98.953 - 1 -,

En este caso, la diferencia entre ambos tipos de errores parece mínima. Pero, si se eleva el error típico al cuadrado (varianza) obtenido del muestreo aleatorio estratificado, y se divide por el cuadrado del error típico que se obtendría mediante un muestreo aleatorio simple, se comprueba el efecto del diseño (deff), enunciado por Kish (1965/1995):

A=

Ycong'}

1 --=1:¿ (y¡ - y) m n

=

-

-

2

;=1

Como ya se dijo en el subapartado 3.4.4, para que el efecto del diseño sea peque-

ño, en un muestreo por conglomerados es preferible que el tamaño del conglomerado no sea muy grande.


186

Métodos de encuesta

Capítulo 3: El diseño de la muestra

187

MSE = varianza + sesgos2

Adaptemos el ejemplo anterior a una muestra aleatoria por conglomerados. Con este propósito se divide la población universitaria por curso académico y grupo. Imaginemos que fuesen 780 los grupos existentes en total. De ellos se decide escoger aleatoriamente 20 grupos (conglomerados) de 122 alumnos cada uno. De esta forma se obtendría una muestra total de 2.440 alumnos. El error típico para esta muestra por conglomerados sería:

Se(-

)

Ycongl

=

( m)

2

Sb1-M xm

=

(

20) 0,099 1- x -780 20

=

00698 '

Donde: M = número de conglomerados en la población (780). m = número de conglomerados seleccionados en la muestra (20). StJ2 = varianza de los valores del conglomerado a favor de los nuevos planes de estudio (0,099). Como era de esperar, el error típico supera al alcanzado mediante la estratificación (0,0095) y, también, el muestreo aleatorio simple (0,0099).

En general, las estimaciones de los errores típicos para muestras aleatorias por conglomerados (en especial, en muestreos polietápicos, en los que difiere la unidad de muestreo primaria de la de observación) resultan bastante complejas. Si bien, en la actualidad existen varios programas estadísticos (SAS, Stata, Wesvar o Sudaan), que calculan los errores típicos para cualquier variedad de diseño muestra!. Estimaciones de error muestral, que deberían adecuarse al diseño de la muestra. Uno de los grandes errores cometidos por los investigadores que usan encuestas consiste en analizar una muestra por conglomerados como si fuese una muestra aleatoria simple. Por lo general, una confusión como ésta hace que los investigadores informen de errores estándar mucho menores que lo debido; esto da la impresión de que los resultados de la encuesta son mucho más precisos de lo que realmente son (Lohr, 2000: 132).

Asimismo, ha de insistirse en que el error de muestreo es sólo uno de los integrantes del error total de encuesta. Cada estimación de encuesta tendrá su correspondiente error de la media cuadrática (MSE: Mean Square Error). Por él se entiende: "la diferencia cuadrada promedio entre las estimaciones producidas por muchas repeticiones hipotéticas del proceso de encuesta y el valor del parámetro en la población" (Biemer y Lyberg, 2003: 53). En general, se define como la suma de todos los errores variables y todos los sesgos al cuadrado. En concreto,

Por varianza se entiende la diferencia cuadrada promedio entre las estimaciones de encuesta, desde las replicaciones, y el valor promedio de las replicaciones. Indica errores variables (cuando los errores negativos en las observaciones tienden a cancelar a los positivos), qu~ con frecuencia se asume que son aleatorios. Sus valores difieren entre encuestados, entrevistadores, preguntas del cuestionario, codificadores y demás intervinientes en el proceso de encuesta. Los errores de muestreo, medición y de tratamiento de la información están más expuestos a error variable. . En cambio, los sesgos indican errores sistemáticos, que afectan a cualquier muestra en un diseño de encuesta específico, con el mismo error constante. Quiere esto decir, que influyen en todas las aplicaciones de un mismo diseño de encuesta. "Todas las posibles encuestas que utilizan el mismo diseño podrían sobreestimar los años medios de educación por persona en la población" (Graves, 1989: 8),por ejemplo. En ese sentido, es un error "constante", no aleatorio. Los errores negativos en las observaciones .no serían contrarrestados por los positivos, porque unos son más prevalentes que los . otros. De modo que, cuando las observaciones de la muestra se promedian, la suma de estos errores no es cero, a diferencia de los errores variables. En su resolución habría que modificar el diseño total de la encuesta. No sólo introducir cambios en algunos de sus actores (entrevistadores, codificadores, encuestados), ni incrementando el tamaño de la muestra, como sucede con los errores variables. Los intervalos de confianza que se elaboran en datos de encuesta (utilizando varianza muestral sólo) no reflejan algunos de los sesgos de cobertura, no respuesta, medición o muestreo, que pueden plagar la encuesta (Graves, 1989: 13).

En los próximos capítulos se concretarán los efectos de los otros errores de encuesta, ajenos al error de muestreo y de no cobertura aquí tratados. Cualquier actuación para la mejora de la encuesta irá encaminada -en consonancia con lo aquí dicho- a la reducción preferente de los errores sistemáticos, por sus efectos más perjudiciales en la calidad de la encuesta en su conjunto. Además, téngase presente que los otros errores ajenos al de muestreo pueden llegar a contribuir más al error total de la encuesta que el error de muestreo (el más medido en la investigación mediante encuesta), como se verá en los capítulos que siguen.

LECTURAS COMPLEMENTARIAS

Azorín, F. YSánchez Crespo, J. L. (1986): Métodos y aplicaciones del muestreo. Alianza. Madrid. Clairin, R. y Brion, P. (2001): Manual de muestreo. Hespérides. Madrid. De Vaus, D. (comp.) (2002): Social surveys. Sage. Londres.


188

Capítulo 3: El diseño de la muestra

Métodos de encuesta

Henry, G. T. (1990): Practical samplig. Sage. Newbury Park. Kish, L. (1965/1995): Survey samplig. John Wiley and Sonso Nueva York. Levy, P. S. y Lemeshow, P. S. (1991): Sampling ofpopulations: methods and applications. Wiley. Nueva York. Lohr, S. L. (2000): Muestreo: diseño y análisis. International Thomson Editores. México. Rodríguez Osuna, J. (1991): Métodos de muestreo. Centro de Investigaciones Sociológicas. Colección Cuaderno Metodológico, n.o 1. Madrid. Rodríguez Osuna, J. (1993): Métodos de muestreo. Casos prácticos. Centro de Investigaciones Sociológicas. Colección Cuaderno Metodológico, n.o 6. Madrid. Singh, S. (2003): Advanced sampling theory with applications. How Michael selected Amy. Kluwer Academic Publishers. Dordrecht, The Netherlands.

EJERCICIOS PROPUESTOS 1. Quiere conocerse la adaptación de los estudiantes extranjeros al sistema educativo español. Defina la población de estudio y concrete el marco muestral que utilizaría para el diseño de la muestra y su repercusión en los errores de encuesta. ¿Habría variaciones dependiendo del método de encuesta que se elija? .Justifique la respuesta.

2. En los informes FOESSA, en los informes sociológicos financiados por la Universidad Complutense, o en los publicados por el Instituto de la Juventud, se adjunta el detalle del diseño muestral de la encuesta que en ellos se analiza. Escoja uno o varios de éstos u otros informes y describa el diseño de la muestra. Acompañe su descripción de reflexiones sobre posibles repercusiones de las decisiones adoptadas en los errores de encuesta. Proponga un diseño muestral alternativo. 3. Diseñe la muestra para una encuesta a estudiantes universitarios, con objeto de conocer su valoración de la enseñanza universitaria. Plantee diseños muestrales alternativos en función del método de encuesta elegido y de la población de estudio. Justifique los distintos pasos hasta la selección de las unidades últimas de observación, junto con las posibles consecuencias de determinadas actuaciones en los errores de no cobertura y de muestreo. 4. Se quiere conocer la proporción de alumnos a favor de la reforma de los planes de estudio en una universidad que cuenta con 86.724 alumnos matriculados. Calcule: a) El tamaño muestral para un error máximo de ±3,5%. b) Afije la muestra, de varias formas posibles, atendiendo al ciclo donde se en-

cuentran cursando estudios. Describa los distintos procedimientos de afijación.

Ciclo universitario

Primero Segundo Tercero

.

N. ° alumnos

Desviación típica

41.458 34.120 11.146

2,06 5,14 4,32

189

c) ¿~ué es ponderar? Pondere la muestra para la afijación simple. d) SI la muestra hubiese estado integrada por 978 alumnos, calcule el error muestral partiendo de que el 47% de los alumnos están a favor de la nueva ley universitaria. 5. Se desea conocer la, situación laboral de la población residente en un municipio. La encuesta se hara a personas ocupadas de 16 y más años. Tomando los datos del último Censo de Población Activa se obtiene la siguiente clasificación:

Población activa ocupada Profesión

Profesionales y técnicos Personal directivo Empleados administrativos Comerciantes y vendedores Personal de servicios ... Agricultores Obreros Total

Total

Varones

Mujeres

117.430 17.131 102.507 76.039 81.409 17.377 292.238

60.942 15.252 49.721 41.743 34.364 14.236 270.952

56.488 1.879 52.786 34.296 47.045 3.141 21.286

704.131

487.210

216.921

a) D~te~mi~ar el tamaño muestral para un error máximo de ±2,5%.

b) DIstnbUlr la muestra proporcionalmente. c) Ponderar la muestra para la afijación simple. d) P,on~erar la muestra si se hubiesen hecho 400 entrevistas a profesionales y tecmcos. e) Calcular el error para las siguientes estimaciones de insatisfechos con su situación laboral: 39,4% profesionales y técnicos, 28,3% personal directivo 73,8% empleados administrativos, 54,1% comerciantes y vendedores 59 60/; personal de servicios, 48,2% agricultores y 52,1 % obreros. "


EL DISEÑO DEL CUESTIONARIO

componente clave en cualquier proceso de medición es el instrumento que se utipara la recogida de información. En la encuesta es el cuestionario. Aunque éste "':;~;'.".",";;"",.":'" tarnbJLén se aplica en otras estrategias de investigación, como en la experimentación o el uso de fuentes documentales y estadísticas. En este último caso, para el vaciado de información incluida en informes o expedientes. La fase correspondiente al diseño del cuestionario es trascendental en la planificación de una encuesta. Del acierto de su diseño depende la calidad de los datos que de ella se extraigan. En el apartado 1.5 se destacó al cuestionario como una de las fuenpotenciales de errores de medición en la encuesta, junto con la actuación de los ag(~nt(~s que en ella intervienen: el encuestado (su voluntad o incapacidad para pro~~'r~11~n#':l'" una información veraz) y el entrevistador (cuando la encuesta se realiza meentrevista). Además de los errores propiciados por el tratamiento que se haga información recabada mediante el cuestionario. El presente capítulo trata del cuestionario, de su influencia en los distintos errores medición y de cómo éstos pueden reducirse con una mejora en su diseño, de la tra""'~""''''''''-'''''''' de los conceptos teóricos clave en preguntas concretas en un cuestionario, de proceder para su correcta formulación y disposición en el cuestionario. Como Lohr (2000: 9), "la obtención de respuestas precisas es un reto en todo tipo de •· • ·.····.··eJnClles1tas. En especial, las realizadas a personas". Porque las personas no siempre dila verdad; no siempre comprenden las preguntas que se les hacen; pueden tener ...., ~'v " u de memoria y no acordarse acerca de lo que se les pregunta; y pueden dar reSOU(~st(lS distintas según cómo, cuándo y dónde se les interrogue. De la influencia del método de encuesta empleado ya se habló en el capítulo 2. Ahonise quiere indagar en los efectos atribuidos al cuestionario y cómo éste puede debilitar la presencia de los deerrores de medición. ,: ..

..,..,

&.4.


192

M étodos de encuesta

Capítulo 4: El diseño del cuestionario

4.1. De los conceptos teóricos a los indicadores empíricos: el error de especificación Antes de proceder a la redacción de las preguntas del cuestionario, una tarea prioritaria para eliminar posibles errores de especificación es decidir qué conceptos son clave en la medición del problema de investigación y cómo van a operacionalizarse. Los errores de especificación se dan cuando el concepto implicado en la pregunta del cuestionario y aquel que debería medirse en la encuesta difieren. Disonancia que resulta en estimaciones erróneas de los datos de encuesta. Ésta no consigue una adecuada medición del objeto de estudio. El "objeto de interés" es, de acuerdo con Becker (1998: 122), el comienzo de la conceptualización. Ver en lo que se está interesado y sobre lo que no se quiere saber. Pero, ¿qué se entiende por concepto? Los conceptos pueden definirse como "símbolos lingüísticos que categorizan ~ los fenómenos" (Phillips, 1985: 77). Pueden derivarse de reflexiones teóricas, de" generalizaciones empíricas (a partir de resultados de investigaciones) o de reflexiones propias sobre la variedad de experiencias de la vida social. Sea como fuere, se caracterizan por representar constructos abstractos, no directamente observables, como son, por ejemplo, los conceptos de anomia, cohesión social, amistad, discriminación o xenofobia. Para Kaplan (1964: 49) el concepto es "una familia de ideas". Son constructos. El concepto de compasión, por ejemplo, es un constructo creado a partir de la idea de compasión, que comparten quienes han utilizado dicho término. No se puede observar ni directa ni indirectamente porque no existe. Nosotros lo construimos. Otros autores (Kerlinger, 1986; Hox, 1997) prefieren distinguir el concepto del constructo, como "abstracciones teóricas". El concepto es una abstracción formada por la generalización de fenómenos similares. Incluso cuando su nombre es una palabra comúnmente utilizada (como pueden ser los términos clase social, desempleo, satisfacción) se adaptan o crean por los investigadores en consonancia con sus objetivos de investigación. En cambio, el constructo es un concepto sistel11álicªm~I1t~º~tini4o,más formal, para su uso en la teoría científica. - -- -Por ejemplo, delincuencia es un concepto que expresa la tendencia de las personas a mostrar conductas que se clasifican como "delictivas". Puede definirse haciéndose referencia a las conductas que cada sociedad cataloga de "delictivas". Por el contrario, la desviación sería (en consonancia con estos autores) un constructo. Aunque se refiere a la tendencia de las personas a mostrar conductas que se clasifican como "desviadas", sólo puede definirse en el marco de alguna teoría que delimite qué conductas son "desviadas".

En consecuencia, los conceptos cumplen una función fundamental de "síntesis", de denominación común, que englobe a una serie de observaciones, proporcionándolas un sentido.

1YJ

El concepto de tristeza, por ejemplo, ofrece una denominación común a una serie de manifestaciones diferentes: llanto, desánimo, bajo tono de voz, negativa a hablar, a comer, problemas de sueño. Difieren por su mayor o menor grado de abstracción. El concepto de poder connota un grado de"abstracción superior al de los conceptos de educación o empleo.

Tanto los concept()s como los constructos han de vincularse a variables empíricas u observacionales mediante una definición operacional. En ella se indica cómo piensa medirse el concepto, las variables con las que están vinculados y qué valores se diferenciarán en la misma. Este proceso de traducción de constructos teóricos a variables observables que le representen adecuadamente se define como operacionalización. Por el contrario, la conceptualización "implica la formación de conceptos, que establece el significado de un constructo, elaborando la red nomológica y definiendo importantes subdominios de su significado" (Hox, 1998: 53). En la concepción del operacionismo han sido claves la aportación pionera de G. A. Lundberg, de 1939 (Foundations of Sociology. Macmillan. Nueva York), a partir de las propuestas de ~ W. Bridgman en el campo de la física (expresas en su obra The logic ofmodern physics, editada igualmente por Macmillan, en 1927). Para Lundberg la definición operacional es el constructo, no un proceso para observar un constructo después de que se ha definido. Supone que cualquier cambio en la definición operacional implica un nuevo constructo teórico. Por ejemplo, "si medimos el calor con un termómetro de mercurio y con un termómetro de alcohol, se están midiendo cosas diferentes. De manera similar, si cambiamos una palabra en nuestra pregunta, estamos midiendo un constructo diferente" (Hox, 1998: 50).

_-:-7b_:~';d+~">_cc~--- ..

Igualmente ha sido clave la aportación de Paul F: Lazarsfeld, en su artículo pionero "Evidence and inference in social research", de 1958 (Daedalus, 87: 99-130) y en publicaciones posteriores (1971, 1972 Y1973). En ellas propone el procedimiento a seM,-"'''' para pasar de la conceptualización a la operacionalización de conceptos teóricos. Cuatro son las fases esenciales: 1. Representación teórica del concepto, de forma que queden reflejados sus rasgos

definitorios. 2. Especificación del concepto, descomponiéndolo en las distintas dimensiones o

aspectos relevantes que engloba. 3. Para cada una de las dimensiones se selecciona una serie de indicadores (o va-

riables empíricas), que "indiquen" la extensión que alcanza la dimensión en los casos analizados. 4. Síntesis de los indicadores mediante el cálculo de índices. A cada indicador se le asigna un peso o valor, de acuerdo con su importancia. A partir de estos valores se confecciona un índice. Es decir, una medida común que agrupe a varios indicadores de una misma dimensión operacionalizada numéricamente.


194

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

b) Determinar los referentes empíricos que pertenecen al constructo y cuáles no. Para evitar deficiencias en la definición constitutiva del constructo, que no esté definido con suficiente precisión. Hay que restringir su significado, incrementando el número de sus características definitorias. c) Asegurarse de que la etiqueta verbal dada al constructo sea comprendida inequívocamente. Los términos abstractos con frecuencia tienen pocas características distintiV'as y se refieren a un gran conjunto de referentes empíricos. Para evaluar la terminología empleada, Hox (1997: 57) propone el test de la sustitución. Significa que "si en una definición constitutiva una palabra puede ser sustituida por otra palabra con una'ganancia en claridad o precisión, entonces la primera palabra está siendo mal usada". Por su parte, Sartori (1984) insiste en la necesidad de que los términos clave del concepto sean entendidos unívocamente, no ambiguamente. Ello exige que, al seleccionarlos términos que designen al concepto, se relacione y controle con el campo semántico al que pertenece el término. Quiere decir, la serie de palabras vecinas asociadas.

Fiske (1971) describe un procedimiento análogo al de Lazarsfeld. Parte, asimismo, de la representación teórica del concepto. De la necesidad de identificar su contexto teórico, a partir del marco teórico de la investigación. Si bien, insiste en que: a) El núcleo teórico es la esencia del concepto. Ha de cubrir todos los fenómenos a los que se refiere. Exige:

• Establecer explícitamente lo que el concepto incluye y excluye. Además, las diferencias con otros conceptos relacionados. • Describir su polo opuesto. Por ejemplo, si quiere medirse el concepto de satisfacción lo opuesto sería definir insatisfacción. Asimismo, en la medición de pobreza, describir su opuesto: riqueza. b) En las fases iniciales de la investigación, se puede partir de constructos más generales. Después, pueden especificarse subconstructos (equivalentes a las subdimensiones de Lazarsfeld) para alcanzar una mayor precisión.

Con posterioridad, Hox (1997) insiste en la necesidad de: a) Clarificar la definición constitutiva del constructo, asemejándose al análisis del significado de núcleo de Fiske (1971). La definición constitutiva del constructo ha de ser: • Adecuada: contener suficientes características que permitan una delineación satisfactoria de los límites empíricos y referentes del constructo: la definición denotativa. • Parsimoniosa: no incluir ninguna característica innecesaria.

A tal fin, Sartori (1984) propone recoger características de definiciones connotativas existentes (de un diccionario, de investigaciones previas).. A partir de ellas, abstraer un núcleo común. Este autor distingue dos formas diferentes en que puede definirse un constructo: • Las asociaciones que tienen en mente sus usuarios o la lista de características incluidas en el constructo: definición constitutiva. • La denotación semántica del constructo, por ejemplo, listando la serie de objetos a los que se refiere: definición operacional. Hox (1997) advierte de la posibilidad de'que aparezcan varias definiciones constitutivas diferentes. Razón por la cual es importante comprobar la ocurrencia de homónimos y sinónimos. Ha de evitarse la ambigüedad, que no quede claro el significado del constructo, porque éste tenga más de un significado. En este caso, habría que seccionarlo, de acuerdo con sus distintos significados. O porque exista más de un constructo para un mismo significado.

195

Puede decirse que tenemos un concepto de A (o de no A) cuando somos capaces de distinguir A de cualquier cosa que no sea A (Sartori, 1984: 74).

··.,,·.,'c.'·,'cc,';'"',,".'.'.· ...·.

Con estas tres propuestas Hox (1997) quiere evitar tres problemas que pueden darse en un constructo teórico: a) Problemas de connotación. Confusión de significados porque el constructo está asociado a más de un significado, o porque dos constructos apuntan el mismo significado y los investigadores no han hecho explícito lo que pretenden. b) Problemas de denotación. Constructos "vagos". No queda claro a qué objetos o referentes se aplica. c) Problemas terminológicos. Haber elegido, para el constructo, una etiqueta que induce a características o referentes erróneos. y admite que "el análisis semántico no lleva directamente a preguntas de encuesta.

embargo, ayuda a desintegrar significados diferentes y a reconocer la ambigüedad nuevos constructos" (Hox, 1997: 58). A la conceptualización puede llegarse desde la teoría, mediante un proceso de(de la teoría a los datos,' de lo general a lo concreto), a través del cual se extraen los constructos y se seleccionan las variables observables. Pero también puede llegarse los datos empíricos, mediante la operación metodológica de la inducción (de lo r"'""'...' n....,o1"'"'" a los principios generales, de los datos a la teoría). La teoría puede concebirse como "un grupo de proposiciones lógicamente interconectadas, de las que pueden deducirse uniformidades empíricas" (Merton, 1983: 56). Aparte de proposiciones (que indican cómo y en qué condiciones generales se cree que están relacionados los fenómenos definidos conceptualmente), las teorías están integradas por conceptos-y por axiomas o leyes.


196

Métodos de encuesta

Los conceptos constituyen "categorías para la organización de ideas y observaciones" (Bulmer, 1992: 43). "Sirven para clasificar y medir operativamente los fenómenos que se observan (Blalock y Blalock, 1968: 7). Los axiomas o leyes permiten explicar las regularidades o conexiones existentes en los fenómenos sociales.

Capítulo 4: El diseño del cuestionario

197

• Falta de control paterno: grado al que el joven percibe que sus padres le rechazan o no apoyan.

Por medio de un proceso deductivo, los conceptos y las proposiciones que conforman una teoría se concretan en variables empíricas o indicadores, que posibiliten la contrastación empírica de la teoría. A este proceso se le conoce como operacionalización de conceptos teóricos. Supone: a) La delimitación de los conceptos mediante definiciones nominales o teóricas, al igual que operativas (u operacionales). Una de las teorías que mayor apoyo empírico ha recibido en la explicación de la delincuencia juvenil es la Teoría del Control Social de Hirschi (1969). Esta teoría se fundamenta en los siguientes axiomas (o aseveraciones) esenciales:

a) Los controles sociales son los que mantienen al joven en la conformidad. b) La interiorización de la norma constituye el determinante de la conducta delictiva. c) Los lazos o frenos que mantienen al individuo en la conformidad son: • • • •

Afecto a personas convencionales (padres, profesores, amigos). Compromiso con líneas convencionales de acción. Implicación en actividades convencionales. Creencia en la legitimidad. Es de la creencia en la legitimidad de la norma de lo que depende, en último término, la "autorrepresión" del individuo y su no implicación en la conducta delictiva.

De estos comienzos axiológicos pueden deducirse proposiciones de las que derivan hipótesis como las siguientes:

• La definición nominal o teórica es la que se asigna a un concepto, a modo de lo indicado anteriormente, para definirlo y perfilarlo, pero que carece de las precisiones necesarias para medir los fenómenos a los que el concepto hace referencia. • La definición operacional comprende el significado concreto que se da al concepto, especificando cómo se medirá su ocurrencia en una situación determinada. Detalla el contenido del concepto a medir, vinculando los constructos definidos teóricamente con los procedimientos operacionales. b) La descomposición del concepto en las diferentes dimensiones o aspectos que incluye. Éstos los determina el investigador en función de sus objetivos de investigación. Es preferible, a efectos operativos, acotar el número de dimensiones a aquellas que sean más relevantes en la medición del concepto que abarcar indiscriminadamente toda dimensión que se le ocurra. La elección de dimensiones ha de estar justificada en relación con el problema de investigación.

----~.--1CYéiU'lta-mayQl"-+espeto-y-admil"ación-sienta-el-joven-tIaciaJas-personaS-COnJas-que-st#----_e'

identifica, menor es la probabilidad de que se emprenda en conductas delictivas. • Cuando el joven se libera de las ataduras que le vinculan a la sociedad convencional (familia, escuela, comunidad) está más predispuesto a transgredir la norma legal. • Cuanto más ocupado esté el joven en la realización de actividades convencionales, menor tiempo encontrará para cometer actos delictivos. • La ausencia de creencias que prohíban la realización de conductas delictivas llevan al joven desvinculado a la delincuencia. Las hipótesis contienen conceptos que precisan medirse para su comprobación empírica, proceso que se conoce como operacionalización de conceptos teóricos en indicadores empíricos. De las hipótesis anteriores podrían operacionalizarse los conceptos:

• Delincuencia juvenil: todo tipo de conducta contranormativa (que infringe la norma legal establecida) llevada a cabo por las personas menores de 18 años.

Retomando el concepto de delincuencia, a continuación va a ilustrarse cómo la operacionalización de un concepto teórico no siempre cubre la variedad de dimensiones que representa. Siempre se tratará de una aproximación susceptible a ser rebatida. En el Diccionario de Uso del Español de María Moliner (Editorial Gredos), la delincuencia se define como "cualidad de delincuente"; "fenómeno de cometerse delitos". Entendiéndose por delito, "acción p.enada por las leyes por realizarse en perjuicio de alguien o por ser contrario a lo establecidi:ipor aquéllos". Éstas son definiciones teóricas, que precisan de una mayor concreción a efeCtos operativos.


198

Métodos de encuesta

Se revisan teorías explicativas de la delincuencia, en busca de aclaración. Lo primero que se aprecia es la distinta conceptualización de la delincuencia, dependiendo del foco de interés en su análisis: qué motiva la transgresión de la norma legal (definición normativa) o qué hace de la transgresión un delito (definición reactiva).

Definición normativa primero, la delincuencia se define como transgresión o conducta que infringe la norma legal establecida en una sociedad determinada. Ésta es una definición normativa de la conducta delictiva, presente en el paradigma que podría llamarse de socialización y control. Agrupa aquellas perspectivas teóricas, que partiendo de la aportación de Durkheim y Merton (Teoría de la Anomia), coinciden en una misma concepción de la delincuencia como transgresión de /a norma legal, debida a la existencia de defectuosos procesos de socialización y de control, que no logran mantener al individuo en la conformidad. • A la delincuencia se recurre en busca de remedio a la tensión que se padece ante el fracaso en el logro de las metas valoradas culturalmente: "metas culturales" (Merton) o "aspiraciones ilimitadas" (Durkheim). Favorecida por la carencia de unas normas efectivas de control social que "controlen" a aquellos que comienzan a descomprometerse, moralmente, con las normas existentes (Teoría de la Anomia de Durkheim y de Merton, Teoría de la Oportunidad Diferencial de Cloward y Ohlin, Teoría de la Neutralidad de Sykes y Matza, Teoría del Control Social de Hirschi). La pérdida de integración del orden colectivo, la desigualdad económica, la presión hacia el éxito (elevadas aspiraciones contrapuesto a limitadas oportunidades), la pérdida de vínculos con la sociedad convencional (familia, escuela, comunidad) y la no interiorización de la norma legal (fracaso del proceso de socialización) se sitúan como desencadenantes de la delincuencia. La delincuencia se debe a un proceso de socialización diferencial, en la que se consigue la interiorización de una serie de normas y de valores contrarios a la legalidad (Teoría de la Subcultura de Cohen; Teoría de la Transmisión Cultural de Shaw y McKay y Teoría de la Asociación Diferencial de Sutherland). Se insiste en la influencia del entorno social inmediato (tener amigos, familiares delincuentes), junto con el compromiso con las expectativas que éstos tengan sobre ellos.

Capítulo 4: El diseño del cuestionario

• Supuestamente viola normas generales, desde el punto de vista cultural. .. • Origina fuertes reacciones sociales. . , Se manifiesta en actividades de control social, en manos de pohclas y Similares. • A menudo lleva a la desviación secundaria (al rol de delincuente). Ante esta distinta concepción de la delincuencia, en función de los objetivos de investigación, el investigad~r procederá a la acotació~ de !~s dimensio?es de los conceptos i~­ plicados en su análisis. Como ilustración, a contln~acl~~ se seleccl.onan al~u~os d~ los mas presentes en investigaciones empíricas, en la exphcaclon de la del!ncuencla Juvenil, aunque relacionados con la comisión de cualquier conducta contranormatlva. De la hipótesis siguiente: "cuanto menos vinculado esté el joven en la sociedad convencional (familia, escuela, comunidad), más predispuesto estará a transgredir la n?rma I.egal", se deriva el siguiente desglose del concepto de "vinculación social", en tres dImenSIones básicas: familiar, escolar, comunitaria (amigos, vecindad).

Familia

a) Características familiares: • Si vive o no con ambos padres. En caso contrario: motivo de la "ruptura familiar"; edad que tenía cuando se produjo; cómo le afectó. • Número de hermanos, lugar que ocupa (orden de nacimiento). • Estatus familiar: nivel de ingresos, de estudios y ocupación de los padres y hermanos.

b) Afecto hacia padres y hermanos 1:

• • • •

Definición reactiva Es la reacción social la que define la conducta como "delictiva", no la transgresión de la norma. Para el paradigma interaccionista (Teoría del Etiquetamiento) , la delincuencia se genera por la reacción social, a través de la creación, aplicación y fijación de la norma legal a determinadas conductas e individuos. El énfasis se pone en aquellas circunstancias socioestructurales que precipitan la reacción social. También, en el "rol" de delincuente, como resultado de la nueva identidad y expectativas que los "otros" tengan hacia él. Además de en la acción marginante de la sociedad. Gibbons y Jones (1971) proponen una definición de la delincuencia que pretende abarcar una mayor dimensionalidad del concepto:

199

• •

Tipo de relación que mantiene con los padres y hermanos: de cariño, cordialidad, indiferencia. Grado de comunicación entre ellos. Tiempo que pasa con ellos y tiempo que desearía pasar. Identificación con los padres y hermanos. Interés de los padres y hermanos con las actividades que realizan; con sus problemas e inquietudes. Compartir actividades con los padres y hermanos. Valores familiares: cumplimiento de las normas. Sanciones que suelen aplicarse cuando no se cumplen (castigos físicos, materiales, psíquicos). Deseos de satisfacer expectativas familiares. Discusiones familiares: frecuencia, intensidad, relevancia del tema.

Escuela

a) Actuación escolar: • Último curso académico realizado. Calificaciones obtenidas. • Si ha repetido o no algún curso académico.


200

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

201

transgresión de la norma legal), por las instancias de contr(jl social (policías, tribunales). Aparte de analizarse la seriedad y la gravedad de la infracción, junto con el número de diligencias policiales previas a la actuación judicial, por ejemplo. De esta forma se daría un carácter más amplio al análisis de la delincuencia. Se abarcarían más dimensiones en su conceptualización.

b) Actitud hacia la escuela:

• Motivación al éxito escolar. Interés y afecto hacia la escuela. Si le gusta ir al colegio. Número de horas que dedica al estudio. • Participación (voluntaria) en actividades escolares. • Aceptación de la autoridad escolar. Si les preocupa la opinión que de él/ella tengan sus profesores y compañeros. • Percepción de sí mismos como estudiantes: autoestima2. • Aspiraciones educativas y ocupacionales (compromiso con modelos de trabajo convencionales).

c) Para cada dimensión, buscar indicadores (o variables empíricas), que logren representar la propiedad latente que el concepto representa. Su existencia e intensidad, en condiciones de validez y de fiabilidad. Entre el concepto (latente) y los indicadores elegidos para su medición ha Comunidad de haber una plena correspondencia. Si bien se asume, como en cualquier a) Amigos: proceso analítico, unos márgenes de incertidumbre. Quiere esto decir que se trata de una relación "probable", sujeta a ser cuestionada, precisamente debido a • Número de amigos. Tipo de relación que mantienen con ellos. las características de generalidad y abstracción que definen a todo concepto. En • Si cometen o no alguna clase de conducta contranormativa. cambio, los indicadores son variables empíricas, concretas. De ellos se exige que • Grado de identificación con los amigos. sean "expresión numérica, cuantitativa de la dimensión que reflejan" (González • Tiempo que pasa con ellos. Blasco, 1989: 235). De lo que se trata es de fundamentar dicha relación, con.' cepto-dimensión-indicador, lo más posible, reduciendo al mínimo el error de meb) Vecindad: dición. • Relaciones de vec:lfinlEdlélalEldf:-.-----------------------M~.-:.---------:PPa:t"I~artt;atll-rp'lTI't'IOrl"lp~6~Slit· tfto-re~srlf't4tlt"f1ntrid~arflnfl11e"':tn'tlt71a.¡...1 t':eltle':llg"'ifF-''II-vflft'fFiifto"""s-i4iftA1clfliiff'e'l'tflflclAoi'<fefYSrpAct\ft'fFl't\l-ePlt\fl-icl4-lt\'l--rlcli-i- - • Características de la vivienda donde reside: condiciones de habitabilidad, hacimensión y no sólo uno. Esto se conoce como operacionalización múltiple. Pronamiento, tenencia en propiedad, en alquiler, período de tiempo en última resi-,;;u' puesta por D. T. Campbell y D. W. Fiske, en 1959 (en "Convergent and disdencia. criminant validation by the multitrait-multimethod matrix". Psychological • Características del barrio: densidad de la población, movilidad residencial, heterogeneidad3, ubicación en la ciudad, porcentaje de viviendas en propiedad y en a l - ' Bulletin, 56: 81-105), como una estrategia para aumentar la validez de consquiler, servicios comunitarios (escuelas, mercados, red sanitaria, equipamientos deI':e tructo. -.--"""',;-

li.."

fa~~ii~~:),Yvi~~a~~:~'e~sl~:c~~~e~~~~~~:~i~~~~~~ac~~t~~\~ndc~~n~~i~~I~r~~~~~s,

{i

c

:'"

~-----------"ReffiJ3e-€ItJe-pasa-eA-la-eafl~.;-------------------~+

Atendiendo a los objetivos del estudio, el investigador puede utilizar estas variables en la medición de la actitud diferencial ante la comisión de un acto considerado "delictivo" (de

1 De acuerdo con la Teoría de Control Social de Hirschi (1969: 90), la supervisión paterna es un factor clave de la conducta delictiva. "Es menos probable que el chico cometa actos delictivos no porque sus padres restrinjan sus actividades, sino porque comparten sus actividades con ellos. No porque sus padres sepan en realidad en dónde están, sino porque les perciben enterados de su localización. 2 Hirchi (1969: 113) destaca la importancia de la variable autoestima en el proceso causal de la delincuencia: "cuanto más competente crea el individuo que él es, menos probable será que cometa actos delictivos". 3 Estas tres características del barrio fueron destacadas por la Teoría de la Transmisión Cultural de Shaw y McKay (1969), como características de las áreas de delincuencia.

d~~U:~::i~~ef~~n:~~~~:~t:ne~~~~~~t~ac~;~r~:c~~~e~~:n~~~~~éti~;;~

su ----bY<ach-Y-R-E.-Meehl--de-L955-(".Constr-UCt-YalidiqUn psychoJogicaLtests" Psychological Bulletin, 52: 281-302). Hace referencia a la adecuación de la medición de los conceptos teóricos. Lo bien que éstos han quedado medidos por los indicadores elegidos. Para su consecución es primordial la delimitación clara y precisa de los conceptos teóricos a medir. Pero, también, proceder a una operacionalización múltiple por dos razones principales: • Una, utilizar varias medidas para un mismo concepto contribuye a abarcar las distintas dimensiones que incluye. Un cuestionario que pregunte sobre aspectos ligeramente diferentes de la misma cosa varias veces y utilice una combinación de los resultados de estas preguntas (un índice), para indicar la presencia de una actitud, probablemente está menos afectado en sus resultados por error aleatorio (Henerson y otros, 1987: 71).


202

Métodos de encuesta

• Dos, proporciona una mayor precisión y validez de la medición, cuando coinciden los resultados de mediciones diferentes. Pero esto último exige que los distintos indicadores realmente midan el mismo concepto. También es importante la fundamentación teórica del concepto. De acuerdo con Heath y Martin (1997: 81), "si un concepto no es parte de una teoría bien desarrollada, entonces las oportunidades para comprobar la validez de constructo se reducirán".

Tomar las "detenciones policiales" como único o principal indicador de delincuencia sería inexacto. Puede haberse cometido un acto delictivo y no haberse registrado ninguna detención policial o a la inversa. Una persona puede ser detenida sin que haya cometido ningún acto delictivo. El acudir exclusivamente a las "detenciones policiales" ayuda a medir la delincuencia "oficial", que no siempre coincide con la "real". Probablemente ayudará a corroborar las teorías que enfatizan la mayor implicación en la comisión de actos delictivos por los grupos más desfavorecidos o marginales de la sociedad. Por el contrario, las encuestas de autodenuncia dibujan una mayor extensión de la delincuencia en los distintos segmentos de población. Estas encuestas incluyen preguntas referidas a la comisión de conductas contranormativas. Generalmente, infracciones que pudieran considerarse no graves: conducir sin cinturón de seguridad, pasarse un semáforo en rojo, sustraer algún artículo de un centro comercial, de la empresa donde se trabaja, consumo de sustancias ilícitas y similares. Ayudan a medir la discrecionalidad de los agentes de control social (policía, instancias judiciales). La actuación diferencial depende de quién infrinja la norma legal, en consonancia con los supuestos del paradigma interaccionista. El uso combinado de ambas medidas de delincuencia lograría una mejor radiografía de la actividad delictiva en una sociedad. Más cuando se incluyen indicadores varios, tanto en los informes oficiales como en las encuestas de autodenuncia. Eso sí, procurando que midan la delincuencia en su distinto grado de severidad e intensidad.

Los indicadores elegidos han de adecuarse a los objetivos de investigación. En su elección se recomienda: • Elaborar una lista que incluya el mayor número posible de indicadores, para así abarcar la variada dimensionalidad del concepto a medir. Después, en función de la información que proporcionen, se procederá a la eliminación de aquellos indicadores que resulten no significativos en la medición del concepto.

Capítulo 4: El diseño del cuestionario

203

• Acudir a indicadores ya validados en investigaciones previas. Ello favorece la realización de estudios comparativos y ayuda en la selección de aquellos que ya han mostrado cumplir requisitos de validez y de fiabilidad (como se verá en el capítulo 6). Si bien, el investigador ha de tener presente su posible efecto diferencial, debido al contexto sociocultural y tempo~al en que se apliquen. d) La información proporcionada por los distintos indicadores de una misma dimensión puede sintetizarse en un índice. Éste ayudará a calibrar el grado al que los distintos casos observados se ajustan al concepto medido. Su cálculo precisa que los indicadores a agrupar compartan una escala de medición común para facilitar su agregación. Asimismo, los indicadores deben ponderarse de acuerdo con su importancia relativa en la medición de cada dimensión del concepto. Como ésta suele ser una actuación posterior a la recogida de información, se posterga al capítulo 6 el detalle del procedimiento a seguir en la elaboración de índices. Aquí únicamente se avanza la gran contribución de las técnicas analíticas multivariables factoriales en el cálculo de índices y, en general, en la operacionalización de conceptos teóricos.

Ya se dijo que a la conceptualización puede llegarse desde la teoría, pero también desde los datos empíricos. De las observaciones (datos de encuesta), mediante la operación metodológica de la inducción, se procede a la consecución de constructos teóde los casos particulares a los generales. En este proceder destaca la contribución de las técnicas analíticas multivariables factoriales y similares, que indagan en las interrelaciones entre una serie de variables empíricas en busca de un nexo de unión entre ellas. Después de que los datos de encuesta se han recabado, en la fase de análisis se procede a determinar qué variables, de las incluidas en el cuestionario, varían conjuntamente. Las variables correlacionadas, o que comparten variabilidad, quedan agrupadas formando una misma dimensión latente (factor o componente principal). La condición que se impone es que el número de dimensiones sea inferior al de indicadores ovariables empíricas. En caso contrario, el análisis no sería pertinente porque las variables no tienen un nexo común. Las dimensiones aparecen ordenadas conforme a su relevancia en la medición del C011Cejoto específico de que se trate. Dentro de cada dimensión se gradúa la aportación cada indicador, de manera que aquellos que presenten un coeficiente factorial elevado son los que más contribuyen a la configuración de la dimensión latente. función de qué variables lo integren, se asigna una etiqueta a cada dimensión. Éspflop4orciOllar'á un nombre común a los distintos indicadores que la componen. El concepto queda finalmente perfilado cuando se conocen los distintos valores que presenta cada una de las dimensiones latentes obtenidas. Los indicadores son los que proporcionan la información numérica. A partir de ella, se llevan a cabo una serie de operaciones aritméticas, que concluyen con la obtención de un índice, una cifra numérica de síntesis del concepto que pretendía medirse mediante el cuestionario diseñado al efecto.


204

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

205

Racismo biológico La forma clásica de racismo. La que tradicionalmente se mide en los sondeos de opinión. La más manifiesta. Se caracteriza por: Tomemos el concepto de racismo, definido por Wetherell (1996: 178) como "el proceso de marginalizar, excluir y discriminar contra aquellos definidos como diferentes sobre la base de un color de piel o pertenencia grupal étnica". En su conceptualización se han dado varias propuestas, que se ajustan a una escala acumulativa, que va de las formas menos extremas de discurso racista (racismo aversivo o prejuicio suti~ a las más manifiestas (racismo biológico) .

Racismo aversivo Término acuñado por Gaertner y Dovidio en 1986, para quienes representa la forma más actual de racismo. Se caracteriza por: • No asumir la superioridad de unas razas sobre otras. Las diferencias étnicas se consideran fruto del aprendizaje social. • Defender los valores igualitarios: la igualdad de derechos para los distintos grupos étditada a la del grupo mayoritario. • Se consideran "no racistas", "no prejuiciosos", pero valoran el contacto interétnico como un "problema social". Son favorables a políticas de ayuda a países en desarrollo para evitar que su población emigre. Un racista aversivo puede defender la igualdad de las razas y, al mismo tiempo, propugnar un cierto control de las fronteras ante la llegada masiva de inmigrantes africanos, o una mayor presencia policial en barrios ocupados por inmigrantes (Rodríguez y Rodríguez, 1999: 42).

Racismo simbólico y moderno (McConahay y Hough, 1976; McConahay, 1983) Asume la superioridad cultural del propio grupo étnico, considerando a los "otros" una amenaza a la distintividad cultural del grupo. Los inmigrantes están destruyendo nuestra cultura, nuestra lengua y nuestras tradiciones [..j. Los demás grupos étnicos tienen derecho a ser tratados igual que los miembros de nuestro grupo, pero no pueden esperar más derechos de los que se merecen (por ejemplo, que no esperen el derecho al voto) (Echevarría y Villareal, 1995: 220).

Sentimiento de que los otros grupos étnicos están violando valores preciados y haciendo demandas ilegítimas para cambiar el status quo racial (McConahay, 1986).

• La creencia en la superioridad genética del grupo propio frente al exogrupo. • No admiten de~echos para los grupos étnicos considerados inferiores ni la igualdad de oportunidades. • Los matrimonios interétnicos, u otro tipo de contacto personal, se perciben como una amenaza de degeneración cultural y biológica de la propia raza. Coincide con lo que Pettigrew y Meertens (1995) llaman prejuicio explícito: el rechazo manifiesto o "explícito" hacia los integrantes de otros grupos, hacia quienes se evita el contacto íntimo. La medición del racismo (manifiesto y latente) no siempre incluye indicadores de sus distintas modalidades. Lo habitual es que comprenda tres aspectos fundamentales (Morales, 1996): a) Distancia social (Oskamp, 1991): grado de separación considerada aceptable en las relaciones entre personas de países o de etnias distintas. Se distingue un grado de intimidad máximo (matrimonio, noviazgo, relaciones de amistad), intermedio (vivir en el mismo vecindario, compartir los mismos clubs sociales, recreativos) y mínimo (compartir el mismo autobús, acudir a los mismos establecimientos públicos, como bares b) Igualdad de tratamiento: grado de aceptación de principios generales de discriminación en distintos ámbitos de la vida social (trabajo, transporte público, posibilidad de asistir a los mismos centros escolares, libertad de elección de la pareja sin tener en cuenta su raza o país de origen). No obstante, se advierte que las preguntas de los cuestionarios apuntan a principios generales, no a prácticas concretas. c) Implementación de los principios de igualdad: grado de aceptación de políticas concretas emprendidas por el gobierno con vistas a conseguir la igualdad racial. . LoScPril'lcipio5-de igllaldad..cie_dereJlhos están presentes en.Ias versiones más actuales del discurso racista. Lo habitual, en dichas encuestas, es que se deduzca una actitud más negativa, hacia personas de otra etnia o país diferente, cuando se evalúan políticas gubernamentales concretas y se responde a cuestiones referidas al polo de distancia social que implica una mayor intimidad. Por el contrario, la actitud menos negativa se obtiene en preguntas sobre principios generales de discriminación y las relativas al polo de distancia social que implica una intimidad escasa (Morales, 1996). Asimismo, en la medición de racismo se precisa la consideración de los tres componentes "esenciales" en cualquier medición de actitudes (Lamberth, 1980). a) Afectivo. Controla el nivel de agrado o desagrado de la persona con respecto al objeto de actitud. b) Cognitivo o de creencias con respecto a un objeto, que sugiere, a su vez, dos dimensiones adicionales. Una, la especificidad o generabilidad de la actitud. Dos, el grado de diferenciación de las creencias.


206

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

e) Comportamentalo conductual. Verifica cómo se comporta la persona relacionándo-

lo con los otros dos componentes de la actitud. Atendiendo a estas consideraciones, Cea D'Ancona (2002b) evalúa los indicadores tradicionales de "racismo", presentes en la última encuesta ex profeso de actitudes ante la inmigración, hasta la fecha, realizada por el Centro de Investigaciones Sociológicas. Con los indicadores incluidos en la encuesta, un total de 41, se realiza un análisis factorial de componentes principales. El objetivo es descubrir si éstos comparten alguna estructura latente. Esta serie menor de variables latentes ha de caracterizarse por aglutinar variables bastante correlacionadas entre sí y escasamente correlacionadas con aquellas que forman otra estructura latente o dimensión del concepto que se analiza: racismo. En el cuadro 4.A figuran las diez dimensiones latentes obtenidas tras la rotación varimax. Ésta permite maximizar la varianza de los coeficientes factoriales cuadrados en cada componente principal, obteniendo dimensiones relevantes no correlacionadas entre sí. Los componentes figuran en su orden de aparición, acompañados de la etiqueta asignada por la autora para su denominación. Se ha intentado que el nombre dado a la dimensión latente refleje el significado de las variables que en él ponderen más y que sinteticen su contenido "común". Las variables aparecen acompañadas de sus coeficientes factoriales, cuya magnitud señala lo que caracteriza a cada componente. Su valor expresa la correlación de cada indicador(o variable observada) con cada componente. Su signo, la dirección de dicha relación: positiva o negativa.

CUADRO 4.A. Composición de los componentes principales tras la rotación varimax 1 Derechos sociales

2 Derechos de ciudadanía

Educación pública Vivienda digna Asistencia sanitaria Practicar su religión Trabajo en igualdad Constituir asociaciones Traer a su familia Cobrar el paro Mantener sus costumbres

0,824 0,770 0,747 0,702 0,672 0,669 0,666 0,463 0,286

3 Sociabilidad con marroquíes

Vecino marroquí Compañero de trabajo marroquí Casar con marroquí Colegio con inmigrantes Simpatía hacia marroquíes

0,822 0,788 0,708 0,595 -0,492

Votar municipales Votar elecciones generales Afiliarse a partidos políticos Obtener la nacionalidad

0,879 0,877 0,780 0,491

4 Política inmigratoria

Valoración inmigración Supresión fronteras UE Refugiado político Control inmigración Regularizar inmigrantes Leyes inmigración Facilitar entrada a inmigrantes Número de inmigrantes

0,614 0,606 0,519 0,509 0,455 0,452 0,429 -0,368

5 Imagen tópica negativa del inmigrante

Bajan salarios Quitan trabajo Aumentan delincuencia

0,751 0,750 0,586

.

7 Partido racista

Aceptación partido racista Partido racista

6 Discriminación étnica o de la alteridad

Condiciones de vida del inmigrante Dificultades de los inmigrantes Trabajos no cualificados Ampliación derechos

-0,699 0,582 0,536 0,456

8 Aceptación del inmigrante

0,766 0,446

9 Violencia contra inmigrantes

Problema agresiones inmigrantes

207

Amistad con inmigrantes Aumentará número de inmigrantes Cupo inmigrantes

0,668 -0,583 -0,274

10 Temor al asentamiento de inmigrantes

0,817

Intención quedarse Trato con desconfianza

0,652 -0,593

Después, la efectividad de las diez dimensiones obtenidas se comprueba mediante un análisis discriminante. Ello exige el resumen de la aportación de los distintos indicadores que forman una misma dimensión o componente principal en un índice. Para ello se calculan las puntuaciones factoriales, con el propósito de que en la representación de cada dimensión latente intervengan todas las variables empíricas con coeficientes factoriales significativos. Se aplica el método de Anderson-Rubin porque propicia la obtención de puntuaciones factoriales

no correlacionadas. El análisis discriminante se realiza tomando como variable dependiente los tres grupos obtenidos del análisis de conglomerados K-medias, en consonancia con la actitud declarada ante la inmigración; y como independientes las diez puntuaciones factoriales. De él se obtiene que, en consonancia con las nuevas propuestl!s de racismo, las preguntas relativas a derechos sociales y de ciudadanía son las de mayor utilidad en la medición de racismo. Le siguen los ítem relativos a política inmigratoriaque son, a su vez, los que mayor variabilidad obtienen en las respuestas de los encuestados. En cambio, los relativos a distancia social, presentes en la generalidad de las encuestas de actitudes y prejuicios étnicos raciales, se sitúan en el cuarto lugar en efectividad. De las diez dimensiones latentes sólo las seis primeras mostraron relevancia estadísticamente significativa en la medición de racismo. El orden el siguiente, de acuerdo con el índice de potencialidad compuesto calculado: derechos sociales (0,464), derechos de ciudadanía (0,044), política inmigratoria (0,038), sociabilidad con marroquíes (0,017), discriminación étnica y de la alteridad (0,013) e imagen tópica negativa (0,012). Para mayor información véase el susodicho artículo. En una investigación posterior (Cea D'Ancona, 2004b) se profundiza en la medición de racismo. Se analiza su evolución en los últimos años, comprobándose su relevancia en encuestas realizadas por el CIS en fechas más próximas. Además, se muestran los indicadores utilizados en otros sondeos de opinión y estudios sobre inmigración y racismo. A destacar los llevados a cabo por CIRES/ASEP y los eurobarómetros. En especial, el Eurobarómetro 53, de 2000, cuyos indicadores de racismo (un total de 31) también se agruparon en siete di-


208

Métodos de encuesta

mensiones latentes (culpar a las minorías, apoyo a políticas de mejora de la coexistencia social, aceptación restrictiva de inmigrantes, molestia, optimismo multicultural, condiciones de repatriación y asimilación cultural) mediante la realización de un análisis factorial. Sus valores se sintetizaron en índices, que igualmente sirvieron para realizar una tipología de actitudes ante la inmigración.

En suma, de los datos empíricos se infieren constructos teóricos que, con posterioridad, pueden ser alterados, a la luz de nuevos datos empíricos. Ésta es una aproximación inductiva a la conceptualización. La más aplicada en la metodología cuantitativa, cuando la medición se hace mediante encuesta. Pero ésta no es la única aproximación empírica a la conceptualización o formación de conceptos. También está la representada por la Teoría Fundamentada (The Grounded Theory) de Glasser y Strauss (1967), congruente con el paradigma interaccionista. El interaccionismo simbólico indaga en la comprensión de cómo se aprenden los significados y símbolos del lenguaje en interacción unos con otros. La teoría fundamentada busca la generación de conceptos teóricos a partir de datos empíricos, por medio del análisis comparativo. No es meramente un método específico o técnica. Es un estilo de realizar análisis cualitativo que incluye una serie de rasgos distintivos, tales como muestreo teórico y ciertas guías metodológicas, como realizar comparaciones constantes y el uso de la codificación para asegurar el desarrollo conceptual y la densidad (Strauss, 1987: 5).

El investigador analiza los datos sistemática e intensivamente (frase por frase de las notas de campo, texto de entrevista, protocolo de observación u otro documento), en busca de indicadores empíricos. Clasifica en categorías los incidentes que encuentre en los datos. Mediante la comparación constante de su contenido, va redefiniendo las categorías hasta que éstas adopten una forma abstracta. El análisis conceptos clave. se integran en una teoría global que establezca las relaciones entre ellos. Para más información de esta aproximación analítica y otras cualitativas véase Valles (1997).

4.2. La formulación de las preguntas: sus efectos en el error de medición

Una vez concretados los indicadores a incluir en la medición de los conceptos cent!ales de la investigación, se procede a la formulación de las preguntas del cuestionario. Esta constituye una fase esencial en el desarrollo de una encuesta. Los resultados que de ella se obtengan dependen de qué se ha preguntado, cómo se ha formulado la pregunta, las opciones de respuesta que se han considerado, el contexto de la pregunta y demás aspectos relacionados con la redacción del cuestionario y su administración.

Capítulo 4: El diseño del cuestionario

209

El interés por los efectos de la formulación de las preguntas en los resultados de la encuesta llevó, en los años cuarenta y posteriores del siglo xx, a una serie de investigadores, pertenecientes tanto al ámbito académico como comercial, a la realización de experimentos. Querían comprobar si distintas redacciones de preguntas suscitan respuestas diferentes. Algunos de estos experimentos se publican en la compilación realizada por H. Cantril en 1944 (Gauging public opinion. Princeton University Press). A ellos también hace referencia S. L. Payne en 1951 (The art of asking question. Princeton University Press). En 1981 H. Schuman y S. Presser publican una monografía que reúne los diversos experimentos llevados a efecto por ellos mismos y otros investigadores, referidos a la forma de la pregunta, su redacción y contexto (Questions and answers in attitude surveys: experiments in question form, wording and contexto Academic Press. Nueva York). Un total de 130 experimentos en 34 encuestas nacionales y regionales, entre 1971 y 1980. Nuevamente se constata que pequeños cambios en la formulación de las preguntas pueden provocar grandes diferencias en las respuestas. Observan la existencia de efectos debidos a la redacción de la pregunta, su orden y disposición conjunta en el cuestionario. Así como los relativos a las opciones de respuesta (en preguntas cerradas): sesgos de aquiescencia, primacía y recencia, junto con los debidos a la inclusión de alternativas de respuesta intermedias y de "no opinión" (no sabe/no contesta). Con anterioridad, Sudman y Bradburn (1974) habían demostrado que los efectos de la formulación de la pregunta afectan tanto a las preguntas de opinión como a las de hechos. A esta conclusión llegaron tras haber realizado un meta-análisis (es decir, un análisis conjunto de los resultados cuantitativos de una serie de estudios individuales sobre una cuestión concreta) de 900 experimentos "split-ballot". Éste es el procedimiento experimental más aplicado en" la comprobación de diferencias en las respuestas ante dos alternativas de una misma pregunta. Para ello' se divide la muestra al azar en dos mitades, o más, dependiendo del número de formulaciones alternativas que se hagan de la misma pregunta. Garantizada la homogeneidad de los grupos, por haberse procedido a la distribución aleatoria de sus integrantes, las diferencias su realización, los autores concluyen que la mayoría de los errores de medición se deben al diseño del cuestionario. En concreto, a la extensión del cuestionario, el orden de las preguntas, a su formato abierto o cerrado, al empleo de palabras ambiguas, de difícil comprensión, a la saliencia de la pregunta para el encuestado y al empleo de ayudas al recuerdo. En general, los errores principales debidos a la formulación de la pregunta cabe resumirlos en los seis que figuran en el cuadro 4.1. Errores de especificación

La pregunta no se adecua a los objetivos de la investigación. No logra su traducción en un indicador válido en la medición de los conceptos esenciales del estudio.


210

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

CUADRO 4.1. Errores debidos a la formulación de la pregunta

No correspondencia de la pregunta con los objetivos de la encuesta Desigual interpretación de términos de la pregunta La redacción de la pregunta, su introducción y formulación concreta

De medición

• ¿Piensa usted que Estados Unidos debería permitir discursos públicos contra la democracia? El 75% dijo "sí".

MOTIVO

ERRORES De especificación

211

Las opciones de respuesta

Qué alternativas se ofrezcan: efectos de las opciones intermedias, de no opinión, equilibradas

Este ejemplo ilustra cómo un cambio, aparentemente pequeño, en la redacción de la pregunta produce grandes diferencias en la información captada en la encuesta. En consecuencia, conviene evitar que, tanto en la pregunta como en las opciones de respuesta (en pregunfas cerradas), se incluyan palabras ambiguas o que puedan tener una connotación dispar. Errores de medición debidos a la redacción de la pregunta Los errores de medición invisibles al analista de datos surgen debidos a la formulación de la pregunta (Groves, 1989: 497).

En qué orden: efectos de primacía, recencia, aquiescencia Orden y contexto de la pregunta en el cuestionario

Lohr (2000: 10) ilustra el efecto en la respuesta suscitado por cómo se enuncia y formula en conjunto la pregunta con el siguiente ejemplo. A finales de 1993 y a principios de 1994 se hicieron dos encuestas sobre Elvis Presley.

Sesgo de deseabilidad social Tema de la pregunta

Errores deliberados (o motivados) de memoria, de comunicación

Errores de medición debidos a la interpretación de términos de la pregunta

En la investigación mediante encuesta la medición se hace no por observación directa de los fenómenos, sino a través de la información transmitida mediante "palabras" y "frases". La introducción de determinadas palabras o términos puede llegar a sesgar los resultados del estudio. Palabras ambiguas o que tengan distintas connotaciones pueden suscitar respuestas dispares. Aunque el lenguaje en las preguntas de encuesta puede estar estandarizado, no existen garantías de que el significado asignado a las preguntas sea constante por encima de los encuestados (Groves, 1989: 450).

Un ejemplo famoso, frecuentemente citado, sobre el efecto de la redacción de la pregunta en la respuesta es el ilustrado por D. Rugg en 1941 ("Experiments in wording question II". Public Opinion Quarterly, 5: 91-92). Muestra que un simple cambio de palabra, "prohibir" por "permitir" modifica la respuesta. Las preguntas y sus porcentajes de respuestas fueron los siguientes: • ¿Piensa usted que Estados Unidos debería prohibir discursos políticos contra la democracia? El 54% de los encuestados dijo "sr'.

• En una se preguntaba, En los últimos años ha habido muchos rumores e historias acerca de si Elvis Presley realmente murió. ¿Qué le parece esto? ¿Piensa que existe alguna posibilidad de que estos rumores sean ciertos y que Elvis siga vivo o no? El 8% de los sondeados respondió que es posible que Elvis esté aún con vida. • En la segunda encuesta, la pregunta varió: Un programa de televisión recientemente examinó varias teorías sobre la muerte de Elvis Presley. ¿Cree usted que Elvis Presley está vivo o no? El 16% respondió que es posible que Elvis siga vivo. Este ejemplo indirectamente también puede ilustrar los peligros de asociar una conducta o actitud a personas o instituciones de prestigio, a los que se atribuya una cierta autoridad. Errores de medición debidos a las opciones de respuesta

Afecta no sólo qué alternativas de respuesta se ofrezcan, en las preguntas cerradas, si se presentan de una forma equilibrada, que no induzca a una respuesta concreta. También, el orden en que éstas se presenten. En las preguntas cerradas, en las cuales hay que elegir una (o varias) de las respuestas ofrecidas en la pregunta, pueden darse errores de medición debidos al orden de la respuesta. En especial, en las encuestas telefónicas y cara a cara, cuando son varias las alternativas de respuesta entre las que elegir y éstas no pueden ser visualizadas, por parte del entrevistado, en hojas de respuesta o tarjetas. Consiste en la elección preferente de la primera alternativa de respuesta que se mencione (efecto de primacía) o


212

Métodos de encuesta

la última (efecto de recencia), con independencia del contenido de la respuesta. Ambos efectos se dan más en personas con un bajo nivel de estudios (Schuman y Presser, 1981/1996; Krosnick y Alwin, 1987). Principalmente en aquellas preguntas con más de tres opciones de respuesta. Los efectos de primacía y de recencia pueden deberse a problemas de retenci6n, de memoria, de recordar las distintas alternativas de respuesta entre las que elegir. Pero, también, influye la saliencia o relevancia del tema, del que trata la pregunta y la encuesta en general, para el encuestado. Cuando no sea de su interés, estará más predispuesto a querer concluir cuanto antes la entrevista; no dedicará mucho tiempo a meditar la respuesta, contestando lo primero que le venga a la mente, o se le sugiera, se ajuste o no a su sentir real. De acuerdo con Krosnick y Alwin (1987), los efectos de orden de la respuesta ocurren porque algunos encuestados no conceden a todas las alternativas de respuesta igual consideración. En su incidencia afecta el orden en que se presente la alternativa de respuesta y cómo se rellene el cuestionario. • En encuestas autoadministradas, o cuando pueden visualizarse las alternativas de respuesta en una tarjeta u hoja de respuestas, en el transcurso de una entrevista cara a cara, se da más el efecto de primacía. Las respuestas que figuran al principio del listado son las que reciben un procesamiento cognitivo más profundo (Schuman y Presser, 1981/1996; Bishop y otros, 1988; Krosnick y Alwin, 1987). • Cuando es el entrevistador quien lee las alternativas de respuesta al encuestado (en persona o por teléfono), es más probable que se produzca el efecto de recencia. Las últimas respuestas obtendrán un procesamiento cognitivo mayor que aquellas que las antecedan. Este efecto ya fue constatado por Cantril y colaboradores en 1944. Posteriormente, Payne (1951) defiende que la dificultad de la pregunta y su longitud (el número de sílabas por palabras) es lo que provoca el efecto de recencia en encuestas mediante entrevista. Krosnick y Alwin (1987) advierten que los efectos de memoria pueden también jugar un papel importante en las presentaciones orales de las preguntas. Es más probable que se recuerde la primera y la última de las alternativas de respuesta del listado siendo, en consecuencia, las más probables a ser elegidas. Schuman y Presser (1981/1996) descartan, por el contrario, la memoria como un factor clave en los efectos de recencia. Constatan la existencia de dichos efectos (de recencia) incluso en preguntas breves de respuesta tricotómica (de tres opciones de respuesta). Esto último es después corroborado por Dillon (1990). Este investigador constata que la última alternativa de respuesta mencionada atrae, en promedio, un 10% más de las respuestas adicionales que cuando se menciona en primer o en segundo lugar, con independencia de su contenido. Para demostrarlo, considera una pregunta acerca del divorcio, cuyo efecto había sido ya comprobado por Schuman y Presser (1981). La pregunta se formula en los términos siguientes:

Capítulo 4: El diseño del cuestionario

213

El divorcio debería ser más fácil o más difícil de obtener de lo que es ahora.

El porcentaje de respuesta variaba dependiendo de si se ofrecía una opción de respuesta intermedia y de la ubicación de la respuesta: '.'

Orden de las alternativas de respuesta

Porcentaje de respuesta

El divorcio debería ser: • Más fácil de conseguir • Más difícil

40 50

El divorcio debería ser: • Más fácil • Más difícil • Permanecer como está

21 34 45

El divorcio debería ser: • Más fácil • Permanecer como está • Más difícil

23 35 41

Para McClendon (1991/2002) el conocimiento del tema, junto con el interés que éste suscite, puede afectar tanto a los efectos de recencia como a los de aquiescencia. Por aquiescencia se entiende la tendencia al acuerdo indistintamente del significado de la pregunta. Schuman y Presser (1981/1996) muestran que la aquiescencia no se da exclusivamente en preguntas de acuerdo/desacuerdo. También pueden ocurrir en las dicotómicas eqllilibraldas, con a o pregurltas Sea el caso de la siguiente pregunta de elección forzada, en la que hay que elegir entre dos alternativas de respuesta: ¿Cuál es, en su opinión, el principal responsable del aumento de la delincuencia en nuestro país, las actuales peores condiciones socioeconómicas o la mayor presencia de inmigrantes?

Con esta formulación de pregunta se lograría reducir el efecto de aquiescencia, respecto a su redacción en el formato de acuerdo/desacuerdo. Las peores condiciones socioeconómicas son más probables que la mayor presencia de inmigrantes en el aumento de la delincuencia en nuestro país. De acuerdolEn desacuerdo.


214

Métodos de encuesta

Aunque suscitará otro tipo de errores, como se verá cuando se analicen los efectos de distintos formatos de preguntas. . El se~go de aquiescencia es más habitual que se dé en personas de estatus social baJ? y en llliembros de minorías étnicas (Ross y Mirowsky, 1998). En el meta-análisis reahzad~ por N.arayan y Krosnick (1996), de encuestas nacionales y regionales norteamerIcanas, Igualmente se constata que el menor nivel educativo de los encuestados afect~, directament~, a los siete efect~s de respuesta: de orden de la respuesta, de aquiescenCIa, de alternatIva de respuesta Intermedia, de inclusión de respuesta de "no opin!ón",. de prohibir/permitir, de equilibrio y de orden de la pregunta basado en la reCIprocIdad. La aquiescencia también se da, cuando el encuestado elige la respuesta que él cree que.se espera que dé. Es decir, cuando se quiere ajustar a las expectativas o demandas del ~~vestigador (definido por Orne, 1969). Una redacción de la pregunta "neutral" eqUIlIbrada en afirmaciones positivas y negativas, puede ser una forma de evitar lo~ errores de medición debidos al efecto de aquiescencia. Asimismo, han de considerarse !os efect~s e~ la respuesta que puede ocasionar el ofrecer alternativas de respuesta IntermedIa (tIpo "ni de acuerdo ni en desacuerdo", "ni satisfecho ni insatisfecho" o "indeciso") o de "no opinión" (no sabe/no contesta). Éstos se tratan con posterioridad ' cuando se aborda el formato de la pregunta cerrada. Errores de medición debidos al orden de la pregunta

Suelen atribuirse a la transferencia de significados de una pregunta a otra. Ya en 1939 J. Sayre comprobó (en "A comparison of three indexis of attitudes towards radio advertisi.ng". !ournal ofApplied Psychology, 23: 23-33) que las preguntas precedentes pu~den InflUIr en las respuestas a preguntas posteriores. Varios de sus hallazgos rel~tIVOS a los efectos de orden de la pregunta fueron posteriormente confirmados por varIOS autores. En 1944, H. Cantril obtiene un menor respaldo de la opinión pública norteamericana a la particip~ción conjunta de.su ejército con el francés o el británico, cuando la pregunta era precedIda por una relatIva a servir en el ejército alemán. Por su parte, Schuma? y Presser (1981/1996) constatan la existencia del efecto de orden de la pregunta en varIas de las preguntas que analizan. En una relativa a la felicidad conyugal, por ejemplo, captan un mayor porcentaje de encuestados que declaran sentirse felices (700/0), cuando esta pregunta es posterior a una genérica sobre la felicidad, que cuando la anteced~ (63%). En cambio, la pregunta genérica sobre la felicidad obtiene un mayor porcentaJe ?~ respuestas f~v~rables cuando es preguntada primero (52%) que después de la espeCIfIca sobre la feliCIdad conyugal (38%). Igualmente, la opinión favorable al abort~ ~n general es mayor, cuando se formula después de una relativa a hijos con defectos fISICOS o mentales, que cuando aparecen en primer término.

Más recientemente, Singleton y Straits (2002) observan que, cuando una pregunta general sobre un determinado tema (por ejemplo, la satisfacción en la vida en ge-

Capítulo 4: El diseño del cuestionario

215

neral) sigue a una pregunta específica relacionada (la satisfacción matrimonial), las personas pro~uran reiterar la información dada con anterioridad en su respuesta a la pregunta específica. Quiere esto decir que interpretan la segunda pregunta corno pidiendo nueva información sobre la satisfacción en la vida en general, aparte de la marital. A veces la forma en que una persona responde a una pregunta influye en su respuesta a preguntas posteriores, con el propósito de no parecer "incongruentes". Si bien, Schuman y Presser (1981/1996) advierten que el efecto de orden no se crea por poner dos preguntas de contenido similar próximas unas a otras; sino cuando el encuestado tiene necesidad de que su respuesta a la segunda pregunta sea consistente con la dada en la primera pregunta. Este efecto es más habitual en personas de nivel educativo bajo, como igualmente demuestra Sigelman (1981). Las preguntas generales, más que las especificas, están más expuestas al efecto de orden. Los efectos de contexto también pueden acontecer cuando la interpretación de una pregunta está influida por la información que la anteceda. Bien en las preguntas inmediatamente anteriores, bien en la introducción de la pregunta, o en las instrucciones que se den para responderlas. Obviamente, la pregunta ¿ Está usted satisfecho o insatisfecho con la actuación del Gobierno? captará un menor porcentaje de satisfacción si va precedida de la pregunta más específica ¿Cómo valora usted la actuación del Gobierno en la Guerra de ¡rak?, que cuando no es precedida por esta pregunta.

De acuerdo con Wanke y Schwarz (1997), asignar una pregunta específica y una general al mismo contexto conversacional induce a los sujetos a interpretar esta última como perteneciente a aspectos no cubiertos por la pregunta especifica, evitando de esta forma la redundancia. Formular varias preguntas especificas previo a una general cambia, sin embargo, el significado pragmático de la pregunta general: de una petición para información adicional a una información para un juicio de resumen integrativo. Esta última explicación sólo es factible, no obstante, cuando las preguntas especificas se hallan relacionadas unas con otras y pueden integrarse en un juicio común. Para Kalton, Collins y Brook (1978), las diferencias en el orden de las preguntas se advierten mejor cuando las preguntas específicas anteceden a la general. Errores de medición debidos al tema de la pregunta

En especial, cuando éste pueda inhibir al encuestado de dar una respuesta veraz. Llámense preguntas "embarazosas" (Goode y Hatt, 1952), "amenazantes" (Sudman y Bradbum, 1974), "sensitivas" (Lin, 1976) o aquellas potencialmente "ofensivas" (Berdie y Anderson, 1974). Lo cierto es que incomodan al encuestado y, si no se aborda el tema con la debida cautela, la captación de respuestas "válidas" se limita. Tradicionalmente en este grupo de preguntas potencialmente "amenazantes" se han incluido las relativas a renta, conducta sexual, ideología política, religiosa, salud mental y física, o conductas desviadas, como consumo de drogas (De Lamater y McKinney,


216

Métodos de encuesta

1982). Si bien, cabría extenderlo a toda cuestión que aborde condu~tas, opiniones o actitudes que quieran mantenerse ocultas, por temor a la censura SOCial. Lo que lleva a la mayor captación de respuestas "políticamente correctas" o socialmente deseables, ante la necesidad que todos tenemos de "aprobación social", a menos que las preguntas se formulen de forma que quede oculta su intencionalidad o se diluya la gravedad de la respuesta. A veces las personas no dicen la verdad. La obtención de respuestas veraces es un reto importante en las encuestas que implican temas delicados, como las encuestas sobre consumo de drogas (Lohr, 2000: 8).

A diferencia de otros sesgos, como el de aquiescencia, el llamado de deseabilidad social se da más en personas de mayor nivel educativo. En un estudio de actitudes racistas, Krysan (1998) detecta, en sus tres situaciones experimentales (encuesta cara a cara estándar, encuesta cara a cara con hojas de respuesta y encuesta por correo), que las personas de mayor nivel educativo tienen mayor interés en no aparecer como "racistas". Perciben más la intencionalidad de la pregunta que aquellos con un menor nivel educativo, y emiten las respuestas que saben que son "políticamente correctas". Por el contrario, los niños y los jóvenes son menos susceptibles que los adultos a sesgos de deseabilidad social (Scott, 1997). . . . .. . Johnson y otros (1997) comprueban que las defmIcIones de deseab~lzdadsoc~~l están culturalmente mediadas varían de unas sociedades a otras. La socIedad mejICana está más predispuesta a dar r~spuestas "socialmente deseables" 9-ue ~a angl?sajona, porque está más influida por "el qué dirán". El mundo de las apanencIas esta, en general, más presente en las culturas hispanas. ., En el capítulo 2 ya se indicó cómo el método de encuesta afecta a la conseCUCIon de respuestas menos afectadas por el sesgo de deseabilidad social. En el subapartado 4.2.1 y siguientes se dan algunas recomendaciones relativas a la formulación de las preguntas y su ubicación en el cuestionario, que ayudan a diluir este tipo de sesgo. Tampor ser más vulnerables a la captación de respuestas no "veraces", aunque no sea liberadamente. Bradburn (1983) distingue tres tipos de errores de respuesta: a) Errores deliberados o motivados. El encuestado añade u ~mite información. ~~­ ra causar una buena impresión al entrevistador; o para eVItar que éste avengue algo. . . b) Errores de memoria sobre la ocurrencia de determinados acontecImIentos y cuándo sucedieron. e) Errores de comunicación. Causados bien porque el entrevistador no ha expresado con claridad lo que está preguntando, bien porque el entrevistado falla en aclarar su respuesta al entrevistador. Es decir, no expone su respuesta adecuadamente, repercutiendo en el registro de una respuesta errónea.

Capítulo 4: El diseño del cuestionario

217

Además de los posibles efectos de la mediación del entrevistador en las respuestas (tratado en el capítulo 5), el investigador ha de considerar el posible efecto en la variabilidad de la respuesta debido al encuestado. Existen diferencias de personalidad que pueden afectar sistemáticamente a su voluntad de dar respuestas "veraces". Sobre todo, en preguntas que podrían afectar a su autoestima o imagen pública. Pero, también, puede incidir: a) La presencia de otras personas durante la entrevista. b) Acontecimientos que le ocurrieron antes de que la entrevista comenzase. c) Presiones sociales para no cooperar con extraños.

Como ilustración de los distintos errores de respuesta posibles, Bradbum (1983) toma, precisamente, la pregunta referida a la renta familiar durante el año pasado. Ante ella pueden darse las siguientes circunstancias que pueden inducir la sospecha de que no se está consiguiendo una medición adecuada de la renta familiar: • Los encuestados pueden omitir deliberadamente algunos tipos de renta, que no quieren que se conozcan (por su procedencia ilegal o porque no han sido declaradas a Hacienda). • Pueden olvidar alguna clase de renta (dividendos o intereses en sus cuentas de ahorro) o informar estimaciones falsas de renta no debidamente contabilizadas. • Una mala comprensión de la pregunta o no definir el concepto de renta de igual forma que lo hace el investigador. Por ejemplo, obsequios, herencias, pagos de seguros, de acciones, dividendos, ¿se informan como renta? La pregunta puede no aclarar lo que el investigador tiene en mente cuando pregunta sobre renta. • Los encuestados pueden incluir renta desde un período de tiempo equivocado. Este error de memoria se conoce como "telescoping". De acuerdo con Sudman y Bradburn (1974), este error de respuesta se produce cuando se recuerda un cc-=---lloonteeimiente-oome-habienae-ec--llHide-€B.-llua-feGha-máS-l'eciente-de-la-que-eOL---_ realidad aconteció. • Los encuestados pueden deliberadamente inflar la información sobre su renta para impresionar al entrevistador o parecer de una posición social superior a la que tienen en realidad. En el capítulo 2 se dijo que la encuesta cara a cara, preferiblemente la realizada en el domicilio de los encuestados, es la menos expuesta a la captación de un nivel económico y educativo, por parte de los encuestados, superior al real. La más favorable es la encuesta telefónica, donde ambas variables suelen estar sobredimensionadas. Los distintos errores de medición debidos a la respuesta de los encuestados pueden tradulcin;e en errores sistemáticos y en errores variables o aleatorios. Depende de su inddlencia en el conjunto de la encuesta.


218

Métodos de encuesta

• Los errores sistemáticos son aquellos que "no suman cero cuando las observaciones de la muestra son promediadas" (Biemer y Lyberg, 2003: 47). Es decir, cuando los errores positivos o los negativos prevalecen en el conjunto de los casos analizados resultando en una sobreestimación o subestimación de los valores "reales" en la'población. En general, se deben a una "falsificación" deliberada de la información. El sesgo de aquiescencia, por ejemplo, puede resultar en un error sistemático en encuestas que incluyen escalas sociológicas estándar. Lo mismo puede acontecer en cuestiones que suscitan el sesgo de deseabilidad social. Co~o sucede c~ando se capta una ~~­ jor valoración de la inmigración que la realmente eXIstente, debI?o a que la poblac~on sondeada ha descubierto la intencionalidad de la pregunta y, delIberadamente, decIde ocultar su valoración "real" para no parecer "racista".

• Los errores variables o aleatorios no producen, en cambio, una sobreestimación o subestimación de los valores promedio. Ante una misma cuestión, por ejemplo declarar el nivel de renta, unas personas pueden estar predispuestas a informar un nivel de renta superior al real para "i~presi?nar", mientras que otras prefieren decir menos de 10 per~ibido, por te~or a actuacIones fisc~les futuras o, simplemente, para no impresionar. Lo lD1S~O es extensIbl~ a preguntas refendas al pasado. Especialmente, si son de escasa relevancIa como, por ejemplo, los programas de televisión vistos la semana pasada o los alimentos comprados. A menos que se haga uso de alguna "táctica de ayuda al recuerdo", como se verá en el subapartado 4.2.1.

El error será variable cuando, en el análisis conjunto de la muestra, no ha habido una mayor desviación ni de exceso ni de defecto, a~ulá~~ose los. v~ores. positivos y negativos. En caso contrario, se estaría ante un error slStematlco. La ffiC1dencIa, en los resultados de la encuesta, de los primeros (los errores variables) pueden reducirse incremen~ando el tamaño de la muestra. No así los errores sistemáticos, que precisan de un mayor CUIdado cuando se diseña la encuesta. Principalmente, cuando ésta aborda cuestiones delicadas que puedan despertar suspicacias por parte del encuesta~o y pro~~car, ~ue ':~enta" de manera deliberada, resultando en datos de encuesta erroneos o InvalIdos . La distorsión sistemática del estatus verdadero del respondiente pone en peligro la validez de las mediciones de encuesta. A diferencia del error aleatorio, los sesgos de respuesta no se anulan con mediciones repetidas. Más, al contrario, la distorsión entre las puntuaciones observadas y las verdaderas de un respondiente persisten (Fox y Tracy, 1986: 9).

4.2.1. Recomendaciones para la redacción de las preguntas

Varios de los· errores de medición pueden corregirse con una redacción adecuada de la pregunta. En el capítulo 1 ya se hizo referencia a la conveniencia de realizar in-

Capítulo 4: El diseño del cuestionario

219

dagación exploratoria cualitativa previa (observación, grupos de discusión, entrevistas en pr<?fundidad) para ayudar a descubrir la variedad de discursos y aspectos que incluye el problema de investigación. Esta información complementará a la que se extraiga de la exigida revisión bibliográfica, de estudios teóricos y empíricos referidos al problema de investigación. Especial relevancia adquiere, para el diseño del cuestionario, acceder a cuestionarios ya "validados'''' en estudios anteriores. Aunque sea difícil encontrar un cuestionario que cubra todos los objetivos que persigue la encuesta, el ver qué preguntas se hicieron, qué se trataba de medir con ellas, qué resultados se obtuvieron, puede ayudar a la redacción de nuevas preguntas. Con ello se evita caer en errores cometidos con ante~ioridad. Además, el investigador puede optar por tomar algunas preguntas, medIante las que se alcanzó una buena medición de los conceptos de interés, e incluirlas en su cuestionario. De esta forma pueden realizarse análisis comparativos. Esta práctica permite, en concreto: a) Replicar hallazgos de estudios anteriores en otras poblaciones o en fechas posteriores, comparándose sus resultados. b) Analizar su evolución o tendencia, en distintos períodos de tiempo. e) Comprobar su fiabilidad, en estudios realizados en poblaciones y contextos similares, donde no existan razones para esperar cambios.

La realización de estos análisis exige modificar lo menos posible las preguntas tomadas de otros cuestionarios, tanto en su redacción como en su ubicación en el cuestiona?o. ~omo se verá en el apartado 4.3., la distinta localización de la pregunta en un cuestIo~~rIo, en el c?ntexto en el que se sitúe, afecta a la respuesta. Al igual que la introduccIon de cambIOS, aunque sean menores, en su formulación. Cuando la pregunta proceda de cuestionarios redactados en otro idioma o en el mi~~?, pe:o en un.as circunstancias sociotemporales muy dispares, debe procederse a un analísIs mas detenIdo de su redacción. No sólo porque incluyan términos que en su traducción actual tengan unas connotaciones diferentes. También, porque la población a la que ahor~ se di?ge le ?é una ~terpretacióndistinta. Johnson y colaboradores (1997) muestran la eX1s~e~~Ia ~e dife~encIas cu~t~rales tanto en la comprensión de las preguntas como en la exposlcIon difere?CIal a losdlstmtos sesgos debidos a la formulación de la pregunta. Pero, ¿qué se entIende por una "buena" pregunta? Para Payne (1980: 72), "una 'buena' pregunta, entre otras cosas, es aquella que no afecta a la respuesta". Para Fowler (1998: 344), es aquella que "produce respuestas que son medidas válidas y fiables de algo que queremos medir". Válidas en el sentido en que se correspondan con algún valor "verdadero", hipotético, que intenta medirse. Fiables a la extensión en que las respuestas que se están describiendo sean "consistentes". (La validez y la fiabilidad de las preguntas de encuesta se tratan en el capítulo 6, junto a otros criterios de calidad de los resultados de encuesta). Aunque algunos puedan considerar la elaboración de preguntas de encuesta un "arte", que se adquiere por experiencia (el mismo Stantley Payne publica en 1951 un pe-


220

Métodos de encuesta

queño libro con el título The art of asking questions, con una edición más reciente en 1980), cada vez son más los metodólogos que asientan el diseño de cuestionarios en teorías cognitivas y de la comunicación interpersonal. Gracias a la aportación de numerosos experimentos de preguntas de encuesta (algunos de los cuales ya han sido mencionados), que exploran en "los procesos comunicativos y cognitivos que subyacen en las respuestas de encuesta" (Schwarz, 1997: 31). El entender los procesos sociopsicológicos implicados en la respuesta a preguntas de encuesta ayuda en la formulación de "buenas" preguntas. Antes de comenzar a redactar las preguntas, es conveniente:

1. Especificar los objetivos de la encuesta. La información que pretende recogerse. 2. Identificar los conceptos centrales en la investigación y traducirlos en indicadores "válidos", que ayuden a reducir los errores de especificación. 3. Elegir el método de encuesta a aplicar y concretar la población a sondear. Esto significa que:

Capítulo 4: El diseño del cuestionario

221

Las recomendaciones más citadas en la literatura de encuesta para la redacción de preguntas se resumen en el cuadro 4.2 y se describen a continuación.

CUADRO 4.2. Recomendaciones para la redacción de preguntas

.

1. Formular preguntas relevantes a la investigación.

2. 3. 4. 5. 6. 7. 8.

Preguntas breves y fáciles de comprender por las personas a las que van dirigidas. Emplear un vocabulario sencillo, evitando conceptos o términos abstractos. La redacción de la pregunta ha de ser precisa. La pregunta ha de ser lo más objetiva o neutra posible para no influir en la respuesta. No redactar preguntas en forma negativa. Redactar preguntas de forma personal y directa. ~i las pre~untas ni. las alternativas de respuesta (cuando se ofrezcan) pueden refenrse a vanas cuestIOnes al mismo tiempo. El principio de la idea única. 9. No emplear palabras que comporten una reacción estereotipada.

Las preguntas que funcionan en una situación pueden ser improductivas en otras y que pocas reglas generales pueden encontrarse que se apliquen a todas las circunstancias (Sheatsley, 1983: 206). Ha de tenerse presente el nivel de formación de la población, su dominio del idioma, su capacidad de comunicación verbal, además de su interés por el tema. Con el objeto de elaborar un cuestionario que le sea atractivo, fácil de responder y que no le lleve a rechazarlo. Asimismo, el modo como se administrará el cuestionario influye no sólo en su formato y presentación. También, afecta a la redacción específica de las preguntas. 4. Concretar los análisis que se prevén realizar, en consonancia con los objetivos de la investigación. Como se verá en el capítulo 6, cada técnica analítica tiene unos supuestos básicos que garantizan su correcta realización. En la medida en a buen término. Por ello se recomienda incluir variables "relevantes" para la explicación del objeto de estudio y que estén medidas en el nivel correcto que amplíe sus posibilidades analíticas. Cuantas más actuaciones se prevean respecto al análisis de los datos, más se facilitará la fase analítica de la investigación.

Formular preguntas relevantes a la investigación .~iempre tiene que haber un vínculo entre la pregunta y el problema de investigaclOn. La pregunta ha de adecuarse a la consecución de los objetivos propuestos. En caso contrario, deberá descartarse. . A.tal efecto, Sudman y Bradburn (1987) recomiendan que, como regla general, el mvestlg~dor se pregunte (cada vez que piense en una posible pregunta): "¿por qué estoy haCiendo esta pregunta?". Por su parte, Henerson, Morris y Fitz-Gibson (1987) aconsejan la elaboración de hojas de resumen para eliminar preguntas innecesarias.

tionario es, precisamente, su adecuación en la consecución de los objetivos de encuesta, como se verá en el apartado 6.3. . Preguntas breves y fáciles de comprender, por las personas a las que van dirigidas

De la redacción de las preguntas, la investigación empírica ha contribuido a perfilar una serie de pautas a seguir en la consecución de "buenas" preguntas. Si bien, los mismos metodólogos de encuesta reconocen la dificultad del empeño: Qué difícil es escribir buenas preguntas. Requiere gran habilidad y juicio, mucho tiempo y experiencia y, todavía, incluso después de años de experiencia, nadie puede escribir una pregunta perfecta (Sudman y Bradburn, 1982: 3,283). Desesperamos de poder elaborar preguntas inmunes de crítica seria (Schuman y Presser, 1981: 13).

Sin d~da, la mejor estrategia es utilizar preguntas breves, cuando sea posible, y que los entrevistadores den a los entrevistados tiempo suficiente para responder a las preguntas (Converse y Presser, 1994: 93). Payne (19~0: l:~9}34! :eivindica la "necesidad de preguntas cortas, compuestas por palabras sencillas. Utlhzar tan pocas palabras como sea necesario. Puedes pregunt~~ la mayoría de las preguntas con veinte palabras o menos". Y aporta evidencia empmca de que las preguntas cortas consiguen mejores datos que las largas.


222

Métodos de encuesta Capítulo 4: El diseño del cuestionario

Las preguntas largas y complejas aumentan la probabilidad de que el encuestado se pierda y no las siga (Orenstein y Phillips, 1978). En el mismo sentido se pronuncia Molenaar (1982), para quien las preguntas con instrucciones relativamente largas obtendrán más respuestas "no sabe". Sobre todo, en preguntas de actitudes. En consecuencia, estarían desaconsejadas preguntas como, por ejemplo, Algunas personas opinan que el Gobierno no debería ceder a las presiones nacionalistas, otros dicen que es el momento de reformar la Constitución, ¿qué piensa usted?

Para Mangione (1998) dos reglas generales para la elaboración de preguntas son hacer preguntas claras y no ir más allá de lo que razonablemente se espera que la gente recuerde. Sin duda, las preguntas largas exigen más, tanto del encuestado corno del entrevistador, .cuando el cuestionario se rellena mediante entrevista. Su capacidad para leer entera la pregunta, palabra a palabra, intentando mantener al mismo tiempo el interés del entrevistado y que éste retenga el contenido completo de la pregunta. No obstante, hay ocasiones en las cuales las preguntas largas pueden funcionar mejor que las cortas. Aunque Fowler (1998) desaconseja el uso de preguntas largas referidas al pasado, existe evidencia empírica que avala el empleo de preguntas largas para reducir los efectos de "deseabilidad social" y mejorar la evidencia del recuerdo de acontecimientos del pasado. Bradbum, Sudman y colaboradores (1979) experimentaron con la longitud de la pregunta en la medición de las conductas sensitivas mediante encuesta. Añadieron una frase inicial a cada pregunta o una introducción larga a la pregunta. Por ejemplo, Ocasionalmente, la gente bebe con el estómago vacío o beben un poco demasiadó y se intoxican. El año pasado, ¿con qué frecuencia se intoxicó mientras bebía algún tipo de bebida alcohólica?

La declaración de consumo de bebidas alcohólicas y de drogas fue mayor cuando la pregunta se introdujo con ese preámbulo. Lo mismo sucedió en preguntas referidas a conducta sexual. Posteriormente se verá que ésta es una estrategia para aumentar la declaración de conductas o actitudes no aprobadas socialmente.

En consonancia con Molenaar (1982), Sudman y Bradbum (1982: 50-51) aceptan que las preguntas cortas son mejores cuando se indaga en actitudes. Por el contrario, las preguntas largas se prefieren cuando se·analizan conductas. Son tres las razones que esgrimen: a) Las preguntas más largas pueden utilizarse para proporcionar al encuestado ayudas a la memoria. Dar ejemplos en la pregunta puede estimular el recuerdo. Ayudar a recordar puede ser importante cuando se preguntan cuestiones delicadas (Lee, 1993: 77).

223

b) Las preguntas más largas llevan más tiem

. Como resultado, al entrevistado se le da m~~tara que el entrevlsta~or las lea. puesta y, en general cuanto ID" t' . 1 en:po para pensar, medItar su res, as lempo se e de para pensar más recordará. Las preguntas más largas pueden mejorar l l'd d respondientes a implicarse en el p . a ca l. ~ de la respuesta forzando a los 497). rocesamlento cognItIvo más profundo (Graves, 1989: '<1

El tomar más tiempo para d formación adicional. respon er puede contribuir al recuerdo de inc) El encuestado puede int

t 1 1 . · . erpre ar a ongltud de la pregunta como un indo d de su ImportancIa Le anima a 1 Ica or bum 1974 1983· 1 prestar a mayor atención (Sudman y Brad,anne y otros, 1981; KaIton y Schuman, 1982/2002). , ,

e

surv;~U:;~:~~:n~~S:~bloesrgqu(1e9s8el)anefel.ctuarlon

una serie de experimentos, en The , a IZan os errores d d"" d b' de memoria y a deseabilidad social E e me lClon e Idos a fallos las preguntas más largas pueden ~n :toncre~o, en algu~os comprueban si es cierto que gas y, de esta forma ser más válidas Ag~na clr~unstancIa, obtener respuestas más lar(corta y larga) de u~a misma pregu~ta:SI, por ejemplo, se comparan dos formulaciones • Corta:.¿Qu~pr~blemas de salud ha tenido usted en el pasado?

~::::~;I;;l~~:;~:::~~U;:~t~dre

¡roblemas de salud du;ante el último año. salud ha tenido usted el año pasad~/ mundo en la encuesta. ¿Qué problemas de Obtuvieron un mayor número de aconte' . clmlentos de salud recordados e informados con el formato de pregunta lar go que con e1corto.

Esto viene a corroborar los haUaz os . que una introducción a la pregunta a~n ante~ores de Sud~an y Bradbum (1974) de tad en su retención, favorece la inf~rmad~:~:r:~ehsu longl~ud y aumente la dificulductas sensitivas o delicadas A t c os refendos al pasado y de conpuntualizan que . es e respecto, Kalton y Schuman (1982/2002: 15) El consejo usual de "mantén las re unta " ill~cortas es probablemente una fonna inadecuada de decir "mante/n las preg Pt g un as senc as'" en 1 ". . p"reguntas largas probablemente derivan d '.~ pract~ca, las dIficultades de las SI misma. e su complejIdad mas que de la longitud por

No obstante, adviértase que el uso continuad d cuestionario, puede aumentar el can . . o e preguntas largas, en un mismo gativamente en la calidad de sus r sanClO o fatlga del encuestado. Ello revierte neespuestas en las últimas . P. . ar tanto, en la mesura está el acierto El preguntas del cuestIonario. para cuando sea necesario en el trat; . r~servdadr las pr~guntas largas exclusivamente , filen o e etermInados temas (delicados o Ín-


224

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

timo-personales, del pasado). Lo que tampoco puede hacerse, para reducir la extensión de la pregunta, es acudir a abreviaturas (como IPC, índice de precio al consumo; o PIB, producto interior bruto), a menos que sea de uso muy extendido. Emplear un vocabulario sencillo, evitando conceptos o términos abstractos

Máxime en encuestas dirigidas a personas mayores o con problemas de lenguaje. Las preguntas complejas o difíciles de entender suelen obtener un mayor porcentaje de no respuesta de ítem (no saben/no contestan). Por otra parte, Dillon (1990) advierte que las respuestas "fáciles" no son necesariamente respuestas "fiables". En el diseño de la encuesta, antes de comenzar a confeccionar el cuestionario, ha de concretarse la población a la que se piensa sondear. Es bueno conocer su nivel de conocimientos, su dominio del lenguaje. La elección de las palabras que compondrán la pregunta ha de estar supeditada a las peculiaridades de la población. Como regla, deben utilizarse palabras que sean comprendidas por los miembros de menor nivel educativo de la población. Términos aparentemente sencillos, como "proporción", pueden ser erróneamente interpretados por algunos segmentos de población. Así lo constata Belson (1981: 240) con la siguiente pregunta: ¿Qué proporción del tiempo que ve la televisión lo dedica a ver programas de noticias?

Sólo 14 de las 53 personas entrevistadas interpretaron correctamente la palabra "proporción" como porcentaje, parte o fracción. El resto lo interpretó como "cuánto tiempo" o "qué programas de noticias ve".

Es preferible incluir palabras familiares, que se empleen con frecuencia. "Las palabras familiares son las más útiles, si no tienen demasiados significados en el contexto" (Payne,1980: 235). Para asegurarse de su familiaridad, este autor recomienda combusca en ella. Además, es bueno consultar qué otros significados puede tener y que puedan confundir al encuestado sobre el sentido de la pregunta. Han de evitarse palabras ambiguas, que carezcan de un significado uniforme, al igual que expresiones que puedan inducir a error. Esta recomendación adquiere mayor relevancia, cuando el cuestionario es rellenado por el mismo encuestado, sin la mediación de un entrevistador, que pueda aclarar el significado de la pregunta y de las respuestas (si se ofrecen y ha de elegirse entre ellas). Se desaconseja el uso de palabras habituales en el argot de los sociólogos, como proporción, socialización, alineación, interacción social. No son plenamente comprendidas por la generalidad de los individuos (Newell, 1993). Igualmente, se ha de ser precavido en el uso de términos como trabajador, mayor, joven, progresista, mucho, con bastante frecuencia, usualmente, barato. Su acepción puede variar dependiendo de a quién se pregunte, dificultando la interpretación de la respuesta. Para evitar su distinta

1;2,')

interpretación, puede seguirse la recomendación, expresada por Fowler (1998), de no utilizar escalas con adjetivos, en la medición de estados subjetivos (actitudes, opiniones, valores), en estudios internacionales o que incluyan a poblaciones de culturas diversas. En estos casos, se propone el empleo de escalas numéricas para garantizar la comparabilidad de las respuestas. Ha de procurarse que tanto las preguntas como las respuestas (en caso de preguntas cerradas) estén' redactadas en un lenguaje sencillo, fácilmente comprendido por el ciudadano de a pie. Por ejemplo, en la siguiente pregunta sobre salud: En el último mes, ¿alguien de su familia ha sufrido de cefalea intensa?; es preferible cambiar el término usual en el argot médico de "cefalea" por "fuertes dolores de cabeza", al ser éste de más fácil comprensión por el conjunto de la población.

Asimismo, en encuestas dirigidas a poblaciones de distinta procedencia cultural o idioma, es importante asegurarse que la traducción a otro idioma (expresa en el cuestionario) no cambie el significado de la pregunta. En caso contrario, no podrían compararse las respuestas, como sucedió en algunas de las preguntas incluidas en el Eurobarómetro 53, del año 2000, que presentaron sesgos culturales (diferencias de interpretación), como se indica en el apartado 6.4. Una vez redactada la pregunta, es conveniente ponerse en el lugar de la persona de menor nivel educativo a la que se piensa encuestar y preguntarse: "¿Cómo respondería yo a la pregunta, si fuese preguntado?". Después, en el pretest o precomprobación del cuestionario, antes de su lanzamiento definitivo, tendrá el investigador oportunidad de comprobar si realmente la pregunta es entendida por la población a la que se dirige. Fijándose en los problemas surgidos en su administración y en la proporción de ~e~sonas que optan por no contestarla (los "no saben/no contestan"). Para ello es e~lgldo que el pretest del cuestionario se haga en personas que se ajusten a toda la vanedad de la población que finalmente va a ser sondeada (apartado 4.5).

Cuantos más detalles se aporten en la pregunta, más se contribuye a su precisión a

l~ especificación ~e lo que se pregunta y a su interpretación. Palabras sencillas y fanri-

liares, para el conjunto de la población, pueden tener, no obstante, significados diferentes. Lohr (2000) lo ilustra con una palabra tan sencilla como auto. La pregunta ¿Posee puede s~sc~tar diferentes interpretaciones, a menos que se aclare lo que qUiere decITse con los ternunos auto y posee. Ha de evitarse que surjan preguntas como: ¿.Cuenta como propiedad un vehículo aún no pagado en su totalidad?, o ¿puede conSiderarse una furgoneta o una camioneta un auto? us~ed un a~to?,

De acuerdo con Kalton y Schuman (1982/2002), el punto de partida al elaborar una pregunta es hacer una definición precisa del hecho a recoger. Cambios aparente-


226

Métodos de encuesta

mente marginales en la definición pueden tener efectos profundos en los resultados de la encuesta~ Incluso hechos aparentemente sencillos, como el número de habitaciones ocupadas en una vivienda, pueden tener problemas de definición: ¿Ha de incluirse la cocina, si sólo se utiliza para cocinar?; ¿se incluyen los baños, aseos, el hall?; ¿una habitación dividida por un biombo o una cortina es una o dos habitaciones? Para evitar errores de especificación en la pregunta, su interpretación errónea, es conveniente añadir alguna especificación que concrete el sentido de lo que se pregunta. Por ejemplo, Aproximadamente, ¿cuánto dinero se gastó usted en las pasadas Navidades? (Inclúyase el dinero gastado en todo tipo de conceptos: alimentación, transporte, viajes, compras de regalos, lotería y demás.)

Capítulo 4: El diseño del cuestionario

227

Es más probable que esta pregunta capte un estado de opinión más favorable a dicha propuesta que cuando, en el enunciado de la pregunta, se añade: Le parece a usted ésta una buena o una mala propuesta? • ¿Está usted a favor de la pena de muerte para personas condenadas por terrorismo? Sería mejor proporcionar un equilibrio formal en la pregunta del tipo: ¿Está usted a favor o en contra de la pena de muerte para personas condenadas por terrorisma? • Lo mismo puede decirse de la pregunta ¿ Cree usted que la actual política exterior del Gobierno es positiva? Suscitará más respuestas favorables a la actuación gubernamental que cuando en el enunciado de la pregunta se añaden los términos: "excelente, buena, regular, deficiente, mala".

La pregunta ha de ser lo más objetiva o neutra posible para no influir en la respuesta

'La consecución de preguntas objetivas o neutrales parece más difícil de alcanzar en ~~preguntas referidas a aspectos subjetivos. Como Schuman y Presser (1996: 179) se'c'.f'Ift~lan,

Aunque algunos autores, como Hox (1997: 53), consideren que "en el contexto de la medición en encuestas, no existe ninguna pregunta de encuesta puramente objetiva", ha de perseguirse la "objetividad". Éste es un requisito de calidad de la pregunta.

Ninguna pregunta de actitud puede ser completamente neutral, ya que el mero hecho de indagar sobre ella puede agudizar la definición de ella como un "asunto".

Una "buena" pregunta es, entre otras cosas, aquella que no afecta a la respuesta (Payne, 1980: 72).

De la pregunta se demanda que sea consonante con los objetivos de la encuesta y que esté redactada de forma que no invite a una determinada respuesta. En consecuencia, ha de evitarse la práctica deliberada, por parte de algunos investigadores, de formular preguntas tendenciosas, que permitan corroborar sus hipótesis de partida, al incitar a una respuesta concreta. Preguntas como, por ejemplo, ¿No pegará usted a sus hijos, verdad?, además de incitar a una respuesta negativa, no aportaría una información "creíble". Lo mismo puede decirse de preguntas cerradas, que fuercen a los encuestados a elegir entre pocas opciones de respuesta, no cubriendo todo el abanico de alternativas posibles.

La pregunta ha de ser equilibrada, en consideraciones positivas y negativas, si quieren evitarse sesgos como el de aquiescencia (o tendencia al acuerdo, indistintamente del contenido de la pregunta). Especificar sólo una alternativa de respuesta es una forma de cargar la pregunta (Sheatsley, 1983: 214).

Sea el caso, por ejemplo, de las preguntas siguientes: • Recientemente se ha propuesto incrementar el gasto sanitario para dar asistencia médica a todos los colectivos de inmigrantes. ¿Le parece a usted una buena propuesta?

De todas formas, si va a formularse una pregunta cerrada (que incluye las distin:,\'~~~opciones de respuesta), debe procurarse que su enunciado incluya las diferentes al:-":',;:~~tnativas de respuesta entre las cuales el encuestado ha de elegir una o varias. Nun-

'T9c,:ldebe presentarse una única vertiente del tema, ya sea positiva o negativa, y }:~~~guntar por su opinión. Sobre todo conociendo de la predisposición de algunas per}::~enas a manifestarse "de acuerdo" con cualquier proposición plausible que se le if>f.rezca (sesgo de aquiescencia), a menos que se den otras alternativas de respuesta. El investigador-debe formular las preguntas para dar igual énfasis a todas las alternativas; para legitimar todas las variedades de opinión; para hacer que el encuestado estime que cualquier respuesta que escoja sea tan aceptable como cualquier otra (Orenstein y Phillips, 1978: 219).

,».l\1olenaar (1982: 66) advierte, no obstante, que "añadir un argumento 'pro' a iEi~~9~de las alternativas en una pregunta obtendrá más elecciones para esa alternativa; ."};f;;~~adir un argumento a la otra alternativa necesariamente no hace ambas alternativas ;~q:.,{(Jeigual peso". --' En el mismo sentido, ha de insistirse en la recomendación de evitar que expresiones ;;','9omo "la mayoría de la gente opina que..."; la referencia a la opinión expresa de una '''\autoridad (la Iglesia, el Gobierno, los expertos) antecedan a una pregunta. Excepto que s~opte, deliberadamente, por esta fórmula como estrategia para aumentar la proba~bilidad de informar de conductas ilícitas o socialmente censurables, como después se , -yerá. Estas introducciones a la pregunta tienen el efecto de "cargar" la pregunta, sesgando la respuesta, al influir en la misma. Como sucede con la pregunta:

°


228

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

Muchos expertos creen que la actuación del Gobierno en el control de la delincuencia es equivocada, pero otra gente opina que es acertada. ¿Cuál es su opinión? Aunque todos estamos familiarizados con preguntas cargadas, diseñadas para mostrar que el público apoya a un candidato político particular o causa o producto .comercial, el profesional de la investigación respetable hará todo el esfuerzo par~ evitar influir en los respondientes y pennitir la igual expresión de todos los puntos de vIsta. Esto no siempre es fácil, sin embargo, ya que todos operamos sobre la base de supuestos inconscientes y sesgos que podemos compartir con nuestros conocidos, pero que son bastante inaceptables para otros segmentos del público (Sheatsley, 1983: 215).

Para evitar la inclusión de sesgos en la pregunta, sería conveniente discutir su redacción con personas que compartan otros puntos de vista (con "abogados del diablo"). Ello contribuye al enriquecimiento de la pregunta. No redactar preguntas en forma negativa

La comprensión de la pregunta se dificulta con su redacción en negativa. Sirva de ilustración una encuesta realizada por Ropper en 1993 y destacada por Lohr (2000). En ella se obtuvo un resultado sorprendente: el 25% de los norteamerican?s ~n~ cuestados "no creían" que el Holocausto realmente hubiese ocurrido. Cuando se elimino de la pregunta la palabra "no" tan sólo un 1% de los sondeados opinaba que "posiblemente el exterminio hacia los judíos (el Holocausto) nunca ocurrió".

La formulación negativa de una pregunta suele comprenderse peor que su correspondiente enunciado en positivo. De manera especial, cuando ~e pide al e~cues­ tado que manifieste su grado de acuerdo o desacuerdo ante determmadas cuestIOnes. Por ejemplo, en vez de la pregunta ¿No debería castigarse a los estudiantes que suspenden?, es preferible A los estudiantes que suspenden, ¿deb~ría castigárseles? Este úlclarifica el significado de una respuesta negatIva. Igualmente, en la pregunta '1' 1 ., el conflicto de Irak?, habría que eliminar la palabra "no" para facIItar a comprenslOn e interpretación de la pregunta.

En caso de preferir la redacción negativa de la pregunta (por ejemplo, ¿Preferiría usted que sus hijos no llegasen tarde a casa?), es conveniente subrayar l~ palabra "no" para llamar la atención sobre ella y que el encuestado se percate del sentIdo de la pregunta. Redactar preguntas de forma personal y directa

Se prefiere lo concreto a lo abstracto. Por ejemplo, ¿Qué sentiría usted si tuviese un accidente de tráfico? Se obtendría mayor infonnación con una redacción más directa y personal: ¿Ha tenido usted, alguna vez, un accidente de tráfico? Si es así, ¿qué sintió?

229

En experimentos actitudinales, infonnados por Molenaar (1982), se cambió la típica pregunta referida a la política gubernamental: "¿Está usted de acuerdo con... ?", por una pregunta más personalizada: "¿Votaría usted por.... ?". Con esta modificación de la pregunta se consiguió de un 4 a un 12% más de acuerdo con la política propuesta. Asimismo, en The National Crime Survey de Estados Unidos, en vez de la pregunta genérica ¿Alguien le atacó a usted en los últimos seis meses?; se plantean una serie de preguntas específicas, que detallan la fonna en que alguien puede ser atacado, captando una mayor información (Lohr, 2000): ¿Alguien le ha atacado o amenazado en alguna de estas formas?: • Con algún anna, por ejemplo, una pistola, un cuchillo. • Con algo como un bate de béisbol, una sartén, un palo, etc.

En general, las preguntas específicas suelen proporcionar una información más precisa las preguntas genéricas. Estas últimas, por el contrario, pueden provocar una mayor vade interpretaciones. Por esta razón Converse y Presser (1994) aconsejan restringir a aquellas circunstancias en que interese la obtención de una medida global. Igualmente, cuando se analicen conductas que precisen una especificación temporal numérica, se recomienda proporcionar categorías de respuesta específicas. Las expiesionles "con frecuencia", "regularmente", son vagas y ambiguas. Habría que eviEn su lugar son preferibles opciones de respuesta concretas. Como, por ejemplo, t'diaIialm(;~nte","2-3 veces por semana", "una vez a la semana", "dos veces al mes". las preguntas ni las alternativas de respuesta pueden referirse varias cuestiones al mismo tiempo

Se defiende el principio de la idea única. Preguntas como ¿Cree usted que la sociedad actual es egoísta e insolidaria?, no son ",..~---aGocilaGa&-No-a~all-a-una-interpretación-correcta de la respuesta No puede separarse la doble mención de la pregunta. Lo mismo cabe decir de la pregunta: En las últimas Navidades, ¿cenó usted con su familia y se divirtió? Puede que la respuesta a la primera parte de la pregunta sea afirmativa, pero la correspondiente a la segunda parte negativa. La pregunta comprende dos cuestiones diferentes, por lo que sería mejor transfonnarla en dos preguntas distintas como, por ejemplo, Pll. En las últimas Navidades, ¿cenó usted con su familia?

[ ~o

;

PllA. ¿Se divirtió? Sí No

1 2


230

Métodos de encuesta

Lo mismo cabe decir de las opciones de respuesta de una pregunta cerrada. Éstas tampoco deberían contener dos o más ideas afines en una misma categoría de respuesta. Así, por ejemplo, se considera inapropiada la siguiente pregunta, incluida en el cuestionario de CIRES/ASEP en la medición de las actitudes ante la inmigración. En ella se pide a los encuestados que seleccionen la afirmación, de las dos siguientes, con la que se sienten más de acuerdo con el tipo de inmigración: • Que los inmigrantes vengan a España con sus familiares y se asienten para siempre. • Que los inmigrantes vengan una temporada sin sus familiares y que luego regresen a su país.

Así expresas, ambas opciones de respuesta incluyen dos cuestiones a la vez. Una, el carácter familiar e individual de la inmigración. Dos, su carácter definitivo o temporal. Ello dificulta la interpretación de las respuestas. Además, se fuerza a los encuestados a elegir entre dos opciones en las cuales puede compartir una parte, pero no la otra también incluida. Sería mejor haber ampliado las opciones de respuesta para que cada una de ellas incluya una única idea referida al tipo de inmigración que se prefiere.

No emplear palabras que comparten una reacción estereotipada Preguntas directas, como por ejemplo, ¿Se considera usted racista?, hay que concederlas una validez limitada en la medición de racismo. En la sociedad contemporánea pocas personas manifiestan abiertamente que son "racistas", por miedo a la desaprobación social. Habría que complementar esta pregunta con otras que logren ocultar su intencionalidad, permitiendo captar la actitud latente ("real") ante la inmigración. En las encuestas de actitudes ante la inmigración es práctica usual incluir preguntas referidas a "distancia social", como por ejemplo las siguientes dos preguntas incluidas en las encuestas del CIS: A usted le preocuparía mucho, bastante, poco o nada que un hijo o una hija suya se casara con un ciudadano de Marruecos u otro país norteafricano? Hasta qué punto, mucho, bastante, poco o nada, le importaría a usted que sushijos (si no los tiene, en caso de que los tuviera) compartieran en el colegio la misma clase con niños de familias inmigrantes extranjeras?

En Cea D'Ancona (2002b, 2004b) se demuestra la escasa utilidad de estas preguntas en la medición de racismo, frente a preguntas relativas a derechos sociales, de ciudadanía y de política inmigratoria, que consiguen ocultar más la intencionalidad de la pregunta. Lo cual favorece la captación de conductas, actitudes u opiniones que suscitan desa-

Capítulo 4: El diseño del cuestionario

231

probación social. Además, no suele recomendarse el uso de palabras hipotéticas como "¿Qué haría si...?" o "¿Le gustaría....?". ' Newell (1993) observa que lo que el encuestado dice que "podría hacer", cuando se elunen1ta a una situación concreta, no siempre expresa su conducta futura "real". Existen tJI'eguntas que inevitablemente consiguen respuestas favorables (como, por ejemplo, ·flUj,tar,ía a usted (ener mayores ingresos?), por su deseabilidad social. En cambio, otras ol)tiemen respuestas desfavorables porque no son socialmente deseables. Si bien, el autor teconlJCe que la utilidad de las preguntas hipotéticas lo dicta el tema de estudio. En el mismo sentido se manifiesta Sheatsley (1983), para quien preguntas como ;(;Ol:npra¡ría este producto si estuviese disponible? o Si las elecciones se celebrasen ¿v?:aría al candidato A o al candidato B?, aunque puedan tener interés, son de esutilidad como predictores de conducta futura, debido a que las circunstancias camFrey (1989) recomienda evitar preguntas hipotéticas, que piden predicciones soel futuro ("¿Qué sucedería si.... ?"), por su escasa fiabilidad. Obtienen respuestas talmt)ién "hipotéticas". Además de evitar el empleo de palabras estereotipadas o con un significado pevorativ(), hay otras actuaciones dirigidas a reducir el sesgo de deseabilidad social. Re:cuénlese que la deseabilidad social supone un error de medición cuando los encuestados no admiten la tenencia de conductas, actitudes u opiniones ~ue perciben co"socialmente indeseables". El temor a ser rechazados, desaprobados socialmente, lleva a dar respuestas "políticamente correctas" o socialmente deseables, pero que se adecuan a su situación o sentir particular. Este tipo de error de medición se relaciona más con los métodos de encuesta mediante entrevista, como se vio en el capítulo 2. Su presencia se infiere cuando hay una sobre decl~r~ción (o declaración en exceso) de conductas, opiniones o actitudes valoradas pOSItIvamente en la sociedad analizada. Por el contrario, las negativamente valoradas apenas se declaran. . ?,nductas socia~~n~e deseables describen al buen ciudadano, a la persona culta y bIen mformada, ~ al mdIvIduo que cumple con sus responsabilidades morales y sociales. Estas conductas mcluyen votar, leer, utilizar bibliotecas, ir a acontecimientos educativos y ~ulturales, dar a la caridad, estar empleado e incluso ponerse el cinturón de seguridad llllen~ras se con~uce. Todas éstas están sobreinformadas. Por ejemplo, un tercio de los respondientes que informaron dar a la caridad en realidad no lo dieron' un tercio más de suj~tos info~mó haber votado y por el ganador, que en realidad votaron. Conductas soClalmen~e m~eseables describen la enfermedad y la incapacidad, la conducta ilegal o contra norm~tIva. Estas describen padecer cáncer, enfermedades venéreas y mentales, delincuencI~, cons~mo de drogas y de alcohol, posesión de armas y actividad sexual. Todas éstas e~tan submformadas. También están subinformadas preguntas relativas a estatus finanCIero, como la renta, el ahorro, activos financieros y bancarrota (Dillon, 1990: 120). En la reducción del sesgo de deseabilidad social pueden seguirse algunas o varias de las actuaciones resumidas en el cuadro 4.3 y que después se detallan.


232

Métodos de encuesta

CUADRO 4.3. Recomendaciones para reducir el sesgo de deseabilidad social 1. Motivar al encuestado para que responda con sinceridad. 2. Ocultar la intencionalidad de la pregunta. 3. Preferir el formato de pregunta abierto al cerrado, las preguntas largas a las cortas o breves, y las escritas en un vocabulario familiar al encuestado más que el estándar. 4. Proporcionar respuestas flexibles (en preguntas cerradas) o atenuar la gravedad de la pregunta. 5. Aleatorizar las opciones de respuesta. 6. Dar mayor privacidad a la respuesta. 7. Cargar deliberadamente la pregunta:

• • • • •

Todo el mundo lo hace. Asumir la conducta y preguntar por su frecuencia y otros detalles. Uso de la autoridad para justificar la conducta. Razones de por qué no. Escoger marcos de tiempo apropiados.

Capítulo 4: El diseño del cuestionario

233

Por esta razón se prefieren indicadores indirectos, como los relativos a política inmigratoria, por ejemplo, en la medición del concepto de racismo (Cea D'Ancona, 2002b, 2004b). En el contexto norteamericano, Hesselbart (1975) advirtió, con anterioridad, que en preguntas "directas" las personas de mayor nivel educativo son menos propensas a asumir estereotipos raciales que en preguntas "indirectas".

rir el formato de pregunta abierto al cerrado, las preguntas largas cortas o breves; y las escritas en un vocabulario familiar uestado más que el estándar

Con es~os. formatos de pregunta, Bradburn, Sudman y colaboradores (1979) y, con postenondad, Sudman y Bradburn (1982), lograron incrementar la declaración.de. cond~ctas sensitivas en algo más de un 30%. Schuman y Presser (1981) conSIgUIeron mcluso aumentar al doble la revelación de consumo de alcohol y otras conductas ilícitas.

.. orcionar respuestas flexibles (en preguntas cerradas) o atenuar la gravedad pregunta Motivar al encuestado para que responda con sinceridad

En la introducción de la pregunta es bueno enfatizar la importancia de proporcionar una información "veraz". Asimismo, Fowler (1998: 355) recomienda que se explique el propósito de la pregunta para que los encuestados "puedan ver por qué son apropiados". Al mismo tiempo, es imprescindible transmitir garantías de confidencialidad y anonimato de la información que se proporcione en la encuesta. Como Singer, Von Thurn Miller demuestran, las garantías de confidencialidad reducen la no resEn suma, se trata de garantizar a los encuestados que sus respuestas no se vincularán a ellos, a una identidad concreta, sino que se analizarán en conjunto, anonimizándose. Por lo que no han de tener temor a declarar su nivel de renta "real", porque no va a repercutir en una futura actuación fiscal, por ejemplo; o que un empresario omita la contratación de inmigrantes "ilegales" por miedo a actuaciones policiales futuras. Ocultar la intencionalidad de la pregunta

Aunque ésta sea una recomendación general, extensible a todo tipo de pregunta, en el tratamiento de cuestiones que puedan suscitar el sesgo de deseabilidad social adquiere mayor relevancia. Siempre y cuando se desee obtener una respuesta que se ajuste a la realidad.

ffa de evitarse que el encuestado piense que su respuesta puede ser valorada neyamente. Una pregunta se considera "amenazante" no sólo cuando puede perci.e como una invasión a la intimidad personal. También, cuando se aprecia que exis,na respuesta "correcta" y otras "incorrectas". Pudiendo ser aprobado o ~probado socialmente, si se pronuncia por una u otra de las respuestas. El temor a nsura social puede llevarle a elegir la respuesta que atribuya mayor deseabilidad .•·l o a no pronunciarse (es decir, no responder a la pregunta). Es habitual relacionar untas "amenazantes" con la obtención de un mayor porcentaje de no respuesta en

En la última encuesta de actitudes ante la inmigración del CIS de 1996, por ejemplo, se obtu,:,o un ~ayor p?rcen!~je de no respuesta (no sabe/no contesta) en las pregu~tas refendas a IdeologIa pohtIca (27,6%), ingresos (28,1 %), seguidas de otras relatIVas a los derechos de los trabajadores extranjeros (¿ Considera usted que los derechos de los trabajadores que viven en España, deberían ampliarse, deberían dejarse como están o deberían reducirse? Un 28% de los 2.493 encuestados optó por no responder a la pregunta). Ante todo, hay que procurar que la pregunta no incomode al encuestado. Preguntas ~mo ¿Alg~na vez ha robado usted algo de un centro comercial? suelen provocar rechazo e mco~odIdad en el entrevistado. Podría mejor preguntarse ¿Alguno de sus amigos o conoCl,dos acostumbr~ a ~ustraer algún producto de centros comerciales? Después, se formulanan preguntas mdIrectas, que permitan conocer si el encuestado también acostumbra a dicha práctica.


234

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

Hay que procurar redactar la pregunta de forma que logre minimizar la probabilidad de que los encuestados piensen que su respuesta puede ser valorada de forma negativa. Para ello es imprescindible que la pregunta y sus alternativas de respuesta (en preguntas cerradas) se redacten de la forma más objetiva o neutra posible, no introduciendo ningún término que pueda llevar a deducir "desaprobación". Todas las respuestas han de percibirse como igualmente aceptables. Cuando se estime necesario, puede optarse por solicitar una respuesta aproximada. Como sucede en preguntas habituales en las encuestas, como es la relativa a "ingresos", que suele generar reticencias por parte de los encuestados a declarar la cantidad exacta. De acuerdo con Groves y Kant (1979), las preguntas directas sobre renta son las que obtienen un mayor porcentaje de no respuesta. Por su parte, Ripler e Hipler (1986), tras analizar varias encuestas de ámbito nacional en Alemania del Oeste, obtienen que las preguntas abiertas sobre renta consiguen un mayor porcentaje de no respuesta que cuando la pregunta es cerrada. En esta cuestión, la pregunta abierta suele percibirse como más amenazante y ofensiva que la cerrada, aunque permita la obtención de resultados más precisos y eviten problemas usualmente relacionados con las preguntas cerradas (como se verá en el subapartado 4.2.2). En estos casos se recomienda la redacción flexible de la pregunta. Por ejemplo, ¿Podría usted indicar, aproximadamente, cuál es la cuantía de sus ingresos mensuales? Y, preferiblemente, cerrada, preguntando por una cantidad aproximada dentro de unos intervalos específicos, como hace el CIS, en la encuesta de actitudes ante la inmigración de 1996 (estudio n.O 2.214). En su cuestionario, ésta es la última pregunta (~52) Yaparece con el siguiente enunciado: P.52 Actualmente, entre todos los miembros del hogar (incluido el entrevistado) y por todos los conceptos, ¿de cuántos ingresos netos disponen por término medio en su hogar al mes? No le pido que me indique la cantidad exacta; sino que me señale en esta tarjeta en qué tramo de la escala están comprendidos los ingresos de su hogar.

(MOSTRAR TARJETA DE INGRESOS) Menos de 50.000 ptas De 50.001 a 100.000 ptas De 100.001 a 150.000 ptas De 150.001 a 200.000 ptas. . De 200.001 a 300.000 ptas. . De 300.001 a 400.000 ptas. . De 400.001 a 500.000 ptas. . De 500.001 a 750.000 ptas De 750.001 a 1 millón de ptas Más de 1 millón de ptas N.C

. . . . . . . . . . .

01 02 03 04 05

(172)(173)

06 07 08 09 10 99

Adviértase en esta pregunta la mayor concreción de la variable renta para evitar errores de especificación: "entre todos los miembros del hogar (incluido el entrevistado) y por todos los conceptos".

235

las opciones de respuesta

Ésta es una práctica posible en encuesta mediante entrevista, no en las autoadella se quiere reducir el temor a revelar conductas, opiniones o acque pudieran tener desaprobación social. técnica, conocida como RRT (Randomized Response Technique), fue origi¡";'~I"l""""&3n1rp propuesta por S. L. Warner en 1965 (en "Randomized response: a survey !cfi:nlqIUe for eliminating evasive answer bias". Journa1 ofAmerican Statistical Asso60: 63-69). Su denominación introduce, no obstante, una cierta confusión. Es más que la "respuesta" lo que, en realidad, se aleatoriza. '--'''''.. . . . ..,.. . ., .._ en ofrecer al encuestado al menos dos preguntas (pueden ser tres o inclusive una considerada "amenazante" (por ejemplo, conducir sin el cinturón de seguridad, '''''.«',;'.U.01... .L'-'''~ .... productos de un centro comercial) y otras "no amenazantes" (la compra de un la práctica de una determinada actividad deportiva). La condición es que las .ct.ilbre~guntéLs elegidas se respondan de la misma forma. Lo usual, con respuestas dicotómitipo "sí", "no". El encuestado elige cuál de las dos preguntas (o más) responde, meFX.·cliallte un procedimiento aleatorio, como puede ser tirar una moneda al aire, arrojar un Por ejemplo, si obtiene, tras lanzar una moneda al aire, "cara", responderá la pri'''.',.',''' .........&.._... ~ pregunta, mientras que si es "cruz", la pregunta será la segunda. Como las opciones ··.·'-"i,{:-i;~,:1¡~m,!'-~;é!::S)!:!·cle respuesta a ambas preguntas son las mismas, el entrevistado puede responder "sí" o , sin que el entrevistador sepa realmente qué pregunta está siendo contestada. De esse quiere transmitir al entrevistado la sensación de mayor privacidad en su res;oX'~;:':OU(~st;a., esperando que ello posibilite una mayor sinceridad en su contestación. 111J.JL0"~.U.,,-".lLA-lJ. Con

/,.i';"".,,:;.uau'-'.

Locander, Sudman y Bradburn (1976) consiguieron una mayor declaración de conductas socialmente indeseables, como el consumo de bebidas alcohólicas o estar arruinado, haciendo uso de esta técnica. Al igual que Zdep y Rhodes (1976), en su encuesta sobre consumo de marihuana; o Bradburn, Sudman y colaboradores (1979). Si bien, estos últimos investigadores precisan que esta técnica muestra mayor adecuación en conductas que no sean muy "amenazantes". Tras entrevistar a una muestra aleatoria de 200 personas, que habían sido arrestadas, en Illinois (Chicago), por conducir bebidas y a 200 que habían declarado bancarrota, mediante cuatro métodos de encuesta (entrevista cara a cara, telefónica, utilizando RTTy encuesta autoadministrada), consiguen una mayor admisión de conducta indeseable, como haberse arruinado, con RTT. Pero no en la conducta más amenazante: conducir bebidos. Ésta fue escasamente revelada en cualquiera de los cuatro métodos de encuesta que se aplicaron.

El inconveniente principal de esta técnica es la dificultad de identificar la respuesta la persona que la emite. Lo cual entorpece la realización de análisis explicativos determinadas conductas. mayor privacidad a la respuesta

Se prefiere la encuesta autoadministrada a la aplicada mediante entrevista y, en las >;~;I!~~r,~j¡í\'( encuestas cara a cara, el uso de hojas de respuesta autorrellenadas. La autocumpli-


236

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

mentación del cuestionario, en su totalidad o en parte, contribuye a transmitir la sensación de mayor anonimato y confidencialidad en la respuesta. Un requisito necesario para la obtención de respuestas más "sinceras". En un estudio llevado a cabo por Jobe y colaboradores (1997), sobre preguntas sensitivas en encuestas de fertilidad, en colaboración con NCHS (The National Center for Heath Statistics de Estados Unidos, que desde 1973 realiza la National Survey of Family Growth: NSFG) y con NORC (The National Opinion Research Center), se consiguió una mayor declaración de promiscuidad sexual, de padecer enfermedades de transmisión sexual y el uso de preservativos, en encuestas autoadministradas. De un 19 a un 37% más que cuando la encuesta se hacía mediante entrevista. Por otra parte, en el estudio comparativo de K6rmendi (1988) se muestra la mayor inadecuación de la encuesta telefónica en la indagación de cuestiones como la renta económica. Un mayor porcentaje de no respuesta se obtuvo en la pregunta referida a la reIíta, en la entrevista telefónica que en la cara a cara. En ambos métodos, aquellos que no respondieron a esta pregunta mostraron ser, precisamente, los de menor renta. En el capítulo 2 se hace referencia a otros estudios que corroboran la mayor adecuación de la encuesta autoadministrada, seguida de la encuesta cara a cara, con o sin hojas de respuesta, como los métodos más idóneos para tratar temas delicados o especialmente sensitivos, en contra de la encuesta telefónica. A las razones entonces dadas, añádase una consideración también importante. La entrevista cara a cara permite controlar la presencia de otras personas en el transcurso de la entrevista, que pueden contribuir a sesgar las respuestas de los entrevistados. El control de la posible influencia de "otros" no se consigue en los demás métodos de encuesta (telefónica y autoadministrada). Lo que puede favorecer la obtención de una respuesta menos "sesgada" en la encuesta cara a cara. Pero, siempre y cuando se sigan, en su práctica, las recomendaciones dadas en el capítulo 2. deliberadamente la

vré~f!Unta

Como sucede con otras reglas (antes expuestas) referidas a la formulación de la pregunta, el propósito de la pregunta puede llevar a contradecir alguna de las recomendaciones precedentes. Sea el caso de la enunciada en quinto lugar, la referida a "no cargar" la pregunta para garantizar su neutralidad y objetividad. En el tratamiento de temas delicados o sensitivos puede optarse por lo contrario: "cargar la pregunta". Al menos ésta es una estrategia aconsejada por Sudman y Bradburn (1987) para aumentar la probabilidad de informar conductas socialmente no deseables. Con ella se quiere conseguir una información más "veraz" o "creíble". En especial, cuando se parte del supuesto de que algunas personas pueden decidir no desvelar conductas, actitudes u opiniones porque creen que se desvían de lo socialmente deseable. Este proceder fue primeramente aplicado por Alfred Kinsey, C. Wardell, B. Pomero y C. E. Martin, en su famoso estudio sobre la conducta sexual masculina, publicado en

237

1948 (Sexual behavior in the human maleo Saunders. Philadelphia). Primero, obtuvieron que pocos entrevistados admitían, en una pregunta abierta, la práctica de la masturbación, que ellos presumían que era más generalizada de lo declarado. Con la finalidad de conseguir una mayor revelación, decidieron "cargar" la pregunta, siguiendo la estrategia de asumir la conducta y preguntar detalles sobre la misma. Por ejemplo, ¿Cuántos años tenía usted la primera vez que se masturbó? Esta pregllnta se considera que está "cargada" porque asume que los entrevistados tienen alguna experiencia de masturbación. Además, indirectamente se informa a los entrevistados que la práctica de la masturbación es "común" y no deben sentirse culpables si la practican. Para sorpresa de los autores, la mayoría de los entrevistados respondió afirmativamente la pregunta. Es decir, reconoció la práctica de la masturbación.

Junto a ésta, hay otras formas de "cargar" la pregunta. Sudman y Bradburn las resumen en cinco principales: a) Todo el mundo lo hace. Introducir la pregunta con una frase que exprese que se trata de una conducta común o frecuente, con el propósito de reducir la amenaza de su revelación. Por ejemplo, Incluso los padres más tranquilos alguna vez se enfadan con sus hijos. En la última semana, ¿han hecho sus hijos algo que le enfadara?

Calvo Buezas (2000) hace uso de esta estrategia en su medición de racismo, en una encuesta a 6.000 alumnos de primaria y bachillerato, cuando pregunta:

p.n TODOS TENEMOS NUESTROS GUSTOS PERSONALES Y NUESTROS RECELOS. CON ALGUNAS PERSONAS NOS MOLESTARÍA CASARNOS. ¿Te molestaría casarte con uno/a persona de los siguientes grupos? (Sí o No): moros/árabes, gitanos, judíos, portugueses, negros de África, latinoamericanos, españoles, norteamericanos, europeos, asiáticos, negros de Latinoamérica, indios

Adviértase la importancia que se concede a las frases introductorias, al haberse destacado escribiéndolas, en el cuestionario original, en mayúsculas. Esta técnica Sudman y Bradburn (1982) la desaconsejan en tópicos de amenaza moderada. b) Asumir la conducta y preguntar por su frecuencia y otros detalles. .Por ejemplo, ¿Cuántos cigarrillos fuma usted al día?, puede resultar menos estigmabzante que la pregunta: ¿Es usted fumador? Como así lo demostró el estudio de Kinsey y colaboradores, antes referido, en el tratamiento de la masturbación.

Sudman y Bradburn (1987) detectan un inconveniente importante en este tipo de pregunta. Los encuestados que no realicen las actividades sobre las que


238

Métodos de encuesta

se pregunta podrían incomodarse, ante el supuesto de que sí las practiquen. Esto repercutirá, negativamente, en su cooperación posterior. c) Uso de la autoridad para justificar la conducta. Los encuestados pueden reaccionar de forma más favorable a una aseveración, si se atribuye a alguien a quien respetan o sienten simpatía. Por ejemplo,

Capítulo 4: El diseño del cuestionario

239

Éstas son las recomendaciones más corroboradas empíricamente, que pueden ayuen la. declaración de conductas, actitudes, opiniones "ilícitas" o socialmente de""a.L'.J.'-"oJ~"'''~~' Si bien, hay autores, como Phillips y Clancy (1972/2002), que manifiestan ~t-1r·1C' con el control de esta variedad de error de medición. Otra cuestión que ha recibido tratamiento específico, por su efecto en el error de Tf,,c.Ut-l.. son las preguntas referidas al pasado. A este respecto, en general se reco~ .. ,.,.....,.rl"-I evitar, en el cuestionario, preguntas que obliguen a realizar cálculos mentales ,~.'''''L:ll''llrr'l"f'' con frecuencia, a la memoria. La razón es que este tipo de preguntas ponen la fiabilidad de las respuestas e, incluso, la posibilidad de que el sujeto las conSuelen ser más difíciles de responder de una forma precisa. En especial, cuando ln....,. sobre la que se pregunta es para el encuestado trivial o inusual. No tienen la·trasce~nalenclanecesaria que garantice su retención en la memoria. Sin duda, en su rl~t:lro1nl-:::ln de recuerdo incide: ,..r<í"a ....

...' n A

f,\./Ic-,

Varios estudios científicos actuales avalan que beber vino reduce la probabilidad de sufrir un infarto y favorece la digestión. ¿Bebe usted vino durante las comidas? ¿Con qué frecuencia? (Preguntas a las que siguen otras referidas al consumo de bebidas alcohólicas.)

d) Razones de por qué no. Cuando a los encuestados se les dan razones que jus-

tifiquen la no comisión de conductas socialmente deseables (como votar en los comicios electorales, lectura de prensa diaria, ponerse el cinturón de seguridad), se reduce su predisposición a no informarles. Por ejemplo,

¡O¡'.... ' ...

C' ......

.-:'.....

a) La relevancia o saliencia del tema para el encuestado. Como la memoria es se-

lectiva, es más probable que se recuerden los eventos que tuvieron especial repercusión en la vida del encuestado, aunque sucedieran hace un largo período de tiempo, que aquellos considerados "triviales". . b) El tiempo transcurrido desde su ocurrencia. Obviamente, es más fácil recordar acontecimientos próximos en el pasado (ayer, hace dos días, la semana pasada) que los lejanos.. Sobre todo, si fueron inusitados y de escasa trascendencia para el encuestado. c) El detalle de la información que se solicite. Esto juega en contra de acontecimientos triviales y aquellos que ocurrieron hace tiempo.

Muchos conductores afirman que llevar puesto el cinturón de seguridad es incómodo y dificulta el acceso a los mandos del coche. Pensando en la última vez que usted se montó en un coche, ¿se puso el cinturón de seguridad?

e) Escoger marcos de tiempo apropiados. Para conductas socialmente no deseables es preferible comenzar con una pregunta como, por ejemplo, ¿Alguna vez ha cruzado usted un semáforo en rojo? En cambio, si se trata de una conducta so-

cialmente deseable (leer la prensa, votar en las elecciones), es preferible omitir la expresión "alguna vez". Al encuestado le puede molestar que se dude de que realiza conductas que tienen aprobación social. En vez de preguntar: ¿Alguna vez se ha puesto usted el cinturón de seguridad?, es preferible:

Las preguntas que requieren mayores detalles de los que los encuestados sean capaces de proporcionar suscitarán respuestas menos fiables y también reducirán la cooperación del encuestado (DeLamater, 1982: 41).

Pensando en la última vez que usted se subió en un coche. ¿Se puso usted el cinturón de seguridad?

Por esta razón se aconseja reducir la cantidad de detalle pedido en la respuesta, cuando se trate de acontecimientos de escasa relevancia para el encuestado y sea amplio el período de tiempo transcurrido.

Sheatsley (1983) defiende la conveniencia de "cargar" la pregunta, incluso cuando se trata de cuestiones que pueden considerarse "normales". Sea el caso de:

d) La motivación del encuestado en responder. Su éxito en recordar la información que se le solicita depende de la facilidad del recuerdo y del esfuerzo que se le persuada que haga (Kalton y Schuman, 1982/2002: 216).

• Estudios cursados. Una pregunta, como por ejemplo, ¿Cuál fue el último curso que completó en el colegio?, puede ayudar a evitar que se exagere el nivel educativo. Se

facilita al encuestado la admisión de que dejó la escuela a una edad temprana. • Atención sanitaria. Porque mucha gente es reacia (al menos en Estados Unidos)

a criticar la atención médica dispensada. En vez de preguntar si se está o no satisfecho con la atención médica recibida, se considera preferible preguntar:

Habitualmente, participar en una encuesta es de escasa relevancia para el enMás bien, se le aborda en un momento concreto y se le requiere para res"''''.I..I.~"" con premura, a una serie de preguntas. Salvo que la encuesta sea por correo, pudiéndose rellenar el cuestionario cuando se quiera y en el tiempo que se estime ne~~.L.I.'...,. Si el tema de la encuesta no es de su interés, lo más probable es que se concluir el cuestionario cuanto antes, concediendo escaso tiempo a meditar las

;"'>7···..···Clles,ta<]o. •.I. ..

- .....

¿Está usted enteramente satisfecho con el cuidado médico que recibe o existe alguna cosa con la que no esté enteramente satisfecho?


240

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

241

Se han propuesto una serie de actuaciones que pueden facilitar la actuación del encuestado y contribuir a la reducción del error de medición, debido a fallos en la memoria. Entre ellas las más referenciadas son:

c) El uso de "procedimientos de ayuda al recuerdo" (Sudman y Bradburn, 1987). Consiste en proporcionar una o más "señales de memoria" como parte de la pregunta. Puede cbnsistir en:

a) Anteceder la pregunta con una introducción que indique la importancia de responder la pregunta, referida al pasado, con precisión. Anteriormente, ya se indicó que las preguntas largas son recomendadas, no sólo en el tratamiento de

• Proponer ejemplos en la pregunta. Por ejemplo, ¿A qué organizaciones pertenece usted? (por ejemplo, religiosas, sindicales, gubernamentales, de

caridad, etc.). • Mostrarles una tarjeta, que contenga el listado de respuestas, en encuestas cara a cara. En las autoadministradas, la persona puede leer todo el

temas sensitivos, sino también en los referidos al pasado. Ayudan en la contextualización de la pregunta y pueden estimular el recuerdo. b) Proporcionar un marco temporal adecuado a la relevancia del tema. Para evitar obtener respuestas poco fiables, aproximar en el tiempo las preguntas referidas a eventos de escasa notoriedad (compras de alimentos, programas de televisión vistos, desplazamientos urbanos). Por el contrario, en aquellos de mayor trascendencia (compra de una vivienda, de un vehículo, viajes al extranjero, hospitalizaciones, defunciones), lo usual es espaciarlo más. Puede superarse inclusive el año. También debido a su escasa cotidianidad, su limitada frecuencia. Fowler (1998) observa que en cuestiones de escaso impacto, como las referidas a consumo diario, un período de tiempo corto, como veinticuatro horas, puede incluso generar errorde medición, debido a un fallo en el recuerdo. Además, es habitual que, cuando se solicite información referida a la semana pasada o hace dos semanas, se tienda a dar estimaciones promedio o típicas, más que intentar recordar. Por esta razón, cuanto más proximidad tenga en el tiempo, mejor. Para Converse y Presser (1994), las preguntas de "promedio" (por término medio) o las concernientes a un día típico, suelen resultar más útiles que cuestiones relativas a un día concreto. Para ayudar al recuerdo, estos autores también aconsejan: • Estrechar el período de referencia al pasado más inmediato (como la o-ayer .-=-= tir'1!j-ernjiftx;=fa-semtttta-ptlsttlltl,· ·,¡;retdim=usteá=al---e:c2 gún ejercicio físico? En caso afirmativo, ¿Qué tiempo dedicó? • Tomar como referencia acontecimientos o fechas importantes del calendario, para datar acontecimientos de la vida personal. Por ejemplo, Desde su último cumpleaños, ¿ha recibido usted algún regalo? • Preguntar por acontecimientos que han sucedido en los últimos seis meses.

Después, puede incluso remontarse "más allá". No obstante, ha de insistirse en que esta estrategia de distanciamiento progresivo en el tiempo sólo se aconseja en eventos de cierta notoriedad para el encuestado. Fowler (1998) propone un procedimiento sencillo para mejorar la capacidad de que los encuestados ubiquen acontecimientos en el pasado: mostrarles un calendario con el período de tiempo (sobre el que se pregunta) subrayado.

cuestionario antes de responder. El listado ha de ser lo más exhaustivo posible, incluyendo las distintas opciones posibles. Por ejemplo, en la pregunta ¿Qué hace usted para relajarse? Mostrar una tarjeta que comprenda distintas actividades lúdicas (ir al cine, ir de compras, dar un paseo, montar en bicicleta, leer, ver la televisión, escuchar música, hacer yoga, darse un baño o ducha, dejando espacio para que se indique otras, si se practican) y preguntar si se realizan o no.

Este proceder se sigue bastante en encuestas de audiencia, de hábitos de lectura y de actividades lúdicas en general. Contribuye a la reducción del número de acontecimientos omitidos, pero puede favorecer los efectos de "telescoping", situándolo en una fecha más reciente que en realidad ocurrió. En acontecimientos documentados (como gastos, atención sanitaria) puede pedirse al encuestado que consulte la documentación que precise para responder (Bradburn, 1983). También puede recurrirse a viñetas, cuando se quiera que el encuestado realice juicios, explícitos o implícitos, sobre el alcance de fenómenos complejos (Martin y Polivka, 1995). d) Realizar varias preguntas, referidas a la misma cuestión, para aumentar la probabilidad de su recuerdo. A este respecto, Dex (1995/2002) aconseja que, ~lla!l40se quiera fechar deterrninadoseventos, aql1ellos de más difícil recuer-

".2.2. El formato de la pregunta: abierto versus cerrado i'> En el cuestionario, la pregunta puede aparecer en un formato abierto o cerrado, de; pendiendo de si aparecen expresas las alternativas de respuesta.

'freguntas abiertas fgi~>;

Las preguntas abiertas son aquellas en las que no se menciona ninguna opción de , ..respuesta. El encuestado puede expresarse en sus propios términos, no circunscribiendo su respuesta a unas alternativas predeterminadas.


..ii!!4.'P.J..t..¡~

242

UNIVERSIDAD

Métodos de encuesta

ALBERTO HURTADO BIBLIOTECA

Capítulo 4: El diseño del cuestionario

243

.

berse a que en la elaboración de la pregunta cerrada no se incluyeron todas las alternativas de respuesta posibles. También a que, al mencionar unas alternativas concretas, se está influyendo en la respuesta del encuestado, llamando incluso su atención en aquellas respuestas en las que antes no habían pensado. La sugerencia puede incluso llevar a modificar su pensamiento inicial.

En su opinión, ¿cuál es el principal problema que más preocupa a los españoles en la actualidad? .

e) Permiten captar lo más "saliente" para el encuestado. Lo primero que le viene a la mente.

¿Qué le gustaría hacer las próximas Navidades?

Cuando se habla de inmigrantes extranjeros que viven en España, ¿en quiénes piensa usted de manera inmediata? .

Esta "libertad" concedida al encuestado en la respuesta conlleva unas ventajas y unos inconvenientes que hay que valorar. Entre las ventajas de la pregunta abierta destacan las cinco siguientes:

a) Son más fáciles de elaborar que las preguntas cerradas. No exigen un conocimiento previo sobre el tema. b) Ocupan menos espacio en el cuestionario. De gran interés cuando existan límites de espacio. c) Permiten a los encuestados responder con sus propias palabras, no sugiriéndoles ningún tipo de respuesta. En cambio, cuando se les pide que elijan alguna de las opciones de respuesta predeterminadas, pueden sentirse forzados a dar una respuesta que no se ajusta, exactamente, a lo que dirían si la pregunta fuese abierta. Además, puede introducir "matices", que ayuden a interpretar su respuesta. El punto de vista de los investigadores más experimentados es que las preguntas cerradas producen respuestas más relevantes y comparables, pero que las preguntas abiertas

producen las respuestas más completas y "profundas", que reflejan más adecuadamente matices de significado que se pierde forzando al respondiente en una serie bastante prieta de respuestas alternativas (Bradburn, 1983: 299).

d) Pueden obtenerse respuestas no anticipadas, no previstas o inesperadas, cuando se diseñó el cuestionario.

Si quiere conocerse la impresión más saliente de un programa, una pregunta abierta sobre impresiones es mejor que una lista chequeada de respuestas posibles (Henerson y otros, 1987: 61). Preguntas como, por ejemplo, "¿Qué piensa sobre... ?", "¿A qué se refiere con...?", conceden a los encuestados libertad para pronunciar cualquier idea que puedan pensar. "Sus respuestas son libres, abiertas, ilimitadas. No establece alternativas definid~s y el sujeto las responde en sus propias palabras" (Payne, 1980: 33). Ahora bIen, cuando el cuestionario sea rellenado por un entrevistador ?abrá que insistirle que escriba exactamente lo que dice el encuestado y que no mtroduzca ninguna modificación en lo que dicen (su verbatim). Pese a sus amplias posibilidades, las preguntas abiertas no predominan en los S~b~e todo, en los elaborados por empresas privadas de opinión pública. se debe, ~~mclpalmente,a su mayor coste (económico y temporal) y a problemas comparabI1Idad de las respuestas. En general, los inconvenientes principales detectados en las preguntas abiertas son:

a) ~ás caras que las preguntas cerradas. Requieren un mayor esfuerzo en su regIstro (por parte del entrevistador o del propio encuestado, en encuestas autorrellenadas), trascripción y codificación posterior. Como indica Payne (1980' 53-54): . Pocas pe~s~nas empl~an las mismas palabras incluso para expresar la misma idea. Algunos clanfican sus afirmaciones mejor que otros. Esto hace la grabación difícil cuando queremos distinguir entre dos ideas estrechamente relacionadas pero aun así diferentes.

Por ejemplo, ante estos dos formatos de pregunta:

• Abierta: ¿Qué le gusta más de la Universidad?

..

• Cerrada: Del siguiente listado de cosas generalmente mencionadas como positivas de la Universidad, ¿cuál le gusta a usted más?

Lo más probable es que el formato abierto recoja respuestas no consideradas en la redacción de la pregunta cerrada, obteniéndose respuestas no coincidentes. Puede de-

Esta dificultad se extiende a la codificación de las respuestas. En especial, c.uando en la respuesta aparecen palabras que pueden tener más de un signifIcado. l!na v~z concluid? el trabajo de campo, a menos que se utilice elpretest del cuestIonano para el.clerre de las preguntas abiertas, se procede a la codificación de las respuestas abIertas. Para este propósito lo habitual es extraer una muestra aleatoria de los cuestionarios completados. La muestra suele oscilar entre


244

Métodos de encuesta

el 20 y el 50% del total de cuestionarios (Bourque y Clark, 1994). Varias personas, a ser posible, se encargan de transcribir, literalmente, las distintas respuestas emitidas. Buscarán "términos comunes", que permitan su agrupación en un número reducido de categorías de respuesta. El número de categorías dependerá de: • La variabilidad de las respuestas. • Los objetivos de la investigación. Si se quiere una mayor especificación en la respuesta o, por el contrario, se prefiere su síntesis en un número reducido de categorías genéricas. Cada categoría debe incluir un número considerable de respuestas similares. Su contenido dictará el nombre (o etiqueta) que se dará a la categoría de respuesta. Categorías que han de cumplir los requisitos comunes a la Codificación de preguntas cerradas: exhaustividad, exclusividad y precisión (como después se verá). A cada categoría se le asignará, como en cualquier proceso de medición, un código numérico, que facilitará su análisis estadístico posterior. b) Más expuesta a errores de registro y de traducción de la información, a una mayor subjetividad en su interpretación. El entrevistador (cuando el cuestionario no sea autorrellenado) ha de anotar, literalmente, la respuesta del encuestado. No debe introducir ninguna modificación que pudiera alterar su significado. Esto, obviamente, supone una mayor duración de la entrevista que únicamente marcar una o varias de las alternativas de respuesta dadas en una pregunta cerrada. Asimismo, los codificadores deben procurar proporcionar etiquetas que se ajusten al significado común de las respuestas agrupadas. Además, no se ha de simplificar o reducir en exceso la respuesta del encuestado. A veces, cuando las preguntas abiertas ab:allllCO de cuestiones dispares, el recurso al análisis de cone las respuestas. c) Más susceptibles a errores de medición, provocados por la actuación del entrevistador. Mayor dificultad para alcanzar uniformidad en su actuación: cómo formula las preguntas y cómo anota las respuestas. d) Su contestación exige más tiempo y esfuerzo por parte del encuestado. Tanto que su uso se desaconseja en cuestionarios autoadministrados (Dillman, 1978). El tener que escribir la respuesta, sobre todo si se le pide una respuesta muy detallada y extensa, puede desmotivarle y llevarle a no contestar la pregunta (habiendo una mayor no respuesta de ítem) o a hacerlo con una excesiva brevedad. En la encuesta telefónica, que carece del contacto visual entre el entrevistador y el entrevistado, también se ha constatado que las respuestas a preguntas abiertas tienden a ser más breves y simples que en las entrevistas cara a ca-

Capítulo 4: El diseño del cuestionario

245

ra. L~ razón ~stá, de acuerdo con Biemer y Lyberg (2003: 142), en que "los respondlentes henden a ser menos conversacionales en una entrevista telefónica que en una entrevista cara a cara". La mayor dificultad de la comunicación a través del hilo telefónico ya fue comentada en el capítulo 2, donde se señalaban las ventajas y los inconvenientes que ofrece este canal de comunicación. e) Los encuestados pueden dar respuestas irrelevantes o no acordes con la intenc~onalidad de fa pregunta. O, como indica Payne (1980: 51), "algunos se negaran a establecer sus observaciones más pertinentes simplemente porque parecen tan obvias". Por ejemplo, si se pregunta la razón por la que compraron una botella de aceite por O'~O euros, en vez de 1,~0 euros, ~uchos no dirán que es para ahorrar dinero. Tal vez podna encontrarse que solo un 40 Yo de las respuestas lo mencionan. Otros simplemente pueden optar por decir "porque lo prefiero" o "porque sÍ, eso es todo".

f) Mayor ~ificultad para modificar tendencias. Davis y Smith (1992) destacan la mayor dificultad de mantener reglas de codificación sutiles a lo largo de los años. Por estas razones -tiempo, coste, variabilidad del entrevistador, variabilidad del respondie?te, problemas ~e codificación y de análisis- el investigador es generalmente bien aconsejado, en cualqUIer encuesta a gran escala, a que cierre tantas preguntas como sea posible (Sheatsley, 1983: 208).

Pese a estas limitaciones, las preguntas abiertas muestran ser de gran utilidad: a) ~~ estudios exploratorios, cuando no se dispone de un conocimiento previo suflclente del tema que se investiga. A veces puede utilizarse el pretest como una pri~era apr.oximació.~ exploratoria al tema de estudio y, después, proceder, a parhr de la mformaclOn recabada, al cierre de la pregunta. ..... Quizá~·el-~ás íl1ipor~anú:uso .de preguntas· abíértas es en pretestar pregunta.s cuando el mvestIgador qUIere explorar muchas dimensiones de un tema y está inseguro exactamente de qué preguntas realizar. El uso extensivo de preguntas abiertas con muestras pequeñas ~~ede permitir al investigador desarrollar mejores preguntas cerradas que, cuando sea utIlIzada en muestras más grandes, obtendrá los mejores resultados (Bradbum, 1983: 302).

b) Cuando el investigador no prevé todas las posibles respuestas a una cuestión determinada. ésta precise de la enumeración de un listado extenso de respues~as, o complejo para presentarse a los encuestados. De especial releva~cla, en encuestas telefónicas, en las que no puede acudirse al empleo de t~rJeta~ de respuesta. 0, sencillamente, se quiera ahorrar espacio en el cuestIOnano.

°


246

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

En la última semana, ¿cuál ha sido la noticia que más ha llamado su atención?

247

.

Para estas cuestiones es preferible el formato de pregunta abierto porque amplía las respuestas posibles, no circunscribiéndolas a las propuestas por el investigador. Además, hace innecesario el uso de ayudas visuales, que faciliten la retención de lás alternativas de respuesta, por lo que se adecua a las encuestas cara a cara y telefónica. d) Cuando se desea una mayor especificación de una respuesta dada con anterioridad. "Probablemente éste es el tipo de pregunta abierta más habitual en la encuesta" (Payne, 1980: 37). Suele seguir a una pregunta cerrada y se redacta con pocas palabras: "por qué", "cuáles", "cómo". Si bien, se desaconseja el uso reiterado de estas preguntas abiertas a lo largo del cuestionario porque pueden cansar al encuestado e, incluso, resultarle impertinente. Conviene no abusar. Así lo constata Becker (1998: 58-59), quien recomienda el uso preferente de "¿cómo?" a" ¿por qué?". La primera incomoda menos al entrevistado en el transcurso de la entrevista. Su reflexión es la siguiente:

¿ Qué le gustaría hacer ahora? . ............................................................................................................................................... ¿Qué programas de televisión ha visto usted el pasado fin de semana? .. ...............................................................................................................................................

o

en preguntas referidas a nivel de estudios y ocupación, cuando se opta por un formato de pr~gunta abierta para obtener una mayor concreción. Com? ~ucede en las encuestas de~ CIS. En su estudio n.O 2.214, estas variables aparecen con los siguientes formatos de pregunta.

P43a .Cuáles son los estudios de más alto nivel oficial que Ud. ha cursado (con in. ~ependencia de que los haya terminado o no)? Por favor, esp~ci!ique lo '}1ás posible, diciéndome el curso en que estaba cuando los termmo (~ los ¡~te­ rrumpió), y también el nombre que tenían ento~ces esos est~d¡os (ej.~ 3 años de Estudios Primarios, Primaría, 5. º de Bachillerato, Maestna Industnal, Preuniversitario, 4. de EGB, Licenciatura, Doctorado, FP1, etc.).

º

(ENTREVISTADOR: Si aún está estudiando, anotar el últi~o curso q~e haya completado. Si no ha completado la Primaria, anotar el numero de anos que asistió a la escuela.) CURSO . NOMBRE (de los estudios) . ......................................................................................................................... NIVEL (Codificar según T. ESTUDIOS) ..

P46. ¿ y cuál es/era su actual/última ocup~ción u ?ficio? E~ deci~, ¿en qué. ~onsis­ te/consistía específicamente su trabaJo? (Precisar lo mas pOSible las actividades realizadas. EJEMPLO: mecánico reparador de automóviles, ayudante de odontología, profesor de enseñanza primaria, etc.). Nos re~~rimos .a su ocupación principal: aquella por la que Ud. (o el cabeza de famJl¡a) obtiene/obtenía mayores ingresos.

Yo primero comprendí que "¿cómo?" era mejor que "¿por qué?", como resultado de hacer trabajo de campo. Cuando entrevisté a personas preguntándoles "¿por qué?", les provocaba una respuesta defensiva. Si les preguntaba por qué habían hecho alguna cosa particular en la que estaba interesado -¿"Por qué se convirtió en médico?", "¿Por qué eligió esa escuela para enseñar?"- el entrevistado entendía mi pregunta como una petición de justificación, para una buena y suficiente razón para la acción sobre la que estaba indagando. Respondían a mi pregunta" ¿por qué?" brevemente, a la defensiva. Como si dijeran "de acuerdo compadre, ¿eso es suficientemente bueno para ti?". Cuando, por otro lado, preguntaba cómo había ocurrido algo -" ¿Cómo se te ocurrió meterte en esa línea de trabajo?", "¿Cómo dejaste de enseñar en esa escuela?"-mÍ pregunta "funcionaba" bien. La gente la respondía en extensión, me contaba historias llenas de detalles informativos, me daba explicaciones que incluían no sólo sus razones para lo que habían hecho, sino también las acciones de otros que habían contribuido al resultado sobre lo que estaba indagando.

P31. ¿ Recomendaría este Centro a un familiar o amigo? Sí No

c) Cuando se busca una respuesta inmediata, no influida, y quieran identificarse prioridades o preferencias. Por ejemplo,

1 2

[

En la actualidad, ¿qué es lo que más le preocupa?

.

..................................................................................................................................................

P31a. ¿Porqué?

.


248

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

P38. ¿Ha participado Ud. En la organización de alguna de las actividades del Centro?

[

1

No

2

P38a. ¿En cuáles? .. ......................................................................................................................

e) Si quiere conocerse el valor numérico exacto de una variable. Por ejemplo, ¿Cuántos años tiene?, la pregunta se deja abierta para pemútir la grabación exacta del valor numérico y no unos valores (códigos de respuesta) que le represente a él y a otros valores agrupados en un intervalo. Ello permite una mayor precisión en la estimación de la media aritmética y demás estadísticos univariables, bivariables y multivariables, como se verá en el capítulo 6. Si sólo quiere clasificarse a los encuestados utilizando estas variables (por ejemplo, edad) como variable de clasificación, en la fase de análisis, se procede a su agrupación en intervalos, de acuerdo con las respuestas obtenidas.

¿Cuántos años cumplió Ud. en su último cumpleaños? ¿Cuántas horas, por término medio, dedica al día

a la lectura?

. ..

249

En el tratamiento de temas delicados, en particular, cuando se está interesado en la frecuencia de la conducta, como ya se ha mostrado. Así, por ejemplo, Bradburn y Sudman (1979) obtuvieron más mención de conductas sensitivas (consumo de bebidas alcohólicas, prácticas sexuales ilícitas) en preguntas abiertas que cerradas. En su favor está el pemútir a los encuestados describir su conducta con sus propias palabras, pudiéndose conseguir respuestas "espontáneas" y términos propios"que etiqueten su conducta. Con posterioridad, Sudman, Bradburn y Schwarz (1996), al igual que Biemer y Lyberg (2003), insisten en la recomendación de utilizar preguntas abiertas en la obtención de frecuencias conductuales. Debido a que los encuestados a veces emplean el rango de alternativas de respuesta numéricas como marco de referencia en la estimación de la frecuencia de su propia conducta. Si ven su conducta como "típica", pueden seleccionar un valor cercano a la alternativa del medio, sin intentar asegurar más adecuadamente la frecuencia verdadera de su conducta, lo cual puede resultar en un error sistemático. Además, como las respuestas son numéricas y no categóricas, pueden grabarse, como ya se ha dicho, directamente en el ordenador. Esto significa que no precisan del tedioso procedimiento posterior del cierre de preguntas abiertas. No obstante, en algunas cuestiones sensitivas, como las referidas a renta, Dillman (1978) observa que los encuestados proporcionan una información más sincera cuando se les ofrece una serie amplia de categorías de respuesta en un formato cerrado más que si se les pide la cantidad exacta (en una pregunta abierta). g) En la consecución de empatía o "rapport" con el encuestado, ofreciéndole la oportunidad de responder como él quiera. Ya sea al principio del cuestionario, ya tras una serie de preguntas cerradas para ofrecer a los entrevistados una ocasión de expresarse con sus propias palabras, pudiendo así dar una respuesta más matizada. Por ejemplo, Dígame, por favor, ¿qué piensa sobre la actualprogramación de Televisión Española?

Dígame, por favor, el número de personas que viven en la actualidad en esta vivienda contándose usted . Año de nacimiento

reguntas cerradas

..

En encuestas autoadministradas este tipo de preguntas abiertas numéricas pueden figurar en el cuestionario seguidas de una línea o de cuadrados. Los cuadrados tienen la ventaja de indicar el número de dígitos que se solicita.

Año

Mes

LO

19

LO CIIJ

¿Cuántos metros cuadrados tiene su vivienda?

También denominadas precodificadas o de respuesta fija. Son preguntas cuyas respuestas ya están acotadas cuando se diseña el cuestionario. El investigador determina, previamente, cuáles son las diversas alternativas de respuesta posibles a una \cuestión determinada. El encuestado se limita a señalar cuál o cuáles (si la pregunta es . múltiple), de las opciones dadas refleja su opinión o situación personal. Las respuestas se listan verticalmente. A cada una de ellas se adjunta un número. Ese número constituye el código numérico, que facilitará tanto la transferencia de la respuesta verbal a un fichero de datos informatizado como su posterior análisis estadístico. Ello repercute en una mayor exigencia de rigor y de exhaustividad en su formulación.


250

Métodos de encuesta

El investigador deberá documentarse (con anterioridad a la redacción de la pregunta) sobre las distintas alternativas de respuesta existentes a la cuestión que se pregunta. Las distintas categorías u opciones de respuesta deberán, asimismo, cumplir los requisitos de exhaustividad, exclusividad y precisión, exigidos en cualquier proceso de medición. Porque, como afirman Schuman y Presser (1981: 299), los encuestados generalmente "juegan por las reglas del juego". Eligen entre las alternativas de respuesta ofrecidas para la pregunta cerrada, más que ofrecer una respuesta no incluida en la serie dada. Quiere esto decir que: a) Las categorías diferenciadas en la variable han de comprender el mayor número de atributos para satisfacer el requisito de exhaustividad. El propósito es que ninguna observación quede sin poder clasificarse. Por eso la recomendación de incluir la opción de respuesta "otros",cuando se prevea la posibilidad de que existan otras opciones de respuesta distintas a las enunciadas en la pregunta. A esta opción se la dotará de espacio suficiente que facilitar su especificación. b) Las categorías de respuesta también han de cumplir el requisito de exclusividad. Es decir, han de ser mutuamente excluyentes y no solaparse, de forma que cada observación sólo pueda clasificarse en un atributo. Debe evitarse que un mismo encuestado escoja más de una opción de respuesta, salvo que la pregunta sea múltiple. Para evitarlo, han de meditarse las distintas alternativas de respuesta dadas y preguntarse si es posible que alguien escoja más de una. Si fuese necesario, poner expresamente la instrucción "escoger sólo una". Téngase además presente que las "alternativas de respuesta" pueden contribuir a errores de comprensión. Sobre todo, cuando es habitual utilizar las opciones de respuesta como ayuda en la interpretación de la pregunta. c) El requisito de precisión concierne a la exigencia de realizar el mayor número de distinciones posible. Ello contribuye a la consecución de una información más precisa. Tiempo habrá para agrupar las distintas categorías o valores de las variables. Generalmente, después de haberse recabado la información (en la fase de análisis), a la vista de la frecuencia que presente cada atributo de la variable. Pero, por el contrario, nunca será factible desglosar los atributos después de la obtención de los datos.

Para ilustrar la inclusión de la opción de respuesta abierta "otros" y demás formatos de pregunta cerrada, se toman preguntas incluidas en el estudio del CIS n.º 2.221, tal y como figuran expresas en el cuestionario (a excepción del tipo de letra, que se ha modificado para diferenciar más la pregunta de las opciones de respuesta).

Capítulo 4: El diseño del cuestionario

251

P.7. ¿ Trabajas (o trabajabas) como ..... ? (MOSTRAR TARJETA A)

- Asalariado fijo (a sueldo, comisión, jornal, etc., con carácter fijo) . - Asalariado eventual o interino (a sueldo, comisión, jornal, etc., con carácter temporal o interino) - Empresario o profesional con asalariados - Profesional o trabajador autónomo (sin asalariados) - Ayuda familiar (sin remuneración reglamentada, en la empresa o negocio de un familiar) - Miembro de una cooperativa - Otra situación, ¿cuál? _

1 2 3 4 (40) 5 6 7 9

- N.C

P.33. Pasando ahora a cuestiones más generales. De los siguientes objetivos sociales por los que la gente suele decir que merece la pena luchar, ¿cuáles consideras, personalmente, los más interesantes? (MOSTRAR TARJETA 1) (MÁXIMO CUATRO RESPUESTAS)

-

La prevención del SIDA La prevención de la delincuencia La ayuda a los enfermos y a los minusválidos La defensa del medio ambiente La prevención de la droga La lucha contra el racismo La ayuda a los más necesitados, los pobres Los derechos de los jóvenes Las causas humanitarias en el mundo (hambre, víctimasde guerra) La integración de los inmigrantes La acción a favor del Tercer Mundo Otra, ¿cuál? N. S N.C

01 02 03 04 05 06 07 08

_

(131) (132) (133) (134) (135) (136) (137) (138)

09 10 11 98 99

P.34. Y, refiriéndonos a nuestro país, de las siguientes posibles metas a conseguir, ¿cuál te parece la más importante de todas? (MOSTRAR TARJETA J) (ELEGIR SÓLO UNA)

-

Que en España haya justicia Que en España haya orden Que en España haya libertad.......................................................... Que en España haya desarrollo económico.................................. Que en España haya paz Que en España haya trabajo N.S N.C

1 2 3 4 (139) 5 6 8 9


252

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

P.35. En líneas generales, ¿la sociedad española te parece muy justa, justa, injusta o muy injusta?

_ _ _ _ _ _

Muy justa Justa.................................................................................................... Injusta................................................................................................. Muy injusta........................................................................................ Justa en unas cosas e injusta en otras (NO LEER) N.S N.C

1 2 3 4 (140) 5 8 9

(217) (218) Dcha.

N.S. 98

Por ejemplo, en la variable "clase social", medida con cinco categorías: alta, mediaalta, media, media-baja y baja; debería aplicarse una escala numérica, en consonancia con el nivel de estatus correspondiente. El código numérico más bajo, el "1", se aplicaría a la categoría "clase social baja". En cambio, el más elevado, el "5", a "clase social alta", y no a la inversa. Lo mismo cabe decir de los dos ejemplos siguientes:

Extrema izquierda Izquierda Centro Derecha.................................................. Extrema derecha ··

¿Cómo calificaría Ud. su situación económica?

Podría indicar, aproximadamente, ¿cuántos cigarrillos fuma Ud. al día?

Esta última pregunta es más precisa que el formato tradicional de una variable ordinal en siete categorías de respuesta ymás que si se limita a cinco. Después, en la fase d~ an.álisis p~­ drá procederse a la agrupación de categorías inclusive en sólo tres, para la realización de tipologías (por ejemplo, izquierda, centro y derecha). 1 2 3 4 5 6 7

b) El código numérico asignado es conveniente que tenga correspondencia con el significado de la respuesta. Sobre todo en variables ordinales (clase social, nivel de estudios, de ocupación), para posibilitar su tratamiento estadístico como variable continua.

N.e. 99

01 02 03 04 05 06 07 08 09 10

Extrema izquierda Izquierda Centro izquierda.................................. Centro................................................... Centro derecha Derecha Extrema derecha

a) Asignar los mismos códigos numéricos a las mismas respuestas. Por ejemplo, codificar la respuesta "Sí" con el número "1", "No" con el "2". Es habitual que las respuestas "no sabe" se codifiquen con los números "8", "98" o "998", dependiendo de cuántos dígitos correspondan a la pregunta, en función del número de respuestas posibles. La respuesta "no contesta" como "9", "99" o "999". En algunas circunstancias l'uede optarse por reservar el "O" para designar la no respuesta de ítem.

P.5t. Cuando se habla de política se utilizan normalmente las expresiones izquierda y derecha. En esta tarjeta hay una serie de casillas que van de izquierda a derecha. ¿En qué casilla te colocarías? (MOSTRAR TARJETA ESCALA) (PEDIF3 AL ENTREVISTADO QUE INDIQUE LA CASILLA EN LA QUE SE COLOCARlA Y REDONDEAR EL NÚMERO CORRESPONDIENTE)

Izda.

253

1 2 3 4 5

En los ejemplos ilustrados se ha podido ver que las preguntas y las categorías de respuesta aparecen ordenadas en sentido vertical. Cada opción de respuesta va acompañada de un número. Éste es el código que representa a la categoría de res~uesta a todos los efectos analíticos. Respecto a la codificación de las respuestas conviene seguir las tres pautas a continuación:

-

Sólo 1 02..................................... Menos de medio paquete........... Un paquete diario....................... Alrededor de paquete y medio. Dos o más paquetes....................

1 2 3 4 5

-

Pésima.......................................... Mala.............................................. Regular Buena........................................... Muy buena...................................

1 2 3 4 5

c) Los códigos numéricos suelen figurar a la derecha de cada opción de respuesta para facilitar el trabajo del codificador. Si bien, en los cuestionarios para ser autorrellenados suele ponerse a la izquierda de la respuesta, para evitar que el encuestado se equivoque. Cuando se pone a la derecha suele quedar espacio en blanco entre la respuesta y su código numérico, pudiendo provocar equívocos, a menos que se pongan puntos suspensivos. En cambio, si el número figura a la izquierda, se deja el espacio a la derecha de las respuestas "libre" por si el encuestado quiere realizar alguna aclaración sobre las respuestas. Los números que figuran en los ejemplos ilustrados entre paréntesis corresponden a la columna o columnas que ocupará la pregunta en la matriz de datos. Cuando la pregunta incluye un número de respuestas inferior a diez, ocupará una sola columna. Excepto que se trate de una pregunta múltiple, en cuyo caso el número de columnas dependerá del número de opciones de respuesta que se permitan: dos, tres e inclusive todas, cuando se pide al encuestado que ordene las opciones de respuesta de más a menos o de menos a más, según su opinión en el tema en cuestión.


254

Capítulo 4: El diseño del cuestionario Métodos de encuesta

EJEMPLOS DE PREGUNTAS

CE~RADASMÚLTlPLES

P. 11. De las siguientes maneras de invertir dinero, ordénelas de acuerdo con sus preferencias. (Respuesta múltiple.) (MOSTRAR TARJETA A) (18-24)

-

En cuenta corriente . En libreta a plazo fijo . En Deuda Pública o en Bonos del Estado . Invertir en Bolsa . En fondos de pensiones . Compra de vivienda . Compra de joyas u obras de arte . Otras (Especificar) . ....................................................................................

P.12. ¿Qué cualidades, de las siguientes, admira Ud. más en una persona. (Respuesta múltiple). (SEÑALAR SÓLO TRES). (MOSTRAR TARJETA B)

_ _ -

Lealtad Respeto o o ········ o. o ooo o...... Sinceridad o o. oo................... Tolerancia Amabilidad Simpatía Entrega o,... Perseverancia Humildad Comprensión Sociabilidad o•• o... •.• Sencillez o ••••••••••• • o

O"

o

o

o

01 02 03 04 05 06 07 08 09 10 11 12

(25-26) (27-28) (29-30)

La primera pregunta pide que se ordenen las categorías de respuesta. Cuando se busque una ordenación, hay que especificarlo en la pregunta indica~do la fo~m~ de proced:r;, Por ejemplo, escriba "1" junto a la categoría de respuesta que considere mas Importa~te.; 2, en la segunda más importante; y así hasta la última. Advié~ase q~e, en vez d~ por codl~o~ numéricos, las respuestas aparecen acompañadas de una linea. Este es el mejor procedimiento para evitar confusiones entre unos códigos numéricos y otros.

Cuando la pregunta incluye más de 10 alternativas de respuesta, pero menos de 100, ocupa dos columnas. Si supera los tres dígitos, pero es menor de 1.000, serán tres las columnas asignadas, y así sucesivamente. Además obsérvese que en muchas preguntas (de las ilustradas) se especifica si la pregunta ad~te una única respuesta o varias. Cuando se admiten dos o más respuestas,

255

se está ante una pregunta cerrada múltiple. En cuyo caso, habrá que dar instrucciones eXlpresas (entre paréntesis, en mayúsculas, cursiva u otro tipo de letra diferente a la utien el enunciado de la pregunta) de cuántas opciones de respuesta se admiten, se establecen límites de cantidad. También, conviene especificar la manera de inu!"a••", como se hace en la pregunta, de las ilustradas, referida a ideología política. Esta última recomendación es forzada en los cuestionarios autorrellenados. En ellos siemdeben darse instrucciones de cómo contestar la pregunta. Por ejemplo, "ponga una cruz en la casilla correcta", "rodee con un círculo la respuesta elegida", "elija sólo una respuesta", "señale como máximo tres respuestas". Y ello en un tipo de letra que destaque del resto de la pregunta. Estas instrucciones han de figurar tantas veces como se estime necesario, para evitar que el encuestado no sepa cómo debe responder la pregunta y opte por no contestarla o lo haga mal.

Asimismo, adviértase que cuando la pregunta incluye muchas alternativas de respuesta, en la encuesta cara a cara es habitual, y lo más aconsejable, el recurso a tarSu uso posibilita la visualización de las distintas respuestas posibles por parte del entrevistado antes de contestar a la pregunta, no teniendo que retener en la memoria las alternativas de respuesta. No obstante, se recomienda que, cuando se muestre una tarjeta de respuestas, el entrevistador lea las respuestas que en ella figuren expresas, para evitar molestar al encuestado. Principalmente, cuando se entrevista a poblaciones con dificultades para la lectura, por problemas de visión o simplemente de lectura. Respecto a las opciones de respuesta, existen además tres cuestiones que conviene considerar: a) El número de categorías de respuesta a diferenciar. Aunque anteriormente se ha insistido en la necesidad de cumplir el requisito de precisión (hacer el mayor nú-

mero de distinciones posibles), a veces se plantea la limitación de las alternativas de respuesta. Sobre todo, en encuestas telefónicas, en las cuales no puede recurrirse a tarjetas de respuesta, obligando al entrevistado a su retención memorística. En este contexto, se aconseja limitar el número de categorías de respuesta alternativas a no más de cinco, para asegurarse de que el entrevistado retenga las distintas alternativas de respuesta antes de contestar. A veces incluso se plantea la conveniencia de rotar el orden de lectura de las alternativas de respuesta, cuando se prevea que su disposición pudiera afectar a la misma. En especial, el efecto de respuesta llamado de recencia (el elegir la última respuesta mencionada), más probable en la encuesta telefónica, como se vio en el apartado 4.2. Pero, igualmente, el de primacía, es decir el elegir la primera respuesta mencionada, se ajuste o no a la realidad, desatendiéndose del resto. También, en la medición de estados subjetivos (opiniones, actitudes, valores), como se verá en el subapartado 4.2.3. Lo más habitual es diferenciar cuatro o cinco alternativas de respuesta. Depende de si se incluye o no una op-


256

Métodos de encuesta

ción de respuesta intermedia ("ni de acuerdo ni en desacuerdo", "indiferente", "ni satisfecho ni insatisfecho"). Por ejemplo, muy de acuerdo "4", bastante de acuerdo "3", poco de acuerdo "2", nada de acuerdo "1". Más de cinco categorías no resulta conveniente. Sobre todo, más de siete, porque se genera la dificultad de "matiz" y una peor diferenciación, en la interpretación, de unas alternativas respecto de otras.

Lo que sí parece deseable es que, siempre que sea posible, no limitar las opciones de respuesta a menos de tres, aunque muchas preguntas constituyan "dicotomías naturales" (como designa Sheatsley, 1983). Por ejemplo, ¿Tiene usted un ordenador? Sí! No. Es bastante habitual que las preguntas dicotómicas ofrezcan poca información o una pobre distribución de respuesta. Sheatsley (1983: 209) lo ilustra con el siguiente ejemplo:

Si se pregunta ¿Está usted satisfecho o insatisfecho con el cuidado médico que recibe?, sólo cerca del 20% de una muestra nacional expresará insatisfacción; la gran mayoría dirá que están satisfechos. Esto no es irrazonable porque la gente con frecuencia es reticente a criticar a los doctores y a otros expertos. Pero si se pregunta ¿ Cómo de satisfecho está usted con el cuidado médico que recibe: muy sati4echo, algo satisfecho o no muy satisfecho?, la distribución marginal aparecerá: 50% muy satisfechos, 35% algo satisfechos y 15% no satisfechos. Los dos primeros grupos que llegan a combinarse en la versión dicotómica pueden bien parecer bastante diferentes en términos de sus características, conducta y otras actividades.

Es mejor clasificar a la población en un número mayor de categorías y, después, en la fase de análisis proceder a su agrupación, si fuese necesario. b) La inclusión de una alternativa de respuesta intermedia. Si la hace explícita o no. Es decir, sólo registrarla, si es mencionada de forma espontánea por el entrevistado (cuando la encuesta sea mediante entrevista). El ofrecer explícitamente una alternativa intermedia suele resultar en un aumento de valoraciones "neutras", que pueden no ajustarse a la realidad, provocando errores de medición. Puede ser un escape fácil ante una elección difícil, que no guste, o simplemente porque no se quiere meditar la respuesta o manifestarse claramente. En especial, en cuestiones delicadas o sensitivas. En un estudio experimental comparativo en Estados Unidos y Alemania, Bishop y colaboradores (1988) observaron que los encuestados son mucho más probables a seleccionar una alternativa de respuesta intermedia, cuando ésta se ofrece explícitamente. Este efecto se da tanto en encuestas autoadministradas como en las telefónicas. En experimentos anteriores. llevados a cabo por Kalton, Roberts y Holt (1980), el incremento se cifró entre el15 y el 49% de las respuestas. Schuman y Presser (1981!l996) lo reducen entre el 10 y el 20%. Para Converse y Presser (1994), cuando se ofrece una alternativa de respuesta intermedia, el 20% de los encuestados la escogen, pese a no ser ésta la alternativa que habrían elegido, si no se hubiese ofrecido en el enunciado de la pregunta.

Capítulo 4: El diseño del cuestionario

257

e) El explicitar las opciones de no respuesta: "no sabe/no contesta". Normalmente se recomienda su no inclusión expresa en la pregunta, salvo que se estime de interés en su formulación. Por ejemplo, cuando se quiera captar la inexistencia de datos o de opinión sobre una cuestión determinada. La experiencia muestra que éstas constituyen opciones de respuesta muy recurridas, cuando el encuestado no quiere pensar o manifestar una respuesta concreta (o sea, "descubrirse"). Este problema se evidencia más en cuestionarios autoadministrados. El encuestado puede visualizar la alternativa de no respuesta y elegirla sólo por no pensar en la respuesta o por quererla ocultar. Schuman y Presser (1979a) analizaron los efectos de ofrecer explícitamente la alternativa de no opinión, como una opción de respuesta, en preguntas referidas a actitudes ante los líderes políticos de varios países. Cuando se ofrecía como alternativa de respuesta un 20% más de encuestados la mencionaban que cuando no se ofrecía de forma explícita. Con posterioridad, Gilljam y Grandberg (1993) observan, en un estudio para medir las actitudes hacia la energía nuclear, que, cuando se ofrecía, un 15% de los encuestados la escogían. Si no se mencionaba, el porcentaje que la elegía, de forma espontánea, descendía al4 e, incluso, aI3%. La mayoría de los encuestados que inicialmente dijeron "no sé" acabaron dando respuesta a dos preguntas posteriores y relacionadas con la anterior (con aquella que dijeron no tener opinión).

En los cuestionarios autorrellenados es totalmente desaconsejable la inclusión explícita de la alternativa de no opinión en la pregunta. En cambio, en los cuestionarios a cumplimentarse mediante entrevista, la alternativa de no opinión puede incorporarse al listado de opciones de respuesta. Si bien, debe instruirse a los entrevistadores para que no la mencionen. Sólo han de registrarla cuando el entrevistado la diga espontáneamente y tras haber intentado conseguir otra respuesta por parte del entrevistado, ya sea aclarando cualquier duda que la pregunta le suscite; ya concediéndole más tiempo para meditar la respuesta; ya transmitiéndole confianza para emitir cualquier tipo de respuesta (no va a recibir ninguna reprobación). En palabras de Sheatsley (1983: 211): A los entrevistadores se les debería instruir para que sondeen la respuesta "No sé" con frases como "Justo su opinión" o "Por supuesto, nadie realmente sabe. Pero ¿qué piensa de ello?".

Sánchez y Morchio (1992) también aconsejan "sondear" las respuestas "no sé" para clarificar su verdadero significado. Debido, precisamente, a los distintos significados que estas respuestas pueden tener: ignorancia, indecisión, no certeza del sentido de la pregunta. En general, una respuesta "no sé" puede reflejar: • Actitudes ambivalentes, que pueden ser especialmente difíciles de informar, cuando no se ofrecen escalas con un punto intermedio (Krosnick y Fabrigar, 1997).


258

Métodos de encuesta

• Inexistencia de opinión sobre el tema o que no se ofrece una respuesta que comparta el encuestado. De acuerdo con Kalton y Schuman (1982/2002), en preguntas de hecho (u objetivas), la respuesta "no sé" representa un fracaso en obtener información. Existe una respuesta a la pregunta, pero el encuestado no puede proporcionarla. Por el contrario, en las preguntas de opinión (o subjetivas) tiene una interpretación diferente. El encuestado puede, en realidad, no tener ninguna opinión sobre el tema que se le pregunta. Y advierten del peligro de que algunos encuestados puedan sentirse presionados a dar una respuesta específica, incluso aunque "no sé" sea su respuesta correcta. Este peligro puede darse igualmente en las preguntas de hecho, pero es más probable en las de opinión. • Que el encuestado no entienda la pregunta o esté indeciso sobre la opción de respuesta a escoger. Converse (1976) muestra que los porcentajes de "no opinión" aumentan, cuanto más complejo es el lenguaje empleado en la redacción de la pregunta. También, cuando las preguntas: - Contienen largas explicaciones. - Requieren predicciones futuras más que describir el presente y el pasado. - Son dicotómicas (con sólo dos opciones de respuesta) más que politómicas, porque las preguntas dicotómicas suscitan mayor dificultad para descubrir opiniones moderadas. - Tratan temas poco conocidos por el conjunto de la población.

• Falta de motivación o de capacidad para pensar en una respuesta. Nadeu y Niemi (1995) han comprobado que los encuestados más habilidosos y motivados son los más propensos a responder las preguntas del cuestionario, aunque sea incorrectamente, antes que admitir ignorancia. Principalmente, varones y personas de mayor nivel educativo e interés. Esto último es corroborado en diversos estudios (Schuman y Presser, 1981/1996; Bishop y otros, 1986; Graves, 1989; Krosnick y Fabrigar, 1997/2002). Se ha constatado que la tendencia a responder "no sé" es mayor en personas de menor nivel educativo y de habilidades cognitivas, así como entre aquellos que conceden al tema sobre el que se pregunta menor importancia. Por ejemplo,Krosnick y colaboradores (2002), con datos de nueve experimentos con tres encuestas a hogares, encontraron que la opción de "no opinión" es mayor en personas con menos habilidades cognitivas (medidas por el logro académico); que responden en secreto, más que de forma oral; y que dedican poco esfuerzo a contestar la pregunta. Resumiendo, se desaconseja la inclusión de las categorías de respuesta de "no sabe/no contesta" en indagaciones conductuales o de hecho, pero también sobre aspectos subjetivos. No aumenta la calidad de los datos, sino que reduce

Capítulo 4: El diseño del cuestionario

259

la medición de opiniones significativas. Sólo cabe su incorporación, cuando se quiera recoger la inexistencia de información u opinión sob~e un p~rticular. ~?a el caso, por ejemplo, de cuestionarios diseñados para el vaCIado de mformaclOn de documentos existentes u observaciones registradas. De acuerdo con Bourke y Clark (1994: 19), "uno de los mayores errores que se cometen al extraer datos de informes es no advertir que se buscó información y no se encontró". Después, en la fase de grabación de los cuestionarios, a las preguntas que finalmente quedaron sin respuesta, se les asignan los códigos correspondientes a "no sabe" (8,98,998) o "no contesta" (9, 99, 999), dependiendo del sentido de la no respuesta. El uso mayoritario de preguntas cerradas en la encuesta se debe a la conjunción de serie de ventajas importantes:

a) La rapidez y comodidad de su registro. Resulta bastante más sencillo y rápido anotar la respuesta a una pregunta cerrada que la correspondiente a una abierta. Ello se traduce en ahorro de costes en el trabajo de campo (en tiempo de entrevista) y de edición de los cuestionarios. Las respuestas pueden grabarse inmediatamente en el ordenador (durante o después del trabajo de campo) para su posterior tratamiento estadístico, sin necesidad de mediar una actuación previa de cierre de preguntas, como en las preguntas abiertas. b) La mayor estandarización de las respuestas, ampliando sus posibilidades de comparación. Al estar expresadas en los mismos términos, también permite eliminar la vaguedad o ambigüedad de las respuestas. c) La posibilidad de centrar las respuestas de los encuestados a aquellas opciones consideradas relevantes y relacionadas con la cuestión que se pregunta. Pueden incluso guiar a los encuestados en la búsqueda de una respuesta. En especial, cuando las opiniones no están bien cristalizadas (Molenaar, 1982). Dohrenwend (1965) recomienda el uso de preguntas cerradas cuando la desgana a responder restrinja respuestas a preguntas abiertas. d) Requieren menos esfuerzo por parte del encuestado, mostrando mayor adecuación cuando éste tiene problemas de comunicación verbal. Pero no todo son ventajas. Las preguntas cerradas presentan, igualmente, graves inconvenientes que pueden llevar a cuestionar su utilidad en la medición tanto de aspectos objetivos como de subjetivos. Siete son los inconvenientes más señalados:

a) Las preguntas cerradas coartan las opciones de respuesta. Éstas no siempre se ajustan a la variedad de respuestas posibles o no son apropiadas para el encuestado. Ello revierte, negativamente, en la simplificación de la información conseguida. Para evitar que las preguntas cerradas no proporcionen una serie apropiada de alternativas de respuesta se recomienda comenzar el diseño del cues-


260

Métodos de encuesta

tionario con preguntas abiertas (Lazarsfeld, 1944; Mosser y Kalton, 1971; Schu· man y Presser, 1981; Dillon, 1990). Después, utilizar las respuestas obtenidas en el pretest o prueba del cuestionario para desarrollar una serie significativa de respuestas "cerradas". Pero igualmente puede optarse por realizar, previamente, indagación cualitativa ex profeso (entrevistas abiertas, grupos de discusión) a personas implicadas en el tema de estudio, como ya se dijo en el capítulo 1. b) La respuesta puede estar influida por las alternativas ofrecidas. Éstas pueden forzar a que la contestación a la pregunta se conforme a la noción preconcebida del investigador sobre el tema. Es casi cierto que en casi todas las preguntas alguna fracción de sujetos dan respuestas que realmente no quieren dar (Payne, 1980: 79). Con certeza no representarán las actitudes de los sujetos [...]. Los respondientes meramente reconfirmarán el propio marco de referencia del investigador sin ni siquiera comprenderlo (Schuman y Presser, 1981: 108, 110). El encuestador que formula preguntas cerradas puede estar especificando categorías de pensamiento que no son representativas de lo que el encuestado piensa. Con el resultado de que los encuestados confirman nuestro propio marco de referencia sin incluso darnos cuenta (Dillon, 1990: 141).

Este último autor (Dillon, 1990) obtiene distinta mención de respuestas en preguntas cerradas y en abiertas. Por ejemplo, ante la pregunta ¿Cuál es el problema más importante al que se enfrenta este país en el presente?, el doble de encuestados dijo "delincuencia" en la pregunta cerrada, que cuando la pregunta era abierta. Con anterioridad, Schuman y Presser (1979b, 1981/1996) ya habían demostrado que distintas respuestas pueden captarse, dependiendo de si la pregunta se formula con un formato abierto o cerrado. A la pregunta ¿Qué preferiría usted más en su trabajo?, el 60% de los encuestados dieron una respuesta, en la pregunta abierta, no incluida en las cinco alternativas de respuesta en la pregunta cerrada: 1) sueldo alto (12,4%); 2) ningún peligro de ser despedido (7,2%); 3) poca jornada laboral y mucho tiempo libre (3,0%); 4) oportunidades de promoción (17,2%); 5) el trabajo sea importante y de sentimiento de realización (59,1 %) -las cifras entre paréntesis corresponden a los porcentajes de respuesta-o En el formato de pregunta abierta, las tres respuestas más mencionadas fueron: "satisfacción y gusto por el trabajo" (17,0%), "trabajo agradable o divertido" (15,4%) Y"buenas condiciones de trabajo" (14,9%). "Oportunidad de promoción", por ejemplo, sólo fue mencionada por el 1,8% de los encuestados, cuando la pregunta era abierta, mientras que con el formato cerrado reunió al 17,2% de los sondeados. La no coincidencia de respuestas en preguntas abiertas y cerradas la obtienen, igualmente, en otras preguntas, como la referida a los valores de los hijos. En el formato cerrado se preguntó: Mientras que hablamos de sus hijos, por favor, le importaría mirar esta tarjeta. Si tuviese que elegir, ¿qué cosa de esta lista escogería como la más importan-

Capítulo 4: El diseño del cuestionario

261

te para que sus hijos aprendiesen para prepararles para la vida?: 1) obedecer (19,0%); 2) ser bien parecidos o populares (0,2%); 3) pensar por sí mismos (61,5%); 4) trabajar duro (4,8%); 5) ayudar a otros cuando necesiten ayuda (12,6%). En el formato abierto se dieron hasta 17 respuestas diferentes. Las tres respuestas más mencionadas fueron: "conseguir una educación" (12,8%); "ser honesto, sincero" (7,4%); Y"tener respeto a otros: aceptación de los derechos de otros, ejemplo, ser tolerante" (6,7%). "Obedecer", sólo fue pronunciado por el 2,4% de los 460 encuestados y "pensar por sí mismos" por el 4,6% . Éstos y otroshallazgos les llevaron a afirmar que la pregunta cerrada "reconduce" la respuesta a las opciones que el autor da.

c) El diseño de una pregunta cerrada es bastante más laborioso que el de una pregunta abierta. Exige del investigador el previo conocimiento de la realidad que investiga, su delimitación y medición expresa. No sólo ha de decidir cómo formular la pregunta, sino también qué categorías de respuesta considerar, en qué nivel de medición (nominal, ordinal, de intervalo, de razón o proporción) y qué códigos asignar a cada respuesta. d) No permite al encuestado expresar el significado de su respuesta. e) Cuando se ofrecen muchas opciones de respuesta, aunque se recurra a una tarjeta de respuesta (en la encuesta cara a cara), cabe la posibilidad de que el encuestado no medite las distintas alternativas de respuesta que se le ofrezcan, sino que elija, precisamente, la primera que parezca adecuarse a su parecer. Por ejemplo, en una encuesta autoadministrada a profesores de la escuela elemental-referenciada por Biemer y Lyberg (2003: 142)- se ofrecía a los profesores una lista de diez ayudas para su docencia. Se les pidió que seleccionaran aquella que encontrasen más útil en su enseñanza a los alumnos. Aunque las ayudas se listaban sin seguir ningún orden particular, fueron más seleccionadas las que figuraban al principio de la lista. Casi el doble que las que aparecían al final. Esto sugiere que los encuestados dejaron de leer la lista una vez que encontraron una respuesta aceptable, en lugar de haber elegido la respuesta después de haber leído todas las alternativas de respuestas posibles.

Ya se dijo que este tipo de error de medición, debido al efecto de primacía, es más frecuente en encuestas autoadministradas y en las personales que utilizan tarjetas de respuestas. En cambio, el efecto de recencia se da más cuando la pregunta, y sus opciones de respuesta, se dicen de forma oral (entrevista telefónica y personal sin tarjetas de respuestas).

Sudman y Bradburn (1983) y, con posterioridad, Rasinski, Mingay y Bradburn (1994), también encuentran evidencia empírica de que los ítems que aparecen arriba de la lista son los más probables a ser seleccionados. Si bien, estos últimos autores comprueban que esta tendencia no se produce, cuando en la pregunta se incluye la instrucción "Marque todas las opciones aplicables".


262

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

263

CUADRO 4.4. Ventajas e inconvenientes de las preguntas abiertas y cerradas

f) La estandarización de las palabras, que se consigue igualando la literalidad de la pregunta y de sus respuestas, no implica necesariamente estandarización de los significados. Los encuestados pueden atribuir significados diferentes a una misma pregunta.

Tipos de preguntas

Respuestas como, por ejemplo, "mucho", "poco", "bastante", "joven", "caro", suelen provocar interpretaciones dispares de una persona a otra. Mientras que algunos encuestados pueden considerar que fumar cinco cigarrillos al día es "poco", para otros puede ser "mucho". Asimismo, un jersey de 75 euros puede ser una "ganga" para algunos y "muy caro" para otros.

En consecuencia, siempre cabe la duda de si las distintas opciones de respuesta son igualmente interpretadas por todos los encuestados. g) El formato de pregunta cerrado puede incrementar la "amenaza" de la pregunta, debido a que "fuerzan" al encuestado a elegir una de una serie de respuestas. Por esta razón, Sudman y Bradburn (1974) desaconsejan el formato cerrado, tanto para preguntas conductuales como actitudinales, que tengan respuestas socialmente deseables. El cuadro 4.4 resume las ventajas y los inconvenientes de cada formato de pregunta: abierto y cerrado. El investigador deberá valorarlos, en relación con sus objetivos de investigación, antes de elegir una u otra opción de pregunta-respuesta. También, deberá tener en cuenta los cuatro aspectos clave presentes en cualquier investigación: a) El tiempo y los recursos que el investigador quiera destinar a la codificación de las preguntas abiertas. b) El grado de exactitud que desee en las respuestas. c) La cantidad y tipo de información que necesita. d) Su conocimiento previo del tema que investigue. El grado al que puedan anticiparse la variedad de respuestas posibles.

Tal vez lo mejor sería su uso combinado. Ya Oppenheim (1966) proponía utilizar las preguntas abiertas primero, para suscitar las respuestas espontáneas, y, después, las cerradas. Estas últimas muestran mayor utilidad como ayudas a la memoria y para conseguir datos "comparables". A lo que cabría añadir las potencialidades del formato de pregunta abierto para indagar en razones, prioridades, sugerencias de mejora y demás potencialidades enunciadas con anterioridad, respecto a cada tipo de formato.

Abiertas

Cerradas

• 'Elaboración sencilla. • Ocupan menos espacio en el cuestionario. • Proporcionan una información más amplia y exacta, expresada en los propios términos del encuestado. • Pueden obtenerse respuestas inesperadas. • Permiten captar lo más "saliente" para el encuestado.

• Rapidez y comodidad en su registro. • Mayor estandarización de las respuestas, reduciendo su ambigüedad. • Favorecen la comparabilidad de las respuestas. • Pueden centrarse las respuestas en aquellas consideradas relevantes. • Requieren menos esfuerzo por parte del encuestado.

• Mayor coste (económico-temporal) en su registro, transcripción y codificación posterior. • Su contestación exige más tiempo y esfuerzo por parte del encuestado (y del entrevistador, en su caso). • Más expuestas a errores de registro y a mayor subjetividad en su interpretación. • Más susceptibles a errores de medición debidos a la actuación del entrevistador. • Pueden darse respuestas irrelevantes, no acordes con el propósito de la pregunta. • Mayor dificultad para monitorizar tendencias.

• Coartan las opciones de respuesta. • Las alternativas de respuesta pueden influir en la contestación a la pregunta. • Su redacción exige un mayor esfuerzo y conocimiento del tema por el investigador. • No permiten expresar el significado de la respuesta. • Posibilidad de respuesta no meditada (efectos de primacía, de recencia y de aquiescencia). • Las respuestas pueden tener distintas interpretaciones para los encuestados. • Pueden incrementar la "amenaza" de la pregunta.

'teJ:'l1a: lo que se dice o hace, y ésta no siempre es congruente con la realidad, en especial 4.2.3. La especificidad de la medición de actitudes

La medición de las actitudes tradicionalmente ha tenido un tratamiento específico. Como aspecto subjetivo, la forma de medirla es a través de su manifestación ex-

1 cuando

se mide por medio de la declaración verbal y se trata de actitudes expuestas a valoración social. El miedo a la desaprobación o censura social puede llevar a una ocultación deliberada de la actitud "real", habiendo dos vertientes de la actitud: la maniesta y la latente.


264

Métodos de encuesta

Ya en 1934 Lapiere (en su famoso artículo "Attitudes vs. Actions". Social Forces, 13: 230-237) cuestionó la validez de las respuestas verbales en la medición de las actitudes. Mediante un cuestionario se puede obtener una reacción verbal ante una situación enteramente simbólica, que no coincide necesariamente con la actuación real del encuestado cuando se encuentre ante dicha situación. No existe seguridad al respecto. Véase Alvira (1977), quien, tras una revisión de estudios sobre actitud y conducta, concluye que las mediciones verbales de las actitudes no son adecuadas como medidas de las actitudes subyacentes. Pese a ello, reconoce que ésta continúa siendo la estrategia más seguida en la medición de actitudes. Principalmente, desde 1928, fecha de edición del famoso artículo de L. L. Thurstone "Attitudes can be measured" (en American Journal of Sociology, 33: 529544). Supuso el inicio de una serie de propuestas escalares en la medición de actitudes. Consisten en la enunciación de una serie de aseveraciones acordes con la actitud a medir, de las cuales se pide declarar el grado de acuerdo sobre las mismas. Si bien, el formato varía. A continuación se exponen cinco propuestas principales: la escala de distancia social de Bogardus, la escala diferencial de Thurstone, el escalograma o escala acumulativa de Guttman, la escala aditiva de Likert y el diferencial semántico de Osgood. Escala de Distancia Social de Bogardus

En 1925 aparece la propuesta de Emory S. Bogardus en la medición de la distancia social ("Measuring social distance". Journal of Applied Sociology, 9: 299-308). Matizada en una publicación posterior, de 1933 ("A social distance scale". Sociology and Social Research, 17: 265-274). Consiste en una serie de proposiciones dispuestas en orden decreciente de deseo de interrelación con personas de etnias diferentes o expuestas a estigmas sociales. Ayuda en la medición de la distancia social o grado de separación, considerada aceptable, en las relaciones entre distintos grupos sociales. De gran relevancia en la medición, por ejemplo, de las actitudes ante la inmigración, como ya se vio en el apartado 4.1. Se distingue un grado de intimidad máximo (matrimonio, noviazgo, amistad), intermedio (tenerle como compañero de trabajo, vecino) o mínimo (compartir el mismo autobús, su presencia en bares, restaurantes, discotecas) e, inclusive, su exclusión en toda modalidad de contacto. La propuesta de Bogardus presenta la siguiente graduación decreciente hacia otras personas o grupos sociales, entre las que elegir: 1. 2. 3. 4. 5. 6. 7.

Me casaría con él. Le tendría como un amigo más. Trabajaría con él en una oficina. Admitiría a algunas personas en mi vecindad. Le admitiría solamente como interlocutor. Querría que viviese fuera de mi vecindad. Querría que viviese fuera de mi país.

Capítulo 4: El diseño del cuestionario

265

A partir de las respuestas se puede elaborar un índice de distancia social, en conSOlllal1lCla con los pesos asignados en cada punto de la escala. Como puede verse en el ~ielnpllO a continuación.

.... En el Informe FOESSA de 1970 (Informe Sociológico sobre la Situación en España), di.. rigido por Amando de Miguel, se hizo uso de la escala de distancia social de Bogardus, para medir la distancia social con personas procedentes de otra región, con aquellos que han estado en un manicomio más de un año, con pobres y con aquellos que han estado en la cárCel por un delito común. El formato de la pregunta es el mismo. Lo que varía es el grupo soqial sobre el que se mide la actitud favorable o desfavorable de los españoles. La pregunta de distancia social con los de otras regiones, incluida en el cuestionario lIa.mado "Extra-A-Regionalismo", figura así enunciada: P122. SI TUVIESE USTED QUE RELACIONARSE CON UNA PERSONA QUE NO ES DE ESTA REGlÓN, ¿CUÁLES DE ESTAS ACTITUDES ADOPTARíA USTED? (Enseñar tarjeta) (Respuesta única: la primera) - La aceptaría en todas las ocasiones e incluso no le importaría casarse con él 1 - Le aceptaría en todas las ocasiones, excepto como yerno o nuera 2 - Le aceptaría en casi todas las ocasiones como amigo y no tendría inconveniente en invitarle a comer a mi casa (pero no como yerno o nuera) 3 - Le aceptaría como ciudadano y también como vecino, inquilino, compañero de trabajo, etc. 4 - Sólo le aceptaría como un ciudadano más.................. 5 - No le aceptaría en ninguna de estas situaciones 6

En el cuestionario Extra F-Psicología se mide la distancia social con un ex paciente de un sanatorio mental, un ex presidiario y un pobre, utilizando la misma escala anterior. En el Apéndice Metodológico del Informe se detalla el procedimiento seguido en la obtención de un (ndice de distancia social. Los porcentajes de respuesta en cada proposición (o categoría de respuesta) se multiplica por el coeficiente de ponderación asignado correspondiente: 5, 4, 3, 2, 1 Y O. El resultado total se divide por SOO (al haber quedado excluida la sexta categoría por estar multiplicada por O): índice de distancia social = A% xS + B%x 4+ C% x 3+ O%x 2 + E%x 1

500


266

Métodos de encuesta

El índice oscila entre un máximo de "+1" (aceptación máxima) y un mínimo de "O" (aceptación mínima), con un punto medio sin significación estadística. Más recientemente, en las encuestas de actitudes ante la inmigración realizadas por el CIS, la distancia social hacia personas de procedencia distinta se mide con varias preguntas que, aunque comparten similares supuestos con la escala de Bogardus, presentan un formato diferente, como preguntas separadas. Las preguntas son las siguientes: •

¿A Ud. le preocuparía mucho, bastante, poco o nada queun hijo o una hija suya (si no los tiene, en caso de que los tuviera) se casara con un ciudadano de ....? • ¿Hasta qué punto: mucho, bastante, poco o nada, le importaría a Ud. que sus hijos (si no los tiene, en caso de que los tuviera), compartieran en el colegio la misma clase con niños de familias de inmigrantes extranjeras? • ¿Y hasta qué punto: mucho, bastante, poco o nada le importaría a Ud. tener como vecinos a una familia de ciudadanos de .....? • ¿Y hasta qué punto: mucho, bastante, poco o nada, le importaría a Ud. tener como compañero de trabajo a ciudadanos de.... ?

Salvo en la segunda pregunta, en el resto se distingue entre ciudadanos de diferentes países: Portugal, algún otro país de la Unión Europea, Estados Unidos, Europa del Este (PoI~:>nia, Hungría, etc.), Latinoamérica, Marruecos u otro país norteafricano, un país del Africa Negra.

Escala diferencial de Thurstone En 1929, L. L. Thurstone propone, junto con E. J. Chave (en The measurement of attitude. University of Chicago Press), un nuevo procedimiento en la medición de actitudes, que sería perfilado, con posterioridad, en una publicación en solitario de 1931 (The measurement of social attitudes. University of Chicago Press). Consiste en enunciar una serie de proposiciones relativas a una determinada actitud (más o menos favorables o contrarias a la misma), expresadas en forma categórica (como aseveraciones). Al encuestado se le pide que indique su acuerdo o desacuerdo con cada frase o proposición. El promedio de las respuestas resumirá su actitud ante el problema que se investiga. En concreto, su realización exige:

1. Determinar qué actitud quiere medirse, en consonancia con los objetivos y el marco teórico de la investigación. 2. La generación de un número ele,vado de ítems o frases (de 100 a 150), relacionadas con la actitud a medir. Estas han de cubrir todo el continuo de la actitud, desde el extremo más positivo hasta el más negativo. En su redacción han de seguirse las mismas pautas generales destacadas en la redacción de preguntas de un cuestionario. En particular, se reitera la necesidad de evitar elaborar ítems o frases:

Capítulo 4: El diseño del cuestionario

267

• Demasiado largas porque dificultan la comprensión y retención (por parte del entrevistado). Fundamentalmente, cuando se preguntan mediante entrevista telefónica o personal, sin el uso de tarjetas de respuesta. • Que contengan dos o más ideas. De Vellis (1991: 59) lo ilustra con el siguiente ejemplo: "Yb apoyo derechos civiles porque la discriminación es un crimen contra Dios." Si una persona apoya los derechos civiles por razones diferentes, ¿cómo debería responder? Una respuesta negativa podría incorrectamente expresar una falta de apoyo a derechos civiles y una respuesta positiva podría incorrectamente adscribir un motivo al apoyo del respondiente.

• Las dobles negativas. • Referencias ambiguas y adverbios de cantidad (nunca, siempre, todos) y demás recomendaciones incluidas en el apartado 4.2.1. Asimismo, es conveniente que la ubicación u ordenación de los ítems en la escala mantenga una estructura similar a la del cuestionario en su conjunto. Quiere esto decir que los primeros ítems sean los más suaves o menos definidores de la actitud a medir; los que expresan mayor controversia, en el segundo tercio de la escala; los intermedios, al final. 3. Un grupo de expertos, llamados "jueces", preferiblemente 30 o más, evalúan la serie de ítems, indicando en qué punto del continuo de la actitud se sitúa. Para ello, cada juez o experto clasifica cada ítem en uno de los 11 montones que comprende el continuo de la actitud graduada. Es decir, de "bastante desfavorable" (1) a "bastante favorable" (11), siendo el "6" el valor neutro. Aqu~llos ítems ubicados en montones bastante diferentes quedan excluidos, por conSIderarse ambiguos en la medición de la actitud. A tal fin, se puede elaborar ~na matriz cuyas columnas incluyan las valoraciones dadas a cada ítem por el conjunto de expertos. Se calcula la mediana (también puede ser la media, aunque Thurstone prefiere la mediana) de cada columna, que representa a cada ítem, y el rango interpercentílico (P75 - P25 ). Éste es elegido por Thurstone para medir la dispersión discriminante de cada ítem. Y, de acuerdo con él, se retendrá todo ítem cuya dispersión no supere el valor de "2". O sea, que suscite consonancia en su valoración. 4. Los 20 o 30 ítems finalmente seleccionados se listan, de forma aleatoria en el cues~~onario q~e va a pas~rse a la muestra del estudio (elegida al azar de 'la poblaclOn a anahzar). ConVIene que en el cuestionario no figuren los valores escalares promedios dados a cada ítem en la prueba de jueces. Para cada ítem los encuestados han de indicar si están "de acuerdo" o "en desacuerdo". La puntuación de cada sujeto, en la escala, se obtiene de la media (o mediana) de los valores escalares de los ítems en que ha dicho estar "de acuerdo".


268

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

1.· EJEMfiQDGESCAL~

THURSTQNE

·1'-------------

Los siguientes ítems con sus valores escalares están tomados de una escala de Thurstone incluida en su publicación de 1931 (The measurement of social attitudes) y reseñada por Lamberth (1980: 230). Se trata de una escala de actitudes ante los negros. Las frases o ítems elegidos concuerdan con cómo se medía el racismo por aquel entonces. Consonante con lo que actualmente se conoce como racismo tradicional o biológico (como ya se dijo en el apartado 4.1). Valor escalar 10,3 10,3 7,7 5,4 2,7

0,9 0,9

ítem Creo que el negro tiene los mismos derechos sociales que el blanco El negro debería ser considerado como igual al hombre blanco y disfrutar de sus mismas ventajas El negro es perfectamente capaz de cuidar de sí mismo, si el hombre blanco le deja tranquilo No me interesa en absoluto la situación social del negro En ningún caso los niños negros deberían asistir a la misma escuela que los niños blancos El negro está siempre un poco encima de los animales El negro debería ocupar el lugar más bajo entre los seres humanos

De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo

En el cuestionario, los ítems nunca han de figurar de forma ordenada (ascendente o descendente), sino aleatoria. Es decir, alternando aquellos que expresen actitudes positivas con negativas y neutras. Tampoco han de figurar los valores escalares dados por los expertos (o jueces). Tan sólo la frase junto con las opciones de respuesta posibles: de acuerdo y en desacuerdo. Normalmente sin código numérico expreso. El encuestado deberá señalar (con una cruz, por ejemplo) aquellas frases con las que está de acuerdo. La media o la mediana, de los valores escalares atribuidos a los ítems elegidos, representará su actitud hacia los negros.

La laboriosidad que su práctica exige contribuye al uso limitado de la escala Thurstone en la investigación social.

269

a aquellos ítems que se sitúen por debajo de él. Ello exige una clasificación jey acumulativa de los ítems. diferencia de la escala de Thurstone, el universo de ítems se reduce sensiblete. A 30 enunciados, e inclusive menos, si aparecen acompañados de otras pretas en el cuestionario. Además, se elimina la prueba de jueces. Basta su previa combación en una muestra de la población: la prueba piloto o pretest del cuestionario. Las categorías de respuesta pueden ser dicotómicas ("de acuerdo" 1, "en desardo" O; "sí" 1, "no" O) o incluir más de dos opciones de respuesta como en las esLikert. En este último caso, la puntuación más elevada se asigna al valor de la resfa que sea más favorable a la actitud. Por ejemplo, "completamente de acuerdo" "de acuerdo" (3), "indiferente" (2), "en desacuerdo" (1), "completamente en deérdo" (O). En ambos casos se sigue el mismo procedimiento de escalamiento, aplidose la técnica de escalograma llamada Cornell (el nombre de la universidad ~de Guttman trabajaba por aquella fecha), pero con cinco categorías de respuesta.

Vellis (1991) ilustra el escalograma de Guttman en una escala de aspiraciones de los hacia el logro educativo de sus hijos. Lograr el éxito escolar es la única forma de que mis hijos compensen mis esfuerzos como padre - Ir a un buen colegio y obtener un buen trabajo son importantes para la felicidad de mis hijos - La felicidad es más probable, si una persona ha logrado sus metas educativas y materiales

De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo

1 O 1 O 1 O

En una escala Thurstone los ítems quedarían enunciados de esta forma: - Lograr éxito es sólo una forma de que mis hijos compensen mis esfuerzos como padre - Ir a un buen colegio y obtener un buen trabajo son importantes, pero no esenciales en la felicidad de mis hijos - La felicidad nada tiene que ver con lograr metas educativas o materiales

De acuerdo En desacuerdo De acuerdo En desacuerdo De acuerdo En desacuerdo

Escalograma o escala acumulativa de Guttman

En 1944 Louis Guttman (en "A basis for scaling qualitative data". American Sociological Review, 9: 139-150) propuso un procedimiento escalar acumulativo para la medición de las actitudes. En ella la respuesta positiva a un ítem supone una respuesta

Las respuestas obtenidas de los sujetos se disponen en una matriz. En las columse sitúan las preguntas, especificándose la respuesta: "sí" (1), "no" (O). En las filas, los sujetos que contestan. Para cada sujeto, se suma el número de respuestas afir-


270

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

mativas. Se cambia el orden de las filas de la matriz original para que los sumatorios más elevados ocupen las primeras posiciones y los más bajos las últimas. Los ítems en las columnas también se reordenan para que en las primeras columnas aparezcan los ítems cuyo sumatorio sea más bajo y en la última el más alto. A modo de lo ilustrado en el cuadro 4.5.

271

el índice supere el valor de referencia de "0,90", a partir del cual la escala se conválida. Quiere esto decir que se eliminan aquellos ítems que han obtenido estas de mayor dispersión.

CUADRO 4.5. Escalograma de seis ítems con respuesta favorable (1) y desfavorable (O)

Sujetos que contestan

1 2 3 4

5 6 7 8 9

10

Ítems

3

6

1

2

5

4

1 1 1 1

1 1 1 1 1 1

1 1 1 1 1 1 1 1 1

1 1 1 0* 1 1 1 1 1 1

1 1 1 1 1 1 1 1 0* 1 1

1 1 1 1 1 1 1 1 1 1 1 1

6 6 6 5 5 5

O

O

12

53

O O O O O O

O O O

1*

11

1*

12

O O

O O O

O O O O

Puntuación categorías

5

7

9

Errores *

1

13

Puntuación de los sujetos

1

O

O O

1*

O O

10

10

2

1

González Blasco (1989/2000) ilustra la confección de una escala de Guttman con cinco ,osiciones (o ítems) extraídas de una escala utilizada por C. Srole en la medición del niqeanomia (en García Ferrando, M., "Estructura comunitaria y desarrollo organizado". Rede Estudios Sociales, 1971, 3: 3-18).

ítems

4 4

3

?tNo es útil escribir a los funcionarios públicos porque a menudo no

3

" >están interesados en los problemas del hombre de la calle. ,t\ctualmente hay que vivir al día y dejar que el mañana se cuide ";>así mismo. pesar de lo que se dice, las cosas están cada vez peor para el hombre medio y no mejor. ,ELtraer niños a este mundo es un problema, dado cómo se presenta el futuro. ,í;:i1 estos días uno no sabe en quién confiar.

2 1

O

5

* Errores: Valores "1" ubicados en la zona de "O" y a la inversa, "O" en la zona de "1". Después se calcula el índice de reproductividad para validar la escala: E

R=l--QxS Donde E = número total de errores; Q = número de ítems; S = número de sujetos que responden. La escala obtenida se considera "válida" cuando el índice es mayor o igual a "0,90". En caso contrario, se considera invalida. Cuando esto sucede, suele procederse a la eliminación gradual de los ítems que presentan un mayor número de errores. Has-

-LA

% respuesta afirmativa

error

% Error

67,3

30,50

7,90

54,4

50,00

12,95

41,7

51,00

13,21

40,7

54,00

13,99

35,2

52,50

13,60

observados: 443 residentes del Estado de Missisipi

respuestas se rotaron, de forma que su ordenación minimizara los errores, según los de Guttman. Con los cinco ítems se obtuvo un escalograma. Mediante un programa Ifpt'l'l1álico también se calcularon los errores de cada ítem, sus porcentajes de respuesta y Icclefi,cie,nte de reproductividad. Este último resultó ser de 0,8767, un valor algo inferior a lo que se opta por eliminar el ítem de mayor error (54,00), el número 4. Tras su elinih~¡NIÍ,n se repite el proceso con los cuatro ítems restantes. Como el nuevo índice de re;<proofucjfivic1aof es 0,9034, la escala integrada por las cuatro proposiciones restantes queda fi;j;malrrlente aceptada.

La medición de actitudes mediante escalas dicotómicas de acuerdo-en desacuerdo las más vulnerables al llamado sesgo de aquiescencia, al acuerdo indistintamente gel, ,contenidlo del ítem.


272

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

En uno de los experimentos llevados a cabo por Schuman y Presser (198111996) se compararon las respuestas a dos aseveraciones opuestas, en las que se pedía a los encuestados que dijesen si estaban de acuerdo o en desacuerdo:

conformidad con el significado de la respuesta para la actitud que miden. También pueden aplicarse los códigos numéricos +2, +1, O, -1, -2. La puntuaCión global de la escala suele obtenerse "sumando" (al ser una escala sumativa o aditiva) todas las puntuaciones registradas (incluidas las inversas).

1. Los individuos son más culpables que las condiciones sociales de la cuencia y del desorden en este país. 2. Las condiciones sociales son más culpables que los individuos de la delincuencia y del desorden en este país.

Si no existiese ningún efecto de la forma de la pregunta, se esperaría que el porcentaje de encuestados que respondiesen "de acuerdo" al primer ítem fuese el mismo que el porcentaje que respondiese "en desacuerdo" al segundo ítem, y viceversa. No obstante, el 59,6% de los sondeados dijeron estar "de acuerdo" con el primer ítem y sólo el 43,2% "en desacuerdo" con el segundo ítem. Una diferencia por" centual que los autores estimaron bastante significativa y les llevó a afirmaJ;Aa existencia de sesgo de aquiescencia. Sesgo que, por otra parte, se da más en personas de menor nivel educativo, como igualmente observaron Converse y Presser (1994).

Escala aditiva de Likert En 1932 Rensis Likert propone (en "A technique for the measurement of attitudes". Archives of Psychology, 140: 44-53) uno de los procedimientos escalares más aplicados en la investigación social. Presenta las siguientes peculiaridades, que le distinguen de otras escalas: a) No precisa un número de ítems iniciales tan elevado como en la escala Thurstone. Basta con reunir el doble o el triple de los que se desea incluir en la escala final. Es habitual proponer en torno a 60 ítems para, después, quedarse con 20-25. b) La escala ha de ser equilibrada. Es decir, ha de contener, aproximadamente, el mismo número de ítems o proposiciones claramente favorables y desfavorables hacia el objeto de actitud. Además, han de ser expresión de un "comportamiento deseado", enunciados de forma categórica, en el sentido del deber ser. Por ejemplo, Los inmigrantes ilegales deberían ser repatriados a sus países respectivos. c) No deberían incluirse aseveraciones "muy suaves", porque suscitan demasiado acuerdo, cuando se incluyen en una escala Likert. Lo que las hace poco atractivas o interesantes a efectos analíticos. Por la misma razón, tampoco deberían incluirse aquellos ítems en los que casi todo el mundo se encontraría de acuerdo, por ser poco definidores en la medición de la actitud correspondiente. d) A diferencia de las modalidades anteriores, la escala Likert es politómica. Generalmente, con cinco categorías de respuesta para cada ítem. Por ejemplo, "muy de acuerdo", "de acuerdo", "indeciso", "en desacuerdo", "muy en desacuerdo". Las puntuaciones (1,2,3,4,5 o, a la inversa, 5, 4, 3, 2,1) se asignan

273

00

LQs inmigrantes legalmente establecidos en España deberían tener los mismos derechos sociales que los españoles.

5 Muy de acuerdo

4 De acuerdo

3 Indiferente

2 En desacuerdo

1

Muy en desacuerdo

Todos los inmigrantes, legales o ilegales, deberían ser repatriados a sus países de origen. 1 Muy de acuerdo

2 De acuerdo

3 Indiferente

4 En desacuerdo

5 Muy en desacuerdo

Las respuestas se combinan de manera que aquellas que supongan una actitud más fap[l:ible obtendrán una puntuación más elevada, mientras que a la actitud más desfavorable ~;6<>rresponderá la más baja. En este ejemplo podrían, igualmente, haberse aplicado las punoO'ciones de +2, +1,0, -1, -2, al primer ítem y, a la inversa, en el segundo. Al tratarse, el pri, de un ítem que expresa una actitud positiva ante la inmigración, en tanto que el segundo negativa. Por esta razón, ha de adscribírseles valores numéricos contrarios. Mejor en la de análisis, cuando los datos se hayan introducido en el ordenador. En el cuestionario, alternativas de respuesta iguales han de figurar con el mismo código numérico para eviinfluir en la respuesta. Tras la recogida de la información, es cuando los códigos numés se modifican en la dirección de la actitud que midan.

En relación con las categorías de respuestas existe, no obstante, disenso en varias cuestiones que se reseñan en los tres puntos siguientes: • El número de categorías a incluir. Aunque existe consenso en la consideración de las actitudes en un continuo, que va de extremadamente positivo a extremadamente negativo, y que cuantos más puntos de la escala existan pueden conseguirse distinciones más sutiles, no está claro el número de categorías ideal.


274

Métodos de encuesta

Sheatsley (1983) desaconseja más de cinco categorías de respuesta porque algunas personas pueden tener dificultades para encontrar las diferencias de matiz entre unas respuestas y otras. Para Krosnick y Fabrigar (1997) la longitud de la escala óptima se sitúa entre cuatro y siete puntos. Aunque admiten que, cuando el número de opciones es bastante grande, el significado de cualquier punto particular es bastante menos preciso, comprueban que la fiabilidad es mayor en escalas de siete a nueve puntos en investigaciones longitudinales y de cinco a siete puntos en investigaciones transversales o seccionales. Lodge (1981), en cambio, recomienda escalas de longitud infinita para conseguir una mayor distinción entre los objetos.

Si la escala se aplica en una encuesta telefónica, habría que pensar en reducir las opciones de respuesta a un número inferior a cinco (tres o cuatro puntos); o expresarla con números con preferencia a categorías verbales (como después se verá). • La inclusión de categorías intermedias (ni a favor ni en contra, indiferente). En dimensiones bipolares, puede estar justificada, si se piensa que algunas personas verdaderamente pueden tener posiciones "neutrales" y que forzarlas a responder en una dirección o en la otra podría añadir error a la medición. Pero, por otra parte, ya se dijo que el ofrecer un punto medio en una escala favorece su elección en personas que no quieren definirse o detenerse a pensar en una respuesta de mayor interés. Andrews (1984), Alwin y Krosnick (1991) comprueban que las escalas con puntos intermedios son menos fiables que aquellas que los excluyen. En contra de Schuman y Presser (1981), para quienes la inclusión de alternativas intermedias fortalece la medición de las actitudes. En España, Rojas y Fernández (2000) han comprobado la utilidad de la alternativa intermedia "ni de acuerdo ni en desacuerdo" en la escala de timidez de Cheek y Buss. Comprueban que no funciona como tal, debido a los distintos significados atribuidos por los encuestados. Posteriormente, Hernández Baeza y otros (2001) también aconsejan la eliminación de la categoría intermedia "indiferente", por no ser relevante en la medición de actitudes.

En general, en la elaboración de la escala deberían seguirse las mismas recomendaciones que en la redacción de preguntas cerradas. En especial, las referidas a la longitud de la pregunta, la inclusión de opciones intermedias y de no opinión (no sabe/no contesta). • Si etiquetar todos los puntos de la escala con palabras o etiquetar sólo los extremos con palabras y los demás con números. Incluir etiquetas en todos los puntos de la escala puede ayudar a clarificar su significado y a la introducción de matices. Principalmente, en poblaciones de bajo nivel cultural. Para Andrews (1984), Alwin y Krosnick (1991), Krosnick y Fabrigar (1997), las escalas plenamente etiquetadas son más fiables y válidas que las

Capítulo 4: El diseño del cuestionario

275

parcialmente etiquetadas. Además, estos investigadores constataron la obtención de mayor varianza en las puntuaciones de los ftems, cuando éstos estaban totalmente etiquetados.

A favor de las escalas con valores numéricos está su mayor precisión, al no sufrir de la ambigüedad inherente del lenguaje (Krosnick y Fabrigar, 1997). Pero, también, su mayor facilidad de retención en la memoria. De gran interés en la encuesta telefónica. Cuando haces entrevistas telefónicas, mientras que puede ser difícil enseñar a los encuestados 5 o 6 adjetivos, es comparativamente fácil definir una escala de 10 puntos numéricamente (Fowler, 1998: 359).

Asimismo, puede aumentar la comparabilidad de la medición en distintos métodos de encuesta y en estudios internacionales, o que incluyan a personas de culturas diferentes. Como el escalograma de Guttman, no precisa de la prueba de jueces o expertos. Basta con administrarla a una pequeña muestra representativa de los sujetos cuyas actitudes se quiere medir. Aproximadamente entre 50-100 personas que, además, han de cubrir el rango de actitudes que se desea que la escala detecte. Puede igualmente utilizarse el pretest del cuestionario. La información recabada de la escala inicial en la pequeña muestra o en el pretest se utiliza para la selección de los ítems a incluir en la escala definitiva. Los menos ambiguos y más discriminantes en la medición de la actitud de que se trate. Para ello se procede al cálculo de la puntuación total de cada individuo en la escala, de la suma de sus puntuaciones en cada ítem. Aquellos que presenten una actitud más favorable a la inmigración, por ejemplo, deberán tener una puntuación más alta; los más contrarios o reacios a la inmigración, la más baja. Se ordenan los sujetos en orden decreciente, de acuerdo con su puntuación total. La primera posición la ocupa aquel de puntuación más elevada, mientras que la última, aquel de menor puntuación. Con el 25°k de los sujetos con puntuaciones más elevadas (grupo alto) y el 25% con las más bajas (grupo bajo), se analiza cada ítem, su adecuación en la medición de la actitud. Pueden seguirse alguno de los cuatro procedimientos siguientes: • Calcular la media de cada ítem en ambos grupos (alto y bajo) y sus desviaciones típicas correspondientes. Su significatividad se comprueba mediante la prueba estadística t de Student. Aquellos ítems a los que corresponda un valor t empírico inferior al teórico, al nivel de probabilidad elegido (habitualmente un nivel de significación de 0,05, que equivale a una probabilidad de acertar en la inferencia del 950/0 ), serán descartados por no ser discriminantes. No presentan diferencias estadísticamente significativas entre ambos grupos.


276

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

• El cálculo del coeficiente de correlación de cada ítem con el total de la escala. Los ítems elegidos serán aquellos que presenten una correlación estadísticamente significativa. Normalmente, una correlación superior a 0,35. • Se calcula la mediana de cada ítem en ambos grupos y se confecciona una tabla de contingencia, con dos filas (una de puntuaciones por debajo de la mediana; la segunda de puntuaciones por encima de la mediana) y dos columnas (grupo alto, grupo bajo). El poder discriminante de cada ítem se comprueba mediante el test de chi-cuadrado o el test F de Fischer. Como en toda prueba de significatividad, cuando los valores empíricos superen los correspondientes valores teóricos o críticos, significa que el ítem es válido en la diferenciación de los grupos. Tiene poder discriminante. • El poder discriminatorio de los ítems puede igualmente comprobarse mediante el análisis discriminante. Éste ayuda a la obtención de los ítems que más definen a los sujetos en cada grupo, de acuerdo con la ~ctitud medida, y aquellos que más diferencian a unos grupos respecto de otros (los más discriminantes), como se verá en el capítulo 6. Otra técnica multivariable de gran utilidad es el análisis factorial, tanto en la fase exploratoria como en la confirmatoria. Permite comprobar si la escala está compuesta por ítems que miden dos o más dimensiones de la actitud y cómo deberían ponderarse para componer las escalas. Una vez comprobado el poder discriminatorio de cada ítem, se retienen aquellos estadísticamente significativos en la diferenciación de ambos grupos (alto y bajo). Con el requisito añadido de que la mitad de los ítems midan una actitud favorable y la otra mitad, aproximadamente, una desfavorable. Se concluye el diseño final del cuestionario listando los ítems retenidos en orden aleatorio e intentando que los situados en el primer tercio sean los menos definidores o más suaves; los ubicados en el segundo tercio, los más controvertidos; y en el tercio final, los intermedios. Alternando los enunciados o ítems que representen actitudes diferentes. Con ello se quiere evitar el sesgo de aquiescencia. O sea, la tendencia a decir "de acuerdo", indistintamente del contenido del ítem. Este sesgo es más habitual cuando los primeros ítems indican una misma actitud o consonancia de significado. Normalmente se retienen en torno a veinte ítems o aseveraciones. Pero, si la escala se incluye en un cuestionario, junto a otra serie de preguntas (subjetivas o de hechos), sería mejor reducir la serie de ítems a los más definidores de las distintas posiciones ante el objeto de actitud. Ante todo ha de evitarse fatigar al encuestado y que éste no preste atención en la respuesta o que decida no seguir respondiendo al cuestionario. Como Sheatsley (1983: 210) advierte: Cuando el número de ítems excede de 8 o 10, muchos respondientes se aburrirán y responderán sin propósito, sin pensamiento real. Simplemente para pasar la lista tan rápido como sea posible.

277

ra ilustrar el uso de una escala Likert se extracta una pregunta de las incluidas en el onario aplicado en el estudio de Torres Ríus, M.; Alvira Martín, F.; Blanco Moreno, P. í Pérez, M. (1994): Relaciones padres/hijos. Ministerio de Asuntos Sociales. Colección .ios. La pregunta se expone tal y como aparece en el cuestionario. . 34. A continuación voy a leerle una serie de frases. Me gustaría que me dijera, para

cada una de el/as, si está muy de acuerdo, de acuerdo, indiferente, en desacuerdo o muy en desacuerdo. Frases

feriría no haber tenihijos. s hijos han sido una [iln· satisfacción en mi

Muy de acuerdo

Muy en NS/ En desacuerdo desacuerdo NC

De acuerdo

Indiferente

2

3

4

5

9

(22)

2

3

4

5

9

(23)

2

3

4

5

9

(24)

2

3

4

5

9

(25)

2

3

4

5

9

(26)

2

3

4

5

9

(27)

2

3

4

5

9

(28)

2

3

4

5

9

(29)

2

3

4

5

9

(30)

2

3

4

5

9

(31)

2

3

4

5

9

(32)

dá. en día los hijos no etan a los padres. se explican las cosas Iquier niño entiende razones de su padre. hijos vienen con un debajo del brazo. hay cosa que más tisfaga a un padre que sqnrisa de su hijo. padres son los que de tomar exclusiva~~te las decisiones y ~hijos obedecerlas. qcreo que pegar sea Isistema de enseñar da. alquier decisión que ~El toine, si ésta es im'portante, debe discutircon todos, incluidos .I()s hijos. ·l,a disciplina en educa/dón es la clave del éxito. letra con sangre entra.

· .. La

(.../...)


278

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

Frases

Muy de acuerdo

De acuerdo

Indiferente

• A los niños desde muy pequeños hay que acostumbrarlos a razonar. • Me basta con que mis hijos se críen con salud. • Los hijos son un problema que nunca acabas de llevar. • Por más que uno se esfuerce, al final los hijos salen como quieren.

1

2

3

4

5

9

(33)

1

2

3

4

5

9

(34)

1

2

3

4

5

9

(35)

1

2

3

4

5

9

(36)

En Muy en NS/ desacuerdo desacuerdo NC

Con estos 15 ítems querían medirse las actitudes de los padres hacia los hijos. Adviértase que, como es usual, se incluyen tanto ítems que denotan una actitud muy positiva (por ejemplo, "Los hijos han sido una gran satisfacción en mi vida"), como negativa ("Preferiría no haber tenido hijos") o indiferente ("Me basta con que mis hijos se críen con salud"). Las opciones de respuesta figuran en el cuestionario con el mismo código numérico en todos los ítems, como ha de hacerse. En el análisis de las respuestas, tras su grabación, es cuando suelen modificarse aquellos códigos, en cada ítem, no consonantes con la actitud que se mide. Mediante un análisis factorial de componentes principales en esta pregunta se obtuvieron tres modelos de relación padres-hijos: modelo autoritario (frases 1, 7 Y 10), de laissez-faire (frases 13, 14 Y 15) e inductivo-de apoyo (frases 4,6,9 Y 12). Los cinco ítems restantes no mostraron utilidad en esta tipología de actitudes en la relación padres-hijos.

Un problema importante de la escala Likert es que la misma puntuación global puede obtenerse de distintas combinaciones de respuesta (Procter, 1993). Asimismo, ha de considerarse que los procedimientos escalares expuestos miden las actitudes a través de declaraciones verbales. Por ello, se enfrentan al mismo problema: el individuo puede descubrir la actitud que se mide y modificar su respuesta (si quiere ajustarse a las demandas del investigador o a aquellas que perciba como socialmente deseables). Esto significa que son vulnerables al sesgo de deseabilidad social. Por último, añadir que, con independencia de que quiera medirse una actitud, o no, el formato escalar Likert es muy habitual en las encuestas. Ahorra espacio en el cuestionario y, además, es más fácil responder a preguntas que comparten unas mismas categorías de respuestas bajo un mismo cabecero de pregunta que en preguntas separadas. Diferencial Semántico de Osgood

Propuesto por C. E. Osgood, G. J. Suci YP. H. Tannembaum, en 1957 (The measurement ofmeaning. University of Illinois Press), como un procedimiento para ase-

279

elsignificado connotativo de los conceptos. Muestra gran utilidad en la medición tereotipos sociales y, en general, en la medición de las actitudes diferenciales antintos grupos sociales. arte del supuesto de que se pueden determinar los sentimientos (positivos o nes)de las personas, hacia un objeto concreto de actitud, mediante su posición anjetivos polares o antónimos. El objeto de actitud a medir se sitúa en el cabecero pregunta. Se pict"e a los encuestados que marquen una de las posiciones (genente siete), que median entre dos adjetivos antónimos. ara su elaboración se recomienda que los pares de adjetivos (que expresan disiones del concepto a medir) se alternen, de forma aleatoria, para que las restas positivas (o negativas) no caigan en el mismo extremo.

En su opinión, ¿Cómo son los marroquíes? Coloque una X en una de las siete posiciones comprendidas entre cada par de adjetivos polares. (MOSTRAR TARJETA) MARROQuíES Sinceros Holgazanes Honestos Sucios Activos Hostiles Tolerantes

Falsos Trabajadores Deshonestos Limpios Pasivos Amigables Intolerantes 234

5

6

7

adjetivos pueden ser bipolares (por ejemplo, amigable-hostil) o unipolares. Estos úl:.~,~ ~,,-_.- la existencia o ausencia de un único atributo. Por ejemplo, amigable-no ami-

La puntuación de una persona se obtiene asignando "1" a la posición que expre~respuesta más negativa; el "7", a la más positiva; y las intermedias, desde 2 a 6, nsecutivamente. La puntuación global será, igualmente, el promedio de todas las respara la totalidad de los enunciados propuestos. el pretest se obtuviera que un porcentaje elevado de respuestas se sitúa en la ,naneuu'a o intermedia (próxima al 4), debería procederse a la sustitución de los paadjetivos antónimos por otros que muestren mayor utilidad en la medición del de actitud que se trate.


280

Métodos de encuesta

Por último, resaltar la mayor adecuación de esta última modalidad de formato escalar en situaciones en las que las personas muestren fuertes reacciones emocionales hacia una determinada cuestión (Henerson y otros, 1987). Para Lamberth (1980: 231) constituye "un instrumento útil y flexible de medición". No existe un modelo único de diferencial semántico. El tema y los adjetivos antónimos o polares elegidos hacen que las escalas sean muy diversas.

Capítulo 4: El diseño del cuestionario

281.

), por ejemplo, contradicen lo dicho. En su opinión, el cuestionario debería mar con preguntas de opinión, porque las consideran más interesantes que las rea hechos (o aspectos objetivos). filas encuestas mediante entrevista puede ser de gran utilidad iniciar el cuestiocon preguntas abiertas, bastante genéricas, relativas al tema central de la encuesta. en ayudar a romper el hielo. Por el contrario, en los cuestionarios autorrellenados saconseja el uso iÍJ.icial de preguntas abiertas. Lo mejor es comenzar con preguntas das sencillas. Como indican Sudman y Bradburn (1987: 218),

as

4.3. La ubicación de las preguntas en el cuestionario Una vez concretados los contenidos de la encuesta y traducidos a preguntas específicas, procede decidir su disposición en el cuestionario, de acuerdo a un orden lógico, y la presentación que se dará al cuestionario. Como ya se dijo en el apartado 4.2, la calidad de las respuestas puede no sólo verse afectada por la redacción de las preguntas. También, por el contexto que comprenda la pregunta (entre qué preguntas se encuentra) y su ubicación en el cuestionario (al principio, en el medio, al final). Existen una serie de convenciones, generalmente aceptadas, relativas a la ubicación de las preguntas en el cuestionario. Con ellas se quiere reducir su efecto en el error de medición. Se resumen en el cuadro 4.6 y, a continuación, se comentan. CUADRO 4.6. Recomendaciones para la ubicación de las preguntas en el cuestionario

Las preguntas abiertas, que requieren escribir más de unas cuantas palabras, se perciben como difíciles, como potencialmente embarazosas, debido a la posibilidad de cometer errores gramaticales.

simismo, en las encuestas autoadministradas se insiste más en que las preguntas es sean interesantes y fáciles de responder; que transmitan la sensación de que star el cuestionario va a suponer poco esfuerzo. Las primeras preguntas del cuestionario se convierten para muchos en un "¡voy a probar a ver!", las preguntas comienzan con algo fácil y general que implica a la persona con el objetivo de la investigación (Bosch y Torrente, 1993: 36-37).

l,contenido de las preguntas conviene que guarde relación con la carta de pre-

ción que acompaña al cuestionario. 1. Preguntas iniciales interesantes y sencillas. 2. Preguntas clave en el centro del cuestionario. 3. Distribuir secuencialmente las preguntas que formen una batería. 4. Preguntas "amenazantes" al final del cuestionario.

Preguntas iniciales interesantes y sencillas Las preguntas que inician el cuestionario han de satisfacer la doble condición de despertar el interés del encuestado y ser, al mismo tiempo, de fácil respuesta, por el conjunto de la población a la que se pregunta. Hay que evitar que suscite un porcentaje de no respuesta elevado, que se responda con "no sé", porque desanimaría a seguir contestando al cuestionario. Se prefiere comenzar con preguntas sencillas y que resulten interesantes al encuestado, no provocando en él ningún retraimiento que afecte a su respuesta en las preguntas posteriores. Se busca transmitir confianza al encuestado y animarle a que cumplimente todo el cuestionario. Por esta razón, se anteponen las preguntas neutras (referidas a aspectos objetivos más que a subjetivos), que no pidan al encuestado decantarse "a favor" o "en contra", y que estén relacionadas con el problema de investigación. Si bien, como en otras cuestiones, hay opiniones contrarias. Czaja y Blair

.a decisión sobre qué pregunta poner en primer lugar puede dejarse para el final.

untas clave en el centro del cuestionario as preguntas "clave", aquellas consideradas de especial relevancia para alcanzar bjetivos de la investigación, deberían ubicarse en el centro del cuestionario. Es desu tercio medio, después de haber despertado el interés del encuestado, habiendo ado un ambiente distendido, favorable a la aplicación del cuestionario. Pero, anH~ su cansancio pueda afectar negativamente a la contestación de las preguntas, .niendo respuestas menos meditadas, más precipitadas, y más omisión de respuesta sabe/no contesta"). Esta recomendación adquiere mayor relevancia en las encuestas mediante entrevis~s que en las autoadministradas. En estas últimas, la posibilidad de que el encuestado ~itod9 el cuestionario antes de contestarlo invalida muchas de las actuaciones para re,(:irerrores de medición debidos a la ubicación de las preguntas en el cuestionario.

istribuir secuencialmente las preguntas que formen una batería " Por "batería" se entiende un conjunto de preguntas relativas a una misma cuestión, Ue se complementan, al enfocar distintos aspectos del mismo tema. Es conveniente


282

Métodos de encuesta

que las preguntas que compongan una batería figuren juntas en el cuestionario, formando una unidad. Si bien, en ocasiones, hay que optar por distanciarlas, si quiere evitarse que el encuestado trate de responderlas de forma coherente, por haber percibido la relación existente entre las preguntas anteriores y las posteriores. Aunque, Wanke, y Schwarz (1997) advierten que cualquier intento de separar el contexto y la pregunta de interés puede resultar fútil, si ambas preguntas son bastante similares en contenido y formulación. Cuando se opte por la dispersión, habrá que procurar hacerla de modo que no se confunda o moleste al encuestado. Si una serie de preguntas sobre temas religiosos de repente es interrumpida por guntas sobre renta, los encuestados no sólo pueden experimentar desorientación, que también pueden volverse suspicaces acerca de los propósitos del estudio, Phillips y Orenstein (1978: 223).

Para evitar estas "suspicacias" se aconseja que, siempre que se pase a preguntas de contenido distinto, se haga una breve presentación o introducción en la pregunta, que indique que se pasa a otro tema (por ejemplo, "Cambiando de tema, ..." o "Ahora algunas preguntas sobre ..."). Ello puede contribuir a la comprensión de la pregunta y a que el cuestionario parezca menos caótico. Las preguntas han de tener una secuencia "lógica". El problema está en cómo distribuir las preguntas para evitar el efecto de contexto, debido a la transferencia de significado de una pregunta a la siguiente. Este efecto está más presente en aquellas preguntas que traten un mismo tema o temas relacionados. En estas circunstancias, varias preguntas sobre una misma temática, se aconseja seguir una secuencia que sea lógica y gradual. Una práctica habitual es la llamada técnica del embudo. Consiste en comenzar por preguntas más genéricas, sencillas y menos comprometidas y, poco a poco, pasar a preguntas más específicas, complejas y comprometidas. Cuando se sigue esta secuencia, Singleton y Straits (2002) observan que los encuestados responden a la pregunta especifica (sobre satisfacción matrimonial, por ejemplo) reiterando la información dada con anterioridad en la pregunta general (sobre satisfacción en la vida en general). O sea, interpretan la segunda pregunta como pidiendo nueva información sobre la pregunta general. Para Sheatsley (1983), los encuestados suelen dar respuestas más pensadas a preguntas especificas, cuando éstas se consideran en un contexto más amplio. Pero, en ocasiones, puede preferirse invertir la secuencia de las preguntas, siguiendo la técnica de embudo invertido. Primero, se formulan las preguntas específicas y, gradualmente, se va pasando a preguntas más genéricas. Este proceder muestra mayor adecuación cuando el tema es complejo y el investigador quiere asegurarse que el encuestado considera distintos aspectos al dar la respuesta. Favorece la obtención de una respuesta, a la pregunta genérica, menos precipitada, en la que se han valora- " do aspectos específicos del tema.

Capítulo 4: El diseño del cuestionario

283

Así lo constataron Schuman y Presser (1981/1996), quienes captaron, por ejemplo, un mayor porcentaje de personas que se autodeclaraban "felices" en la vida en general cuando esta pregunta figuraba en primer lugar (520/0) que cuando aparecía después de una pregunta específica sobre la felicidad conyugal (38%). En la misma fecha se publica el estudio experimental de McFarland (1981), en el que se obtiene un mayor porcentaje de personas que dicen estar "muy interesadas" en la religión, cuando esta pregunta genérica ("¿Cómo de interesado diría Ud. que está en temas religiosos, muy interesado, algo interesado o no muy interesado?") 'era precedida por una especifica ("¿Ha asistido por propia convicción a la iglesia durante los últimos siete días?"). Un 64% de los sondeados, mientras que cuando aparecía al principio el porcentaje descendía al 56% .

i~~§acuerdo con Wanke y Schwarz (1997), formular varias preguntas especificas ans;:de-una general induce a interpretar la pregunta general como pidiendo un juicio de --:-$u111.en . <"'Eh suma, el preguntar antes por aspectos concretos o específicos contribuye a una ;~~f>llesta más reflexiva sobre cuestiones generales, porque favorece la valoración pre.:tiª;Qe, aspectos concretos. También, ayuda a reducir la no respuesta. Así lo constata Sigelman (1981), en una comprobación de la reacción ante una famosa pregunta Gallup: ¿Aprueba o desaprueba la forma en que _x _ está llevando a cabo su trabajo como presidente? Cuando esta pregunta seguía a una serie de 48 ítems sobre un amplio rango de asuntos sociales y políticos, se obtenía un menor porcentaje de no respuesta que cuando figuraba al principio. Igualmente, es de esperar que una pregunta genérica sobre el grado de satisfacción con la actuación del Gobierno, por ejemplo, recoja una respuesta diferente y, posiblemente más negativa, cuando es precedida por preguntas especificas que aluden a actuaciones gubernamentales concretas que han suscitado una peor valoración de la opinión pública (como el conflicto de Irak o el desastre del Prestige). ':~aspreguntas generales son las más sensibles al efecto de orden. Las distribuciones ~l:1~ respuestas difieren en consonancia con la localización de la pregunta en el cues-

e'ario, más que las especificas (Kalton, Collins y Brook, 1978; Schuman y Presser, ,-1./1996; Mason, Carlson y Tourangeau, 1994). Estos tres últimos autores demues<~p;que el poner una pregunta abierta entre dos cerradas puede reducir el efecto de or,,~it'gedos preguntas cerradas.

f!:t>~";";.t-\..simismo, la mayoría de los efectos de asimilación (o de consistencia de la res"t~ta.de la pregunta posterior aJa anterior) suceden cuando varias preguntas espeicaspreceden a una general (Schwarz, Strack y May, 1991). Los efectos de contras::(eFdar respuestas contrarias en las preguntas posteriores) es, en cambio, más ~itual, cuando sólo una pregunta especifica se formula inmediatamente antes que la ~~eral. Por su parte, Kalton y Schuman (1982/2002) hablan del efecto de sustracción -::,:_deresta). Después de responder a una pregunta especifica, los encuestados asumen ,JJ.eJa pregunta general excluye la parte especifica.


284

Métodos de encuesta Capítulo 4: El diseño del cuestionario

Cuando se diseña un cuestionario para ser autorrellenado por el propio encuestado hay que tener presente, además, que los efectos de contexto no se asocian necesariamente al orden de las preguntas. La respuesta a una pregunta puede estar influida por preguntas precedentes, al igual que por posteriores. Aunque las preguntas estén dispuestas en un orden predeterminado en el cuestionario, el encuestado puede leer todo el cuestionario antes de empezar a responder. También, puede contestar las preguntas a "saltos", en función de su sencillez o interés. Ello incide en que se desaconseje seguir la técnica del embudo en la encuesta autoadministrada porque pierde efectividad. No así la técnica del embudo invertido: comenzar por preguntas especificas y, gradualmente, pasar a preguntas genéricas. El que la encuesta autoadministrada esté menos expuesta a efectos de orden de las preguntas, respecto a la personal y telefónica, no significa que no existan efectos de contexto. Preguntas relacionadas pueden influir unas en otras también en la encuesta autoadministrada. Como muestran Schwarz y Hippler (1995), en un experimento en el que comparan las respuestas obtenidas en una encuesta telefónica y una encuesta por correo. Preguntas "amenazantes" al final del cuestionario

Las preguntas que puedan percibirse, por parte del encuestado, como "amenazantes" es mejor situarlas al final del cuestionario. Cuando la reacción a ellas no pueda afectar a la contestación de preguntas posteriores. De ahí que la práctica común sea disponer las preguntas sociodemográficas de identificación (edad, nivel de estudios, ocupación, estado civil, religiosidad, ideología política, ingresos) al final del cuestionario. Ello se debe, principalmente, a su consideración de "personales", a la reacción negativa que puede provocar en el encuestado el proporcionar datos de" identificación personales. Principalmente, los relativos a ingresos e ideología política. Estos, como ya se ha dicho, suelen presentar un mayor porcentaje de no respuesta frente a otros sociodemográficos, como edad o estudios. Además, es más probable que disminuya la r~­ sistencia a informar "adecuadamente" de datos "personales", cuando ya se ha averIguado el propósito de la encuesta, habiendo respondido a la práctica totalidad de las preguntas que integran el cuestionario. De todas formas, es conveniente que el bloque de preguntas sociodemográficas sea precedido por una introducción ( o preámbulo), que indique su finalidad en la investigación; que aclare su significado y utilidad en la interpretación de los resulta~os de l~ ~~­ cuesta; que informe al encuestado de la necesidad de su respuesta para reahzar anahsls comparativos de grupos de población diferentes e indagar en la explicación de las respuestas dadas. Preguntas referidas a características sociodemográficas han de estar presentes en todo cuestionario. Las opiniones, actitudes, conductas de las personas pueden estar afectadas por su perfil sociodemográfico. De cuantas más características ~o­ ciodemográficas se recoja información, mejor para la explicación del objeto de estudIO. No obstante, a veces hay que colocar algunas preguntas sociodemográficas al principio del cuestionario. Cuando éstas actúan de preguntas filtro, que permiten

285

seccionar a la población a la que corresponde hacer una serie de preguntas porque comparten una característica concreta. p'0r ejemp!o, e.star jubilado, ser estudiante, tener una segunda vivienda. En un

e~tudlO que qUIera mdagar en las relaciones entre padres e hijos, es necesario que pre:lamente se formulen preguntas relativas a la situación familiar (estado civil si tiene hiJOS o no, cuántos hijos, de qué edades), que actúen de filtro de los encuestad~s que puedan aportar información.

En general, las preguntas "amenazantes", sobre temas delicados o sensibles nunca deberían .fi~,urar al principio del cuestionario porque suelen suscitar un ~ayor err?r de medlczon y de no respuesta que cuando se ubican al final. Lo más conveniente es Ir gradualmente de preguntas menos amenazantes a las más inhibidoras. Preferiblemente, ubicarlas después de una serie de preguntas relacionadas.

~:ocedien?o de est~ .forma, Dohrenwend (1970) consiguió que una mayor proP?rCIOn de ~uJeres admItIeran haber tenido un aborto. Principalmente, mujeres de un nIvel educatIvo más alto. Este ~esultado ~dquiere mayor relevancia, si se tiene presente que l~~ pe~?nas de mayor nIvel educatIvo son las más propensas a proporcionar resp.uestas p.ohtIcamente correctas", a enmascarar conductas, opiniones o actitudes soCialmente mdeseables, al ser más suspicaces sobre la intencionalidad de la pregunta. Este e!.ecto d~ ~;cuencia Molenaar (1982) y Bradbum (1983) lo interpretan como cW'H!;sif;J"~ft'f:'cf:(i·i'··:f,·.~P-·¡,-p~,:p~lrn~ empatla · El precede~pr~~ntas sobre cuestiones socialmente sensibles por pero menos IllhIbtdoras, puede contribuir a establecer una mayor "0'1:·:':!J·fjti.,"~{}~ii'·:;/(~mlr;atíao co~p~netración con el encuestado, que ayude en su desinhibición, dando una mas SIncera que cuando no se procede de esta forma gradual. último, ha de !~sistirse en la conveniencia de diseñar un cuestionario no muy tr'X'.'.ex,tenso. Una norma baStea, en la elaboración de un cuestionario, es evitar fatigar al en';C)~-~lg.~~tadlo para que no merme la calidad de sus respuestas. Como observa Molenaar ·'>\:·.;(;lC.Z;.J~ los efectos de fatiga ocasionan respuestas menos discriminantes. ade~ás se relaciona con un mayor error de no respuesta. Por éstas, y otras ra2:ºn.es" ha de reIterarse en l~ r~comendación de eliminar toda pregunta que sea reon~. relevante ~,los obJetI~os de la investigación, aunque al investigador le pue;:·.q.~l,p(lrelcer mteresante . Es muy Importante dedicar tiempo suficiente a meditar la inexa~ta que se precisa para cumplir los objetivos esenciales de la encuesta. es.el numero de preguntas lo que determina la amplitud máxima de un cuesi,!l~~na;no" Silla la duración media de su cumI?lim~ntación. Po: lo general, se aconseja que i{:q~)S(}lJr'ep.ase,l~s tres cuartos ~e hora. Mejor St dura no mas de treinta minutos. En la telefomca no se reconuenda una duración superior a 15 minutos. En la encuesta h;c"..U·fU¡r.lC~(}rn en la calle, inc~~so menos: no más de 5-10 minutos. Sin embargo, ha de mapercepclon sobre su duración en función del interés que el tema desel encuestado, cómo se haya diseñado el cuestionario y la destreza del en-


286

Métodos de encuesta

trevistador en su administración (en encuestas mediante entrevista). Más que la longitud del cuestionario en sí, es el interés que el tema despierte en el encuestado lo que repercute en su atención y sensación de cansancio. Para temas notorios, las entrevistas personales pueden durar de una hora a hora y media, y son posibles cuestionarios por correo en torno a 16 páginas. Para temas no notorios, los cuestionarios por correo suelen limitarse de 2 a 4 páginas (Sudman y Bradbum, 1987: 227). Una entrevista de 20 minutos puede parecer insufrible si el contenido del cuestionario es difícil o aburrido o hace que el respondiente se sienta incómodo. Por otro lado, una entrevista de 2 horas puede ser una experiencia bastante agradable, si los respondientes perciben que la encuesta es de valor, reconocen su propia importancia y han sido preparados para la duración de tiempo que en realidad requiere (Sheatsley, 1983: 222).

Respecto al diseño del cuestionario, han de evitarse largas series de preguntas que compartan un mismo formato (tipo escala gradual desde "muy de acuerdo" hasta "muy en desacuerdo", por ejemplo), porque suele provocar cansancio y aburrimiento en el encuestado. Cuando se precise su inclusión, mejor alternarlas, a lo largo del cuestionario, con preguntas de formato diferente. En general, se aconseja disponer las preguntas intercalando distintos formatos de pregunta: preguntas abiertas con cerradas, cerradas que precisen del uso de tarjeta (en entrevista cara a cara) con aquellas que no la requieran. Se trata de variar la tarea del encuestado, evitando la monotonía en su cumplimentación del cuestionario, porque ésta puede afectar negativamente a la calidad de su respuesta. Sobre otros aspectos del diseño del cuestionario se va a hablar en el apartado siguiente. De la actuación del entrevistador, en el capítulo 5.

Capítulo 4: El diseño del cuestionario

287

Si la encuesta es mediante entrevista, la presentación puede iniciarse con la identificación del entrevistador ("Hola, buenos días/tardes. Me llamo __ Estoy realizando una encuesta para _ _"). Después, en cualquier modalidad de encuesta, se describe, sucinta y de forma general, la finalidad de la encuesta, el procedimiento seguido en la selección del encuestado, el tipo de información que se precisa, el interés del estudio y los beneficios de su participación. Esto último es muy importante que se resalte. No se olvide que el propósito del mensaje de presentación es, precisamente, motivar a la persona seleccionada para que participe en la encuesta. Participación que se verá incrementada cuando el estudio interesa a la persona, pues ésta percibe la relevancia de su colaboración (que su opinión es importante) y cómo repercutirán los resultados del estudio en su beneficio (que tendrá consecuencias deseables). También inciden las garantías de confidencialidad y de anonimato que se proporcionarán a la información por él dada, como se dijo en el capítulo 2. Por esta razón, estas "garantías" son un integrante básico y destacado en todo mensaje de presentación, como se ilustra en los ejemplos a continuación. Y, todo ello, de forma breve para pasar, inmediatamente, a formular las preguntas del cuestionario. Una presentación extensa puede desmotivar la participación en la encuesta. De manera especial, en la encuesta telefónica. Da la oportunidad de pensar en objeciones para no participar. Mientras que la negativa a colaborar en la encuesta es más improbable que se produzca una vez que comienza la entrevista, y las primeras preguntas logran enganchar al encuestado, por su interés y fácil resolución. Por último, si se trata de una encuesta telefónica, también es importante verificar el número de teléfono marcado por el entrevistador, antes de comenzar la entrevista. o

4.4. La presentación del cnestionario Todo cuestionario comienza con un mensaje de presentación, que ha de ser cuidadosamente elaborado. De él también depende la calidad de la encuesta, por su incidencia especial en los errores de no respuesta y de medición. Cuando el mensaje preparado no logra retener entre el 30 y el 40% de las personas contactadas se está, de acuerdo con Sheatsley (1983: 219), ante "una mala encuesta. No importa lo bien que esté diseñado el cuestionario". En el error de medición incide en la medida en que pueda propiciar que la persona seleccionada responda con sinceridad y detenimiento a las preguntas que se le planteen. Para contribuir a la reducción de ambos errores, conviene que la presentación comience con la identificación de la institución o centro responsable de la investigación. Esto ayuda a dar seriedad al estudio, en mayor medida cuando es de prestigio reconocido. A veces se da el nombre del patrocinador de la encuesta, siempre y cuando se prevea que puede contribuir a la participación en la encuesta. No cuando se piense que pueda sesgar los datos de la encuesta o incitar a no participar en la investigación.

A) Mensaje de presentación estándar en encuestas personales en hogares españoles, realizadas por el Centro de Investigaciones Sociológicas (CIS). Buenos días/tardes. El Centro de Investigaciones Sociológicas está realizando un estudio sobre temas de interés general. Por este motivo solicitamos su colaboración y se la agradecemos anticipadamente. Esta vivienda ha sido seleccionada al azar mediante métodos aleatorios. Le garantizamos el absoluto anonimato y secreto de sus respuestas en el más estricto cumplimiento de las leyes sobre secreto estadístico y protección de datos personales. Una vez grabada la información de forma anónima, los cuestionarios individuales son destruidos inmediatamente. B) Estudio evaluativo de los Centros Municipales de la Tercera Edad de Madrid, realizado entre 1991 y 1992, por M.ª A. Cea D'Ancona y M. S. Valles Martínez (financiado con una Ayuda a la Investigación por el Ayuntamiento de Madrid).


288

Métodos de encuesta

Un equipo de estudiantes y profesores de la Universidad Complutense de Madrid estamos realizando una encuesta entre los socios de Centros Municipales de la Tercera Edad, para el Área de Servicios Sociales del Ayuntamiento. Ya hemos estado en el Centro "_ _" y nos hemos presentado a la asistente social responsable del centro (" "), a la animadora ("_ _") y a la Junta Directiva ("_ _"). Ha sido usted seleccionado/a, mediante procedimientos aleatorios, entre otros cientos de personas, para que nos conteste a unas preguntas. No se preocupe, pues las preguntas son muy fáciles y nadie sabrá que usted las ha respondido. Con su colaboración y la de todas las personas entrevistadas se podrá hacer un estudio que servirá para mejorar los centros de mayores. Estos mensajes de presentación aparecen impresos en los cuestionarios respectivos. El entrevistador tiene que aprenderlos, memorizarlos, pero nunca leerlo, literalmente, cuando contacta con un posible entrevistado. Sirven de pauta para su presentación de la encuesta.

Cuando el cuestionario se administra mediante entrevista cara a cara o telefónica, el entrevistador es el encargado de realizar esta presentación de forma verbal. En la encuesta por correo, esta introducción a la encuesta figura en forma de carta de presentación, que precede al cuestionario. En ella se detallan, brevemente, los aspectos referidos. Su extensión no debería superar una página para favorecer su lectura. Conviene que la carta incluya la fecha en que debe remitirse el cuestionario. Normalmente, dos semanas máximo después de la fecha de envío. Asimismo, se recomienda que ofrezca un número de teléfono para cualquier aclaración que el encuestado precise. Éste se añade al nombre y dirección de la entidad responsable del estudio. En la carta de presentación también figuran las instrucciones básicas para la correcta cumplimentación del cuestionario. Por ejemplo, en preguntas cerradas: ponga una cruz en el recuadro junto a la respuesta elegida; rodee con un círculo el número que corresponda a su respuesta (es preferible el círculo a tachar el número para evitar equívocos); en preguntas abiertas: escriba su respuesta en las líneas impresas adjuntas en la pregunta.

Además, es habitual incorporar una ilustración gráfica, dibujo o fotografía porque contribuye a darle una apariencia de profesionalidad. A ser posible, una imagen sencilla y abstracta. Díaz de Rada Yotros (2003) comprueban la importancia de la portada y del color del cuestionario (preferiblemente blanco) en la encuesta postal. Asimismo, es usual incorporar algún tipo de incentivo o gratificación con el envío o prometerlo tras la devolución del cuestionario rellenado, como estrategia para aumentar la tasa de respuesta (véase apartado 2.3). Aunque la gratificación simplemente sea el proporcionarle los resultados de la investigación.· Cuando se trata de una gratificación "prometida", en la carta se indica el procedimiento a seguir para su obtención. Es habitual que la gratificación "prometida" se solicite mediante una tarjeta que

Capítulo 4: El diseño del cuestionario

289

incluye en elenvío, junto al ~uestionario. En ella aparecen los datos personales del estinatario del cuestionario. Estos son de gran utilidad para saber quién ha devuelel cuestionario, sin tener que poner ningún dato de identificación en el mismo. El ~eestionario se remite al organismo responsable de la investigación en un sobre aparte de franqueo en destino o con un sello conmemorativo, como recomienda el médo TDM de Dillman (apartado 2.3). En un envío diferente al de la tarjeta, para salguardar el anonimato del cuestionario. La carta concluye agradeciendo, de antemano, la colaboración de su destinatario eún el saludo cordial y la firma del responsable de la investigación. A ser posible, en glíg rafo azul para darle un toque más personal. Denota que las cartas se han firmabuna a una.

.. A continuación se extracta la carta de presentación que figura en la portada de un l.J~stionario enviado al domicilio de la autora, diseñado por METRA-SEIS, S. A., tal y como arece impreso. Sólo se omite la dirección del receptor y el logotipo de la empresa que fiel estudio: Volkswagen-Audi España, S. A.

VOLKSWAGEN-AUDI, S.A. Parque de Negocios Mas Blau 11 C/ de la Selva, 22 08820 El Prat de Lobregat (Barcelona)

I

SU VISITA AL TALLER

de Octubre de 2003. Estimacla Sra. CEA: Recordará que hace unos días le enviamos una carta/cuestionario como ésta, invitarldo,le a participar en el estudio que VW está realizando a través de Metra Seis. La finalidad de VW es mejorar constantemente su servicio, y su opinión en este sentido es fundamental, motivo por el cual te reiteramos la importancia de su colaboración invitándole nuevamente a rellenar el cuestionario. Si ya lo hubiera hecho y su respues~ se ha cruzado con esta carta, agradecemos de antemano su colaboración rogándole no vuelva a enviarlo. Como ya le decíamos en nuestra carta anterior, en compensación a sus molestias participará en el sorteo que se celebrará, ante notario, en Enero del próximo año, en el que puede ser agraciado con un GOLF (véase la tarjeta adjunta), siempre y cuando su

I


290

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

cuestionario sea recibido en nuestras oficinas en un plazo de 30 días a partir de la fecha de esta carta. El resultado del sorteo será comunicado mediante carta certificada al ganador. Una vez cumplimentado este cuestionario, le rogamos lo remita en el sobre adjunto de franqueo en destino. Agradeciéndole de antemano su colaboración, reciba un cordial saludo.

Karl H. Weber. Director de Postventa. EL N.º CON EL QUE Ud. PARTICIPA EN EL SORTEO ES: *R 09 08180673 Cumplimentar este cuestionario es voluntario. Las respuestas serán confidenciales, garantizándole el absoluto anonimato y que no se asociarán informáticamente a Ud., utilizándose sólo a nivel estadístico para valorar el grado de satisfacción y determinar los puntos de mejora. Si desea ejercitar su derecho de acceso, rectificación, cancelación y oposición, dirija su escrito a VW Audi España, S. A., Selva, 22 Parque de Negocios Mas Blau 11,08820 El Prat de Lobregat (Barcelona). Es muy importante que rellene el cuestionario siguiendo las siguientes instrucciones: - Este cuestionario debe ser cumplimentado por la persona que habitualmente lleva el coche al taller. - Utilice un lápiz para corregir si se equivoca. Borre los posibles errores para que el escáner no los lea. ~ - Marque con una cruz (así: ~, no así: la casilla que corresponda a su respuesta. - No escriba en los recuadros que están sombreados.

U

EJ Q )

Sus opiniones deben referirse exclusivamente al concesionario DONDE REALIZÓ SU ÚLTIMA VISITA. En caso de que éste no sea EL QUE FIGURA EN EL RECUADRO, por favor, indique a continuación el nombre correcto del mismo.

CONCESIONARIO:(0311H) ~ FERPER, S.A. U-.l.-LJ

291

final del cuestionario autoadministrado es habitual proporcionar un espacio paque el encuestado realice comentarios adicionales. Ya acerca del tema de la encuesta orejemplo, "Si hay algo más que Ud. desea añadir acerca del tema de la encuesta, r favor, escríbalo en el espacio en blanco a continuación"), ya sobre el cuestionario sll cumplimentación. En los cuestionarios administrados mediante entrevista debe reservarse un espacio palos datos de control, necesarios para la supervisión del trabajo de campo. Los referidos procedimiento a seguir en la selección de los entrevistados pueden aparecer al principio cuestionario, antes del mensaje de presentación: n.O de estudio, n.o de cuestionario, Cü'dad autónoma, municipio, tamaño de hábitat, distrito, teléfono, fecha, nombre entrevistador, código y datos fijados para las cuotas (generalmente, sexo y edad) y las ,si se sigue un muestreo por rutas aleatorias. En cambio, los concernientes a la reación de la entrevista, lo habitual es que figuren al final del cuestionario. .. Por ejemplo, en los cuestionarios realizados por el Centro de Investigaciones ciológicas los datos de control incluyen distintos apartados a rellenar por el entrey en la codificación de los cuestionarios. el entrevistador:

• Incidencias de la entrevista: número de orden de la entrevista (por muestra), portales en los que el portero impide entrar, viviendas en las que no hay nadie, viviendas en las que se niegan a recibir ninguna explicación, negativas de varones/mujeres a realizar la entrevista, contactos fallidos por no cumplir la cuota, contactos fallidos por no existir viviendas (edificios públicos, oficinas, etc.). • Entrevistas realizadas: entrevista conseguida (calle o plaza, número, piso, puerta), fecha de realización (día, mes, año), día de la semana que se realiza la entrevista, duración de la entrevista (en minutos), hora de realización. • Valoración de la entrevista: desarrollo de la entrevista (muy buena, buena, regular, mala, muy mala) y sinceridad del entrevistado (mucha, bastante, poca, ninguna). A rellenar en codificación:

• Cuestionario cumplimentado: correcta, incorrectamente (motivo). Valoración de la inspección: entrevista no inspeccionada, inspección telefónica, inspección personal, personal y telefónica. Resultado de la inspección: correcta, incorrecta (motivo). Resultado final: entrevista válida, anulada.

EN CASO DE SER INCORRECTO, ANOTE AQuí

METRA SEIS

f-\(Jlenlas de esta información necesaria para la supervisión del trabajo de campo, ser de interés añadir un espacio en blanco para anotar cualquier observación real cuestionario y al desarrollo de la entrevista. Cuando ésta se lleva a cabo en el domicilio del entrevistado, cara a cara, puede ser de interés dejar espacio anotaciones referidas a la vivienda y al propio encuestado, si éstas pueden conen la explicación de los resultados de la encuesta.


292

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

En resumen, se aconseja incluir en el cuestionario toda información que pueda ayudar en la evaluación posterior de los datos de encuesta. Incluye los convencionales datos de control antes referidos, en la encuesta mediante entrevista, y las "observaciones" que el entrevistador pueda hacer a su término. En especial, las referidas a: a) La actitud del encuestado durante el desarrollo de la entrevista (si mostró interés, tenía prisa, respondía las preguntas rápida o sopesadamente, si manifestó algún tipo de inhibición en alguna pregunta, sinceridad y similares). b) El desarrollo de la entrevista (lugar donde se realizó, si había otras personas presentes, si se realizó en un ambiente tranquilo, si el entrevistado fue interrumpido en alguna ocasión, por qué razón, si hubo problemas de entendimiento en la comprensión de alguna pregunta y en la capacidad de expresión del encuestado.

En cuanto alformato del cuestionario, debe cuidarse en extremo. La impresión que cause afectará tanto al error de medición como de no respuesta total (que no se conteste el cuestionario) y de ítem o pregunta. Más grave, si cabe, cuando la pregunta no ha obtenido respuesta por haberse pasado de largo (por omisión). Aunque el investigador pueda tener sus propias preferencias por formatos concretos, en general se recomienda: a) Elformato de libro, con preferencia a hojas grapadas. Parece más profesional, facilita la lectura, la vuelta de página y evita la pérdida de hojas. b) Impresión atractiva, que sea fácil de leer (en letra clara y en tamaño que permita ser leído con facilidad). A ser posible, en papel de buena calidad (sobre todo, cuando se reproduce en dos caras), de color blanco o pastel. En cuestionarios que incluyen apartados diferentes o dirigidos a distintos grupos de población (por ejemplo, cuestionarios para amas de casa, estudiantes, jubilados, padres, hijos, etc.) puede ser de gran ayuda, en su administración, su impresión en colores diferentes. Páginas impresas en colores distintos ayuda a identificar la estructura del cuestionario. c) Imprimir el cuestionario a doble cara en dos columnas. Abarata los costes de reproducción de los cuestionarios y de envío postal (en encuestas por correo), al tener menos peso, por haberse reducido el número de hojas. Además, transmite la sensación de brevedad (el cuestionario no es muy extenso), necesaria para no desanimar a su destinatario. Incluso puede aumentarse a tres el número de columnas, siempre y cuando las preguntas aparezcan espaciadas, nunca agrupadas o apelotonadas. Es importante que las preguntas aparezcan espaciadas (con espacio en blanco alrededor de ellas) y que la página presente márgenes equilibrados (derecha e izquierda, arriba y abajo). La apariencia del cuestionario es preeminente. Debe facilitar la lectura, ser manejable, sencillo de rellenar y con espacio suficiente para responder a las preguntas. La disposición de las preguntas sin apenas espacio entre ellas, con la intención de que el cuestionario parezca más

293

corto, provoca efectos no deseados: una menor cooperación, por parte del encuestado, y una mayor probabilidad de cometer errores en su cumplimentación (Sudman y Bradburn, 1987). La densidad de la escritura puede desanimar a los encuestados tanto como el número de páginas en el cuestionario (Henerson y otros, 1987: 79).

También puede optarse por delimitar las preguntas, separándolas por líneas, a modo de recuadros, como hace el Centro de Investigaciones Sociológicas, para marcar su empiece y final. d) Las preguntas aparecen ordenadas en sentido vertical y numeradas consecutivamente, con números arábigos (de 1 a n). Aquellas que figuran bajo un mismo cabecero pueden identificarse añadiendo una letra (A, B, C, D). Los números de las preguntas se destacan para su mejor identificación (en un color diferente, subrayándose, imprimiéndose en otro tipo de letra). Nunca debe dejarse una pregunta sin numerar porque facilita su omisión. e) En preguntas cerradas, disponer las distintas alternativas de respuesta en sentido vertical, acompañadas por su código numérico. También puede adjuntarse un recuadro, si se prefiere que se marque con una cruz la casilla que corresponda a la respuesta. Por ejemplo, P.ll. ¿Tiene Ud. hijos?

1. Sí D 2. No D

o, alternativamente:

1. D Sí 2. D No

f) En preguntas abiertas, proporcionar espacio suficiente para que se anote la respuesta. Recuérdese que el espacio suele interpretarse como indicador de cantidad de información que se desea. Normalmente aparecen líneas (__). Aunque también puede optarse por dejar un espacio abierto. De acuerdo con Sheatsley (1983: 224), "el espacio abierto proporciona más flexibilidad", porque la escritura suele variar de tamaño de unas personas a otras. Lógicamente, la cantidad de espacio dejado variará con la respuesta esperada. En preguntas abiertas numéricas pueden adjuntarse cuadrados para indicar el número de dígitos que se piden.

Mes

Por ejemplo,

Año

o=] 190=]

g) Evitar que las preguntas queden partidas entre páginas. Una pregunta, incluyendo todas sus categorías de respuesta, nunca debería figurar entre dos páginas. h) Una pregunta larga, que incluya varias partes, no ha de ser seguida por una pregunta breve al final de la página. Se trata de evitar su omisión por error (que se pase de largo).


294

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

295

i) En encuestas mediante entrevista, proporcionar instrucciones al entrevistador, en lugares apropiados a lo largo del cuestionario. Estas instrucciones han de po-

derse identificar con facilidad, mediante una impresión diferenciada del resto. Acudiendo a letras mayúsculas, cursiva, negrita o a otros recursos tipográficos, por ejemplo. Las instrucciones son exigibles en preguntas complejas o cuando se prevea que puedan generar confusión. También, cuando se cambia de tema, para no desorientar al encuestado. En especial, en las entrevistas telefónicas. Como Bosch y Torrente (1993: 97) afirman, "tratar de economizar unos segundos no poniendo ninguna transición redunda en más segundos de preguntas de aclaración por parte del entrevistado como: ¿Pero Ud. no me preguntaba sobre tal tema?". Esta exigencia es mayor cuando se formulan preguntas de carácter personal. Ha de evitarse que el entrevistado cuelgue el teléfono o deje por concluida la entrevista. Las instrucciones se ponen delante de la pregunta, si tienen que ver con la manera de formular o de responder la pregunta. Por el contrario, aparecen detrás de la pregunta si se refieren al modo de regist~ar las respuestas, o de señalar al entrevistador cómo debería sondearlas. Estas han de ir impresas en el mismo tipo de letra (mayúsculas, cursivas, negrita u otra variedad) en todo el cuestionario y en el mismo formato (entre paréntesis, corchetes, en un recuadro). Igualmente, ayuda la preparación de especificaciones que acompañen al cuestionario: comentarios explicativos y clarificaciones, que ayuden a resolver complicaciones que surjan en el desarrollo del trabajo de campo. j) En preguntas filtro, dar instrucciones (literales, mediante flechas, recuadros) que apunten a la siguiente pregunta. Es esencial que la instrucción figure inmediatamente después de la respuesta. De este modo es menos probable que el entrevistador (o el encuestado) lo pasen por alto. Recuérdese que una pregunta filtro es aquella que se formula con anterioridad a otra (u otras), con la finalidad de eliminar a los sujetos a los que no procede hacer la pregunta siguiente. Es fundamental que en el cuestionario quede bien indicado qué preguntas corresponde seguir contestando. Esto puede hacerse mediante flechas, si sólo se va a hacer una o, a lo máximo, dos preguntas; o mediante recuadros, si son dos o más las preguntas a realizar. A ser posible, en un tono gris claro, u otro, para destacarlo más del resto del cuestionario. El recuadro es muy deseable porque ayuda a la mejor visualización de la serie de preguntas a formular a una parte concreta de encuestados. Aquellos a los que no corresponda, pasan a responder las preguntas situadas después del recuadro. Es preferible que las bifurcaciones debidas a las preguntas filtro aparezcan en una misma página.

P.15. ¿Está Ud. jubilado? Sí No

1

.(54)

P.18. Respecto a la relación con sus vecinos del edificio, ¿ diría Ud. que se lleva bien con. .. ?

2

SÓLO SI ESTÁ JUBILADO/A

P.16. ¿A qué edad se jubiló Ud. ? (55-56) [ " SÓLO SI SE JUBILÓ ANTES DE LOS 65 AÑOS

Todos La mayoría de ellos 2 Unos pocos solamente 3 Ninguno 4

(64)

E

P.18.A. ¿A qué se debe?

_

(65)

P. 19. ¿ Ha participado en la organización de alguna de las actividades del centro? P. 17. Desde que Ud. se jubiló, ¿se ha visto afectado por alguna de las siguientes circunstancias? (LEER CADA UNA). Sí No - Ha perdido al cónyuge 1 2 (58) - Ha transmitido la herencia a sus hijos 2 (59) ....; Ha dejado de consumir algunos productos 2 (60) - Ha tenido que solicitar algún tipo de ayuda 2 (61) - Ha vendido su casa 2 (62) - Han disminuido sus amistades 2 (63)

Sí r---+-- No

1

(66)

2

P1~A.¿Cuá~s?

_

(67-68) (69-70) (71-72)

P.19.B. ¿Porqué no?

_

(73)

k) Preparar el cuestionario para el procesamiento de los datos. Ahorra tiempo y dinero. Esta preparación supone las actividades previas de precodificación de las preguntas cerradas (explicada en el subapartado 4.2.2) y la precolumnación del

cuestionario entero. O sea, asignar a cada pregunta una localización de columna para su procesamiento informático.


296

Métodos de encuesta

Aunque la precolumnación es cada vez menos necesaria, por las características de los actuales programas informáticos de grabación de datos para su posterior análisis estadístico, sí lo es la concepción de qué es una pregunta en un cuestionario. No siempre coincide con la numeración que figura expresa en el cuestionario. Bajo un mismo rótulo de pregunta puede haber varias preguntas que compartan las mismas opciones de respuesta. Como sucede en las preguntas que presentan un formato de escala (subapartado 4.2.3), habiendo tantas preguntas como ítems o frases incluya; y en las preguntas múltiples, que en realidad suponen tantas preguntas como número de respuestas se soliciten. De ahí la conveniencia de precolumnar el cuestionario, de reflexionar expresa o implícitamente sobre la posterior configuración de la matriz de datos que del cuestionario va a extraerse, en lo referido al número de variables incluidas en el mismo rótulo de pregunta. El otro integrante de la matriz de datos, los casos, lo da el tamaño de la muestra analizada. Como ya se dijo en el subapartado 4.2.2, la precolumnación consiste en asignar a cada pregunta del cuestionario una o más columnas, dependiendo del número de respuestas posibles. Si la pregunta es cerrada, ya se conoce, con certeza, el número de columnas que requerirá. Pero, si la pregunta es abierta, debe preverse el tipo y el número de respuestas posibles. A menos que la respuesta sea numérica, generalmente no se precisa más de dos columnas. Si son menos de diez las opciones de respuesta posibles, incluyendo la no respuesta (generalmente se reserva el código 8 para "no sabe" y el 9 para "no contesta"), se asigna una sola columna a la pregunta. Si son diez o más las respuestas, dos columnas. En este último caso se codificarían las respuestas desde 00, 01, 02, ... hasta 99 (dejando los códigos 98 para "no sabe" y 99 para "no contesta"). En preguntas abiertas numéricas habrá tantas columnas como número de dígitos se consideren. Por ejemplo, en la pregunta "Número de habitaciones en su vivienda", pueden dejarse dos columnas, si se prevé que, incluida la no respuesta, se den cifras de dos dígitos (10 habitaciones, por ejemplo). En "Metros cuadrados de su vivienda", tres columnas porque no se prevén viviendas que sean de 100 metros cuadrados o más. En cambio, en "Metros cuadrados de su parcela", el número de columnas aumenta a cuatro, cinco e, inclusive, más, dependiendo de la población de estudio.

Cuando el encuestado puede dar más de una respuesta en una misma pregunta (pregunta múltiple), el número de columnas depende del número de respuestas que se pidan. También, del tratamiento informático que se dé a esta columnación especial. Los códigos correspondientes a las columnas suelen imprimirse en el margen derecho de la pregunta. Las primeras columnas habitualmente se dejan para los datos de control del cuestionario. Aquellos que permitan la identificación de cada registro (encuestado) con su cuestionario, una vez que la información se transforma en códigos numéricos para su posterior grabación en el fichero de datos. Básicamente, número de estudio, número de cuestionario y los referidos

Capítulo 4: El diseño del cuestionario

297

a su localización espacial (comunidad autónoma, provincia, municipio, tamaño de hábitat) u otra de interés. Depende del universo de estudio. Por ejemplo, en una encuesta a estudiantes universitarios, de toda España, se incluirían como básicas las utilizadas en el diseño de la muestra: universidad, facuItad y curso, como mínimo. A veces, se añaden los relacionados con la administración del cuestionario: entrevistador, duración de la entrevista, etc.; que pueden figurar al principio o al final del cuestionario.

(1-4) (5-8) (9-10) (11-12) Pro'vincia - - - - - - - - - - Murlicip,io - - - - - - - - - - - -_ _ (13-15)

P.1.¿Está o ha estado Ud. casado con anterioridad? Sí No

1

(16)

2

[

P.2. De la sigúiente lista de cualidades, por favor escoja las tres que más valora en una persona. (Pregunta múltiple.) (MOSTRAR TARJETA A)

Lealtad Sinceridad Tolerancia Amabilidad Simpatía Humildad Sencillez Perseverancia Entrega Honestidad Afabilidad

1.°

2.°

3.°

(20-21 )

(22-23)

(24-25)

01 02 03 04 05

01 02 03 04 05

01 02 03 04 05

06

06

06

07 08

07 08

07 08

09 10 11

09 10 11

09 10

11


298

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

P.3. A continuación vaya leerle una serie de frases. Me gustaría que Ud. me dijera, para cada una de ellas, si está muy de acuerdo, en desacuerdo o muy en desacuerdo. Frases

Muy de De En Muy en NS/ acuerdo acuerdo desacuerdo desacuerdo NC

Lo más importante que puede hacer la mujer en la vida es tener hijos.

4

3

2

1

9

(26)

Los novios no deberían casarse hasta no tener el porvenir totalmente resuelto.

4

3

2

1

9

(27)

La mujer casada debe trabajar, aunque no sea necesario para el sostenimiento del hogar.

4

3

2

1

9

(28)

Hay trabajos de hombres y trabajos de mujeres y no deberían mezclarse.

4

3

2

1

9

(29)

Aunque se insiste en que no todos los cuestionarios son previamente precolumnados. Depende del sistema de grabación de los datos de encuesta que se utilice. Los sistemas CADAC no precisan de la precolumnación. Tampoco es necesaria en las encuestas convencionales, si la grabación de los datos se hace en programas como DBASE o se emplean las versiones para windows de los paquetes estadísticos al uso, como SPSS. Finaliza el cuestionario con un "gracias" impreso. A decir por el entrevistador, al término de la entrevista, o para leer por el propio encuestado en la encuesta autoadministrada. Si el cuestionario va a ser autorrellenado por el propio encuestado, puede incluirse una breve nota en la que se solicite la revisión del cuestionario, por si hay algún error o se ha dejado alguna pregunta sin contestar. En encuestas por correo conviene, además, insistir en su rápida devolución. 4.5. La prueba del cuestionario y su redacción final

El diseño del cuestionario no ha de darse por concluido hasta que haya sido probado o pretestado. Ha de comprobarse su adecuación como instrumento de medición para la consecución de los objetivos del estudio, antes de su administración definitiva a la muestra de la encuesta. En concreto, se quiere averiguar si:

a) Las preguntas tienen sentido, se comprenden y provocan las respuestas esperadas. Si quieres entender cómo los sujetos responden preguntas de encuesta y cómo diseñar cuestionarios que produzcan datos de alta calidad, identifica preguntas problemáticas e intenta determinar por qué esos problemas existen (Esposito y Rothgeb, 1997: 566).

299

El significado que el investigador da a una pregunta puede que no se corresponda con el atribuido por el encuestado. Como Belson (1981) apunta, las preguntas no son igualmente comprendidas por el investigador y el encuestado. Su significado puede diferir. Con el pretest se quiere no sólo verificar su correspondencia con los objetivos de la encuesta. También, explorar en su interpretación por las personas a las que se dirige, antes de su puesta en práctica definitiva. Que es comprendida con facilidad y no precisa de ninguna aclaración añadida a la pregunta. De ella se obtiene la información esperada, siendo mínimo el porcentaje de no respuesta de la pregunta. Cuando no es así, se está ante una "mala" pregunta, que no cumple su finalidad. Si el investigador lo estima necesario, pueden probarse versiones alternativas de una misma pregunta, para comprobar cuál satisface más el objetivo perseguido. b) Las preguntas cubren la variedad de lo que se analiza. No han de ser una pauta del "todo o nada" (Frey, 1989: 159). Preguntas que apenas obtienen variabilidad en su respuesta, al haber aglutinado a tres cuartas partes o más de los sondeados en una misma alternativa de respuesta, no son "buenas" preguntas. Habrá que analizar, en consecuencia, el motivo de dicha coincidencia mayoritaria en la respuesta. Si es propiciada por la redacción y el formato dado a la pregunta (preguntas dicotómicas de acuerdo/en desacuerdo, por ejemplo) o por el tema que aborda (si está expuesto al sesgo de deseabilidad social). Sea cual fuere la razón, habrá que modificar la redacción de la pregunta para evitar errores de medición, producidos por los sesgos de deseabilidad social, aquiescencia, primacía o recencia, que suelen provocar la elección mayoritaria de una única respuesta. En las preguntas cerradas hay, además, que detectar posibles problemas en las alternativas de respuesta ofrecidas. Si éstas satisfacen los requisitos exigidos de exhaustividad, exclusividad y precisión; y su codificación es correcta. En el subapartado 4.2.2, ya se dijo que cuando se prevén "problemas" en la categorización de las respuestas, es preferible darle un formato de pregunta abierta. Tras el pretest puede procederse a su cierre definitivo, teniendo en cuenta las respuestas recabadas. Es común el uso del pretest para el cierre de preguntas abiertas, cuando éste ha posibilitado la captación de todo el abanico de respuestas posibles. c) La disposición conjunta de las preguntas en el cuestionario sigue una secuencia lógica y no influye en la respuesta. Se han de detectar posibles errores de medición debidos al orden de la pregunta y al contexto en el que está ubicada en el cuestionario. Cuando se prevean efectos en la respuesta debidos a la localización de la pregunta en el cuestionario, pueden probarse distintas ubicaciones de las preguntas para comprobar con cuál se alcanzan mejores resultados: respuestas más "veraces", menos influidas por factores contextuales. d) Las instrucciones, que figuran en el cuestionario, se entienden y no se precisa añadir más. Así como las transiciones de preguntas y las rutas a través del cues-


300

Métodos de encuesta

tionario, marcadas por las preguntas filtro, si éstas han quedado bien definidas. Recuérdese que el porcentaje de no respuesta de la pregunta puede deberse a su mala redacción, a las opciones de respuesta que ofrece (si satisfacen los requisitos exigidos), pero también a su no administración por "omisión". El pretest es de gran ayuda para detectar posibles omisiones de preguntas ocasionadas por rutas no claramente definidas en el cuestionario: las preguntas a hacer a cada encuestado. Cuando se obtenga un porcentaje de no respuesta superior al esperado, habrá que proceder al análisis detenido de sus causas. e) La duración del cuestionario no afecta a la respuesta. El tiempo previsto por el investigador para su cumplimentación puede no coincidir con el "real" y repercute, negativamente, en la información obtenida. La puesta en escena del cuestionario, antes de su lanzamiento definitivo, permite comprobar el tiempo medio que requiere su correcta administración, ya sea mediante entrevista, ya mediante autocumplimentación (por el propio encuestado). Para ello se precisa contabilizar su duración conjunta, registrándose cuándo comienza y concluye su resolución. Pero, también, es de interés comprobar la duración media de cada una de sus secciones. Permite averiguar cuál puede ser la responsable de una duración superior a la prevista y si ésta se debe a una mayor dificultad, para responder a la pregunta, de la esperable, para lo cual habrá que reservar espacios, a lo largo del cuestionario, para anotar el tiempo empleado en su contestación. En general, la aplicación de cualquiera de los métodos asistidos por ordenador (CAP!, CAT!, CASI) permite medir la latencia de la respuesta. Es decir, el tiempo que se tarda en contestar a una pregunta. En preguntas referidas al pasado, o que requieren un procesamiento cognitivo profundo, es de esperar que su respuesta tarde más tiempo en producirse. En caso contrario, se estaría ante la duda de su veracidad o corrección, por estimarse "precipitada". Pero, cuando la pregunta no necesita un ejercicio reflexivo o memorístico, latencias en las respuestas superiores a las esperadas pueden indicar problemas en la comprensión de las preguntas, en su enunciado y/o en las alternativas de respuesta ofrecidas (en preguntas cerradas), por lo que habría que revisar la pregunta en cuestión. Pero el pretest no sólo se circunscribe al cuestionario. Abarca las distintas fases de la encuesta. En la medida en que se haga en consonancia. con el método elegido, puede aportar información de interés, que ayude a su correcta realización, relativa a:

Capítulo 4: El diseño del cuestionario

d) La preparación de los entrevistadores (en encuestas cara a cara y telefónicas).

fermite detectar posibles "dificultades" en la realización de las entrevistas. e) El coste aproximado del trabajo de campo (en tiempo y dinero). A partir del pretest puede mejor calcularse la duración promedio de las entrevistas y sus posibles efectos en los costes de la encuesta y en los errores de medición.

Ha de insistirse en que esta información es tanto más válida cuanto más se ajuste el a las condiciones "reales" en que, finalmente, se llevará a cabo la encuesta: entrevista rJen~onlal (en el domicilio del entrevistado, en la calle, su lugar de trabajo), telefónica, 7utloaltmiln~)trílaa y las personas sondeadas compartan el mismo perfil sociodemográfila población de interés. Adviértase que la generabilidad de la información que se ;;IALJ.(.UJ::," dependerá de los casos observados: su número y composición. Normalmente, el pretest se hace en una muestra pequeña (en torno a 50 casos), de características a la población de estudio. Es habitual que sea una muestra eso de conveniencia. Si bien, lo deseable sería que en su selección se siguiese un aleatorio. A ser posible, el mismo que piensa aplicarse en la muestra paencuesta definitiva. De esta forma, se obtendría información previa, referida a dittclUtaaes en la selección y la captación de encuestados, que ayudase a arbitrar medidas reducir los errores de no cobertura y de no respuesta de la encuesta. El entrevistar a "conocidos", por ejemplo, aunque se ajusten a las cuotas fijadas (seedad, nivel de estudios, ocupación) para garantizar su equivalencia con la poblade estudio, no debería hacerse. Precisamente, porque su conocimiento puede afeca su conducta. Es preferible entrevistar a "extraños", en el contexto "real" de

::'.'·I..LI.L";''',",,'-'''

:UJ.U\."'..,;U.Ll..I.ll'\o.I.I..I.I.V

Además, si es una encuesta nueva, con un cuestionario pionero, no probado en esanteriores, puede ser preferible incrementar el tamaño de la muestra, para la ......... _-~~~- del cuestionario, a 100 casos, al menos. Permitiría la realización de análisis es:;(:;"'-l~~.I."'''.I.,",'J''' (multivariables), a modo de los que se piensa efectuar en la muestra definitiva, una cierta validez estadística. Estos análisis aportarían información previa sobre la ,>rf~le"ancu, estadística de las variables incluidas en el cuestionario en la explicación del .....,_~JI'"'I de estudio. La proporción de varianza explicada, por qué variables (aquellas que (:;>tlen~~an significación estadística y lógico-sustantiva), y si habría que añadir más variables conseguir un modelo con mayor poder explicativo. Y ello, antes de emprender el definitivo, al que se destina una cuantiosa partida presupuestaria. ;;~:it~.i_~;0C-;ti,~;;k;_;i~'·.·.;·\;> Cuanto más se ajuste el pretest al diseño de la encuesta, en cada una de sus fases, se p,odrán prever errores no detectables hasta su puesta en práctica. No cuando se I.'~ .,.n> la muestra, el cuestionario y se planifica el trabajo de campo, sino cuando se proa la recogida de información y a su análisis. Lógicamente, este acoplamiento del a la encuesta diseñada (en papel) supondrá un incremento en los costes del es'-;~;r.·/-'{k./-/r:>;··.· .-"'""""........." en tiempo y dinero. Pero, contribuirá a aumentar la calidad de la encuesta y al uso de los recursos a ella destinados. Tal es la importancia que se concede al pretest, en la literatura de encuesta, que aucomo Sudman y Bradburn (1982/1987: 283) aconsejan que, "si no tienes recursos /i.:/II.UU.l.V';'

·· .

bido a problemas para acceder a encuestados o a la negativa de éstos a participar en la encuesta. b) La idoneidad del marco muestral utilizado en la investigación. c) La variabilidad de la población respecto al tema que se analiza. De gran utilidad para el diseño de la muestra, como se vio en el capítulo 3.

•.....,

·L.IIoI."T .... ' ' ' .. ,.....

.......

a) El porcentaje aproximado de no respuesta que se obtendría en la encuesta. De-

301

...


302

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

para la prueba piloto del cuestionario, no hagas el estudio". En su ?pinión, habría que hacer, como mínimo, cuatro pruebas o revisiones de los cuestionarlos, antes de su l~n­ zamiento definitivo. Converse y Presser (1994) lo reducen a dos; Oppenheim (1966) Incrementa el número a ocho. De Lamater y McKinney (1982: 39) enfatizan que "la práctica estándar de pretestar instrumentos en muestras de conveniencia. ~e est~dian:~~, colegas o amigos es bastante indeseable, a menos que sean la poblaclon de Int~res . El pretest debe hacerse con personas de iguales características que la poblacIón de estudio y reproduciendo, con exactitud, las condiciones en que se administrará el cuestionario final. Aunque, si la encuesta es por correo e, inclusive, telefónica, pueden antes realizarse algunas entrevistas cara a cara. Permite captar informaci.ón "~o verbal" (gestos y demás reacciones del entrevistado ante las pr~gunt~s del cuestIonano), no posible por otros medios. También, es deseable que el InvestIgador ~o se mant~n?a al margen, sino que participe en el pretest del cuestionario; que no deje, en ~XC1USIVI~~d, la tarea en manos de los entrevistadores. De esta forma podrá obtenerse InformacIon, de "primera mano", sobre la aplicación del cuestionario. Nadie puede escribir un buen cuestionario a menos que haya hecho algunas entrevistas. Sólo de esta forma puede darse cuenta de cómo pueden formularse las preguntas para que la gente las comprenda y cómo las preguntas que suenan sencillas no se entienden por la gente corriente (Bowen, 1973: 90).

Es importante que el investigador participe en la realización de las entrevistas, bien como entrevistador, bien como supervisor. En este último caso puede acompañar al entrevistador en la realización de las entrevistas cara a cara, o puede escuchar la conversación e~ el transcurso de la entrevista telefónica, sin que ni el entrevistador ni el entrevistado se percaten de su presencia. El no saber que está siend.o observado tiene .la ventaja de no afectar al desarrollo de la entrevista; que el entrevIstador y el entrevIStado actúen de forma distinta a la que harían si no se sintiesen observados por otra persona. Otra manera poco obstrusiva de observar la realización de la entre:ista, su.p~esta en práctica, es grabarla, con el consentimiento expreso o no del entrevIstado. ~I bIen, Fowler y Mangione (1990) a~onsejan info~~r a los en~r~vistados qu~ la .en~rev~sta es-

tá siendo grabada y consegUIr su consentImIento exphcIto, para no InfrIngIr nInguna ley. Si se les explica con propiedad, rara vez manifestarán "rechazo" a la grabación de la entrevista. En la encuesta telefónica la grabación es fácil, pero en la cara a cara también, gracias a la tecnología de grabación digital que puede aplicarse conjuntamente con CAPI. Se llama CARI (Computer-Audio-Recorded Interviewing) y permite programar la grabación digital de toda la entrevista o de la parte '!ue sea d~,inter~~ p~ra el diseñ~­

dor del cuestionario. De esta forma puede obtenerse InformacIon, de pnmera mano , de la reacción de los entrevistados ante distintas preguntas del cuestionario y de incorrecciones en la realización de la entrevista. De gran utilidad para mejorar el trabajo de campo.

303

La observación de la entrevista puede hacerse en la fase de pretest y cuando se adel cuestionario definitivo (en la fase" de trabajo de campo). Aporta información muy útil en la evaluación de los datos de encuesta. Entre los indicios de ''fallos'' o problemas en el cuestionario destacan los seis siguientes: ministr~

a) Si el entrevistador no lee la pregunta exactamente como está escrita, puede de-

b)

c)

d) e)

f)

berse a una mala redacción de la pregunta. De difícil comprensión por parte del entrevistado. Si el entrevistador omite alguna pregunta, por completo, puede deberse o a una incorrecta especificación de las preguntas filtro, de las rutas correspondientes en el cuestionario, o simplemente a la ubicación de las preguntas. Ya se ha dicho que no separar, con espacio suficiente, una pregunta de la siguiente, puede llevar a la omisión involuntaria de la pregunta a continuación. Principalmente, cuando una pregunta corta sigue a una larga, que incluye un listado amplio de respuestas. Si el entrevistado solicita alguna aclaración al entrevistador sobre la pregunta es indicativo de que la pregunta no es "clara". Bien por problemas de definición o conceptual, bien porque su utilidad o intencionalidad no es comprendida por el entrevistado. Si el entrevistado interrumpe al entrevistador, antes de que éste acabe de leer la pregunta, puede indicar que la pregunta es demasiado larga. Si el entrevistado tarda más tiempo del esperable en responder a la pregunta puede señalar la existencia de problemas en la pregunta. En la comprensión de su enunciado y de las alternativas de respuesta (en preguntas cerradas). Bassili y Scott (1996), por ejemplo, han constatado que preguntas con dobles negativas tardan más tiempo en ser respondidas que cuando se formulan en afirmativa. Si el entrevistado proporciona respuestas "inadecuadas" es, igualmente, un indicio de "fallos" en la pregunta.

Aparte de la observación del desarrollo de la entrevista, puede ser de gran utilidad, <;~\t;t;;j?Li!.<fci:':/2.·.: •.• : .· . en la evaluación de la encuesta, la valoración que de ella hagan sus protagonistas. La opinión de los encuestados y de los entrevistadores puede registrarse tanto en la fase de pretest o prueba del cuestionario como en su aplicación definitiva. • La valoración de los encuestados puede conseguirse de forma individual o.co-

lectiva (en grupos). Lo más sencillo es reservar un espacio, al final del cuestionario, para incluir varias preguntas referidas al mismo. Su interés, extensión, grado de dificultad en su respuesta (en general y en preguntas concretas, que se prevean de especial dificultad), aclaraciones de determinadas respuestas y "mejoras" que introducirían en el cuestionario (redacción de las preguntas, su localización y la presentación, en general, del cuestionario). • La valoración de los entrevistadores puede igualmente obtenerse de forma individual y colectiva. Lo más fácil es proporcionar un espacio, al término del cues-


304

Métodos de encuesta

Capítulo 4: El diseño del cuestionario

tionario, en el apartado dedicado a los datos de control, para que los entrevistadores anoten cualquier incidencia que hayan observado en la realización de la entrevista. La finalidad es detectar "problemas" en la aplicación del cuestionario, en general, y en preguntas concretas, en particular. A los entrevistadores también se les piden propuestas para la mejora de la encuesta, para evitar la repetición de errores en el trabajo de campo definitivo.

305

Lo más económico es solicitar la información de formar individual y por escrito. Pelo m~s enriquecedor, aunque de mayor coste, es la discusión en grupo. ';",l-¡'tIJtlf'"P1JI~Tll.~

cognitivas

Esta modalidad de entrevista tradicionalmente ha sido aplicada por los psicólogos para conocer el proceso de pregunta y respuesta. En las dos últimas décadas ~ C.L·v~.I ~ '~'-' de acuerdo con Biemer y Lyberg (2003: 264), "en un componente imOOJn:a][llt; de las actividades de precomprobación de la encuesta". Mediante ellas se conocer el proceso que sigue el encuestado en su cumplimentación del cuestioAunque De Maio, Rothgeb y Hess (2002: 340) disienten, al afirmar que "este mépuro no es utilizado universalmente y por muchas organizaciones de encuesta". No C0tJlstalntl~, hay consenso en reconocer su gran utilidad para "entender los procesos (soy psicológicos) implicados en responder a preguntas de encuesta y al hacerlo así ayudará a todos a diseñar cuestionarios mejores" (Esposito y Rothgeb, 1997: 566). Las entrevistas cognitivas suelen realizarse en espacios "controlados", a modo

·.·.'~_·.nr-t"\ . . T1'71""'\~

Asimismo, resulta muy enriquecedor (por su complementariedad a la información individual) si, inmediatamente después del pretest (o prueba del cuestionario), se reúne a varios de los entrevistados y se realiza, con ellos, algún grupo de discusión. Se hará con la mayor proximidad en el tiempo para favorecer el "recuerdo". Recuerdo que, de todas formas, se verá ayudado, si antes se ha pedido a los entrevistadores que registren, tras la realización de cada entrevista, los datos de control antes referidos, así como sus "impresiones" de la entrevista. En esta puesta en común de los entrevistadores se les pide que informen cualquier incidencia que encontraron en la administración del cuestionario, tanto concerniente a las preguntas, como al "campo" (el contactar y "retener" a los entrevistados). El "lograr" que participen en la encuesta y que respondan con sinceridad y sin precipitación a las distintas preguntas que se les formulen. Recuérdese que el interés del pretest no sólo se limita al cuestionario. También se quiere información referida al desarrollo de la entrevista y a la reacción de los encuestados, cuando se les requiere para participar en la encuesta. Además de la prueba "in situ" del cuestionario y de la información específica, extraída de los encuestados y de los entrevistadores, sobre el cuestionario y su aplicación, existen otros procedimientos en la evaluación de los cuestionarios: la consulta a "expertos" y las entrevistas cognitivas. Consulta a "expertos"

Puede hacerse por separado o reunidos en uno o varios grupos. La finalidad es identificar errores de especificación y demás errores de medición referidos al cuestionario. A personas consideradas "expertos" se les pide que revisen las preguntas, relacionándolas con los conceptos a medir: su redacción, si induce a respuestas socialmente deseables y otros errores de respuesta. También, analizan su ubicación en el cuestionario y su presentación. Con especial énfasis, en las instrucciones y las rutas en él definidas. O sea, se les requiere para que evalúen, en su condición de "expertos" o personas con experiencia en la práctica de encuesta y/o en el tema que se investigue, la calidad del cuestionario. Para conseguir una información más reflexiva o meditada, es mejor enviarles el cuestionario, aproximadamente, una semana antes de la fecha fijada para la entrevista individual o la reunión de grupo. Sus comentarios se graban en cintas de audio e, incluso, de vídeo, siguiendo el proceder habitual en cualquier grupo de discusión y entrevista cualitativa.

.....

••

..... T ...' .....

...

..

•~!lII'II~lf~~~l~l~a~lb~o~~r,~a~~t~oriO' equipados grabadoras vídeo. También pueden a cabo en por teléfono. En llevarse cualquiera de las particular delcon entrevistado o, yincluso, la entrevista se graba para su posterior análisis con detenimiento. Además, pueden tener un carácter simultáneo o retrospectivo. La primera es la co·,t·'J.~,:~;:~;,f';;f·(¡iH;¡~';)llúrLml~nl~e conocida entrevista "piensa en alto". En ella se pide al entrevistado que di·····x'··.·.~L.L ·~.L.L voz alta, lo que piensa cuando se le formula la pregunta y medita la respuesta. . • · .• ·;;'···,":t.'.•. · ./;',·'c:pu cambio, en la entrevista cognitiva retrospectiva es, después de haber respondido al j:,,¡!;;~!~¡~f~i,~j;I~U(~~tion~riio (como en una entrevista normal), cuando se solicita al entrevistado j.{{2;;·j(~J;m,·~·:!';;.;·i.:.. a.(aa]~aC:IOlle~;" sobre sus respuestas. Por ejemplo, ¿Qué pensó cuando la pregun¿Por qué fue la respuesta elegida _ _ y no otra? La entrevista cognitiva retrospectiva tiene la ventaja de no introducir sesgos en las '··>.• JreS1DU(~st(lS a preguntas posteriores, en el curso de la entrevista, y no alargarla en exceso an(1112:ar~;e con detenimiento cada pregunta). Pero tiene el inconveniente del "01. Porque la información no se transmite en el mismo tiempo en que se produce, puede no ser capaz de recordar el proceso cognitivo seguido en la resi~~,~1(~~j,J~,'i}f(i~ule~1l: a las distintas preguntas del cuestionario. entrevista cognitiva, en general, resulta muy útil en el conocimiento del proceso \~[~~;j~~'?!¡~~;(:~~~~~:~._..::J,_u y en la detección de errores de medición debidos a problemas de com.J de las preguntas. También, de retención de la información en ella dada y de ;·"·'j/:'t.:f);'1".} .•:cJ·3.1nIlUell1Cla, en la respuesta, de las alternativas de respuesta ofrecidas (en preguntas J'j>:1·~Y·.",}/:;••/.C~erl·ad,as) En su contra está su carácter limitado a conocer la reacción que suscitan las ))~i:~:c:::i'f.·"in(·:s~·:;.]prE~gu.ntéls del cuestionario, no aportando otra información de relevancia para el co·.·~.:· """",v desarrollo de la encuesta. Por ello se recomienda su aplicación, no de forma ex.::,..: .•...;.,•....•...:,:.}:.....:.:. _"'~U"'Y'L.L& sino complementaria a otras "pruebas" del cuestionario. Si quiere obtenerse información sobre situaciones "raras", pueden utilizarse viñetas .····:·;>'/· ••. }.··\·:S··••.· .tiU conjunción con la entrevista cognitiva. Consiste en plantear una.situación hipoté','·J"V'."':);, :.•._-- a los entrevistados. Éstos han de decir cómo debería responder ante ella una •

•· ••

·•· •• •..

.. ',.c;..:.:':·······:···:····.L .....

•.


306

Capítulo 4: El diseño del cuestionario

Métodos de encuesta

persona hipotética. Después, se les pregunta cómo la situación hipotética descrita en la viñeta se relaciona con una pregunta de encuesta concreta. La artificialidad de la situación planteada a los sujetos es la desventaja principal del uso de viñetas (De Maio y otros, 2002; Biemer y Lyberg, 2003). Artificialidad igualmente extensible a la entrevista cognitiva, en general. Ni el entrevistador ni el entrevistado se ajustan a los protagonistas de la encuesta "real". El entrevistador suele ser el investigador más que un entrevistador normal. Los entrevistados típicamente son "voluntarios" pagados, bastante motivados en la tarea de responder al cuestionario, no habiendo sido elegidos de forma aleatoria. El estilo de entrevista puede, asimismo, suscitar procesos cognitivos ajenos a una entrevista normal. El número de entrevistas suele ser pequeño (20 o menos). Pero no se olvide su finalidad: identificar problemas en la comprensión de las preguntas y la lógica seguida en su respuesta. No la comprobación, a priori, de los problemas que pueden darse en la realización de la encuesta en cada una de sus fases. Por esta razón se reitera la necesidad de su combinación con otros procedimientos de precomprobación de la encuesta. La prueba del cuestionario no ha de limitarse a una única fuente de información. Es preferible el uso complementario de al menos dos de ellas. La consulta a "expertos" y las entrevistas cognitivas pueden llevarse a cabo antes de lo que comúnmente se conoce como pretest del cuestionario: su prueba en una pequeña muestra en las mismas condiciones en las que finalmente se aplicará el cuestionario. La observación directa de las entrevistas y la información que de ella se extraiga de entrevistadores y encuestados resulta también valiosa en la mejora de la encuesta. La detección de errores en su práctica ayuda en su prevención y mejora de la encuesta final. Tras la prueba del cuestionario se vuelve a las fases iniciales en el diseño de la encuesta. Han de buscarse soluciones a las deficiencias observadas en su puesta en práctica. Si bien, conviene que cualquier modificación que se haga en el cuestionario, yen su aplicación, se "pruebe" antes de su definitiva puesta en escena. Un segundo pretest parece exigido para asegurarse que las modificaciones hechas logran el efecto buscado. Después, cuando se pasa a la fase de trabajo de campo y de análisis de los datos de encuesta, la introducción de "mejoras" es menos factible. Incluso, puede introducir sesgos graves, si se aplican en unos casos y no en otros, en los que precisamente se detectó. Por ejemplo, apreciar problemas en la comprensión de una pregunta, o en las alternativas de respuesta ofrecidas, cuando se está realizando el campo, y modificar su redacción en los cuestionarios que quedan por responder. De acuerdo con Sheatsley (1983: 228),

··,'-"L,.......

307

por el incremento que supone en los costes del estudio, en tiempo y dinero. No deseable en encuestas pioneras, que no siguen el hacer usual de estudios Incluyen nuevos indicadores, nuevas preguntas, nuevo formato de cuestiocambios en su aplicación. Por ejemplo, una encuesta de actitudes ante la inmique disienta de las encuestas realizadas hasta la fecha (por el CIS, ASE!?, en los con el propósito de conseguir una mejor medición del racismo.

r"I..... O""'

.;'\

LECTURAS COMPLEMENTARIAS ·.•.•. c~r.';·;t'!0{0U:~/;.}··A~ojfra, M.a J. (1999): Cuestionarios. Centro de Investigaciones Sociológicas, Colección

"r,\~?i~~L~{{j3icl~c~u~a:'derno Metodológico n. o 26. Madrid.

• •. • • •

L. YRog, D. J. (comps.) (1998): Handbook ofapplied social research methods. Sage. Thousand Oaks, California. de Rada Igúzquiza, V (2001b): Diseño y elaboración de cuestionarios para la investigación comercial. ESIC (Escuela Superior de Gestión Comercial y Marketing).

·.• ·;;~c;.:;.·)'!·:2.·.·i(.UHf~nerson, M. E.; Morris, L. L. YFitz-Gibbon, C. T. (1987): How to measure attitudes. N ewbury Park, California. i(~hJ~'>/,~?(}i.c:;:ii2ylberg, L.; Biemer, ~; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., (comps.) (1997): Survey measurement and process quality. John Wiley and Sons Inc. York. -r:cY¡>~if!ff;¿?·),+"·/·R()ias Tejada, A. J.; Femández Prados, J. S. y Pérez Meléndez, C. (1998): Investigar meencuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid. ·.·';,i:Z,,'i5·(_J-IX i;:.; SchuJnaJn, H. y Presser, S. (1996): Questions & answers in attitude surveys. Experiments on question form, wording and contexto Sage. Thousand Oaks, California. S. y Bradburn, N. M. (1982/1987): Asking questions: a practical guide to QUlest¡~On~nalre designo Jossey-Bass. San Francisco. :Y',:·:<.l..iPl.1Cl, R. A. y Carmines, E. G. (1980): Measurement in the social sciences. Cambridge University Press. Cambridge. ·'··'· ..d".J'Y'-I-Jl.L.LU.I..l"l

EJERCICIOS PROPUESTOS Operacionalice los conceptos xenofobia y discriminación.

Un error común es escribir enteramente nuevas preguntas, cambiar la redacción de muchas otras o asumir que se ha cortado diez minutos del tiempo de entrevista, haciendo ciertas eliminaciones, y luego enviar la versión revisada al campo sin probarla.

Toda modificación requiere su precomprobación y, en caso de no conseguir la mejora esperada, proceder a su revisión, modificación y consiguiente precomprobación. Lamentablemente, esta prueba del cuestionario continua no es usual en la práctica de la en-

Localice un cuestionario que mida las actitudes ante la inmigración. Señale las dimensiones y los indicadores utilizados en la medición de racismo. Compruebe si las diversas recomendaciones para la elaboración de cuestionarios se cumplen. Indique los diferentes errores debidos al diseño del cuestionario y las actuaciones para evitarlos.


30S

Métodos de encuesta

4. Diseñe un cuestionario propio sobre racismo. Ajústese a las recomendaciones dadas respecto a la formulación y la disposición de las preguntas en el cuestionario y su presentación. El cuestionario ha de estar codificado y columnado. Exponga las precomprobaciones que haría antes de la redacción definitiva del cuestionario y su justificación. 5. Las siguientes preguntas se incluyeron en una encuesta a Centros Municipales de la Tercera Edad (realizada en 1993 por M.a A. Cea D'Ancona y M. Valles Martínez financiada por el Área de Servicios Sociales del Ayuntamiento de Madrid). De ellas: indique cuántas preguntas realmente incluyen y cómo se columnarían.

LA ADMINISTRACIÓN DEL CUESTIONARIO

P.I. Por favor, ¿recuerda qué días de la semana pasada ha ido Ud. al Centro? L

M

s

v

J

D

p.1.A. (EN CASO DE NO HABER IDO NINGÚN DÍA) ¿A qué se debió?_

P.I.E. (EN CASO DE HABER IDO ALGÚN DÍA) ¿Cuáles son las tres razones principales por las que acude? _

P.2. Los Centros Municipales de la Tercera Edad suelen contar con una serie de Servicios para sus socios. Dígame si conoce o no en su centro los que le cito a continuación. (EN CASO AFIRMATIVO) ¿Querría calificarlos de la 10, según la opinión que tenga de ellos? (SI VALORA MENOS DE 5) ¿Por qué? CONOCE

UTILIZA

Si

No

No

Podología

1

2

1

2

Peluquería

1

2

1

2

Comedor

1

2

1

2

Cafetería

1

2

1

2

Gimnasia

1

2

1

2

Biblioteca

1

2

1

2

Taller de pintura

1

2

1

2

Servicios

VALORA

POR QUÉ

ncluida la fase de diseño del cuestionario, tras sus precomprobaciones y posteriomodificaciones, procede su "puesta en escena definitiva": la recogida de inforjjj.:ici45n. Esta fase se llama trabajo de campo. De los recursos que a ella se destinen iÍelcoIlólniC:OS, humanos, materiales) y del rigor que se exija en su práctica (acordes con criterios establecidos en el diseño de la encuesta), dependerá el éxito o el fracaso encuesta. El conseguir datos que al menos satisfagan requisitos mínimos de ca............~....,..u. Se puede haber confeccionado un buen cuestionario, se puede haber proyectado buena muestra (que cumpla criterios de calidad), si al final, en la recogida de inación, no se procede como debería hacerse, se obtendrán datos que no se sabe n qué representan. En este capítulo se analiza la contribución de los entrevistadores a los errores de ensta, tanto al error de medición (desviación de la respuesta obtenida de los valores rerlda(ielos''') como a los errores de no observación (de no cobertura, muestreo y no reS'TJWes/tI), que afectan a la representatividad de la población en la muestra de la que T(illabllente se extrae la información. Y cómo su intervención puede mejorarse con una ¿ácje(:ua.da selección, formación y supervisión de su actuación. Se hace mención espea la no respuesta en todos los métodos de encuesta, y no sólo en la encuesta me.... IJlilJlltl;; entrevista (cara a cara o telefónica). Se destacan sus efectos negativos en la ca•• ' ••..., •....,......... de la encuesta y cómo éstos pueden solventarse. •••• • ••

ll1ng

La contribución del entrevistador a los errores de encuesta La mediación de entrevistadores en la recogida de información afecta a la calidad los datos de encuesta. Así lo acreditan estudios varios que indagan en los efectos del en/revis'tatior en los distintos errores de encuesta.


310

Métodos de encuesta

Ya en 1929, S. A. Rice hablaba de "sesgos de contagio" debidos a la intervención de los entrevistadores (en "Contagious bias in the interview: a methodological note". American Joumal oiSociology, 35: 420-423). En 1942, D. Katz demuestra (en "Do interviewers bias polls?". Public Opinion Quarterly, 6: 248-268) que la falta de homogeneidad de estatus social entre el entrevistador y el entrevistado contribuye a la obtención de respuestas sesgadas. Compara a los entrevistadores de "cuello blanco" (de clase media-alta) con los de clase trabajadora (de "cuello azul"), y detecta la consecución de conductas, actitudes u opiniones más "conservadoras", cuando el entrevistador es de "cuello blanco". En 1946 se publica uno de los primeros estudios experimentales sobre la contribución del entrevistador a los errores de encuesta. Fue el llevado a cabo en la India por ~ C. Mahalanobis ("Recent experiments in statistical sampling in the Indian Statistical Institute". Journal ofthe Royal Statistical Society, 19: 325-378). Primero, se asignó a los entrevistadores, de forma aleatoria, a la parte de la muestra a ser entrevistada para una encuesta agrícola. Después, mediante el uso de "muestras interpenetradas" se estima la varianza de los entrevistadores en las distintas variables incluidas en el cuestionario (como, por ejemplo, en la variable renta económica). La inexistencia de variabilidad en los entrevistadores resultaba en la obtención de un conglomerado integrado por los valores de la muestra. Por el contrario, la formación de conglomerados alrededor del objeto de· estudio refleja la existencia de efectos del entrevistador, siendo su varianza elevada. Tras su realización, se defiende la necesidad de incluir los llamados "errores humanos" (debidos a entrevistadores, codificadores, supervisores), junto a los de muestreo, en la estimación del error de encuesta. En 1954, H. Hyman y colaboradores analizan cómo las expectativas del entrevistador afectan a los datos de encuesta, en un estudio realizado en Menphis y Nueva York (Interviewing in social research. University of Chicago Press). Antes de la entrevista, los entrevistadores prevén las respuestas que pueden darse. Estas expectativas afectan a su actuación durante la entrevista y a la obtención final de las respuestas.que esperaban conseguir. Además, constaron que la disparidad de las características (etnia, religión, género) del entrevistador y el entrevistado contribuye, igualmente, a la obtención de datos de encuesta "sesgados". Por ejemplo, observan que los entrevistados negros dan respuestas más patriotas, en preguntas referidas a política exterior, cuando el entrevistador es blanco que cuando es negro; o se autoclasifican de un estatus social más elevado cuando responden a entrevistadores negros que a blancos. Los efectos debidos al entrevistador fueron mayores en Menphis que en Nueva York. La responsabilidad del entrevistador en los resultados de la encuesta fue, con posterioridad, destacada por R. L. Kahn y C. F. Cannell en 1957 (The dynamics ofinterviewing: theory, techniques and cases. John Wiley and Sonso Nueva York). En 1969, M. T.·Ome apunta a las "características de la demanda" como determinante de la conducta de los entrevistadores y los entrevistados ("Demand characteristics and the concept of quasi-controls", en R. Rosenthal y R. L. Rosnow, Ar.tifacts in behavioral research. Academic Press. Nueva York: 143-179). A partir de entonces se sucecten los estudios que indagan en la contribución del entrevistador a los errores de encuesta. Como puede verse en la bibliografía adjunta y en la exposición que sigue a continuación.

Capítulo 5: La administración del cuestionario

311

Pero, ¿cómo afecta el entrevistador a los resultados de la encuesta? En 1957 Kahn y :f;fLfll1leU resumían en tres las fuentes básicas originarias del error debido al entrevistador: a) Sus características demográficas: género, edad, nivel educativo, estatus socio-económico, etnia, religión. b) Factores psicológicos, como las expectativas o las percepciones sociales. Al igual que Hyman y colaboradores, para Kahn y Cannellla actuación del entrevistador puede contribuir a lo que se conoce como la "profecía autocumplida". En el transcurso de la entrevista, el entrevistado puede percibir que el entrevistador espera de él unas respuestas determinadas y, en consecuencia, ajustar sus respuestas a aquellas que reflejan las expectativas de lo que considera respuestas "correctas". Coincide con lo que Ome (1969) llama "características de la demanda". Una actuación inadecuada, por parte del entrevistador, en la realización de la entrevista.

A estas tres fuentes básicas hay que hacer mención cuando se indaga en los efecentrevistador en los datos de encuesta. Bradburn (1983: 315) destaca las ca?~i{~'g~i;1):/,~I~-li\><:;:i~~te:rís1tic'lS sociodemográficas "visibles", junto con la experiencia del entrevista-

'.;~tiNir~~;~~,iíf~tfur;~~co~mo decisivas

en la contribución del entrevistador a los errores de medición de lo esperable), cuando dice:

:r

~os efectos del entrevistador son una fuente tan pequeña de efectos de respuesta, partIcularmente cuando se comparan con efectos asociados con la redacción del cuestionario. Creo que puede deberse, principalmente, al hecho de que la mayoría de las entrevistas por organizaciones de encuesta se hacen por entrevistadores profesionales que ~on entr~nados p~ra s~~ sensitivos y evitar tipos de sesgo que los entrevistadores podrían l~troduclr en l~ sltuaclon de entrevista. Los principales efectos encontrados están precIsamente relaCIonados con aquellas características que son visibles y sobre las cuales los propios entrevistadores no pueden hacer nada.

Características sociodemográficas

la literatura de encuesta se mencionan distintas variables sociodemográficas ;Ii!(~ne~ro_ edad, etnia, nivel educativo, clase social, ideología política) que pueden afectar ::al(tsrleSDlue~itas ?e los entrevistados (la veracidad de los datos de encuesta). Especialmente, ,y,..,..... se relaCIona con el tema de investigación y se trata de características claramente '·.w·--.a."''''''L1l.J.UJ.~',"'\_ por parte del entrevistado. Aunque no siempre se ha confirmado. J.J.\,JlV

Suele relacionarse con efectos de respuesta, cuando la encuesta trata de temas reel sexo (Sudman y Bradburn, 1974).

~ªc;:lonad()s con


312

Métodos de encuesta

Capítulo 5: La administración del cuestionario

Por ejemplo, en una encuesta telefónica sobre acoso sexual se obtuvo que los encuestados varones eran dos veces más probables a informar haber acosado sexualmente a alguien en el trabajo cuando eran entrevistados por un hombre que por una mujer (Lavrakas, 1998). Igualmente, en una encuesta que medía actitudes de rol de género, Kane y Macaulay (1993) encontraron efectos en la respuesta debidos al sexo del entrevistador. Cuando éste era mujer, tanto los entrevistados varones como las mujeres daban respuestas más igualitarias que cuando el entrevistador era varón. Catania y colaboradores (1996) analizan los factores que influyen en las respuestas a preguntas sobre conducta sexual, en una encuesta telefónica a 2.030 personas de 18 a 49 años. En ella, los varones más que las mujeres manifestaron mayor vulnerabilidad ante el sexo del entrevistador y a variaciones en la formulación de la pregunta. Sus hallazgos inciden en la recomendación, reiterada por otros investigadores, de procurar la coincidencia por género entre el entrevistado y el entrevistador. Principalmente, cuando la encuesta incluya preguntas sobre conducta sexual. "

313

es la característica "externa" del entrevistador que parece afectar más a la resdel entrevistado. Fundamentalmente, cuando la encuesta trata de temas raciales -"", _._~, ..... y Schuman, 1975; Singleton y Straits, 2002). Se obtienen respuestas diferentes la etnia del e,~trevistador y del entrevistado coincide que cuando difiere. Schuman y Converse (1971) contrataron a encuestadores blancos y negros para entrevistar a residentes negros en Detroit. A la pregunta ¿Cree usted que puede confiar en la mayoría de las personas blancas o en ninguna?, la respuesta del 35% de los entrevistados por una persona blanca fue que confiaba en la mayoría de las personas blancas. El porcentaje se redujo al 7 % , cuando fueron entrevistados por un encuestador negro.

general, cuando se traten temas relacionados con la etnia, ha de procurarse la de etnia entre el entrevistador y el entrevistado, si se quieren obtener remás "válidos". La investigación empírica corrobora que se manifiestan más 'rse:fitiJlTI1(~ntos, actitudes o conductas contrarias a otro grupo étnico cuando se comunican ,.,.....,.~r~a'I(T1C"f"-:lr'lnor de la misma etnia que el entrevistado. ;"'/··.,.)/.f\.uc:alJ.a~, si se entrevista a inmigrantes o a personas de otras culturas, es igualmente Nc(jleSe~alJ.Le buscar la similaridad entre el entrevistador y el entrevistado. 0, al menos, con':::"'/~.¡';""+''''';¡''I") entrevistadores que sean no sólo bilingües, sino también "biculturales". A tal ':::,,'.a:;;·..... "'a~'tl") instruirse a los encuestadores sobre los rasgos (o peculiaridades) más dis;é':"flintl'vOS de las personas a quienes han de entrevistar. Como afirman De Leeuw y Co210), ~oirLclclenCla

Edad Afecta a los errores de encuesta, especialmente por su vinculación a la variable experiencia. En el meta-análisis llevado a cabo por Sudman y Bradbum (1974), los mayores errores se detectaron en entrevistadores jóvenes, menores de 25 años. En su mayoría, estudiantes universitarios. La explicación no está en la edad, sino en la carencia de la necesaria experiencia y formación como entrevistador que garantice una actuación correcta. También afecta el hecho de que típicamente entrevistan a otros estudiantes jóvenes sobre temas sensibles o delicados.

En consecuencia, cuando se recurra a estudiantes como entrevistadores, habrá que incrementar su formación como entrevistadores y su supervisión, si se quiere contrarrestar su falta de experiencia. La experiencia del entrevistador es la variable sociodemográfica que más parece afectar a su actuación. Es la más determinante en la consecución de un mayor porcentaje de respuesta (Groves y Fultz, 1985; Graves y Lyberg, 1988; Feldman, Hyman y Hart, 2002; Biemer y Lyberg, 2003). Incluso el efecto de otras variables, como género, desaparece cuando se controla por experiencia. Graves y Fultz (1985) detectan un mayor porcentaje de respuesta en entrevistadores femeninos, pero no cuando se igualaba por experiencia como entrevistador. Coincidiendo con Fowler (1993), puede afirmarse que el entrevistador "ideal" es aquel que tiene experiencia, pero que no se siente muy experimentado. Es decir, que no se relaja en la aplicación ortodoxa del procedimiento de entrevista. Los entrevistadores "muy experimentados" tienden a ser descuidados, incluso más que los "noveles". Biemer y Lyberg (2003) también destacan la existencia de una relación curvilínea entre actuación del entrevistador y la experiencia.

c " , ..... , . , . ...

Cuando se encuesta a grupos culturalmente diferentes un curso breve sobre las diferencias en la cultura puede ayudar a los entrevistadores que no sean biculturales; las reglas de conversación pueden diferir; una introducción más larga puede necesitarse; puede ser difícil e incluso imposible entrevistar a mujeres y a niños sin un representante del cabeza de familia presente; días concretos o períodos del día pueden ser inapropiados para una entrevista.

Éstas son las tres características personales del entrevistador más perceptibles, por ;';:::':10af1[e del encuestado, y que más pueden influir en la respuesta de éste. Siempre que la

\~¡~2("~;¡t~~~'~;'~tr~:~:~~ trate un tema relacionado con dicha característica, no cuando versa sobre .:;

asuntos. Pueden afectar a la participación en la encuesta y a la información que

i?-,:~["·;·,:r~~i,nj·~-:-·!itefi ella se recoja. Groves, Cialdini y Couper (1992) destacan estas tres variables so-

/!~)fJl/¡i]~):;);j;·itjU.)~>~i()dlelIlog~rájfic~lS (género, edad y etnia) del entrevistador como decisivas en la parti-

··tt!'¡~i~I~i~i2'{;!ff~:~~~~:~c~e~nsuna encuesta, por su interacción con los puntos de vista, prejuicios y .~ del entrevistado. Asimismo, la forma en la que el entrevistador mira, esvestido, habla y adapta las instrucciones del estudio a cada encuestado puede ·iiJ.R:·',"'};;.,'·.'·,.:.• ::t.am·bié:n ser decisivo. Cuando los rasgos de los encuestadores se asemejan a los de los i+i~),ij·'\",.;;;iY_i,i::iynlCU(~st(ldc.s, la colaboración es mayor que al contrario (Groves y Couper, 1998).


314

Capítulo 5: La administración del cuestionario

M étodos de encuesta

315

.bgía política

También, en entrevistadores que cuentan con mayor experiencia para hacer frentesituaciones difíciles. a Existen, además, otras características socioden10gráficas del entrevistador qu pueden afectar en su interacción con el entrevistado. Se relacionan más con la "disi tancia social" existente entre ambos. Ya sea por su posición social, ya por su nivel edu.: cativo.

-,

Clase social Parece que los entrevistadores de una posición social más elevada obtienen mél-<:::: yores errores de respuesta cuando no adaptan su indumentaria y conducta al estatu8 802.:',<)" cial probable del entrevistado. Para Dohrenwend y colaboradores (1968/2002) eslal;::)}?"~ transmisión de una lnayor ~I.distancia social" entre el entrevistador y el entrevistado 10;':<:'-' que favorece la obtención de respuestas sesgadas, por parte del entrevistado; y no la-. "distancia social objetiva" entre ellos. En su opinión, habría que seleccionar o a en-" trevistadores negros de clase media o a blancos de clase social más baja que no re~ chacen a personas de una posición social más baja. En su estudio (una encuesta de salud a 1.713 adultos de Nueva York) se com-".'· prueba que cuando las actitudes del entrevistador miniInizan la distancia social percibidª por el entrevistado, los efectos debidos a la posición social del entrevistador disminuyell.,;"" En una encuesta de actitudes ante extranjeros Reinecke y Schmidt (1993) analizan;conjuntamente los efectos en la respuesta de las variables clase social y edad delen~' trevistador. Los encuestados que manifestaron un menor grado de xenofobia fueron los entrevistados por personas que percibían de un estatus social más elevado y, prefe~ rentemente, de menor edad. El dar respuestas socialmente deseables es más frecuente-' en encuestados de más edad. En los más jóvenes, la edad del entrevistador afecta me··;:t:) nos, no así el estatus social "percibido". En los de mayor edad incidía más la edad del en-)-:; trevistador (se manifestaba una mayor xenofobia cuando el entrevistador tenía más eQad) que el estatus social percibido.

Nivel de estudios c-

Sobre el efecto desigual en la respuesta debido al nivel educativo del encuestador: se ha indagado menos. Aunque del entrevistador se exige, como mínimo, que tenga u~~>:: adecuada capacidad de lectura y de escritura (Fowler, 1993), que haga posiblel~? realización de la entrevista, es deseable que su nivel educativo supere al de la media de~.\ la población (Azorín y Sánchez Crespo, 1986; Groves y Couper, 1998). Favorece asu;;-~ instrucción como entrevistador y su futura actuación: su capacidad de expresión ver-, bal y de registro de la información que recabe. 0, al menos, que reúna las sUfici~n~es:';',; capacidades intelectuales relacionadas con la comunicación verbal (dominio de.l,ldlO~·.. :. ma, elocuencia, saber expresarse), observación, retención memorística yanotaclon,de>, la información obtenida. ,e;.

La influencia de la ideología política del entrevistador ha sido analizada en España or Alvira y Martínez Ramos (1985), en un experimento realizado, en noviembre de 1983, conjuntamente por los centros de opinión pública donde ambos trabajaban: el Cent' o de Investigaciones Sociológicas (CIS) y Emopública. Cada centro seleccionó a dos :ntrevistadores, cada uno de una ideología concreta (izquierda y derecha). Realizaron 1.1ll total de 200 entrevistas (25 cada entrevistador) en los distritos de Carabanchel (de voto predominante de izqu.ierda) y Salaman~a (de derecha). Más que efectos d~ectos, de.>.J~ctaron efectos interactIvos con otras varlaples y no muy grandes. Los propIOS autores ,/.0'. '>reconocen las limitaciones del estudio, la dificultad de extraer resultados concluyentes. _.'S610 se analizó la actuación de cuatro entrevistadores. En una encuesta real, el universo de entrevistadores es mucho mayor (100 e inclusive más) y difieren no sólo en ideolo'gía política, sino también en,otras varia~les sociodemográ~cas y e~ experiencia como encuestadores. Al aumentar estos en numero, los sesgos IntroduCIdos por ellos pueden transformarse en errores aleatorios, al compensarse unos con otros. En el estudio de Atienza y Noya (1999) se concluye que la mitad de los encuestados declararon haberse fijado en algún rasgo externo del entrevistador para intentarlo encasillar ideológicamente. En la participación en la encuesta afecta cómo se perciban, recíprocamente, el entrevistador y el entrevistado.

i~~las características psicológicas del entrevistador que más pueden afectar a los ':Ültados de la encuesta destacan dos: la confianza que el entrevistador tenga en sí .#g1o y sus expectativas sobre los encuestados.

::Vil) Los encuestadores que tienen más confianza en su capacidad para conseguir .. cooperación y completar con éxito la entrevista, acaban consiguiendo una :"c·mayor cooperación por parte de los encuestados y una mayor tasa de res'~~;:;'":-puesta(Grovesy Lyberg, 1988; Frey y Oishi, 1995; Graves y Couper, 1998). J."Las expectativas que los encuestadores tengan respecto de los-resultados de la "'encuesta pueden afectar a su actuación en la entrevista e incidir en la obtención <le unas respuestas coincidentes con sus expectativas: la llamada profecía au-

··tocumplida. Bradburn, Sudman y colaboradores (1979) lo comprueban en una encuesta sobre consumo de drogas, alcohol y conducta sexual a 1.172 adultos norteamericanos. Antes dela realización del trabajo de campo, preguntaron a cada uno de los 59 entrevistadores por el grado de dificultad que esperaban que tendría la encuesta y la proporción de encuestados que responderían a las preguntas. Tras la realización de la encuesta encontraron una pequeña relación, aunque consistente, entre expectativas previas y datos obtenidos. Aquellos entrevistadores que preveían dificultad en la administración de los 'cuestionarios y que no lograrían mucha información fueron, precisamente, quienes menos información lograron.


316

Métodos de encuesta

Estos resultados coinciden con los hallazgos precedentes de Hyman y colaboradores, de 1954, y de Kahn y Cannell, de 1957. Con posterioridad, Schaeffer y Maynard (2002: 578) insisten en que: Los entrevistadores pueden introducir errores por sus expectativas de que los encuestados tendrán actitudes consistentes o que los encuestados con características sociales específicas tendrán ciertas creencias que pueden afectar a la adecuación de las respuestas.

. A las variables destacadas hay que sumar las comúnmente referidas corno propicIadoras de una actuación adecuada, sea ésta cualesquiera: a) Su preparación o formación específica para el trabajo a realizar. ' b) Su interés y motivación por el mismo. En ella incide, negativamente, su baja remuneración y la precariedad en el trabajo. / c) El tiempo que disponga para su realización. d) La cantidad de trabajo que tenga que realizar y su compatibilización, en muchos casos, con otro puesto de trabajo (contrato a jornada parcial).

La sobrecarga de trabajo, la premura que se exija en su cumplimiento, la desn:otivación y desinterés por la encuesta y su falta de preparación contribuyen, negat!vamente, a la consecución de una actuación satisfactoria por parte del entrevistador. Esta puede traducirse en la obtención de un mayor porcentaje de no respuesta (total y. de ítem), por parte del entrevistador, y, en general, un peor cumplimiento de sus funCIones.

5.1.3. Actuación inadecuada del entrevistador

En las encuestas cara a cara y telefónicas, los entrevistadores desempeñan un papel esencial en su desarrollo. La calidad de los datos que de ellas se obtengan depende, en gran medida, de cómo los entrevistadores hayan realizado su trabajo. Su actuación no se limita a entrevistar a los encuestados. Entre sus funciones destacan: a) Localizar a los entrevistados, siguiendo las directrices marcadas en el diseño de la muestra. b) J!10tivar a las personas seleccionadas para participar en la investigación. Es muy Importante que el entrevistador inspire confianza en el entrevistado. Repercute positivamente en su participación (corno se verá en el apartado 5.3) y en la sinceridad de sus respuestas. Por esa razón, en las entrevistas "cara a cara" se recomienda que el entrevistador cuide su apariencia porque contribuye a transmitir confianza. En la entrevista telefónica se insiste más en la elocuencia, en el tono de voz, al no haber comunicación visual.

Capítulo 5: La administración del cuestionario

317

Oksenberg y Cannell (1988) observan que los entrevistadores que hablan con voz alt~ y con una pronunciación estándar consiguen una mayor parti~ipación d~ ~os en-

trevistados, porque éstos los perciben como más competentes y confIados. El utIlIzar un tono de voz caído, en palabras clave en la introducción, también contribuye a reducir la negativa a participar.

Leer las preguntas tal y como están redactadas en el cuestionario y en el orden en que aparecen. Cuando fuese necesario, ayudar al encuestado a comprenderla, aclarando su significado. Anotar la respuesta en el cuestionario, ciñéndose a lo dicho por el encuestado, con la mayor exactitud posible. Cuando la respuesta no concuerde con lo que se pregunta, o sea ambigua o poco clara, tendrá que volver a formular la pregunta, aclarando cualquier duda que pueda plantearle el entrevistado. ' En las encuestas cara a cara, registrar "observaciones" sobre los entrevistados y el lugar donde se lleva a cabo la entrevista: el domicilio particular del encuestado, su lugar de trabajo, de ocio, el vecindario donde reside, municipio y demás que se consideren de interés para los objetivos de la investigación. Contestar a las preguntas de 'control incluidas en el cuestionario, al término de la entrevista: los datos de control. Si se estima conveniente, anotar cualquier observación o incidencia que crea pueda ayudar al investigador en la interpretación de las respuestas, aunque no se hayan previsto en el cuestionario. El no cumplimiento riguroso de las funciones a ellos asignadas contribuye a los errores de encuesta. Éstos se suman a los efectos del entrevistador en la respuesta del encuestado causados por sus características personales (psico-sociodemográficas). • Errores de muestreo, debidos a la selección última de las unidades de la muestra (las personas a entrevistar). • Errores de no cobertura, propiciados por las sustituciones de las unidades de la muestra difíciles de localizar por otras más accesibles, pero de perfil sociodemográfico diferente. Por ejemplo, sustitución de mujeres profesionales, de elevado nivel de cualificación, que viven solas, por amas de casa más fáciles de localizar en sus domicilios en la franja horaria destinada para el trabajo de campo.

• Errores de no respuesta total (o de unidad), por no haber resuelto, con éxito, las negativas de los seleccionados a participar en la encuesta, no habiéndoles motivado suficientemente. • Errores de no respuesta de ítem (o de pregunta), por haberse saltado la pregunta o, si la ha realizado:

1. No haber anotado la respuesta.


318

Métodos de encuesta

Capítulo 5: La administración del cuestionario

319

Además, está el peligro de que el entrevistador sólo formule algunas de las preguntas al encuestado y, para acortar el tiempo de duración de la entrevista o no incomodarle, responder él mismo las otras preguntas no realizadas, inventándoselas.

• Saltarse el protocolo. Aunque los encuestadores reciben instrucciones, orales y por escrito, de cómo presentarse al encuestado, esta entradilla la viven como una pérdida de tiempo y propia de encuestadores "novatos". Cuando se abre la puerta del domicilio, sencillamente se presentan, con sus propias palabras, e indican que desean hacer una encuesta. • En vez de leer las preguntas, entregan el cuestionario al encuestado para que él mismo lo vaya respondiendo. Ahorra mucho tiempo, en especial cuando se incluye una larga batería de preguntas con un mismo formato de respuesta. • Reorganizan las preguntas siguiendo el orden que ellos estiman más lógico y natural, y que entienden que facilita la respuesta. • Eliminan las preguntas que parecen "redundantes" o aquellas cuya contestación es evidente, por las respuestas que se han dado en preguntas anteriores. • Remodelan las preguntas para que sean más fáciles y rápidas de contestar. Para ilustrarlo citan el siguiente ejemplo: en vez de puntuar de 1 a 5 una batería de ítems, que el entrevistado elija los tres que más le gusten y otro tanto de aquellos que no le gusten. Más adelante, el encuestador se encargará de recodificarlas, dando valores máximos a unas, mínimos a otras y medios a las no seleccionadas. Al final, de SO ítems sólo se seleccionan los tres mejores y los tres peores. A partir de ahí, el proceso es una reconstrucción. • Eliminar preguntas que alargan la entrevista y que el encuestador entiende que no corresponden al núcleo de la misma.

Bradburn, Sudman y colaboradores (1979) analizaron cintas de 1.044 entrevistas hechas por un grupo seleccionado de entrevistadores. Encontraron que un tercio de las preguntas no fueron leídas como fueron escritas. Discursos no programados se dieron en la mitad de las 41.292 administraciones de las preguntas que estudiaron. En España, un estudio llevado a cabo por Camacho, Prado, Romero y Valera (2000), detecta una serie de graves irregularidades en la actuación de los encuestadores. La información la proporcionan 18 entrevistadores de empresas que operan en Sevilla capital, con experiencia laboral suficiente (de 4 a 22 años), que se ofrecieron voluntarios para participar en cuatro sesiones de grupos de discusión. Una conclusión clave es que los cuestionarios suelen ser más extensos de lo deseable. Más allá de 20 minutos, los encuestados se cansan y no responden de manera fiable. En la calle, no han de durar más de 3 minutos. En estas circunstancias, los encuestadores buscan estrategias para realizar un mínimo de entrevistas que les resulten rentables económicamente. Estas estrategias suelen depender de la cantidad de dinero que cobre el encuestador por cuestionario cumplimentado. Cuanto menos dinero perciba, más acortará la entrevista. Entre las actuaciones más habituales, al efecto, están:

La conclusión del susodicho estudio es que "las encuestas se maquillan"..No sólo se realizan en la casa del encuestado. También se hacen en la casa del encuestador, en la soledad de su habitación, intentando adivinar las intenciones del entrevistado o, simplemente, respondiendo en su lugar, lo que a su juicio mejorencajaría. Los supervisores se obvian con la sencilla regla de pedirles el favor a los encuestados de que, si son preguntados, informen positivamente de su trabajo. A todo esto hay que añadir que sólo se pagan las encuestas completas. ··.'-<L,~J,,'·¿-·:;i;';1~';g;;'!'i·'.··'.</'.·•.•· .•'" Lo cual significa que, si por cualquier razón (no siempre achacable al·encuestador) faltan respuestas, normalmente el propio encuestador hará lo posible por rellenarlas. Asimismo, se detectan irregularidades en la aplicación del diseño muestra!. Como un muestreo verdaderamente aleatorio supone mucho esfuerzo, que se traduce en mayor coste económico y temporal, está la práctica extendida del muestreo por cuotas (capítulo 3). Y, cuando éste se puede aplicar conjuntamente con el muestreo de rutas aleatorias (que contribuye a garantizar la "representatividad" de la muestra), se elige a los sujetos "sin demasiado esfuerzo" e intentando respetar, hasta cierto punto, un mínimo de aleatoriedad. Tras un comienzo más o menos azaroso, se selecciona a cualquier persona que esté com-

2. Haberse conformado con una respuesta de no opinión (no sabe/no contesta), no habiendo concedido al entrevistado más·tiempo para meditar la pregunta o aclararle las dudas que le suscite. 3. Haber registrado una respuesta "inválida", ya porque sea ambigua, ya por no estar claramente especificada o no ser acorde con lo que se pregunta. • Errores de medición debidos a cómo administran el cuestionario: 1. Cómo leen las preguntas: introducen variaciones en su formulación, las leen demasiado rápido no dando tiempo suficiente para pensar en la respuesta, las leen con una entonación que influye en la respuesta, enfatizan algunas palabras o respuestas, hacen gestos de asentimiento, contrariedad, de asombro o polemizan con el entrevistado, influyendo en su respuesta. 2. Cómo registran la respuesta: anotan la respuesta equivocada, involuntariamente, o tergiversan la contestación del entrevistado o, deliberadamente, falsean la respuesta. 3. Cómo siguen el orden de las preguntas en el cuestionario y las rutas específicas definidas por las preguntas filtro.

r


320

Capítulo 5: La administración del cuestionario

Métodos de encuesta

prendida en la cuota a cubrir. Las revisitas a los domicilios, para contactar con la persona elegida al azar, no es habitual. Se practica la sustitución. Es decir, sustituirla por otra persona de características similares, con la pérdida consiguiente de representatividad de la muestra. Obviamente, una muestra, supuestamente aleatoria, que continuamente es retocada, deja de serlo. Ante sus hallazgos, los autores del estudio (Camacho y otros, 2000) concluyen que la motivación económica es un factor de gran influencia para entender la "calidad" del trabajo de los encuestadores. Además, cuando -en opinión de los encuestadores- se cobra por cuestionario menos que hace diez años (normalmente, de 3 a 6 euros; las menos, de 6 a 12 euros) y ello afecta a su "calidad". Por último, critican la descoordinación entre los técnicos que diseñan el cuestionario y la muestra y quienes lo ejecutan (los encuestadores). Los cuestionarios se hacen desde la teoría, desconociendo lo que es la aplicación práctica, la realidad de las personas encuestadas y las posibilidades del encuestador. Quienes, en teoría, deberían actuar de enlace, los coordinadores de campo, en la práctica su función se reduce a "dar cumplimiento cabal a las recomendaciones que llegan de arriba. Esta falta de retroalimentación desanima con frecuencia a los encuestadores que no se sienten suficientemente valorados" (Camacho y otros, 2000: 131). Esta visión tan negativa de la práctica de la encuesta habría, no obstante, que verificarla en estudios más amplios, de ámbito nacional, que abarquen distintos colectivos de encuestadores (de empresas gubernamentales, privadas). Ha de comprobarse hasta qué punto los hallazgos de la anterior investigación reflejan el hacer no sólo de empresas privadas de opinión pública, muy marcadas por rendimientos económicos (relación coste-beneficios). También, de empresas gubernamentales, no tan definidas por fines económicos. De estas últimas se espera un mayor rigor en el proceso de encuesta, como igualmente sucede con las encuestas más académicas, llevadas a cabo desde el ámbito universitario. De todas formas, se han resaltado los hallazgos de dicho estudio para que el lector se percate de que no siempre la "puesta en escena" de la encuesta se realiza acorde al rigor exigido para garantizar la representatividad de la información que en ella se recoja. Como también se ilustra en el capítulo 6, cuando se expone la relación de errores detectados en la realización del Eurobarómetro 53, de 2000 (apartado 6.4). Algunos de los errores debidos a la mediación del entrevistador son controlables, como se verá en el apartado 5.2, pero otros no. Unos se traducen en errores variables, que varían de entrevistador a entrevistador (en unos casos se ha formulado la pregunta de una forma, en otros de otra, o se ha variado el orden de las preguntas, por ejemplo). Por lo que, analizadas en su conjunto, su efecto se neutraliza. Quiere esto decir, que no se materializa en un aumento de varianza del entrevistador. En cambio, cuando el entrevistador actúa de la misma forma con todos los entrevistados y su proceder se distancia de los otros entrevistadores, al no seguir las directrices dadas por los respon-

321

es de la encuesta, se está ante errores sistemáticos. Éstos últimos incrementan la va. a del entrevistador, afectando más a la calidad de la encuesta, por tratarse de errono esporádicos", al haberse cometido de forma reiterada. ero, ¿qué puede hacerse para reducir el efecto de los entrevistadores en los errores cuesta? Las actuaciones posibles van desde adecuar la selección de los encuestadores características de la encuesta y de la población a entrevistar, junto con la mejora de rmación y la est<fndarización de su proceder, hasta la intensificación de la superviyel control de su actuación. En concreto, las acciones para reducir la contribución entrevistador a los errores de encuesta se resumen en el cuadro 5.1. CUADRO 5.1. Recomendaciones para reducir la contribución del entrevistador a los errores de encuesta Aumentar el número de encuestadores y mejorar su selección. Ampliar la formación y el entrenamiento de los encuestadores. Presentación general del estudio. Selección de los entrevistados. Tácticas de presentación y de motivación. Información pormenorizada sobre el cuestionario. Cómo realizar la entrevista: • Lectura de la pregunta con soltura, ajustándose a su redacción. • Utilizar un tono medio, "natural", sosegado. • Realizar una lectura "neutral". ESltandalríz,lr su actuación como entrevistador. • Formulación exacta de las preguntas. • No influir en la respuesta. Anotación exacta de la respuesta. Intervención de los encuestadores ajustada a los criterios establecidos. Intensificar la supervisión y el control del trabajo de campo.

/:ll,lfflentarelnúmero de encuestadores y mejorar su selección

El aumento del número de encuestadores contribuye a minimizar la incidencia de sistemáticos debidos a su intervención en la encuesta. Como anteriormente se una encuesta en la que actúen 100 entrevistadores conseguirá una mayor preque aquella en la que sólo intervengan 10 encuestadores. Al incrementar su núno sólo se reduce el número de entrevistas que cada uno tiene que hacer (por lo

...•• >•••••• ----


322

Métodos de encuesta

que una actuación impropia por su parte afectará a un menor número de entrevistas). También, se amplía la heterogeneidad entre ellos. Es menos probable la coincidencia en unos rasgos psico-sociodemográficos concretos y en su proceder. Es más factible que los errores de encuesta a ellos debidos se traduzcan en errores aleatorios, al compensarse los ocasionados por unos por los debidos a otros. Los incrementos de los costes de contratación, de formación y de supervisión de un mayor número de encuestadores puede llevar, no obstante, a escoger otra solución. De todas formas, conviene seleccionar un número "razonable" de entrevistadores, en consonancia con el número de entrevistas a realizar por cada uno, junto con la dificultad de su ejecución. Preferiblemente se busca su adecuación a las peculiaridades de la encuesta y de la población a entrevistar. Esta acción se complementa con las que siguen a continuación. Ampliar la formación y el entrenamiento de los encuestadores

La preparación de los encuestadores ha de cubrir todos los aspectos implicados en su actuación. Desde la selección de los encuestados hasta el registro de la respuesta, si se quiere homogeneizar su intervención y que ésta se ajuste a las directrices marcadas en la investigación. A tal fin, el adiestramiento de los encuestadores ha de incluir cinco apartados básicos: a) Una presentación general del estudio: la temática de la encuesta (para que conozcan la materia sobre la que tienen que extraer información), el patrocinador (si se estima conveniente), la finalidad que se persigue con la encuesta y cómo

se va a proceder en su realización. Se ha de despertar el interés del encuestador y buscar su implicación en la consecución de los objetivos de la investigación. Para lo cual es muy importante que sea consciente del papel trascendental que desempeña en el estudio y cómo su actuación afecta a la calidad de la encuesta. A tal fin, se les debería informar de las consecuencias de actuaciones "impropias" y su repercusión en los errores de encuesta. Se trata de minimizar los errores debidos a su intervención, además de informar a los encuestadores de que los responsables de la encuesta conocen las "picarescas" habituales en la administración de los cuestionarios e intentarán evitarlas. El encuestador ha de saber que su actuación estará sometida a "control" riguroso (sea o no cierto) y que de ella dependerá su remuneración y contratación. b) Procedimiento a seguir en la selección de los entrevistados, en función del método de encuesta y del diseño de la muestra que va a aplicarse. En la encuesta telefónica, se les explica cómo se generarán los números de teléfono, de acuerdo con el sistema aleatorio elegido (capítulo 3). En la encuesta cara a cara, se les adiestra en la aplicación de los criterios marcados en el diseño de la muestra: cómo se procede en el cumplimiento de las cuotas, en la realización de rutas aleatorias (de forma aislada o conjuntamente) o en el procedimiento a seguir en la

Capítulo 5: La administración del cuestionario

323

selección de las unidades "últimas" de la muestra. Debe darse una información detallada, lo más rigurosa posible, de los pasos a seguir en la elección de entrevistados y prevenirles de posibles "problemas" con los que pueden encontrarse y cómo solventarlos. e) Enseñarles tácticas para presentarse ante la persona seleccionada y motivarla a participar en la encuesta. Éste es un tema muy importante ya que, como se verá en el aparf'ado 5.3, es prioritaria la reducción de "rechazos" a contestar el cuestionario en aras de la representatividad de los datos de encuesta. En dicho apartado se informa de diversas estrategias a seguir para hacer frente a los "rechazos". Por ejemplo, a los que dicen "No puedo, tengo prisa" y se les contacta en la calle, insistir en que el cuestionario es muy sencillo; que sólo le llevará un par de minutos responder a las preguntas; que es importantísimo para el estudio su participación; y destacar los beneficios de la misma. Si están en su domicilio y no pueden responder en ese momento, intentar concertar con él/ella, o con la persona con la que se contacta, una cita para realizar la entrevista en el mismo día o un día próximo. En caso extremo, se puede emitir un mensaje que transmita lástima, como los siguientes: "Es que si no le hago la entrevista, no cobro" o "Me penalizan si no consigo entrevistarle". Esta estrategia ha dado buenos resultados en personas como yo, predispuestas al "no", "no tengo tiempo ", a menos que la encuesta suscite mi interés, por su temática.

En todo caso, es bueno que el entrevistador haga ver al entrevistado que el tema de la encuesta "le interesa", "le afecta" y tiene una repercusión positiva que participe en la misma. Por esa razón, a los encuestadores ha de dárseles, por escrito, distintos argumentos para que los estudien, memoricen y expongan a la persona seleccionada, en su presentación de la encuesta. d) Información pormenorizada sobre el cuestionario. El propósito de cada pregunta, cómo formularla, cómo anotar la respuesta, el orden a seguir en la realización. de las preguntas, las rutas marcadas por las preguntas filtro. Si el cuestionario se imparte con antelación a la sesión de formación, se da tiempo al encuestador para que lea con detenimiento el cuestionario, reflexione sobre el mismo y pueda plantear, a la persona que le instruye, cualquier "duda" que le surja. En general, es mejor, previo a cualquier clase, que el alumno disponga del material del que se va a hablar y que lo haya leído con antelación. Ello ayuda a su mejor aprendizaje. En el caso de la encuesta, incluye, además del cuestionario, el material a utilizar en: • La realización de las entrevistas: tarjetas de respuesta, gráficos, el manual del entrevistador, cuaderno de notas. • La selección de los entrevistados: mapa del área donde se harán las entrevistas, hojas de ruta, tablas de números aleatorios, plantilla con las cuotas. • Su presentación: la credencial de encuestador, que respalde su actividad transmitiendo una imagen de mayor profesionalidad, y la tarjeta de


324

Métodos de encuesta

agradecimiento. En ella aparece el nombre de la empresa, la dirección y el número de teléfono, por si el entrevistado desea alguna aclaración. Cuando va a aplicarse alguno de los modos informatizados de encuesta (CAPI, CATI), la explicación del cuestionario se acompaña de prácticas en el manejo del programa informático. De mayor intensidad, cuando los encuestadores carecen de experiencia en su uso. Ha de adiestrárseles el tiempo que sea necesario para posibilitar que el empleo del ordenador no entorpezca, sino que agilice, la realización de la entrevista. Asimismo, en cualquiera de los modos de encuesta (informatizada o no), conviene alertar a los encuestadores de posibles "errores" que pueden cometer en su cumplimentación del cuestionario, con fines preventivos. e) Cómo realizar la entrevista. Forma de hacer las preguntas, de dirigirse al entrevistado, tono de voz a emplear, cómo mirarle (si es una entrevista cara a cara). En la encuesta telefónica se concede, lógicamente, mayor importancia al tono de voz y a la expresión verbal, en general, al ser la comunicación "auditiva", no visual. El usar un tono de voz alto, claro, con una pronunciación estándar parece favorecer la cooperación porque los entrevistadores son percibidos como competentes y confiados (como muestran Oksenberg y Cannell, 1988). En la encuesta cara a cara, al conjugarse la comunicación verbal con la visual, ha de ponerse especial cuidado no sólo en la expresión verbal, sino también en la visual: apariencia física, comportamiento, gestos, miradas. Todo con la finalidad de transmitir "confianza" al entrevistado, para que responda al cuestionario de la forma más sincera posible. Anteriormente se ha hecho mención a determinadas características psicosociodemográficas del entrevistador como favorecedoras de una mejor comunicación entrevistador-entrevistado. Principalmente, cuando están relacionadas con el tema de investigación. Sobre la indumentaria, se recomienda que sea "discreta y correcta, pero sin

Capítulo 5: La administración del cuestionario

El intercambio de información, la comunicación "cara a cara", se favorece cuando se transmite la sensación de que "interesa" lo que se dice, apoyando con la palabra, los gestos y las maneras al interlocutor para que éste hable con sinceridad y confianza. El cruce de miradas es clave. Hay que procurar mirar a los ojos de la persona con la que se habla. No sólo cuando uno se dirige a ella, sino, especialmente, cuando ésta responde. 'Contribuye a la percepción de ser escuchado, lo que se dice es de interés, dándole confianza para seguir hablando. Sólo en preguntas delicadas, aquellas que puedan considerarse íntimas-personales, es preferible no mirar al encuestado, cuando éste ha de responder a la pregunta. Mejor quedarse mirando al cuestionario o a la pantalla de ordenador (cuando se use CAPI), si se cree que el entrevistado puede sentirse incómodo o inhibido. • Utilizar un tono de voz medio, "natural", como el que se emplea en una conversación sosegada. El ritmo tranquilo genera en el entrevistado una respuesta sosegada, mientras que la lectura rápida da sensación de prisa que puede llevar a contestar a la pregunta de forma precipitada, antes de ser comprendida en su totalidad. Este hecho, además de aumentar el error de medición, puede generar -como indica Díaz de Rada (2001a: 171)- "frustración en el entrevistado". Por ello se recomienda proceder a una lectura lenta y clara de la pregunta, concediendo tiempo suficiente al encuestado para responderla. En especial, en personas con dificultades para la comprensión verbal (personas de edad avanzada, con problemas cognitivos). Ha de descartarse la lectura "rápida" del cuestionario para ahorrar tiempo de entrevista (acabar lo antes posible, ajuntándose quizás a los deseos del entrevistado). Propicia respuestas precipitadas, no pensadas e, incluso, puede ten~r el efecto contrario: alargar la duración de la entrevista. Si el entrevistado desea meditar la respuesta y la pregunta se le ha

n;Jiw~;~--------------------~--~-~---~p-m;alis-~-:1-(-1'v.1auzcmer., -Ftoias-'V~~f][1árlde~z;--'l~~Jó:-9M-)~-tta~de-evjtta]~se-da.r-l(i-lllna~~ei1l~-----'-~_ •. ~?-±::;-;f;:;M\j2;}i:{'i;:_'t'__ ?.,..{--_--------~-~---------tlorlntltat1l0-]ráp~lcl(imlenl~e-,--'puleC1e

de un "vendedor a domicilio". Ello se suma a la exigencia de unos "modales correctos y seguros", acompañados de una "sonrisa amable", para hacer que el entrevistado se sienta "cómodo". Respecto a la forma de realizar la pregunta se aconseja que: • Su lectura se haga con soltura, ajustándose a la redacción de la pregunta. En la encuesta cara a cara se insiste en la conveniencia de no quedarse mirando fijamente al cuestionario, para no perder contacto visual con el entrevistado. Las preguntas han de leerse como lo hacen los presentadores de televisión: echando un breve vistazo al papel y manteniendo la mirada en la pantalla. Para ello, se precisa que el entrevistador se aprenda las preguntas, casi de memoria, mediante la lectura reiterada del cuestionario, previo a la realización del trabajo de campo.

325

-feEfl:lefif-al-ent-fev-is-t-aElef--qüe--l-a-le-a--más'---~~

despacio, la repita las veces que sea necesario, y aclare lo que no entienda. El tono de voz ha de ser medio. Una voz débil dificulta el entendimiento del mensaje, inspira más compasión que credibilidad y el entrevistado pierde interés. Una voz torrente intimida a la persona entrevistada y da la apariencia de estar ante un vendedor agresivo de algún producto (Manzano y otros, 1996: 99).

• Realizar una lectura "neutral", no enfatizando unas palabras con preferencia a otras o unas respuestas, cuando se mencionan en la pregunta (pregunta cerrada), para no influir en la respuesta. También, debe evitarse añadir comentarios, cuando se realiza la pregunta ° se da la respuesta, ni aludir a "experiencias personales". Como afirman Van Kammen y Stout-


326

Métodos de encuesta

hamer-Loeber (1998: 385), el entrevistador "debería mantener siempre una relación profesional con los participantes en la entrevista". En relación a la respuesta, se insiste en la necesidad de conceder, al encuestado, tiempo suficiente para meditar la respuesta, evitando la contestación precipitada, antes incluso de terminar la pregunta. Además, debe procurar que ninguna pregunta quede sin respuesta (no respuesta de ítem) o se responda incorrectamente. Para ello, ha de entrenarse a los encuestadores para que hagan frente a las respuestas "no sé" y a respuestas incompletas. Fowler (1991) insiste en la conveniencia de informar al entrevistado, antes de proceder a la entrevista, de la importancia de obtener datos completos y cómo ha de responderse a las preguntas de forma correcta. Ayuda a la mejora de las respuestas. Asimismo, ha de insistirse en que no se dejen preguntas en "blanco", sin anotar el motivo (a qué se debe): no contesta, no sabe, no procede su realización al tratarse de preguntas filtro. Ello facilita el trabajo del codificador y, además, esta información es necesaria para la interpretación correcta de las respuestas. Repetir la pregunta,"las veces que sea necesario, es exigido, cuando el entrevistado manifieste que no la entiende o dé una respuesta incompleta, imprecisa, no acorde con lo que se pregunta. Existen unas "tácticas" de entrevista comúnmente referidas en la realización de las entrevistas en profundidad (entrevistas cualitativas), pero extensibles a toda modalidad de entrevista. Constituyen formas de comportamiento "verbal" y "no verbal", utilizadas cuando la situación lo requiera, para transmitir al entrevistado que prosiga o clarifique su respuesta. Valles (1997: 220-221 y 2002: 115-126) las sintetiza en siete, siguiendo la aportación de Gorden (1975): • Táctica del silencio. Considerada la más "neutral", la que menos estructura la respuesta. Resulta muy útil, si se emplea en el momento " preciso y en la dosis correcta. Unos pocos momentos de silencio pueden ser la forma de animar a la gente a hablar con mayor detalle y profundidad sobre el tema o puede"incluso expresar sus sentimientos y emociones directamente (Atkinson, 1998: 35).

Pero, ha de evitarse el "exceso". El silencio puede llegar a ser "embarazoso", incómodo, para el entrevistado, no sabiendo éste que más se pide de él. González y Padilla (1998: 150) aconsejan evitar el uso excesivo de silencios y de expresiones de asentimiento: Los primeros representan una situación violenta que el entrevistado intentará romper ampliando su respuesta. Los segundos deben emplearse con mesura para no caer en el ridículo.

Capítulo 5: La administración del cuestionario

327

• Tácticas de animación y de elaboración. Igualmente calificadas como tácticas "neutrales" de entrevista. La primera, la animación, incluye cualq~ier manifestación (gestos, ruidos, expresiones) que indique al entrevIstado que el entrevistador asiente en lo que dice y desea que continúe hablando. Cumplen esta función, por ejemplo, expresiones como "ah", "mmm", "ya", ~over la cabeza afirmativamente o mostrar un rostro expectante, serio o sonnente, acorde con lo que dice el entrevistado. Con ello se le indica que se está "a la escucha".

La táctica de la elaboración es más verbal, pero tratando, igualmente, que la intervención del entrevistador sea "neutral". Al entrevistado se le pide que se extienda, que aclare su respuesta. Por ejemplo, "¿y entonces?", "¿hay algo más que le gustaría añadir?", "¿podría precisarlo un poco más?".

• Tácticas de reafirmar y repetir. Persigue la obtención de información adicio~al, mediante. la repetición de expresiones pronunciadas por el ent~evIstado, pero SIn formular la pregunta directamente. Se distinguen tres tIpOS: - Eco. La repetición de algunas de las palabras del entrevistado. - Interpretación de lo dicho por el entrevistado, en vez de repetirlo de forma literal. - Resumen de lo dicho, combinando la repetición con la interpretación.

Éstas son formas de invitar al entrevistado a que prosiga en la elaboración de su respuesta, al tiempo que se le indica que se le entiende y se le sigue con interés. • !á~tica de reca~itulación. Una forma de "elaboración retrospectiva". Se InVIta al entreVIstado a que "recapitule" lo que acaba de decir, en busca de una mayor elaboración en un segundo relato. • Táctic~ de aclaración. Se pide al entrevistado que "aclare" lo que acaba de deCIr (su respuesta o algún aspecto de la misma). Por ejemplo, "No he entendido lo que acaba de decir. ¿Me lo podría aclarar o concretar algo más, por favor?".

Esta táctica suele requerirse después de que las tácticas de elaboración alcancen un punto muerto.


328

Capítulo 5: La administración del cuestionario

Métodos de encuesta

Algunos ejemplos de solicitud de aclaración son los típicos "¿qué?", "¿cómo?", "¿cuántos?", "¿por qué?", "¿cuándo?". Ante una respuesta imprecisa de "muchos" o "frecuentemente", pedir al entrevistado que "aclare o concrete cuántos realmente". No ha de pasarse a otra pregunta (del cuestionario) hasta que no haya quedado clara la contestación de la pregunta precedente.

• Táctica de cambiar de tema. De uso más habitual en las entrevistas cualitativas, cuando el entrevistador tiene que lanzar unas preguntas para cubrir temas aún no tratados en la entrevista, o para soslayar un asunto delicado, que oprima o inhiba al entrevistado. No tanto en la entrevista estandarizada, como sucede en la encuesta, donde se sigue un orden estricto de pregunta y respuesta. • Táctica de la post-entrevista. Como su nombre indica, es una "prolongación del encuentro entrevistador-entrevistado", una vez concluida la entrevista formal. Proporciona una oportunidad para conversar, de forma más distendida, con el entrevistado. Se quiere captar su impresión acerca del cuestionario (en el caso de la encuesta) y cómo se ha llevado a cabo la entrevista. Además, ofrece la oportunidad de poder detectar, en el curso de una conversación "informal", si ha habido alguna información que el entrevistado ha ocultado, durante la entrevista, y a qué se debió.

329

tar aún en presencia del entrevistado, se le puede solicitar que aclare preguntas cuya contest~ción ha quedado confusa o que confirmen respuestas que se cree han sido mal anotadas. También conviene, de acuerdo con Van Kammen y Stouthamer-Loeber (1998: 386), entrenar a los encuestadores "para dejar al participante con un sentimiento positivo sobre el proyecto. La última impresión que el participante tenga del entrevistador puedeterminar lo deseoso que él o ella estará de ser entrevistado de nuevo". Al entrevistador hay que enseñarle, además, a "saber escuchar", a observar cómo se produce el discurso oral: titubeos en la voz, voz entrecortada, cambio de tono, precipitación al hablar. Si la entrevista es cara a cara, forma de mirar, cambios de mirada, .::tVJ..I..I.'JI""'U~ ceño fruncido, encogimiento de hombros, sudoración o cualquier manifes'. __ "","'__"''''A'' de nerviosismo o de incomodidad por parte del entrevistado ante lo que se pre;.. . ,'"._.. . ,.._. Debe dejársele hablar, sin interrumpirle, sin manifestar ninguna reacción de ,';;'lU.l.VV'U"".I.~J.J. o desaprobación ante lo que dice (manteniendo una actitud "neutral", prosin mostrar superioridad, sino creando un ambiente en el cual se sienta cóy hable con confianza. A veces, la propia personalidad del entrevistador contribuye a que este hacer se llej¡~¡~~¡¡~~~~cc:~:,.~a~~c;:a.~bo con "naturalidad". No necesita mucho aprendizaje. También afecta la ex> que tenga en la realización de entrevistas. Pero, las más de las veces, conviene ;.··... ,........_,oJ ..... ,.4-... "buenas" y "malas" prácticas de entrevista, para que se sepan enterados de cósu proceder afecta a la calidad de la encuesta. Además de establecer en qué se filos supervisores en su actuación. Al aprendizaje del cuestionario hay que añadir prácticas de lectura, en voz alta, del /ti2<-~4~~J;jJ-Ú·<;;~~cu~~stjionlari.o y la realización de entrevistas supervisadas. Aparte de mostrarles "buenas" entrevistas, exponiendo las razones de dicha calificación, es necesaria la rea.:.·.• $Txj.¡.)';:,Dt·c,':·'.. ·.··macl.uIl de prácticas. Principalmente, cuando los encuestadores tienen poca o nula ex-}f,.bd1:/~{;\·.·.··:·nprlpn{'·i~ o hay incorrecciones en su actuación. Pueden hacerse: ·,,;;,,_';;;: .

Anteriormente se ha destacado la relevancia, para la evaluación de los datos de encuesta, de recoger información de los propios encuestados referidos al cuestionario y a su administración. Al igual que de todo aspecto que pueda ayudar a calibrar la sinceridad en la respuesta y cómo afectan en los errores de medición el entrevistador, el entrevistado y el cuestionario. De ahí la "exigencia" de añadir datos de control expresos en el cuestionario (como los expuestos en el apartado 4.4) y de espacio suficiente, al final del cuestionario, para que el entrevistador anote "cualquier" información que estime de • Entrevistas de "roles cambiados", en las que un entrevistador hace de entreinterés.enJainterpI_~1ª~jºº4e los datos Afectan al cuestionario (objeciones a preguntas realizadas por el ire:vlsia(fo~-ssliu:re;da(~ci()ii~iit~ic~lCi(5if-lelretlc-Ut~-sti:onario--:yr--.... ---)t• Entrevistas en las cuales el preparador hace de entrevistado y los futuros endemás), y al entorno donde se produce la entrevista (tranquilo, ruidoso; si el entrevistado cuestadores de entrevistadores. fue distraído por algo o terceras personas, en el curso de la entrevista). • Entrevistas con un "extraño", una persona ajena a la investigación, que hace de Antes de dar por finalizada la entrevista y despedirse del entrevistado, reiterándole para escenificar una situación de entrevista "real". entrevistado, el agradecimiento por su colaboración, es imperativo que el entrevistador repase el cuestionario; que repase si todas las preguntas a realizar han sido contestadas y las resEs bueno que las prácticas de entrevista no sólo se supervisen, sino que se "graben", puestas anotadas se ajustan a lo dicho por el entrevistado. Es decir, ha de asegurarse su posterior puesta en común y discusión. El aprendizaje se adquiere mediante la que no ha cometido ningún error en su anotación. También, que la letra es legible (se ?\5tt,:W~[·{j\f}f)N1 . .... !t\;lcornb]lna,ció,n del estudio, la práctica, la observación y la discusión del hacer propio y del lee con facilidad). Este repaso, que apenas supone unos pocos minutos, ayuda a reducir Se busca la detección de errores y que los encuestadores comprendan por errores de medición debidos a anotaciones erróneas de las respuestas, y de errores de ·:I::;'\':."J·'E,(Y:Ci:<lué son "errores" y qué hacer para evitarlos. También, ayuda la puesta en común de no respuesta de ítem, por "omisión" de pregunta o de respuesta (ésta no se ha anotaencuestadores sobre sus experiencias en la aplicación de la encuesta. do o se ha registrado mal). Weinberg (1983) añade, a las técnicas de entrenamiento de encuestadores la La inmediatez con la que se realiza el repaso del cuestionario, justo al terminar la p.:~;,,-'}!iDt\;··-;/ , _ : · . • · • . · .·.·co:nv(~nienlcia de realizar ejercicios escritos, como parte del estudio en casa o en gru~o. entrevista, contribuye al recuerdo o la memoria de lo que en ella se ha dicho. Y, al es.,..'--'" ....;,;,<.<;,..,.•:.,••.••.•. . . . . .•. '1.1"10 ..... 13n


330

Métodos de encuesta

Se les pregunta sobre el cuestionario, el manual del entrevistador y demás material entregado. Se les plantea cómo resolverían situaciones problemáticas concretas. Por ejemplo, "¿Qué haría si el encuestado le dijese que no quiere responder al cuestionario?".

A los encuestadores se les debería dar, antes de comenzar las sesiones de formación, un manual o guía que recoja la información necesaria para la realización con éxito de su trabajo. Desde los objetivos de la encuesta, las instrucciones para la selección de los entrevistados y su presentación, hasta cómo aplicar el cuestionario y cómo resolver "problemas" con los que puedan encontrarse. Después, se les puede examinar sobre el material entregado para saber hasta qué punto lo han aprendido y comprendido. El manual contribuye, además, a garantizar que todos los encuestadores dispongan de la misma información y pueda avanzarse en su homogeneización. Esto último es de especial importancia cuando los encuestadores reciben instrucción de diferentes profesores o no acuden todos a las sesiones de formación. Más que leerlo, deberán aprenderlo. También, será un material de "consulta" al que acudir ante problemas o incidencias en su actuación. Por esta razón, del manual se exige que sea lo más completo y comprehensivo posible. Por último, respecto a la duración del período de formación, suele oscilar entre dos y cinco días. De acuerdo con Fowler y Mangione (1990), varía desde al menos un día, en muchas encuestas, hasta de tres a cinco días, en encuestas gubernamentales y académicas. "Los entrevistadores formados durante menos de un día producen, significativamente, más errores de encuesta que aquellos que fueron preparados durante más tiempo" (Fowler, 1988: 117). Billiet y Loosveldt (1988) comprobaron igualmente la presencia de menor error de no respuesta parcial en encuestadores que recibieron una formación más intensa (hasta 15 horas) y en aquellos en los que se grabaron las entrevistas. Lógicamente, a mayor duración del período de formación, más tiempo se concede a los encuestadores para estudiar, debatir, pedir aclaraciones del material entregado y realizar prácticas de entrevista. En su duración incide la preparación previa de los encuestadores, su experiencia, la complejidad de la encuesta y la intensidad de las sesiones (cuántas horas se impartan al día y para cuántos encuestadores). Estandarizar su actuación como entrevistador

Tradicionalmente se ha visto en la estandarización una forma de reducir la varianza debida al entrevistador, con la consiguiente reducción del error de medición en la encuesta. Sobre todo, cuando en la encuesta (mediante entrevista) intervienen muchos encuestadores. Se quiere homogeneizar su actuación para que las variaciones entre ellos sean las menos posibles y no generen problemas de comparabilidad en la información por ellos recabada. La estandarización atañe, en mayor medida, al proceso de entrevista, a la interacción entrevistador-entrevistado. Exige:

Capítulo 5: La administración del cuestionario

331

• La formulación de las preguntas exactamente como están escritas en el cuestionario y en el mismo orden en que aparecen. • No influir en la respuesta del entrevistado. El entrevistado tendrá que interpretar la pregunta "por sí mismo". El entrevistador deberá "comportarse de una forma amigable, pero neutral" (Dijkstra y van der Zouwen, 1982: 7). No debe responder al encuestado (para evitar sesgos que puedan surgir de la inferencia del entrevistador en la tespuesta) ni dar una información directiva (Brenner, 1982: 140). Si el entrevistado le pide que interprete la pregunta, se tiene que limitar a repetir la pregunta y sus opciones de respuesta (en preguntas cerradas), yanimarle a que dé su propia interpretación..La definición de términos confusos se circunscribe a la dada en las instrucciones para la administración del cuestionario. Pero, como reconocen Biemer y Lyberg (2003: 151), "desafortunadamente esta meta idealista frecuentemente no se alcanza en la entrevista estandarizada". Especialmente, en preguntas complejas, en las que algunos encuestados precisarán de la interpretación, por parte del entrevistador, para su correcta comprensión.' No obstante, se insiste en la elaboración rigurosa del cuestionario para que éste no requiera "clarificaciones" por parte del entrevistador. • La anotación de la respuesta manteniendo los términos exactos con los que se pronuncia. De especial incidencia en preguntas abiertas. No cabe la interpretación de la respuesta. • La preparación de los encuestadores para que su intervención se ajuste a los criterios establecidos por los responsables de la encuesta. Incluyendo la resolución de problemas con los que puedan encontrarse en su trabajo. Han de preverse los más posibles para dar las mismas pautas de actuación, y de forma simultánea, a todos los encuestadores. En 1990 se publican dos propuestas contrapuestas de entrevista en la encuesta. y Mangione (1990) defienden la entrevista estandarizada, mientras que Schu(1990) reivindican la conveniencia de la entrevista conversacional. El con(WNi·····Ce~eter·· mayor libertad al entrevistador para obtener respuestas más adecuadas. Se ,: <.,..,,-.----_ que el entrevistado entienda el significado de lo que se pregunta. Para ello se aual entrevistador a modificar, si se requiere, la formulación de la pregunta y ayu'." .....• '1" encuestado en su comprensión. En la entrevista conversacional se busca la es'ur·c • •·tarletalrlzacl.ón del "significado", no de la intervención del entrevistador. .i;;·?·i"~r;>f~if~f¡:r:ir~()l1l;E~;s,;t~u;dd~ios hechos con anterioridad, como el realizado por Dijkstra (1987), habían que la práctica de un estilo "más informal" de entrevista contribuye a la ob;ci:¡;·~~;:G>i~'~i~>~;lC~}·:t!;;,;(te:n.ci.ón de respuestas más relevantes a los objetivos de la encuesta. No sólo porque se ;.,·.;:.f)~;.··:-:>·:'/>/··:'::·:;·· Jt' ......~L.a..a.- la clarificación del significado de la pregunta. También, porque se consigue inmás al entrevistado para que participe en la encuesta. La entrevista adquie.·. . .·.cíL;/'ü;..-r:•• .'{>.-< •. ]~e más el carácter de una conversación que de una entrevista formal, que sigue un }E~,;·;:;{~:~;:;/·_::·:······:· guión estricto. .Con posterioridad, Dykema, Lepkowski y Blixt (1997) comprueban, con pre. . ".:, . . :.. >.. c.t;;.::.::::..·.::::..... guntas habituales en la encuesta de salud (NHIS: National Health Interview Survey),


332

Métodos de encuesta

que cambios sustantivos en la formulación de la pregunta sólo están significativamente relacionados con la adecuación de la respuesta en una de cada diez preguntas analizadas. En contra de los defensores de la estandarización, observan que los cambios en las preguntas consiguen respuestas más adecuadas. Ello se debe a que la alteración, por parte de los entrevistadores, se hace para comunicar "más claramente" la finalidad de la pregunta. Cambios frecuentes suponen omitir partes de una pregunta porque el entrevistador piensa que no son aplicables al entrevistado o porque son especificaciones de períodos de referencia u otros criterios que el entrevistado ya entiende, por ejemplo. Si bien, los autores del estudio reconocen que las preguntas que analizaron eran, en su mayoría, preguntas de hecho (objetivas). Si hubiesen indagado en aspectos subjetivos, es posible que cambios pequeños en su enunciado hubiesen alterado el significado de la pregunta. Adviértase que, en general, las preguntas de hechos (u objetivas) son las menos susceptibles a los efectos del entrevistador. No así, las preguntas subjetivas (opiniones, actitudes, valores). No obstante, la práctica "rigurosa" de la estandarización, aunque se defienda, no siempre se produce, aun cuando se crea que se lleva a cabo. Como el mismo Bradbum (1983: 314) reconocía, tiempo atrás, Como uno no puede estandarizar completamente cada aspecto de la situación de entrevista, no debemos esperar que los entrevistadores estén completamente programados. En realidad, una de las virtudes de los buenos entrevistadores es que son flexibles y pueden ajustar su conducta y discurso apropiadamente a las situaciones en las que se encuentran. Los esfuerzos para estandarizar preguntas no deberían llevar a una rigidez que requiere que los entrevistadores abandonen su sentido común.

Ante esta disyuntiva, la pregunta inmediata es ¿qué hacer? Sobre todo, cuando se parte de que en la metodología cuantitativa, enfocada a la inferencia, a la generalización de los hallazgos del estudio, la estandarización se defiende como garante que contribuye a la calidad de los datos. Se busca minimizar la influencia del investigador (en la encuesta, .. ·-eii-general,y-delentrevisiador;-eilpartiCUlar)enla-informaciónqueseproporeione.-~ Tal vez, lo mejor sería combinar ambas aproximaciones, como proponen Schoeber y Conrad (1997) y Conrad y Schoeber (2000). Ajustarse a lo establecido en el cuestionario, pero autorizando al encuestador a clarificar respuestas y a ayudar a la buena comprensión de las preguntas complejas o que no han quedado bien especificadas en el cuestionario. Algunas preguntas incluyen términos que pueden ser entendidos, por parte del encuestado, de forma diferente a quien diseñó el cuestionario. Problemas que, por otra parte, pueden detectarse en el pretest o pruebas previas del cuestionario. En caso contrario, puede pedirse al entrevistador que contribuya a su clarificación. En estas circunstancias de preguntas "difíciles", la entrevista conversacional es deseable. Si bien, no ha de considerarse ésta una "panacea". Exige una mayor preparación, por parte del entrevistador, y, a veces, supone una mayor duración del tiempo de entrevista. Ello revierte negativamente en los costes del trabajo de campo (aunque no invalida su práctica) y, positivamente, en la calidad de la encuesta.

Capítulo 5: La administración del cuestionario

333

Dijkstra (1987), tras realizar varios experimentos en Holanda sobre estilos de entrevista, igualmente recomiendan preparar a los encuestadores para la realización de enl're~'istI2s más "personales". Pero, evitando que éstos añadan sus puntos de vista "per/son:ale:s" a la secuencia de pregunta-respuesta. En su estudio se concluye que un estilo "p,ersonal" de entrevista estimula al entrevistado a dar respuestas más adecuadas. Sin ernbar'go, puede también contribuir a la obtención de respuestas sesgadas, debido a que el entrevistador ha iflfluidoen la respuesta o la ha interpretado de forma inadecuada. . De ahí la insistencia en que debe mejorarse su preparación para la ejecución de las entrevistas. Las preguntas que son difíciles, pero para las cuales el entrevistador no puede sugerir respuestas, probablemente se beneficiarán de un estilo personal de entrevista porque aumenta la motivación del encuestado a contestar de forma adecuada y completa. Para preguntas que son fáciles (y que no requieren tal motivación) pero que son susceptibles a sugerencias por parte del entrevistador, un estilo formal de entrevista puede obtener datos de mayor calidad (Schaeffer y Maynard, 2002: 578).

Introduciendo mejoras en el diseño del cuestionario (teniendo en cuenta la información recogida en el pretest u otras comprobaciones previas del cuestionario), para facilitar la comprensión de las preguntas, junto con una exhaustiva instrucción de los "encuestadores para su administración, se pueden, no obstante, evitar muchos de los errores de medición debidos al entrevistador. Y, como no siempre es posible anticipar todas las situaciones en las que puedan encontrarse, se debería preparar a los encuestadores para adaptarse a distintas situaciones de entrevista; que puedan flexibilizar su actuación en función del entrevistado.

Intensificar la supervisión y el control del trabajo de campo Junto con la formación del entrevistador, la supervisión es necesaria para reducir la -variabilidad.debida-aLentrevistador.Yrecisªme.nte.,.!!nº.dl:lJ9s fa.~!º~~~.gtl~~()ntribuye a ,·la menor incidencia del entrevistador en los errores de medición en la encuesta telef6nIca-la facilidad para la supervisión "continua". Cuando las entrevistas se hacen desde una central, donde coinciden entrevistadores y supervisores, puede consultarse cualincidencia en la realización de las entrevistas y se logra una mayor estandarización homogeneización en la actuación del entrevistador. Además, la sensación de ser "vi(en cualquier momento de la entrevista, el supervisor puede escuchar, sin ser perpor el entrevistador, lo que en ella se dice) hace que el entrevistador intente no de~;vialfse de las instrucciones dadas para su realización. A ello también contribuye el programa CATI que, como los otros modos de encuesta informatizada, persigue la estanaal"Í7l1r.li)n de la entrevista. El evitar errores debidos al entrevistador, como la omisión de preguntas o el no registro de respuesta (como se vio en el capítulo 2). En la encuesta cara a cara, la monitorización de la entrevista es una excepción, no lo habitual. Rara vez se lleva a cabo la entrevista bajo "observación" (directa o indi-


334

Métodos de encuesta

recta) del supervisor. El entrevistador se siente más "libre", no "vigilado", lo cual puede propiciar que se desvíe de las instrucciones dadas. Ello se suma a los efectos en la respuesta de los encuestados debidos a la presencia visual de un entrevis~ador (sus r~s­ gas físicos, vestimenta, gestos, mirada). El resultado es una mayor varIanza o varIabilidad del entrevistador. Es decir, una incidencia desigual en los datos de encuesta (la respuesta de los e.ncuestados). Pero, también, hay que considerar la razón de entrevistas por entrevistador. En la encuesta telefónica la mayor facilidad para la realización de la entrevista, unido a su mayor brevedad (no más de 10-15 minutos), hace que cada entrevistador haga el doble, e incluso el triple, de entrevistas que en la encuesta cara a cara. En esta última se ~re­ cisa de más encuestadores, siendo más difícil conseguir homogeneidad en su actuacIón, con el consiguiente incremento de varianza debida al entrevistador. Si bien, su efecto individual negativo, de cada entrevistador, en los errores de medición afecta a un menor número de entrevistas (que en la encuesta telefónica). Menos si cabe, cuando es causalo aleatorio y puede contrarrestarse. Homogeneizar la actuación de los entrevistadores, con la consiguiente reducción de su efecto negativo en el error de medición, se consigue mejorando la selección, formación y supervisión de los entrevistadores. Dado el protagonismo de la supervisión en el trabajo de campo, a ella se dedica el apartado siguiente (apartado 5.2). Aquí sólo insistir en la necesidad de controlar los efectos del entrevistador en el error de medición, que afecta más a: a) Encuestas que tratan temas "delicados", referidos a conductas, actitudes u opiniones que tienden a "ocultarse". b) Encuestas cara a cara, y más en encuestas convencionales, de "lápiz y papel", no mediante ordenador. c) Preguntas subjetivas (actitudes, opiniones, valores) más que a preguntas objetivas (o de hechos) -véase, por ejemplo, el estudio de Dykema, Lepkowski y Blixt (1997)-. Principalmente, en preguntas delicadas o sensitivas, como las referidas a renta económica o ideología política. d) Preguntas abiertas más que en cerradas (Hagenaars y Heinen, 1982). Aunque hay que puntualizar, de acuerdo con Groves (1989: 380),que Las preguntas abiertas no están inherentemente sujetas a mayor variabilidad del entrevistador, pero el número de respuestas obtenidas a una pregunta abierta parece ser sensible a diferencias del entrevistador.

Como Feldman y colaboradores (1951-1952/2002) comprueban, en un estudio experimental con 45 entrevistadores de Denver realizado en 1949, en las preguntas abiertas las diferencias entre los entrevistadores es amplia en el tipo y número de respuestas. Son los entrevistadores con mayor experiencia los que registran más respuestas y.de mayor calidad. En la respuesta también afecta~ las expectativas que el entrevistador tenga sobre la respuesta a la pregunta ablerta.

Capítulo 5: La administración del cuestionario

335

e) Respuestas de "no sabe"/"no contesta". La no respuesta, tanto total como de ítem, s.uele relacionarse con deficiencias en la actuación del entrevistador: localización y motivación de entrevistados (no respuesta total); omisiones de preguntas, preguntas realizadas de forma precipitada, no dando tiempo suficiente al entrevistado para responder o no intentando que el entrevistado piense en una respuesta válida; o, sencillamente, no anotando de una forma clara la respuesta. Todo lo cual próvoca error de no respuesta de ítem. Para algunos autores la causa de las diferencias observadas en la interpretación del efecto del entrevistador en la no respuesta puede estar no en que un único entrevistado responda de forma diferente a entrevistadores distintos, sino en que los entrevistadores tengan que acceder a grupos de población diferentes. Como indican Stokes y Yeh (1988: 358), Los porcentajes de respuesta del entrevistador con frecuencia difieren y la no respuesta generalmente no es aleatoria en la población. Esto parecería ser una fuente probable para diferencias aparentes entre entrevistadores.

f) Entrevistados de menor nivel educativo y de mayor edad. Éstos últimos, por su menor nivel educativo. Las personas de menor nivel educativo pueden buscar mayor ayuda del entrevistador para responder a las preguntas o pueden utilizar la inflexión de la voz del entrevistador como una señal para las respuestas a preguntas que encuentran difíciles (Graves, 1989: 379).

Por último, también hay que considerar el entorno donde se lleva a cabo la en-

¡·;~~,:tr~vista. Éste afecta a la interacción entrevistador-entrevistado. No sólo el modo de en-

;~c;tr~vista (personal, telefónica), o el cuestionario a cumplimentar. No es lo mismo for-

~;lllular y responder preguntas, cuando ambos interlocutores (entrevistador y !!'é;Sl)J;revistado) están cómodamente sentados en un espacio silencioso y "sin prisa", que >?,.~'-~l1.a.l1do ambos están de pie en un espacio concurrido o bullicioso (en la calle, en la ,'~~erta del domicilio del entrevistado, siendo observados por otros convecinos) y se tie.ei~eprisa por terminar lo antes posible. ~.~~La supervisión del trabajo de campo

<..... Para una encuesta de "calidad" es imprescindible, cuando se realiza mediante ~:~J.1trevista, la supervisión o "control" de la actuación del entrevistador en la reco-

:'8ida de la información. Ha de evitarse la tentación a "falsificar" la entrevista, en su :~~f:9~ªlidad o en parte. Además de controlar errores en la selección de entrevistados

: y<el} la cumplimentaciónde los cuestionarios. A la supervisión se ha hecho refe-

~~I).cia en páginas precedentes, al igual que a procedimientos a seguir en la prueba


336

Capítulo 5: La administración del cuestionario

Métodos de encuesta

y evaluación de los cuestionarios (apartado 4.5). Mucho de lo entonces dicho es igualmente aplicable a la supervisión del trabajo de campo. Razón por la cual se aconseja su relectura. Es responsabilidad del supervisor, o persona encargada del "campo", verificar que los encuestados se han seleccionado aplicando, rigurosamente, las directrices marcadas en el diseño de la muestra. También, la calidad de los datos recogidos. En la encuesta mediante entrevista su intervención ha de cubrir todo el trabajo del entrevistador. Ha de comprobar que se ha llevado a efecto de acuerdo con las instrucciones dadas. Entre sus funciones principales están: a) Dirigir el trabajo de los entrevistadores. Desde la distribución de las entrevistas a realizar por cada uno y la coordinación entre ellos, hasta la resolución de cualquier "problema" o incidencia que puedan encontrarse en la administración de los cuestionarios. Es importante que exista una interacción continua entre supervisores y entrevistadores. Contribuye a la prevención de errores de encuesta. Ante cualquier incidencia en el campo (referida a la muestra, al cuestionario), los encuestadores han de poder consultar, con prontitud, al supervisor qué hacer para su resolución. Asimismo, resulta beneficiosa la reunión conjunta del supervisor con los entrevistadores a su cargo y, a ser posible, al poco de iniciarse el trabajo de campo. De esta forma, ante las primeras "incidencias" pueden darse unas mismas pautas a todos los entrevistadores, de forma simultánea, y en un mismo momento en la ejecución del campo (en sus inicios, para que los errores detectados afecten a menos cuestionarios). Debe reiterárseles la trascendencia de que actúen con corrección, tanto en la selección de los entrevistados como en el desarrollo de la entrevista. b) El control de su actuación, en su desarrollo y tras su conclusión. Se trata de detectar "errores" en la selección de las unidades de la muestra, la contactación de 10sentre"islªdºs{l<ºll!ºs~~resentael entrevistador a la persona para ser encuestada) y en la realización delá.-entiévlsta (cómo TorffÜ.lta-laspreguntas,anota las respuestas, orden seguido en las preguntas). Especial atención se presta a las preguntas sin respuesta y en aquellas con respuesta incompleta, ambigua o irrelevante. Ha de comprobarse si ello se debe al diseño del cuestionario o al hacer del entrevistador. Si éste ha concedido tiempo suficiente al entrevistado para pensar en la respuesta; le ha repetido la pregunta y ayudado en la comprensión de términos no entendidos (en caso de que éste haya sido el motivo); le ha insistido en la importancia de dar una respuesta y que ésta sea "sincera"; o, simplemente, se debe a un "descuido" porparte del entrevistador, que no ha formulado la pregunta o no ha anotado la respuesta.

Para el control se revisan los cuestionarios, se pregunta a los jefes de campo (si los hubiera), a los entrevistadores y se verifican las entrevistas. Asimismo, es de gran utilidad la observación directa e indirecta del desarrollo de la entrevista.

337

5.2.1. Revisión de los cuestionarios

Es la forma de control más sencilla, de menor coste y de uso extendido en la generalidad de las encuestas. Una vez completados los cuestionarios, el supervisor los inspecciona para ver si se han omitido preguntas; si se han seguido correctamente las rutas marcadas en el cuestionario por las preguntas filtro; si las respuestas son legibles (en preguntas abiertas), lian quedado correctamente especificadas y son relevantes a lo que ~e pregunta; si hay preguntas sin respuesta y cuál es su motivo. Muchos de los errores en la cumplimentación de los cuestionarios pueden evitar. se si los encuestadores, una vez concluida la entrevista y antes de despedirse del entrevistado, hacen una revisión completa del cuestionario. Las respuestas dadas las tienen aún recientes en la memoria y cualquier duda ante anotaciones en el cuestionario las pueden consultar con el encuestado. e El supervisor también comprueba los datos de control, unos ubicados al principio . y otros al final del cuestionario (apartado 4.4). Datos de identificación del encuestado que se hayan registrado (nombre, dirección, número de teléfono, localidad), procedimiento seguido en su selección (si hubo o no sustitución, número de intentos de contactación, día, hora), motivo de la no respuesta total (no localización, rechazo o negativa a contestar), fecha de realización de la entrevista (mes, día, hora) y su duración. De esta información quiere deducirse si realmente se entrevistó a quien debía entrevistarse, el número de intentos habidos hasta su contactación y si la entrevista se ajusal tiempo previsto. Una entrevista completada con prontitud es indicio de actuación incorrecta por pardel entrevistador. No ha dado tiempo suficiente al encuestado para entender la prey meditar la respuesta. La entrevista se ha hecho de forma precipitada. Si >i Oll¡;n. el supervisor ha de estar alerta ante posibles falsificaciones por parte del entre/X··.vistadlo.,ro Este puede anotar el tiempo promedio esperado en su cumplimentación, sea Cierto. El problema de limitar el control a la información registrada en el cuesiti.onari.o es, precisamente, que sólo se controla lo que está en él anotado. Aunque se aportados en el cuestionario (por ejemplo, anotaciones de respuestas erróneas ~._ temporal, despiste o por inventiva del encuestador), a menos que se cotejen otros medios. Además, no puede saberse si en la respuesta ha influido, directa o <itlldilre(:ta]ment(~, el entrevistador, a menos que se haya "observado" la entrevista. Por y otras razones es exigible no limitar el control de la encuesta a lo escrito en el iC1ue!¡tic)llGtric), sino complementarlo con alguna verificación ex profeso. t ' - ••

•••

Rara vez los errores que surgen durante la entrevista pueden detectarse simplemente inspeccionando los cuestionarios. Los datos pueden parecer bastante plausibles y satisfacer todos los criterios visibles para datos de calidad (Biemer y Lyberg, 2003: 279).

Asimismo, es de gran utilidad analizar las "observaciones" que el entrevistador haregistrado en el cuestionario. Referidas a la actitud y conducta del encuestado du-


Capítulo 5: La administración del cuestionario

338

339

Métodos de encuesta

rante la entrevista (si mostró interés, parecía sincero, incómodo, inquieto, distraído), si había alguna persona presente, si fue distraído en alguna ocasión y por qué motivo, tiempo que tardó en contestar a las preguntas, si tuvo problemas en la. comprensión de las preguntas y sus respuestas. El objetivo es detectar problemas en la cumplimentación de los cuestionarios, en sus causas (el cuestionario, el encuestado, la intervención del entrevistador) y si han provocado errores de medición. .

5.2.2. Verificación de los cuestionarios

De los cuestionarios complementados se extrae, al azar, una pequeña muestra. Normalmente, entre un 10 y un 20% del total de cuestionarios. Es preferible que la muestra se extraiga de cuestionarios cumplimentados por distintos encuestadores. En los cuestionarios aleatoriamente seleccionados se verifica la información en ellos registrada. En las encuestas hechas por el Centro de Investigaciones Sociológicas, por ejemplo, es frecuente que la verificación se haga por teléfono, aproximadamente con el 10% de la muestra. La verificación telefónica obviamente es la más rápida y de menor coste que la realizada "en persona", volviendo al domicilio del encuestado. Pero, para que sea posible se precisa de su número de teléfono y que éste sea correcto. En caso contrario, habrá que recurrir a la verificación "en persona" o por correo. La verificación por correo suele descartarse por la mayor probabilidad de no obtener respuesta. La verificación "en persona" conlleva un mayor coste (económico y temporal). Aunque proporciona mayor información referida al campo, al procedimiento seguido en la selección de los entrevistados, que no se consigue por los otros modos de verificación. De todas fonnas, cuando se aplica un muestreo por rutas aleatorias (en la encuesta cara a cara) es común que el supervisor examine las rutas complejas sobre el terreno para verificar que se han seguido las directrices dadas en el diseño de la

lerado). Preguntas sin respuesta en el cuestionari rrectamente especificada o, simplemente ele idas ~ o cu~a ~e~puesta no queda coya sido su respuesta pueden volver ' g a azar, mdlstllltamente de cuál hapuesta. En caso de di~crepanciasen lase a preguntar, con objeto de verificar la resindicárselo al entrevistado e indagar s res~uestdasbrespecto a la vez anterior, habrá que a que se e en. Al encuestado se le puede pedir su valoración d 1 t . e a encuesta y del entrevistador (el trato dispensado su conducta durant 1 .. ' e a en reVIsta cómo la llevó b) S· peclflca que es un procedimiento de "control d ' . " . a c~ o · / 1 se les es. .• :J;,,';.;;•..•. ,;.> . . comprobación de la actuación del entrevistad e tahdad rutlllano, mas que una '-4"''''''''''&''''''''-' con Weinberg (1983: 353)" / or, . os ~ncuest.ados se muestran, de luntarios", espontáneos sobre la c~ndmats c~~peratlv.os y reahzan comentarios "vo•.•. ,./i:>..•. . . . < .•. .•. de ellos.' uc a e entreVIstador. Se puede extraer más in"t"A...''f'Y'I:lI''' ........ -

Este procedimiento de "control" es . . d·b . y de errores en la administración del cu~~res~ ve en l~ det~~ón de "falsificaciones" ....""...7'-4........ '-'.LI.v de la entrevista: detectar e:;;;m:::o, ~r~,es llls~f¡clente ~ara supervisar el trevistador-entrevistado . Por ello es convenIente . medl~lon debIdos enno limitarse a s a lal· Interrelación .,. . complementarla con otros modos de control. u ap IcaClon aislada, SI-

Observación del desarrollo de la entrevista . . ; . .~ . . . La observación constituye un procedimiento de supervisar "toda" la actuación del t . t dcontrol muy completo porque perdel encuestado hasta su despedida en reVlS a or.. Desde la selección y contacta353) representa "la u'n· f ' una vez conclUIda la entrevista. Para Weinberg d Ica arma en que el s u · .<i',.. ,~"'''u.u ocurre antes y durante una entrevista car pe:;'Isor pu~ e ver lo que en reaes "ideal para detectar violaciones delib:r:~:r~ · rara !3ldemer y L~berg (2003: La observación es más fácil de' t s e a gUIa e entreVIsta". eJecu ar y resulta menos "intrusiva" en la en que en 1a cara a cara En l a ' l' cuesde la entrevista (puede escu~harsei:lm:~a, e s.up~rvlsor puede escuchar toda o n so o unos ml~utos, pero a cada uno de los grabarla incluso'

~.1:-

.c)j.'.J"i;';t);:.': .

•.. . "iN,i.•;.}.:t;¡,.. .•. Xl1JLllt;;

...••> ••.••. ,

muestra. La verificación de los cuestionarios se orienta a la detección de falsificaciones en la entrevista, en su totalidad o en partes. Si la entrevista realmente se ha llevado a efecto con la persona que debía entrevistarse Yésta ha respondido a todas las preguntas del cuestionario. Se buscan "errores" en el proceso seguido en la selección de los entrevistados, además de constatar la veracidad de los motivos de la no respuesta total (por ejemplo, argumentar que la vivienda estaba vacía o desocupada, cuando realmente la no respuesta se debió a "rechazo" y no a "no contacto". La persona no quiso ser entrevistada en ese día y hora). Al entrevistado se le pregunta si ha realizado la encuesta. En caso negativo, habrá que recomprobar todos los cuestionarios cumplimentados por el entrevistador "cogido" en falsedad. También, se le pregunta si se le ofreció algún incentivo, cuánto tiempo cree que duró la entrevista, si tuvo algún problema con alguna de las preguntas y cuál fue la reacción del entrevistador (la repitió varias veces hasta que la comprendió, se la explico detenidamente, le dio tiempo suficiente para meditarla o, por el contrario, iba ace-

,

\.I~UV de que están siendo escuch=~~;u¿ ~e percate~ ~ el entre~istador ni el entre-

;LFLSill]é:re}VZClAteSl~acara a cara la observació~d~r:~:s~e~~~~fr~~~~:taJ~.Por el contrario, .; ......; •.•L ........

(un supervisor, otro entrevistador) aco _ eXIge que una tercerealización de la entrevista EIl . mpane, en persona, al entrevistado d' . o lllcrementa los costes de la .h Ietas y desplazamientos de larga dist . Ad / encuesta, SI ay que que puede afectar tanto a la actu ~~cla. emas, es un procedimiento "inLa presencia de una tercera persona c~c~~~ del e~trevistad?; como del entrevis<;~lji'};f;l-;";;i;;x.;:>.,.ol)Serv::l(I(\~ afectando a lo que se d. nhn uye a a percepclon de ser "vigilados" . Ice o se ace. ' S' . . I qUIere re~~~~s=ll:::~~~~:~:o~e sentirse obse~vados, esta tercera persona pue.ITl'lC''1''fr'to 77 ,

~'f;:.;:.'Dra.ctl~~:l~ Lo último decir que es un~:~~i:~~rezs.ta~o,co~o un entre".ist~doren ;<:;;':IºO~;eI1var. no ha de hacer ningún coment' .' que SImlsmo, de lImItarse arlO o gesto afecteeste a la ha actuación de am-a


340

Capítulo 5: La administración del cuestionario

Métodos de encuesta

bos (entrevistador y entrevistado). Debe procurarse que la entrevista se desarrolle de la forma más "natural" posible. Sin duda, la observación "en vivo" de la entrevista es de gran ayuda, no sólo para experimentar las dificultades de localizar, contactar e incentivar a los encuestados. También, para conocer cómo realmente se lleva a cabo la entrevista y qué errores pueden atribuirse a la mediación del entrevistador. A sus rasgos físicos, su apariencia, modales, forma de hablar, de gesticular, de comportarse y de formular las preguntas. Si éstas se leen despacio, de forma clara, sin incidir más en una respuesta que en otra, ajustándose a su redacción en el cuestionario; o se tienen que repetir varias veces o aclarar su significado; y cómo afectan a la respuesta del encuestado. Igualmente, puede observarse la reacción del entrevistado ante la pregunta que se le plantea y la reacción del entrevistador ante su respuesta. La observación puede ser, también, indirecta, a través de la grabación de la.entrevista. Permite el análisis más detenido del desarrollo de la entrevista, una vez que ésta ha concluido. Su revisión, con el propio entrevistador, para que observe "aciertos" y "errores" en su actuación, dirigidos a su mejora. Además, puede utilizarse como material ilustrativo, en cursos de preparación de encuestadores, para enseñar "buenas" y "malas" prácticas de entrevista. Éstas representan sus tres ventajas principales. Su handicap, el rechazo del entrevistado a que se grabe la entrevista y que ello influya en su participación en la encuesta. En la encuesta telefónica la grabación puede hacerse sin conocimiento ni del entrevistador ni del entrevistado, con la finalidad de que éstos actúen con "naturalidad". Si se quiere que el entrevistador esté siempre alerta, ante una posible escucha por parte de un supervisor, puede ser informado de que, en cualquier momento, puede producirse la escucha y la grabación de la entrevista. Ello puede contribuir a que se esmere en su actuación, porque no sabe cuándo se le escucha. En la encuesta cara a cara, la.grabación sin el conocimiento del entrevistador y sin el consentimiento del entrevistado es más difícil. Pueden utilizarse grabadoras convencionales o nuevos recursos tecnológicos, como CARI (Comp uter-Audio-Recorded --- --- iniérvle-wlng):-Un-sistéma"ae--gia15áci6rt-digital'quepuede- aplicarse-cOIl€APf-y- que --ofrece la posibilidad de programar el ordenador para que grabe partes específicas de la entrevista. Pero, a diferencia de la encuesta telefónica, la grabación de las entrevistas cara a cara es inusual como procedimiento de control rutinario, fundamentalmente debido al rechazo que puede suscitar en los entrevistados, afectando negativamente a la tasa de respuestas y a los errores de medición atribuidos al entrevistador y al entrevistado. Antes de comenzar la grabación, lo más correcto, para no quebrantar ninguna norma legal, es pedir autorización al entrevistado. De acuerdo con Weinberg (1983: 354), la mayoría de los entrevistados no ponen objeciones a que se grabe la entrevista, si antes se les explica su finalidad ("ayudarme a hacer un mejor trabajo" o "para que el supervisor compruebe cómo llevo a cabo mi trabajo", por ejemplo) y se les garantiza un total anonimato (en la cinta no se grabará ningún dato que identifique al entrevistado y sólo será escuchada por el supervisor). Desde su experiencia, Biemer y Ly-

341

'flerg (2003: 283) afirman que "solicitar permiso para la grabación ·utilizando CARI no tíene efe,ctos apreciables en los porcentajes de respuesta". Las hasta aquí mencionadas constituyen las principales formas de supervisión del ";tfábajo de campo. Pueden complementarse con entrevistas ex profeso a los encuesL*~dores, individual o en grupo, como se hace en la prueba previa del-cuestionario (apar'. 'go4.5). También, a jefes de campo y demás personal que intervenga en la recogida °éinformación. Van Kammen y Stouthamer-Loeber (1998) sugieren un procedimiento alternati'Q:insertar a un encuestado "fantasma", infiltrado entre las personas a ser entrevis'das. Los encuestadores no saben si están entrevistando a una unidad de la muestra é~al" o a un "impostor". Se lleve o no a efecto la infiltración, el mero conocimiento ~·.su existencia puede, no obstante, tener los mismos efectos beneficiosos: evitar que ~~encuestadores'se desvíen de las directrices marcadas para su intervención en la en;úesta. - Aunque se tiende a supervisar más a los nuevos encuestadores que a aquellos con ';~~ experiencia, en una situación contractual más estable es bueno supervisar a "toqs", para que ninguno baje la guardia y se relaje en el cumplimiento de las normas. A los entrevistadores "noveles" no se les debería "sobrecargar de trabajo" (Díaz de Ráda, 2001: 202-203). Es preferible asignarles, primero, un menor número de entre~~~~es y, en función de su actuación, ir gradualmente incrementando el número de en;~~~vistas a realizar. En caso de detectarse errores en su cumplimentación, éstos afec;!a;r.ían a un menor número de cuestionarios y habría tiempo para su corrección, antes ;te.~;gue concluya el período de tiempo destinado al trabajo de campo. --,~;~k;;Si se quiere que la supervisión se efectúe con una cierta rigurosidad, tampoco hay >"~-<llle sobrecargar a los supervisores. Es también preferible asignarles un número ra;<,:;!:~Bnable de entrevistadores. La proporción óptima es un supervisor por cada diez en:\!téyistadores (Weinberg, 1983; Groves, 1989; Lavrakas, 1998, este último en referent:~~llala encuesta telefónica). :~);::~,,·;~.Además, de la supervisión debería desprenderse no sólo la penalización a en_,,:e-stad(}r€sq-lle-hayancometido"errores'-~--q-uehan-sido--detectados. También,_Ja~_~ _ ._g~~tificación a aquellos que se hayan esmerado en "exceso" en su trabajo. Si cabe, es rilJ.~sincentivador la gratificación que la penalización. YF'r<:.Los resultados de la supervisión se informan, al equipo investigador, para su vac<j()ración y consideración en la interpretación de la información recogida en la encuesta. "]j,n el informe se adjunta el material examinado: número de cuestionarios, hojas de ru-:~~s,rutas sobre el terreno, análisis de grabaciones y demás información que se estime de interés. al

:... ' Uno de los retos más difíciles de la investigación mediante encuesta es alcanzar la Aunque se haya diseñado una muestra "perfecta", que satisfaga

~;iplena participación.


e,

.lIl~~

UN~\!E".RSIDAD

342

AI_SERTO HURTADO

Métodos de encuesta

Capítulo 5: La administración del cuestionario

343

BIBLJOTECA

E 1gunas encuest.as a hogares se intenta entrevistar a todos los miembros (o ~ todos los mIembros adultos). En otras, se elige aleatoriamente a alguno de sus mtegrantes par~ que responda al cuestionario. Cuando no se puede establecer contacto o conseg~rr c~~peración del hogar entero, en el primer caso, varias unidades d~ la muestra ~IndIvlduos) se pierden. En el segundo caso, sólo una de ellas c) ~/odas las personas de la muestra tienen la misma probabilidad de ser elegidas .~unas"e.n~uestas ~obremuestrean a ciertos grupos en la población par ~ mItIr anahsIs espeCiales. a per

b) Si cada unidad muestreada contiene un elemento de la muestra o much

de~~og~

los requisitos exigidos de tamaño y aleatoriedad en la elección de sus integrantes, si finalmente no se consigue que éstos respondan al cuestionario, teniéndose que recurrir a "otros" para obtener información, todos los recursos a ella destinados se habrán malogrado. Los datos que se extraigan de la encuesta, aunque satisfagan requisitos de significatividad estadística (al haberse mantenido el tamaño de la muestra), no serán "representativos" de la población de interés, si no se mantiene la composición de la muestra original e intervienen otros factores ajenos a la aleatoriedad. La no respuesta representa un error trascendental que deteriora la calidad de la encuesta por muestreo. Afecta a su propia esencia. La posibilidad de inferencia, de generalización de los hallazgos de la encuesta a la población que se estudia, dependerá de la magnitud de la no respuesta y, en mayor medida, de su composición. Es decir, de las características diferenciales entre quienes sí responden y aquellos que no aportan información. Principalmente, cuando las diferencias estén directamente relacionadas con el problema de investigación. Pese al uso común del porcentaje de respuesta como indicador de calidad de la encuesta, se necesita conocer la composición de la muestra finalmente analizada y su correspondencia con la población de estudio. Si la gente que no responde mantiene diferentes puntos de vista o se comporta de forma diferente de la mayoría de la gente, tu estudio incorrectamente informarádel promedio de la población. También subinformará del número de personas que piensan como lo hacen los que no responden. Incluso si los que no responden no son diferentes de los que responden, bajos porcentajes de respuesta dan la apariencia de estudios de calidad pobre y debilitan la confianza del consumidor en los resultados del estudio. El estudio se convierte en menos útil o menos influyente justo porque no tiene los adornos de la calidad (Mangione, 1998: 405).

Los dos componentes básicos del error de no respuesta son la tasa de no respuesta (la proporción de no respondientes en la muestra) y la diferencia entre quienes no responden y aquellos que sí contestan a la encuesta. Pero, mientras la tasa de no respuesta es fácilmente documentada en la mayoría de las encuestas, las características de los "no respondientes", necesarias para calibrar el efecto de la no respuesta, son de difícil acceso o conocimiento. Cuatro son los aspectos del diseño de la encuesta que hay que considerar -siguiendo a Groves y Lyberg (1988: 196) y a Graves (1989: 136-138)- en los cálculos del porcentaje o tasa de respuesta: a) Si todas las unidades del marco de muestreo son elegibles para la encuesta. Quiere esto decir que hay que comprobar si existen unidades en el marco muestral que no sean miembros de la población de estudio. En caso de que existan, ha-

brá que desestimarlos. Por ejemplo, viviendas que han pasado a ser oficinas, alumnos que han dejado de serlo o, en una muestra probabilística de área de grupos de minorías étnicas, hogares no elegibles porque sus inquilinos no pertenecen a alguna minoría étnica.

poblaclO~)~ de un ~l~ctivo concreto de individuos (minorías étnicas), pOrqUeJintere~: Por e.Zemplo, elegir a más integrantes de los debidos (por su peso en el con'unto

la

rec~g~.~asdl~formaclO~ sobre

pro a

1 1. "a

~:;í~:;~C~)~

sus expectativas electorales. Se les ha dado una mayor e ser elegIdos en la muestra. En consecuencia, habrá que roceder a la de la muestra para la estimación de estadísticos globales se vio en el

d) Si se permit~

(co~

l~

sustitución de una unidad de una muestra no contactada o ue

r~ch~za partICIpar en la encuesta por otra similar. En tal caso, habrá dlr como documentar la no entrevista inicial.

. . . ;;é;,;}i~%\i~i~~,i/p¡(te;L;~a

.....

ue q

d~ci-

no respuesta puede ser total (o de unidad) y de ítem (o pregunta) L total denota el fracaso en extraer información de la unidad ( . h a no resseleccion d 1 persona, ogar eroa a en a muestra original. Puede deberse a que no ha podido ~sta-

contacto con ~lla o que ésta rehúsa participar en la encuesta or ue no '>t'\:n... . . puede .. (por lllca.t:>acidad física o mental, por falta de dominio en . ", "',", '~.L" .I. I. I.'I.':' para la comUnIcación verbal). guaje Esta distinción entre no respuesta p~r "no contacto" o por "rechazo" es de fácil re_._q,.__',"_.• en la encuest~ cara a cara. No aSl, en la encuesta por correo, en la que no suele

,nhlola~n"O,.

~ll~

•.> .•,"....., ••... .,""•.

~w'.f:':. . tel~~tójnic,a- en el motivo de la no devolución del cuestionario. Tampoco, en la encuesta La person"a que responde al teléfono puede decir que aquella a la que se deen(:;ue~stalr. no esta en casa en ese momento, cuando realmente sí está er . ·.• ,i'i·r~!~pr entrevIstada. Si no se insiste en la llamada, se hace un SegUimie~io~e~~sq~~~~ ".,..:Jl.p.ljlirl ....,d,,-le la muestra, esta no respuesta se registraría como "no contacto" cu d se trata de un "rechazo" a participar en la encuesta. Conforme se'inc;~~~~ ~:lo;:;v:(~rlllUnleT·O de contactos ~on las unidades muestrales más puede clarificarse el motivo respuesta de unldad: no contacto o negativa a responder la no respuesta de ítem ( o pregunta), la unidad de la mues~ra sí participa en la ·;~n.cu(~st:aa pero no responde a todas las preguntas del cuestionarl'o Esta debers 1 t' . . no respuesta e a cues lonarlO, al encuestado o al entrevistador: a) ~l cuestionario es demasiad~ largo, el encuestado se cansa y decide terminar-

;;~~~~~¡¡!~~~!~¡;!\~!¡........

o cuanto antes, no respondIendo al resto de las preguntas.


344

Capítulo 5: La administración del cuestionario

Métodos de encuesta

b) El cuestionario incluye preguntas abiertas (más expuestas a la no respuesta y a respuestas incompletas) o varias preguntas filtro, cuyas rutas no han quedado bien especificadas en el cuestionario. . . . ." e) El encuestado no sabe qué respuesta dar, por falta de. conoc1m1ento o dec~slOn. d) El encuestado no quiere dar una respuesta por con~lderarla comprometlda. e) El entrevistador no realiza la pregunta ya por desp1ste (al no. haber quedado bien delimitada en el cuestionario), ya porque no la cree pertInente. f) El entrevistador no anota la respues.ta ?la ~~cribe de fo~~~ ilegible o poco clara, teniéndose que proceder a su ehmlnaClon de los anahsls.

345

Cuando sea factible, conviene también diferenciar una categoría de no respuesta más identificada con la encuesta telefónica. Una vez comenzada la entrevista, encuestado decide no seguir respondiendo al cuestionario y cuelga el teléfono porque el cuestionario sea muy extenso, bien porque su temática no le suscite inbien porque se sienta incómodo ante las preguntas que se le formulan). Este tide negativa se re&!stra menos en los otros métodos de encuesta. En la encuesta por no puede separarse la no respuesta parcial de la no respuesta total, debido a que .'··,J~~~M:;~_f;t~;;-/<;<-e]lclLes·tlona]rIO que es "interrumpido" tampoco acaba devolviéndose al centro emisor. la encuesta cara a cara, el contacto visual con el entrevistador hace más difícil la inde la entrevista. Especialmente, cuando se ha logrado una buena interacentre el entrevistador y el entrevistado. .·,··,·,.,·.".:·.'.c·,'····':····'T'.l

LLJ.l..l.UIIJ""'.I."-'.I..I.

A diferencia de la no respuesta de unidad (o total), la no respuesta de ítem se informa en la encuesta ("no sabe"! "no contesta"), en cada una de las pre~nt~~ por separado y se considera en la interpretación de los datos d~ encuesta. En la es~aClo~ de l,~ no respuesta de ítem se analizan conjuntamente las umdades de la muestra analizada qu~ no han aportado información de interés a la pregunta: los "no sabe" (excepto que sea ~sta una categoría de respuesta relevante a la pregunta), los "n? contesta" y los "no aphcabIes" (es decir, aquellas personas a las que no correSp?nd.1.a hacer. la pregunta en c?nformidad con el mtro anterior. Por ejemplo, personas sm h1JOS en una pregunta refenda a los hijos). Se suman y dividen entre el total de la muestra analizada. , Encuestados que no aportan información Tasa de no respuestas de ltem = Muestra analizada =

NS+NC+NA NS+NC+NA+R

Donde NS = no saben. NC = no contestan. NA = no aplicables. R = responden a la pregunta de forma "válida".

Encambio-,enla-norespuesúLtotal.sehªd~.cºIlsi<l~l."ll~a!.~()l1j~~!()~~~~~~ades

de la muestra original que no han acabado participando en la encuesta.

No participantes en la encuesta Tasa de no respuestas total = Muestra orIgIna .. 1 NE+NC+N = NE+NC+N+R Donde NE == unidades muestrales no elegibles o entrevistables, por no a~~star~e a.~as características de la población de interés. Por ejemplo, fannhas sm luJOS en una encuesta a padres de familia; inmigrantes, en una encuesta a población autóctona sobre actitudes ante la inmigración. NC == unidades muestrales con las que no ha podido establecerse contacto. N = unidades muestrales que se han negado a participar en la en(~ueSla. R = unidades muestrales que han respondido al cuestionario.

En las encuestas telefónicas existe una categoría de negativa que ocurre sólo rara vez en encuesta de entrevista personal: la entrevista parcial. Rara vez a los entrevistadores se les pide que abandonen la casa después de que ellos comienzan una entrevista personal, pero los encuestados aparentemente se sienten más justificados a terminar conversaciones telefónicas en medio de una entrevista (Groves, 1989: 139).

Pero el análisis de la no respuesta no ha de circunscribirse a las tasas de no resTambién ha de incluir la comparación entre quienes aportan información y ;raC~U(~ll()S que no responden a la encuesta. Esto último es más difícil de conocer a mese indague ex profeso. En caso de que se conozcan los valores en la v~riable i;at~lnllel·es~ en los respondientes y no respondientes, de acuerdo con Biemer y Lyberg puede calcularse el error de no respuesta mediante el producto de sus dos comt"'/'ii,;-,n.onen1tes o determinantes. O sea, multiplicando la diferencia entre las medias de valores de Y en respondientes ( YR) Yno respondientes ( YNR) por la tasa de no ;~:}r(~s1Jue~;ta. El error de no respuesta queda, en suma, definido de la manera siguiente: {,r1J'ue~fJta.

de no respuesta = (tasa de no respuesta) x (Diferencia entre la media de Y en los ___ r~_~pº!lº!~º!~~_ Y"º_º_r_e_~J?ºlJJji~ºte~)

facilitar la comparabilidad de distintas variables en niveles de medición diprefiere, no obstante, el cálculo del error de no respuesta relativo o en tér-

Error de no respuesta relativo == t NR

X

YR-YNR) ( Y

tNR = tasa de no respuesta total.

YR = media de Y (la variable que se analiza) en los respondientes. y NR = media de Y en los no respondientes. y

== media de Y en todos los casos de la muestra:

Y = (tR X YR ) + (t NR X Y NR ).


346

Capítulo 5: La administración del cuestionario

Métodos de encuesta

347

del 15,5%, para una no respuesta de 29% , Y desciende al 9,64%, cuando el porcentaje de no respuesta baja al 19%. a) E NR

E

NR = tNR

X

(Y R - Y NR) = 0,29 x (1.120 -

ENR,.."~

y = (t R X Y R) + (t NR x Y NR) = (0,71 x 1.120)+ (0,29 x 849) = 1.041,41 .

0,29x(1.120-849) 1.041,41 = 0,0755

Para una tasa de no respuesta porcentual del 29%, el error de no respuesta relativo es de 7,55%. Ahora comprobemos las oscilaciones en el valor dependiendo de la tasa. de no re~­ puesta y de las diferencias en los valores de Yentre respondientes y no respondientes. Pnmero, si el porcentaje de no respuesta es inferior, por ejemplo, del 19%. Obviamente, se produciría un descenso: 51,49 euros, que traducido a términos porcentuales sería del 4,82%. Lo cual habría que tener en cuenta de cara a la inferencia de resultados, como sucede en el caso del error muestral (capítulo 3). E

NR = t NR X(YR - YNR) = 0,19x(1.120-849) = 51,49 euros

(Y R - Y NR) = 0,29 x (1.340 - 720) = 179,8

euros

0,29 x (1.340 - 720) 1.160,2 X

=

0,155

(YR - YNR) = 0,19 x (1.340 -720) = 117,8

Y = (t R xYR)+(t NR xYNR) = (0,81x1.340)+ (0,19 x 720) = 1.222,2

849) = 78,59 euros

E NR,.."",

A efectos de comparabílidad, se procede a su traducción en términos porcentuales, mediante el cálculo del error de no respuesta relativo estimándose, primero, el valor de Yen el

Error no respuesta relatIvo =

=

b) E NR = t NR

total de la muestra.

X

y = (t R X Y R) +.(t NR x Y NR) = (0,71 x 1.340) + (0,29 x 720) = 1.160,2

En una encuesta telefónica, con una tasa de no respuesta de 0,29 se ha obtenido una renta mensual media de 1.120 euros en los respondientes (y R) Y de 849 euros en los no respondientes (Y NR ). (Recuérdese que la encuesta telefónica es la más vulnerable a una declaración excedida de nivel de renta y de estudios, como se vio en el capítulo 2.) El error de

no respuesta sería igual a 78,59 euros:

= t NR

=

0,19 x (1.340 - 720) 1.222,2

=

0,0964

Con este ejemplo ha querido ilustrarse cómo se ve afectado el error de no respuesta por dos componentes: la tasa de no respuesta y la diferencia en el valor promedio de Y enlos respondientes y los no respondientes. En especial, por lo segundo. Como ha podido el error de no respuesta crece más a medida que aumenta la distancia entre las mede Y, más cuando coincide con una tasa de no respuesta elevada. Todo lo cual detela validez externa de la encuesta, sus posibilidades de generalización a la población de

La información sobre el tamaño de la no respuesta es preciso que se incorpore en infonne de la encuesta, para que el lector pueda valorar sus efectos en los datos de ".,','" el1lcuest:a y la consiguiente significatividad de los mismos. De acuerdo con Kish 557), "tal información se ha convertido en la práctica estándar para las meencuestas". Pero, quizá sea en las gubernamentales, no así en las llevadas a cabo la investigación comercial. Estas últimas más expuestas a errores de no respuesta más ';,elevaclos. Sánchez Carrión (2000: 41) la cifra alrededor del 50% de la muestra. Una \,é4ntidad que duplica el 25% que marca The Office of Management and Budget, como lrláximo para la no respuesta. Lo que lleva a cuestionar "la misma viabilidad de '#~ erlcu!eslta como técnica para obtener información representativa de una pobla. DeMaio (1980) rebaja al 10% el valor máximo de la tasa de no respuesta que se <,d)ns:idl~ra "tolerable". Por encima de él, se cuestiona la representatividad de los datos '''HHIIILe

y = (t R X Y R) + (t NR x Y NR) = (0,81 x 1.120) + (0,19 x 849) = 1.068,51 ENR",,"~

= 0,19x(1.120-849) = 0,0482 1.068,51

Segundo, si la diferencia de renta mensual media en ambos colectivos es mayor: en los respondientes de 1.340 euros, en los no respondientes de 720. El er~or de ~o. respuesta s~­ ría en ambos supuestos mayor, tanto en términos absolutos como relativos. Loglcamente, mas elevado para una tasa de no respuesta más alta. El error de no respuesta relativo llega a ser

No obstante, ha de insistirse en la necesidad, para apreciar su verdadera magnitud, características diferenciales entre respondientes y no respondientes. Funi,(larJuellta.lm.ente, en las variables más relacionadas con el tema de estudio. Esta inilonna,ciótll puede extraerse de "la misma muestra o de seguinUentos intensivos en una ),:~utlmllestra o de extrapolar las diferencias encontradas en sucesivas llamadas. Con más

"",,~,v c<mo,cer las


348

Métodos de encuesta

frecuencia dependemos del conocimiento vago acumulado en encuestas pasadas" (Kish, 1965/1995: 557). A ello se añade la forma más usual de comprobar la existencia de errores en la muestra: el comparar características sociodemográficas clave de los no respondientes con las correspondientes a la población de estudio, de acuerdo con los datos estadísticos censales utilizados de referencia. En suma, la información de los no respondientes puede extraerse de: a) Los propios no respondientes, de su seguimiento en un estudio específico ex profeso. b) Imputándoles características de los respondientes a los que ha sido más difícil contactar. Aquellos que han precisado de un mayor seguimiento (rellamadas, revisitas, reenvío de cuestionarios), como se verá en el subapartado 5.3.2. c) Preguntando a personas "próximas" al no respondiente (vecinos, familiares, amigos, compañeros), que pueden aportar información sobre él (sexo, edad aproximada, nivel de estudios, ocupación, estado civil, número de personas en la vivienda). d) Extrayendo información del marco muestral que se ha utilizado, aunque esta información suele ser escasa y no estar relacionada con los objetivos de la encuesta. e) Comparando las características sociodemográficas de los respondientes con los datos censales disponibles de la población de estudio. De acuerdo con Groves (1989: 187), "éste es por ahora el método más frecuente para asegurar los sesgos de no respuesta". Aunque presentan el problema de su actualización (si no se dispone de información censal actualizada: que no sean datos "viejos") y, a veces, de su "fiabilidad", en la medida en que constituyan un fiel reflejo de la realidad analizada. Si de la comparación de los datos de encuesta con los censales, en las variables de las que se tenga información (sexo, edad, estado civil, ocupación), apena.s se aprecian diferencias entre ellos, se presupone que el error de no respuesta es mínimo. No obstante, hay que insistir en que: Este procedimiento con frecuencia ignora el hecho de que los datos de encuesta y los datos del Censo pueden estar sujetos a errores de medición, que las definiciones de los conceptos podrían diferir y que los otros estadísticos de encuesta podrían estar sujetos a errores de no respuesta incluso si los estadísticos demográficos no lo estuvieran (Groves, 1989: 187).

5.3.1. Factores que inciden en la participación en la encuesta

En la medida en que la no respuesta afecta diferencialmente a unas unidades muestrales (individuos, hogares, empresas) que a otras, el error de no respuesta será mayor. Pero, ¿en qué medida la no respuesta tiene una incidencia desigual en unos gru-

Capítulo 5: La administración del cuestionario

349

pos de pobl~ción que en otros? A la hora de explicar la no respuesta son varios los fac-

t~res a consIder~r y que afectan a todos los implicados en la encuesta. Desde el ro-

p~o ~ontexto SOCIal en el que se realice la encuesta, el método de encuesta ele id~ el

dIse~odde la mu~stra y del cuestionario, hasta las características concretas ~el ~n­ cues.? o pot~ncIaI, ~:l entr~vistador (en caso de que medie en la reco ida de informac~on) Yd la lllteraCC!on habIda entre ellos. Los factores más important;s se resumen en e cua ro 5.2 y se comentan a continuación.

CUADRO 5.2. Factores que inciden en la participación en la encuesta a) Contexto social.

• • • • •

La resp?n~abilidadsocial u obligación cívica. La legItimIdad atribuida a la encuesta. La saturación o exceso de encuestas. La imagen que se tenga de ellas. Cambios sociales.

Métodos de encuesta. • Distinta no respuesta en función del método elegido. : El tem~ de la encu,esta y el interés que suscite en el encuestado. GarantIas de anommato y de confidencialidad . • Extensión y complejidad del cuestionario . • La dificultad del campo. Características de la persona a encuestar.

• • • •

Género. Edad. Estado civil. Estatus social. Hábitat.

Características del entrevistador. • • • • • •

Experiencia. Expectativas. Estado emocional. Capacidad de persuasión. Paciencia. Cómo se enfrente a la no respuesta.


350

Métodos de encuesta

Contexto social

Groves, Cialdini y Couper (1992), junto con Groves y Couper (1998), destacan, en su explicación de la no respuesta, la contribución de factores sociales relacionados con la responsabilidad social sentida por la persona y la legitimidad que ésta atribuya a la encuesta. Con posterioridad, Curtin, Presser y Singer (2000) insisten en el sentimiento de obligación cívica en la explicación de la participación en la encuesta. A la legitimidad contribuye la temática que trate la encuesta y el prestigio del centro responsable de la misma. Por ello es práctica usual, en la presentación de la encuesta, el mencionar el propósito del estudio, quién lo lleva a cabo e, incluso, el patrocinador, si su conocimiento, por parte del encuestado, se cree que favorece la participación en la encuesta. También incide el contexto social. En especial, la saturación o exceso de encuestas hechas hasta aquel entonces, junto con la imagen que se tenga de ellas. Una visión negativa de las mismas lleva al desánimo y al consiguiente rechazo a colaborar en la investigación. Asimismo, ha de hacerse mención a los cambios sociales que contribuyen a una menor participación en las encuestas: • La creciente incorporación de la mujer al mundo laboral. • El estar menos tiempo en casa en las franjas horarias habituales para el trabajo de campo (de lunes a viernes de 6 a 9 de la tarde). • El mayor individualismo de las sociedades modernas. • El rechazo a hablar con extraños (sea o no promovido por el aumento de la criminalidad). • El temor al uso que se hará de la información aportada. Su conocimiento ayudará, no obstante, a reducir su incidencia en la no respuesta, cuando se diseña la encuesta. Métodos de encuesta

En el capítulo 2 se mostró que la no respuesta, tanto total como de ítem, es menor en la encuesta cara a cara. Le sigue la encuesta telefónica y, a mayor distancia, la encuesta por correo. El contacto visual con el encuestado contribuye a su motivación, para participar en la encuesta, y a una mejor explicación del cuestionario, que favorece su respuesta (una menor no respuesta de ítem). A lo allí dicho (a cuya relectura se remite) hay que añadir la distinta no respuesta que se consigue con cada método de encuesta. • En la encuesta telefónica, la no respuesta se debe más a "rechazos" que a "no contactos". La mayor facilidad y el menor coste (económico y temporal) de seguir a la unidad de la muestra mediante la rellamada, las veces que sea necesario, en diferentes días y franjas horarias, contribuye a la reducción de los "no contactos", no así de los "rechazos". En la encuesta cara a cara, el mayor coste

Capítulo 5: La administración del cuestionario

351

de los recontactos o revisitas (desplazamiento, dietas) incide en que éstas se reduzcan a una, dos o a lo más tres (como es deseable), resultando en una mayor no respuesta por "no contacto" que por "rechazo". Una vez contactada la persona, el decir "no" a la cara a un entrevistador es más difícil que colgar el teléfono o no rellenar un cuestionario (el desecharlo). En la encuesta por correo es más complicado conocer el motivo de la no respuesta: "no contacto" (dirección errónea, ausencia del domicilio) o "rechazo". • En la encuesta telefónica las negativas suelen darse en el primer minuto de conversación. I?espués de que los entrevistadores se han presentado, pero antes de que exphquen el propósito de la llamada. En el estudio de Oksenberg y Cannell (1988), con entrevistadores de encuestas telefóni~as, que trab~jaban para The Survey Research Center de Michigan, el 40% de las negativas se prodUjeron durante las primeras frases en la presentación de la entrevista' un 50% después de las primeras frases; y el 10% restante una vez que la entrevista te~ lefónica había comenzado. En la revisión de cuatro encuestas, también telefónicas, llevada a cabo por Collins y colaboradores (1988), en el Reino Unido, un tercio de las negativas ocurrieron incluso antes ~e que el entrevistador pudiese establecer qué individuo, de la vivienda, debía ser entreVIstado. Esto contrasta con el modelo de negativas que se da en la entrevista cara a ca:a. En ella, relativamente pocas negativas se producen previo a la selección del entrevIs~ado. El ~ntacto directo, visual, entre el entrevistador y el entrevistado parece que contnbuye a evItar la negativa rotunda, al comienzo de la presentación de la encuesta aunque pueda ésta posponerse una vez que ha concluido la presentación. '

• ~a en.cuesta car~ a cara es la menos vulnerable a la no respuesta parcial, es deCIr, a mterrumpIr la entrevista mientras ésta aún se está llevando a cabo. En.relación con la e:zcuesta, ~bviamente también afecta el tema del que trate. No nto SI es un tema senSIble o dehcado (conducta sexual, drogadicción, fiscalidad), coohan ?emostrado Singer (19?8) o Bradburn y colaboradores (1978); sino el interés ;~9.suscIte en ~l enc~est~,do y SI éste cree que tiene información "relevante" que pue~iaportar a la mvesttgaClon. De acuerdo con la teoría de la participación en la encuesta ar!?llada por Groves, Singer y Corning (2000), la Teoría de la Saliencia, la partiaCI~n en,la encuesta ~epende de la "saliencia" del tema para la persona a encues: el mteres que le SUSCIte durante la petición de encuesta. La presentación de la encuesta es trascendental en la motivación del encuestado t~ res~~nder, al igual que las garantías de anonimato y de confidencialidad de la to~acIon que e~ ella ~e den. También lo es la extensión y la complejidad del cuesnano. Un cuestlOnano más breve, que demande un menor detalle en la inforpu:;d~ g~nerar me~os "agobio" en el encuestado, quien, generalmente, ~ener, pnsa por ternunar cuanto antes, excepto que el tema de la encuesta sea su lllteres. A estos aspectos de la encuesta se añaden las dificultades del campo.


352

Capítulo 5: La administración del cuestionario

Métodos de encuesta

• Cuando éste se lleve a efecto. Si coincide con un período de tiempo vacacional o de incidencia generalizada de alguna enfermedad vírica, por ejemplo. • La dificultad para la contactación de las unidades de la muestra. • Los plazos de tiempo para el trabajo de campo. Cuanto más se recorten, menos se reducirá la no respuesta por "no contacto". • Cuando éste se lleve a cabo (mes, día de la semana, hora del día). • Las estrategias seguidas para la reducción de la no respuesta: toma de contacto previo (telefónico, por correo), gratificaciones, seguimiento de los no respondientes (revisitas, rellamadas, reenvíos del cuestionario), sustituciones o ajustes de la muestra una vez concluido el trabajo de campo (ponderaciones e imputaciones de la muestra final), como se verá en el subapartado 5.3.2. Características de la persona a encuestar

El perfil del no respondiente suele identificarse más con personas mayores, de un nivel educativo medio-bajo, que viven solos, en áreas urbanas y son varones (Traugott, 1987; Davis y Smith, 1992; Singleton y Straits, 2002). Aunque hay un cierto disenso a este respecto. DeMaio (1980), tras analizar la no respuesta (1.012 negativas) en The Current Populafion Survey (en una muestra probabilística de 47.000 hogares norteamericanos), concluye que los más propensos a no participar en las encuestas son las personas mayores, de clase media que viven en áreas urbanas. Pero no detecta diferencias por género. Ésta última es, de las variables sociodemográficas, en la que menos acuerdo hay sobre su incidencia en la no respuesta.

No obstante, veamos qué información se tiene referida al perfil sociodemográfico del no respondiente.

constatan-que

• Género. Davis y Smith (1992) Tos varones son a cooperar en una encuesta que las mujeres, indistintamente de que existan más hombres de negocios que mujeres, que viajen y que tengan jornadas laborales más largas. Esto contradice a quienes, como Goyder (1987), mantienen que el control de la relación entre las variables género y participación, por las relativas a la ocupación laboral, debilita dicha relación. Además, ésta depende de la temática de la encuesta, del interés que genere en el encuestado. En España, Trujillo y Serrano (2003) comprueban la incidencia de las rellamadas en la enCUesta telefónica, en una muestra de 12.000 personas que han pasado al menos un día hospitalizadas en alguno de los hospitales de la Seguridad Social de Andalucía. En este estudio se obtiene que, en casi todos los tramos de edad y franjas horarias de las llamadas telefónicas resulta más fácil localizar, en la vivienda, y contar con la colaboración, para participar en la encuesta, de las mujeres que de los varones.

353

• Edad. Tanto en la encuesta telefónica como en la personal, la edad del potencial encuestado correlaciona de forma negativa con la probabilidad de participar en la encuesta: las personas mayores son más propensas a no responder (Goyder, 1987; Groves y Lyberg, 1988; Collins y otros 1988; Groves, 1989). En la encuesta por correo, los resultados son más ambiguos. Groves y Lyberg (1988) incluso detectan una tendencia a la no respuesta más fuerte en los mayores en la encuesta telefónica que en la cara a cara. Entre las causas posibles de esa mayor no respuesta se incluyen: - La pérdida de oído que lleva a la renuncia a utilizar el teléfono. En general, más problemas de audición para mantener una conversación. - La ruptura o desengaño social, que lleva a dudar de interactuar con extraños. - La socialización distintiva respecto al uso del teléfono. Trujillo y Serrano (2003), en su análisis de la no respuesta en la encUesta telefónica, también concluyen que las personas mayores son las más predispuestas a negarse y a no contestar al teléfono. Si bien, lo atribuyen a factores varios, normalmente referidos en la literatura metodológica como "mortalidad experimental": enfermedad, fallecimiento, cambio de residencia, que impiden "contactar" con las unidades de la muestra. Asimismo, aprecian variaciones por edad y género. - Entre las mujeres, las más difíciles de localizar en sus domicilios son las de menos de 30 años. En un nivel intermedio, los siguientes tramos de edad. Por encima se sitúan las mayores de 65 años. - Entre los varones, la probabilidad de respuesta es más baja en todos los grupos en edad laboral, no habiendo demasiadas diferencias entre ellos. Por el contrario, es más elevada entre los mayores de 65 años. - En personas de 30 a 45 años, tanto varones como mujeres, es más habitual que el número de teléfono no se corresponda con la persona buscada. Se explica por la mayor facilidad de cambio de domicilio o de teléfono móvil en este grupo de población. En relación a otros tramos de edad, Dohrenwend y Dohrenwend (1968) obtienen una mayor tasa de no respuesta en personas mayores de 40 años (23% ) e inferior en los más jóvenes, en la encuesta cara a cara. En la encuesta telefónica, O'Neil (1979) detecta la mayor tasa de no respuesta en las personas mayores de 55 años.

Pero antes de extraer conclusiones sobre el efecto diferencial de la edad en la no respuesta se debería, siguiendo la recomendación de Goyder (1987), controlar el tamaño del hogar. En el mismo sentido se manifiestan Groves y Cooper (1998), para quienes la mayoría de los hallazgos de porcentajes de respuesta más bajos entre las personas mayores se deben a que no se controla el hecho de que muchas personas mayores viven solas. Cuando se controla por tamaño del hogar, se encuentra que las personas de más edad son, en contra de lo que se es-


354

Métodos de encuesta

pera, las más deseosas de responder a la encuesta. De acuerdo con estos dos autores, los jóvenes y los mayores son quienes más cooperan. Los menos colaboradores, las personas de mediana edad. Los jóvenes, p~rque les m~ev~ la ~~­ riosidad de dar información. Los mayores, porque lo consIderan una obhgacIon cívica". Además, las personas mayores son las más fáciles de localizar en sus domicilios. Su sobrerrepresentación se da en encuestas con bajos porcentajes de contactos, donde no se han potenciado los esfuerzos de convertir las negativas en participación en la encuesta. " . . , ". " La consideración de contestar a una encuesta como obhgacIon CIVlca es respaldada por Curtin, Presser y Singer (2000). Estos autores insisten, además, en la exigencia de realizar más rel/amadas para cont.actar, en la en~~esta ~ele­ fónica, a personas más jóvenes y de mayor estatus socIal. La cO?VerSIOn d~ negativas" se precisa más en las personas mayores y de menor nIvel educa~I~~. • Estado civil. Los solteros, por su menor probabilidad de estar en sus domIcIlIos en las horas habituales del trabajo de campo, son los que presentan una mayor no respuesta por "no contacto", en las encuestas mediante entrevista. En may~r medida en la encuesta cara a cara. Y no tanto por "rechazo". Una vez localIzados, l~ predisposición de los solteros a responder al cuestionario. supera al ~e los otros estados civiles. En ello incide la edad, como antes se ha VIstO, y demas factores relacionados con el estatus social, como después se verá. Por su parte, Groves y Cooper (1998) destacan la mayor facilidad de contacto en hogares con niños pequeños. En ellos habrá siemp~e ~l" menos un adulto cuidándoles, pero no necesariamente en hogares con hIJOS Jovenes. • Estatus social. Usualmente medido mediante la combinación de los indicadores de ocupación, renta y nivel educativo. Correlaciona positivamente con la probabilidad' de respuesta en todas las modalidades de encuesta (Goyder, 1987). Quiere esto decir que la mayor probabilidad de respuesta se da confo~e se asciende en la escala social, en mayor medida si se atiende a la variable nIvel edu. . cativo y no tanto en las demás variables. Las personas de mayor nivel educativo son las que más remI~en el cuestIOnario debidamente cumplimentado en la encuesta por correo (Dl11man, 1978). También, son las que más participan en la encuesta telefónica (O'Neil, 1979; Graves y Lyberg, 1988) y en la cara a cara (Dohrenwend y Dohrenwend, 1968). La mayor tasa de no respuesta, en la generalidad de los métodos de encuesta, se en las personas de nivel educativo más bajo. Pero, como indican Graves y (1988), este hallazgo no es independiente de la mayor n~ respuesta ~n las personas mayores, debido a su menor nivel educativo. Se .~recIsa ~e estudIo~ que hagan uso de técnicas analíticas multivariables, que verIfIquen SI las relaCIones detectadas entre las variables son espurias o no. • Hábitat. Su incidencia es lógicamente mayor en la encuesta cara a cara que en los otros métodos de encuesta. La mayor no respuesta se da en las grandes áreas metropolitanas y en personas que viven en edificios vigilados por porteros y guar~ dias de seguridad (Kish, 1965/1995; House y Wolf, 1978; Groves y Kahn, 1979,

Capítulo 5: La administración del cuestionario

355

Groves y Lyberg, 1988; Goyder, Lock y McNair, 1992; Graves y Couper, 1998). Estos edificios pueden convertirse en plenamente "no respondientes" en encuestas cara a cara. Se argumenta que la incidencia diferencial del hábitat se debe a la densidad de población y a la tasa de delincuencia que presenten. En las encuestas telefónicas están las "barreras" de los contestadores automáticos y los servicios de identificación de las llamadas, éstos últimos más utilizados por personas jóvenes y aquellos de estatus social más elevado (Link y 01dendick, 1999/2002). La incidencia desigual de estas variables en la no respuesta supondrá un mayor de no respuesta, cuanto más relacionadas estén con el tema de estudio. 'e,n..nrtp·ri~,tlr/l.~ del entrevistador

el apartado S.l se mostró cómo las características sociodemográficas del entre:;a-(;/.vtsltaclor (género, edad, etnia, estatus social, ideología política) afectan a la participación encuesta, cuando interactúan con prejuicios y preferencias de los encuestados y, aderelación con el tema de la encuesta. A éstos se suman sus rasgos psicológiL"'l"1l"..ar-f"~1tTU(:lC' de éxito, percepciones sociales, confianza en sí mismo, motivación), las ty!;J.;I\i~~';~:fii.t~t:}'~¡:"~:~~i~~;;~~~ laborales (cantidad de trabajo, remuneración), su preparación para la encuesta ···.'<7i • ;,f[,Jr¡_·~i;i-¿yJ{-CO]lCrleta a realizar, su manera de hablar o de expresarse verbalmente (más en la encuesta de vestir, de mirar (en la encuesta cara a cara), su experiencia (que contribuye \'<larvo:ratHelne:nte a la reducción de la no respuesta). A lo dicho entonces, a cuya relectu.........:.. ~ . . ,,,.- remite, destacar la incidencia crucial en la no respuesta de: ·.·,... ······;···,:>·'.<c"C·i.'.;.·¡ .•·· ... :.-···

• La experiencia del ent,-evistador (Groves y Lyberg, 1988; Groves y. Couper, 1998; Biemer y Lyberg, 2003). Cuando se controla por ella, se elimina la incidencia de otras variables. Por ejemplo, Graves y Fultz (1985) obtienen una no respuesta más elevada en entrevistadores varones que en mujeres. Pero, cuando controlan los efectos del género del entrevistador en la tasa de respuesta por su experiencia, las diferencias desaparecen.

Sus expectativas. Como si se tratase de una "profecía autocumplida", el pensar que no se obtendrá colaboración influye negativamente en el logro de respuesta (Bradburn y Sudman, 1979; Schaeffer y Maynard, 2002). Al igual que el pensar que las preguntas son delicadas y no van a ser respondidas favorece la consecución de una mayor no respuesta de ítem en esas preguntas concretas (Singer y Kohnke-Aguirre, 1979). Estado emocional. Es igualmente crucial en su éxito (Groves, Cialdini y Couper, 1992). Afecta su estado afectivo, psicológico, previo al contacto con el entrevistado. También, su éxito aquel día, el cansancio, la motivación, el estado de ánimo en general.


356

Métodos de encuesta

encue~ta. El tono de voz que empleen, forma de dirigirse a los entrevistados, en especIal por teléfono. Oksenberg y Cannell (1988) destacan la conveniencia de hablar en voz alta, con decisión (sin titubeos) y con variabilidad en el tono de voz. Contribuye a que se perciba, a los entrevistadores, como más competentes y creíbles. De lo que resulta una mayor colaboración por parte de los encuestados. • Paciencia y actitud, en general, que muestren durante la entrevista. En mayor medida, cuando se entrevista a personas con dificultades de lenguaje o cognitivas que impiden un desarrollo fluido de la entrevista. Por ejemplo, personas mayores, de bajo nivel cultural, o que no dominan el idioma. • Cómo se enfrenten a la no respuesta. Su perseverancia y capacidad disuasoria para convertir la no respuesta por rechazo en respuesta (así lo muestran Bishop, Tuchfarber y Oldendick, 1986).

• Capacidad de persuadir a los reacios para que participen en la

Como ha podido constatarse, son varios e interrelacionados los factores que inciden en la participación en la encuesta. Es importante que, en la medida en que se pueda, se registre el motivo de la no respuesta. Este será de gran ayuda en la búsqueda de su solución, como se verá en el subapartado 5.3.2.

5.3.2. La reducción del error de no respuesta

Debido a que en el error de no respuesta incide tanto la tasa de no respuesta como las características diferenciales entre quienes responden y quienes no, su reducción también estará marcada por ambos componentes. Deberá dirigirse a la disminución de cada uno de ellos. Sin duda, la consecución del primero, una tasa de no respuesta prácticamente nula, favorece lo segundo (por ser mínima la presencia de no resp~ndientes en la muestra). Por esta razón, los principales esfuerzos se dirigen a consegUIr que los sujetos aleatoriamente elegidos pa.ra ser encllestados acaben p~l'ti~~~~~_~~~_l~_en­ cuesta.

El cuadro 5.3 incluye actuaciones varias ante la no respuesta. Unas dirigidas a la reducción de la tasa de no respuesta antes de concluir el trabajo de campo. Otras, a ajustes estadísticos para equilibrar la muestra final, una vez concluida la fase de recogida de información. En la aminoración de la tasa de no respuesta total o de unidad, primero están las intervenciones encaminadas a conseguir que las unidades originales de la muestra acaben siendo encuestadas. Incluye: ampliar y adecuar el período de tiempo para el trabajo de campo a las peculiaridades de la población a encuestar; la prenotiftcación de la encuesta, por teléfono o correo; potenciar el seguimiento de las unidades muestrales o "recontacto"; el uso de gratificaciones; la mejora de la presentación de la encuesta para conseguir motivar a la unidad de la muestra a responder; el empleo de ?~r?s métodos de encuesta para posibilitar el contacto con unidades de la muestra dlflclles d~ localizar; incrementar el tamaño de la muestra para disminuir la repercusión negatl-

Capítulo 5: La administración del cuestionario

357

va de la no respuesta en la validez estadística; y la sustitución de los "no contactos" o rechazos por unidades de población "equiparables". Es decir, lo más similares posible a aquellas a las que sustituyen. Si tras la aplicación de uno o varios de los remedios anteriores queda aún no respueden aplicarse ajustes estadísticos de la no respuesta, que ayuden a la repff~Selt1tat1vldald de la muestra final. A tal fin se han propuesto diferentes métodos de nnjrl{ll~raClé'n y de imputación. Para la reducción de la no respuesta de ítem, primero están las actuaciones preventl'vas de mejorar el diseño del cuestionario (la formulación y la disposición de las pn~guntals, principalmente) y la formación de los entrevistadores (en encuestas mediante CUADRO 5.3. Actuaciones para aminorar el error de no respuesta

NO RESPUESTA TOTAL O DE UNIDAD a) Actuaciones preventivas para la reducción de la tasa no respuesta por "no contacto" o por "rechazo" • Adecuación del trabajo de campo a las peculiaridades de la población a encuestar • Prenotificación de la encuesta • Seguimiento de la muestra • Gratificar la participación • Mejorar la presentación de la encuesta • Emplear otro método de encuesta • Tratar de convertir las "negativas" en aceptación • Incrementar el tamaño de la muestra • Sustitución por unidades equiparables

b) Ajustes de la no respuesta: el "equilibraje" de la muestra final .• Ponderación -de-la-muestra• Imputación de respuesta

NO RESPUESTA DE fTEM O PREGUNTA a) Actuaciones preventivas • Mejora del diseño del cuestionario • Intensificación de la formación de los entrevistadores y su supervisión

b) Ajustes estadísticos • Imputación • Eliminación total o parcial de los casos sin respuesta


358

Métodos de encuesta

entrevista) y su supervisión. Segundo, las distintas posibilidades estadísticas para el ajuste de la no respuesta. Desde la solución radical de eliminar los casos sin respuesta en una o más variables, hasta las distintas opciones de imputación. Rara vez es suficiente la aplicación de uno de los remedios enunciados para conseguir que el error de no respuesta se reduzca al mínimo. Habrá que usarlos de forma combinada, si se quiere aumentar la "representatividad" de los datos de encuesta. Pero, veamos, con detenimiento, en qué consiste cada uno de los remedios a la no respuesta propuestos.

5.3.2.1. Actuaciones preventivas para la reducción de la tasa de no respuesta

Cuando se planifica el trabajo de campo, los principales esfuerzos se encaminan a conseguir el cumplimiento de la muestra diseñada para la encuesta. Quiere esto decir, que se logre encuestar a la unidad de la muestra originariamente seleccionada. Si esto no fuese posible, ya por fallos en el marco muestral (direcciones erróneas, por ejemplo), ya por ausencias de la unidad elegida (fallecimiento, desplazamiento a otro lugar, enfermedad), que impidiese su contactación, o ya por su "rechazo" a ser encuestado, habrá que decidir qué hacer para evitar que su no respuesta afecte a la v~lidez externa (a las posibilidades de generalización de los datos de encuesta). Las opcIOnes son variadas. Con sus potencialidades y límites, que el investigador deberá sopesar. En este subapartado se enuncian las más referenciadas en la literatura de encuesta, que buscan reducir la tasa de no respuesta. En el siguiente subapartado se exponen las actuaciones de corrección estadística de la no respuesta postencuesta (una vez concluido el trabajo de campo). Las distintas estrategias para reducir el tamaño o magnitud de la no respuesta también buscan el "equilibrio" de la muestra. Que en ella esté representada toda la variedad del universo de estudio, como pretende la muestra que se ha diseñado al efecto. Que no se primen a unos grupos de población, por su mayor "accesibilidad" y "disponibilidad", frente a otros más inaccesibles. Todas las actuaciones aquí incluidas han de ser previstas, cuando se planifica la encuesta, porque mejoran sus resultados. Adecuación del trabajo de campo a las peculiaridades de la población a encuestar

Ha de evitarse que el trabajo de campo se ejecute en semanas "atípicas", en las que se prevean "ausencias" mayoritarias en hogares u otros espacios físicos donde se lleve a cabo la encuesta (por ejemplo, períodos vacacionales o estivales). También, en días y franjas horarias no propicias para "contactar" con la mayoría de las unidades de la muestra. Naturalmente, las horas y los días de la semana afectan a las encuestas mediante entrevista, no a la encuesta por correo. Los días laborales, y de 6 a 9 de la tarde, son los preferidos para la realización de las entrevistas. Al menos en los países anglosajones, en los cuales, a partir de las 6 de la tarde son escasas las "ausencias" del hogar (las jornadas laborales y escolares mayoritarias

Capítulo 5: La administración del cuestionario

359

han concluido, los comercios cierran y las actividades fuera de casa descienden considerablemente). E? España, por el contrario, comenzar a las 6 de la tarde quizá sea un poco pront~, elevana la no respuesta por "no contacto", pues todavía la actividad fuera del hogar e~ mtensa. Los comercios aún están abiertos (hasta las 8 e incluso las 10 de la noche), la Jornada laboral de muchos trabajadores aún no ha concluido, las universidades y otros.centros de enseña~a aún funcionan hasta las 9 y media de la noche, y el desplazanne?t.o a cas~ (depe~cI!endo de la distancia del lugar de residencia), unido a las buen~s condI~IOnes c~ma~ologICaS (en especial, en primavera-verano), contribuye a que en dIcha franJa horana aun sean muchas las "ausencias" del hogar. Más en unos colectivos de poblaCIón concretos, que en muchas encuestas son la población de interés. No se cena a las.6 d~ la ta~de, sino a partir de las 9 de la noche, e inclusive después. En consecuenCia, SI se qUiere contactar, en un primer intento, a un elevado número unidades de la m,u~stra, en encuestas en domicilios, habrá que concentrar la franja horaria proxIma a la hora de la cena. Pero sin interrumpir la cena. Principalmente, cuand~ la encuesta es cara a cara y rellenar el cuestionario lleva de 20 a 30 minutos. Ad~m~s, hay que tener presente la estacionalidad: los diferentes hábitos de la población en mVIerno y verano. Las 9 de la noche puede ser muy tarde en invierno, pero no en verano. Asimismo, los viernes por la tarde, por su consideración de inicio de fin de semana parece ~n día ~~óneo p,ara el ~rabajo de campo. Tampoco los sábados y los domingos: su cons~d~raclO~ de dIas festivos (para muchos destinados a compras y a actividades lUlU\,;<lI1i, a viajes d~ fI~ de semana). Quizá, podría pensarse en el domingo por la tarde, dado al recogImIento, a la preparación para la semana que comienza. , ~n el estudio antes ~eferenciado de Trujillo y Serrano (2003), mediante encuesta telefonu;a, se mu~stra.la dIstinta probabilidad de contactar a varones y a mujeres en días y franjaS horanas dIferentes. En conjunto, • El porcentaje de respuesta fue mayor los días laborales por la tarde que los fines de semana. • Las mujeres eran más fáciles de localizar de 12 a 21 horas, aJ igual que los varones mayores de 60 años. Los varones, en general, a las 21 horas. • Localizar a las mujeres los sábados era más difícil que los días laborales tanto por ' la mañana (excepto a primera hora), como por la tarde. • El domingo fue ~l ~ía más favorable para contactar a varones jóvenes. Fundamentalmente, a ultIma hora de la mañana y de la tarde. Aunque fue el día de la semana en que menos varones respondieron a la encuesta. En rel~ción con la estacionalidad, en uno de los pocos estudios efectuados hasta la fecha, de ~Igderhous (1981), en una encuesta telefónica breve (10 minutos), de una muestra aleatona de hogares en Canadá, obtuvo: • Ma~or~s ~as~s ~e respuesta en los meses de enero, febrero y marzo. • Abnl, Juma, Juho y agosto eran "menos preferibles".


360

Capítulo 5: La administración del cuestionario

Métodos de encuesta

• Diciembre fue el peor mes del año para recoger información. • Agrupando los meses en estaciones, la primavera (marzo, abril, mayo) fue la más productiva. Once años más tarde, Losch y otros (2002) vuelven a indagar en los efectos de la época del año en la eficacia de la muestra. Para ello analizaron las encuesta de salud de dos años (1998 y 1999), efectuada anualmente en la Universidad de Northern, Iowa, en cooperación con The Iowa Department of Public Health y U. S. Centers for Disease Control and Prevention en Atlanta: 3.600 entrevistas cada año (300 cada mes). La estrategia de la rellamada se aplicó un mínimo de tres intentos (días, noches, fines de semana). Diciembre no se incluyó. En verano, y sobre todo en Julio, se precisó de más rellamadas. No se detectaron, en general, grandes oscilaciones en los distintos meses. La explicación está en que se llegaron a realizar hasta quince rellamadas.

361

cuestado. Se le da tiempo para que medite la conveniencia de participar en la encuesta

y, cuanqo la desestime, para pensar cómo evadirse de la misma. La prenotificación por carta es más habitual y suele identificarse con un aumento mayor en la tasa de respuesta. De acuerdo con Fox, Crask y Kim (1988), el incremento pued.e llegar a ~er del 47,40/0 en la encuesta por correo. Faria, Dickinson y Filipic (1990) conSIguen un Incremento del 47,90/0 cuando la prenotificación la realizan por correo, y del 42,30/0 cuando es telefónica. Porcentajes también afectados por el prestigio del centro responsable del estudio. Hay un cierto consenso en reconocer la efectividad de las cartas de aviso, tanto en enlCUé~st().lS cara a cara como en telefónicas (Dillman, Gallegos y Frey, 1976). Legitimar respaldar la solicitud de encuesta; informar de la relevancia de la participación; y reel temor a ~ue un "desconocido" llame a la puerta. A estos beneficios hay que ~I~ el reconOCIdo por Groves y Lyberg (1988: 208), para la encuesta mediante en.U~LL.L. el reducir la ansiedad sentida por los entrevistadores ante el contacto frío con encuestado y la mejora de su actuación en el primer contacto. El envío de una carta previo a la encuesta telefónica puede llegar a incrementar la de respuest~ de 5 a 13 puntos porcentuales, según lo obtenido por Traugott, Groy LepkowskI (1987), pero no tanto si la prenotificación de la encuesta telefónica se >· ••• ,.·:.hor·~ por teléfono. ...r

· . . . . . , .....

••• L J 'O'

Aparte de pensar en el mes, día y franja horaria mas idónea para contactar a las unidades de la muestra, la reducción de la no respuesta por "no contacto" también lleva a valorar la conveniencia de ampliar el período de tiempo para el trabajo de campo. Posibilita el seguimiento de los "no localizados" en distintos días y horas de la semana, antes de la aplicación del remedio radical de la sustitución para no reducir el tamaño de la muestra.

Groves y Magilavy (1981) probaron un contacto telefónico antes de una encuesta aleatoria RDD (Random-Digit-Dialing). Las diferencias en los porcentajes de respuesta apenas fueron perceptibles: 81 % en aquellos en los que sí hubo un contacto previo y del 80 0k en los que no hubo.

Prenotificación de la encuesta El aviso con antelación de la realización de una encuesta puede contribuir más a la reducción de la no respuesta por "rechazo" que por "no contacto". Ya sea por correo o por teléfono, se avisa a la persona de que en los próximos días se le va a pasar un cuestionario (por correo o mediando un entrevistador). El uso del teléfono para el preaviso permite: • Concertar una cita: día y hora más idóneo para la realización de la entrevista (si laeneuestaesmedian-teentrevista). • Responder a dudas de los posibles encuestados, referidas a la encuesta y a los criterios seguidos en la selección de los encuestados. • Sondear la predisposición a participar en la misma y la necesidad de incrementar los incentivos para la participación. • Comprobar que la persona a quien quiere encuestarse reside en la dirección registrada en el marco de muestreo. De especial utilidad, cuando la encuesta es por correo, en la que no siempre es posible saber el motivo de la respuesta ("rechazo" o "no contacto"). En general, ayuda a identificar futuros problemas en la ejecución del trabajo de campo, pero hay que disponer del número de teléfono de todas las unidades de la muestra (si lo tienen) y destinar una parte del presupuesto y de personal a su realización. Inevitablemente supone un incremento en los costes económicos y temporales de la encuesta y puede provocar el efecto contrario: el poner en sobre aviso al futuro en- .

No obstante, en caso de optarse por una prenotificación previo a una encuesta telo má~ habitual es que se haga también por teléfono más que por carta. El enp~eclsa co??cer e.l nombre y la dirección del número de teléfono al que se (i)··.···-Juarna. ~sta Informaclon se tIene cuando se utiliza un listín telefónico para la selección

.:/·:·:_·;.····ll.ilr;..

;:~_ .. i"'...

torla--de-la-muestra.,~nO-silosnúme1=os-deteléfon-ose-gene1=a-na-l--aza-r,coID-Q-s-~-­

el procedimiento conocido como RDD (subapartado 3.4.9). Cuando la prenotificación se realice por carta, se aconseja que: a) I~~lu~a el membrete oficial de la agencia patrocinadora porque ayuda en la legltlmzdad de la encuesta. Más en el caso de que tenga autoridad y sea de reconocido prestigio (Brunner y Carroll, 1969; Groves y Lyberg, 1988). En el estudio de Brunner y Carroll (1969), por ejemplo, cuando la prenotificación era r~mitida por una ~niversidad, la tasa de respuesta aumentaba del 52,3 al 72,50/0. En cambIO, cuando la enVIaba un organismo privado, el incremento se reducía sensiblemente del 47,7 al 53,9%.

b) Se~ personalizada. Dirigida a una persona concreta, con su nombre y apellidos, . y fIrmada por el responsable del estudio, para dar más fuerza a la solicitud de participación.


362

Capítulo 5: La administración del cuestionario

Métodos de encuesta

61 %. Con tres rellamadas, el 69% . Con cuatro, el 77 % • Con cinco, el 82 % • Y, con seis rellamadas, el 86°k. En el estudio de Trujillo y Serrano (2003), de la comprobación de la incidencia de las rel/amadas en la encuesta telefónica, se obtuvo que con seis llamadas se contactó al 900/0 de las mujeres de más de 45 años. Éstas fueron las que menor número de llamadas precisaron para ser localizadas. Los hombres menores de 45 años, por el contrario, necesitaron nue~e llamadas telefónicas para alcanzar ese porcentaje de éxito. Los autores del estudio concluyen que seis llamadas de teléfono bastan para llegar a una tasa de respuesta, en la encuesta telefónica, de "éxito". Al menos, en amas de casa, estudiantes y jubilados (en los que incluso llega a superarse el techo del 90% ). La población ocupada precisa de ocho llamadas para alcanzar ese porcentaje.

c) Esté redactada en un lenguaje sencillo y en un tono amigable, pero cortés. d) Motive a la participación en la encuesta, indicando la finalidad del estudio, la im-

portancia de su colaboración y los beneficios de la misma. A la carta puede añadirse un incentivo económico-material de ipso facto o prometido. También, conviene hacer referencia al procedimiento seguido en la selección de los encuestados y, sobre todo, garantizar el absoluto anonimato y la confidencialidad de la información que se aporte en la encuesta. Estos aspectos ya se expusieron en el apartado 2.3, a cuya relectura se remite, para no repetir lo ya dicho. Seguimiento de la muestra

Ante la "no contactación" de la unidad de la muestra, lo más conveniente es insistir en la llamada, en distintos días y horas del día (en la encuesta telefónica o cara a cara) o enviar, de nuevo, el cuestionario (en la encuesta por correo).

363

En la encuesta cara a cara, ese número tan elevado de rellamadas apenas es factible, los mayores costes que supone el enviar a alguien, de nuevo, a una dirección, sin .·.,··~I"""''-' garantías de encontrar allí a la persona que se busca. Máxime si se trata de una aislada, no próxima, a la que hay que enviar ex profeso a una persona. tres revisitas suele aconsejarse en las direcciones en las que nadie contesta. Si hualguien, y ésta no fuese la persona a entrevistar, es más fácil concertar una cita para una visita posterior. Para Kish (1965/1995) debería incluso repetirse la visita hasta seis o más veces, hasta alcanzar una tasa de respuesta del 850/0. Como en la encuesta telefónica, en la encuesta cara a cara también conviene llevar registro de las revisitas efectuadas para agilizar su realización. En una ficha o en otro .;;fi~;¡J/;;;~/,¿;:-:';;;l:;Di(ioc:unlellLto, se anota el número de intentos de contactación, día y hora en el que se pro·.:;r.<::.>/!; .•·.,.,:·;;-,.;... dujo. Ello contribuye a una mejor programación de las revisitas. En la encuesta por correo, la efectividad de los reenvíos de cuestionarios ha sido ampliamente documentada. Ya en 1961 Scott, tras una revisión extensa de la investigación _~~t!E~jji-~j:;;:k_'·. existente hasta aquel entonces, concluyó que los envíos de seguimiento era lo más efec.•,<'''', ..• tivo para incrementar la tasa de respuesta en la encuesta por correo. En 1978 Dillman lo incluye en su propuesta para aumentar la respuesta en la encuesta por correo: el Método de Diseño Total (TDM: Total Design Method), explicado .·;:·?C'.·.:C>.·':::,i'/';-'\<"',~~l1 el apartado 2.3. De acuerdo con este método, exactamente una semana después del primer envío, debe enviarse un recordatorio por correo a todos a quienes se envió el i;-j~~~~~':~i~t!\·,/,ti"'''• '.·····cuestionario. En este recordatorio se les agradece su colaboración y se les insiste en la \if~;-;:i;)';;;~Nr;};--t-;"t)or

... U.lJL"""""'-L'-'.L.L

La rel1amada es el medio más corriente y exitoso para reducir la proporción de no respuesta, particularmente los que no están en casa. Debido a su similaridad, los envíos por correo repetidos a los que no devuelven el cuestionario también afecta a esta categoría (Kish, 1965/1995: 550).

Heberlain y Baumgartner (1978) muestran que el número de contactos, junto con la saliencia del tema, explican el 51 % de las variaciones en la tasa de respuesta. Tales son sus beneficios en la reducción de la tasa de respuesta por "no contacto" que se aconseja incluir "la planificación de rellamadas al calcular los costes y el tamaño de la muestra, al diseñar la muestra y los procedimientos de campo" (Kish 1965/1995: 551). Con su intensificación se busca lograr encuestar a quien debe encuestarse, de acuerdo con la muestra diseñada. Además, se producen menos desequilibrios en la muestra final, al lograrse contactar a aquellas unidades de la muestra más difíciles de localizar, como son los profesionales que más tiempo pasan fuera de casa. Si bien, la facilidad en su aplicación difiere en los distintos métodos de encuesta. De mayor aplicación, por su menor coste, en la encuesta telefónica, y más restrictiva en la encuesta cara a cara. En la encuesta telefónica, repetir la llamada en distintos días y horas apenas incrementa los costes del estudio. Se pueden hacer cuantas llamadas permita el período de tiempo destinado al trabajo de campo, hasta la contactación de la unidad de la muestra. Incluso pueden programarse las llámadas, mediante algoritmos de programación, seleccionando días y horas más probables de encontrar alguien en casa (comenzar los días laborales, por las tardes-noches, y proseguir los fines de semana). Si fuese preciso, ampliar algún día más el plazo temporal para la recogida de información. Lavrakas (1993) documenta bien la necesidad de incrementar las rellamadas en la encuesta telefónica. Con una única llamada, se logró cumplimentar el 270/0 de los cuestionarios. Con una rellamada a los no respondientes, el 480/0. Con dos rellamadas, el

_<.¡.-e .. :,>.'."'",..,."/:,.'

"_>;""."!,.,"'>,':,.>',<"'.

<:''>.".'•. .' ', ...._.,

''''',!':>'''i/:.>''',''''i,''

;1;-'//;':.::,'/

>

.r'."-'""".""-

.. _/~; /_{,;;;,.,\;<..

importancia de su participación en la encuesta. Tres semanas después del primer envío, una segunda carta y una copia del cuestionario a quienes aún no lo han devuelto clJmplIme~ntad().Siete semanas posteriores al primer envío, se vuelve a enviar una carta recordatorio con el cuestionario (por si éste se ha extraviado). Este envío es ahora por correo certificado. Si se dispone del número de teléfono del destinatario, el seguimiento puede hacerse por teléfono. Brennan y Hoek (1992) muestran la importancia de efectuar al menos tres envíos. En una encuesta por correo a 602 mujeres mayores de 18 años de Nueva Zelanda, obtuvieron que con un único recordatorio la tasa de respuesta se incrementó del 17 al 240/0 . Con dos recordatorios, del 18 al 260/0. Incluso en el grupo de los más reacios, el uso de


364

Capítulo 5: La administración del cuestionario

Métodos de encuesta

dos recordatorios dobló y, en algunos casos, triplicó el porcentaje de respuesta. En los respondientes más reacios, el seguimiento telefónico puede ser necesario.

Pero el incrementar el número de envíos postales para aumentar la tasa de respuesta también tiene un límite marcado por las exigencias presupuestarias y los plazos de tiempo para la investigación. El tener que guardar un tiempo desde que se envía el cuestionario hasta que éste se devuelve debidamente rellenado (de 10 a 15 días, por ejemplo), tras cada envío, alarga el tiempo necesario para la recogida de información (el trabajo de campo). Puede llegar a superar los dos e inclusive los tres meses. Esta distancia en el tiempo entre los primeros y los últimos cuestionarios devueltos puede afectar negativamente a la comparabilidad de la información que proporcionan. De manera especial, si la temática de la encuesta está muy influida por el contexto socio-temporal en el que se cumplimenta el cuestionario: los hechos'que le preceden. Además, exige la aplicación de un sistema de identificación y de registro de los cuestionarios ya devueltos, para no volverlos a enviar a aquellos que ya lo han respondido. Con el consiguiente aumento de costes (postales y de fotocopias) y de molestia a los encuestados que han cumplido con la petición de encuesta. El recurso al envío por correo certificado se aconseja para dar mayor relevancia a la investigación y a la percepción, por parte de su receptor, de que su opinión se valora en exceso. Tanto que ,no ha importado costear las tasas más elevadas del correo certificado y, con anterioridad, se les ha enviado varios recordatorios. Se está tras él, con la consiguiente presión que ello supone. Sin embargo, presenta los inconvenientes relacionados con el correo certificado:

365

puestas. Puede haberse conseguido reducir el error de no respuesta y, en cambio, aument~r el error de medición debido al encuestado, afectado por su simpatía-antipatía la encuesta.

Gratificar la participación

Partiendo de la Teoría del Intercambio, Dillman (1978, 1991) propone "gratificar" la participación en la encuesta como estrategia para incentivar la tasa de respuesta, al menos en la encuesta por correo. El responder a una encuesta supone unos costes (pérdida de tiempo, de control de la información) que no necesariamente se traducen en beneficios (que la información aportada revierta en beneficio del encuestado, en la mejora de su situación). Con la gratificación se le quiere tral).smitir que se aprecia el esfuerzo por dedicar parte de su tiempo a responder al cuestionario, aunque la gratificación sea sólo simbólica. Con anterioridad, se había apuntado a la norma social de la "reciprocidad" como base para el uso de incentivos en la encuesta (Gouldner, 1960). La recepción de una f!rlltlrlcaClc~n hace que la persona se sienta obligada a "dar algo" a cambio, en cualquier relación social. En 1984 Cialdini destaca, entre los factores psicológicos que pueden influir en la participación en la encuesta la reciprocidad, la mayor predisposición a responder a una encuesta si se es recompensado con un regalo, paga, una concesión o se piensa que la información dada le beneficiará. A este factor añade otros cinco: • Consistencia. Si es consistente con sus creencias, valores, actitudes. Resulta

a) Mayor coste que el correo postal ordinario. b) El receptor tiene que firmar para recoger el envío y, en caso de no estar en su

domicilio en el momento que pasa el cartero, el tener que desplazarse, en unos días de la semana y franjas horarias concretas, a la oficina postal para reGºg~IJ.lIl.ª~ªrlª~ºJ!TI_p~g!!~ºº~~_ª9.!!~~t~Lg~~_es . l..lº~_i~º~~gJ:l!_t~é!:~.:P~E~ él. Pue~__!!~-~ varse una gran desilusión cuando descubre que, de nuevo, es aquel cuestionario que hace tiempo rechazó contestar. Pese a ello, el envío por correo certificado crea más presión en el receptor para que éste acabe rellenando el cuestionario. House, Gerber y McMichael (1977) obtuviero~ que, cuando el tercer envío se hizo por correo certificado, la tasa de respuesta aumentó en un 43 % ; mientras que por correo ordinario, sólo en un 200/0. Además, como indica Dillman (1991), el correo certificado permite identificar a los respondientes "inelegibles", al precisar de la firma para recoger el envío. Lo cual es de gran utilidad en la valoración de la no respuesta.

Otra cuestión es la respuesta que pueda dar el encuestado tras tanta "presión" ejercida sobre él para que acabe cumplimentando el cuestionario: la adecuación de sus res;.

beneficioso informar al encuestado cómo se emplearán los resultados de la encuesta en mejorar sus condiciones de vida. • Validación social. El saber que otros han contestado a la encuesta ayuda a la participación. Contribuye a su valoración social. _c~~~~~_~~utoIft!~d. ~ L~J~_~!g_~~~ió!!~_~!!_Jª-~~cll_~~~~~_~~l~~_eI_~a Y9 r,. ~!!ªººº_lª-p~ición procede de una autoridad a quien se reconoce legitimidad. Éste es uno de los factores que intervienen en la generalmente mayor tasa de respuesta en encuestas gubernamentales, respecto a las hechas desde el ámbito privado. Por ello, se insiste en la necesidad de destacar, en la presentación de la encuesta, el nombre del centro responsable del estudio e, inclusive, del.patrocinador, si se espera que su conocimiento favocerá la participación, por su prestigio social y la legitimidad que se le otorgue. • Escasez. El saber que la oportunidad para participar en la encuesta sólo se ofrece a unos pocos y en un plazo de tiempo limitado. Se le ha de comunicar su fortuna por haber sido elegido (mediante un procedimiento aleatorio) y la oportunidad que se le concede para dar su opinión. En caso contrario, la perderá y es improbable que, en el futuro, vuelva a concedérsele dicha oportunidad. • Empatía. El deseo de participar es mayor cuando se establece empatía con el entrevistado (en encuesta mediante entrevista), cuando se le siente más próximo.

.__ ~


366

Métodos de encuesta

Capítulo 5: La administración del cuestionario

Como se vio en el apartado 5.1, la coincidencia en las características sociodem.ográficas entre el entrevistador y el entrevistado puede favorecer la participación en la encuesta. Fundamentalmente, cuando tienen relación con la temática que aborda la encuesta. Estos factores se tienen en cuenta en la presentación de la encuesta. En ella se prima el resaltar los "beneficios" (la utilidad social) de la participación en la encuesta, como una forma de gratificar su colaboración en el estudio. A ello se suma el "agradecimiento" expreso por su contribución y, a veces, algún tipo de obsequio o de recompensa material. No hace falta que sea de cuantía elevada. Es preferible un regalo "simbólico", de escaso valor (de cinco euros, por ejemplo), adjunto al cuestionario, que una gratificación cuantiosa (un coche, 6.000 euros, un viaje para dos personas) "prometida", tras la cumplimentación del cuestionario. Los incentivos monetarios son más exitosos que los no monetarios (Goodstadt y otros, 1977; Hansen, 1980) y más los prepagados que la promesa de recompensa condicionada a la cumplimentación del cuestionario (Wotruba, 1966; Armstrong, 1975; Gelb, 1975; Goodstadt y otros, 1977; Berk y otros, 1987). Con una gratificación de sólo 5 dólares dada por adelantado, James y Bolstein (1990) obtienen una tasa de respuesta del 71,3%, mientras que con la promesa de 50 dólares, sólo logran un 56,70/0 de respuesta. Además, consiguieron una información de mayor calidad (escasa no respuesta de ítem y preguntas abiertas más completas). Con posterio·ridad, Warrimer y colaboradores (1996), igualmente con un prepago de 5 dólares en una encuesta por correo, lograron una tasa de respuesta del 78°k. Mangione (1998), en una encuesta sobre consumo de alcohol, llegó a una tasa de respuesta del 820/0, con la misma gratificación. Con un prepago de sólo 1 dólar, pero diez años antes, Hubbard y Little (1988) habían conseguido una tasa de respuesta del 680/0, mientras que con la pro·· mesa de gratificación de 200 dólares la tasa de respuesta se redujo al 51,8%.

Estas indagaciones experimentales, que analizan el efecto diferencial de la gratificación en mano respecto a la prometida, confirman los beneficios del prepago, aunque éste sea simbólico. Una pequeña cantidad para compensar, en parte, el tiempo dedicado a responder al cuestionario. Su receptor se siente más obligado a "corresponder" participando en la encuesta. También contribuye a dar más importancia a la encuesta y seriedad a la empresa que la lleva a cabo. Su uso es más generalizado en la encuesta por correo y su efectividad, en ella, ha sido demostrada de forma reiterada (Armstrong, 1975; Linsky, 1975; Heberlein y Baurngartner, 1978; Yammarino, Skinner y Childers, 1991; Church, 1993 y un largo etcétera). Si bien, es igualmente extensible a los otros métodos de encuesta, que tradicionalmente han confiado al entrevistador la responsabilidad de motivar a la participación en la encuesta. Por ejemplo, adjuntando la gratificación a la carta de presentación previo a la entrevista telefónica o cara acara (si se utiliza esta vía de prenotificación). Willimack y co-

367

laboradores (1995), en una encuesta cara a cara en Detroit, lograron reducir la tasa de !lO respuesta al 12,4%, incluyendo un bolígrafo con el anagrama de la Universidad de Michigan en la carta de presentación, en la que se solicitaba la colaboración. Cuando no se adjuntó dicha gratificación, la tasa de no respuesta llegó al 16,1 %. Además, se obtuvieron respuestas de mayor calidad con el obsequio del bolígrafo: respuestas más completas a preguntas abiertas. Lo que es más, no lograron evidencia "fiable" de diferencias en la composición s-ociodemográfica de la población que respondía al cuestionario, debido al incentivo material dado. En una serie de experimentos, realizados durante dos años, en una encuesta telefónica mensual (Survey of Consumer Altitudes), aplicando el procedimiento RDD (Random-Digit-Dialing) , Singer, Van Hoewyk y Maher (2000) consiguieron incrementar la tasa de respuesta en al menos 10 puntos porcentuales con incentivos prepagados incluidos en la carta de preaviso. También, se redujo significativamente el número de llamadas necesarias para cerrar un caso, al igual que el número de negativas. No así con incentivos prometidos ni con cartas de prenotificación sin gratificación incluida.

Las gratificaciones son igualmente muy utilizadas en las encuestas panel y en las en{;J~¡l,~~~~~~'¡~!!; ;:;~:;adiario. En ellas se demanda más el seguir incentivando a los integrantes de la \ para que continúen participando en el estudio. Aunque, rara vez, en encuestas '.i:r·:~~;',·!;~1,\{ti'?~J~::;:·/~~ublernam.en1talt~s. Como indica Graves (1989: 215), Quizás por la visión de que las encuestas gubernamentales deberían buscar cooperación, como parte del servicio público, por la parte de los encuestados. Por contraste, las agencias de investigación comercial ganan dinero debido a la cooperación de los encuestados y de esta forma deberían compartir esa recompensa.

En su contra está, lógicamente, el incremento en los costes de la encuesta y, para la posibilidad de "modificar las respuestas de los entrevistados que paa la categoría de trabajadores del entrevistador, al que como cualquier buen tra/l.JlC:lIa.uu'~ tratarían de agradar con su trabajo -en este caso con las respuestas que las preguntas del cuestionario-" (Sánchez Carrión, 2000: 55), si bien esta última .i'!~\a.t1tlna'ClÓ'n no siempre ha sido corroborada por la investigación empírica. Ni Hubbard (1988) ni James y Bolstein (1990), por ejemplo, han obtenido evidencia emque confirme que el uso de gratificaciones contribuye a la captación de respuestas favorables o conformistas. ··E·.. . ·•· i>j\.slffil~sm,o~ se suceden los estudios que muestran los beneficios de los incentivos en .'la.·.·culmlD1í]me~nt:acíónde los cuestionarios: escasos sesgos de respuesta, respuestas más """~~.lIJ.l""'"u.O a preguntas abiertas (mayor número de palabras escritas), y la mención de Jte~;Du'est(lS más distintivas (Wotruba, 1966; Godwin, 1979; Berk y otros, 1987). En camen los experimentos en la encuesta telefónica RDD realizados por Singer,Van y Maher (2000), sí se detectó que los incentivos prepagados afectaban a alde las preguntas clave del cuestionario, en el sentido de propiciar una res•.Dlles1ta más positiva. No obstante, los mismos autores del estudio reconocen la necede más investigación sobre la interacción de las características del respondiente :;a.l¡~UIIVO autores, ..

:··1111.-:1 ..... · .....

···......


368

Métodos de encuesta

(como las relacionadas con su estatus socioeconómico) con incentivos, para ver en qué medida son más efectivos en unos grupos de población que en otros. Mejorar la presentación de la encuesta

En cualquier modalidad de encuesta, cómo se presente el estudio afectará a la participación en él. De ahí la insistencia, ya reiterada, de resaltar los beneficios de responder al cuestionario, incluyendo los seis factores psicológicos destacados por Cialdini (1984) como decisivos en la participación en la encuesta: reciprocidad, consistencia, validación social, autoridad, escasez y empatía. Para no redundar en recomendaciones relativas a la presentación de la encuesta, ya mencionadas en éste y en capítulos anteriores (capítulos 2 y 4), sólo queda insistir en la necesidad de procurar garantías de anonimato y de confidencialidad de las respuestas. En especial, cuando la enc~esta aborde cuestiones "delicadas" que puedan suscitar suspicacias por parte del encuestado. Singer, Von Thurn y Miller (1995) demuestran que la garantía de confidencialidad es lo que más favorece la respuesta en encuestas "delicadas". Si bien, advierten que su uso "en exceso" en las demás encuestas puede tener el efecto contrario. Puede contribuir a aumentar, en el encuestado, la sensación de sensibilidad de sus respuestas. De nuevo, la recomendación de que en la mesura está el acierto. Con anterioridad, Singer (1993/2002), tras revisar investigaciones precedentes, había concluido que el anonimato y la confidencialidad son clave para aumentar la participación en la encuesta y la calidad de la respuesta. No obstante, la variable crucial es la confianza en la integridad de la agencia que recoge los datos. No la naturaleza de las garantías dadas a los respondientes.

Emplear otro método de encuesta

Elle} apartado·2.4Yáse ápuiiló;como ésttateglaparareducirfa-tasa-deno-respuesta, el utilizar otro método de encuesta en los no respondientes. Por ejemplo, aplicando la encuesta cara a cara a quienes no han devuelto el cuestionario por correo o no ha podido contactarse con ellos por teléfono. Esto último, si la muestra se ha extraído de un listado que incluya las direcciones de las unidades muestrales y no mediante el marcaje aleatorio de dígitos de teléfono (RDD: Random-Digit-Dialing). Su uso complementario ayuda, además, a recabar información sobre el perfil de los no r~­ pondientes. Información necesaria en la valoración de la no respuesta y la conSle guiente "representatividad" de la muestra finalmente observada. Lo mismo puede hacerse con los otros métodos de encuesta en el seguimiento de los "no contactados": • En los "no contactados" en la encuesta cara a cara puede concertarse, por teléfono, una "cita" para la realización de la entrevista, en el lugar, día y hora

Capítulo 5: La administración del cuestionario

369

que el entrevistado escoja. Si el entrevistado lo prefiere, incluso puede hacerse la entrevista por teléfono. De esta manera, se elimina el coste añadido de la revisita sin garantías de éxito. Igualmente, puede hacerse con quienes no devuelven el cuestionario cumplimentado por correo, si se dispone de un número de teléfono. Enviar por correo el cuestionario a los "no contactados" vía cara a cara o telefónica (si se tí'ene su dirección). 0, en caso de la encuesta cara a cara, si hay alguien en el domicilio, se le puede entregar el cuestionario para que se lo dé a la persona a la que ha de encuestarse y ésta lo rellene cuando pueda, en un plazo de tiempo marcado. Se le puede decir que dentro de dos días, a una hora concertada, se pasarán por él. Si se prefiere, se les entrega un sobre contra reembolso para que lo envíen por correo. La autocumplimentación del cuestionario también se aconseja como estrategia pareducir la no respuesta y evita errores de medición en preguntas delicadas, combiiidose con la entrevista cara a cara o telefónica. Como se indica en el apartado 2.4, 1l.Ya relectura se remite. iltar de convertir las "negativas" en aceptación

Ante la "negativa" expresa o rechazo a participar en la encuesta, puede probarse conversión en "aceptación", antes de descartar a la unidad de la muestra del estuo.Siguiendo a Graves y Couper (1998), esta conversión puede hacerse de tres maras: • Reasignando los casos "reacios" a entrevistadores seniors o a supervisores. Este personal con mayor experiencia y formación trata, de nuevo, de establecer contacto con la unidad de la muestra. En el recontacto suele hacerse referencia formal al contacto anterior. cEnvtáruiule7lTllITana de ''persuasiórr'~-enia--que-sereitera-ta1mportaneia del es tudio y la relevancia de lograr una participación completa de la muestra. Se insiste en los beneficios que reportará la información dada en la encuesta y, normalmente, se indica que, en los próximos días, un entrevistador tratará de establecer contacto con él/ella. Estas cartas suelen obtener mayor éxito cuando la personalización de la correspondencia transmite la seriedad del esfuerzo de la encuesta y los argumentos expuestos logran "convencer" a los "reacios". • Cambiando el método de encuesta. Por ejemplo, a los reacios por teléfono, tratar de recontactarlos cara a cara, si el presupuesto lo permite. recurrir al teléfono para el seguimiento de los cuestionarios por correo no devueltos. U otros modos combinados de encuesta apuntados con anterioridad.

°

Según estimaciones de Graves y Lyberg (1988: 208-209), de un 25 a un 40% de los de la muestra que inicialmente se niegan a ser entrevistados, después acaban par-


370

Capítulo 5: La administración del cuestionario

Métodos de encuesta

ticipando en la encuesta. El éxito de la conversión de la negativa en participación depende de: • • • •

La "suavidad" de las negativas. Si otro miembro en el hogar contactado ha participado. Lo bien desarrollada que sea la razón para la negativa inicial. La actuación del segundo entrevistador en convencer al reacio.

Para Sánchez Carrión (2000: 96), en la encuesta personal en domicilios, "lo mejor que se puede hacer para conseguir la entrevista es meterse dentro de la casa (prácticamente éxito asegurado: 3,80/0 de negativas), mientras que si solamente se logra establecer contacto a través del telefonillo, el fracaso también está prácticamente asegurado (85,70/0 de negativas). En la encuesta mediante entrevista, en general se aconseja el instruir al entrevistador en técnicas de persuasión. Han de tener respuesta ante cualquier excusa esgrimida por el no respondiente. Por ejemplo, ante un "Lo siento, no puedo", intentar concertar una cita para otro momento, cuando sea más conveniente al futuro encuestado. De acuerdo con Lavrakas (1993), únicamente de un 10 a un 150/0 de los "rechazos" en encuestas telefónicas pueden considerarse "fuertes". Para Van Kammen yStouthamer-Loeber (1998: 387), "casi la mitad de la gente que una vez dicen que no quieren hacer una entrevista más tarde consentirán en ser entrevistados". Por esta razón, es importante que los entrevistadores "siempre dejen la puerta abierta para futuros contactos". No obstante, el forzar a los reacios a participar puede introducir errores de medición, si éstos no dan respuestas precisas (por no querer pensar, por querer ocultar la respuesta u otra causa). Davis y Smith (1992), por ejemplo, observan que, en aquellos que al principio se negaron a realizar la entrevista, pero que después fueron convencidos, resultaron ser menos cooperativos durante la entrevista y presentaron una mayor no respuesta de ítem en varias preguntas, como las relativas a renta económica. Éste es un peligro que hay que tratar de prevenir.

Incrementar el tamaño 'de la muestra

Erróneamente puede pensarse que si se seleccionan más unidades muestrales de las necesarias, para un error muestral determinado (que posibilite la inferencia estadística), y así hacer frente a las "negativas" o "no contactos", también puede reducirse la incidencia del error de no respuesta en la calidad de los datos de encuesta. Esta presuposición no es cierta, si no se realizan esfuerzos para lograr que los distintos grupos de población participen en la encuesta. Es decir, si el incremento del tamaño de la muestra no se traduce en una mayor captación de los distintos grupos de población, sino que quedan sobrerrepresentados, en la muestra final, aquellos más fáciles de "con-

371

. Recuérdese que el error de no respuesta está determinado por el producto de tasa d~ no respuesta y la diferencia en los valores medios entre los respondientes y no respondientes. ,,"U:stll~ucl~on por

unidades equiparables

La sustitución, junto con la imputación, son los remedios más frecuentes para eviel efecto negativo de la no respuesta en la reducción del tamaño de la muestra y el ki··<~~orlsU~Ul~~nl:e aumento del error muestral. Pero puede generar más error de no respuesta, ';\'.! U~;"'''''J.J.V.l.u..I..l.'-lV la calidad de la encuesta, si los "sustitutos" elegidos no son equiparables ):·;;'%'~.b;;:",:;·.•'· •.•·.·.a qluH~nt~S reemplazan. Para Kish (1965/1995: 558), la sustitución "generalmente es de poca ayuda y pue·.•·····.x-.;<;'k·);";·"\,•. ·Clle en realidad perjudicar". El control del tamaño de la muestra puede mejor lograrse .···.·.;-Á:;j·'.:~g;:··;,{::··co:n "suplementos", mediante el incremento anticipado del tamaño de la muestra. No óbstalntc~, hay que insistir en que ni los incrementos del tamaño de la muestra ni la sus.'.·:r:f.·:7.::.·;:.t'ítuClC~n logran reducir el error de no respuesta, si acaba encuestándose a quienes más probables a "responder". La sustitución suele practicarse conjuntamente con el muestreo por cuotas. El respondiente se sustituye por otro que pertenezca a la misma "cuota". Ésta nor·. •· ·• •. •·'••:; ·;}••·r>.Jll.alrne:nte se define por el cruce de variables sociodemográficas: género, edad, estado ocupación, estudios u otras acordes con los objetivos de la encuesta. Por ejemplo, para facilitar el trabajo de campo, las cuotas suelen reducirse a unas pocas variables y de fácil visualización por parte del entrevistador, como se vio en el capítulo 3. Ello contribuye a que la sustitución no garantice la plena equivalencia del no respondiente con el sustituto. Puede coincidir en alguna variable (edad, género, estado civil), aunque no en otras excluidas de la cuota. Además, hay que añadir la arbitrariedad en la selección del sustituto, al ser inusual la aplicación de un procedimiento de selección aleatorio (que garantice la igual probabilidad de elección de todos los integrantes de la cuota). Lo cual favorece la inclusión, en la muestra final, de aquellos grupos de población de más fácil localización en la franja horaria habitual para el trabajo de campo, como son las mujeres casadas con niños pequeños, que sean amas de casa o con jornada a tiempo parcial, frente a las profesionales solteras, con jornada laboral completa, hasta avanzada la. tarde-noche. Murgui, Muro y Uriel (1992) muestran cómo la sustitución contribuye a mcrementar, en la muestra, la presencia de las personas más fáciles de contactar, destacando las amas de casa.

Por sus beneficios en mantener el tamaño de la muestra original, sin apenas in• . -':·?1;-';f;·~j~Li.Wf)ii;·cI·eITlentar los costes de la investigación (a diferencia de los recontactos), la sustitución más practicada de lo que debiera por los centros privados de investigación social y mercados, más enfocados a la consecución de máximos beneficios con mínimos cos. pero menos cuando se persiguen datos de encuesta de mayor "calidad". Como indlcaSánchez Camón (2000: 22), la práctica de la sustitución es más habitual en centros investigación comercial y social. Por el contrario, la eliminación de los no respon-


372

Capítulo 5: La administración del cuestionario

Métodos de encuesta

dientes es propia del tipo de investigación administrativa realizada por el Instituto Nacional de Estadística (INE) o por centros de investigación social de prestigio, como The Survey Research Center (SRC) o The National Opinion Research Center (NORC), de las Universidades de Michigan y Chicago, respectivamente. La sustitución, por la pérdida en representatividad de la muestra que pudiera suponer, debería ser el último recurso a aplicar, cuando se quiere mantener el tamaño original de la muestra. Después de haber probado otras estrategias y no haberse logrado una tasa de respuesta satisfactoria. Ahora bien, cuando se lleve a cabo, se debería decir en el informe de la encuesta, que ha habido sustitución, al igual que ha de hacerse co~ la no respuesta. Su conocimiento es preciso para la correcta interpretación de los resultados de la encuesta. 5.3.2.2. Ajustes estadísticos de la no respuesta: la ponderación y la imputación

la asignación de unos "pesos" se quiere equilibrar la desigual probabilidad de en la muestra final. El procedimiento en la corrección de la no respuesta es similar a cuando se ponmuestras estratificadas no proporcionalmente, en la búsqueda de estimaciones paconjunto de la población. Unos grupos de población están subrepresentados, :f_IIJ~"".I..L~.L"'''''' que otros se hallan sobrerrepresentados en la muestra final. Si bien, ahora la ~rF,lz)nf1pra~Clo~n se realiz'a en función de la tasa de respuesta. Habrá que incrementar el pequienes han contestado a la encuesta para que "representen" a aquellos, en el grupo de población, que no han respondido. Varios son los procedimientos alternativos de ponderación aplicados en el ajuste la no respuesta (véase Kalton, 1983; Sánchez Carrión, 2000; Lohr, 2000, entre citados en la bibliografía). Depende de los datos que se tomen de referencia paasignación de "pesos" en cada subgrupo de población (en el que se divide la muesde acuerdo a la no respuesta habida. Los tres más practicados son ponderar según: ~LIo.1~.L ....,~ de la población, la muestra original (la diseñada) y la accesibilidad o dis.JVJ..UIVJLLL'-'.~"-L de las unidades de población. Existen otros procedimientos de uso más res\f;\iLJlU.l~~J.U1U, como la llamada ponderación "raking-ratio" o de ajuste proporcional. Esta es de utilidad cuando se quiere ponderar de acuerdo a dos variables conjuntas que sólo se dispone de su distribución univariable. Pero veamos las de uso más U __ .

:'+-i"'~'·'t"----- --- ----------- --

Una vez concluida la recogida de datos, en la fase de análisis, pueden realizarse ajustes estadísticos que ayuden a mitigar los desequilibrios en la muestra final debidos a la no respuesta. Mediante ellos se intenta compensar las diferencias en las estimaciones de los respondientes y los no respondientes. A tal efecto, lo ideal es disponer de información sobre los no respondientes, que permita comprobar en qué medida se distancian de los respondientes. Si la información extraída de estos últimos logra representar a la población de estudio, incluidos los no respondientes, al menos datos referidos a sus características sociodemográficas básic.as (género, edad, indicadores de estatus social, hábitat). Que el entrevistado~ la recoJ~, ya del propio no respondiente (en la no respuesta por rechazo), ya de VeC1U?s: famIliares u otras personas, que puedan aportar información del elegido para partICIpar en la encuesta (en la no respuesta por no contacto). Ha de procurarse que esta información se recabe, a ser posible, de forma estandarizada, reservando un espacio a propósito ---el1-el--cuestionario-p-arª-su~r~gisJ!º. _ Lamentablemente, rara vez se dispone de ltiformációri--feTativa--a-1os-n-Ofespon---dientes. Lo que imposibilita su utilización en los ajustes de la no resp.uesta. A co~ti­ nuación se exponen los ajustes estadísticos de la no respuesta más aphcados en la Investigación mediante encuesta: los métodos de ponderación de la muestra y de imputación de respuesta. Ponderación de la muestra

Una práctica común para "compensar" la no respuesta total (o de unidad) -aunque no siempre adecuada o incluso válida" (Lavrakas, 1993: 93)- es ponderar la muestra en consonancia con la tasa de respuesta. Como ya se indicó en el subapartado 3.4.3, la ponderación de la muestra es un procedimiento habitual de ajuste posmuestreo de las estimaciones muestrales a los correspondientes parámetros poblacionales, que considera aquellas unidades de la población de las que no se ha extraído información. Me-

373

....

.......L""'.L'"

Ponderar de acuerdo con la distribución de la población. Éste es el procedimiento de ponderación más sencillo, que no precisa de información sobre los no respondientes. Mediante él se "ajustan" características demográficas de la muestra final respecto a las mismas características en la población de interés, a partir de los datos censales disponibles de la población. Generalmente, datos sociodemográficos (género, edad, estudios, ocupación, hábitat), empleados en el diseño de la muestra, y que necesariamente no están relacionados con el problema de investigación. -----~----ba--finalidad--es-~eHegiFoosv-iaGjgll€S-de--la-muestm-iinal,--respecto-delap11·~---­

blación de estudio, atribuibles a la distinta tasa de respuesta. La muestra final ha de mantener la "proporcionalidad" habida en la población. Para ello se compara la muestra final con los datos disponibles de la población a la que pretende "representar", con objeto de comprobar en qué medida ambas se distancian. La población se divide en estratos o grupos. A ser posible, de acuerdo con variables relacionadas con el problema de investigación. En cada estrato, se di~ vide el porcentaje que representa en la población entre el porcentaje que representa en la muestra final, siguiendo el mismo procedimiento que en el muestreo estratificado no proporcional (subapartado 3.4.3). De modo que los grupos de población menos representados en la muestra (al haber tenido una mayor tasa de no respuesta), obtendrán un coeficiente de ponderación más elevado. Por el contrario, a los sobrerrepresentados les corresponderán los coeficientes de ponderación más bajos. La magnitud del peso o coeficiente de


374

Capítulo 5: La administración del cuestionario

Métodos de encuesta

ponderación depende de la distancia habida en la representación de cada grupo en la muestra respecto a su presencia en la población. Por ejemplo, si la muestra final está integrada por un 41 % de varones y un 59% de mujeres, mientras que su presencia "real" en la población de interés es del 48 y 52%, respectivamente, habrá que devolver a la muestra s~ debido :'equilibrio" respect~ ~e la población al haber una tasa de respuesta diferencial por genero. A tal fin, se dIVIden los porcent~jes respectivos (% en la poblaciónl% en la muestra), obteniéndose que cada respondiente varón será tratado como si hubiese respondido 1,17 (48/41 = 1,171), Ycada mujer como si hubiera contestado 0,88 (52/59 = 0,881).

Al igual que en el muestreo estratificado no proporcional, cada pes~ o coeficiente de ponderación se multiplica por la estimación muestral correspondIente en cada grupo diferenciado en la población. Después, se suman todos los ~roductos· (de coeficientes por estimación) y se divide por el total de la muestra analIzada. De esta forma se obtiene la estimación para el conjunto de la población, corregida la desproporcionalidad en la muestra (respecto de la población) por la incidencia desigual de la no respuesta. Mediante esta variedad de ponderación se busca la corrección no sólo de errores de no respuesta, sino también de no cobertura. Es decir, la desigual probabilidad de selección de las unidades de población para integrar la muestra. Su principal inconveniente es que sólo puede hacerse en aquellas variables de las que se ten~a información en la población. En su mayoría, variables sociodemográficas, independIentemente de su relevancia respecto al problema de investigación. Su éxito dependerá, obviamente, de la correspondencia de la variable elegida para la ponderación con los objetivos de la encuesta, pero "como la representatividad en u.n.a variable no es ge~era~able a .to~as la~ variables o relaciones en la pregunta, la utIlIdad de esta aprOXImacIón es lImItada (Smith, 1983/2002: 109).

El 38% de las 1.168 personas que respondieron a la encuesta se declararon usuarios de Wnet, con una media de 35 minutos por día. A efectos inferenciales, de generalización de estimaciones muestrales al conjunto de la población, se procede a ponderarla muestra ra "corregir" los desequilibrios entre los distintos grupos de población, debidos a la no resdiferencial. Los ajustes se hacen atendiendo a las dos variables más usuales, al esr presente en la mayoría de los marcos muestrales: género y edad. Los coeficientes de poneración obtenidos y su aplicación se incluyen en el cuadro 5.A.

esta

CUADRO 5.A. Ponderación de acuerdo con la distribución de la población (A) Población Ni

(B) Porcentaje población

(C) Muestra origina/(') ni

(O) Muestra final ni'

(E) (G) Porcentaje Coeficiente muestra ponderación final w¡(B/E)

(H) Usuarios Internet Ij

48.560 45.210 39.340 28.010

14,94 13,91 12,11 8,62

239 222 194 138

156 133 116 128

13,36 11,39 9,93 10,96

1,118 1,221 1,219 0,786

47.918 44.807 38.998 32.140

14,74 13,79 12,00 9,89

236 221 192 158

163 159 164 149

13,96 13,61 14,04 12,76

1,056 1,013 0,855 0,775

324.983

100,00

1.600

1.168

10,00

92

(1) wíxf¡

%(2)

46 13

58,97 67,67 39,66 10,16

102,86 109,89 56,07 10,22

95 71 33 4

58,28 44,65 20,12 2,68

100,32 71,92 28,21 3,10

444

38,01

482,59

90

)Afijación 'proporcion~lI: proporción que representa el estrato por el tamaño de la muestra a afijar (1.600 unidades). Porcentaje de usuanos de Internet respecto a la muestra final (P;): (ljln;) x 100. Por ejemplo, en varones de 18 a 35 años, (92/156) x 100 = 58,97.

El 49,58% de los 324.983 miembros de la población son varones (161.120/324.983 = Y el 50,42% mujeres (163.863/324.983 =0,5042). Pero, eh la muestra final los va~s han quedado subrepresentados, al haber registrado una mayor tasa de no respuesta, ~lIega a ser del 32,79% (1 - 0,6721 = 0,3279). En especial, los varones de 51 a 65 años. ha encuestado a 116 y deberían haber sido 194, siendo su tasa de no respuesta del ,g1% (1 - 0,5979 =0,4021). Por el contrario, las mujeres están sobrerrepresentadas, al ser t¡¡sa de no respuesta más baja en todos los grupos de edad. De los 1.168 encuestados, 54,37% son mujeres (635 / 1.168 = 0,5437) Y su tasa de no respuesta se redujo al 1,31% (1 - 0,7869 =0,2131). La no respuesta fue desigual por género y edad. Para remediar su incidencia se pondera muestra final para que mantenga la proporcionalidad de la población. Si bien, ha de insistirse que en el error de no respuesta no sólo incide la tasa de no respuesta (que habría que reir), sino también las diferencias entre respondientes y no respondientes (en acceso a Intemet). ••. De acuerdo con los coeficientes de ponderación, obtenidos dividiendo, en cada estrato, ¡porcentaje que representa en la población entre el porcentaje en la muestra, cada varón ~58)

En un municipio de 324.983 habitantes se realiza una encuesta para conocer el u~o de Internet. Se selecciona aleatoriamente una muestra de 1.600 personas, varones y mUJeres, de 18 y más años (para un errorde ±2,5% Y varianza máxima, P= Q= 50). Tras efectuar tres revisitas, en los respectivos domicilios, se obtiene una tasa de respuesta del 73% (1.1?8 respondientes y 432 no respondientes). Para reducir la tasa d~ ~o respuesta no se opt~ por la sustitución de los no respondientes, sino por ajustes estadlstlcos postencuesta mediante la ponderación. Ésta podría reducir el error de no respuesta siempre que no h~biese ~ifere~~ias entre respondientes y no respondientes. Es decir, en caso de error aleatOriO, no slstematlco.

375

uc


376

377

Capítulo 5: La administración del cuestionario

Métodos de encuesta

respondiente será tratado como si hubiese respondido 1,086 (49,58/45,63), mientras que cada mujer como si hubiese sido 0,927 (50,42/54,37). Si, en vez de utilizar la razón de porcentajes de población y muestra, se divide el número de personas en la población real entre el número de respondientes correspondientes, se obtienen las unidades de la población representadas en la muestra. Por ejemplo, cada varón que responde representa a 302,29 varones en la población (161.120/533:: 302,29). Por su parte, cada mujer representa a 258,05 mujeres de la población (163.863 / 635 :: 258,05). Tomando los coeficientes de ponderación que figuran en la columna G del cuadro 5.A, los grupos de población menos representados han sido los varones de 36 a 50 años (1,221 :: 13,91 / 11,39) Y de 51 a 65 años (1,219 :: 12,11 /9,93). En cambio, las mujeres de más de 65 años están sobrerrepresentadas en la muestra final (con un coeficiente de ponderación de 0,775), seguidas de los varones de más de 65 años (0,786). Cada mujer mayor de 65 años representa a 216 mujeres en la población (32.140/149 == 215,7) Y cada varón de ese mismo grupo de edad a 219 varones en la población (28.010/ 128 :: 218,8). " Para estimar la proporción conjunta de usuarios de Internet en la población, se procede a multiplicar el número de usuarios de Internet en cada estrato por su correspondiente coeficiente de ponderación, como se indica en la columna I del susodicho cuadro. Se suman todos los productos y se divide por el tamaño total de la muestra final, como expresa la fórmula a continuación. De acuerdo con ella, el porcentaje de usuarios de Internet estimado sería 41,32%, Y no 38,01 %, como se obtuvo en la muestra sin ponderar, es decir, sólo considerando a los respondientes I

..•...•. Tomando los datos del ejemplo anterior, se procede a ponderar la no respuesta, pero toando como referente la muestra original, la diseñada para la encuesta. En este caso se comfIJeba la desviación de la muestra final respecto a la original, debido a la incidencia desigual e la no respuesta. El coeficiente de ponderación es ahora proporcional a la inversa de la taa de respuesta. O sea, si la tasa de respuesta es igual al cociente entre muestra final (n~) y uestra inicial (n), el peso o coeficiente de ponderación en cada estrato (w) será igual a 1/tade respuesta. También, puede calcularse dividiendo la muestra inicial ~ntrela muestra fiElI, en cada estrato o grupo de población diferenciado. En el cuadro 5.8 se describe el cálWlo de los coeficientes de ponderación y su aplicación en la estimación de la proporción de uarios de Internet ('1), como en el ejemplo anterior.

a

CUADRO 5.B. Ponderación de acuerdo con la muestra original (1)

(A) Muestra original ni

(B) Muestra final n'I

(e) Tasa de respuesta (BI A)

(O) Coeficiente ponderación w¡ (A/B o 1/C)

(E) Usuarios Internet f¡

239 222 194 138

156 133 116 128

0,6527 0,5991 0,5979 0,9275

1,532 1,669 1,672 1,078

92 90 46 13

238.99 221,98 193,95 137,98

140,94 150,21 76,91 14,01

236 221 192 158

163 159 164 149

0,6907 0,7195 0,8542 0,9430

1,448 1,390 1,171 1,060

95 71 33 4

236,02 221,01 192,04 157,94

137,56 98,69 38,64 4,24

(F) (O x B)

w¡ x

n;

(O x E) w¡x

'¡

2:w¡ x r¡ P

= ;-1

=

n'

482,59 = 04132 1.168'

b) Ponderar de acuerdo con la muestra original. Otra alternativa de ponderación de la no respuesta muy practicada consisa la inicial o diseñada para

la encuesta. El coeficiente tra original entre la muestra final, en cada estrato o grupo diferenciado (de acuerdo a una o más variables conjuntas de clasificación. De manera que el peso de cada estrato sea proporcional a la inversa de su tasa de respuesta. En la ponderación según la población, era inverso a la probabilidad de selección. Los coeficientes obtenidos se aplican, igualmente, a todas las estimaciones muestrales. Si el coeficiente fuese mayor de "2", lo recomendable es -como indica Fuller (197412002: 423)- "combinar subgrupos para reducir la razón de 2 a menos". Para su realización se precisa conocer a qué grupo de población pertenecen tanto los respondientes como los no respondientes. A menos que se recabe esta información ex profeso, la práctica usual es utilizar la empleada para el diseño de la muestra, en su estratificación (género, edad, estudios, ocupación, hábitat). La ponderación será más exitosa cuanto más relacionadas estén las variables elegidas con el problema de investigación.

-.WS

--1~~

~ -t600,-1L

El coeficiente de ponderación ahora sólo depende de la tasa de respuesta. Como en togrupos de población, diferenciados por género y edad, la muestra final ha descendido de la inicial o la diseñada para la encuesta. Todos los coeficientes de ponderación son mayores de "1", pero ninguno supera el valor "2". El coeficiente más elevado (1,672) a los varones de 51 a 65 años, en los cuales la tasa de respuesta fue la más ba59,79% de la muestra original). El peso o coeficiente es proporcional a la inversa de de respuesta (1 /0,5979 == 1,672) o el cociente entre muestra original y muestra final /116 == 1,672). O sea, que cada encuestado varón de 51 a 65 años será tratado como 1,672 varones del mismo grupo de edad. El coeficiente más bajo corresponde a las JTlujeres de más de 65 años (1,060 == 1 /0,9430), al haber sido su tasa de respuesta la más ¡";ieleVél.da (se encuestó al 94,30% de la muestra original). Coeficiente que también puede ob~"""" ",1:1 dividiendo la muestra original entre la final en el estrato: 158 / 149 == 1,060.

-----==.=


378

Métodos de encuesta

Capítulo 5: La administración del cuestionario

Estos coeficientes se aplican, igualmente, a todas las estimaciones muestrales (multiplicándose por ellas), como si los no respondientes no difirieran de los respondientes, es decir que la no respuesta fuese aleatoria. De ello no se tiene plena certeza, al no tener información de los no respondientes. En el cuadro 5.8 se describe el proceso para estimar la proporción global de usuarios de Internet, ponderando la no respuesta como si ésta no hubiese existido (es decir, como si se hubiese encuestado a toda la muestra inicial). La estimación resulta ser, asimismo, del 41,32%. Cantidad que resulta de la siguiente fórmula, traduciendo la proporción en porcentajes.

661,20 1.600,16

=

0,4132

Se suman todos los productos de coeficiente por estimación muestral, en cada estrato o grupo de población, como en la ponderación anterior, aunque ahora se divide por el tamaño de la muestra original. No se olvide que mediante esta ponderación la información extraída de los respondientes se hace extensible a los no respondientes, como si no existiesen diferencias entre ellos.

c) Ponderar de acuerdo con la accesibilidad o disponibilidad de las unidades de la población: el método de Politz-Simmons. Este método de ponderación es calificado, por Moser y Kalton (1971: 178), como "ingenioso para resolver el problema de la no respuesta". Inicialmente fue sugerido por H. O. Hartley en 1946 (incluido en el artículo de F. Yates "Statistical developments in sampling and sampling surveys". Joumal ofthe Royal Statistical Society, A, 109: 12-43). Posteriormente, fue desarrollado por Alfred Politz y Willard Simmons en 1949 (en "An attempt to get the 'not-athomes' into the sample without callbacks". Joumal ofthe American Statistical Association, 44: 9-31), por cuyos nombres comúnmente se le conoce. La ponderación responde ahora a la "accesibilidad" o "disponibilidad" de las unidades de población. Disponibilidad que se define por el número de

días de la semana, previos al de la entrevista, que la persona se encontraba en casa en la franja horaria en la que se realiza el trabajo se campo. Suele ser las cinco tardes previas, normalmente en días laborables. Su aplicación precisa preguntar, a las unidades de la muestra, cuántos días, de los últimos seis, se encontró en casa a la misma hora. O sea, en las cinco tardes que preceden al día en que se le contactó. La probabilidad de estar en casa se obtiene de la siguiente división: (K + 1) / 6. Siendo K el número de tardes de las cinco precedentes. De modo que, una persona que haya estado en casa todos los días, la probabilidad de estar en casa es máxima: "1" {(5 +1) /6= 1}. Por el con-

379

trario, aquellos que no habían estado ninguno de los cinco días precedentes, su probabilidad es mínima. Exactamente "0,1667" {(O + 1) /6= 0,1667}. La muestra quedaría ahora estratificada en seis grupos, definidos por la "probabilidad de ser localizados en casa" por el entrevistador (en la franja horaria para el trabajo de campo): 6/6 = 1; 5/6 = 0,833; 4/6 = 0,667; 3/6 = 0,5; 2/6 = 0,333; 1/6 = 0)667. Conocida la probabilidad de estar en casa, se pondera por su inversa. Por ejemplo, 1 /0,1667 = 5,999. 0, igualmente por 6/6,6/5, 6/4, 6/3, 6/2 Y6/1. Éstos constituyen los pesos o coeficientes de ponderación. A aquellos que dicen haber estado en casa todos los días les corresponderá un menor coeficiente (1), mientras que quienes no han estado ninguno de los cinco días precedentes obtendrán el máximo coeficiente (5,999). Estos coeficientes se multiplicarán por las estimaciones muestrales, como en las ponderaciones precedentes.

Esta tercera modalidad de ponderación se asienta en el supuesto de que aquellos más difíciles de localizar en casa se asemejan a los finalmente "no contactados". Por esta razón, les corresponde el peso más elevado (prácticamente 6). El acierto de tomar a los menos accesibles en representación de los no accesibles por no contacto dependerá del grado de coincidencia entre ellos. No sólo de su perfil sociodemográfico, sino también en sus respuestas a las preguntas del cuestionario. En palabras de Fuller (1974/2002: 423), No hay ninguna razón a priori para creer que los no respondientes en cualquier caso habrían respondido a la encuesta de la misma forma que aquellos infrecuentemente en casa.

El sesgo dependerá, en consecuencia, de las diferencias habidas entre resy no respondientes. A menos que se haga un estudio ex profeso a prIOrI, no hay plena certeza de que los no respondientes se asemejen a los re~pondient:s .. Además, está el problema de la fiabilidad de la información que eXIge la practIca de esta ponderación: el número de días, de los cinco precedentes, que el encuestado estaba en casa, en una franja horaria concreta. Está afectada por su voluntad de facilitar dicha información, que puede considerar "intrusiva", y de la exactitud de su recuerdo.

p~nd~entes

Sudman (1976; 196612002) constata que los respondientes tienden a sobreestablecer su disponibilidad. Ello revierte, negativamente, en la obtención de muestras sesgadas y en su escasa aplicación en el tratamiento de la no respuesta. Éste se circunscribe, únicamente, en la no respuesta por "no contacto", eludiendo la debida a "rechazo". Traugott (1987) analizó datos de rellamadas en dos encuestas realizadas en Michigan en 1984 sobre preferencia por candidatos a la presidencia de Estados Unidos. La tasa de respuesta fue del 65%, un porcentaje habitual en encuestas electorales. Cerca del 21 % de la muestra respondió a la primera llamada telefónica. Se realizaron hasta 30 intentos


380

Capítulo 5: La administración del cuestionario

Métodos de encuesta

para localizar a la persona que no contestó a la primera llamada. Aquellos que tardaron más tiempo en responder fueron más varones, de más edad, y republicanos, en comparación con aquellos que contestaron pronto. En su opinión, Si quienes no contestan se parecen a quienes lo hacen tarde, se podría especular que es más probable que quienes no responden están a favor de Reagan. Pero quienes no lo hacen no necesariamente se parecen a los difíciles de contactar. Las personas que rehúsan terminantemente a participar pueden diferir en gran medida de las personas que no pudieron contestar de inmediato y es más probable que quienes no respondieron estén enfermos o alguna otra circunstancia impida su participación. Tampoco conocemos la probabilidad con la que quienes no contestaron la encuesta votarán en las elecciones. Incluso si especulamos que están a favor de Reagan, necesariamente no es más probable que voten por Reagan (Traugott, 1987: 260-261).

En suma, cualquiera de los métodos de ponderación para ajustar la no respuesta parten del supuesto de que los respondientes y los no respondientes son similares, siendo la no respuesta "aleatoria". Pero esto no necesariamente es así. Suele ser mayor en unos grupos de población que en otros, presentando un perfil sociodemográfico específico. Cuanto menos "representen" los respondientes a los no respondientes, más sesgadas serán las estimaciones de los parámetros poblacionales. Por esta razón, se aconseja el uso de la ponderación sólo cuando no se haya podido reducir la tasa de no respuesta por cualquiera de las actuaciones preventivas descritas en el subapartado 5.3.2.l. Asimismo, recuérdese que una tasa de no respuesta elevada implica la pérdida de representatividad de la muestra. Aunque se haya aplicado un muestreo probabilístico, en la selección de las unidades de la muestra, ésta puede realmente no ser probabilística, cuando la no respuesta es elevada. Y, cuando quiera que se aplique una ponderación, ha de quedar ésta especificada en el informe de la encuesta. Lo mismo es extensible a los otros ajustes estadísticos postencuesta de la no respuesta: la imputación.

381

• El entrevistador. No formula la pregunta; la formula, pero no registra la respuesta; o la anotación que hace de ella es ambigua o poco clara, lo que lleva a eliminarla del análisis. • El encuestado. No emite una respuesta "válida", bien por desconocimiento ("no sabe"), bien porque no quiere darla, o bien por considerarla comprometida. . También, puede deberse a su deseo de finalizar cuanto antes de contestar al cuestionario, r~spondiendo "no sé" o la primera ;espuesta que ~e le ofrezca, para no perder tiempo pensando en una respuesta. Respuestas inconsistentes en preguntas relacionadas lleva, igualmente, a la eliminación de la respuesta. • En la codificación y posterior grabación de las respuestas en el ordenador. La introducción de un valor "inválido" propicia también su eliminación. En gene.ral, los "no sabe" suelen reflejar duda o ambivalencia por parte del enestado, mientras que los "no contesta" se atribuyen, normalmente, a fallos en el dio del cuestionario y a una actuación deficiente por parte del entrevistador (cuan2ést~ media en su aplicación). Pero los no contesta también se registran en preguntas 9 aplicables. Es decir, aquellas que se hacen a una parte de la muestra y no a todos sus tegrantes (preguntas filtro). Por ejemplo, preguntas referidas a relaciones con los hi~' que únicamente se formulan a personas que tienen hijos. La inclusión de datos incompletos en el análisis repercute en la sobreestimación de .errores típicos de los coeficientes de las variables afectadas. Lo cual influye, neÍl.vamente, ~n la signi.ficatividad de las estimaciones muestrales. En su resolución hay llas actuacIOnes posIbles, que van desde su eliminación del análisis hasta la impupión. La opción a aplicar dependerá de la conjunción de los factores siguientes: el tam~ño de la muestra, la proporción que en ella representen los datos incompletos, si és!PS afectan a una o a varias variables, y si están distribuidos de forma aleatoria. ......... Cuando la proporción de datos incompletos (o sin respuesta) es pequeña, en un ta~eo mue~tr~l el~;ado, y é~t?~ se distribuyen de forma a~e~toria, la mejor opción pue~~er su eliminaClon del análisIs. Pero, cuando estas condIClones no se cumplen, la apli~

'~~-.t'

12.-

Por imputación se entiende la "asignación de valores" a los casos en los que falten. Normalmente de respondientes que se asemejan a los no respondientes. Para lo cual se consideran otras variables en las que sí han proporcionado respuesta. Puede utilizarse en el ajuste de la no respuesta total (o de unidad) y de ítem (o pregunta). Si bien, su aplicación se identifica más con esta última. La no respuesta de ítem está muy relacionada con el error de medición, pero también con otros errores de encuesta. En concreto con:

••.. ue puede suponer una reducción drástica del tamaño de la muestra, que haga pe.(i,rla validez estadística (la posibilidad de inferencia) de los datos de encuesta. Y, sendo, porque puede conllevar la obtención de resultados sesgados. La reducción del tamaño de la muestra original es más drástica, cuantas más va~bles se incluyan en el a.nálisis y no coincidan los casos sin respuesta en todas las fiables. Según estimaciones de Jaccard y Wan (1996), la disminución en el tamuestral puede llegar a suponer su reducción a la mitad, cuando se incluyen variables y cada una de ellas tiene, al menos, un 5% de sus valores sin res-

• El diseño del cuestionario. Principalmente, con cuestionarios largos y complejos; con muchas preguntas abiertas, más vulnerables a la no respuesta de ítem; con preguntas filtro mal identificadas, que producen un seguimiento erróneo en el orden de formulación de las preguntas; y con preguntas mal redactadas, que dificultan su comprensión.

eliminación de los casos sin respuesta también se desaconseja cuando su dis)ltibuci.ón en la muestra no sea aleatoria. Que la no respuesta se dé más en unos casos ··Cóm~retos que en otros, ajustándose a un perfil sociodemográfico específico que le disde quienes emiten respuesta.


382

Métodos de encuesta

Por ejemplo, cuando personas de distintas categorías profesionales no declaran igual-

mente sus ingresos mensuales (aquellos de categoría superior muestran mayor reticencia a su declaración que los de categorías inferiores) no se está ante una no respuesta aleatoria. La eliminación de estos casos del análisis supondrá, salvo que representen una baja proporción en el conjunto de la muestra, la obtención de resultados sesgados, además de estimaciones de parámetros poblacionales inconsistentes. Por esta razón, se recomienda que, antes de eliminar los casos sin respuesta, se compruebe si quienes no aportan información coinciden en un mismo perfil sociodemográfico. De ser así, habrá que desestimar su eliminación y optar por otro remedio ante la no respuesta. La eliminación de casos más radical, la hasta aquí descrita, es la llamada eliminación por lista ("listwise deletion"). Supone la eliminación del caso cuando éste no ha respondido a alguna de las preguntas del cuestionario, aunque haya respondido al resto. Otra forma de eliminación, menos radical y más practicada, es la conocida como eliminación por pares ("pairwise deletion"). Para el análisis de los datos, se eliminan únicamente los casos sin respuesta en la variable que se analiza. Su eliminación del análisis no implica su eliminación de otros análisis en variables en las que sí ha proporcionado respuesta. Por lo que supone una menor disminución en el tamaño de la muestra analizada. Ésta es su gran ventaja, respecto a la eliminación total del caso (listwise deletion), además de atenerse sólo a las respuestas dadas. Pero cualquier procedimiento de eliminación sólo debería aplicarse cuando coincidan los tres requisitos mínimos de: tamaño muestral elevado y/o baja proporción de casos sin respuesta, junto con una no respuesta aleatoria. De no ser así, habrá que optar por alguno de los procedimientos de imputación. Los de uso más común son: a) Imputar por la media. Es decir, "reemplazar" los valores sin respuesta por la media de los valores observados en la variable afectada, antes de pn::>cé~der al análisis. Esta imputación es una de las más populares. No afecta a la dia muestral de la variable, aunque sí a su variabilidad. Disminuye su varianza, lo que resulta en niveles reducidos de asociación entre las variables afectadas. , b) Tomar los valores de respuesta dados por otros casos que han proporcionado res" puestas similares en otras variables. A los casos sin respuesta se les atribuye la da por otros individuos de similares características, que han emitido las mismas respuestas que ellos en otras preg~ntas. Esta imputación se ll~ma "hot de~k" (o de cubierta caliente). Supone duplicar la respuesta del respondIente con el nesgo que ello comporta. Aunque la no respuesta se reemplace por valores aleatorios dentro del rango de valores de la variable en cuestión (se toman valores d~ respondientes elegidos al azar entre los similares a los no respondientes), esta atnbución de respuesta es más arriesgada que la anterior. Individuos de características similares no tienen por qué ser plenamente coincidentes.

Capítulo 5: La administración del cuestionario

383

Una variación es la imputación del vecino más próximo. El valor imputado se toma del respondiente "más próximo" al no respondiente, de acuerdo con la medida de distancia que se aplique. La imputación es, en consecuencia, no aleatoria, sino determinista. Predecir cuál habría sido la respuesta del individuo, a partir de sus respuestas a otras preguntas del cuestionario. Generalmente mediante un análisis de regresión que prediga el valor que corresponderá a dicha variable, considerando sus respuestas en otras variables. Por ejemplo, predecir sus ingresos no declarados en la encuesta, considerando su resp~e~ta en variables relacionadas con ingresos: nivel de estudios, ocupación, edad, género,

habltat u otras que se estimen relevantes.

/ Ésta es la solución má~ sofisticada y, de acuerdo con Afifi y Clark (1990), la mas deseable, cuando eXIstan correlaciones elevadas entre las variables. A su favor est~ el imputar respuesta en función de la dada, por el mismo sujeto, ~n ot~~s vanables. Pero ello no la libera de la introducción de sesgos en la estU?aClOn de los parámetros poblacionales, como sucede en los otros procedimIentos de imputación.

[ Para ilustrar los efectos de la imputación en los resultados de encuesta, se extracta la resesta a. uno .de los indicadores incluidos en la dimensión "asimilación cultural", incluido en ~cuestlonanos de los Eurobarómetros 47.1 (de 1997) y 53 (de 2000). Este último analizado P;rSORA .(Ins~itute for S?cial Research and Análisis, de Viena) en 2001, Ytitulado Attitudes pwards mmonty groups m the European Union. En el cuadro s.e se ofrecen los resultados ~. nyeve de los países .que integraban la Unión Europea en aquellas fechas. En él puede .ns,tatarse, para una m~sma fecha, 1997~ los distintos porcentajes de acuerdo, dependiendo !:l.SI los dato~ son o no Imputados. Las diferencias porcentuales apenas son perceptibles en ~I~es con baja tasa de no respuesta (como los Países Bajos o Italia). Pero donde la no res~~ta fue más elevada las diferencias porcentuales son mayores. En Portugal o Bélgica es siete puntos porcentuales. En general, la estimación del porcentaje de acuerdo en este indicador de asimilación culral extrema es inferior tras la imputación que cuando sólo se analizan los casos con resuesta. ¿Qué datos son mejores? El lector ha de juzgarlo, teniendo en mente la regla estade no "imputar" cuando la no respuesta en la pregunta supere el 5%, por el efecto g1sltors,ionladcx que supone su práctica. La no respuesta fue del 14% en 1997 y del 12% en


384

Métodos de encuesta

Capítulo 5: La administración del cuestionario

CUADRO 5.C. ítem de asimilación cultural (% de acuerdo)

País

"Para convertirse en miembros plenamente aceptados de la sociedad, la gente que pertenece a los grupos de minorías debe abandonar su propia cultura" 1997(1)

1997(2)

2000(2}

España Portugal Italia Grecia Alemania Francia Bélgica Países Bajos Reino Unido

17 27 10 34 26 32 44 26 26

14 20 9 30 20 29 37 25 21

17 25 12 35 24 28 36 29 23

Total Unión Europea

25

21

22

(1) Datos no imputados del Eurobarómetro 47. 1. (2) Datos imputados extraídos del informe del Eurobarómetro 53.

La no respuesta no fue aleatoria. Mayor en las mujeres, de 65 y más años, jubiladas y amas de casa, en la generalidad de los países de la Unión Europea, exceptuando Luxemburgo. Para la imputación se aplicó el procedimiento de maximizar lo esperado, al no estar los casos sin respuesta distribuidos aleatoriamente. Implica una serie de iteraciones hasta que se alcanza la serie más completa de datos. La no aleatoriedad de la no respuesta provoca que los países con un elevado porcentaje de casos sin respuesta presenten sesgos sistemáticos, a diferencia de los países con una mínima tasa de no respuesta. También se hizo uso de la ponderación para corregir características no representativas de la muestra, en relación con la población de estudio. En variables como edad, género y país, ----enlos en-·osque-sec·- .... --. . ' .. . -.,

·casos

Los procedimientos de imputación aquí destacados son los de uso más común. Cualquiera de ellos ofrece la ventaja principal de no reducir el tamaño de la muestra original. Hecho que adquiere una relevancia especial en situaciones de tamaño muestral pequeño y/o una elevada proporción de casos sin respuesta. Ello afecta, positivamente, a la reducción del error muestral (variable) y a la consiguiente significatividad estadística de los datos de encuesta (como se vio en el capítulo 3). Pero no se olvide que se trata de respuestas "imputadas", no de respuestas "reales", que tendrán tratamiento de valores observados "reales", con el riesgo que supone en la interpretación de los resultados de la encuesta. Por ello, la recomendación más extendida es que, cuando se imputen respuestas, se distingan los casos con valores "reales" de aquellos con valores "imputados".

3~5

El mayor peligro del uso de la imputación es que un análisis futuro de los datos no distinguirá entre los valores originales y los asignados. Lo ideal es que quien realice la imputación registre cuáles fueron las observaciones asignadas [...]. Los valores imputados pueden ser buenas estimaciones, pero no son datos reales (Lohr, 2000: 276). La mejor imputación es la que no se hace. Esta frase podría resumir nuestra opinión sobre la imputación [...]. Hemos de indicar lo delicado del procedimiento, que exige un estudio detalladq, de cada situación antes de decidirse por imputar valores y elegir el procedimiento más adecuado. En cualquier caso, si finalmente nos decidiéramos por imputar, siempre es conveniente distinguir entre los casos que tienen valores reales, declarados por el entrevistado, y aquellos que tienen valores imputados (Sánchez Carrión, 1999: 280).

Además, sólo debería imputarse cuando la no respuesta de ítem no supere el Con ello se evitarían datos de encuesta sesgados. Pero esta regla rara vez se cumComo indican Biemer y Lyberg (2003: 114), "hoy día la imputación se lleva a caen series de datos que contienen porcentajes de no respuesta incluso superiores". 'Al igual que la ponderación, la imputación parte de la consideración de la no res. . •. sta como aleatoria. Cuando, en realidad, rara vez lo es. De Leeuw (200112002), por jemplo, muestra que la edad del respondiente y su nivel educativo correlacionan, de 'anera consistente, con la no respuesta de ítem. Lo que de nuevo lleva a reiterar la neesidad de intensificar los esfuerzos dirigidos a aumentar la tasa de respuesta previo la conclusión del trabajo de campo (subapartado 5.3.2.1), más que en aplicar ajustes tadísticos postencuesta, ya mediante la ponderación, ya a través de la imputación. Por uy perfecto que sea el ajuste estadístico, siempre supondrá la introducción de algún esgo en las estimaciones de los parámetros poblacionales. Se sobreestiman las resgestas de los "respondientes" en representación de los "no respondientes", sea o no a correspondencia cierta. Mejoras en el diseño del cuestionario y en su aplicación, mo una mejor formación y supervisión de los entrevistadores, ayudará a reducir los rores de no respuesta y los de observación o medición. En especial, los debidos a la tervención del entrevistador (en encuestas no autoadministradas), al encuestado y al . . ., s o-último_se_tr.ata_en d~ uiente ca ítulo.

LECTURAS COMPLEMENTARIAS Vaus, D. (comp.) (2002): Social surveys. Sage. Londres. de Rada Igúzquiza, V. (2000a): Problemas originados por la no respuesta en la investigación social: definición, control y tratamiento. Universidad Pública de Navarra. Navarra. J. H. Y Oishi, S. M. (1995): How to conduct interviews by telephone and in persono Sage. Thousand Oaks, California. }}\;Jrmles. R. M. y Couper, M. P. (1998): Nonresponse in the Household interview surveys. Wiley-Interscience. Nueva York.


386

Métodos de encuesta

Capítulo 5: La administración del cuestionario

Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, c.; Schwarz, N. y Trewin, D., (comps.) (1997): Survey measurement and process quality. John Wiley and Sons Inc. Nueva York. Manzano, V:; Rojas, A. J. Y Fernández, J. S. (1996): Manual para encuestadores. Ariel Practicum. Barcelona. Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Meléndez, C. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid. Sánchez Carrión, J. J. (2000): La bondad de la encuesta: el caso de la no respuesta. Alianza. Madrid.

EJERCICIOS PROPUESTOS 1. Destaque las contribuciones principales del entrevistador a los errores de encuesta, junto con las actuaciones para su prevención y corrección. A ser posible, en un cuadro sintético. 2. ¿Difiere la supervisión del trabajo de campo en cada método de encuesta? J ustifique la respuesta e indique qué debe primar en cada método para mejorar la calidad de la encuesta. 3. ¿Qué factores determinan más la participación en la encuesta? Señálense en consonancia con la investigación empírica más reciente. Para cada uno de ellos, dígase qué debería hacerse para reducir la tasa de no respuesta. 4. Se desea conocer el número de horas por término medio que los niños en edad escolar ven la televisión a la semana. A tal fin, se realiza una encuesta mediante entrevista personal a padres, obteniéndose que, en los días laborables, sus hijos ven la televisión una media de 1 hora y 20 minutos. La tasa de no respuesta fue del 29,7%. Tras el seguimiento telefónico de los no respondientes, la media se eleva a 2 horas y 15 minutos. Calcule el error de no respuesta e interprete la disparidad en los resultados. 5. En un municipio de 916.347 habitantes se realiza una encuesta cara a cara (en los domicilios de los encuestados) para conocer el grado de satisfacción con la política municipal. La muestra la integran 1.372 personas de 18 y más años, de ambos sexos (para un error de ±2,7% y máxima heterogeneidad, P = Q = 50). La tasa de respuesta fue del 68% (933 respondientes y 439 no respondientes). Pondérese la muestra de acuerdo con la población de estudio y la muestra original, teniendo en cuenta la información disponible en el cuadro adjunto.

387

Población

Muestra Inicial

Muestra final

Satisfechos con la política municipal

Varones 18 - 30 31 - 50 51 - 65 Más de 65

115.407 139.394 101.998 73.448

173 209 153 110

122 129 95 86

73 87 68 65

Mujeres 18 - 30 31- 50 51 - 65 Más de 65

121.308 136.407 129.001 99.384

181 204 193 149

139 143 130 89

90 104 101 73

Total

916.347

1.372

933

661


EL TRATAMIENTO DE LA INFORMACIÓN

!trabajo de campo da paso a la explotación analítica de los datos recabados mediante Ilcuesta. De ellos se quiere extraer la máxima información posible y que satisfaga los J:>jetivos del estudio. Comprende las fases preparatorias de los datos para el análisis ~dición, codificación, grabación) y las propiamente analíticas, desde la vertiente esádística e interpretativa de los resultados de encuesta. Esta fase es igualmente clave su desarrollo y tampoco está exenta de errores, que pueden nublar los esfuerzos re..... ados en estadios anteriores. Asimismo, los errores habidos con anterioridad, de no pservación y de medición, tienen su correspondiente repercusión en la "significatiyidad" de los resultados que de los análisis se extraigan. Una reflexión sobre la calidad de los datos de la encuesta es exigida para mejor coócer el alcance "real" de la información que de ella se deduzca. Por esta razón, en esúltimo capítulo se incluye un apartado referido a la calidad de la encuesta y a su evaCion. 's s' .. , , , . . . .,

opiamente, y precede al apartado final referido al informe de la encuesta. El informe mple la función de presentación del esfuerzo de investigación llevado a cabo. Es el Jg40cllm1en1:o que ha de dar constancia de las distintas fases en el desarrollo de la en<l;UleSla. de sus aciertos y desaciertos, junto con su repercusión en la interpretación de inJfofimacióln que se divulga. Como representa la síntesis del ejercicio de investigación, cullminaldón, a él se dedica el último apartado del libro.

La preparación de los datos para sn análisis Tras rellenarse los cuestionarios procede su chequeo y preparación para el análiEsta fase en el proceso de encuesta agrupa distintas actuaciones encaminadas a la


390

Capítulo 6: El tratamiento de la información

Métodos de encuesta

"depuración" de los datos brutos contenidos en el cuestionario para posibilitar su análisis estadístico. Desde la edición o primera inspección de los datos, la codificación (de preguntas abiertas), la grabación de los datos (si la encuesta no se ha hecho mediante alguno de los modos informatizados), el cálculo de pesos o coeficientes de ponderación (que logren equilibrar la muestra con respecto a la población de estudio, por errores de no observación: no cobertura, no respuesta y de muestreo), la imputación (cuando ésta se elija como estrategia de corrección de los errores de no respuesta) y la inspección exploratoria de los datos grabados para su posterior tabulación, que dará o no pie a análisis estadísticos más complejos. En cada una de las actuaciones mencionadas pueden producirse."errores" que deterioren, igualmente, la calidad de la encuesta. Puede haber errores de codificación (que ésta no se ajuste al procedimiento prescrito), de grabación de los datos (que se introduzcan códigos de respuesta incorrectos), de asignación de pesos, de tabulación. Errores que tratan de paliarse con la creciente automatización del procedimiento de encuesta y que no siempre son reconocidos en la comprobación de la calidad de los datos de encuesta.

391

La fase de edición comprende los distintos procedimientos dirigidos a la detección

:"oe datos erróneos para su corrección antes de comenzar a operar en ellos. En la en-cuesta convencional, de lápiz y papel, los cuestionarios se inspeccionan en busca de resuestas erróneamente registradas para paliarlas antes de su grabación en el programa : stadístico al uso. En el capítulo 5 se destacó la conveniencia de que el entrevistador, an:c~es de dar por concluida la entrevista, revise todo el cuestionario, por si ha omitido algllna pregunta, ha anotado erróneamente una respuesta o ésta no es consistente con :i'9tra~ dadas en preguntas relacionadas. Es preferible hacer esta rápida inspección en prersencIa del encuestado, porque permite contrastar con él cualquier error o duda que se :':_ªetecte y solicitarle cualquier aclaración sobre sus respuestas. En los modos informa:\fizados de encuesta algunos de ~os errores en la cumplimentación de los cuestionarios ::;,/son advertidos en el curso de la misma entrevista, como se indicó en el capítulo 2. '.' . Por su parte, los supervisores o el personal responsable del trabajo de campo han inspeccionar los cuestionarios antes de darlos por válidos y remitirlos al personal ende su grabación informática. Preguntas sin respuesta y respuestas no clara·:~>I!~f)'~{ié);,~rj~:~~J;i:"~~~jnte especificadas o ambiguas han de ser resueltas para no descartarlas de los anáestadísticos, ya remitiéndoselas a los entrevistadores, ya poniéndose en contacto or,.. '~:telet(J~nl(~O o personal) con los propios encuestados. De ahí la necesidad de incluir en cu~stionarios un apartado dirigido a la identificación del entrevistador y del en'C,,'·····••·ciue:sra1oo. Los cuestionarios en los que se detectan errores graves en su cumplimen~I,A."'JL'-' deberían descartarse, a menos que dichos errores pudieran resolverse con los afectados antes de los análisis. En la encuesta por correo los fallos en la cumplimentación de los cuestionarios de-,,.,.-<0 ..._- igualmente solucionarse preguntando al encuestado, más habitualmente por teAunque co.nlleve un incremento de los costes de la encuesta, en tiempo y dipued~ redUCIr errores de no respuesta tanto de ítem (al no darse por inválidas :,;pJre~:untas Sl~ respue~ta. o aquellas con un~ respuesta errónea), como de unidad (porno tendna que elirnmarse todo el cuestIonario por estar en blanco en su mayor par".'~ escasas preguntas respondidas, o no poderse resolver errores apreciados en las ",,'~u.J.J."'("''' contestadas). Con la grab~ción de las .respuestas en la matriz de datos, mediante el código nue.'.> . :--:--_._-- a ellas aSIgnado, prOSIgue la inspección o revisión de las respuestas y la posterior t<>.·.llevurC4~ctóln de los datos. Se comprueba si el código dado a la respuesta pertenece al rande valores posibles. ': ... ,'.,' ... (."' .......a.I-....... _.""

Los datos pueden ser modificados ampliamente durante el procesamiento de los datos y puede ser una fuente importante de error no de muestreo [...]. A pesar de su potencial para influir en los resultados de la encuesta, el error del procesamiento de datos se considera por muchos metodólogos como relativamente no interesante (Biemer y Lyberg, 2003: 219). Tanto la calidad de los datos como su accesibilidad descansa, en gran parte, en el procesamiento de los datos y en la creación de ficheros. De hecho, probablemente en ningún estadio en el proceso de encuesta existe una mayor oportunidad de que un error realmente horrible se cometa durante la preparación de los datos (Davis y Smith, 1992: 60).

"Horrible" en la medida en que puedan traducirse en errores sistemáticos de encuesta, que, como ya se ha ido viendo, son los que más deterioran la calidad de la encuesta. Y ello porque normalmente esta fase preparatoria de los datos recae en unas pocas manos. A diferencia de otras, como el trabajo de campo, en las que los errores de medición debidos al entrevistador suelen en parte compensarse con la mayor presencia de entrevistadores, que contribuyen a su conversión en errores variables. Su mayor número incide en que sus efectos negativos por su mediación en la recogida de información afecte a un menor número de cuestionarios. Además, no todos los errores de grabación o de codificación son fácilmente perceptibles.· Lo que ha de llevar a incrementar los esfuerzos de control en la ejecución de esta fase de la encuesta para que disminuyan los errores de medición debidos al tratamiento de los datos. De la ponderación y de la imputación ya se ha hablado en los capítulos 5 y 3. De la codificación, en el capítulo 4. Para no ser redundante, este último capítulo se limita a la exposición de lo no dicho con anterioridad. Para lo excluido se recomienda la relectura de los capítulos precedentes.

..···.c·, .•

......

., ·IJ.&.

'-'1J.a.,-,u

o."

.. '> ...

.... "''-''&''&'

"';:" ...•""'&'

Por ej:~plo, en la va~able "sexo" (1 varón, 2 mujer, 9 no contesta), ante cualquier valor n~merl.co grabado ?lferente a los especificados (3, 4, 8 u otro), habrá que revisar el c~~st.l0nan~ ~ara ver SI es posible su corrección, porque se deba a un error en la grab~cIon InformatI~a de.la respuesta. Asimismo, si sólo se encuesta a personas de 18 y más a~os, toda edad InferIor a 18 habrá de revisarse en el cuestionario original para corregIr el error de grabación.


392

Capítulo 6: El tratamiento de la información

Métodos de encuesta

Los errores pueden deberse a fallos en la introducción de los datos en el ordenador (fallos de teclado). Pero, también, pueden ser ocasionados por deficiencias en la recogida de información (la anotación errónea de la respuesta en el cuestionario). Estos últimos son más difíciles de corregir e incluso de detectar, cuando el código de respuesta grabado pertenece al rango de valores numéricos posibles en la pregunta. Por ejemplo, se ha encuestado a un varón pero, en la matriz de datos, o incluso en el mismo cuestionario, se ha anotado el código de respuesta correspondiente a mujer. Igualmente, la persona tiene 43 años y la edad grabada ha sido 34.

Lo mismo sucede con los errores de grabación que responden a fallos en la cumplimentación de los cuestionarios y que no fueron detectados en sus revisiones previas. Su corrección ahora es más difícil porque requiere contactar de nuevo con el encuestado para volverle a formular la pregunta. Cuando esto no es posible, o viable, el error de grabación se traduce en error de no respuesta total, cuando se elimina todo el cuestionario, o de ítem, si se le asigna el código numérico correspondiente a la no respuesta. Éstos se sumarían a aquellos que originariamente no respondieron a la pregunta, incrementándose la tasa de no respuesta. Cuando unos casos específicos presentan muchas preguntas sin respuesta (valores perdidos: los "missing values"), suele decidirs~ su exclusión de los análisis, salvo que al investigador le interese su estudio. Igualmente, preguntas con una elevada tasa de no respuesta también pueden descartarse de los análisis. Si se opta por su corrección, mediante ajustes estadísticos con coeficientes de ponderación y/o alguna de las modalidades de imputación, estas medidas correctivas de errores de no observación se incluyen en esta fase preparatoria de los datos de encuesta. También, los correspondientes a la detección de atípicos (los "outliers"), aquellos casos que se distancian del conjunto de la muestra que se analiza. Para cualquiera de las actuaciones incluidas en la depuración de los datos, son de gran ayuda los análisis univariables exploratorios (ver su distribución de frecuencias absolutas y re atlvas, su no respues a, o ' . .. ., ficas) y de cruce de variables. Pueden detectarse errores de grabación contrastando respuestas de preguntas relacionadas. Por ejemplo, que la edad de la madre sea inferior a la del hijo. Y del análisis cruzado de preguntas filtro. Que la persona figure como no usuaria de Internet y, en cambio, haya respondido a preguntas sobre acceso a Internet. La depuración de los datos es la antesala del análisis, cuyas potencialidades se incrementarán cuanto más rigor se ponga en sus preámbulos. Los análisis exploratorios ayudan no sólo a la detección de errores, sino también al conocimiento de la distribución de los datos que quieren analizarse. De ellos se desprenden decisiones relativas al tratamiento estadístico de la no respuesta, de transformación de las variables mediante su recodificación (agrupando o alterando sus categorías de respuesta) o la creación de nuevas variables (mediante la agrupación de dos o más de ellas). También, la búsqueda de los análisis estadísticos que más se adecuen al tamaño y composición de la muestra (los casos analizados), a las variables y a los objetivos de la investigación.

393

6.1.2. Codificación de las respuestas

La codificación de los cuestionarios es frecuente hacerla previo a la grabación de los cuestionarios, como se dijo en el capítulo 4. Pero la recodificación de las respuestas a preguntas abiertas o cerradas se posterga a la fase de preparación o depuración de los datos para el análisis. "

Por ejemplo, la codificación de la pregunta abierta: ¿Cuál es/era su actual/última ocupación u oficio? Es decir, ¿en qué consiste/consistía específicamente su trabajo? (Precisar lo más posible las actividades realizadas, EJEMPLO: mecánico, reparador de automóviles, ayudante de odontología, profesor de enseñanza primaria, etc). Nos referimos a su ocupación principal: aquella por la que Ud. (o el cabeza de familia) obtiene/obtenía mayores ingresos.

Esta pregunta la incorpora el Centro de Investigaciones Sociológicas (CIS) en la mayoría de los cuestionarios donde la ocupación actúa de variable de clasificación. Para su codificación aplica los códigos CNO (Clasificación Nacional de Ocupaciones) de 1979. Éstos van desde los códigos 011 (Químicos) hasta 999 (Trabajadores no clasificados en otros grupos primarios: peones). El primer dígito corresponde a grandes grupos ocupacionales (0/1 Profesionales, técnicos y similares, 2 Miembros y personal directivo de órganos de la Administración Pública y directores y gerentes de empresas, 3 Personal de servicios administrativos y similares, etc). El segundo y el tercer dígito a categorías específicas de cada grupo. En esta fase de la encuesta se procede a su recodificación en un número inferior de categorías en función de la frecuencia de las respuestas (obtenida tras la grabación de los datos y el análisis exploratorio de los mismos, de sus frecuencias). La codificación puede hacerse de forma manual o mediante ordenador (CAC: Computer-Assisted-Coding). Aunque esta última aún tiene escaso desarrollo, pese a sus beneficios económicos (de menor coste económico y temporal que la codificación ma, . nua y e c n dificaciones pueden darse errores. Los errores de codificación se deben a la introducción de un código de respuesta incorrecto. Atribuidos a una mala formación del personal que graba los códigos de respuesta, que no aplican adecuadamente las reglas de codificación, por mal entendimiento o por despiste. También, pueden deberse a deficiencias en la codificación diseñada, que no abarca todo el abanico de respuestas posibles a la pregunta abierta. Lo cual favorece la confusión ante qué códigos aplicar a respuestas no claramente especificadas en el libro de códigos, y la pérdida consiguiente de uniformidad en la codificación de todos los cuestionarios, cuando son varias las personas que en ella participan. Un codificador concreto puede, por despiste o desconocimiento, codificar erróneamente ingenieros técnicos como ingenieros superiores o a la inversa, por ejemplo, provocando un error en la codificación. Si este error se ha producido en unos pocos cues-


Capítulo 6: El tratamiento de la información

394

395

Métodos de encuesta

tionarios, apenas será perceptible y se convertirá en error variable, cuando"sea contrarrestado por la actuación de otros codificadores. Pero, si afecta a un ~ran numero ~e cuestionarios, propiciará la sobrerrepresentación "errónea" de deterffilna~a~"profesIones en la muestra analizada y la consiguiente subrepresentación de otras, convIrtIendose en error sistemático. Éste mucho más perjudicial para la calidad de la encuesta.

La reducción de los errores de codificación pasa por la exigida supervisión de la actuación de los codificadores y su debida preparación, que evite lo's errores debidos a desconocimiento. Han de recibir unas instrucciones muy claras de qué códigos aplicar ante qué respuestas. En las preguntas cerradas, los códigos suelen figurar en ~l cu~s­ tionario. En las preguntas abiertas, en el libro de códigos elaborado al ef~cto. Este I~­ cluye los códigos a aplicar a las distintas opciones de respuesta, mantemendo la dISposición de la pregunta en el cuestionario. Deberían d~s~artarse, a menos que se revisen, códigos de respuesta aplicados en encuestas sImIlares, que compa:tan la misma pregunta. Ante una misma pregunta abierta las respu~stas pueden vanar, dependiendo de la población que se encueste y del contexto soclOtemporal en el que se desarrolle el estudio. De acuerdo con estimaciones de Biemer y Lyberg (2003), los errores de codificación pueden llegar a niveles del 20%, en algunas preguntas, especialmente si ~l personal de codificación no está bien formado. Campanelli y colaboradores (1997) relacIonan los errores de codificación con la conjunción de varios factores adversos: el tipo ?~ pr~~u~ta, la naturaleza de las respuestas, la longitud y adecuación del marco de CodIflcacIo~, Junto con la formación y la supervisión. ~e los cocJ.!ficadores. Todos ,ello.s afectan. a l~ .ca1w.ad de la codificación, cuya comprobaclOn es ha~Itual ha~erla en ~enmnos d~ ftabzl!d~d. comprobar el grado al que dos codificadores mdepe?dIentes aSIg~an el1ll1smo cod~go. Esta comprobación valdría, no obstante, para reduclf errores debIdos a u~a mala mterpretación de las respuestas y los código~ a a~ignar. ~o .para aquellos ocaslO~~do~por despistes o fatiga ante una tarea tan rutmana y preCIpItada como es la codiflcacLOn. Los ficheros de datos del CIS, en especial aquellos que datan de principios de los años noventa y anteriores, no solían someterse a procesos de depuración,.ante la" ~ifi­ cultad de aplicar los "controles" ahora má~ posibles por ~os ~vanc~~ de la InformatIca. Por ejemplo, en la primera encuesta de actItudes ante la Inmlgraclon ~e 1990 los errores de grabación por mí detectados (porqiIe en muchas preguntas habla respuestas que no se ajustaban al rango de valores preestablecidos en la codific~~i~n de l~ pregunta) fueron tan numerosos que impidieron que la incluyera en el anahsls conjunto de las encuestas de actitudes ante la inmigración (Cea D'Ancona, 2004b), no así los sondeos posteriores, de 1991 en adelante.

6.1.3. Grabación de los datos

Los cuestionarios correctamente cumplimentados y "supervisados" se graban en el ordenador, siempre y cuando la encuesta no haya sido automatizada, coinci-

,._ 1 ••

LJLI~'-'

la grabación con la recogida de información. La grabación puede ser manual,

·."·~~rllIl)¡nlrp el teclado de ordenador. Ésta es la forma más usual hasta la fecha, aunque

vez van teniendo· mayor presencia los modos automatizados de grabación, escáner, fibra óptica e, incluso, la grabación oral (VRE: Voíce Recognítíon

11l\.... U.L.u.I..I."v

Para que puedan escanearse los cuestionarios, éstos han de presentar un formato permita su grabación y la traducción de las imágenes grabadas en calegibles por el ordenador. Esto último facilitado por la tecnología ICR (~Yf"lntlelllf!el1[ Character Recognition) y OCR (Optical Character Recognition). A ello suman los recientes avances en transmisión facsímil de e-mail (correo electrónitravés de Internet y de intercambio de datos electrónicos (EDI). Todo lo unido a los modos convencionales de encuesta automatizada (CAPI, CATI, descritos en el capítulo 2, está contribuyendo a facilitar la tediosa y motarea de grabación de los cuestionarios. Además de evitar la comisión de fahumanos en la grabación, cuando se teclea un código de respuesta incorrecto al incluido en el rango de valores posibles el programa alerta de su introducMás difícil es evitar errores de grabación si el código erróneo de respuesta que introduce pertenece al rango de valores de la pregunta, en los sistemas CAno así en los otros modos automatizados de grabación de cuestionarios me<:.~--;>',.·}~.:.-. ·ii·.··.;~· • :;dian1te escáner o fibra óptica, por ejemplo. Los errores de grabación pueden reducirse con un adecuado diseño del cues,.,:.{ ..••!" .. en el que queden bien delimitadas las preguntas, las respuestas y sus códigos !.. /;FY;i\·ílulIlérlCC)S correspondientes. También, mejorando la forrp.ación y la supervisión las personas responsables de la grabación de los cuestionarios. Asimismo, un cues.... < "" .,. ,..,. precolumnado ayuda al diseño del fichero de datos, como se vio en el ca-\~(1ec~ua.ao que

.•. ·.LJLV""J.I..L ......

J.vJ.JJLA..I..I. •..."

4. Los ficheros de datos del CIS, por ejemplo, se siguen grabando en el formato tra"rhr~lI"""'-r\,",1 ASCII (American Standard Code for Informatíon Interchange), que puede aplia cualquier programa estadístico (SPSS, BMPD, SAS). Está compuesto por ficolumnas de números. Cada fila representa un cuestionario (los casos observados) columnas incluyen los códigos correspondientes a las respuestas dadas a las ·.:oreE~untas del cuestionario. Cada cuestionario se considera un registro, cuya longitud .·•. \,"'·""IJ'~J..l\.lvJ.u. del número de preguntas que incluya (traducidas a variables). En el cuessi está precolumnado, se especifica la posición que cada variable (pregunta) \·;;"V'~UL'a en el fichero de datos. Cuando los datos se graban en formato AS~II, además del fichero de datos, hay elaborar un fichero de definición de datos. Este comprende instrucciones precisas la lectura del fichero de datos. Estas instrucciones incluyen información pri.··.·1'1l"\nll'"r1.;,.,.l de las variables en el cuestionario: las columnas donde se hallan ubicadas en de datos, las etiquetas que nombran a las variables y a sus atributos (categorías· reS.Duest:a o valores numéricos), así como la especificación de cómo se codifica la no ·:-,rleSD'ue,sta (no sabe/no contesta), en cada pregunta, para su tratamiento mediante : 4JLl C:l 1.1SIS estadístico. ..- •.".L'-'.L.I.'LA..I..I.'''''.


396

Capítulo 6: El tratamiento de la información

Métodos de encuesta

397

IP405'Europeos del Este (polacos, húngaros, etc.)'

Para ilustrar un fichero en formato ASCII se extracta parte del perteneciente al barómetro del CIS de mayo de 2003 (n. Q de estudio 2.511), cuyas primeras preguntas corresponden a indicadores comúnmente empleados por el CIS en la medición de actitudes ante la inmigración. Primero, aparece un extracto del fichero de datos y, segundo, el correspondiente al fichero de definición de datos.

VALUE LP.BEL éCAA .Q1'Andalucía' 02'Aragón' 03'Asturias (Principado de)' 04'Baleares (Islas)' 05'Canarias' 06'Cantabria' 07'Castilla-La Mancha' 08'Castilla y León' ..09'Cataluña' 10'Comunidad Valenciana' 11 'Extremadura' '12'Galicia' 13'Madrid (Comunidad de)' 14'Murcia (Región de)' "1!5'Navarra (Comunidad Foral de)' 16'País Vasco' 17'Rioja (La)'

A) Fichero de datos 25110244425029760 o o 0412199 110101010101010101010411219361221224122124272188433 013636118551330101 1511040702 15050340153111 1 108 25110244525029760 o o 04 99 2999999999999999999993221183320000022112121 93288423 02703122611401102 2112050706 15050340103111 1 108 251102446250297600 o 071 7 147777777773281123312212241332243438999997001253 3115801190103 04070502 15050340103111 1 108 25110244725029760 o o 014151799 1888888888841122236122112322221427329999980 02253 2219999099104 090101 15050340154111 1 108 251102448250297600 o 098 99 199999999993888123520000041221144222889997001792 0128721310105 0906020404 16050350151111 1 108 25110244925029760 o o 0118 99 110101010101010101010411212361221223133112353241 331 225433115521193306 02 16050350101111 1 108

B) Fichero de definición de datos DATA L1ST FILE='Cis2511' I CUES 5-9 A11-9(A) CCAA PROV 10-13 MUN 14-16 TAMUNI17 AREA 18 DISTR 19-20 SECCION 21-23 ENTREV 24-27 P101 TO P103 P201 TO P20328-39 P340 P401 TO P410 41-60 P5 TO P13 P13A01 TO P13A05 P14 TO P21 61-82 P22 83-84 *~+~~~~~~~~re-P26-85-88~7

P28 89 92

P~4lA-94~

P3096 P31 97-98 P32 99 P32A 100-101 P33 P34 102-103 P35104-106 P36 P36A 107-108 P37109-110 FINAL 111-152(A).

En el paquete estadístico SPSS para Windows ambos ficheros se conjugan en un único en formato de tabla, que incluye los valores numéricos en cada variable, para cada camodo del extracto que se presenta a continuación. En él puede verse la disposición de variables en las columnas y de los casos en las filas. ) Fichero de datos en SPSS para Windows cues

a1

ccaa

prov

mun

tamuni

2444

251102444

2

50

297

6

2

2445

251102445

2

50

297

6

3

2446

251102446

2

50

297

6

4

2447

251102447

2

50

297

6

5

2448

251102448

2

50

297

6

6

2449

251102449

2

50

297

6 6

7

2450

251102450

2

50

297

8

2451

251102451

2

50

297

6

9

2452

251102452

2

50

297

6

MISSING VALUES P101 TO P3 P5 TO P37(0). VARIABLE LABEL CCAA'Comunidad Autónoma' IPROV'Provincia' ITAMUNI'Tamaño de hábitat' IMUN'Municipio' IDISTR'Distrito' IP401 'Norteafricanos (marroquíes, etc.)' IP402'Africanos (resto del continente)' IP403'Norteamericanos' IP404'Asíáticos'

(...1...)

Los paquetes estadísticos genéricos también pueden leer ficheros de datos genepor bases de datos (como DBASE) u hojas de cálculo (como LüTUS). Estos fiincluyen nombres para las variables, además de información relativa a la amde la variable y la codificación de la no respuesta. Asimismo, las versiones para WiJ'ld(IWS de los programas estadísticos, como SPSS, tienen un formato de grabación datos similar, como se ha visto en la ilustración del ejemplo anterior. Aparte de los ficheros de datos, pueden crearse subficheros específicos para facilos análisis, especialmente cuando el tamaño de la muestra es elevado y el fichero


398

Métodos de encuesta Capítulo 6: El tratamiento de la información

de datos originario adquiere un gran volumen. Incluyen sólo las variables de interés ra la ejecución de análisis concretos. Pero los subficheros pueden ser también de casos, y no sólo de variables. La nalidad no es tanto el ahorro de tiempo, en el análisis de la información, sino la dación de los resultados obtenidos con los análisis estadísticos llevados a cabo. Para se secciona, al azar, la muestra en dos submuestras. Lo normal es destinar una muestra a la obtención del modelo estadístico. En la otra submuestra se replican análisis para comprobar si se alcanzan los mismos resultados. En tal caso éstos se sideran "válidos". Si el tamaño de la muestra es elevado, su división aleatoria se realiza, mediante el programa estadístico al uso, a la mitad (el 500/0 se destina a IIlUleStr;:¡ ." de análisis y el otro 50% a muestra de validación). Cuando la muestra es pequeña, peso de la muestra de análisis es mayor (600/0 e incluso 700/0, por ejemplo) que la rrespondiente a validación. Indistintamente del formato en que se graben los datos y de cuantos ficheros se ge-. neren, habrá que supervisar la grabación para evitar errores que no sólo afecten a .sino t~m~ién a la realización e interpretación de los análisis estadísticos. En ro de datos han de estar correctamente anotadas las variables con sus correspondientes códigos numéricos de respuesta. Además, una vez grabados los datos, habrá que II,..~ variable a variable (mediante análisis exploratorios univariables) para detectar errores de grabación, que puedan solventarse no engordando innecesariamente la respuesta, como ya se indicó en el subapartado 6.1.1. "'r-..'t"' .......

..

6.2. El análisis de los datos de encuesta

La explotación estadística de los datos de encuesta sigue, como en cualquier cedimiento analítico, un proceso secuencial. Primero, de las variables por separado mediante tablas de frecuencia, gráficos y estadísticos univariables que describen la distribución de la variable en la muestra. Segundo, la elaboración de tablas de cOfltlnf!en~cta en las que se cruzan dos, tres e incluso cuatro o más variables, que actúan como riables de control en la relación entre dos variables. La mayoría de los informes de cuesta se limitan a la interpretación de frecuencias porcentuales univariables (de da pregunta del cuestionario) y de tablas de contingencia. Pero cada vez más los i111Í't IISI,S··;."·./·\prosiguen con la consecución de algún modelo multivariable que se adecue a los jetivos del estudio y a las peculiaridades de los datos que se analizan. La mayor mación estadística de los investigadores sociales, junto con el mayor acceso y ficación de los paquetes estadísticos, están contribuyendo a que técnicas a.C"~nrt11C"~",~r)"···'··>.·""" sofisticadas y de cierta complejidad incrementen su presencia en la explotación dística de los datos de encuesta. Para un conocimiento preciso de las distintas opciones de análisis estadístico,. se comienda al lector interesado que consulte manuales u otras publicaciones especializadas. Su exposición detallada es aquí imposible, por problemas de espacio porque va más allá de los objetivos de la presente publicación. En este apartado ún1Lcalme:nte "/':.I..;. ..

··,··.,....·'c-

\:lTTlnll,_-·\'/

399

~<frece una visión panorámica y genérica de distintas posibilidades analíticas apli-

les a datos de encuesta. .1. La exploración univariable

t:kaexploración d~ los datos comienza por el análisis separado de cada variable in~::paen la matriz de datos. Comprende la tabla de frecuencias, su representación grá;;~.y el cálculo de estadísticos que permitan conocer, de manera precisa, la distribu-

.

/·tide los valores de la variable. ;~\ta tabla de frecuencias i~cluye los distintos valores que presenta la variable (dis;;é,.~Uldos en clases o categorIas), acompañados por su frecuencia absoluta (número de :o~~p.§en cada valor de la variable) y relativa (el porcentaje que representa en el con~to de la mu:str~). Esta tabla es de gran ayuda para descubrir errores de grabación, :,.9mo ya se ha IndIcado, aparte de para conocer la distribución de la variable, saber la :?,esFuesta de ítem y ver la conveniencia de recodificar la variable. para análisis 9st~nores (agrupando los valores en un menor número de categorías o cambiando sus ~'''~g~gos n~méricos p~ra hacerlos acordes a las categorías que designan). :;.!<':.i;En vanable~ contlnuas, con un elevado número de valores -por ejemplo, la variable .:.(~~d, cuando se graba la edad exacta (en la pregunta "¿Cuántos años cumplió Ud. en J;t.W~o cumpleaños?")-, ,l~ elabor~ción de la tabla. de frecuencia exige la previa agru~910n ~e los :alores numerICOS en Intervalos amplIos para que la tabla adquiera me,fes dImens~ones (en este caso, en grandes grupos de edad). Bryman y Cramer ~95) aconsejan que el número de categorías diferenciadas esté comprendido entre ~~20. Ar~u~ent~~ que menos de 6 y más de 20 categorías puede distorsionar la forde la dIstrlbucIon de la variable. F~a información incluida en la tabla de frecuencias puede representarse de maneráfica para mejor visualizar la distribución de la variable. Las posibilidades gráfi.I-.I-~Jl.l-"''"'''''Vl~'.''.;:) y de fá~~ realización, al incluirse no sólo en los paquetes estadísticos ,pe<;IaJ.1zaldo.,s.. SIno tambIen en los procesadores de texto de uso común (como en las vers.Iones .del programa Word, de ~icrosoft), que ofrecen un mayor abanico le',r{)r}C~l{)11{~S InclUSIve en tres dimensiones. Estas se suman a los tradicionales: Diagramas. de barras. Una serie de "barras", para cada categoría de la variable, cuyas longItudes dependen de su frecuencia. . Histograma. Sustituye las barras por rectángulos, adecuándose más a variables continuas. Gráfico de sectores, a modo de "tarta". Un círculo dividido en "sectores" de distintos colores o traz~s, que diferencian a unos de otros, y cuyos ángulos dep~nden del porcentaje de casos en cada categoría de la variable. • Polígono. Un g~áfico lineal que une los disti11.tos valores de la variable y cuya altura es proporcIonal a su frecuencia. • Ojivas. Polígonos de frecuencias acumuladas, que muestran la frecuencia de casos por encima, o por debajo, de un determinado valor de la dIstribución.


400

Métodos de encuesta

• El tallo y las hojas. Un gráfico similar al histograma, pero integrado por los dígitos de los valores de las variables. Suele tomarse como referente de las medidas de tendencia central de una distribución de frecuencias porque el dígito a la izquierda (el tronco) que comprenda más valores a la derecha (las hojas) será aquel que agrupe un mayor número de casos. • La "caja". Ofrece una visión global y sintética de la distribución de la variable. El 50% de los casos quedan comprendidos en el interior de la "caja". En los extremos se sitúan, respectivamente, el 25% superior e inferior. Con un asterisco se señala la mediana, con una X los valores máximos y mínimos y con una O los atípicos ("outliers").

Si se quiere una información más precisa de la distribución de la variable, habrá que proceder al cálculo de estadísticos univariables que midan la concentración de valores y su representatividad. Incluyen: • Medidas de tendencia central Describen la agrupación de los valores de una variable. La más representativa, cuando la variable es continua, es la media aritmética. En su cálculo participan todos los valores de la variable, multiplicados por sus respectivas frecuencias absolutas. La media se obtiene de la suma de todos estos productos dividida por el número total de casos e indica el promedio de los valores de distribución. Su correcta interpretación precisa, no obstante, del cálculo de medidas de dispersión, que gradúen la representatividad de la media, al verse está muy afectada por los valores extremos de la variable. En caso de pérdida de representatividad de la media, la mediana se convierte en el siguiente estadístico en importancia. Expresa el valor que divide a la distribución en dos partes iguales, lo que permite conocer los valores de mayor presencia en la muestra. Su cálculo exige que la variable sea, al menos, ordinal (que sus ,,;:,,---------------------- -estén ordenados de más a Illenos o de menos a más. Sea el caso, por elt:~ml)lo, de las variables clase social, niv~lde estu(lios,ldeOlogfupoIítidl) La moda, en bio, puede calcularse con cualquier tipo de variable. Indica el valor de mayor cuencia en la distribución, aquel que más casos comparten. Pero puede haber de una moda (distribuciones multimodales), lo que dificulta su interpretación. También están los cuantiles como medidas de tendencia no central. sentan los valores que dividen a la distribución en partes iguales: los cuartiles, en cuatro partes iguales; los deciles, en diez partes; y los percentiles, en cien partes. Su cálculo se asemeja al de la mediana. De hecho, el cuartil dos, el decil cinco y el percentil cincuenta expresan el valor mediano. • Medidas de dispersión Necesarias para conocer la mayor o menor variabilidad de los valores en torno a la media o la mediana de la distribución. Las medidas de dispersión absolutas más comunes son el rango (o recorrido), la desviación típica y la varianza.

Capítulo 6: El tratamiento de la información

401

El rango expresa el número de valores que incluye la variable. Se obtiene de la diferencia entre el valor superior y el inferior. Su comprensión es sencilla, aunque presenta el gran inconveniente de ser susceptible a la distorsión proporcionada por valores muy extremos en una distribución. Ello se debe a que sólo considera el primer y el último valor de la variable. Cuando la variable es ordinal o métrica (de intervalo o de razón) pueden calcularse rangos que informan de la distribución de los valores centrales de la variable. A destacar el rango intercuartílico (la diferencia entre el tercer cuartil y el primero, por lo que incluye al 50% de los valores centrales de la distribución), semiintercuartílico (el 25% de los valores centrales), interpercentílico (el 80% de los valores centrales, al ser la diferencia entre el percentil90 y 10), Yel semiinterpercentílico (el 40%). La desviación típica es el promedio de la desviación de los casos con respecto a la media. Como indicador de heterogeneidad, su estimación se exige siempre que se calcule la media porque mide su representatividad. Al igual que ésta, su valor viene expresado en la unidad de medición de la variable. Por lo que, su correcta interpretación precisa del cálculo de alguna medida de dispersión relativa, como el coeficiente de variabilidad de Pearson. Una medida estandarizada que se obtiene dividiendo la desviación típica entre la media aritmética. De ello resulta la proporción de heterogeneidad de la variable, siendo de gran utilidad en la comparación de dos o más grupos respecto a una o más variables. Lo cual únicamente es posible mediante el uso de alguna medida estandarizada que permita comparar variables en distintas unidades de medición (por ejemplo, los ingresos medidos en euros y en dólares; o comparar la representatividad de las medias de las variables ingresos y edad). Lo mismo puede hacerse con la mediana, con el cálculo del coeficiente de variabilidad de la mediana de Pearson, dividiendo la desviación media de la mediana entre la mediana. La varianza es el cuadrado de la desviación típica e indica la heterogeneidad de la variable en la muestra analizada. Sus características se asemejan a las de la desviación. -. - . - • Medidas de la forma de la distribución Comprenden la disposición espacial de los valores: su asimetría y curtosis. La asimetría indica la agrupación de las frecuencias en la curva de la distribución de la variable. Un valor de cero significa que la curva es simétrica (la misma área en ambos lados de la curva, al coincidir la media con la mediana y la moda). Un valor mayor de cero denota que la distribución es asimétrica a la derecha o con sesgo positivo (los casos se agrupan a la izquierda de la curva, debido a una mayor presenci~ de valores inferiores a la media). Un valor inferior a cero corresponde, en cambiO, a una distribución asimétrica a la izquierda o con sesgo negativo (la concentración de valores se da a la derecha de la curva, ante la mayor presencia de valores superiores a la media). A partir de un valor superior a 0,8 (con signo positivo o negativo) se considera que la asimetría es importante.


402

Métodos de encuesta

La curtosis expresa la mayor o menor concentración de valores en torno a la media de la distribución. Cuando existe una elevada concentración, siendo la forma de la distribución muy apuntada y elevada, se está ante una distribución leptocúrtica. Por el contrario, cuando la forma es muy aplanada, debido a la elevada dispersión de valores en torno a la media, se está ante una distribución platicúrtica, que coincide con medias no representativas. Una valor de curtosis igual a 3 significa que la distribución es normal o mesocúrtica; un valor mayor de 3, leptocúrtica y menor de 3, platicúrtica.

Capítulo 6: El tratamiento de la información

403

la de frecuencias, tal y como aparece en la salida de ordenador del paquete estadístico SPSS cómo quedaría ésta en un informe de investigación. Después, se ilustran distintas posibiades gráficas, en las tres preguntas. Y, por último, la tabla de estadísticos univariables que intetizan la distribución de las tres variables aquí analizadas.

) Tabla de frecuenclas

Valoración inmigración

El cálculo del error típico de estimación de cualquiera de estos estadísticos permite conocer su significatividad estadística. En qué medida su valor estimado en la muestra que se ha analizado es inferible al universo o población a la que pertenece. Para ello, se divide el estadístico estimado (por ejemplo, la media, la mediana, el coeficiente de asimetría u otro) entre el error típico (que expresa la oscilación en el valor del estadístico de una muestra a otra que se extraiga de la misma población). De este cociente resulta un valor t empírico que, para que sea estadísticamente significativo, ha de ser mayor o igual a 1,96 (con signo positivo o negativo), para el nivel de significatividad usual de 0,05, si la muestra supera los 100 casos. Coincide con una significación igual o inferior a 0,05, que indica la probabilidad de error en la inferencia estadística. Para muestras inferiores, el valor dereferencia varía en función de los grados de libertad (igual al tamaño muestral menos uno). La interpretación correcta de los estadísticos univariables, de la distribución de frecuencias y de cualquier análisis que se realice de las variables requiere conocer el texto literal de la pregunta que la incluye. Quiere decir, cómo figura redactada en el cuestionario, junto con la distribución exacta y completa de las respuestas a la pregunta, incluyendo las opciones de "no sabe" y "no contesta". Asimismo, en la presentación de los resultados de la encuesta lo normal es poner los porcentajes de respuesta en cada pregunta; Éstos expresan el peso de cada valor en el conjunto de la muestra, y son imprescindibles a efectos comparativos. A este respecto, se recomienda siempre poner la base muestral en la que se han calculado los porcentajes, con preferencia al típico total 100%. Ya se sabe que los porcentajes han de sumar 100. En cambio, la correcta interpretación porcentual precisa del conocimiento del total de la muestra o población sobre la que éste se calcula. No es igualmente inferible un porcentaje estimado en una muestra de 30 casos, que de 300 o de 3.000. A menor tamaño muestral, mayor error típico y, en consecuencia, menores posibilidades inferencia1es de los resultados del estudio, como se vio en el capítulo 3.

Para ilustrar distintas posibilidades analíticas univariables se extraen tres preguntas pertenecientes al barómetro de mayo de 2003 del CIS (estudio n.º 2.511). Primero, figura una ta-

Frecuencia

Válidos

Perdidos Total

1,00 2,00 3,00 Total Sistema

592 535 1.096 2.223 272 2.495

Porcentaje

Porcentaje válido

Porcentaje acumulado

23,7 21,4 43,9 89,1 10,9 100,0

26,6 24,1 49,3 100,0

26,6 50,7 100,0

Esta tabla pertenece a la variable que hemos llamado "valoración de la inmigración". 90rresponde a la pregunta 7 del cuestionario, que dice así: "Como Ud. sabe, todos los países desarrollados reciben inmigrantes. ¿ Cree Ud. que, en términos generales, la inmigración eS más bien positiva o más bien negativa para estos países?". Esta variable ha sido re(:odificada para que el valor numérico que represente a cada categoría de la variable sea consonante con la misma. El valor 1 corresponde a la respuesta "más bien negativa", 2 a "ni una cosa ni otra" y 3 a "más bien positiva". Asimismo, para que pueda distinguirse la con.sideración de "válido" del porcentaje, las respuestas de no opinión (no sabe/no contesta) se han desconsiderado en la tabla de frecuencias (perdidos por el sistema). No así en la tabla que describe las respuestas a esta pregunta en una publicación que analiza esta encuesta y otras anteriores de actitudes ante la inmigración (Cea D'Ancona, 2004b). En la tabla que se presenta a continuación se ofrecen las respuestas a esta pregunta en el barómetro de 2003 y en los tres precedentes de 2000, 2001 Y 2002, que también la incluyen, para mejor analizar las tendencias de opinión. En dicha tabla puede verse que este indicador de racismo, perteneciente a la dimensión de política inmigratoria, describe un estado de opinión en 2003 más coincidente con el habido en 2000 que en los dos sondeos inmediatamente anteriores. La valoración más positiva de la inmigración se dio en 2001. La mitad de los encuestados compartían la creencia de que la inmigración es más bien positiva para los países desarrollados que reciben inmigrantes. Un . año después, el porcentaje desciende al 41% y en 2003 se sitúa en el 44% y aumenta, muy levemente, la respuesta indefinida de "ni una cosa ni otra". Respuesta, esta última, que sueenmascarar respuestas negativas que temen pronunciarse por temor a la desaprobación


404

Métodos de encuesta

Capítulo 6: El tratamiento de la información

CUADRO 6.A. Valoración de la inmigración Como Ud. sabe, todos los países desarrollados reciben inmigrantes. ¿Cree Ud. que, en términos generales, la· inmigración es más bien positiva o más bien negativa para estos países?

Banco de datos CIS (% verticales)

Más bien positiva Más bien negativa Ni una cosa ni otra No sabe No contesta Base muestral

Febrero

Febrero

Junio

Mayo

2000

2001

2002

2003

43 24 19 12 1

50 21 17 11 1

41 29 19 10 1

24 21 10 1

2.475

2.498

2.494

2.495

44

405

El segundo gráfico elegido es un diagrama de barras correspondiente a la pregunta 8 del odicho barómetro del CIS, que dice así: ¿Qué le parece a Ud. el número de personas proentes de otros países que viven en España? Los códigos de respuesta también han si.recodificados de forma que el valor 1 corresponde a la respuesta "son pocos", 2 a "son bastes, pero no demasiados" y 3 a "son demasiados". Para que mejor pueda apreciarse el ode la no respuesta en la pregunta, se ofrecen dos diagramas de barras de frecuencias entuales. El primero corresponde a la pregunta sin recodificar, incluyéndose los "no sael 6,9% de los 2.495 encuestados) y "no contesta" (un 0,9%). En el segundo gráfico la gunta está recodificada y la no respuesta omitida.

B) Gráficos El primer gráfico es un histograma de frecuencias absolutas para la variable "simpatía marroqur', incluida en la pregunta 4 del barómetro de mayo de 2003. En ella se pide, concretamente, Dígame, por favor, en una escala del Oal1O, la simpatía que Ud. tiene por cada uno de ellos (marroquíes), teniendo en cuenta que el O significa "ninguna simpatía" y el 10 "mucha simpatía". En el gráfico puede apreciarse la no correspondencia de la distribución con la curva normal. Se trata más bien de una.distribución ligeramente asimétrica a la izquierda (o con sesgo negativo). Esto significa que los casos analizados se concentran más a la derecha de la curva. La frecuencia de los valores superiores a la media (5,3) supera a los situados por debajo de la media aritmética.

oL.__ N.C.

1,00

2,00

. Por último, se representa un gráfico de sectores para la pregunta 7 (valoración de la in¡gración), pero realizados no con el SPSS, sino con el programa Word. Los usuarios de és. yde otros procesadores de texto que ofrecen opciones de gráficos sabrán que las posiidades gráficas son variadas y de fácil ejecución.

1.000

Valoración inmigración 800 600 400 Más bien positiva Desv. típ. =2,60 Media = 5,3

200

N=2233,00

o 0,0

2,0

simpatía marroquí

4,0

6,0

8,0

10,0

3,00

Ni una cosa ni otra


406

Métodos de encuesta

Capítulo 6: El tratamiento de la información

C) Estadísticos univariables Como síntesis se ofrece la tabla que extracta distintos estadísticos univariables en las tres preguntas referidas. Para su interpretación recuérdese el enunciado literal de la pregunta, las opciones de respuesta que incluyen y el nivel de medición de las variables, que h~ce qu~ unos estadísticos se adecuen más que otros en la descripción de las variables. Ademas, aphquese lo dicho con anterioridad en referencia a cada uno de los estadísticos. La tabla está en el mis· mo formato en que aparece en el programa SPSS. A lo dicho entonces, añádase que la "su· ma" (único estadístico antes no descrito) se refiere a la suma total de todos los valores a lo largo de todos los casos que no tengan valores perdidos. Estadísticos

N Media Error típ. de la media Mediana Moda Desv. típ. Varianza Asimetría Error típ. de asimetría Curtosis Error típ. de curtosis Rango Mínimo Máximo Suma Percentiles

Válidos Perdidos

10 25 50 75 90

N.º

Simpatía marroquí

Valoración inmigración

inmigrantes

2.233 262 5,2714 5,500E-02 5,0000 5,00 2,5991 6,7552 -,202 ,052 -,162 ,104 10,00 ,00 10,00 11.771,00 1,0000 4,0000 5,0000 7,0000 9,0000

2.223 272 2,2267 1,785E-02 2,0000 3,00 ,8416 ,7083 -,448 ,052 -1,444 ,104 2,00 1,00 3,00 4.950,00 1,0000 1,0000 2,0000 3,0000 3,0000

2.300 195 2,4722 1,220E-02 3,0000 3,00 ,5852 ,3424 -,589 ,051 -,605 ,102 2,00 1,00 3,00 5.686,00 2,0000 2,0000 3,0000 3,0000 3,0000

6.2.2. La elaboración de tablas

Las tablas en las que se cruzan dos, tres o más variables son un integrante bási~?, y a veces único, en los informes sociológicos de datos de encuesta.. En su pre~~ntaclOn normalmente se siguen una serie de convenciones que ayudan a su rnterpretaclon. Aunque el investigador es libre de diseñar el formato que más se ajuste a su estilo particular y al contenido de la tabla, las pautas más seguidas en su realización son las siguientes:

407

a) Cuando se analiza la relación causal existente entre dos variables, la variable que se cree dependiente (aquella cuya variabilidad quiere analizarse) suele situarse en las filas, mientras que la independiente (o predictora) se ubica en las columnas. Excepto que el elevado número de atributos de la variable independiente desaconseje su ubicación en las columnas, procediéndose a la inversa. Esta disposición de las variables responde a la mayor facilidad de lectura, en la cultura occidental, en sentido horizontal frente al vertical. Como los porcentajes se calculan respecto a la variable independiente, para ver su incidencia en la dependiente, los porcentajes serán verticales (al estar la variable independiente ubicada en columnas) y las comparaciones entre ellos se harán en sentido horizontal. En cada categoría de la variable dependiente se procede a la comparación de los porcentajes habidos en cada categoría de la independiente. Cuando se prefiere poner la variable independiente en las filas y la dependiente en las columnas, los porcentajes serán horizontales y las comparaciones entre ellos se harán de forma vertical. Para que las diferencias porcentuales entre las distintas categorías de la variable independiente se consideren relevantes, han de ser superiores a cinco puntos porcentuales. Más si las bases muestrales sobre las que se calculan los porcentajes son pequeñas, lo cual supondría un incremento notorio en el error típico de estimación y en la pérdida de significatividad de las diferencias porcentuales apreciadas en la muestra. Por esta razón, es muy importante que en la tabla aparezca la base muestral sobre la que se calculan los porcentajes, con preferencia al total de 100%, que ya se sabe han de sumar los porcentajes. b) En la tabla o cuadro ha de indicarse, explícitamente, la dirección que siguen los porcentajes: horizontales, verticales y, cuando no figuran todas las opciones de respuesta en la pregunta, sino sólo alguna de ellas, ha de expresarse que se trata de porcentajes de cada combinación (no suman 100). Asimismo, se reitera que, como sólo se ofrecen datos porcentuales, poner las bases muestrales sobre las que están calculados, como antes se indicó. Los porcentajes conviene ponerlos sin decimales, al tratarse de datos de encuesta. La precisión decimal parece innecesaria con datos muestrales, sujetos a error muestral (bastante afectado por el tamaño de las bases muestrales) y demás errores de encuesta, no cuando se trate de cifras de población. c) Conviene que la tabla esté encabezada por un título que describa, de forma sucinta, el contenido de la tabla. El título ha de especificar las variables comprendidas en la tabla y la relación entre ellas. d) Para facilitar su lectura e interpretación, se recomienda destacar las relaciones que se consideren más significativas, aquellas que presenten un porcentaje más elevado. Para que pueda afirmarse que existe relación o asociación entre las variables han de observarse diferencias porcentuales entre las distintas categorías de la variable independiente, como ya se ha indicado, y además de forma pautada, sin altibajos. Como indica De Miguel (1997: 65),


408

Capítulo 6: El tratamiento de la información

Métodos de encuesta

Una serie ordenada no es sólo la que contiene un porcentaje más elevado, sino la que es cabeza de una trayectoria sin altibajos. Una serie desordenada es la que dibuja una trayectoria truncada, errática [...]. El desorden se manifiesta en que no existe un máximo destacado, no se produce un gradiente regular entre el máximo y el mínimo.

Con las mismas preguntas del barómetro de mayo de 2003 del CIS se procede a la realización de una tabla de contingencia o tabla cruzada. Se quiere saber si en la percepción del número de inmigrantes en nuestro país (pregunta 8) afecta la valoración que se haga de la inmigración (pregunta 7). Ambas variables se cruzan obteniendo la tabla a continuación. Incluye la frecuencia absoluta o recuento en cada casilla de la tabla (número de casos), la frecuencia esperada (aquella que cabría esperar en caso de inexistencia de relación entre las variables; de interés en el cálculo del estadístico chi-cuadrado), el residuo (la diferencia entre la frecuencia observada y la esperada) y los porcentajes calculados respecto a cada pregunta y al total de la muestra. La consideración de la no respuesta (los no sabe/no contesta) en ambas preguntas permite conocer su incidencia en cada categoría de respuesta. Tabla de contingencia PB • P7

409

P7

Más bien Más bien positiva negativa

Ni una ni otra

Total N.C.

N.S.

(NO LEER)

N.S.

Recuento Frec,l.Jencia esperada %de P8 %de P7 %deltotal Residuo

75 75,6 43,6% 6,8% 3,0% -0,6

19 40,8 11,0% 3,2% 0,8% -21,8

33 36,9 19,2% 6,2% 1,3% -3,9

44 16,5 25,6% 18,3% 1,8% 27,5

1 2,2 0,6% 3,1% 0,0% -1,2

172 172,0 100,0% 6,9% 6,9%

N.C.

Recuento Frecuencia esperada %de P8 %de P7 % del total Residuo

10 10,1 43,5% 0,9% 0,4% -0,1

2 5,5 8,7% 0,3% 0,1% -3,5

2 4,9 8,7% 0,4% 0,1% -2,9

2 2,2 8,7% 0,8% 0,1% -0,2

7 0,3 30,4% 21,9% 0,3% 6,7

23 23,0 100,0% 0,9% 0,9%

Recuento Frecuencia esperada %deP8 %deP7 % del total

1.096 1.096,0 43,9% 100,0% 43,9%

592 592,0 23,7% 100,0% 23,7%

535 535,0 21,4% 100,0% 21,4%

240 240,0 9,6% 100,0% 9,6%

32 32,0 1,3% 100,0% 1,3%

2.495 2.495,0 100,0% 100,0% 100,0%

P7

Más bien Más bien positiva negativa

Ni una ni otra

Total N.S.

N.C.

(NO LEER)

P8

Son demasiados Recuento Frecuencia esperada %deP8 %deP7 %-deLto Residuo

333 524,1 27,9% 30,4% i,3"Lo -191,1

469 283,1 39,3% 79,2% 188% 185,9

251 255,8 21,0% 46,9% 101% -4,8

121 114,8 10,1% 50,4% 4,8% 6,2

19 15,3 1,6% 59,4% 0,8% 3,7

1.193 1.193,0 100,0% 47,8% 47,8%

Son bastantes, pero no demasiados

Recuento Frecuencia esperada %deP8 %deP7 % del total Residuo

594 439,3 59,4% 54,2% 23,8% 154,7

96 237,3 9,6% 16,2% 3,8% -141,3

234 214,4 23,4% 43,7% 9,4% 19,6

71 96,2 7,1% 29,6% 2,8% -25,2

5 12,8 0,5% 15,6% 0,2% -7,8

1.000 1.000,0 100,0% 40,1% 40,1%

Recuento Frecuencia esperada %deP8 %deP7 % del total Residuo

84 47,0 78,5% 7,7% 3,4% 37,0

6 25,4 5,6% 1,0% 0,2% -19,4

15 22,9 14,0% 2,8% 0,6% -7,9

2 10,3 1,9% 0,8% 0,1% -8,3

O 1,4 0,0% 0,0% 0,0% -1,4

107 107,0 100,0% 4,3% 4,3%

Son pocos

(.. ./...)

Pero esta tabla, aunque aporta mucha información referida a ambas variables, es de dilectura. En un informe de resultados aparecería, en su lugar, una tabla más sencilla, en que sólo figurase, en cada casilla, el porcentaje calculado de acuerdo con la variable inqé~lenlclielnte (valoración de la inmigración). Esta variable se situaría en las columnas, sienlos porcentajes, en consecuencia, verticales. El único recuento que interesa es el corespondiente a la base muestral sobre la que están calculados los porcentajes. La no puesta suele omitirse, salvo que al investigador le interese destacarla en la interpretación JasJ'espuestas-LaJabla_que_daría bastante simplificada (cuadro 6.!~JJavoreciendo la inerpretación de la existencia o inexistencia de relación entre las dos variables que se cruzan.

CUADRO 6.8. Percepción de la presencia de inmigrantes en España según valoración de la inmigración Valoración inmigración

Barómetro de mayo de 2003 del GIS (% verticales)

Más bien positiva

Número de inmigrantes

Más bien negativa

Ni una cosa ni otra

Total

Son pocos Son bastantes, pero no demasiados Son demasiados

1 17 82

3 47 50

8 59 32

5 44 51

571

500

1.011

2.082


410

Métodos de encuesta

Capítulo 6: El tratamiento de la información

En este caso sí parece haber asociación entre ambas variables. Aunque la mitad de los 2.082 encuestados que han contestado a ambas preguntas opina que el número de personas procedentes de otros países que viven en España "son demasiados" y' tan sólo un 5% que "son pocos", comparando los porcentajes de respuesta en las distintas categorías diferenciadas en la valoración de la inmigración puede observarse que, conforme empeora la valoración de la inmigración, la percepción de su número en demasía aumenta considerablemente. El 82% de los 571 sondeados para quienes la inmigración es "más bien negativa" dice que "son demasiados". Porcentaje que desciende hasta el 32% en aquellos que la consideran "más bien positiva" y al 50% en los que se decantan por la opción intermedia de "ni una cosa ni otra". Esta pauta se mantiene en las otras categorías de la variable dependiente (número 1Ie inmigrantes), pero en sentido lógicamente inverso. Como suponen una menor pe,rcepción de la presencia de inmigrantes en nuestro país, estas respuestas ("son bastantes, pero no de, masiados" y "son pocos") son más mencionadas a medida que mejora la valoración de la inmigración. En consecuencia, puede afirmarse que la percepción de la presencia de inmigrantes en nuestro país está afectada por cómo se valore la inmigración. Existe un gradiente regular en las respuestas a ambas preguntas, sin altibajos, habiendo unos máximos y unos mínimos muy acusados. Todo lo cual lleva a la conclusión de que ambas variables tienen relación de dependencia y en el sentido esperado. Para graduar dicha relación, de forma más precisa, habrá que proceder al cálculo de estadísticos de contingencia y a sus correspondientes pruebas de significatividad. . El contenido de la tabla también se puede representar gráficamente con un diagrama de barras horizontal o vertical como en el gráfico que aparece a continuación. En él figuran los porcentajes correspondientes a cada casilla que resulta del cruce de ambas variables. Aunque el gráfico puede igualmente hacerse con las frecuencias absolutas (recuento), se prefieren los porcentajes para realizar mejor la lectura comparativa de las diferentes opciones de respuesta, al haber distintas bases muestrales.

Percepción de la presencia de inmigrantes según valoración de la inmigración ~

00 80

70

1------1

-1-------------

al

60 . 1 - - - - - - - - - -

S"

50 . I - - - - - - - - - = -

~

lIlI Más bien negativa O Ni una cosa ni otra

40 .1-----------""1

~ 30

liI Más bien positiva

+-~----------i

O Total

20 +---------''-'-1 1O +---,-~t__=--.a--O L.,,~::::II~D....-_ Son pocos

Son bastantes, pero no demasiados Número de inmigrantes

Son demasiados

411

Cuando la lectura porcentual se estima insuficiente, la tabla se complementa con estaclís1:icc)s que gradúan la relación entre las variables y su significatividad. En especuando quiere deducirse una relación causal entre las variables comprendidas en Cada vez son más los estadísticos incorporados en los paquetes al uso. El proSPSS, por ejemplo, incluye varios estadísticos de:

• Bondad de ajuste: las pruebas de chi-cuadrado de Pearson, de razón de verosimilitud (que se basa en la teoría de máxima verosimilitud y llega a conclusiones similares a la anterior en tamaños muestrales elevados), de Mantel-Haenszel (de asociación lineal por lineal; a partir de variables ordinales) y la prueba de McNemar (para detectar cambios en las respuestas debidos a la intervención experimental en los diseños con dos mediciones: antes y después del tratamiento). Permiten comprobar la significatividad de la relación entre las variables; sus posibilidades de inferencia estadística al conjunto de la población (cuando la significaci6n es menor o igual al valor de referencia habitual de 0,05). • Medidas direccionales de la relación de causalidad (grado en que la variable independiente explica la variabilidad de la variable dependiente). Las más comunes son lambda y tau de Goodman y Kruskal, junto con el coeficiente de incertidumbre, porque pueden emplearse con cualquier tipo de variables. Le siguen los estadísticos d de Somer, que precisa que las variables sean al menos ordinales, y eta, para variables dependientes de intervalo. • Medidas simétricas para conocer el grado de relación entre las variables, sin diferenciar entre dependientes e independientes. Phi, V de Cramer y el coeficiente de contingencia, pueden aplicarse con cualquier tipo de variable. El nivel de medición ordinal se precisa para la utilización de los estadísticos tau-b y tau-c de Kendall, gamma de Goodman y Kruskal y el coeficiente de correlación de Spearman. El nivel de intervalo, en ambas variables, para el uso del coeficiente de correlación r de Pearson. Éstos son los estaclísticos de uso más común, pero no los únicos, como puede comrobarse en el libro clásico de Siegel (1985). En él se comentan varios de ellos y otros ~tadísticos de contingencia, cuya explicación sobrepasa los propósitos de la presen~. publicación. Para su conocimiento se remite, al lector interesado, a la consulta de bil:)}i(:>grafía estadística especializada. Aquí sólo añadir que, en las versiones de SPSS pa~~.Windows no sólo se informa del valor de las medidas direccionales y simétricas, sino también de su significatividad (mediante la prueba t de Student). En general, pueden presentar un valor comprendido entre 0,0 (que expresa ineXistencia de relación entre las variables) y 1,0 (asociación perfecta), con signo positivo o negativo. El signo positivo denota que la asociación es "positiva": ambas variables avanzan en la misma dirección (los aumentos en el valor de una suponen incrementos en el valor de la otra). El signo negativo, que avanzan en direcciones contrarias: los aumentos en el valor de una de ellas provocan descensos en el valor de la otra.


412

Por ejemplo, la relación habida entre las variables simpatía hacia los mn:lim~anlte, prejuicios étnicos. Lo más probable es que a mayor grado de simpatía descienda el do de preocupación ante una posible convivencia con inmigrantes. Por el contrario relación será ~ositiva entre la variable simpatía hacia los inmigrantes y el deseo de str gularización. ".

El valor de los estadísticos de contingencia denota el grado de relación entre las riables. En la mayoría de ellos, a partir de 0,5 suele considerarse la relación como levante. Más cuando sobrepasa de 0,7, situándose próximo al valor máximo de 1,0. ro la interpretabilidad de dichos valores depende de su significatividad. Como cualquier estadístico muestral, ésta se comprueba mediante la razón t obtenida de vidir el valor de la medida direccional o simétrica de contingencia entre su error típ'~ co de estimación. Para que sea significativa, la probabilidad de error en la inferencia . . de ser pequeña. Como es usual, una significación inferior o igual a 0,05. . . Por último, a veces se opta, para facilitar la lectura de la tabla, por elaborar uni~~ dice que resuma su contenido. Éste precisa de la asignación de pesos a los distintos y~~ lores de la variable cuyo efecto en la otra variable (la dependiente o criterio) trata '. medirse. Ya en el Informe FüESSA de 1970 (dirigido por Amando de Migue~l)s;e apuntaban cuatro recomendaciones en la elaboración de índices: a) Los "pesos" o coeficientes de ponderación han de adecuarse a la variable

pondera, a las diferencias entre sus distintos atributos (categorías o méricos). Por ejemplo, si la variable es "frecuencia de lectura de periódicos" y está 1l1CWU.(1 c·u·,; seis categorías (diariamente, casi todos los días, una vez a la semana, varias veces al casi nunca y nunca), los coeficientes pueden estar referidos a número de días al mes: (para la opción "diariamente"), 20 ("casi todos los días"), 4 ("una vez a la ("varias veces al mes"), 1 ("casi nunca") y O("nunca").

.ara ilustrar el cálculo de índices en una tabla, se toma la correspondiente al cruce de la nta número 5 del mismo barómetro de mayo de 2003 del CIS con variables sociode'ficas varias (sexo, edad, estudios e ideología política). La pregunta, cuyo enunciado se een la tabla, dice así: ¿En qué medida: mucho, bastante, poco o nada, le importaría a

lfe sus hijos (si no los tiene, en el caso de que los tuviera) compartieran en el colegio la ~clase con niños de familias de inmigrantes extranjeras? Es uno de los indicadores traales en la medición de racismo y pertenece a la dimensión latente de convivencia o soación con inmigrantes. el propósito de facilitar la lectura de la tabla y ver en qué medida las variables soemográficas consideradas inciden en dicho indicador de racismo, se procede al cálculo n índice que resuma su contenido. Los pesos o coeficientes de ponderación que se nan a 105 distintos atributos del indicador en cuestión son: "1" Nada, "2" Poco, "3" Bas. y "4" Mucho. Coeficientes que mantienen la escala de la variable y que cumplen 105 isitos antes enunciados. En la lectura de la tabla adviértase que los porcentajes son ra horizontales, al estar dispuestas las variables independientes o predictoras en filas. . disposición se prefiere en tablas, como la presente, que incluye más de una variable (3pendiente y, en general, en aquellas cuya amplitud desaconsejaría su disposición en lurnnas. ~on

CUADRO 6.C. Preocupación por posible convivencia escolar con hiños inmigrantes por variables sociodemográficas

¿En qué medida: mucho, bastante, poco o nada, le importaría a Ud. que sus hijos (si no los tiene, en el caso de que los tuviera) compartieran en el co/~gic! la misma c:.lase con niños de familias inmigrantes extranjeras?

b) Elegir coeficientes sencillos: Preferiblemente un número entero y pequeño: c) Si la variable contiene atributos con connotaciones positivas y negativas, den utilizarse los mismos coeficientes, pero con signos positivos y negativos, ra destacar su distinta significación. Por ejemplo, en la escala ordinal "grado de acuerdo": +3 ("muy de aculen:lo":f, +2 ("bastante de acuerdo"), +1 ("de acuerdo"), O("ni de acuerdo ni en de!,aClllerdo"), -1 ("en desacuerdo"), -2 ("bastante en desacuerdo") y -3 ("muy en desacuerdo").

d) En una encuesta, iguales respuestas (atributos) en preguntas diferentes riables) han de estar igualmente ponderadas para el cálculo de índices. decir, han de aplicarse los mismos pesos o coeficientes de ponderación n01raue'

posibilita su comparación.

413

Capítulo 6: El tratamiento de la información

Métodos de encuesta

EDAD Menos de 30

30-49 50-64 65y más

Nada

Poco

Bastante

Mucho

75

16

8

1,35

75 75

16 17

8 7

1,35 1,34

77 75 76 70

15 17 15 18

7 7 7 11

1

2 2 1

íNDICE"

1,32 1,36 1,35 1,43 ( .. ./... )


414

Capítulo 6: El tratamiento de la información

Métodos de encuesta

Banco de datos els (% horizontales)

¿En qué medida: mucho, bastante, poco o nada, le importaría a Ud. que sus hijos (si no los tiene, en el caso de que los tuviera) compartieran en el colegio la mísma clase con niños de familias inmigrantes extranjeras?

ESTUDIOS Primarios EGB, FP1 Bachillerato, FP2 Medios, superiores

Nada

Poco

Bastante

Mucho

íNDICE'

72 75 76

16 15 16 17

10 7 7 6

1 1 2 1

1,38 1,32 1,36 1,32

SO 74 69

13 18 18

6 7 11

1 1 2

1,28 1,35 1,46

77

IDEOLOGíA pOLíTICA Izquierda Centro Derecha

~ porcentuales,

ya referidos a las preguntas por separado o a los cruces de variables. El análisis conjunto de varias variables al mismo tiempo, de las relaciones e interrelaciones entre ellas, se adecua más al análisis de la compleja realidad social. El gran número de 'opciones analíticas multivariables en la actualidad, unido a la complejidad de los 'análisis, hacen inviable su exposición detallada en este subapartado del libro. Lo único que cabe es ofrecer una visión panorámica genérica de sus características diferenciales y remitir al lector interesado a la bibliografía especializada. La clasificación de las técnicas analíticas multivariables más compartida es aquella que diferencia entre técnicas de dependencia y de interdependencia, en función de i indagan en relaciones causales entre las variables (dependencia) o sólo buscan la agrupación de variables o de casos (interdependencia), sin diferenciar entre variables ~ependientes e independientes. Para facilitar su visualización, se decide su presentacción gráfica. Primero, de las técnicas multivariables de dependencia (figura 6.1) y, segundo, de las clasificadas de interdependencia (figura 6.2). De cada una de ellas se indican sus objetivos principales y los supuestos básicos que exige su correcta realización.

* El índice se ha calculado multiplicando cada porcentaje por el coeficiente de ponderación correspondiente

(1,2, 3 Y4). Se suman los productos y se divide por 100. Por ejemplo, el índice para los varones sería: _ (75x1)+(16x2)+(Sx3)+(1x4)_1 100 - , 35

TÉCNICAS MULTIVARIABLES DE DEPENDENCIA: Miden la existencia de relaciones causales entre una serie de variables, su grad9 y significatividad

Ivarón -

Para las personas ideológicamente clasificadas de derecha:

I

=

(69x1)+(18x2)+(11x3)+(2x4) = 146

derecha

100

'

La opción de respuesta "nada" es mayoritaria. Tres de cada cuatro encuestados la eligen. Proporción que se eleva al 80% entre los clasificados de izquierda, y desciende al 69% en los de derecha. Por esta razón, todos los índices adquieren un valor entre 1 y 2. Ello se debe a que el coeficiente asignado a dicha respuesta es "1". Cuanto más supere el índice el valor de 1, mayor será el grado de preocupación declarado ante una posible convivencia con inmigrantes. Su cenit se alcanza en las personas clasificadas de derecha (1,46) yen aquellas de 65 y más años (1,43). Seguidos por aquellos con estudios primarios (1,38). Pero, en las variables estudios y edad su incidencia no queda tan clara como en la variable ideología política. En esta última se aprecia una serie ordenada gradual, sin altibajos, produciéndose un gradiente regular entre el máximo y el mínimo. No así en las variables edad y estudios en las que, aunque los mínimos y máximos se sitúan en sus categorías extremas, hay altibajos que hacen que su efecto sea menos nítido en la variable en cuestión. No se observan diferencias por sexo.

I Una variable dependiente 1 r Varias variables dependientes

Métrica

Los recursos informáticos y un mayor conocimiento estadístico están contribuyendo a que, cada vez más, los análisis de datos de encuesta no se limiten a meros comentarios

I

I Nométrica

I Regresión múltiple

6.2.3. Opciones analíticas multivariables

415

I I

I

I

Logit y probit

Discriminante

I

I

Métricas 1I No métricas

I Varianza I

I

Múltiples relaciones entre variables dependientes e independientes

I

I Correlación canónica

Ecuaciones estructurales

Figura 6.1. Técnicas de análisis multivariable de dependencia.


416

Métodos de encuesta

Capítulo 6: El tratamiento de la inJormaclon

'+ 1. I

Regresión múltiple

Al igual que el análisisprobit, constituyen modelos analíticos alternativos en la pre-

• Objetivos:

de variables dependientes cualitativas. Si bien, el análisis logit ha alcanzado más por su mayor practicabilidad. Dentro de este último se incluye la regresión lO.f!lSlJCa y el modelo logit.

.'·:··. .rlI... "ro1r\n

1. Búsqueda de la ecuación que mejor represente la asociación lineal entre las variables. 2. Cuantificar la relación de dependencia mediante el coeficiente de correlación R de Pearson y su cuadrado (el coeficiente de determinación), que expresa la proporción de varianza explicada de la variable dependiente por·las independientes en la ecuación. 3. Determinar el grado de confianza con que puede afirmarse que la relación observada en los datos muestrales es realmente cierta.

·1l~~LJ~""JL,,","'.L,,",

• Regresión logística. Una alternativa idónea al análisis de variables dependientes categóricas o no métricas. Sus objetivos básicos son:

1. Predecir la probabilidad de ocurrencia de un determinado evento (Y = 1), a partir de los valores que presentan una serie de variables independientes continuas. 2. Cuantificar el grado de relación entre las independientes y la dependiente. 3. Determinar su significatividad y el éxito del modelo en la predicción de la variable dependiente.

• Supuestos básicos: 1. Tamaño muestral elevado (20 casos por variable independiente; preferiblemente 40). 2. Variable dependiente métrica-continua. 3. Variables independientes métricas o continuas y relevantes para la predicción de la variable dependiente. 4. Linealidad: la relación entre la variable dependiente y las independientes ha de ser "lineal" (el efecto de cada independiente en la dependiente es el mismo cualquiera que sea el valor de la independiente). 5. Aditividad: los efectos de las variables independientes en la dependiente han de poderse sumar entre sí. 6. Normalidad: la distribución de los datos ha de ajustarse a la distribución normal para favorecer la realización de las pruebas de significatividad. 7. Homocedasticidad: la varianza de la variable dependiente ha de ser igual en cada valor de la independiente para que la relación de las independientes con la dependiente pueda medirse con rigor. En caso contrario, habría una mejor predicción del valor de la dependiente en unos determinados valores de las independientes que en otros. 8. Ausencia de colinealidad o de correlación entre las independientes para que puedan medirse los efectos concretos de cada independiente en la dependiente. 9. Independencia de los términos de error: el valor de la variable dependiente en cada caso concreto han de ser independientes del resto.

El incumplimiento de alguno o de varios de estos supuestos puede llevar a la aplicación de procedimientos de regresión alternativos, como la regresión de mínimos cuadrados ponderados (cuando se incumplen los supuestos de homocedasticidad e independencia de los términos de error) y la regresión polinómica (si se incumple el supuesto de linealidad). En este último caso, también se aplicaría la regresión logística.

A diferencia de la regresión lineal múltiple, no exige los supuestos de linealidad, normalidad y homocedasticidad. Sí los demás antes referidos: tamaño muestral elevado (mínimo 15 casos por variable predictora), variables independientes relevantes y continuas, ausencia de colinealidad entre ellas y aditividad. • Modelo logit: deriva del modelado log-linear, pero aplicado al estudio de la causalidad. Se analiza la relación causa-efecto entre una única variable dependiente y varias independientes o predictoras. Su denominación "logit" se debe, igualmente, al cálculo del logaritmo de la razón de probabilidades de los casos donde acontece un determinado evento respecto de aquellos donde no se presenta. Pero, a diferencia de la regresión logística, la predicción de la probabilidad de ocurrencia de la variable dependiente puede hacerse con variables predictoras continuas y/o categóricas. '-·.1'1

YA,.'"''''''''''

discriminante

técnica multivariable de dependencia que analiza la relación entre una única :,:.:~ dependiente (no métrica o categórica) con varias independientes (preferi¡Qle~mente continuas). La variable dependiente la forman los grupos de casos o variables .......L.L"""V.L_

_PI'C~Vlé:lment:e configurados, por alguna técnica exploratoria de clasificación (como el ian:allS1S de conglomerados o factorial). Sus objetivos principales son:

1. Comprobar si una determinada agrupación de objetos es correcta y si queda

adecuadamente caracterizada por las variables que definen a cada grupo. Averiguar cuál es la combinación de variables predictoras (las funciones discriminantes) que hace máxima la diferencia entre los grupos.


418

Métodos de encuesta

3. Predecir la probabilidad de pertenencia de un objeto concreto (caso, variable) a de los grupos diferenciados, a partir de los valores que presente en las variables pre: dictoras. Como en el análisis logit, se emplea la razón de aciertos de la tabla de cla~ sificación como una medida del éxito del modelo en la predicción de la variable de~ pendiente (los grupos que se han tomado en función de la variable de interés. Por ejemplo, su rendimiento académico o su actitud ante la inmigración). Comparte los mismos supuestos de regresión lineal múltiple: tamaño muestral vado (mínimo 20 casos por variable independiente), variables independientes cOlnfulualS. ausencia de colinealidad, normalidad y homocedasticidad o igualdad de las matrices covarianza en cada grupo. Análisis multivariable de la varianza (MANOVA)

Ampliación del análisis univariable de la varianza, que explora, de manera simultánea, las relaciones entre varias variables independientes no métricas (normal. mente referidas como tratamientos) y dos o más dependientes métricas. Muestra gran adecuación a los diseños experimentales y, en general, cuando se comprueben los efectos de tratamientos diferentes. Determinar la existencia de diferencias en los valores medios de las variables dependientes, en cada grupo de tratamiento, es su objetivo principal. Ello exige el cumplimiento de tres supuestos esenciales:

1. Las variables dependientes han de estar distribuidas normalmente (normalidad). 2. Matrices de varianzas-covarianzas iguales en todos los grupos (homocedasticidad). En caso contrario, no podría medirse el efecto específico del tratamiento, porque se partiría de grupos inicialmente diferentes. 3. Tamaño muestral elevado. Ha de superar al necesario para la varianza simple, si se pretende que el modelo adquiera significatividad estadística. Correlación canónica

Una técnica analítica de dependencia que permite comprobar la existencia de interrelaciones entre una serie de variables dependientes y otra serie de variables independientes o predictoras. Ambas pueden ser métricas o no métricas. Su finalidad principal es la obtención de combinaciones lineales de cada serie de variables (dependientes e independientes) que maximicen las correlaciones entre ellas. Comparte supuestos y estadísticos presentes en los análisis de regresión lineal múltiple y discriminante.

Capítulo 6: El tratamiento de la información

419

írdlistlintéOls interrelaciones entre ellas y diferenciar entre variables observadas y las. Proporciona un modelo causal más ajustado a la pluridimensionalidad de las renes causales, que combina el análisis de regresión lineal múltiple, el factorial y el ndero, que contribuye a la representación gráfica de las relaciones causales aD'Ancona,2002a). Comparte los supuestos básicos señalados en el análisis de regresión lineal múltiA decir: normalidad, linealidad de las relaciones entre variables, aditividad de los tos, observaciones independientes, variables dependientes e independientes co~­ as ausencia de colinealidad entre las independientes, y muestra elevada aleatona. O~a serie de técnicas multivariables se agrupa en la clasificación de interdependencia a 6.2). De carácter simétrico, no distinguen entre variables dependientes e inde·entes. Les une el mismo objetivo básico de analizar las asociaciones o relaciones muentre las variables, buscando su agrupación (de casos o variables). Si bien, existen dincias entre ellas. La principal, no la única, atiende al nivel de medición exigido en las ·ables. Aunque en los últimos años han ido apareciendo modelos alternativos menos Stricthl0S, para variables no métricas, aplicables al análisis factorial y de conglomerados.

TÉCNICAS MULTIVARIABLES DE INTERDEPENDENCIA: Miden el grado de relación entre variables, sin diferenciar entre dependientes e independientes

Variables métricas

Análisis factorial: de factor común yde componentes principales

Modelos lag-linear

Correspondencias

Figura 6.2. Técnicas de análisis multivariable de interdependencia.

Ecuaciones estructurales

Término genérico que designa aproximaciones varias al análisis de la causalidad entre una serie de variables independientes y dependientes, con la particularidad de in-

Denominación genérica que engloba diversos procedimientos multivariables que analizan las varianzas compartidas por la serie de variables incluidas en el análisis, con


420

Métodos de encuesta

Capítulo 6: El tratamiento de la información

. •. . 1'-

.;.1 '

el propósito de descubrir si comparten alguna estructura "latente" (no directamente observable). Sus objetivos principales son: 1. Sintetizar la información proporcionada por las variables observadas (indicadores) en un número inferior de variables no observadas (factores comunes o componentes principales, según la variedad analítica que se realice). Esta serie de variables latentes ha de caracterizarse por aglutinar variables empíricas que estén bastante correlacionadas entre sí y escasamente correlacionadas con aquellas variables empíricas que conforman otra estructura latente. La "no correlación" entre grupos de variables es una propiedad importante. Significa que los indicadores miden "dimensiones" diferentes en los datos. 2. La obtención de puntuaciones factoriales, que actúen en representación de los factores o componentes en análisis posteriores (como discriminante, regresión o varianza). El análisis factorial puede ser exploratorio o confirmatorio. Exploratorio, cuando no se conoce, a priori, la configuración de los "factores", para lo cual se efectúa el análisis. Confirmatorio, si se parte de un modelo previo sobre la estructura latente en los datos y se persigue su confirmación. Dentro de los análisis exploratorios se distinguen el de componentes principales, que analiza la varianza total del conjunto de variables observadas, y los de factor común, que se restringen a la varianza "común" o compartida por la serie de indicadores que se analizan. En este último grupo están los análisis de: factor principal o de ejes principales, de máxima verosimilitud, de mínimos cuadrados generalizados y no ponderados,factorización alfa y factorización imagen. Asimismo, se diferencia el análisis factorial R (de variables) yel Q (de casos). Además, en los últimos años han aparecido programas, como PRINCALS, que permiten la consecución de modelos factoriales no métricos, desbancando la concepción tradicional "métrica" del análisis factorial. Todas estas modalidades se explican en Cea D'Ancona (2002a). El análisis factorial métrico exige el cumplimiento de cuatro supuestos básicos: tamaño muestral elevado, normalidad multivariable, linealidad y correlaciones elevadas entre las variables (sin las cuales no puede procederse a su agrupación, en función de su varianza compartida).

Análisis de conglomerados Una variedad analítica de interdependencia que persigue la clasificación de una serie de individuos, objetos o variables en un número reducido de grupos, llamados "co?glomerados". Con la condición de que éstos sean mutuamente excluyentes; es deCir, que los casos o variables que constituyan un conglomerado sean lo más similares posible entre sí (con respecto a algún criterio de selección determinado previamente) y diferentes respecto a los integrantes de los otros conglomerados.

421

..

j

Los grupos se definen en función del algoritmo de clasificación que se emplee en la agrupación de los casos o de las variables. La amplia tipología existente se engloba en dos amplios métodos de conglomeración: jerárquicos y no jerárquicos. Los primeros no parten de un número específico de conglomerados. Precisamente, el análisis se realiza en su búsqueda. Ésta puede hacerse de forma aglomerativa (el análisis comienza . con tantos conglom~radoscomo objetos a clasificar, y concluye con un solo conglo'_merado, que agrupa a todos ellos) o divisiva o de participación (procede a la inversa: -un solo conglomerado se va dividiendo hasta obtener tantos conglomerados como obJetos a clasificar). Por el contrario, los métodos de conglomeración no jerárquicos, entre los que se ~ncuentra el más aplicado, hasta la fecha, en datos de encuesta, el llamado K-medias, sírequieren la previa especificación del número de conglomerados a extractar. El pro~eso de formación de conglomerados comienza a partir de una partición inicial de los -datos. De ella se procede a la asignación de objetos a aquel conglomerado a cuyo cen-!ro se hallen más próximos. Se aplican procedimientos iterativos de estimación y re~stimación en busca de la optimización del criterio de selección. La consecución de conglomerados lo más diferenciados entre sí. ;:Escalamiento multidimensional Una variedad analítica análoga al factorial, con el que comparte un mismo objel'1i~0: la obtención de un número reducido de dimensiones, que permitan caracterizar "~los

objetos a ser clasificados. Pero, a diferencia del análisis factorial, en el multidi'1Jiensional se impone la restricción sobre el número de dimensiones a extraer. Han de "~er pocas para que puedan representarse, de forma gráfica, las agrupaciones obtenidas. En el escalamiento multidimensionallos datos se representan como puntos en un es'pacío "multidimensional". La distancia habida entre ellos se considera una expresión grá~~fade su semejanza o disimilaridad. Esta representación se hace más factible e inter:pt7table cuando la infonnación puede reducirse a dos o tres dimensiones, como máximo. ;{'i:,'Dependiendo del nivel de medición de las variables, se diferencia entre escala;;:·ento multidimensional "métrico" o "no métrico". En el primer caso (variables de in~~tvalo o de razón), la clasificación se hace a partir de la matriz de correlaciones entre .~~variables. En el segundo (variables nominales u ordinales), desde una matriz de ran~(;)~.De ella se obtiene información de la similaridad de los objetos. La configuración Ill1al será aquella que mejor represente a los rangos de la matriz inicial. :<'Como en el análisis factorial, el escalamiento multidimensional puede ser explo:~~t.0rio o confirmatorio. Depende de la finalidad que persiga.

r:,',,-:'i.También llamados modelos "lineales logarítmicos" o modelos "log-lineales". El ~?mbre le viene de la transformación logarítmica en los datos (las frecuencias ob~ervadas en las variables) para facilitar su aditividad: la posibilidad de sumar los dis-


422

Métodos de encuesta

tintos efectos de un conjunto de variables no métricas (a semejanza de las variables métricas en el análisis de regresión). Sus objetivos principales son: 1. Analizar las relaciones entre variables (cualitativas), representadas en tablas de contingencia multidimensionales. 2. Estimar la probabilidad de obtener un determinado valor en una celdilla concreta de la tabla. Las tablas de contingencia muestran gran utilidad en el análisis de variables cualitativas o no métricas. Pero la incorporación de terceras, cuartas e incluso cinco riables, para que actúen de control en la relación causa-efecto habida entre dos riables, complica su interpretación. La consideración de un mayor número de variables lleva al uso preferente de los modelos log-linear y logit, dependiendo de la finalidad estudio. Ya se dijo que el análisis logit se adecua más a relaciones de dependencia, mientras que el modelado log-linear a relaciones de interdependencia. En ambos modelos analíticos las casillas de la tabla se traducen a componentes, llamados parámetros lambda, que miden el efecto, de los valores que conforman cada casilla. É~tos serán relevantes en la interpretación del modelo, cuando su significatividad sea menor o igual de 0,05, como es usual (que corresponde a un valor Z ~ 1,96). De esta forma podrá conocerse la probabilidad de que un individuo concreto comparta una combinación específica de atributos de un conjunto de variables. Como en las tablas de contingencia, el ajuste del modelo en su conjunto se realiza mediante las pruebas de chi-cuadrado y de razón de verosimilitud, cuyos valores coinciden conforme aumenta el tamaño de la muestra. Análisis de correspondencias

Una técnica de más reciente desarrollo y adecuada al análisis de variables tativas. Parte, igualmente, de la configuración de las variables en una tabla de con.. tingencia, pero difiere en su objetivo principal: la representación de las distancias las filas y de las columnas, que componen la tabla, en unos ejes cartesianos. Para lo se transforma-el.. V'aloT--de-chl..cuad1"ado-enunamedida--métr-iGa--de-d-i-stafl€-ia-. Como en el escalamiento multidimensional, la proximidad de los puntos mide la milaridad, la asociación entre las categorías de las variables. El proceso seguido se ase:meja bastante, al igual que con otras técnicas de interdependencia como el análisis factorial. Se identifica el número adecuado de dimensiones que categoricen al objeto de estudio (mediante el porcentaje acumulado de varianza explicada). Para cada dimensión se derivan los autovalores (que miden la contribución relativa de cada sión e11 1a explicación de la variabilidad de las variables) y se identifica la asociación o relación entre las categorías de las variables mediante su "proximidad". Ésta se comprueba o en filas o en columnas, dependiendo de su ubicación. El obtener un valor chicuadrado elevado significa que existe un grado fuerte de "correspondencia" entre los atributos de las variables. Lo cual·permite la reducción dimensional de las proporciones

Capítulo 6: El tratamiento de la información

423

"objetos en una serie de atributos. Al mismo tiempo, se consigue la representación los objetos relacionados con esos atributos. \~•.' La calidad de los datos de encuesta y su evaluación

La correcta interpretación de los datos de encuesta precisa del conocimiento '-f.evio de los distintos errores que puedan haber coincidido en su realización, dete?~rando su calidad y limitando el alcance de sus resultados. En los capítulos prece~~ntes se han expuesto, de forma detallada y por separado, los errores de encuesta. ';"~ora se quiere ofrecer una visión conjunta de su aportación al error total de encuesta i;~~;~ómo afectan a la validez y la fiabilidad de los datos de encuesta, junto con actuacÍónes en su comprobación. La evaluación de la encuesta no ha de limitarse a lo expuesto en el subapartado 4.5, foncerniente a la prueba del cuestionario o pretest, sino que afecta a todo el proceso :~~encuesta, a todas las fases que convergen en su desarrollo. Pero, tampoco quiere re~ ~;~etirse lo dicho en páginas anteriores. Por esta razón, en este apartado sólo se expo"-'Den cuestiones relativas a validez y fiabilidad de los datos de encuesta. De los errores ,;j:.YJas actuaciones en su mejora hay que remitirse a lo dicho en los capítulos dedicados ';"?-8. cada uno de ellos.

~.3.1. La validez de los datos de encuesta

Uno de los criterios metodológicos más aplicados en la evaluación de los resultaos de cualquier investigación es el de validez. Se aplica en referencia al diseño de inT"'I.J'''.J..~Iu.",.J..'V.J...J..~ en general, y al instrumento de medición utilizado, en particular. En su aplicación al diseño de investigación, el primer requisito que se impone es U.U'~"'Lll-U,",jLV.J...l a los objetivos principales de la investigación. Si éstos no se satisfacen, ?'ta'ln'ves:tl,g:aC]lÓn quedaría desaprobada, no tendría "validez". En ese caso no procede .Yla·conS]lOeraC:;lón de otros criterios de validez. cumplimiento de los objetivos de estudio se analiza, conjuntamente, con los otros determinantes clave en el desarrollo de cualquier investigación: los recursos (ma~ """'~J~""'.a.",,'u, económicos y humanos) y el tiempo disponible para su realización. Ambos inen el buen término de la investigación y en la consiguiente consecución de los obpropuestos. Como se ha ido viendo en los capítulos que anteceden a éste, la ·A"'{"'':l'''t:~'7 de recursos y la premura temporal afectan negativamente a la calidad de la en>vu''''~""a. Si bien, la "abundancia" de recursos y de tiempo necesariamente no implica aude calidad. Depende de cómo se hayan administrado éstos, tanto en el diseño la encuesta como en su ejecución. Al cumplimiento de los objetivos se añaden otros criterios de evaluación. Los aplicados en la investigación cuantitativa son los criterios de validez interna, exde conclusión estadística y de constructo (cuadro 6.1). Inicialmente propuestos


424

Métodos de encuesta

por Campbell y Stanley (1970) y, con posterioridad, modificados por Cook y Campbell (1977) y por Reichardt y Cook (1979). Veamos en qué consisten y cómo se aplican a la investigación mediante encuesta.

CUADRO 6.1. Criterios de validez de los datos de encuesta Validez interna: control de explicaciones alternativas. 1. Creación de grupos de comparación equivalentes. 2. Efectuar varias mediciones.

Validez externa: la generalización de los datos de encuesta.

1. La calidad del marco muestral: errores de no cobertura. 2. El diseño de la muestra: error muestral. 3. La muestra finalmente observada: error de no respuesta. Validez de conclusión estadística: significatividad de los modelos estadísticos.

1. Incrementar el tamaño de la muestra. 2. Formar grupos internamente poco heterogéneos. 3. Adecuación de la técnica estadística a los objetivos de la encuesta y a las peculiaridades de la matriz de datos. Validez de constructo: la medición de los conceptos teóricos.

1. Delimitación precisa de los conceptos: errores de especificación. 2. Operacionalización múltiple.

Capítulo 6: El tratamiento de la información

425

Hace referencia al control de explicaciones alternativas en el establecimiento de rela<:lOIleS ele causalidad. Cuando este criterio no se satisface, los resultados de la encuesta ésta tiene una finalidad explicativa y no sólo descriptiva) serían cuestionables. En la investigación mediante encuesta este control de explicaciones alternativas. hacerse a posteriori, en la fase de análisis, y no previo a la recogida de información, como es característico de los experimentos. El empleo de técnicas analíticas multivariables permite la creación de grupos de "comparación" (o de controf) que sean equivalentes al de observación (iguales en función de los valores de la variable que se controle). Ello permite el "control" de la influencia de variables "perturbadoras" en una relación causa-efecto entre dos o más variables. Para que los resultados de encuesta satisfagan el criterio de validez interna, ha de demostrarse que se han "controlado" explicaciones alternativas a las relaciones causa-efecto analizadas. Para ello resulta determinante: 1. La creación de grupos de comparación equivalentes al de observación, excepto en la variable o variables independientes cuyos efectos quiere medirse. Esta recomendación, común para aumentar la validez interna en estudios explicativos, es fácil de implementar en la investigación mediante encuesta por medio del control estadístico "a posteriori". Más difícil es, por el contrario, el control de cualquier suceso externo e interno a la investigación que pueda afectar a los resultados de la encuesta. 2. Efectuar varias mediciones del fenómeno que se analiza. En estudios longitudinales, donde una misma encuesta se repite en distintos momentos temporales y, preferentemente, a una misma muestra, como sucede en las encuestas panel. Éstas son de gran utilidad en el análisis de las causas del "cambio", además de en la fiabilidad del instrumento de medida: el cuestionario. Las personas de las que se extrae la información, de forma reiterada, son las mismas. Lo que varía son las circunstancias en las que se encuentran con el paso del tiempo.

• Validez convergente. • Validez discriminante o divergente.

Validez interna

Un criterio prioritario en estudios explicativos, que indagan en la "causalidad" de hechos, conductas, opiniones, actitudes o cualquier otro fenómeno que trate de explicarse. Para Campbell y Stanley (1970) es el "sine qua non" en cualquier indagación empírica. Es un criterio de validez previo a otros. Un diseño de investigación ha de ser internamente válido para ser externamente válido y para producir hallazgos adecuados (Fink, 1995: 56).

Un ejemplo ilustrativo es el estudio clásico y pionero, en el uso de la encuesta panel, de Lazarsfeld, Berelson y Gaudet, publicado en 1944 con el título The people's choice (descrito en el capítulo 1). El objetivo principal era comprobar la influencia de la campaña electoral en las intenciones de voto de los electores del condado de Erie (Ohio), en las elecciones presidenciales de 1940 (la campaña electoral de Wilkie-Roosevelt). Para este propósito, La(zarsfeld y colaboradores diseñaron un mismo cuestionario que tendrían que pasar a la misma muestra de electores varias veces, entre mayo y noviembre de 1940. La muestra la integraban 600 personas que fueron elegidas, mediante un diseño muestral probabilístico,


426

Métodos de encuesta

entre los habitantes de Ene con derecho a voto. El cuestionario se les administró, por primera vez, en mayo, antes del comienzo de la campaña electoral. La segunda vez, durante su desarrollo. Y, la última vez, momentos antes de celebrarse las elecciones presidenciales. El extraer información de las mismas personas en diferentes momentos permite analizar mejor el efecto de la campaña electoral en sus preferencias de voto: si éste es modificado o es consecuente al desarrollo de la campaña electoral. Para evitar cualquier explicación alternativa debida a la aplicación repetida de un mismo cuestionario a las mismas personas en diferentes momentos temporales (lo que puede afectar a las respuestas en mediciones posteriores), en las tres ocasiones en las que se pasó el cuestionario, éste se administró igualmente a una muestra alternativa de electores. Aunque pertenecía a la misma población de estudio, las unidades de la muestra diferían en cada fase de recogida de información. Mediante procedimientos aleatorios en cada ocasión se elegía ex profeso una muestra diferente de electores para que actuasen de grupo de control en la eliminación de explicaciones alternativas a la relación causal que se analizaba: la influencia de la campaña electoral en el voto. Muestras de individuos diferentes, pero de un mismo perfil sociodemográfico, que permitían comprobar los efectos de aplicar el mismo cuestionario, a las mismas personas, de forma reiterada.

La encuesta panel se enfrenta a dos problemas principales a considerar en su aplicación: • Uno, es el ya referido a su efecto en los errores de medición, propiciado por pasar el mismo cuestionario a las mismas personas en distintos momentos temporales. La memoria, el aprendizaje, el poder repensar las respuestas para la siguiente ocasión en que se les pregunte, el saber por adelantado qué se les va a preguntar, puede afectar a las respuestas de mediciones posteriores ajenas a la evolución del fenómeno que se analiza. Este efecto negativo es más probable, cuanta mayor proximidad en el tiempo exista entre las fechas de recogida de información. • Dos, la llamada mortalidad experimental. Término que hace referencia a la pérdida de unidades muestrales en el curso de la investigación. El error de no respuesta se incrementa, debido a la desmotivación de las unidades que integran la muestra para seguir participando en el estudio u otros motivos que impidan su continuidad: fallecimiento, enfermedad, cambio de residencia sin haberlo comunicado al equipo investigador. A diferencia del anterior, esta fuente de invalidez es más probable conforme aumenta el período de tiempo que abarca la encuesta panel y son más las oc~­ siones en que se pasa el cuestionario. Su repercusión en los resultados del estudIO dependerá, obviamente, de la magnitud de la no respuesta (cuántas personas hayan dejado de participar en la encuesta) y de su composición. Es decir, s! ~re­ sentan un perfil sociodemográfico que les diferencie de aquellos que contmuan participando en la investigación. Más, si cabe, cuando las características dife-

Capítulo 6: El tratamiento de la información

427

renciales están relacionadas con el tema de estudio. Todo lo cual afecta a la representatividad de la muestra (como se expuso en los capítulos 3 y 5). Su inciden~ia negativa en la calidad de la encuesta puede evitarse, preferiblemente, medIante actuaciones preventivas dirigidas a la reducción de la tasa d~ no respuesta, descritas en el subapartado 5.3.2.1. Como el uso de gratificaClOnes o cualquier otro incentivo que despierte el interés de los sujetos a seguir participando en la encuesta. Validez externa

A diferencia de la validez interna, con cuyo adjetivo se destaca la inferencia "interna" de las relaciones observadas en los casos analizados, la validez externa apunta a la "externalización" de las relaciones observadas, a la generalización de los resultados de l~ ,en.cues~a. Tanto a la población concreta de la que se extrae la muestra (la poblaclOn mclmda. en el m~rco muestra!), como a otros contextos espaciales y temporales. Afecta a la mferencla a otras personas que no han sido encuestadas. En palabras de Cook y Campbell (1979: 37) es: La validez aprox~mada con la que podemos inferir que la relación causal presumida pu~de ser. generahz~da, y a través de medidas alternativas de la causa y el efecto, y a traves de dIferentes tIpos de personas, marcos y tiempos.

. El que u.na encuesta tenga validez externa dependerá, lógicamente, de la presenCta, la magmtud y las características de los errores de no observación. En consecuencia, habrá que indagar en la "representatividad" de la muestra: en qué medida ésta ha logrado ser una representación, a pequeña escala, de la variedad de unidades que componen la pobl~~ión de estu~io, en relación con el problema de investigación. Como se diJO en los capItulos 3 y 5, la pérdida de "representatividad" de la muestra se debe a la existencia de errores de no cobertura, de muestreo y de no respuesta. Por tanto, habrá que evaluar: 1. La calidad del marco elegido para la extracción de la muestra. De él se exige que s~a completo (comprehensivo), actualizado y que evite duplicidades. Para es~ar los errores de no cobertura habrá que conocer la tasa de población no cublerta ~~ el ma,:co muestral, y ,si ~resentan características distintas respecto a la po?lac~?n cublerta. El c.onocllruento del perfil sociodemográfico de los "exclmdos del marco permIte su uso como variables de "cuota" o de clasificación. S~ aplicarán tanto en ~l diseño de la muestra, para garantizar su presencia en la lllisma, como en lo~ ajustes "postencuesta", que reduzcan los "desequilibrios" e~ ~a muestra medIante la ponderación. En la medida en que las variables utiJ!zadas ~n la ponderac!~nest~n relacionadas c~n el problema de investigación y d~erencIen a ~a pO?laCIOn cublerta de la no cublerta en el marco, se conseguirá mejorar las estlmaclOnes muestrales. En caso contrario, no.


428

Capítulo 6: El tratamiento de la información

Métodos de encuesta

Se insiste en que las estimaciones muestrales sólo son inferibles a la población incluida en el marco muestral. Si ésta coincide con la población de estudio, su repercusión en la calidad de los datos de encuesta será menor. Para facilitar su evaluación, se recomienda que en el informe de la encuesta se especifique la población de estudio y el marco utilizado en la selección de la muestra. Esta información es imprescindible para poder precisar el alcance de los resultados de la encuesta: sus posibilidades de "inferencia". 2. El diseño muestral. Si se ha dado a todos los integrantes de la población del marco la misma probabilidad de ser seleccionados para integrar la muestra. Ello exige no limitar el análisis a la muestra diseñada o a los procedimientos probabilísticos aplicados en la selección de la muestra. Se requiere información exacta de la muestra finalmente observada y de las actuaciones llevadas a cabo durante el trabajo de campo para su selección. El error muestral que suele aparecer en la ficha técnica de una encuesta es muy genérico. No ha de caerse en el "error" de su interpretación como una medida de resumen de los distintos errores de estimación de una encuesta. Ni siquiera de los errores de muestreo. En general, se estiman a partir del tamaño de la muestra y rara vez se precisa el efecto del diseño muestral aplicado. Es decir, el procedimiento seguido hasta la selección de las unidades últimas de muestreo y su incidencia en ~l error muestral. Recuérdese que su magnitud está afectada tanto por el tamaño de la muestra como por su representatividad. 3. La no respuesta (total y de ítem), que constituye un error trascendental que deteriora la calidad de la encuesta por muestreo. Pese al uso común de la tasa de respuesta como un indicador de calidad de la encuesta, se requiere información complementaria de la composición de la muestra que finalmente ha respondido al cuestionario y de su correspondencia con la población de interés. Esta información suele tenerse respecto a la no respuesta de ítem (o pregunta), pero rara vez el informe de una encuesta menciona el error de no respuesta total (o de unidad): aquellas unidades de la muestra original que no han acabado participando en la encuesta, bien por no contacto, bien por rechazo. Como en los otros errores de no observación, la incidencia en la calidad de la encuesta de los errores de no respuesta dependerá de su magnitud (la tasa de no respuesta habida) y de su composición (las características diferenciales entre quienes sí responden y aquellos que no aportan información). En especial, cuando estas diferencias están relacionadas con el problema de investigación. Es importante conocer el motivo de la no respl¡lesta para poder prever actuaciones encaminadas a su reducción. Este conociniiento es más difícil en la encuesta por correo. Sobre todo, respecto a la no respuesta total. Mayor dificultad para conocer, con exactitud, el motivo de la no devolución de los cuestionarios. En las otras modalidades de encuesta puede ayudar el aumento del número de revisitas o recontactos telefónicos. La no respuesta de ítem está, en cambio, más relacionada con el diseño del cuestionario (demasiado largo, muchas preguntas abiertas, opciones de res-

429

puesta restringidas en preguntas cerradas, preguntas filtro con rutas mal esrecificadas y otros errores en la formulación y ubicación de preguntas señalados en el capítulo 4), con la actitud del encuestado (no sabe qué responder, por falta de conocimiento o de decisión, o no quiere dar una respuesta por considerarla comprometida) y la actuación del entrevistador (no realiza la pregunta, ya por despiste, ya por no creerla pertinente; o hace la pregunta, pero no anota la respuesta, o lo hace aunque de forma poco clara, ilegible provocando su eliminación de los análisis). La intervención del entrevistador también es crucial en la reducción del error de no respuesta total, como se vio en el apartado 5.3. Ha de procurarse que los errores de no observación no se traduzcan en errores sistemáticos, por sus efectos más nocivos en la calidad de la encuesta. Representan desviaciones de las estimaciones muestrales, respecto a los correspondientes parámetros poblacionales, que es constante en las diferentes repeticiones de la encuesta. De ellos ha de hablarse en el informe de la encuesta, para que el lector pueda valorar sus efectos en los resultados de la misma y su representatividad. La validez externa de una encuesta se relaciona con: • Una muestra final elevada y seleccionada siguiendo métodos probabilísticos que garanticen la igual probabilidad de selección de todas las unidades de la población de estudio: la reducción del error muestra/. • Una muestra heterogénea, que "cubra" los distintos integrantes de la población de estudio y contextos temporales y espaciales varios: la reducción del error de no cobertura. • Una muestra final que se ajuste a la inicialmente diseñada, en su tamaño y composición. Exige la adopción de actuaciones preventivas que ayuden a la participación en la encuesta: la reducción del error de no respuesta. Cuando las actuaciones preventivas fallan, es habitual el recurso a ajustes estadísticos "postencuesta" varios, en forma de ponderación o de imputación, que permitan "equilibrar" la muestra (véase subapartado 5.3.2.2). La comparación de la muestra final con la población de estudio, utilizando datos estadísticos censales, ayuda a medir la representatividad de la muestra y a su "equilibraje" respecto a la población de estudio. Validez de conclusión estadística

Una variante de la validez externa circunscrita al análisis estadístico de los datos de encuesta, a su adecuación a los objetivos de la misma. Para Cook y Campbell (1979: la validez de conclusión estadística concierne a: Inferencias sobre si es razonable presumir covariación dado un nivel a especificado y las varianzas obtenidas.


430

Métodos de encuesta

La validez de conclusión estadística afecta a la significatividad de los análisis estadísticos (las pruebas de hipótesis), a las posibilidades de inferencia de los modelos estadísticos obtenidos con los datos que se han analizado. Incide el tamaño y la heterogeneidad de la muestra. A mayo.r tamaño muestral, aum~n~a la prob,~~ili~~d d~ q~~ los análisis estadísticos en ella reahzados resulten ser estadIstIcamente sIgnIfIcatIVOS . También afectan los errores típicos de las estimaciones muestrales. Su menor cuantía contribuye a la significatividad estadística de las estimaciones muestrales (valores t empíricos superiores a los teóricos, al igual que los otros estadísticos empleados en las pruebas de hipótesis, como la razón Fa chi-cuadrado, por ej~mp~o). Los errore~ típicos descienden, a medida que disminuyen las varianzas o varlabl1Idad de las vanables incluidas en el análisis. Por esta razón, para aumentar la validez estadística se recomienda: 1. Incrementar el tamaño de la muestra que se analiza. 2. Formar grupos internamente poco heterogéneos. . . 3. Adecuar la técnica analítica a los objetivos de la encuesta y a las pecuharIdades de la matriz de datos. Se precisa que los datos satisfagan los supuestos básicos que exige la correcta realización de la técnica estadística que se elija, en relación con los objetivos de la encuesta. Los supuestos de normalidad multivariable, de homoceda~tici~ad.y de inde~~n.dencia de los términos de error, por ejemplo, son comunes a varIas tecnIcas de anahsIs multivariable, como el análisis de regresión lineal múltiple o el análisis discriminante (Cea D'Ancona, 2002a; Hair y colaboradores, 1999). Su incumplimiento está afectado por el tamaño de la muestra y el nivel de medición de las variables (variables continuas: de intervalo o de razón). Validez de constructo

Previamente definida por L. J. Cronbach y ~ E. Meehl (en "Construct validity in psychological tests". Psychological Bulletin, 52: 281-302). Se considera una variaJ?te de la validez interna, aunque circunscrita a la adecuación de la medición de los conceptos teóricos principales de la encuesta.·Si ha logrado cubrirse toda su dimensionalidad y si los indicadores elegidos en su medición realmente son "válidos". Su grado de cumplimiento ~ependerá de la existencia de errores de medición.~ de especificación (expuestos en el capítulo 4). Recuérdese que ~ay er,:ores de ~sp.eciflca­ ción cuando el concepto implicado en la pregunta del cuestIonarlO no COInCIde con aquel que debería medirse. Esta disonancia propicia estimaciones errón~as de los datos de encuesta que no logran "medir" con precisión el objeto de estudIO. Entre el concepto latente y los indicadores elegidos para su medición ha de haber una plena correspondencia. La validez de constructo ~~t,á, por tant?, afectada por la adecuación del cuestionario como instrumento de medlcIon. De Velhs (1991: 47) la define como:

Capítulo 6: El tratamiento de la información

431

La extensión a la que las correlaciones empíricas casan con el modelo predicho y proporciona alguna evidencia de lo bien que la medida se "comporta" como la variable que se supone que mide.

Para aumentar la validez de constructo generalmente se aconseja: 1. Una delimitaéión clara y precisa de los conceptos teóricos que quieren medirse en la encuesta: la reducción de los errores de especificación. 2. La operacionalización múltiple de los conceptos, porque permite una mejor aproximación a su significado real. Para cada dimensión latente diferenciada en el concepto a medir habrá que elegir dos o más indicadores. La validez y la fiabilidad sólo pueden asegurarse con múltiples indicadores (Graves, 1989: 22-23). Si no existe ningún acuerdo claro en cómo medir un concepto, mídelo de varias formas distintas. Si el concepto tiene diversas dimensiones diferentes, mídelas todas. Y, por encima de todo, tienes que saber que el concepto no tiene ningún significado distinto al que le dimos (Babbie, 1992: 134).

Se reitera (como se dijo en el capítulo 4) la necesidad de medir un mismo concepto la forma más amplia posible, con más dimensiones e indicadores por cada dii«c:JL.J..J.v.J..J.IJ.I.."".J..J.latente del concepto teórico. Si bien, hay que precisar que, antes de afirmar los resultados son "válidos" o "inválidos", en función de la convergencia o divergencia con los obtenidos en otras mediciones, habrá que comprobar si los distintos indicadores elegidos realmente miden el mismo concepto. D. T. Campbell fue uno de los primeros defensores del uso de múltiples métodos la medición de las variables en la investigación social. La obtención de los mismos .J.v":'UJ.II,.U.,",lV~ con diferentes métodos proporciona lo que él llama "validez convergente" U""JlJ.J..J.Jl~U. en 1954 en "Operational delineation of 'what is learned' via the transposition · Psychological Review, 61: 167-174) o "triangulación" (en 1953 en A study /pof1pl-,\,hJrn amongsubmarine officers. Columbus, ühio State University Research J:"401Lln{latllOn). Pero es a su artículo, escrito junto con D. Fiske, de 1959 ("Convergent discriminant validation by the multitrait-multimethod matrix". Psychological Jju:lle~tln. 56: 81-105), al que comúnmente se atribuye la especificación de la contribude la operacionalización múltiple a la validez de constructo. De acuerdo con estos autores, la justificación de una nueva medida de constructo exige demostrar "validez convergente": • Validez convergente: cuando una forma concreta de medir un concepto "converge" con otras maneras diferentes de medirlo. Las correlaciones entre ellas deberían ser elevadas. • Validez discriminante o divergente: las medidas de un constructo o concepto latente deberían no estar correlacionadas con medidas de constructos diferentes.


432

Métodos de encuesta

Por su parte, Carmines y Zeller (1979) distinguen la validez de constructo de la validez de contenido y de criterio: • Validez de constructo: cuando se compara una medida concreta con aquella que teóricamente habría que esperar, a partir de las hipótesis derivadas del marco teórico de la encuesta. Por ejemplo, en la medición de la delincuencia en encuestas de autodenuncia, a la población en general, la incidencia de la variable clase social en la explicación de la actividad delictiva se debilita. Al contrario de lo que sucede cuando la encuesta se hace a la población recluida en centros penitenciarios.

• Validez de contenido: grado al que una medición empírica cubre la variedad de significados incluidos en el concepto. Quiere decir, si consigue cubrir el "d~9­ minio" de significados del concepto. Por ejemplo, en una encuesta de actitudes ante la inmigración, si los distintos indicadores empleados en su medición abarcan toda la dimensionalidad del concepto de racismo. Obviamente, ello exige la previa revisión, en la literatura especializada, de cómo diferentes autores han medido el concepto objeto de estudio: la extracción de las distintas dimensiones que hasta entonces se cree que "cubren" el dominio de su significado, junto con la serie de indicadores seleccionados para cada dominio.

En la medición de aspectos subjetivos, como actitudes o creencias, es más difícil determinar si la serie de preguntas elegidas para su medición logran cubrir el dominio de su contenido. Lyons Morris y colaboradores (1987: 99) precisan que "una medida que se centra demasiado en una categoría no tiene validez de contenido para medir el todo. Sólo tiene validez de contenido para la categoría que mide". Por su parte, Bohrnstedt (1983: 100) va más allá y niega que.la validez de contenido sea un tipo de validez. En su opinión, se trata más bIen de "una serie de procedimientos para muestrear dominios de contenido que si es seguido ayuda a asegurar la validez de constructo". • Validez de criterio: la validez de la medición se comprueba comparándola con algún "criterio" (o medida generalmente aceptada) que se haya ~~pleado con anterioridad para medir el mismo concepto. Dentro de ella se dIstIngue entre validez concurrente y predictiva: i. Validez concurrente: cuando la medición nueva se correlaciona con un criterio adoptado para el mismo momento. Por ejemplo, comparar los resultados de una encuesta de intención de voto (a pie de urna) con los "oficiales" al término de las elecciones.

El coeficiente de correlación es el estadístico de uso más extendido para cuantificar la validez de criterio. En su aplicación, en la comprobación

Capítulo 6: El tratamiento de la información

433

de la validez concurrente, ésta normalmente se determina por las correlaciones habidas entre los resultados registrados en el instrumento de medición que se aplica y los observados en una medición diferente, pero referida al mismo objeto de estudio y en el mismo contexto sociotemporal. ií. Validez predictiva: cuando la comparación se hace respecto a un "criterio" fu!uro que esté correlacionado con la medida. Por ejemplo, comparar las respuestas recabadas en una encuesta de actitudes ante la inmigración a empresarios con la conducta que éstos posteriormente manifiestan en la contratación de sus empleados.

Un instrumento de medida en general tiene validez predictiva cuando puede utilizarse para "predecir" una conducta futura. Al igual que la validez concurrente, la predictiva se cuantifica mediante el cálculo de coeficientes de correlación de las respuestas dadas en la encuesta con medidas posteriores de su conducta que se consideran "válidas". Ambos tipos de validez requieren la comparación de medidas alternativas de un mismo concepto. A mayor correlación entre ellas, más validez adquieren. Pero, como precisa De Vaus (1990), estos procedimientos de comprobación de la validez de una medición no están exentos de polémica. Presentan dos problemas principales: • Uno, se asume la validez de la medida establecida con preferencia a la nueva. Una baja correlación entre la medida nueva y la establecida, supone que la medida nueva es "inválida". Pero, tal vez, la inválida sea la antigua (la tradicionalmente aceptada) o la futura, y no la nueva. • Dos, muchos conceptos en las ciencias sociales carecen de mediciones (generalmente aceptadas) que puedan emplearse para la comprobación de nuevas mediciones. La dificultad es mayor cuanto más abstractos son los conceptos que quieren medirse. Muchos de los constructos de interés para los investigadores de encuesta no tienen criterios contra los que la validez de una medida pueda ser fácilmente asegurada. Cuando los tienen, 10$ criterios pueden ellos mismos estar tan pobremente medidos que los coeficientes de validez están mal atenuados debido a errores de medición. Por estas razones, los investigadores de encuesta han encontrado que las valideces relativas a criterio son de uso limitado (Bohrnstedt, 1983: 98).

La comprobación de la validez de la medición hecha a través de encuesta se complica cuando se miden actitudes, cuyo conocimiento no siempre permite "predecir" una conducta futura real. Como ya indicara Lapiere, en su famoso artículo de 1934 ("Attitudes vs. Action", publicado en la revista Social Porces), la encuesta puede captar una reacción verbal ante una situación enteramente simbólica, que necesariamente no coincide con la actuación "real" del encuestado cuando se enfrenta con la situación planteada. Pero la ma-


434

Capítulo 6: El tratamiento de la información

Métodos de encuesta

~a investigaci~nsu~le fal.lar en identificar cuál es la mejor forma de pregunta. Sirve solo par~ advertrr al mvestIgador de la sensibilidad de las respuestas a la forma de la pre?unta, SI las respuestas difieren marcadamente, o aumentar sus sentimientos de segundad en los resultados, si no difieren.

yor dificultad en la comprobación de la validez en la medición de actitudes también se explica por su mayor vulnerabilidad a sesgos de respuesta, propiciados por: a) El deseo de "agradar" o el temor a ser evaluados: el llamado sesgo de deseabilidad social. b) La no comprensión o conocimiento sobre lo que se pregunta. La imprecisión de la respuesta puede deberse a que la pregunta no se entiende o porque los encuestados no son realmente conscientes de sus propias actitudes. c) La falta de objetividad en la administración del cuestionario. Se prefiere la estandarización. Es decir, que todas las unidades que componen la muestra sean interrogadas siguiendo el mismo procedimiento. d) O simplemente porque se han preguntado pocas preguntas para medir la actitud y la intencionalidad de las mismas es fácilmente perceptible por el encuestado, afectando a su respuesta. Esto ha sido constatado por la propia autora en la evaluación que hace de encuestas de actitudes ante la inmigración (Cea D'Ancona, 2002b; Cea D'Ancona, 2004b). Y, en referencia genérica a ello, valga la siguiente reflexión de Henerson y colaboradores (1987: 135):

Cuando midas actitudes con instrumentos de autodeclaración, como cuestionarios, por ejemplo, el argumento más frecuente del escéptico es: "Los que responden tienen una idea de qué respuestas son socialmente deseables. No deseando parecer desviados, ellos ocultan sus sentimientos verdaderos y se inclinan por respuestas para conformar un modelo de cómo ellos deberían responder" [...]. Donde esto ocurra, el instrumento, por supuesto, no está midiendo actitudes verdaderas, sino que está detectando más las ideas de la gente sobre lo que es socialmente deseable. El instrumento es inválido e inútil. Sesgo de deseabilidad social que, como ya se mostró en el capítulo 4, afecta más a personas de mayor nivel educativo, que son quienes más perciben la intencionalidad de la pregunta. A diferencia de los otros sesgos de respuesta (aquiescencia, primacía, recencia), más habituales en personas de menor nivel cultural.

Heath y Martin (1997) apuntan la necesidad, en las ciencias sociales, de teorías que relacionen conceptos no observables con conductas observables. Se precisan teorías sobre los determinantes de la conducta porque ésta puede estar afectada por otros factores distintos de las actitudes. Por ello el recurso a la "conducta" en la "validación" de la medición de una actitud puede no ser concluyente. No siempre la falta de congruencia entre actitud y conducta significa que la medición es "inválida". Ante la dificultad de validar las respuestas a preguntas no factuales (o de hechos), la investigación de los efectos de dichas preguntas normalmente se hace mediante los experimentos "split-ballot". Formas alternativas de una misma pregunta se administran a muestras comparables, integradas por sujetos que comparten las mismas características. Se comparan sus respuestas y se comprueba su consistencia. El interés se pone más en la "consistencia" que en la "validez". Lo que significa, en opinión de Kalton y Schuman (1982/2002: 210-211), que

435

L.a for~a más ~encilla de comprobar la validez de un instrumento de medida (el cuestIonano, por e~emplo), es analizar cómo fue desarrollado y administrado, a los encue~tados, .comparandolo con otros que traten la misma temática, preferiblemente que esten pubhcados. Como hace Cea D'Ancona (20ü4b) en la evaluación de las encuestas de actitudes ante la inmigración, contrastando las efectuadas, hasta la fecha por el Centro de Investig~cion.es ~ociológicas (CI~): ~on las de CIRES/ASEP (cent;o de estudios dirigido por Dlez,Nlcolas), CEMIRA (dmg¡do por Calvo Buezas) y las Comisiones Europeas (los eurobarometros), para unos mismos indicadores y fechas comparables. Pero e~isten otras formas habituales de comprobar los errores de medición de una encuesta. Esto~ ~e resumen ~n el ~uadr? 6.2. Antes de pasar a su exposición, adviértase que. la. evaluaclOn del cuestlOnano mejora cuando se combinan varios de dichos procedImIentos.

CUADRO 6.2. Procedimientos alternativos de comprobación de la validez de medición de encuesta a) Experimentos split-ballot. b) Estudios de contrastación de informes adIninistrativos.

c) Observación del proceso de encuesta. • • • • •

Pruebas in situ. Grabación de la entrevista. Entrevistas individuales y/o grupales a encuestadores y encuestados. Entrevistas cognitivas a encuestados. Datos de control en el cuestionario a cumplimentar por el entrevistador y el encuestado. • Reentrevista. d) Evaluación de los cuestionarios

• Consulta a "expertos". • Análisis pormenorizado de las preguntas del cuestionario. e) Estudios de grupo de criterio.


436

Capítulo 6: El tratamiento de la información

Métodos de encuesta

Experimentos "split-ballot"

La estrategia más seguida, hasta el presente. Desde los iniciales experimentos llevados a cabo por Cantril y sus colaboradores, desde 1940, en The Office of Public Opinion Research, de la Universidad de Princeton, a los más populares de Schuman y Presser (1981/1996), por su mayor divulgación, hasta los más recientes publicados revistas científicas, como Public Opinion Quarterly. Varios de ellos han sido expues~ tos en el capítulo 4 y figuran en la bibliografía adjunta. Mediante los experimentos "split ballot" se comprueba cualquiera de las fuentes de errores de medición. Recuérdese que éstos constituyen desviaciones de las respuestas captadas mediante encuesta de los valores "verdaderos" en la población, ya debido al método de encuesta aplicado, ya al diseño del cuestionario, a la intervención del entrevistador (en encuestas mediante entrevista), a la actitud del encuestado y/o al tr~,. tamiento hecho de la información recogida mediante encuesta. Para su comprobación, la muestra se divide al azar en dos mitades, o más, dependiendo del número de formulaciones alternativas que se hayan realizado de la misma pregunta, de sus opciones de respuesta (para comprobar los efectos de aquiescencia, primacía, recencia, la inclusión de respuestas intermedias o de no opinión) y de su disposición en el cuestionario (efectos de contexto, de asimilación, de contraste, de sustracción, de secuencia). Garantizada la homogeneidad o equivalencia de los distintos grupos, fundamentalmente gracias a la selección aleatoria de sus integrantes, las diferencias en las respuestas se interpretan como debidas al error de medición que se esté analizando. Estudios de contrastación de informes administrativos ("record check study")

Estudios en los que las respuestas obtenidas mediante encuesta se contrastan con las registradas en informes oficiales de. los constructos que se miden. Por ejemplo, con informes policiales (en la medición de delincuencia), con informes académicos, hospitalarios, fiscales. De la calidad de estos informes dependerá el éxito de la comprobación. De que estén exentos de errores de medición y de no observación (que incluyan valores "verdaderos" de las variables de interés), ya que se toman como referente en la comprobación de la validez de la encuesta. Por ello es conveniente que el investigador, previamente, compruebe el grado de adecuación de los informes que va a utilizar con la "realidad" que analiza. A este inconveniente principal se suma la dificultad de disponer de informes con mínimas garantías de "validez" para todos los conceptos de interés en la investigación social. No siempre lo que mide la encuesta se corresponde con la información que proporciona el informe. Además, están los límites comunes al uso de fuentes documentales y estadísticas. A decir, a) La no disponibilidad, por ser difícil o estar restringido su acceso: límites de privacidad.

43'/

b) La coincidencia temporal de los datos de encuesta con la información recogida en los informes. De ellos se exige que se adecuen a los objetivos del estudio, al contexto socio-temporal y a la población que se analiza. Falta de control y/o de conocimiento del proceso de obtención y de registro originario de la información. Lo cual limita la evaluación de la calidad de los datos de los informes y su interpretación. ·.lhc'fl~lJíJrlflM

del proceso de encuesta

Para comprobar si su puesta en "práctica" se llevo a efecto como se diseñó y la poincidencia de sus protagonistas (entrevistador, encuestado) en los errores de enNo sólo de medición, sino también los incluidos en la no observación. Aquí se lo dicho en el apartado 4.5, en referencia a la prueba in situ (por otro entre:-V.lL:ll.CU. o un supervisor) y a la grabación de la entrevista (para su supervisión posProporcionan información de gran utilidad en la evaluación de los datos de enV~'VU""""''l no limitada al cuestionario. Abarca todo el proceso en su desarrollo. ¡;';K.eC1JéI"OeSe'l por ejemplo, la contribución del entrevistador a los errores de: .lV.I.

• No cobertura. Cuando sustituye las unidades muestrales difíciles de localizar por otras más accesibles, pero de distinto perfil sociodemográfico. • Muestreo. No aplicando, con rigor, las directrices marcadas para la selección aleatoria de las unidades últimas de muestreo. • No respuesta total. No resolviendo, con éxito, las negativas de las unidades muestrales "contactadas" para participar en la encuesta. • No respuesta de ítem. Porque se ha saltado la pregunta o no ha anotado la respuesta; se ha conformado con una respuesta de "no sabe/no contesta", sin haber intentado que dé alguna (aclarándole dudas ante la pregunta, dándole tiempo suficiente para pensar en la respuesta); ha registrado una respuesta que será desestimada por considerarla "inválida" (no está correctamente anotada, es ambigua o no acorde con lo que se pregunta). • De medición. Propiciado por cómo lleva a cabo la entrevista: lee las preguntas, registra las respuestas, el orden seguido en la formulación de la pregunta, si hace todas las preguntas, si contribuye a la respuesta, etcétera.

La observación directa o indirecta del desarrollo de la entrevista ayuda a discernir errores debidos a una actuación impropia por parte del entrevistador de los ocasionados por un mal diseño del cuestionario. Recuérdense los siguientes indicios de "fallos" en el diseño del cuestionario que pueden detectarse con la observación de la entrevista: • La no lectura exacta de la pregunta puede deberse a su mala redacción. • La omisión de preguntas puede deberse a su ubicación en el cuestionario y, en caso de preguntas filtro, a una incorrecta especificación de la ruta en el cuestionario.


438

Métodos de encuesta

Capítulo 6: El tratamiento de la información

• La solicitud de alguna aclaración de la pregunta, por parte del encuestado, es dicativo de que la pregunta no es "clara". • Si el encuestado interrumpe al entrevistador antes de que termine de leer la gunta, puede indicar que la pregunta es demasiado larga. • Si proporciona respuestas "inadecuadas", puede deberse a fallos en las pn~Qllnt:~~ • Cuando tarda más tiempo del esperable en contestar a la pregunta, sugiere pro~ blemas en la pregunta, en su enunciado o en las alternativas de respuesta. La tencia de la respuesta es comúnmente utilizada como una medida de calidad la pregunta. La observación directa de la entrevista puede complementarse con la ln"t{'\r't''na/~''Á extraída de los propios implicados, los entrevistadores y los encuestados, de forma dividual o en grupo, como se dijo en los apartados 4.5 y 5.2. Las entrevistas cognitivas a los mismos encuestados, para conocer el proceso guido en la respuesta a las preguntas del cuestionario, es de gran utilidad en la tección de errores de medición debidos a: problemas de comprensión de las pr~~QUntalS. de retención de la información en ella dada y de la influencia en la respuesta de las al~ ternativas proporcionadas en la pregunta. También, es de interés en el análisis de significados de la pregunta atribuidos por los propios encuestados. De los encuestados puede igualmente extraerse información, referida a la cumplimentación del cuestionario (mediante entrevista o autoadministrado), gracias a unas preguntas concretas incluidas al final del cuestionario, sobre su interés, extensión, grado de dificultad en su contestación o qué mejoras introducirían en él. Además, está práctica de la reentrevista. De pasarles, de nuevo, el cuestionario, en su totalidad o en parte, como estrategia para "validar" las respuestas que en él se registran (en la supervisión del trabajo de campo, véase subapartado 5.2) y también para detectar errores de medición. De los entrevistadores la información se extrae, igualmente, de forma individual o colectiva, en grupos de discusión. Preferiblemente, al poco de concluir su intervención, para favorecer el'recuerdo. Lo más fácil y habitual es analizar la información que éstos proporcionan en los datos de control, que suelen adjuntarse al final del cuestionario, para que el entrevistador lo cumplimente al término de cada entrevista. En el apartado 4.4 ya se dijo que los datos de control suelen estar integrados por preguntas objetivas sobre la realización de la entrevista (fecha, dí~, hora, duración, lugar) y subjetivas (desde el punto de vista del entrevistador), referidas a la actitud del encuestado durante la entrevista: si mostró interés, tenía prisa, respondió rápida o sopesadamente, mostró algún tipo de inhibición en alguna pregunta, grado de sinceridad en la respuesta (en opinión del entrevistador). Lo más interesante, a efectos evaluativos, es que el entrevistador anote c~al­ quier "incidencia" que haya detectado en la correcta cumplimentación del cuestionario y sus propuestas de mejora. Incidencias referidas tanto a impedimentos para la contactación del encuestado, como en la realización de la entrevista (si hubo problemas de comprensión de alguna pregunta y de expresión por parte del encuestado).

..... ,':

I

439

pese a la relevancia que estos datos de control pudieran tener en la supervisión y 'luación de los cuestionarios, de acuerdo con Groves (1989: 341) "estas preguntas frecuencia no son utilizadas en la estimación del error de medición". aluación de los cuestionarios

Para identificar errores de especificación y demás errores de medición debidos al di...i()del cuestionario. La consulta a "expertos", de forma individual o en grupo, es de gran ílidad a este respecto. En general, la revisión de cada pregunta del cuestionario, re;;~l()nándola con los conceptos a medir, de acuerdo con los objetivos de la investigación. ':i~las preguntas se pide que se ajusten a los objetivos de investigación, que muestren ser "'aicadores "válidos" de los conceptos que pretenden medir. De ellas se analiza su fori':'lllación y ubicación en el cuestionario, por los efectos que puedan tener en los errores :~rnedición, como se vio en el capítulo 4. En concreto, se comprueba que: • La pregunta tenga sentido (se ajuste a los objetivos de investigación) y que el significado dado por el investigador se corresponda con el atribuido, a la pregunta, por el encuestado. • La pregunta se comprenda con facilidad y no precise de ninguna aclaración. Han de evitarse preguntas largas y complejas, que incluyan términos ambiguos y de difícil comprensión, que provoquen distintas interpretaciones de la misma pregunta. • Su formulación no afecte a la respuesta. • Sesgos de deseabilidad social, aquiescencia, primacía o recencia, suelen provocar la elección mayoritaria de una única respuesta. Por lo que, en caso de detectarse ésta, habrá que analizar el motivo de la misma. Si es propiciado por cómo está la pregunta redactada, por el formato que presenta, por el tema que trata. Recuérdese que las preguntas que apenas consiguen variabilidad en la respuesta, al haber aglutinado tres cuartas partes o más en una única opción de respuesta, no son buenas preguntas. • Tampoco es una buena pregunta aquella que tenga un elevado porcentaje de no respuesta. Puede deberse a fallos en su redacción (ambigua o compleja para el encuestado, no ofrece suficientes alternativas de respuestas), que dificultan su contestación o llevan a su ocultación, por estimarla comprometida. Cuando la pregunta "incomoda" al encuestado, la captación de respuestas "válidas" se limita. Pero, también puede estar favorecido por una mala ubicación de la pregunta en el cuestionario, que lleva a su omisión involuntaria (porque las rutas no han quedado bien especificadas en el cuestionario) o a una no respuesta por efectos de contexto. • Se comprueba la "consistencia" de las respuestas en preguntas relacionadas. Es decir, aquellas que se espera que estén bastante correlacionadas. En caso de discrepancias en las respuestas, habrá que comprobar el motivo.


440

Capítulo 6: El tratamiento de la información

Métodos de encuesta

• •

Preguntas sobre una misma temática también se contrastan. No sólo para indagar en la consistencia de las respuestas. También, para ver cuál logra una respuesta más "veraz". La disposición conjunta de las preguntas en el cuestionario ha de seguir una secuencia lógica y no influir en la respuesta. Las instrucciones expresas en el cuestionario han de ser claras y suficientes. Precisamente, para evitar que rutas no claramente definidas (marcadas por las guntas filtro) provoquen una mayor no respuesta de la esperable en la 1J.&."'·~UJ.ILa~ La duración del cuestionario no afecte la respuesta· por el efecto de fatiga. métodos de encuesta asistidos por ordenador (como CATI o CAPI) permiten medir, con exactitud, la latencia de la respuesta: el tiempo que se tarda en ponder a la pregunta. Porque se graba el tiempo exacto en que se formula la gunta y se emite la respuesta. La latencia de la respuesta es un indicador de su calidad. Un "no sé" después un mayor tiempo pensando la pregunta tiene más valor que aquel que se dio forma precipitada. Obviamente, la interpretación de la latencia de la respuesta dependerá de la pregunta, de su complejidad temática y de la forma de contestarla.

La contrastación de preguntas sobre una misma temática adquiere una gran vancia en la comprobación de la validez de constructo. No se olvide que un integrante evaluativo fundamental en dicho criterio de validez es averiguar qué preguntas del cuestionario actúan como los mejores indicadores de los conceptos que la encuesta quiere medir. A tal fin es imprescindible el análisis conjunto de los distintos indicadores ut1Jl1Zados en la medición. El análisis multivariable es de gran ayuda tanto en su vertiente exploratoria, para descubrir las distintas dimensiones e indicadores que cada una de ellas agrupa (como el análisis factorial exploratorio o el de componentes principales), como confirmatoria (análisis Jactorial confirmatorio o discriminante, por ejemplo). De ellos ha de resultar la eliminación de aquellas pr~g\ll.1tas del cuestionario que no hayan quedado incluidas en alguna dimensión latente o dominio de·conienídiJ dél concepto a medir. Ya en 1983 Bohmstedt defendía la práctica del análisis factorial confirmatorio la forma más apropiada de evaluar los distintos dominios de contenido de un concepto. su parte, el análisis discriminante ha mostrado gran utilidad en la evaluación llevada bo por esta autora (Cea D'Ancona, 2002b, 2004b) de los indicadores de racismo, a la ya se ha hecho referencia en el capítulo 4. Tras la exigida realización previa del torial de componentes principales (para la agrupación de los 41 indicadores de racismo en diez dimensiones latentes) y del análisis de conglomerados K-medias (del que resultó la tipología de actitudes ante la inmigración en tolerante, ambivalentes y reacios), se procede al análisis discriminante para conocer los indicadores de mayor utilidad en la medición de racismo (aquellos que más discriminan o diferencian a los tolerantes de los ambivalentes y reacios). De las 10 dimensiones latentes sólo 6 mostraron poder discriminatorio estadísticamente significativo y en es~e orden: derechos sociales, derechos de ciudadanía, política inmigratoria, sociabilidad con inmigrantes, discriminación étnica o de la alteridad e imagen tópica negativa de la inmigración.

f(~tualos

441

de grupo de criterio

referencia a la validez de constructo, Henerson y colaboradores (1987) destaconveniencia de los llamados estudios de grupo de criterio. El cuestionario se pagrupo de personas de las que se sabe, con un cierto grado de certeza, que po"abundancia" o "deficiencia" del constructo que se mide. Por ejemplo, que en 1~i-L:.~"t'"1r"l,~~C' mediciones hayan alcanzado niveles elevados o bajos de autoestima racismo l'cu.alCIUI(~ra qu~ sea el concepto a medir. En este nuevo cuestionario debería~ alcanza; similares a los obtenidos en anteriores mediciones. De esta forma puede .. A .....,.,.....,.1'·r'\n,~rc'a la validez del instrumento de medida e identificar preguntas inadecuapara la medición del constructo, por no cumplir los requisitos exigidos de validez

La comprobación de su fiabilidad

A diferencia de la validez, la fiabilidad se fija en la "consistencia" en la consecude iguales resultados utilizando el mismo instrumento de medid~, con independel momento en que éste se aplique. Pero, el que la medida resulte "consis-término propuesto por Smith y Stephenson (1979)- necesariamente no que sea "válida". Una medida "fiable" no siempre es "válida". Pero una medigeneralmente es también "fiable". La validez de un instrumento de medida de fiabilidad, aunque no a la inversa. En distintas mediciones con un miscuestio~~rio, pued~n obtenerse los mismos resultados y éstos ser inválidos porque mIdIendo actItudes, valores, opiniones o conductas "reales". Por lo que sería demostrar validez a partir de la fiabilidad. Son dos aspectos de la calidad del ; .. nc'f-r"'1~.~-nt·r'll. de medición diferentes y complementarios. inv~stigación. mediante encuesta, la manera más habitual de comprobar la fiaes aplIcar_el mIsmo cuestionario, en distintos momentos, para después obserse alcanzan los mismos resultados en las distintas mediciones. Si bien, la no con1:Jlt"'11"lt"'1r'\-n de los mismos resultados no siempre significa que el instrumento sea ~JnllalJllen. El analista deberá precisar sus causas. son ~os procedimientos tradicionales y alternativos para comprobar la rJaC~llltlaa de un Instrumento de medición (cuadro 6.3). Los métodos test-retest, alterde las dos mitades y el de la consistencia interna alfa de Cronbach. Están relariI~ con los dos conceptos con los que se identifica la fiabilidad: estabilidad y con77

...'.....: .••",-,;.:1 ... .1"1 ...

,.F\ILA-JLILA-.I.Jl""'1LA-

..... _..." ....

.......

;ilVlelo~ao

test-retest

Éste.es elproceoo.ruento tradicional y el más sencillo para comprobar la fiabilidad de el mismo cuestionario, a las mismas personas, y las mIsmas condICIones, en dos períodos de tiempo diferentes. La segunda adminiscuest~onano. CO?~Iste en administrar


442

Métodos de encuesta Capítulo 6: El tratamiento de la información

CUADRO 6.3. Procedimientos alternativos de comprobación de la fiabilidad del cuestionario a) Método test-retest.

• Coeficiente de correlación. • Índice de inconsistencia. b) Método alternativo. c) Método de las dos mitades. d) Método de la consistencia interna alfa de Cronbach.

tración del cuestionario ha de ser idéntica a la primera. Debe replicarse el mismo pf()ce~;O de encuesta que en la primera medición para que las respuestas sean comparables. Si encuesta ha sido telefónica en el tes~ también en el retest, por ejemplo. Pero no es fácil plicar" toda la situación de encuesta, porque pueden variar sus pr~tago~istas. Por tos del entrevistador, del encuestado o contextuales, aunque el cuesbonano sea,el ~ ..,....... '" Lo único que debe cambiar es el tiempo en que se pasa el cuestionario. Este escogerse de forma que no afecte a los resultados del retest. Se recomienda que el po comprendido entre el test y el retest sea aproximadamente un mes, para evitar q la memoria o el recuerdo de la primera medición afecte a la respuesta en la segUR> medición. Un período de tiempo más amplio tampoco es aconsejable. Pese a queJ~E percutiría, positivamente, en la reducción del efecto de la memoria, aumentaría la pro.. babilidad de que, en ese lapso de tiempo, se produjesen cambios en la persona que ak terasen la actitud, opinión o conducta que se mida. Sus respuestas en el retest diferirí ".,."."" y no debido a que el instrumento empleado en la medición sea "infia?le".. La segunda administración del cuestionario debería, en consecuenCIa, realizarse ~ un período de tiempo en el que no se prevean cambios contextuales y personales qB puedan afectar a la respuesta de los encuestados. La est~bilidades exigida tanto en proceso de medición como en el fenómeno que se anahza. La fiabilidad se cuantifica mediante el cálculo de los coeficientes de correlación del, respuestas en las dos mediciones. Un coeficient~~l~vado implica "estabilida.d" y, ene<) secuencia, "fiabilidad" del instrumento de medIcIon. Normalmente, a partIr de un COy' ficiente igual o mayor de 0,8 se considera que la medición es "fiable". Un valor igual a 1;9" designa fiabilidad perfecta, mientras que un coeficiente próximo a 0,0 se interpreta co1l}~ fiabilidad nula. Esto sucede cuando las dos mediciones son totalmente diferentes.

Donde Yi! es la puntuación observada en la primera medición; Yiz' en la segunda.

443

cálculo del coeficiente de correlación exige que las variables sean continuas. En contrario, se recomienda su previa transformación en ficticia (mediante la codiión binaria en Oy 1 de sus atributos, como se explica en Cea D'Ancona, 2002a). variables categóricas puede, no obstante, aplicarse lo que Biemer y Lyberg 3) llaman índice de inconsistencia, lo contrario al índice de fiabilidad. O sea, "1- r". efine como la razón de la varianza de error de medición en las observaciones a la .anza total. Es decir, expresa la proporción de la varianza total que es varianza de r de medición.

ndo g la proporción de casos en los que no ha coincidido la respuesta en la primera n la segunda medición.

El índice de inconsistencia se obtiene de una tabla de clasificación como la siguiente. En ella cruzan las respuestas obtenidas en la primera medición con las habidas en la segunda. El prose describe a continuación con la pregunta sobre la regularización de los inmigrantes ílees, con dos opciones de respuesta: a favor y en contra.

Tabla de clasificación

"", Respuesta en la segunda medición

Respuesta en la primera medición

A favor de la regularización

En contra de la regularización

590 23

37 370

613

407

0,0588 0,231 + 0,245 = 0,123

Total

627 393 1.020


Capitulo 6: El tratamiento de la información

444

445

Métodos de encuesta

• Proporción de casos en los que no ha habido coincidencia en la respuesta en la segunda medición respecto a la primera: =

g

37 + 23 1.020

=

O 0588 '

• Proporción de casos a favor de la regularización de inmigrantes en la primera medición:

P1

=

613 --O 1.02

=

0,601

• proporción de casos a favor de la regularización en la segunda medición:

• P1(1- P2)

=

P2

=

627 1.020

0,231 Y P2(1- P1)

=

0,245

=

0,615

Como el índice de inconsistencia es igual a 0,123, significa que su equivale~te en fiabilidad sería 0,877 [(1 - 0,123) = 0,877]. Lo que supone la calificación de "fiable" al Instrumento de medición. .• d sos cuya cla .De la tabla de clasificación puede también obtenerse la proporclon e ca sificación en la segunda medición concuerda con la habida en la ~rimera ~como es hablt~~1 en los análisis de regresión logística y discriminante): el porcentaje de aCiertos en la claSIficación. Proporción de "aciertos" =

590+ 370 1.020

=

0,9412

0, lo que es igual, (1 - g) = (1 - 0,0588) = 0,9412 El 94,12% de los sujetos reentrevistados coincidier~n en la respuesta que dieron en la primera medición. Un porcentaje de acuerdo que se estima bastante elevado.

Este efecto es común a toda investigación en la que se observan a unas mismas personas durante un período determinado de tiempo. Cuanto mayor sea su duración, más probable es la presencia de esta fuente de invalidez de los resultados. b) Acortar en exceso el período de tiempo entre ambas mediciones tiene el efecto contrario de sobreestimación de la fiabilidad debido a la memoria. El encuestado puede acordarse de las respuestas que dio en la primera medición y responder, en el retest, de la misma forma con el propósito de mostrar "consistencia" en su respuesta. Esto puede inflar la fiabilidad aparente de la medición. Lo que es más habitual cuanto menor es el período de tiempo entre test y retest. También puede darse el efecto contrario: que la memoria lleve a dar respuestas diferentes, para parecer flexibles, de mente abierta, especialmente en ítems actitudinales (Groves, 1989). Esto último parece, no obstante, menos factible, a tenor de las investigaciones realizadas (Carmines y ZeIler, 1979; Bohrnsted, 1983; De Vaus, 1990; Krosnick y Fabrigar, 1997). Es más probable que la memoria contribuya a la consistencia que a la inconsistencia de las respuestas. c) Por último, hay que considerar el efecto de la primera medición: la reactividad del test. La primera medición puede provocar la sensibilización de la persona hacia el tema sobre el que se le pregunta y, en consecuencia, modificar su respuesta en el retest. Puede dar respuestas más meditadas, fruto de la reflexión (sobre lo preguntado y lo respondido) tras la cumplimentación del cuestionario. También afecta la familiarización con el instrumento de medida, al no variar el cuestionario en el retest. A estas matizaciones se suma la dificultad de aplicar, de forma reiterada, un miscuestionario a una misma población. A lo que ya se ha hecho mención en la exosición de la encuesta panel. Factores internos (cansancio, pérdida de interés) yexternos (cambios de domicilio, de ocupación u otra modificación en sus circunstancias yitales), que impidan la contactación de todas las unidades de la muestra para el retest. .... abandono (o mortalidad experimental) puede contribuir en los resultados de la comprobación. Especialmente, cuanta mayor disparidad exista entre aquellos que dejan la investigación y quienes permanecen en ella. Este problema adquiere mayor relieve conforme se amplía el período de tiempo entre el test y el retest. En general, se desaconseja el uso de este método de comprobación de la fiabilidad ·····cuando se midan fenómenos inestables o más expuestos a cambios, como sucede la intención de voto. En tales casos, habría que aplicar otros métodos alternativos la comprobación de la fiabilidad. Mé~tOc.to

alternativo

Para evitar los efectos de la memoria en el retest se propone un método alternativo, que consiste en pasar, a la misma población, un cuestionario "alternativo" al cumplimentado en la primera medición. Es decir, que mida el mismo concepto, pero de fordistinta.


446

Métodos de encuesta

Capítulo 6: El tratamiento de la información

Por ejemplo, dividir aleatoriamente 20 ítems de racismo: 10 se incluyen en el tionario del test y los otros 10 en el cuestionario para el retest. Ha de procurarse que bos cuestionarios sean similares. Ello permite la comparabilidad de las respuestas diante los coeficientes de correlación entre ambas mediciones.

Ésta es precisamente su mayor dificultad: el crear ítems que realmente sean parables. En palabras de Bohrnstedt (1983: 80), "pocas 'formas paralelas' de TT1P_rl"n1IÁ~";: son realmente paralelas". Esto se suma a otra deficiencia importante: no logra ver, de forma clara, la distinción entre el cambio "verdadero" de la "infiabilidad" la medición (Carmines y Zeller, 1979), como sucede en el método anterior.

447

'a", indaga en la "homogeneidad" de los indicadores utilizados en la medición de oncepto. De manera que la serie de preguntas incluidas en un cuestionario será inamente consistente, cuando aquellas relacionadas con una misma dimensión latente minio del concepto estén bastante intercorrelacionadas entre ellas. Lo que significa miden lo mismo. La consistencia interna suele identificarse con el coeficiente alfa propuesto por ,í·Cronbach en 1951 (en "Coefficient alpha and the internal structure of tests". Psy:~metrika, 16: 297-334). Aunque G. E Kuder y M. W Richard fueron los primeros en comendar una medida de equivalencia que utilizase todas las covarianzas entre los itns, en 1937 ("The theory of the estimation of test reliability". Psychometrika, 2: 135,:~).

Método de las dos mitades

Un procedimiento para comprobar la "consistencia" interna de una medida difiere de los anteriores en que las dos comprobaciones se hacen en sujetos - . . L'~.L~ tes y al mismo tiempo (de forma simultánea). Para ello se divide la serie de ítems dos mitades, que pueden ser equilibradas o aleatorias: aleatorias cuando la alspo:SlC]~Ón <\G:0'2X,;; de la serie de preguntas en las dos mitades es al azar; equilibradas si se busca la ridad entre ellas, procurando (mediante casación) que ítems "iguales" estén en ,'_ ," bas mitades. Su práctica exige garantizar que ambas mitades sean homogéneas, para evitar las correlaciones entre ellas se deban a diferencias de contenido real. Deben ~11'~t'11·':l't":·.--:'·>··;·iX,i: la misma capacidad o actitud en los sujetos. Su éxito dependerá de que exista una rie amplia de ítems y que puedan repartirse equitativamente en dos mitades. O sea, cada constructo esté igualmente representado en ambas mitades. •• -

Éste es el caso, por ejemplo, cuando se quiere establecer la fiabilidad de un compuesto por 18 indicadores. Primero se administra completo a un grupo de mdllVllClUC)S. Después, se dividen al azar los 18 ítems en dos grupos de 9 y se pasan a dos grupos ferentes de personas, aunque de las mismas características, y al mismo tiempo. Se culan los coeficientes de correlación de sus respuestas. Una elevada correlación o igual a 0,70 o, preferiblemente, a 0,80) implica "consistencia interna".

Este tercer método pretende resolver los problemas detectados en el primero, parando las consideraciones de fiabilidad de los efectos de la memoria, el u.1J.1.""~.I.~~.~u,·, ... .-.. :· je o la propia evolución del individuo. No obstante, se sugiere la necesidad de un ajuste estadístico que corrija el tamaño pequeño de las dos series de ítems que comparan (véase Lyons Morris y otros, 1987; o Henderson y otros, 1987). Método de la consistencia interna alfa de Cronbach

Uno de los métodos de comprobación de la fiabilidad más aplicado por los investigadores sociales en los últimos años, favorecido 'por su inclusión en los paquetes estadísticos de uso común. Como puede deducirse de su nombre; "consistencia in-

, 'El coeficiente alfa se calcula a partir de la matriz de varianzas-covarianzas de la se@de-ítems que componen una escala de medida. A diferencia de la matriz de corre,~ión, en la de varianzas-covarianzas las variables no están estandarizadas. La diagonal i~,Ja matriz la forman las vari.anzas de cada ítem. El resto de la matriz son las covalqnzas entre pares de ítems. El coeficiente alfa informa, por tanto, de la varianza "co',un" o compartida entre cada par de ítems. Su valor se obtiene de la fórmula siguiente: a

=

~ N - 1

[1 _L diagonal matriz varianzas - covarianZaS] L todos los elementos de la matriz

. :onde N es el número de ítems; la diagonal son las varianzas de cada ítem; y todos los lementos de la matriz incluye la suma de varianzas y covarianzas de los ítems. El valor del coeficiente alfa va desde 0,0 (infiabilidad) a 1,0 (fiabilidad perfecta). Ex,"resa la proporción de la varianza total de la serie·de ítems incluidos en la escala de me:jdaque se debe a la variable latente y que, por tanto, es "común". Por esta razón, el ,'iJeficiente alfa-"se corresponde estrechamente con la definición clásica de fiabilidad "Q1nO la proporción de varianza en una escala que es atribuible a la puntuación ver;adera de la variable latente" (De Vellis, 1991: 41). En general se aconseja un valor no inferior a 0,80 para que el instrumento de meida pueda considerarse "fiable". A lo mínimo ha de tener un coeficiente alfa superior 0,70.

El análisis factorial, exploratorio y confirmatorio, es también de gran utilidad en la. cuantificación de la consistencia interna. Asimismo, el análisis discriminante permite la comprobación de la efectividad de cada ítem, por separado, en la diferenciación de lqs sujetos de acuerdo con el concepto que sé mida (discriminación, racismo, xenofobia). Eso sí, como con la validez, hay que considerar distintas fuentes de error que pueafectar a la fiabilidad del instrumento de medida. En el caso de la investigación me- .


448

Métodos de encuesta

Capítulo 6: El tratamiento de la información

diante encuesta afectan sobre todo, los errores de observación o medición. Es decir, debidos al método de e~cuesta (cómo se aplica el cuestionario), el diseño del '-'"C~,JLLlJ-,·,' nario (las preguntas, su disposición, presentación), la int~rvención d~l entrevistador características personales y actuación durante la entrevIsta!, la actItud del en(,;ue'sta:do, i'~ (su estado de ánimo, cansancio, interés, la imagen que qUIera pr~yectar, s~~ mientos del tema, el efecto de la memoria) y el tratamiento de la lnformaclon (la ... dificación, grabación, análisis estadístico). . Su conocimiento ayudará a precisar si constituyen errores.slstematl~os:~e . . incidencia negativa en la calidad de la encuesta, o son aleatorlos, de ~as f~Cll.~, - ;., ción. Recuérdese que los errores sistemáticos suelen resultar en sobr~estIm~cl0nes o bestimaciones de los valores "reales" en la población. En cambIO, los. aleatorios suman cero, cuando se promedian en el total de los casos analIzados. Pero tampoco hay que descuidar los errores de no o~s:rvaci?n (de ~o respuesta y de muestreo). La proporción y las caracterIstIcas dIferencIales ?e los cluidos" o "no observados" en la encuesta, en relación con aquellos que SI han cipado en ella. Lo cierto es que la fiabilidad "perfecta" es difícil de alcanzar. Como reconocen mines y Zeller (1979: 11, 12), JL .... LL

·.;··

La medición de cualquier fenómeno siempre contiene una cierta cantidad de causal [...]. Porque las mediciones repetidas nunca igualan.:xa~ta~ente unas a otras, infiabilidad siempre está presente, al menos a una extenslon hmltada.

Para conseguir un coeficiente de fiabilidad elevado varias son las actuaciones picamente recomendadas. Se insiste en la conveniencia de: 1. Seleccionar una muestra lo más amplia y heterogénea posible respecto al ) que se esté midiendo (actitudes, valores, con?uct~, cualquiera que sea éste , ra la comprobación de la fiabilidad del cuestIonano. Una muestra.~levaday terogénea propicia la consecución de coeficientes de co:relacIon ""J.'" "u.V~., •...:· . . ~•. ::. Además, la muestra ha de compartir las mismas característIcas de la OOlJlalClCUli;:cjy' a la que finalmente se encuestará. 2. La operacionalización múltiple. Cuantos más indicador~s se . del se lmno·neaUl~.· •.·.;:) S número de dimensiones o "dominios" del constructo, mejor. SI los indicadores sean relevantes en la medición del concepto. Habrá que elilmIJlar, •··';;;;;-· en consecuencia, todo indicador no relacionado con el objeto de estudio. y

Por ejemplo, si se realiza un análisis factorial, se eliminará to~~ ind~c~dor presente una baja comunalidad (o valor R2: el coeficiente de. corr~lacl0n mult~p.l~ drado obtenido de regresionar la variable con el resto de l~s l~cluldas en el an~hsls). sea, una proporción de varianza compartida con los otros IndIcadores pequena.

La eliminación de ítems poco relevantes en la medición del concepto suele repercutir en incrementos en el valor del coeficiente alfa. Y, en general, el

449

cunscribir el análisis sólo a aquellos indicadores más relacionados con el objeto de;estudio contribuye a la obtención de estimaciones muestrales de los parámetros poblacionales más estables, al disminuir los errores típicos de estimación. ;:3. Aumentar la varianza de las variables afectadas, incrementando las opciones de respuesta de los ítems o preguntas del cuestionario. Cuanto mayor sea su número, más precisa resulta la medición. 4. Estandarizar erproceso de recogida de información para que, por ejemplo, se reduzca la varianza debida al entrevistador. Como se vio en el capítulo 5, un mayor número de entrevistadores contribuye a que su efecto en la calidad de la encuesta repercuta en un menor número de cuestionarios, traduciéndose en error aleatorio y no en sistemático. La mejor forma de demostrar que tu trabajo ha sido mínimamente contaminado por inconsistencias de "instrumentos humanos" es utilizar más de una persona para hacer al menos una muestra de tus entrevistas ti observaciones. Si personas diferentes informan bastante la misma cosa, eso es evidencia de consistencia (Henerson y otros, 1987: 149). ;>,:. Y, en general, reducir la incidencia de cualquier error que deteriore la calidad de á encuesta.

4. La redacción del informe de los resultados de la encuesta El informe cumple la función de presentación, de comunicación, de la investigación e se ha llevado a cabo. En él cristalizan cada una de las fases del proceso investigador. i.:g?r.ello, no se ha de limitar a una mera exposición e interpretación de los resultados de ":~:rncuesta. La comprensión de ésta y del alcance de sus resultados exige la descripción ';'~evia de las diferentes actuaciones que han convergido en su desarrollo y su justifica·pn. Desde la configuración del marco teórico de la encuesta y como éste se ha tradu:~oen el cuestionario, hasta el diseño de la muestra y la ejecución del trabajo de campo, gncluyendo con la exposición de los análisis efectuados y su interpretación. ..' Aunque el informe puede adoptar distintas formas, adecuándose a las peculiari~des del público al que va dirigido (profano, experto), al medio empleado en su diplgación (informe técnico, monografía, artículo de revista, ponencia o comunicación ~.congreso) y al ingenio y la redacción del investigador, suele mantener una estruc#!:ra básica común, que adquiere distinto desarrollo en función de sus características. ;~a integran los seis apartados siguientes: introducción, metodología, resultados, dist~usión, conclusión y bibliografía.

Una visión global de la investigación y de su relevancia para el conocimiento del problema que se analiza. El investigador define y contextualiza el problema de in-


450

Métodos de encuesta

vestigación, especificando los objetivos y las hipótesis esenciales, a partir de las indagaciones teórico-empíricas que preceden al estudio. En la exposición del marco teórico de la encuesta se resalta la trascendencia del estudio llevado a cabo, relacionándolo con los que le anteceden. Se destaca su interés y por qué supone un avance en el conocimiento del problema de investigación. Para lo cual, la investigación se contextualiza en un área de conocimiento concreta. El propósito no es mostrar un catálogo de la literatura especializada en el tema, sino especificar el estado actual de la cuestión: qué cuestiones se han resuelto y sobre cuáles existe aún controversia o carencia de estudio. La argumentación se acompaña de un número limitado de referencias bibliográficas seleccionadas, para marcar'la trayectoria investigadora precedente. Metodología

Capítulo 6: El tratamiento de la información

451

bién conviene especificar las instrucciones dadas a los entrevistadores para la r~ducción de la no respuesta y el número de intentos para contactar a las uni-

dades de la muestra. Debe demostrarse la representatividad de la muestra finalmente observada. f) La supervisión hecha del trabajo de campo y, en general, los controles de calidad de la encuesta que se han aplicado. g) El detalle de los análisis estadísticos llevados a cabo, su justificación y resultados principales. h) La delimitación de los distintos errores detectados en el diseño y la ejecución de la encuesta, junto con propuestas de mejora. De gran utilidad para estudios posteriores. Máxime en encuestas que se realizan con una cierta periodicidad (como las encuestas de actitudes ante la inmigración realizadas cada año, desde 1990 hasta 2000, por CIRES/ASE~o las del CIS, con una periodicidad menos constante, por ejemplo).

Tras la introducción, o al final del informe (en un "apéndice metodológico"), se describen, con mayor o menor detalle, los aspectos relacionados con el diseño de la investigación. En el caso de la encuesta se especifica: a) La población de estudio y el marco muestral elegido para la selección de la muestra. Información imprescindible para la inferencia de los datos de encuesta y la evaluación del diseño muestral. b) La muestra final y en qué medida se ajusta a la diseñada. Se detalla todo el proceso seguido en la selección de la muestra, desde la elección de las unidades primarias de muestreo hasta las últimas. c) El proceso seguido en el diseño del cuestionario: criterios aplicados en la medición de los conceptos principales del estudio y su traducción en preguntas concretas en el cuestionario. Conviene la presentación íntegra del cuestionario en un anexo o incluido en el texto, dependiendo de su extensión. Permite conocer la redacción, el formato exacto de las preguntas y su ubicación. Lo cual es de gran ayuda en la interpretación de las respuestas y, en general, de los análisis llevados a cabo. Además, contribuye a la detección de posibles errores de medición debidos al cuestionario: a la ubicación de la pregunta, su formato y redacción. Suele preferirse incluir el cuestionario en un anexo al final del informe. A veces, acompañando las preguntas de las frecuencias obtenidas en cada opción de respuesta. En general, cuanta más información se ofrezca, mejor podrá valorarse el alcance de los resultados de la encuesta. d) Especificar si ha habido unpretest u otra precomprobación del cuestionario y cómo afectó a su redacción final. e) Lafecha de ejecución del trabajo de campo y las distintas actuaciones llevadas a cabo para incrementar la tasa de respuesta. Preventivas y, si los hubiere, los ajustes estadísticos postencuesta: ponderaciones e imputaciones para reducir los errores de muestreo y de no respuesta. En encuestas mediante entrevistas tam-

La relación y comentario de los "hallazgos" de la investigación. Su exposición ha caracterizarse por su claridad, precisión y objetividad. El texto puede acompañarse con gráficos y cuadros que ayuden en la exposición y la lectura de los resultados numéricos del estudio.

Los resultados se interpretan relacionándolos con las hipótesis de la investigación. Se discute si son o no corroboradas por la información reunida. Además, se comparan los resultados con los obtenidos en estudios anteriores (si los hubiere), precisando su .·····rf~lp"~ni{'l ~ y los posibles límites a su generalización. De toda esta reflexión se deducirán respuestas a cuestiones planteadas en la indel informe. Otras quizás queden sin contestación, poniendo de manifiesto límites del estudio. Por lo que es común que este apartado concluya con la prode futuras líneas de investigación. ", U'l.-C-I.II,,,,",,,"',VIC.

''''_lla,C"''f''n

De todos los apartados del informe, éste es, de acuerdo con Gilbert (1993: 340), el difícil porque debería resumir cuáles fueron los principales hallazgos de la inde una forma sucinta e interesante. Esto es, porque muchos lectores mirarán primero el final para ver si tiene algo interesante que decir, antes de comenzar por el principio". Se relatan los hallazgos más significativos del estudio, dejando la puerta abierta a futuras indagaciones que resuelvan cuestiones discutidas o sin respuesta en la investigación. 'tTa",.. .. nrnn'IÁ_


452

Métodos de encuesta

Capítulo 6: El tratamiento de la información

4).5

Bibliografía

Al final del informe figuran las referencias bibliográficas completas de las publicaciones consultadas en la investigación, normalmente ordenadas alfabéticamente por apellido del autor. Primero aparece el apellido principal del autor, las iniciales del nombre, la fecha de edición de la obra (entre paréntesis), el título del libro (generalmente en cursiva)' la editorial y la ciudad donde se publica. Los artículos de revista aparecen entre comillas y el nombre de la revista en cursiva, seguido del número o volumen y de las páginas en que figura (como puede verse en la bibliografía al final del libro). Conviene limitar las referencias bibliográficas a las realmente consultadas para la investigación, se hayan o no citado a lo largo del texto. A este esquema genérico del informe suele añadirse un breve resumen con los hallazgos más relevantes de la investigación, al principio o al final del mismo. Este breve resumen de no más de 10 o 15 líneas cumple la función de ofrecer una visión sintética y global de la investigación, con el propósito de llamar la atención del lector y despertar el interés por su lectura. También, es frecuente dedicar unas líneas, al comienzo del informe, a los agradecimientos o mención de las personas e instituciones que contribuyeron a la realización de la investigación: entidades que la financiaron o colaboraron de algún modo en su realización. Y a particulares que ayudaron al equipo investigador en su buen término. Esta estructura genérica del informe puede experimentar variaciones según la especificación y complejidad que el investigador le dé. En gran medida depende de la formación e interés del lector al que principalmente vaya dirigido. Un informe escrito como un documento privado para el departamento o empresa que financia la investigación enfatizará cosas diferentes, quizá dando menos espacio a la metodología, que uno dirigido a expertos. Ambos serán más formales y técnicos que un informe dirigido al póblico general (Moser y Kalton, 1989: 467).

De todas formas, su redacción ha de ser clara, expresada en un lenguaje familiar a su lector potencial, huyendo de tecnicismos innecesarios. Pero, ante todo, ha de ser "honesta", ajustada a los hallazgos en cada fase de la investigación, de la manera más fidedigna y objetiva posible. La delimitación precisa de sus "límites" es crucial en la interpretación del alcance de sus resultados y contribuye a su credibilidad. Por ello, se recomienda especificar los distintos errores que se hayan detectado en el curso de la investigación, junto con las actuaciones, preventivas o paliativas, emprendidas para su corrección. La búsqueda de la "calidad" ha de ser cada vez más prioritaria en la investigación mediante encuesta. De ahí que se insista en el conocimiento de los distintos errores que pueden deteriorarla y limitan su potencial como recurso metodológico fundamental para el conocimiento de la realidad social.

Un ejemplo de informe riguroso en el detalle de los errores detectados en el cumplimiento de una encuesta es el realizado por SORA (Institute for Social Research and Análisis, de Viena), en marzo de 2001, para el Eurobarómetro 53: Attitudes towards minority groups in the European Union. De acceso gratuito en la red (www. europa.eu.intlcomm/dg10/epol). En él se reconocen limitaciones relevantes a considerar en la interpretación de los resultados de la encuesta (realizada del 5 de abril al 23 de mayo de 2000 a 16.078 personas, mayores de 15 años, de los entonces quince países miembros de la Unión Europea). Introducen sesgos importantes que pueden incluso llevar a cuestionar la "validez" de sus resultados. Estos problemas metodológicos afectan a:

a) Los marcos muestra/es, que difieren bastante en calidad. En especial en lo referido a las direcciones. Las que resultan inválidas varían del 0% en Alemania hasta el 61 % en España o el 56% en Finlandia. Porcentajes demasiado elevados que sesgan los resultados de la investigación. b) Los porcentajes de respuesta. El 62% de las 1.007 entrevistas realizadas en España fueron cumplimentadas con éxito en la primera visita, mientras que en los Países Bajos se informa que el porcentaje de "negativas inmediatas en el primer contacto" fue del 69%. Los porcentajes de respuesta obtenidos hasta la tercera revisita, generalmente recomendado antes de proceder a la sustitución del sujeto aleatoriamente elegido en el diseño muestral original, varían del 25% en los Países Bajos hasta e181% en Francia. Esto lleva a ser precavidos en la interpretación de las respuestas por países, porque no se puede estar completamente seguro de que aquellos que responden compartan las mismas características que aquellos a los que no se pudo encuestar (bien por no localizarlos en sus domicilios, bien por su negativa a participar en la investigación). Ante ello se recomienda poner más énfasis en la estandarización del procedimiento de selección de la muestra y en la consecución de un mayor porcentaje de respuesta. e) La corrección de /a muestra. Para corregir las características no representativas de la muestra se procedió a su ponderación. Mediante la cual se ajustaron desviaciones de una pequeña serie de variables como edad, género y región, en aquellos casos en los que se disponía de información detallada. Los pesos asignados varían por países. Las correcciones muestrales más pequeñas acontecen en Bélgica (los pesos oscilan entre 0,66 y 1,5) Ylas más altas en los Países Bajos (entre 0,27 y 7,29) YSuecia. d) Los casos sin respuesta difieren bastante por países. Suecia, Dinamarca, Finlandia, Francia y Bélgica son los países con menor proporción de casos sin respuesta. Por el contrario, en Austria, Gran Bretaña, Irlanda e Irlanda del Norte se obtiene un elevado porcentaje de no respuesta. En general, la no respuesta es mayor en las mujeres de 65 años y más, jubiladas y amas de casa, en la generalidad de los países de la Unión Europea, exceptuando Luxemburgo. Para evitar los sesgos debidos a la no respuesta (al no ser aleatoria, sino coincidente con un mismo perfil sociodemográfico, lo que provoca que los resultados de


454

Métodos de encuesta Capítulo 6: El tratamiento de la información países con un elevado porcentaje de casos sin respuesta presenten sesgos sistemáticos), se opta por la imputación. Aunque aplicando el procedimiento iterativo de maximizar lo esperado, al no estar distribuidos aleatoriamente los casos sin respuesta. El procedimiento de estimación concluye cuando no se alcanza ninguna mejora, obteniéndose la misma solución. e) Sesgos culturales que ocasionaron la eliminación de algunas preguntas de los análisis. Aunque el cuestionario fue traducido a todos los idiomas de la Unión Europea, no se pudo evitar las distintas connotaciones en la interpretación de los conceptos de discriminación por países. Esto lleva a los mismos autores del informe a reconocer que es un "riesgo" creer en la completa "verdad" de los resultados. En el mismo informe se señalan los países donde se observan resultados no comparables con otros países en alguna o varias preguntas. La comparabilidad entre países se comprueba mediante un análisis factorial confirmatorio (mediante el programa L1SREL), que permite comparar la estructura latente de las actitudes en todos los países. Para evitar la exclusión de los casos sin respuesta se utilizan valores imputados. Las variables son en su mayoría ordinales.

455

EJERCICIOS PROPUESTOS 1. Interpretar los datos siguientes, sabiendo que la variable ideología política va en una escala de 1 (extrema izquierda) a 10 (extrema derecha). Edad, en años cumplidos. Cupo de inmigrantes, con el siguiente formato de pregunta: El gobierno español ha establecido un cupo anual para la entrada de inmigrantes, esto es, un número máximo de extranjeros que pueden entrar a trabajar en el país cada año. En principio, ¿está Ud. muy de acuerdo, bastante de acuerdo, poco o nada de acuerdo con esta medida? (Muy de acuerdo 4, Bastante de acuerdo 3, Poco de acuerdo 2, Nada de acuerdo 1). Simpatía marroquí, en una escala de O (ninguna simpatía) a 10 (mucha simpatía). Datos procedentes del estudio n.O 2.214 del CIS.

Estadísticos El conocimiento de los errores que se detectaron en la realización de la encuesta ayuda, indudablemente, a la interpretación de sus resultados y a su credibilidad.

N

LECTURAS COMPLEMENTARIAS Bryman, A. Y Cramer, D. (1995): Quantitative data analysis for social scientits. Routledge. Londres. Carmines, E. G. Y Zeller, R. A. (1979): Reliability and validity assessment. Sage. Beverly Hills. Cea D'Ancona, M.a A. (20ü2a-20ü4a): Análisis multivariable. Teoría y práctica en la investigación social. Síntesis. Madrid. De Miguel, A. (1997): Manual del perfecto sociólogo. Espasa. Madrid. DeVellis, R. E (1991): Scaledevelopment. Theory and applications. Sage. Newbury Park. Hair, J. E; Anderson, R. E.; Tathan, R. L., YBlack, W. C. (1999): Análisis multivariante. Prentice Hall. Madrid. Henerson, M. E.; Morris, L. L., YFitz-Gibbon, C. T. (1987): How to measure attitudes. Sage. Newbury Park, California. Sánchez Carrión, J. J. (1995/1999): Manual de análisis de datos. Alianza. Madrid.

Válidos Perdidos

Media Error tip. de la media Mediana Moda Desv. tip. Varianza Asimetría Error típ. de asimetría Curtosis Error típ. de curtosis Rango Mínimo Máximo Percentiles 25 35 50 66 75

Ideología política

Edad

Cupo inmigrantes

Simpatía marroquí

1804 689 4,6729 4,614E-02 5,0000 5,00 1,9595 3,8397 ,301 ,058 ,029 ,115 9,00 1,00 10,00 3,0000 4,0000 5,0000 5,0000 6,0000

2492 1 44,9330 ,3631 42,0000 34,00 18,1276 328,6101 ,309 ,049 -1,034 ,098 78,00 18,00 96,00 29,0000 34,0000 42,0000 54,0000 60,0000

2161 332 2,8709 1,797E-02 3,0000 3,00 ,8353 ,6977 -,579 ,053 -,056 ,105 3,00 1,00 4,00 2,0000 3,0000 3,0000 3,0000 3,0000

2183 310 5,9629 5,838E-02 6,0000 5,00 2,7276 7,4400 -,273 ,052 -,351 ,105 10,00 ,00 10,00 5,0000 5,0000 6,0000 7,0000 8,0000


Capítulo 6: El tratamiento de la información

456

4)/

Métodos de encuesta Tabla de contingencia Ideología política Frecuencia

Válidos

Perdidos Total

1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00 Total Sistema

Porcentaje

4,4 3,9 13,0 11,2 18,5 9,5 5,9 3,4 1,2 1,3 72,4 27,6 100,0

110 98 324 279 461 238 146 84 31 33 1.804 689 2.493

POLÍTICA Porcentaje válido

6,1 5,4 18,0 15,5 25,6 13,2 8,1 4,7 1,7 1,8 100,0

Porcentaje acumulado

6,1 11,5 29,5 45,0 70,5 83,7 91,8 96,5 98,2 100,0

P41

Válidos

Perdidos Total

1,00 2,00 3,00 4,00 Total Sistema

Porcentaje

173 392 1.137 459 2.161 332 2.493

6,9 15,7 45,6 18,4 86,7 13,3 100,0

Porcentaje válido

8,0 18,1 52,6 21,2 100,0

Porcentaje acumulado

3,00

Total

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

33 25,6 38,8% 12,8%

35 45,5 41,2% 7,6%

17 13,8 20,0% 12,2%

85 85,0 100,0% 9,9%

2,00

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

73 52,2 42,2% 28,3%

78 92,7 45,1% 17,0%

22 28,1 12,7% 15,8%

173 173,0 100,0% 20,2%

3,00

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

112 126,4 26,7% 43,4%

241 22,4 57,5% 52,6%

66 68,1 15,8% 47,5%

419 419,0 100,0% 49,0%

4,00

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

40 53,7 22,5% 15,5%

104 95,3 58,4% 22,7%

34 178 178,0 28,9 19,1% 100,0% 24,5% 20,8%

Total

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

258 258,0 30,2% 100,0%

458 458,0 53,6% 100,0%

855 139 855,0 139,0 16,3% 100,0% 100,0% 100,0%

1,00 cupo inmigrantes

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

22 15,7 40,0% 10,0%

23 30,3 41,8% 5,4%

55 10 55,0 9,0 18,2% 100,0% 7,1% 7,9%

2,00

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

56 34,8 45,9% 25,5%

52 67,3 42,6% 12,2%

14 122 122,0 19,9 11,5% 100,0% 11,1% 15,8%

3,00

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

110 123,1 25,5% 50,0%

247 238,4 57,2% 58,0%

75 70,5 17,4% 59,5%

432 432,0 100,0% 56,0%

4,00

Recuento Frecuencia esperada % de cupo inmigrantes % de POLÍTICA

32 46,5 19,6% 14,5%

104 89,9 63,8% 24,4%

27 26,6 16,6% 21,4%

163 163,0 100,0% 21,1%

Recuento Frecuencia esperada % de cupo ,inmigrantes % dePOLITICA

220 220,0 28,5% 100,0%

426 426,0 55,2% 100,0%

126 126,0 16,3% 100,0%

772 772,0 100,0% 100,0%

8,0 26,1 78,8 100,0

2. A partir de la siguiente tabla de contingencia, elabore una tabla para el informe, interprete los datos y calcule un índice. La variable cupo de inmigrantes está como se definió en el ejercicio anterior. Ideología política se halla recodificada, de modo que el valor 1 denota izquierda, 2 centro y 3 derecha.

2,00

1,00 Hombre cupo inmigrantes

Cupo inmigrantes Frecuencia

1,00

Total


458

Métodos de encuesta Capítulo 6: El tratamiento de la información

459

Pruebas de chi-cuadrado

P4I

Hombre

Mujer

Valor

gl

Sigo asintótica (bilateral)

Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos

25,322

Chi-cuadrado de Pearson Razón de verosimilitud Asociación lineal por lineal N de casos válidos

31,351 b

6

,000

30,176 12,781

6 1

,000 ,000

Valor

Sigo aproximada

Phi V deCramer Coeficiente de contingencia

,172 ,122

,000 ,000

,170 855

,000

Phi V deCramer Coeficiente de contingencia

,202 ,142

,000 ,000

,198 772

,000

3

6

,000

24,939 9,943

6 1

,000 ,002

855

772

a. Ocasillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 13,82. b. Ocasillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 8,98.

Medidas simétricas P4I

Hombre

Nominal por nominal

N de casos válidos

Mujer

Nominal por nominal

N de casos válidos

3. ¿En qué difiere la validez concurrente de la convergente? Precise las distintas modalidades relacionadas con la validez de constructo e ilústrelo con ejemplos. 4. Destaque las ventajas y los inconvenientes de los procedimientos alternativos de comprobación de la validez y la fiabilidad de la encuesta. A ser posible, en un cuadro sintético.

.

5. Localice dos investigaciones mediante encuesta en ediciones diferentes (monografía, revista científica, documento de trabajo). Compare la presentación que en ambas se hace de la investigación, la estructura y la redacción del informe. Destaque si en el informe se hace alguna referencia a posibles "errores" detectados en su diseño y ejecución.



ANEXO


Tabla de nĂşmeros aleatorios 44105 71726 57715 79931 00544

47361 45690 50423 89292 23410

34833 66334 67372 84767 12740

99116 15696 97720 11666 71628

48730 39765 02432 52615 81369

84989 65178 51269 71861 78783

73443 71058 53342 32141 41943

23476 90637 69620 98000 75691

91843 82068 02132 84342 05597

84460 44898 80621 42815 83666

62846 09351 66223 77408 36028

59844 98795 86085 37390 28420

14922 18644 78285 76766 70219

40501 22518 94771 18106 60251

86679 60332 63116 85693 02540

99943 98215 62173 98191 02146

23930 22554 48888 73947 54440

99943 98215 62173 98191 02146

52249 90600 21505 22278 32949

54463 15389 85941 61149 05219

14530 01017 13215 91316 40844

58030 76364 97518 19558 24591

89354 17005 35861 32865 08267

47058 83670 69218 00528 14532

29085 67382 90669 78053 52860

05540 55896 64721 59880 57994

62859 17958 54132 32007 95301

05540 88596 64721 58967 57932

69785 52487 01240 20317 97581

96991 93692 05963 42058 77470

44300 98147 93643 03062 21580

41417 28357 17783 40950 32995

52098 77204 51400 64432 36863

88628 47237 62677 63157 56689

50908 75019 36466 70326 41757

60933 01385 55472 33268 83463

47782 32589 01485 20054 85934

15547 39585 68542 78296 94443

21891 59874 11869 53671 99580

10421 34434 70748 09163 96635

33255 02314 62457 32547 11458

66472 33587 00140 65872 22356

42270 10909 43338 38100 07819

22662 85205 40756 69440 81619

35911 73800 57412 76593 35682

79365 42249 13858 58925 92511

02905 96325 16269 52862 84502

97365 47286 49177 77379 88629

14452 46614 16249 62800 50908

42478 10267 44785 30101 69725

17985 32541 95368 21896 85091

78829 39559 65959 16638 09965

77112 00214 31540 96780 22357

33625 85124 01240 32054 47081

27041 96001 67814 74307 54719

98626 94070 00015 84820 64157

70639 39226 02015 88218 67079

46614 16249 91530 62800 10089

64886 21145 93398 84740 35247

69831 23258 65978 11486 57826

75019 62576 94578 32657 84502

32883 80854 65418 03256 59862

32489 64782 55745 53004 17485

34578 69850 35670 02147 32652

88547 32651 02147 96021 32510

32510 63278 95348 32542 02150

86538 08478 47750 95446 ," 48737

65905 18850 82414 11286 10651

92294 35774 83091 85966 71140

67382 90669 78030 03638 59888

95863 04286 52489 30587 25781

45578 02485 67480 31548 65890

50908 75019 36466 70326 47157

32578 74983 75781 84952 75850

99502 58521 41173 72889 69124

36958 32547 25100 35874 96584

63871 98652 85264 73691 23541

36715 91902 32574 32851 63527

98409 45476 89300 50051 31753

87719 20652 10806 29881 66164

79365 04224 13858 58925 92511

51143 32580 94624 34875 02507

08186 26927 15345 77455 75577

21578 34879 00147 24870 34865

54879 35678 00241 01578 98521

74261 05623 28759 99852 00540

03258 19031 46716 04578 01453

63985 36325 01487 85472 14050

20547 36023 32516 32001 32640

06395 93658 82654 79451 11473

15579 39515 68624 78295 94443

82718 04615 25670 16706 55368

46614 13249 91530 10089 62800

48963 02674 13570 25796 55820

30979 76305 75779 90279 37231

20004 05241 62481 65891 96488

77548 03251 42579 53262 14218

26715 65988 27581 32689 99580

64185 66782 23157 12248 02358

65982 54213 33258 26054 65849

93924 17918 95328 21853 63795

72358 01145 87524 02150 45802

96754 34357 06318 06211 47534

17676 86040 37403 52820 09243

55659 53364 49927 07243 67879

98614 24856 96887 90801 55165

75993 03648 12479 21472 77312

73399 34736 58904 58103 51459

"

i "


BIBLIOGRAFÍA


AIMC (2004): Audiencia de Internet. EGM. http://www.airnc.es/. Mifi, A. A. Y Clark, V. (1990): Computer-aided multivariate análisis. Van Nostrand Reinhold. Nueva York. Alexander, C. S. y Becker, H. J. (1978): "The use ofvignettes in survey research". Public Opinion Quarterly, 42: 93-104. J., Allardt, E. (1990): "Challenges for comparative social research". Acta Sociológica, 33: 183-193. Alós, J. S. (1999): "Industria de los estudios de mercado en España 1998". Investigación y Marketing, 64: 74-76. Alós, J. S. (2001): "Industria de los estudios de mercado en España 2000". Investigación y Mar.. keting, 72: 72-74. 'Álvarez Esteban, R. (2003): "Las preguntas de respuesta abierta y cerrada en los cuestionarios. Análisis estadístico de la información". Metodología de Encuestas, 5 (1): 45-54. 'Alvira Martín, F. (1977): "La relación entre actitudes y conducta". Revista Española de la Opinión Pública, 49: 33-52. ¡eAlvira Martín, F. (1995): "Formas de presentación y representación gráfica de los datos" y "Organización del trabajo de investigación social". Sociología: temas de materias sociales. MAP. Consejo Superior de Administradores del Estado. Madrid: 244-275, 32-52. Alvira Martín, F. y Martínez Ramos, E. (1985): "El efeeto de los entrevistadores sobre las respuestas de los entrevistados". Revista Española de Investigaciones Sociológicas, 29: 219-256. Alwin, D. F. YKrosnick, J. A. (1991): "The reliability of survey attitude m~asurement: the influenée oí question and respondent atributes". Sociological Methods and Research, 20: ',i,

139-181.

"Anderson, T. W. (1984): An introduction to multivariate statistical analysis. Wiley. Nueva . York. ;:Anderson, A. B.; Basilevsky, A. y Hum, D. P. J. (1983): "Measurement: theory and techniques", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook ofsurvey research. Aeademie Press Ine. Orlando: 231-288. Anderson, A. B.; Basilevsky, A. y Hum, D. P. J. (1983): "Missing data", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook of survey research. Aeademic Press Ine. Orlando: 415-494. Andrews, F. M. (1984): "Construet validity and error components of survey measures: a structural modeling approaeh". Public Opinion Quarterly, 48: 409-442.


468

Métodos de encuesta

Aquilino, W. S. (1994): "Interview mode effects in surveys of drug and alcohol use. A field experiment". Public Opinion Quarterly, 58: 210-240. Aquilino, W. S. (2002): "Effects of interview mode on measuring depresión in younger. a~u1ts", en De Vaus, D., Social surveys. Sage. Londres: 192-208 (e. 0.1998: Journal of Offlclal Statistics, 14 (1): 15-29). Aquilino, W. S. y Wright, D. L. (1996): "Substance use estimates from rdd and area probability samples. Impact of differential screening methods and unit nonresponse". Public Opinion Quarterly, 60: 563-573. Arber, S. (1993): "Designing samples", en Gilbert, N., Researching sociallife. Sage. Londres: 68-93. Arias Astray, A. y Fernández Ramírez, B. (1998): "La encuesta como técnica de investigación social", en Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Melé?dez, C". Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. SíntesIs. MadrId: 31-49. Armstrong, J. S. (1975): "Monetary incentives in mail surveys". Public Opinion Quarterly, 39: 223-250. Armstrong, J. S. y Lusk, E. J. (1987): "Return postage in mail surveys". Public Opinion Quar. ., . terly, 51: 233-248. Atienza Aledo, J. y Noya Miranda, F. J. (1999): "La encuesta como InteraccIon SOCIal. Una aproximación empírica". Empíria, 2: 73-92. Atkinson, R. (1998): The life story interview. Sage. Thousand Oaks, California. Austin, H. W. (2002): "Sample size: how much is enough?", en De Vaus, D., Social surveys. Sage. Londres: 51-57 (e. o. 1983: Quality and Quantity, 17 (3): 239-245). ' Ayidiya, S. A. y McClendon, M. J. (1990): "Response effects in mail surveys". Public Opinion Quarterly, 49: 234-252. . . Azorín, F. y Sánchez Crespo, J. L. (1986): Métodos y aplicaciones del muestreo. AlIanza. Madnd. Azofra, M.a J. (1999): Cuestionarios. Centro de Investigaciones Sociológicas. Colección Cuaderno Metodológico n.o 26. Madrid. Babbie, E. R. (1973): Survey research methods. Wadsworth Publishing, Ca. Belmont, California. Babbie, E. R. (1992): The practice af social research. Wadswoth Publishing C~mpany. B~lmont. Babbie, E. R. (2000): Fundamentos de la investigación social. Thomson EdItor~s. MéXICO. . Bachmann, D.; Elfrink, J. y Vazzana, G. (1996): "Tracking the progress of e-mad versus snaI1mail". Marketing Research, 8: 31-35. Back, K. W. y Cross, T. S~ (1982): "Response effects of role-restricted respondent characteristics", en Dijkstra, W. y Van der Zouwen, J., Response behaviour in the survey-interview. Academic Press. Nueva York: 189-208. Baker, R. P.; Bradbum, N. M. YJohnson, R. A. (1995): "Computer-assisted personal interview: an experimental evaluation of data quality and cost". Journal of Official Statistics, 11 (4): 413-431. Barnett V. (1991): Sample survey. Principles and methods. Hodder and Stoughton. Londres. Barthol~mew, D. J. (1961): "A method of allowing for 'not-at-home' bias in sample surveys". Applied Statistics, 10: 52-59. . , Bassili, J. N. Y Scott, B. S. (1996): "Response latency as a signal to questlon problems In survey research". Public Opinion Quarterly, 60: 390-399. Batcher, M. y Scheuren, F. (1997): "CATl site manage~ent in a survey of service q.uality", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; DlppO, C.; Schwarz, N. y Trewln, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 573-588.

Bibliografía

469

Becker, H. S. (1998): Tricks ofthe trade. How to think about your research while you're doing it. Chic~go University Press. Chicago. Bechhofer, F. y Paterson, L. (2000): PrincipIes of research design in the social sciences. Routledge. Londres. Beebe, T. J.; Harrison, P. A.; Mcrae, J. A. Jr; Anderson, R. E. Y Fulkerson, J. A. (1998): "An evaluation of computer-assisted self-interviews in a school setting". Public Opinion Quarterly, 62: 623-632. Belson, W. R. (1981): The design and understanding of survey questions. Gower. Aldershot, Hants (Reino Unido). Berdie, D. R. Y Anderson, J. F. (1974): Questionnaires: design and use. The Scarecrow Press. Metchuchen, Nueva Jersey. L.L...,U.~, E. (1998): La integración de los métodos cuantitativos y cualitativos en la investigación social. Ariel Sociología. Madrid. Berk, M. L. Y Bernstein, A. B. (1988): "Interviewer characteristics and performance on a complex health survey". Social Science Research, 17 (3): 239-251. Berk, M. L.; Mathiowetz, N. A.; Ward, E. P. YWhite, A. A. (1987): "The effect ofprepaid and promised incentives: results of a controlled experiment". Journal of Official Statistics, 3 (4): 449-457. Bethlehem, J. (1997): "Integrated control systems for survey processing", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measure. ment and process quality. John Wiley and Sons Inc. Nueva York: 371-392. Bickman, L. y Rog, D. J. (comps.) (1998): Handbook of applied social research methods. Sage. Thousand Oaks, California. Bickman, L.; Rog, D. J. YHedrick, T. E. (1998): "Applied research design: a practical approach", en Bickman, L. y Rog, D. J., Handbook of applied social research methods. Sage. Thousand Oaks, California: 5-38. Biemer, P. P. (1988): "Measuring data quality", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 273-282. Biemer, P. P. y Lyberg, L. E. (2003): Introduction to survey quality. John Wiley and Sonso Nueva Jersey. Biemer, P. P. y Trewin, D. (1997): "A review of measurement error effects on the analysis of survey data", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 603-632. Billiet, J. y Loovsveldt, G. (1988): "Improvement of the quality of responses to factuaLsurvey questions by interviewer training". Public Opinion Quarterly, 52: 190-211. Bishop, G. F.; Hippler, H. J.; Schwarz, N. y Strack, F. (1988): "A comparison of response effects in self-administered and telephone surveys", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 321-340. Bishop, G. F.; Tuchfarber, A. J. Y Oldendick, R. W. (1986): "Opinions on fictitiousissues: the pressure to answer survey questions". Public Opinion Quarterly, 50: 240-250. Blaikie, N. (1991): "A critique ofthe use oftriangulation in social research". Quality and Quantity, 25: 115-136. Blalock, H. M. (1978): Estadística social. FCE. México. Blalock, H. M. YBlalock, A. B. (1968): Methodology in social research. McGraw-Hill. Nueva York. .AJ ......


470

Bibliografía

Métodos de encuesta

Blumberg, H. H.; Ful1er, C. y Hare, A. P. (1974): "Response rates in postal surveys". Public Opinion Quarterly, 38: 113-123. Blyth, B. (1997): "Developing a speech recognition application for survey res.eareh", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewln, D., Survey measurement and process quality. John Wiley and Sons Ine. Nueva York: 249-266. Bohrnstedt, G. W. (1983): "Measurement", en Rossi, P. H.; Wrigth, J. D. YAnderson, A. B., Handbook ofsurvey research. Academic Press Inc. Orlando: 70-122. Bohrnstedt, G. W.; Mohler, P. P.; Müller, W. (comps.) (1987): An empiri~alst~dy ofthe relia~ bility and stability ofsurvey research items. Sage. ~ewbury Park, C~hfornla. ." Boruch, R. F. (1998): "Randomized controlled experlments for evaluatIon and plannlng ,en Bickman, L. y Rog, D. J., Handbook of applied social research methods. Sage. Thousand Oaks, California: 161-192. . . Bosch, J. L. Y Torrente, D. (1993): Encuestas telefónicas y por correo:.. Centro de InveStIgacIo. nes Sociológicas. Colección Cuaderno Metodológico n.o 9. MadrId." Bourque, L. B. Y Clark, V. A. (1994): "Proeessing data: the survey example ,en Lewls-Beck, . M. S., Research Practice. Sage. California: 1-88. Bourque, L. B. Y Fielder, E. P. (1995): How to conduct self-administered and mall surveys. Sage. Thousand Oaks, California. . '. " Bowen, J. M. (1973): "The questionnaire design for the personallntervlew ,en ESOMAR, Fieldwork, sampling and questionanire designo Amsterdam: ?7-91. Bradburn, N. M. (1983): "Response effects", en Rossi, P. H.; Wrlgth, J. D. Y Anderso~, A. B., Handbook ofsurvey research. Academic Press Inc. Orlan~o: ~89-3~8. Bradburn, N. M.; Sudman, S. y colaboradores (1979): Improvlng lntervlew method and questionnaire design: response effects to threatening questions in survey research. Jossey-Bass. San Francisco. Bradburn, N. M.; Sudman, S.; Blair, E. y Stocking, C. (1978): "Question threat and response .. . bias". Public Opinion Quarterly, 42: 221-234. Brehm, J. (1993): The phantom respondents. Opinion surveys and polltlcal representatlon. Ann Arbor. The University of Michigan Press. J ( 1992)· ,. . . "The behavior of respondents, nonrespondents and refusers B rennan, M. Y Hoek across mail surveys". Public Opinion Quarterly, 56: 530-535. . . .." Brenner, M. (1982): "Response effects of 'role-restricted' charactenstlcs of.the I~tervlewer ,~n Dijkstra, W. y Van der Zouwen, J., Response behaviour in the surveY-lntervlew. Academlc Press. Nueva York: 131-166. Brewer, J. y Hunter, A. (1989): Multimethod research: a synthesis ofs/yles. Sage. Londres. " Briek, J. M.; Waksberg, J.; Kulp, D. y Starer, A. (1995): "Bias in list-assisted telephone samples . Public Opinion Quarterly, 59: 218-235. . Brunner, G. A. Y Carroll, S. J. (1969): "The effect of prior notification on the refusal rate In fixed address surveys". Journal of Marketing Research, 9: 42-44. .. " Bryant, B. E (1975): "Respondent selection in a time of changing household composlÍlon . Journal of Marketing Research, 12: 129-135. . . . Bryrnan, A. y Cramer, D. (1995): Quantitative data analysis for soclal sClentlts. Routledge. Lon-

dreso

o

oH

L

Bulmer, M. (comps.) (1992): Sociological research methods. An introductlon. Macml ano ondres (e. 0.1984). ".Q r Burchell, B. y Marsh, C. (1992): "Effects of questionnaire length on survey response. ua lty and Quantity, 26: 233-244.

471

Calvo Buezas, T. (2000): Inmigración y racismo. Así sienten los jóvenes del siglo XXI. Cauce Editorial. Madrid. Camacho, C.; Prado, C.; Romero, B. y Valera, S. (2000): "¿Cómo hacen encuestas los encuestadores?". Metodología de Encuestas, 2 (1): 117-133. Campanelli, P.; Thomson, K.; Moon, N. y Staples, T. (1997): "The quality of occupational coding in the United Kingdom", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. yTrewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 437-455. Campbell, B. (1981): "Race-of-interviewer effeets among southern adolescents". Public Opinion Quarterly, 45: 231-244. Campbell, D. T. Y Russo, M. J. (1999): Social experimentation. Sage. Thousand Oaks, California. Campbell, D. T. Y Stanley, J. (1970): Diseños experimentales y cuasiexperimentales en la investigación social. Amorrortu. Buenos Aires. . Cannell, C. F.; Miller, P. V. y Oksenberg, L. (1981): "Research on interviewing techniques", en Leinhardt, S., Sociological methodology. Jossey-Bass. San Francisco: 389-437. Cannell, Ch. y Oksenberg, L. (1988): "Observation of behavior in telephone interviews", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 475-495. H. (1944): Gauging public opinion. Princeton University Press. Princeton. Carmines, E. G. Y Zeller, R. A. (1979): Reliability and validity assessment. Sage. Beverly Hills. Catania, J. A.; Bincon, D.; Canchola, J.; Pollack, L. M.; Hauck, W. y Coates, T. J. (1996): "Effects of interviewer gender, interviewer choice and item wording on responses to questions concerning sexual behavior". Public Opinion Quarterly, 60: 345-375. Catlin, G. e Ingram, S. (1988): "The effects of CATI on costs and data quality: a comparison of CATI and paper methods in centralized interviewing", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 437-450. Cea D'Ancona, M.a A. (1992): "La encuesta psicosociaI 1 y 11", en Clemente Díaz, M., Psicología social. Métodos y técnicas de investigación. Eudema. Madrid: 264-278; 279-301. Cea D'Ancona, M.a A. (1996/2001): Metodología cuantitativa. Estrategias y técnicas de investigación social. Síntesis. Madrid. D'Ancona, M.a A. (2002a/2004a): Análisis multivariable. Teoría y práctica en la investigación social. Síntesis. Madrid. D'Ancona, M.a A. (2002b): "La medición de las actitudes ante la inmigración: evaluación de los indicadores tradicionales de 'racismo"'. Revista Española de Investigaciones Sociológicas, 99: 87-111. D'Ancona, M.a A. (2004b): La activación de la xenofobia en España. ¿Qué miden las encuestas? Centro de Investigaciones Sociológicas. Colección Monografía ll. o 210. Madrid. Church, A. H. (1993): "Estimating the effects of incentives on mail surveys response rates: a meta-analysis". Public Opinion Quarterly, 57: 62-79. Cialdini, R. B. (1984): Influence: the newpsychology ofmodern persuasion. Harper Collins. Nueva York. Clairin, R. y Brion, P. (2001): Manual de muestreo. Hespérides. Madrid. Clemente Díaz, M. y Fernández, I. (1992): "La medición de las actitudes", en Clemente Díaz, M., Psicología social. Métodos y técnicas de investigación. Eudema. Madrid: 302-323. Colasanto, D.; Singer, E. y Rogers, T. F. (1992): "Context effects on responses to questions about aids". Public Opinion Quarterly, 56: 515-518.


472

Métodos de encuesta Bibliografía

· M·., Syk es,." W· Wilson P. y Blackshaw, N. (1988): "Nonresponse: the U.K. Co11lns, . L experience", W kb en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; NICholls 11, W. . y a s erg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: ~13~231. " Conrad, F. (1997): "Using expert systems to model and impr~ve survey classlficatton proc~sses , en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw,. E.; DlppO, C.; Schwarz, N. y T~ewln, D., Survey measurement and process quality. John WI1ey and Son~ In.c. Nueva York. 393-414. d F . G . y Schoeber, M. F. (2000): "Clarifying question rneanlng In a household telephone C onra, " . .. . survey". Public Opinion Quarterly'. 6~: 1~28. Quarterly, 40. 515-530. Converse,.. J M (1976)'. "Predicting no op1lllon m the polls . PubllC Oplnlon . d d· d ar lze quesJ M Y Presser.,. S. (1994): "Survey questions: handcrafttng C onverse,.. . the . stan 89 162 tionnaire", en Lewis-Beck, M. S., Research Practice. Sage. Cahfor~la: -. . C k T D Campbell D. T. (1977): "The design and conduct of quasl-expenments and true oO, . . y , 'd'l hl Rd . ts'In fi e Id settl·ngs" , en Dunette , H . M ., Handbook o-f an expenmen 'J ln ustrza psyc o ogy. McNally. Chicago. . .. .. C00, k T . D . y C ampbell, D. T. (1979): Quasi-experlmentatlon: deslgn and analysls lssues for field setting. Houghton-Mifflin. Boston. ." . ,en Blckman, L. Cooper, H . M . YL indsay, J. J. (1998): "Research synthesis and meta-analysls h d O k C l· y Rog, D. J., Handbook of applied social research methods. Sage. T ousan a s, a 1fornia: 315-341. .. . l' . Coq Huelva, D. y Asián Chaves, R. (2002).: "Estudio d~, la 'deseabI1~dad SOCIa en una l~vestigación mediante encuestas a empresanos andaluces. Metodologla de Encuestas, 4 (2). 211-

cou~;;: M. P. (1997): "Survey introductions and data quality". Public Opinion Q~rterly, 61: 317-338. . ." G b . J F C ouper, M . P . Y H ansen , S. E. (2002): "Computer-assisted intervlewlng ,en d S u rlum, Th . . dy · J A ., Handbook 01 interview research. Context and Metho s. age. ousan H o 1St eln,. Oaks California: 557-575. Couper, M' . p.., Hansen, S. E . Y Sadosky, S. .A. (1997):. "Evaluating .interviewer . . use ofNCAPI T tech. nology", en Lyberg, L.;.Bierner, P.; Collins, M.; De Le~uw, E., DIPPO,.C., Schwarz, . ~ rewm, D., Survey measurement and process quality. John Wiley and Sons Inc. ~uev~ York. 267-286. (199 Be Couper, M . P . y R o w , .6)· . "Evaluation of a computer-assisted ". ..self-lntervlew component . 89 105 in a computer-assisted personal interview survey . Publzc Oplnlo~ Quarterly, .6? ~ ,; Couper, M. P.; Traugott, M. W. y Lamias, M. J. (2001): "Web survey deslgn and admlnIstrabon . . . Public Opinion Quarterly, 65: 230-253. Cotter, P. R.; Cohen, J. yCoulter, P. B. (1982): "Race-of-interviewer effects In telephone lnterviews". Public Opinion Quarterly, 46: 278-284. Crarner D. (1994): Introducing statistics forsocial research. Routledge. L?ndres. Crowne,'D . P . y M arlowe, D. (1964): The approval motive: studies in evaluatlve dependence. John Wiley. Nueva York. . . Curtin, R.; Presser, S. y Singer, E. (2000): "The effects of response rate changes on the lndex of consumer sentiment". Public Opinion Quarterly, 64: 413-4~8. . Czaja, R. y Blair, J. (1996): Designing surveys. Pine Forge. C?hf~rnla. . Czaja, R.; Blair, J. y Sebestik, J. P. (1982): "Respond~nt selectlon In a .telephone survey. a comparison of three techniques". Journal of Marketzng Research, 19. 381-385. C. y Danhke, G. D anhke, G .L. ( 1989)·. "Investigación y comunicación", en Femández-C.ollado, . ". 385 454 . L., La comunicación humana: ciencia social. McGraw-HIll. Mexlco:

473

Daniel, W. W. (2002): "Nonresponse in sociological surveys: a review of sorne methods for handling the problern", en De Vaus, D., Social surveys. Sage. Londres: 372-383 (e. o. 1975: 50ciological Methods and Research, 3: 291-307). Davis, J. A. Y Smith, T. W. (1992): The NORC General Social Survey. A user's guide. Sage. Newbury Park. De Lamater, J. y McKinney, K. (1982): "Response-effects of question content", en Dijkstra, W. y Van der Zouwen;;, J., Response behaviour in the survey-interview. Academic Press. Nueva York: 13-48. De la Poza Pérez, J.; Martínez Jiménez, R. y Vallejo Martas, M. C. (2003): "Encuestas por correo en administración de empresas: análisis de los índices de respuesta". M etodología de Encuestas, 5 (1): 77-90. De Leeuw, E. D. (1992): Data quality in mail, telephone and face to face surveys. T.T- publikaties. Amsterdam. De Leeuw, E. D. (2002): "Reducing missing data in surveys: an overview of methods", en De Vaus, D., Social surveys. Sage. Londres: 393-407 (e. o. 2001: Quality and Quantity, 35 (2): 147-160). De Leeuw, E. D. YCollins, M. (1997): "Data collection methods and survey quality: an overview", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 199-220. De Leeuw, E. D.; Hox, J. J. YSnijkers, G. (2002): "The effect of computer-assisted interviewing on data quality: a review", en De Vaus, D., Social surveys. Sage. Londres: 170-191 (e. o. 1995: Journal ofthe Market Research Society, 37: 325-344). De Leeuw, E. D. Y Van der Zouwen, J. (1988): "Data quality in telephone and face to face surveys: a comparative meta-analysis", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 283-299. DeMaio, T. J. (1980): "Refusals: who, where and why". Public Opinion Quarterly, 44: 223-233. DeMaio, T. J.; Rothgeb, J. y Hess, J. (2002): "Improving survey quality through pretesting", en De Vaus, D., Social surveys. Sage. Londres: 338-351. De Miguel, A. (1997): Manual del perfecto sociólogo. Espasa. Madrid. De Miguel, A. (2000): Dos generaciones de jóvenes (1960-1998). Instituto de la Juventud. Madrid. De Miguel, A. (2003): El final del franquismo. Testimonio personal. Marcial Pons. Madrid. De Miguel, J. (1999): "Cien años de investigación sociológica sobre España". Revista Española de Investigaciones Sociológicas, 87: 179-219. De Vaus, D. A. (1990): Surveys in social research. Unwin Hyman. Londres. De Vaus, D. (comp.) (2002): Social surveys. Sage. Londres. DeVellis, R. F. (1991): Scale development. Theory and applications. Sage. Newbury Park. Dex, S. (2002): "The reliability of recall data: a literature review", en De Vaus, D., Social surveys. Sage. Londres: 257-282 (e. 0.1995: Bulletin de Methodologie Sociologique, 49: 58-89). Díaz de Rada, A.; Díaz de Rada, V. y Manzano Arrondo, V. (2003): "Efectos del diseño del cuestionario en la tasa de respuesta en encuestas postales". Metodología de Encuestas, 5 (1): 13-29. Díaz de Rada Igúzquiza, V. (1999a): "Viejos tópicos y nuevas realidades en la encuesta postal". Metodologíasde Encuesta, 1 (1): 107-125. Díaz de Rada Igúzquiza, V. (1999b): "Factores que incrementan la eficacia de las encuestas postales". Revista Española de Investigaciones Sociológicas, 85: 221-251.


474

Métodos de encuesta

Díaz de Rada Igúzquiza, V. (2000a): Problemas originados por la no respuesta en la investigación social: definición, control y tratamiento. Universidad Pública de Navarra. Navarra. Díaz de Rada Igúzquiza, V. (2000b): "Utilización de nuevas tecnologías para el proceso de 'recogida de datos' en la investigación mediante encuesta". Revista Española de Investigaciones Sociológicas, 91: 137-166. Díaz de Rada Igúzquiza, V. (2001a): Organización y gestión de los trabajos de campo con encuestas personales y telefónicas. Ariel Practicum. Madrid. Díaz de Rada Igúzquiza, V. (2001b): Diseño y elaboración de cuestionarios para la investigación comercial. ESIC (Escuela Superior de Gestión Comercial y Marketing). Madrid. Díaz de Rada Igúzquiza, V. (2001c): "Problemas de cobertura en la encuesta telefónica". Revista Española de Investigaciones Sociológicas, 93: 133-164. Díaz de Rada Igúzquiza, V. (2001d): "Estrategias para incrementar la tasa de respuesta en las investigaciones de encuestas". Revista Internacional de Sociología, 29: 133-162. Díaz de Rada Igúzquiza, V. (2002): Tipos de encuestas y diseños de investigación. Universidad Pública de Navarra. Navarra. Dijkstra, W. (1987): "Interviewing style and respondent behaviour: an experimental study of the survey interview". Sociological Methods and Research, 16(2): 309-334. Dijkstra, W. y Van der Zouwen, J. (comps.)(1982): Response behaviour in the survey-interview. Academic Press. Nueva York. Dijkstra, W. y Van der Zouwen, J. (1987): "Styles of interviewing and the social context of the survey-interview", en Hippler, H.; Schwarz, N. Y Sudman, S., Social information pro,cessing and survey methodology. Springer-Verlag. Nueva York: 200-211. Dillman, D. A. (1972): "Increasing mail questionnaire response in large samples of the general public". Public Opinion Quarterly, 36: 254-257. Dillman, D. A. (1978): Mail and telephone surveys: the total design method. John Wiley and Sonso Nueva York. Dillman, D. A. (1983): "Mail and other self-administered questionnaires", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook of survey research. Academic Press Inc. Orlando: 359-378. Dillman, D. A. (1991): "The design and administration of mail surveys". Annual Review of 50ciology, 17: 225-249. Dillman, D. A. (2000): Mail and Internet surveys: the tailored design method. Wiley. Nueva York. Dillman, D. A.; Gallegos, J. G. Y Frey, J. H. (1976): "Reducing refusal rates for telephone interviews". Public Opinion Quarterly, 40: 66-78. Dillman, D. A.; Sinclair, M. D. Y Clark, J. R. (1993): "Effects of questionnaire length, respondent-friendly design and a difficult questions on response rates for occupant-addressed census mail surveys". Public Opinion Quarterly, 57: 289-304. Dillman, D. A. Y Tarnai, J. (1988): "Administrative issues in mixed mode surveys", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. JohnWiley and Sonso Nueva York: 509-528. Dillman, D. A.; West, K. K. Y Clark, J. R. (1994): "lnfluence oí an invitation to answer by telephone on response to census questionnaires". Public Opinion Quarterly, 58: 557-568. Dillon, J. T. (1990): The practice of questioning. Routledge. Londres y Nueva Yo~k. ." Dippo, C. S. (1997): "Survey measurement and process improvement: concepts and mtegr~tIon , en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewln, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 457-474.

Bibliografía

475

Dohrenwend; B. S. (1965): "Sorne effects of open and closed questions on respondents'answer". Human Organization, 24 (summer): 175-184. Dohrenwend, B. S. (1970): "An experimental study of directive interviewing". Public Opinion Quarterly, 34: 117-128. Dohrenwend, B. S. ; Colombotos, J. y Dohrenwend, B. P. (2002): "Social distances and interviewer effects", en De Vaus, D., Social surveys. Sage. Londres: 142-154 (e. 0.1968: Public Opinion Quarterly, 3~-¡: 410-422). Dohrenwend, B. S. y Dohrenwend, B. P. (1968): "Sources of refusals in surveys". Public Opinion Quarterly, 3: 74-83. Duncan, O. D. (1984): Notes on social measurement: historical and critical. Russell Sage. Nueva York Durán, A.; Cañadas, l.; Ocaña, A. C. y Pérez Santamaría, F. J. (2000): "Construcción de cuestionarios para encuestas: el problema de la familiaridad de las opciones de respuesta". Metodología de Encuestas, 2 (1):27-60. Dykema, J.; Lepkowski, J. M. Y Blixt, S. (1997): "The effect of interviewer and respondent behavior on data quality: analysis of interaction coding in a validity study", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 287-310. Easthope, G. (1974): History ofsocial research methods. Longman. Londres. Echevarría Echabe, A. y Villareal Sáez, M. (1995): "Psicología social del racismo", en Echevarría, A. y otros, Psicología social del prejuicio y el racismo. Editorial Centro de Estudios Ramón Areces. Madrid. Ehrlich, H. L. (1964): "Instrument error and the study of prejudice". Social Forces, 43: 197-206. Esposito, J. L. Y Rothgeb, J. M. (1997): "Evaluating survey data: making the transition froro prestesting to quality assessment", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, B.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons lnc. Nueva York: 541-572. Faria, A. J., Dickinson, J. R. YFilipic, T. V. (1990): "The effect of telephone versus letter prenotification on mail survey response rate". Journal ofthe Market Research Society, 32: 551568. Federal Committee on Statistical Methodology. Subcornmittee on Survey Coverage (2002): "Coverage errors ocurring before sample selection", en De Vaus, D., Social surveys. Sage. Londres: 355-392. Feldman, J. J.; Hyman, H. y Hart, C. W. (2002): "A field study of interviewer effects on the quality of survey data", en De Vaus, D., Social surveys. Sage. Londres: 118-141 (e. 0.1951-1952: Public Opinion Quarterly, 15: 734-761). Fernández Álvaro, C.; Salamanca Miño, B. y López Blázquez, F. (2001): "Aplicación del muestreo sistemático en el diseño de encuestas. Metodología de Encuestas, 3 (1): 65-73. Fernánclez Prados, J. S. (1999): "Sistemas informatizados para las encuestas telefónicas". Metodologías de Encuestas, 1 (1): 29-46. Fernández Prados, J. S. y Rojas Tejada, A. J. (1998): "Trabajo de campo", en Rojas Tejada, A. J.; Femández Prados, J. S. y Pérez Meléndez, C., Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid: 155-168. Filion, F. L. (1975): "Estimating bias due to nonresponse in mail surveys". Public Opinion Quarterly, 39: 482-492.


476

Métodos de encuesta

Finch, J. (1987): "The vignettes technique in survey research". Sociology, 21: 105-114. Fink, A. (1995): How to design surveys. Sage. Thousand Oaks, California. Fiske, D. W. (1971): Measuring the concepts ofpersonality. Aldine. Chicago. FOESSA (1970): Informe sociológico sobre la situación social de España. Euroamérica. Madrid. Forsyth, B. H. YLessler, J. T. (1991): "Cognitive laboratory methods: a taxonomy", en Biemer, P. N.; Groves, R. M.; Lyberg, L. E.; Mathiowetz, N. A. YSudman, S., Measuretnent erros in surveys. John Wiley. Nueva York: 393-418. Fowler, F. J. Jr. (1988): Survey research methods. Sage. Beverly Hills. Fowler, F. J. Jr. (1991): "Reducing interviewer-related error through interviewer training, supervision and other means", en Biemer, P. P. y otros, Measurement errors in surveys. John Wiley. Nueva York: 259-278. Fowler, F. J. Jr. (1992): "How unclear terms affects survey data". Public Opinion Quarterly, 56: 218-231. Fowler, F. J. Jr. (1993): Survey research methods. Sage. Newbury Park, California. Fowler, F. J. Jr. (1998): "Design and evaluation of survey questions", en Bickman, L. y Rog, D. J., Handbook of applied social research methods. Sage. Thousand Oaks, California: 343-374. Fowler, F. J. Jr. y Mangione, T. W. (1990): Standardized survey interviewing: minimizing interviewer-related error. Sage, Newbury Park, California. Fox, J. A. Y Tracy, P. E. (1986): Randomized response. A method for sensitive surveys. Sage. Beverly Hills, California. Fox, R. J., Crask, M. R. Y Kim, J. (1988): "Mail survey response rate: a meta-analysis of selected techniques for inducing response". Public Opinion Quarterly, 52: 467-491. Frankel, M. (1983): "Sampling theory", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook of survey research. Academic Press Inc. Orlando: 21-69. Frey, J. H. (1980/1989): Survey research by telephone. Sage. Newbury Park, California. Frey, J. H. YOishi, S. M. (1995): How to conduct interviews by telephone and in persono Sage. Thousand Oaks, California. Funer, C. H. (2002): "Weighting to adjust for survey nonresponse", en De Vaus, D., Social surveys. Sage. Londres: 421-428 (e. 0.1974: Public Opinion Quarterly, 38: 239-246). Funer, T. D. Y colaboradores (1993): "Using focus groups to adapt survey instrument to new populations", en Morgan, D. L., Successfulfocus groups: advancing the state ofthe arto Sage. Newbury Park: 89-104. Gaertner, S. L. y Dovidio, J. F. (1986): Prejudice, discrimination and racismo Academic Press. SanDiego. Gaitán Moya, J. A. Y Piñuel Raigada, J. L. (1998): Técnicas de investigación en comunicación social. Síntesis. Madrid. García Ferrando, M. (1985): Socíoestadística. Introducción a la estadística en sociología. Alianza. Madrid. García Ferrando, M. (2000): "La encuesta", en García Ferrando, M.; Ibáñez, J. y Alvira Martín, F., El análisis de la realidad social. Alianza. Madrid: 167-201. Garrigós Monerris, J. l. (2003): Fréderic Le Play. Biografía intelectual, metodología e investigaciones sociológicas. Centro de Investigaciones Sociológicas. Colección Monografías n.O 203. Madrid. Gelb, B. D. (1975) "Incentives to increase survey returns: social class considerations". Journal of Marketing Research, 12: 107-109.

Bibliografía

477

Gelman, A. YLittle, T. C. (1998): "Improving on probability weighting for household size". Public Opinion Quarterly, 62: 398-404. Gfroerer~ J. C. y Hughes, A. L. (1991): "The feasibility of collection drug abuse data by telephone". Public Health Reports, 106: 384-393. Gibbons, D. C. y Jones, J. F. (1971): "Sorne critical notes on current definitions of deviance". Pacific Sociological Review, 4 (1). Gilbert, N. (1993): "W¡iting about social research", en Gilbert, N., Research sociallife. Sage, Londres: 329-344. Gilljam, M. y Granberg, D. (1993): "Should we take don't know for an answer?". Public Opinion Quarterly, 57: 348-357. Glaser, B. G. YStrauss, A. L. (1967): The discovery of Grounded Theory: strategies for qualitative research. Aldine. Chicago. Godwin, R. K. (1979): "The consequences of large monetary incentives in mail surveys of elites". Public Opinion Quarterly, 43: 378-387. Goldstein, K. M. YJennings, M. K. (2002): "The effect of advance letters on cooperation in a list sample telephone survey". Public Opinion Quarterly, 66: 608-617. González Blasco, P. (1989/2000): "Medir en las ciencias sociales", en García Ferrando, M.; Ibáñez, J. y Alvira Martín, F., El análisis de la realidad social. Alianza. Madrid: 343-407. González Gómez, A. y Padilla García, J. L. (1998): "La entrevista", en Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Meléndez, C., Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid: 141-153. González Gómez, A.; Padilla García, J. L. YPérez Meléndez, C. (1998): "La calidad de la encuesta", en Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Meléndez, C., Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid: 199-214. Goode, W. J. y Hatt, P. K. (1952): Methods in social research. McGraw-Hill. Nueva York. Goodstadt, M. S.; Chung, L.; Kronitz, R. yCook, G. (1977): "Mail survey response rates: their manipulation and impact". Journal of Marketing Research, 14: 391-395. Gorden, R. (1975): Interviewing strategy techniques and tactics. Dorsey Press. Homewoods, Illinois. Gouldner, A. W. (1960): "The norro of reciprocity: a preliminary statement". American Sociological Review, 25 (2): 161-178. Gove, W. R. (1982): "Systematic response bias and characteristics of the respondent", en Dijkstra, W. y Van der Zouwen, J., Response behaviour in the survey-interview. Academic Press. Nueva York: 167-188. Gove, W. R. y Geerken, M. R. (2002): "Response bias in surveys of mental health: an empirical investigation", en De Vaus, D., Social surveys. Sage. Londres: 56-83 (e. 0.1977: American Journal of Sociology, 82 (6): 1289-1317). Govindarajulu, Z. (1999): Elements ofsampling theory and methods. Prentice Hall. Upper Saddle River, Nueva Jersey. Goyder, J. C. (1985): "Face-to-face interviews and mail questionnaires: the net difference in responserate". Public Opinion Quarterly, 49: 234-252. Goyder, J. C. (1986): "Surveys on surveys: limitations and potentialities". Public Opinion Quarterly, 50: 27-41. Goyder, J. C. (1987): The si/ent minority. Nonrespondents on sample surveys. Polity Press. Blackwell, Cambridge. Goyder, J.; Lock, J. y McNair, T. (1992): "Urbanization effects on survey nonresponse: a test within and across cities". Quality and Quantity, 26: 39-48.


478

Métodos de encuesta

Bibliografía

Graham, J. W. y Schafer, J. L. (1999): "On the performance of múltiple imputation for multivariate data with small sample size", en Hoyle, R. H., Statistical strategies for small sample ." research. Sage. Thousand Oaks, California: 1-29. Granquist, L. y Kovard, J. G. (1997): "Editing of survey data: how much IS en?ugh? ,en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewln, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva Yo~k: 41?-436. " Groves, R. M. (1979): "Actors and questions in telephone and personallntervlew surveys . Public Opinion Quarterly, 43: 190-205. Groves, R. M. (1989): Survey errors and survey costs. John Wiley an~ Sonso Nueva :ork. Groves, R. M. (1990): "Theories and methods of telephone surveys . Annual ReVlew 01 Sociology, 16: 221-240. Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J. (comps.) (1988): Telephone survey methodology. John Wiley and Sonso N~~va York... Groves, R. M.; Cialdini, R. B. Y Couper, M. P. (1992): "Understanding the deC1Slon to partlclpate in a survey". Public Opinion Quarterly, 56: 475-495. .. . Groves, R. M. YCouper, M. P. (1998): Nonresponse in the Household lntervlew surveys. WI1eyInterscience. Nueva York. Groves, R. M. Y FuUz, N. H. (1985): "Gender effects among telephone interviewers in a survey of economic attitudes". Sociological Methods and Research, 14 (1): 31-52. Groves, R. M. Y Kahn, R. L. (1979): Surveys by telephone: a national comparison with personal interviews. Academic Press. Nueva York. Groves, R. M. Y Lyberg, L. E. (1988): "An overview of nonresponse issues in telephone surveys", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 191-211. Groves, R. M. Y Magilavy, L. J. (1981): "Increasing response rates to telephone surveys: a door in the face for foot-in-the door?". Public Opinion Quarterly, 45: 346-358. Groves, R. M. Y Magilavy, L. J. (1986): "Measuring and explaining interviewer effects in cen. . tralized telephone surveys". Public Opinion Quarterly, 50: 251-266. Groves, R. M.; Singer, E. y Corning,A. (2000): "Leverage-saliency theory of survey partlclpation. Description and an illustration". Public Opinion Quarterly, 64: 299-308. Gunn, W. J. y Rhodes, 1. N. (1981): "Physician response rates to a telephone survey: effects of monetary incentive level". Public Opinion Quarterly, 45: 109-115. Hagen, D. E. Y Collier, .C. M. (1982): "Must respondent selection procedures for telephone surveys be invasive?". Public Opinion Quarterly, 47: 547-556. . . . Hagenaars, J. A. Y Reinen, T. G. (1982): "Effects of role-independent inte~ew~r characterlst~cs on response", en Dijkstra, W. y Van der Zouwen, J., Response behavlour ln the surveY-lnterview. Academic Press. Nueva York: 91-130. Hair, J. F.; Anderson, R. B.; Tathan, R. L.; Black, W. C. (1999): Análisis multivariante. Prentice Hall. Madrid. Hakim, C. (1994): Research design: strategies and choices in the design of social research. Routledge. Londres. Hansen, R. A. (1980): "A self-perception interpretation of the effect of mo~etary and nonmonetary incentives on mail survey response behavior". Journal of Markettng Research, 17: 77-83.

.

l

Hapuarachi P.; March, M. y Wronski, A. (1997): "Usin~ statist~~al methods appl!cab e t~ autocorrelated processes to analyze survey process quahty data ,en Lyberg, L.; Blemer, P.,

479

Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and processquality. John Wiley and Sons Inc. Nueva York: 589-600. Harvey, L. (1987): "Factors affecting response rates to mailed questionnaires: a comprehensive literature review". Journal of Market Research Society, 29 (3): 342-353. Hatchett, S. y Schuman, H. (1975): "Race ofinterviewer effects upon white respondents". Public Opinion Quarterly, 39: 523-528. Heath, A. y Martin, J. (1997): "Why are there so few formal measuring instruments in social and political research?", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement andprocess quality. John Wiley and Sons Inc. Nueva York: 71-86. Heberlein, T. A. Y Baurngartner, R. (1978): "Factors affecting response rates to mailed questionnaires: a quantitative analysis of the published literature". American Sociological Review, 43: 447-462. Henerson, M. E., Morris, L. L. YFitz-Gibbon, C. T. (1987): How to measure altitudes. Sage. Newbury Park, California. Henry, G. T. ('1990): Practical samplig. Sage. Newbury Park. Henry, G. T. (1998): "Practical sampling", en Bickman, L. y Rog, D. J., Handbook ofapplied social research methods. Sage. Thousand Oaks, California: 101-126. Herman, J. B. (1977): "Mixed fiode data collection: telephone and personal interviewing". Journal 01 Applied Psychology, 62: 399-404. Hernández Baeza, A.; Espejo Tort, B.; González Roma, V. y Gómez Benito, J. (2001): "Escalas de respuesta tipo Likert: ¿es relevante la alternativa 'indiferente'?". Metodología de Encuestas, 3 (2): 135-150. Hertel, B. R. (2002): "Minimizing error variance introduced by missing data routines in survey analysis", en De Vaus, D., Social surveys. Sage. Londres: 408-420 (e. 0.1976: Sociological Methods and Research, 4: 459-474). Hesselbart, S. (1975): "Education, ethnic, stereotypes and question format". Sociology and Social Research, 50: 266-273. Hesselbart, S. (1978): "Racial stereotypes, gender stereotypes and question formal". Social Science Quarterly, 59 (2): 338-346. Hippler, H. J. Y Hippler, G. (1986): "Reducing refusal rates in the case of threatening questions: the 'door-in-the face' technique". Journal of Official Statistics, 2: 25-33. Hirschi, T. (1969): Causes of delinquency. University of California Press. California. Hochstim, J. R. (1967): "A critical comparison of three strategies of collecting data from households". Journal ofthe American Statistical Association, 62: 976-989. Hopkins, K. D. Y Gullickson, A. R. (1992): "Response rates in surveys research: a metaanalysis of the effect of monetary gratuties". Journal of Experimental Education, 61: 52-62. House, C. C. y Nicholls 11, W. L. (1988): "Questionnaire design for CATI: design objectives and methods", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 421-436. House, J. S.; Gerber, W. y McMichael, A. J. (1977): "Increasing mail questionnaire response: a controlled replication and extension". Public Opinion Quarterly, 41: 95-99. House, J. S. y Wolf, S. (1978): "Effects of urban residence and interpersonal trust and helping behavior". Journal o[ Personality and Social Psychology, 36 (9): 1029-1043. Hox, J. J. (1997): "From theoretical concept to survey questions", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality.John Wiley and Sons Inc. Nueva York: 47-70.


480

Métodos de encuesta

Hox, J. J. YDe Leeuw, E. D. (1994): "A comparison of nonresponse in mail, telephone and face to face surveys". Quality and Quantity, 28: 329-344. Hox, J. J. Y De Leeuw, E. D. (2002): "A comparison of nonresponse in mail, telephone and face to face surveys", en De Vaus, D., Social surveys. Sage. Londres: 157-171. Hoyle, R. H. (comp.) (1999): Statistical strategies for small sample research. Sage. Thousand Oaks, California. Hubbard, R. y Little, E. (1988): "Promised contribution to charity and mail survey responses". Public Opinion Quarterly, 52: 223-230. Ibáñez, J. (1989): "Perspectivas de la investigación social: el diseño en la perspectiva estructural", en García Ferrando, M.; Ibáñez, J. y Alvira Martín, F., El análisis de la realidad social. Alianza. Madrid: 49-84. Ispízua Uribarri, M. (2002): "La técnica de la encuesta ante las nuevas tecnologías. Unas primeras reflexiones", en Iglesias de Ussel, J. y otros, La sociedad: teoría e investigación empírica. Estudios en homenaje a José Jiménez Blanco. Centro de Investigaciones Sociológicas. Madrid: 1123-1140. Jaccard, J. Y Wan, Ch. (1996): LISREL approaches to interaction effects in multiple regression. Sage. Thousand Oaks. Jackson, R. H. (1984): "Ethnicity", en Sartori, G., Social science concepts. A systematic analysiso Sage. Beverly Hills: 205-234. Jacobs, H. (1994): "Using published data: errors and remedies", en Lewis-Beck, M. S., Research practice. Sage. California: 339-390. Jacobs, M.; Cross, J. y Smailes, E. (1994): "CIM: Computer Interviewing by Mail". Qualityand Quantity, 20: 137-150. James, J. M. Y Bolstein, R. (1990): "The effect of monetary incentives and follow-up mailings on the response rate and response quality in mail surveys". Public Opinion Quarterly, 54: 346-361. Jenkins, C. R. y Dillman, D. A. (1997): "Towards a theory of self-administered questionnaire design", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 165-198. Jobe, J. B.; Pratt, W. F.; Tourangeau, R.; Baldwin, A. K. Y Rasinski, K. A. (1997): "Effects of interview mode on sensitive questions in a fertility survey", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 311-330. Johnson, T. P. Yotros (1989): "Obtaining reports of sensitive behavior: a comparison of substance use reports from telephone and face-to-face interviews". Social Science Quarterly, 70: 174-183. Johnson, T. P; O'Rourke, D.; Chavez, N.; Sudman, S.; Warnecke, R.; Lacey, L. y Horm, J. (1997): "Social cognition and responses to survey questions among culturally diverse populations", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 87-114. Johnson, W. T. y DeLamater, J. (1976): "Response effects in sex surveys". Public Opinion Quarterly, 40: 165-181.

Bibliografía

481

Jordan, L. A.; Marcus, A. C. y Reeder, L. G. (1980): "Response styles in telephone and house~old interviewing: a field experiment". Public Opinion Quarterly, 44: 210-222. Kaldenberg, D. O.; Koenig, H. F. Y Becker, B. W. (1994): "Mail survey response rate patterns in a population of the elderly. Does response deteriorate with age?". Public Opinion Quarterly, 58: 68-76. Kalton, G. (1983a): Compensating for missing survey data. Ann Arbor. University of Michigan, Survey Research Center, Michigan. Kalton, G. (1983b): Introduction to survey sampling. Sage. Beverly Hills, California. KaIton, G.; Collins, M. y Brook, L. (1978): "Experiments in wording opinion questions". Applied Statistic, 27: 149-161. Kalton, G. y Kasprzyk, D. (1986): "The treatment of missing survey data". Survey Methodology, 12 (1): 1-16. Kalton, G.; Roberts, J. y Holt, D. (1980): "The effects of offering a middle response option with opinion questions". Statistian, 29: 65-78. Kalton, G. y Schuman, H. (2002): "The effect ofthe question on survey responses: a review", en De Vaus, D., Social surveys. Sage. Londres: 209-230 (e. 0.1982: Journal ofthe Royal Statistical Society, 145: 42-73). Kane, E. W. y Macaulay, L. F. (1993): "Interviewer gender and gender attitudes". Public Opinion Quarterly, 57: 1-28. Kaplan, A. (1964): The conduct ofinquiry. Chandler. San Francisco. Karweit, N. y Meyers, E. D. Jr. (1983): "Computers in survey research", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook o[ survey research. Academic Press Inc. Orlando: 379-414. Keeter, S. (1995): "Estimating telephone noncoverage bias with a telephone survey". Public Opinion Quarterly, 59: 196-217. Keeter, S.; Miller, C.; Kohut, A.; Groves, R. M. Y Presser, S. (2000): "Consequences of reducing nonresponse in a national telephone survey". Public Opinion Quarterly, 64: 125-148. Kelly, J. R. Y McGrath, J. E. (1988): On time and method. Sage. Beverly Hills, California. Kerlinger, F. N. (1986): Foundations o[ behavioral research. HoIt, Rinehart and Winston. Nueva York. King, G.; Keohane, R. O.; Yerba, S. (2000): El diseño de la investigación social. La inferencia científica en los estudios cualitativos. Alianza Editorial. Madrid. Kiesler, S. y Sproull, L. S. (1986): "Response effects in the electronic survey". Public Opinion Quarterly, 50: 402-413. Kish, L. (1965/1995): Survey samplig. John Wiley and Sonso Nueva York. Kish, L. (1992): "Weighting for unequal P¡". Journal of Official Statistics, 8: 183-200. Kish, L. y Hess, 1. (1959): "A replacement"procedure for reducing the bias of nonresponse". American Statistician, 13: 17-19. Knauper, B. (1998): "Filter questions and question interpretation. Presuppositions at work". Public Opinion Quarterly, 62: 70-78. Knudsen, D. D.; Pope, H. e Irish, D. P. (1967): "Response differences to questions on sexual standards.·An interview-questionnaire comparison". Public Opinion Quarterly, 31: 290297. Kon, 1. (comp.) (1989): Historia de la sociología del s. xIx-comienzos del S. xx. Editorial Progreso. Moscú.


482

Métodos de encuesta

Kormendi, E. (1988): "The quality of income information in telephone and face to face surveys", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 341-356. Kovaliova, M. (1989): "Investigaciones sociales empíricas en el s. XIX", en Kon, l., Historia de la sociología del s. xIx-comienzos del s. xx. Editorial Progreso. Moscú: 121-150. Krosnick, J. A. Y Alwin, D. F. (1987): "An evaluation of a cognitive theory of response-order effects in survey measurements". Public Opinion Quarterly, 51: 201-219. Krosnick, J. A. YFabrigar, L. R. (1997): "Designing rating scales for effective measurement in surveys", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 141-164. Krosnick, J. A.; Holbrook, A. L.; Berent, M. K.; Carson, R. T. Ycolaboradores (2002): "The impact of 'no opinion' response options on data quality non-attitude reduction or an invitation to satisfice?". Public Opinion Quarterly, 66: 371-403. Krysan, M. (1998): "Privacy and the expression of white racial attitudes. A comparison across three contexts". Public Opinion Quarterly, 62: 506-544. Krysan, M.; Schuman, H.; Scott, L. J. YBeatty, P. (1994): "Response rates and response content in mail versus face-to-face surveys". Public Opinion Quarterly, 58: 381-399. Lamberth, J. (1980): Psicología social. Ediciones Pirámide. Madrid. Lamo de Espinosa, E. (1992): "La sociología española desde 1939", en Ibáñez, J., Las ciencias sociales en España: historia inmediata, crítica y perspectivas. Universidad Complutense. Madrid: 119-130. Landon, E. L. Y Banks, S. K. (1977): "Relative efficiency and bias of plus-one telephone samplig". Journal of Marketing Research: 294-299. Lavrakas, P. J. (1993): Telephone survey methods: sampling, selection and supervision. Sage. Newbury Park (e~ o. 1981). Lavrakas, P. J. (1998): "Methods of sampling and interviewing in telephone surveys", en Bickman, L. y Rog, D. J., Handbook of applied social research methods. Sage. Thousand Oaks, California: 429-472. Lazarsfeld, P. F .. (1944): "The controversy over· detailed interviews -an offer for negotiation". Public Opinion Quarterly, 8: 38-60. Lazarsfeld, P. F. (1971): "Una introducción conceptual al análisis de la estructura latente", en Mora y Araujo, M., Medición y construcción de índices. Nueva Visión. Argentina: 29-82. Lazarsfeld, P. F. (1972): Qualitative análisis. Historical and critical essays. Allyn and Bacon. Boston. Lazarsfeld, P. F. (1973a):·"De los conceptos a los índices empíricos", en Bouden, R. y Lazarsfeld, P., Metodología de las ciencias sociales. 1 Conceptos e índices. Laia. Barcelona: 35-46. Lazarsfeld, P. F. (1973b): "La sociología", en Piaget, J. y otros, Tendencias de la investigación en las ciencias sociales. Alianza. Madrid. Lazarsfeld, P. F. Y Oberschall, A. (1965): "Max Weber and empirical social research". American Sociological Review, 30 (2): 185-199. Lee, R. M. (1993): Doing research on sensitive topics. Sage. Londres. Lepkowski, J. M. (1988): "Telephone sam-pling methods in the United States", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 73-98. Lessler, J. T. Y Kalsbeek, W. D. (1992): Nonsampling error in surveys. Wiley. Nueva York.

Bibliografía

483

Levy, P. S. y Lemeshow, P. S. (1991): Sampling ol populations: methods and applications. Wiley. Nueva York. Lévy Mangin, J. P. YVarela Mallou, J. (comps.) (2003): Análisis multivariable para las ciencias sociales. Prentice Hall. Madrid. Lin, N. (1976): Foundations ofsocial research. McGraw-Hill. Nueva York. Lin, l. F. YSchaeffer, N. C. (1995): "Using survey participants to estimate the impact of non participation". Public¿ Opinion Quarterly, 59: 236-258. Link, M. W. y Oldendick, R. W. (2002): "Call screening: Is it really a problem for survey research", en De Vaus, D., Social surveys. Sage. Londres: 393-403 (e. o. 1999: Public Opinion Quarterly, 63: 557-589). Linsky, A. S. (1975): "Stimulating responses to mailed questionnaires: a review". Public Opinion Quarterly, 39: 82-101. Lisón, C. (1968): "Una gran encuesta de 1901-1902". Revista Española de la Opinión Pública, 12: 83-152. Litwin, M. S. (1995): How to measure survey reliability and validity. Sage. Thousand Oaks, California. Locander, W.; Sudman, S. y Bradburn, N. M. (1976): "An investigation of interview method, threat and response distortion". Journal ofAmerican Statistical Association, 71: 269-275. Lodge, M. (1981): Magnitude scaling: quantitative measurement of opinions. Sage. Beverly Hills, California. Lohr, S. L. (2000): Muestreo: diseño y análisis. International Thomson Editores. México. López Pardo, R. y Varela Mallou, J. (2000): "Evaluación de las escalas de respuesta en la medición conjunta". Metodología de Encuestas, 2 (2): 185-198. López Pérez, J. (1981): "Las escalas de actitudes", en Morales, J. F., Metodología y teoría de la psicología. UNED. Madrid: 233-282. López Pintor, R. (1982): La opinión pública española del franquismo a la democracia. Centro de Investigaciones Sociológicas. Madrid. López Pintor, R. (1989): "El análisis de los datos de encuesta", en García Ferrando, M.; Alvira, F. e Ibáñez, J., El análisis social de la realidad. Alianza. Madrid: 359-382. Losch, M. E.; Maitland, A.; Lutz, G.; Mariolis, P. y Gleason, S. (2002): "The effect oí time of year of data collection on sample efficiency. An analysis of behavioral risk factor surveillance survey data". Public Opinion Quarterly, 66: 594-607. Lyberg, L. y Kasprzyk, D. (1997): "Sorne aspect of post-survey processing", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 353-370. Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., (comps.) (1997): Survey measurement and process quality. John Wiley and Sons Inc. Nueva York. Lynn, P. y Lievesley, D. (1991): Drawing general population samples in Great Britain. Social and Company Planning Research. Londres. Lyons Morris, L. ; Taylor Fitz-Gibbon, C.; Lindheim, E. (1987): How to measure performance and use tests. Sage. Newbury Park.

Mandell, L. (2002): "When to weight: determining nonresponse bias in survey data", en De Vaus, D., Social surveys. Sage. Londres: 247-252 (e. 0.1974: Public Opinion Quarterly, 38: 429-434).


484

Métodos de encuesta

Mangione, T. W. (1998): "Mail surveys", en Bickman, L. y Rog, D. J., Handbook of applied social research methods. Sage. Thousand Oaks, California: 399-428. Mann, Ch. y Stewart, F. (2002): "Internet interviewing", en Gubrium, J. F. Y Holstein, J. A., Handbook of interview research. Context and Methods. Sage. Thousand Oaks, California: 603-627.

Manzano Arrondo, V. (1998): "Selección de muestras", en Rojas Tejada, A. J.; Fernártdez Prados, J. S. y Pérez Meléndez, C., Investigar mediante encuestas. Fundamentos teóricos y aspectos practicos. Síntesis. Madrid: 51-97. Manzano,V. y Andreu, J. (2000): "Formatos para ítems en las encuestas electrónicas. Antecedentes y propuestas". Metodología de Encuestas, 2 (1): 61-101. Manzano Arrondo, V. y González Gómez, A. (1998): "Selección del encuestado", en Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Meléndez, C., Investigar mediante encuestas. Fundamentos teóricos y aspectos practicos. Síntesis. Madrid: 99-113. Manzano, V.; Rojas, A. J. YFernández, J. S. (1996): Manual para encuestadores. Ariel Practicum. Barcelona. Marsh, C. y Scarbrough, E. (2002): "Testing nine hypotheses about quota sampling", en De Vaus, D., Social surveys. Sage. Londres: 3-19 (e. 0.1990: Journal ofthe Market Research So. ciety, 32 (4): 485-506). Martín, E. y Polivka, A. E. (1995): "Diagnostics for redesigning survey questionnaires. Measuring work in the current population survey". Public Opinion Quarterly, 59: 547-567. Martín Martínez, J. L. (1980): "Ensayo de tipificación de los 'sin opinión"'. Revista Española de Investigaciones Sociológicas, 16: 9-38. Mason, R.; Carlson, J. E. YTourangeau, R. (1994): "Contrast effects and subtraction in partwhole questions". Public Opinion Quarterly, 58: 569-578. Massey, J. T. (1988): "An overview of telephone coverage", en Graves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 3-8. Massey, J. T. Y Botman, S. L. (1988): "Weighting adjustments for random digit dialed surveys", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 143-160. McCarty, J. A. Y Shrum, L. J. (2000): "The measurement of personal values in survey research. A test of alternative rating procedures". Public Opinion Quarterly, 64: 271-298. McClendon, M. J. (2002): "Acquiescence and recency response-order effects in interview surveys", en De Vaus, D., Social surveys. Sage. Londres: 84-117 (e. 0.1991: Sociological Methods and Research, 20 (1): 60-103). McConahay, J. B. (1983): "Modern racism and modern discrimination: the effects of race, racial attitudes and contet on simulated hiring decisions". Personality and Social Psychological Bulletin, 9: 551-558. McConahay, J. B. (1986): "Modern racism, ambivalence and the modern racism scale", en Dovidio, J. F. y Gaertner, S. L., Prejudice, discrimination and racismo Academic Press. Orlando. McConahay, J. B. Y Hough, J. L. Jr (1976): "Symbolic racism". Journalof Social Issues, 32: 23-45.

McFarland, S. G. (1981): "Effects of question order on survey responses". Public Opinion Quarterly, 45: 208-215. Merton, R. K. (1983): Teoría y estructuras sociales. FCE. México. Merton, R. K. Y Lazarsfeld, P. F. (comps.) (1950): Continuities in social research: studies in the scope and method of "The American Soldier". Glencoe 11., Free Press. Nueva York.

Bibliografía

485

Metha, R. Y Sivadas, E. (1995): "Comparing response rates and response content in mail versus electronic mail surveys". Journal of the Market Research Society, 37: 429-439. Mirás, J~ (1985): Elementos de muestreo para poblaciones finitas. INE. Madrid. Mizes, J. S.; Fleece, E. L. YRoos, C. (1984): "Incentives for increasing return rates: magnitude levels, response bias and format". Public Opinion Quarterly, 48: 794-800. Mohadjer, L. (1988): "Stratification of prefit areas for sampling rare populations", en Groves, R. M.; Biemer, P.". P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wileyand Sonso Nueva York: 161-173. Molenaar, N. J. (1982): "Response-effects of 'format' characteristics of question", en Dijkstra, W. y Van der Zouwen, J., Response behaviour in the survey-interview. Academic Press. Nueva York: 49-90. Moore,D. W. (2002): "Measuring new types of question-order effects. Additive and subtractive". Public Opinion Quarterly, 66: 80-91. Moore, J. L.; Stinson, L. L. Y Welniak, E. J. Jr. (2002): "Income measurement error in surveys: a review", en De Vaus, D., Social surveys. Sage. Londres: 3-36. Morales, J. F. (1996): "El prejuicio racial como actitud negativa", en Morales, J. F. Y Yubero, S., Del prejuicio al racismo: perspectivas psicosociales. Ediciones de la Universidad de Castilla-La Mancha. Cuenca: 11-22. Morales Díez de Ulzurrun, L. (2000): "El efecto de la no respuesta parcial en el análisis de datos de encuesta: una comparación entre la eliminación de observaciones y la imputación múltiple". Metodología de Encuestas, 2 (2): 217-238. Morganstein, D. y Marker, D. A. (1997): "Continuous quality improvement in statistical agencies", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippa, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 475-500.

Moser, A. C. y Kalton, G. (1971): Survey method in social investigation. Heinemann. Londres. Moser, A. C. y Kalton, G. (1989): Survey method in social investigation. Gower, Publishing Company. Londres. Murgui, S.; Muro, J. y Uriel, E. (1992): "Influencias de las sustituciones en la calidad de los datos en la Encuesta de Condiciones de Vida y Trabajo en España (ECVT)". Estadística Social, 139: 137-149. Nadeu, R. Y Niemi, R. G. (1995): "Educated guesses. The process of answering factual knowledge questions in surveys". Public Opinion Quarterly, 59: 323-346. Narayan, S. y Krosnick, J. A. (1996): "Education moderates sorne response effects in attitude measurement". Public Opinion Quarterly, 60: 58-88. Navarro López, M. (2001): "La investigación social aplicada en España", en Del Campo, S., Historia de la sociología española. Ariel Sociología. Madrid: 261-284. Nederhof, A. J. (1983): "The effects of material incentives in mail surveys: two studies". Public Opinion Quarterly, 47: 103-111. Nederhof, A. J. (1988): "Effects of a final telephone reminder and questionnaire over design in mail surveys". Social Science Research, 17: 353-361. Newel1, R. (1993): "Questionnaires", en Gilbert, N., Researching socia/life. Sage. Londres: 94115.

Nicholls 11, W. L. (1988): "Computer-assisted telep~one interviewing: a general introduction", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 377-385.


486

Bibliografía

Métodos de encuesta

Nicholls 11, W. L.; Baker, R. P. Y Martin, J. (1997): "The effect of new data collection technologies on survey data quality", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 221-248. Nisbet, R. M. (1966): The sociological tradition. Basic Books. Nueva York. Noel1e, E. (1970): Encuestas en la sociedad de masas. Alianza. Madrid. Oksenberg, L. Y Cannell, Ch. (1988): "Effects of interviewer vocal characteristics on nonresponse", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 257269.

Oksenberg, L.; Coleman, L. y Cannell, C. (1986): "Interviewers'voices and refusal rates in telephone surveys". Public Opinion Quarterly, 50: 97-111. O'Muircheartaigh, C. (1997): "Measurement error in surveys: a historical perspective", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 1-28. O'Neil (1979): "Estimating the nonresponse bias due to refusals in telephone surveys". Public Opinion Quarterly: 218-232. Oppenheim, A. (1966): Questionnaire. design and attitude measurement. Heinemann. Londres. Orenstein, A. y Phillips, W. R. (1978): Understanding social research: an introduction. Allyn and Bacon, Inc. Boston. Orne, M. T. (1969): "Demand characteristics and the concept of quasi-controls", en Rosenthal, R. y Rosnow, R. L., Artifacts in behavioral research. Academic Press. Nueva York: 143-179. O'Rourke, D. y Blair, J. (2002): "Improving random respondent selection in telephone surveys", en De Vaus, D., Social surveys. Sage. Londres: 404-413 (e. 0.1983: Journal of Marketing Research, 20: 428-432). Orr, L. L. (1999): Social experiments. Sage. Thousand Oaks, California. a Oskamp, S. (1991):A.ttitl-ulesQ,rzd opinions. Prentice Hall. Englewood Cliffs, 2. ed. Padilla García, J. L.; González Gómez, A. y Pérez Meléndez, C. (1298):. "Elaboración del cuestionario", en Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Meléndez, C., Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid: 115-140. Paisley, W. J. y Parker, E. B. (1965): "A computer-generated sampling table for selecting respondents within households". Public Opinion Quarterly, 29: 431-436. Pastor Ramos, G. (1978): Conducta interpersonal. Ensayo de psicología social sistemática. Universidad Pontificia de Salamanca. Salamanca. Payne, S. L. (1980): The art of asking questions. Princeton University Press. Princenton, Nueva Jersey (e. 0.1951). Pérez López, C. (2001): Técnicas estadísticas con SPSS. Prentice Hall. Madrid. Pérez Santamaría, F. J.; Rodríguez Testal, J. F.; Romero de Loera, B.; Rubalcaba Loyaso, F. J. Y Lozano Rojas, Ó. (2002): "Preferencias por formatos de respuesta en cuestionarios para encuestas". Metodología de Encuestas, 4 (1): 63-74. Periáñez, M. (1999): "Sobre los límites de validez de los sondeos". Empiria, 2: 61-72. Pettigrew, T. y Meertens, R. W. (1995): "Subtle and blatant prejudice in Western Europe". European Journal of Social Psychology, 25: 57-75. Phillips, B. (1985): Sociological research methods: an introduction. The Dorsey Press. Illinois.

487

Phillips, D. L. Y Clancy, K. J. (2002): "Sorne effects of 'social desirability' in survey studies", en De yaus, D., Social surveys. Sage, Londres: 921-940 (e. 0.1972: American Journal of Sociology, 77: 921-940). Platek, R. (1977): "Sorne factors affecting non-response". Survey Methodology, 3: 191-214. Platt, J. (1996): A history ofsociological research methods in America 1920-1960. Cambridge University Press. Cambridge. Platt, J. (2000): "Una igstitucionalización problemática: la primera sociología británica", en Del Campo, S., La institucionalización de la sociología (1870-1914). Centro de Investigaciones Sociológicas. Madrid: 71-94. Porst, R. y Zeifang, K. (1987): "A description oí the german general social survey: test-retest study and a report on the stabilities of the sociodemographic variables", en Bohrnstedt, G. W.; Mohler, P. P. y Müller, W., An empirical study of the reliability and stability ofsurvey research items. Sage. Newbury Park, California: 177-218. Presser, S. y Schuman, H. (1980): "The measurement of a middle position in attitude surveys". Public Opinion Quarterly, 44: 70-85. Procter, M. (1993): "Measuring attitudes", "Analysis survey data" y "Analysing other researchers'data", en Gilbert, N., Researching sociallife. Sage. Londres: 116-134,239-254,255-269. Ramos, M.; Sedivi, B. M. Y Sweet, E. M. (1998): "Computerized self-administered questionnaires", en Couper, M. P.; Baker, R. P.; Bethlehem, J.; Clark, C. Z. F.; Martín, J. y Nicholls 11, W. L., Computer assisted survey information collection. Wiley. Nueva York: 389-408.

Rasinski, K. A.; Mingay, D. y Bradburn, N. M. (1994): "Do respondents really 'mark all that apply' on self-administered questions?". Public Opinion Quarterly, 58: 400-408. Reese, S. D.; Danielson, W. A.; Shoemaker, D. J.; Chang, T. K. YHsus, H. L. (1986): "Ethnicity of interviewer effects among mexican-americans and anglos". Public Opinion Quarterly, 50: 563-572.

Reichardt, Ch. S. y Cook, T. D. (1979): "Beyond qualitative versus quantitative methods", en Cook, T. D. Y Reichardt, Ch., Qualitative and quantitative methods in social research. Sage. Beverly Hills, California. Reichardt, Ch. S. y Mark, M. M. (1998): "Quasi-experimentation", en Bickman, L.y Rog, D.J., Handbook ofapplied social research methods. Sage.Thousand Oaks, Calofornia: 193-228. Reinecke, J. y Schmidt, P. (1993): "Explaining interviewer effects and respondent behavior: theoretical models and empirical analysis". Quality and Quantity, 27 (2): 219-247. Richlin, J. y Strenski, E. (1991): A guide to writing sociology papers. Saint Martin. Nueva York. Robson, C. (1993): Real world research. A resource for social scientist and practioner researchers. Blackwell. Oxford. Rodríguez Osuna, J. (1989): "La muestra" ,en García Ferrando, M.; Ibáñez, J. y Alvira Martín, F., El análisis de la realidad social. Alianza. Madrid: 287-320. Rodríguez Osuna, J. (1991): Métodos de muestreo. Centro de Investigaciones Sociológicas. Colección Cuaderno MetodolQgico, n.O 1. Madrid. Rodríguez Osuna, J. (1993): Milodos de muestreo. Casos prácticos. Centro de Investigaciones Sociológicas. Colección Cuaderno Metodológico, n.o 6. Madrid. Rodríguez Torres, R. y RodríguezPérez, A. (1999): "Diseño de un cuestionario para la medición de las creencias sobre las diferencias raciales". Revista de Psicología Social, 14 (1): 41-54. Rojas Tejada, A. J.; Fernández Prados, J. S. y Pérez Meléndez, C. (1998): Investigar mediante encuestas. Fundamentos teóricos y aspectos prácticos. Síntesis. Madrid.


488

Métodos de encuesta

Rojas Tejada, A. J. Y Fernández Prados, J. S. (2000): "Análisis de las alternativas de respuestas intermedias mediante el modelo de escalas de clasificación". Metodología de Encuestas, 2 (2): 171-183. Rose, D. y Sullivan, O. (1993): Introducing data analysis for social scientist. Open University Press. Buckingham. Rosenberg, M. (1965): Society and adolescent self-image. Princeton University Press. Princeton, Nueva Jersey. Ross, C. E. y Mirowsky, J. (1998): "The worst place and the best face". Social Porces, 62: 529-536. Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B. (1983): Handbook ofsurvey research~ Academic Press Inc. Orlando. Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B. (1983): "Sample surveys: history, current practice and future prospects", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook ofsurvey research. Academie Press Inc. Orlando: 1-20. Salmon, C. T. y Niehol1s, J. S. (1983): "The next-birthday method for respondent selection". Public Opinion Quarterly, 47: 270-276. Sánchez Carrión, J. J. (1995/1999): Manual de análisis de datos. Alianza. Madrid. Sánchez Carrión, J. J. (1996): "La calidad de la encuesta". Papers, 48: 127-146. Sánehez Camón, J. J. (2000): La bondad de la encuesta: el caso de la no respuesta. Alianza. Madrid. Sánehez Crespo, J. L. (1971): Principios elementales de muestreo y estimación de proporciones. INE. Madrid. Sánehez Crespo, J. L. (1976): Muestreo de poblaciones finitas aplicado al diseño de encuestas. INE. Madrid. Sánehez Crespo, J. L. (1984): Curso intensivo de muestreo en poblaciones finitas. INE. Madrid. Sánehez Crespo, J. L. YParada, J. de (1990): Ejercicios y problemas resueltos de muestreo en poblaciones finitas. INE. Madrid. Sánehez, M. a E. y Morchio, G. (1992): "Probing 'Don't Know' answers. Effeets on survey estimates and variable relationships". Public Opinion Quarterly, 56: 454-474. Saris, W. E. (1994): "Computer-assisted interviewing", en Lewis-Beek, M. S., Research practice. Sage. Bervely Hills, California: 163-250. Sartori, G. (comp.) (1984): Social science concepts. A systematic analysis. Sage. Beverly Hills, California. Sartori, G. (1984): "Guidelines for concept analysis", en Sartori, G., Social science concepts. A systematic analysis. Sage. Beverly Hills, California: 15-85. Schaefer, D. R. Y Dillman, D. A. (1998): "Development of a standard e-mail methodology. Results of an experiment". Public Opinion Quarterly, 62: 378-397. Schaeffer, N. C. (1980): "Evaluating race of interviewer effects in a national survey". Sociological Methods and Research, 8: 400-419. Schaeffer, N. C. y Maynard, D. W. (2002): "Standardization and interaction in the survey interview", en Gubrium, J. F. Y Holstein, J. A., Handbook of interview research. Context and Methods. Sage. Thousand Oaks, California: 577-601. Schoeber, M. F. Y Conrad, F. G. (1997): "Does conversational interviewing reduce survey measurement error?". Public Opinion Quarterly, 61: 576-602. Schuman, H. y Converse, J. (1971): "The effects of black and white interviewers on black responses in 1968". Public Opinion Quarterly, 35: 44-68. Schuman,H. y Presser, S. (1977): "Question wording as an independent variable in survey analysis". Sociological Methods and Research, 6: 151-170.

Bibliografía

489

Schuman, H. YPresser, S. (1979a): "The assessment of 'no opinion' in attitude surveys", en Schuessler, K. (comp.), Sociological methodology. Jossey-Bass. San Francisco. Schumari, H. y Presser, S. (1979b): "The open and closed question". American Sociological Review, 44: 692-712. Schuman, H. y Presser, S. (1980): "Public opinion and public ignorance: the fine line between attitudes and nonattitudes". American Journal of Sociology, 85: 1214-1225. Schuman, H. y Presser'J S. (1981): Questions and answers in attitude surveys. Experiments on queslíon form, wording and contexto Aeademic Press. Nueva York. Schuman, H. y Presser, S. (1996): Questions and answers in attitude surveys. Experiments on question form, wording and contexto Sage. Thousand Oaks, California. Schuman, H.; Presser, S. y Ludwig, J. (1981): "Context effects 00 survey responses to questions about abortion". Public OpinionQuarterly, 45: 216-223. Schuman, H. y Scott, J. (1989): "Response effects over time: two experiments". Sociological Methods and Research, 17: 398-408. Schuman, S. y Jordan, B. (1990): "Interactional troubles in face to face survey interviews". Journal ofthe American Statistical Associalíon, 85: 232-241. Schwarz, N. (1997): "Questionnaire design: the rocky road from concepts to answers", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Inc. Nueva York: 29-46. Sehwarz, N.; Hippler, H.; Deuteh, B. y Strack, F. (1985): "Response order effects of category range on reported behavior and eomparative judgements". Public Opinion Quarterly, 49: 388-395. Sehwarz, N. e Hippler, H. J. (1995): "Subsequent questions may influenee answers to preceding questions in mail surveys". Public Opinion Quarterly, 59: 93-97. Sehwarz, N.; Strack, F. y May, H. (1991): "Assimilation and contrast effects in part-whole question sequences: a conversationallogic analysis". Public Opinion Quarterly, 55: 3-23. Sehwarz, N.; Straek, F.; Hippler, H. J. Y Bishop, G. (1991): "The impact oí administration mode on response effeets in survey measurement". Applied Cognitive Psychology, 5: 193-212. Scott, C. (1961): "Research on mail surveys". Journal of Royal Statistical Society, serie A, 124: 143-205. Seott, J. (1997): "Children as respondents: methods of improving data quality", en Lyberg, L.; Biemer, P.; Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey measurement and process quality. John Wiley and Sons Ine. Nueva York: 331-351. Shaw, C. y McKay, H. (1969): Juvenile delinquency and urban areas. University of Chicago Press. Chieago. Sheatsley, P. B. (1983): "Questionnaire construction", en Rossi, P. H.; Wrigth, J. D. YAnderson, A. B., Handbook ofsurvey research. Academic Press Ine., Orlando: 195-230. Shuy, R. W (2002): "In-person versus telephone interviewing", en Gubrium, J. F. Y Holstein, J. A., Handbook of interview research~ Context and Methods. Sage. Thousand Oaks, Calofornia: 537-555. Sieber, S. D. (1973): "Integrating fieldwork and survey methods". American Journal of Sociology, 78: 1335-1359. Siegel, S. (1985): Estadística no paramétrica. Trillas. México. Sigelman (1981): "Question arder effects on presidential-popularity". Public Opinion Quarterly, 45: 199-207. Simon, J. (1978): Basic research methods in social sciences. Random House. Nueva York.


490

Métodos de encuesta

Singer, E. (1978) "Informed consent: consequences for response rate and response quality in social surveys". American Sociological Review, 43: 144-162. Singer, E. (2002): "Informed consent and survey response: a summary of the empiricalliterature", en De Vaus, D., Social surveys. Sage. Londres: 280-295 (e. o. 1993: Journal of Official Statistics, 9 (2): 361-375). Singer, E.; Gebler, N.; Raughunathan, T.; Van Hoewyk, J. y McGonagle, K. (1999): "The effects of incentives in interviewer-mediated surveys". Journal of Official Statistics, 15: 217-230. Singer, E.; Groves, R. M. Y Corning, A. D .. (1999): "Differential incentives. Beliefs about practices, perceptions of equity and effects on survey participation". Public Opinion Quarterly, 63: 251-260. Singer, E.; Hippler, H. y Schwarz, N. (1992): "Confidentiality assurances on surveys: reassurances on threat". International Journal of Public Research, 4: 256-268. Singer, E. y Kahnke-Aguirre, L. (1979): "Interviewer expectation effects: a replication and extension". Public Opinion Quarterly, 43: 245-260. Singer, E.; Van Hoewyk, J. y Maher, M. P. (1998): "Does the payment of incentives create expectation effects?". Public Opinion Quarterly, 62: 152-164. Singer, E.; Van Hoewyk, J. y Maher, M. P. (2000): "Experiments with incentives in telephone surveys".Public Opinion Quarterly, 64: 171-188. Singer, E.; Von Thurn, D.R. y Mil1er, E. R. (1995): "Confidentiality assurances and response: a quantitative review of the experimental literature". PublicOpinion Quarterly, 59: 66-77. Singh, R. y Singh Mangat, N. (1990): Elements ofsurvey sampling. Kluwer Academic Publishers. Dordrecht, Holanda. Singh, S. (2003): Advanced sampling theory with applications. How Michael selected Amy. Kluwer Academic Publishers. Dordrecht, Holanda. Singleton, R. A. Jr. y Straits, B. C. (2002): "Survey interviewing", en Gubrium, J. F. Y Holstein, J. A., Handbook ofinterview research. Context and Methods. Sage. Thousand Oaks, California: 59-82. Skinner, C. J.; Holt, D. y Smith, T. M. F. (comps.) (1989): Analysis of complex surveys. John Wiley and Sonso Chichester (Reino Unido). Srnith, T. W. (1990): "Phone horne? An analysis of household telephone owIlership". International Journal of Public Opinion Research, 2: 369-390. Srnith, T. W. (2002): "The hidden 25 percent: an analysis of nonresponse on the 1980 General Social Survey", en De Vaus, D., Social surveys. Sage. Londres: 108-125 (e. o. 1983: Public Opinion Quarterly, 47: 386-404). Srnith, T. W. (2002): "The irnpact of the presence of others on a respondent's answers to questions", en De Vaus, D., Social surveys. Sage. Londres: 155-169 (e. 0.1997: International Journal of Public Opinion Research, 9 (1): 33-47). Smith, T. W. y Stephenson, C. B. (1979): "An analysis of test-retest experirnents in the 1972, 1973,1974 and 1978 General Social Surveys". General Social Survey Technical Report, 14. NORC. Chicago. Spector, P. E. (1992): Summated rating scale construction. Sage. Newbury Park, California. Stevens, S. S. (1951): "Mathematics, rneasurement and psychophysics", en Stevens, S. S., Handbook of experimental psychology. John Wiley and Sonso Nueva York: 1-49. Stinchcombe, A. L.; Jones, C. y Sheatsley, P. (1981): "Nonresponse bias for attitude questions". Public Opinion Quarterly, 45: 359-375.

Bibliografía

491

Stokes, L. Y Yeh,M. Y. (1988): "Searching for causes of interviewer effects in telephone surveys", en G~oves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 357-373. Strack, F. y Martín, L. L. (1987): "Thinking, judging and communicating: a process account of context effects in attitude surveys", en Hippler, H.; Schwarz, N. y Sudrnan, S., Social information processing and survey methodology. Springer-Verlag. Nueva York: 123-148. Strauss, A. L. (1987): Qualitativeanalysis for social scientists. Cambridge University Press. Cambridge. Suchman, E. A. (1962): "An analysis of 'bias' in survey research".Public Opinion Quarterly, 26: 102-111. Suchman, S. y Jordan, B. (1990): "Interactional troubles in face to face survey interviews". Journal ofthe American Statistical Association, 85: 232-241. Suchman, S. y Jordan, B. (1991): "Validity and the collaborative construction of meaning in face-to-face surveys", en Tanur, J. M., Questions about questions: inquiries into the cognitive bases of surveys. Russell Sage Foundation. Nueva York: 241-267. Sudman, S. (1976): Applied sampling. Academic Press. Nueva York. Sudman, S. (1983): "Applied sampling", en Rossi, P. H.; Wrigth, J. D. YAnderson, A.B., Handbook of survey research. Acadernic Press Inc. Orlando: 145-194. Sudman, S. (2002): "Probability sampling with quotas", en De Vaus, D., Social surveys. Sage. Londres: 58-83 (e. O. 1966: Journal 01 the American Statistical Association, 61: 749-771). Sudman S. y Bradbum, N. M. (1974): Response effects on surveys: a review and synthesis.Aldine. Chicago. Sudman, S. y Bradbum, N. M. (1982/1987): Asking questions: a practical guide lo questionnaire designo Jossey-Bass. San Francisco. Sudrnan, S.; Bradburn, N. M. YSchwarz, N. (1996): Thinking about answers: the applications of cognitive processes to survey methodology. Jossey-Bass. San Francisco. Sudman, S. y Jordan, B. (1990): "Interactional troubles in face to face survey interviews". Journal ofthe American Statistical Association, 85: 232-241. Sykes, W. y Collins, M. (1988): "Effects ofmode ofinterview: experiments in the U. K.", en Groves, R.; Bierner, P.; Lyberg, L.; Massey, J.; Nicholls 11, W. y Waksberg, J., Telephone surveys methodology. John Wiley and Sonso Nueva York: 301-320. Tabachnick, B. G. YFidell, L. S. (1989): Using multivariate statistics. Harper and Row. Nueva York. Tacq, J. (1997): Multivariate analysis techniques in social science research. Sage. Londres. Tashakkori, A. y Teddlie, Ch. (1998): Mixed methodology. Combining qualitative and quantitative approaches. Sage. Thousand Oaks, California. Teune, H. (1984): "Integration", en Sartori, G. (comp.): Social science concepts. A systematic analysis. Sage. Beverly Hills, California: 239-264. Thornberry, O. y Massey, J. (1988): "Trends in United States telephone coverage across time and subgroups", en Groves, R. M.; Bierner, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 25-51. Tourangeau, R. y Smith, T. W. (1996): "Asking sensitive questions: irnpact of data collection mode, question format and question context". PubLic Opinion Quarterly, 60: 275-304. Tourangeau, R. y Smith, T. W. (1998): "Collecting sensitive information with different rnodes of data collection", en Couper, M. P.; Baker, R. P.; Bethlehem, J.; Clark, C. Z. F.; Martín,


492

Métodos de encuesta

J. YNicholls 11, W. L., Computer assisted survey information collection. John Wiley and Sonso Nueva York: 431-453. Traugott, M. W. (1987): "The importance of persistence in respondent selection tor preelection surveys". Public Opinion Quarterly, 51: 48-57. Traugott, M. W.; Groves, R. M. YLepkowski, J. (1987): "Using dual frame designs to reduce nonresponse in telephone surveys". Public Opinion Quarterly, 51: 522-539. Troldahl, V. C. y Carter, R. E. Jr. (1964): "Random selection ofrespondents within households in phone surveys". Journal of Marketing Research, 1: 71-76. Trujillo Carmona, M. (2000): "Optimización del error muestral en encuestas a la población general: criterios de estratificación y cálculo del error con 'Wesvar complex samples"'. Metodología de Encuestas, 2 (2): 199-210. Trujillo Carmona, M. y Serrano del Rosal, R. (2003): "Análisis de la incidencia de las rellamadas en las encuestas telefónicas". Metodología de Encuestas, 5 (1): 31-44. Tucker, C.; Lepkowski, J. M. Y Pickarski, L. (2002): "The current efficiency of list assisted telephone sampling designs". Public Opinion Quarterly, 66: 321-338. Valles, M. S. (1997/2003): Técnicas cualitativas de investigación social. Reflexión metodológica y práctica profesional. Síntesis. Madrid. Valles, M. S. (2002): Entrevistas cualitativas. Centro de Investigaciones Sociológicas. Colección Cuaderno Metodológico. n.o 32. Madrid. Van Kammen, W. B. y Stouthamer-Loeber, M. (1998): "Practical aspects of interview data collection and data management", en Bickman, L. y Rog, D. J., Handbook 01 applied social research methods. Sage. Thousand Oaks, California: 375-398. Vidich, A. J. YShapiro, G. (1955): "A comparison of participant observation and survey data". American Sociological Review, 20: 28-33. Vigderhous, G. (1981): "Scheduling phone interviews: astudy of seasonal pattems". Public Opinion Quarterly, 45: 250-259. Voss, D. S.; Gelman, A. y King, G. (1995): "The polls a review preelection survey methodology: details from eight polling organizations 1988 and 1992". Public Opinion Quarterly, 59: 98-132. Wahlke, J. C. (1979): "Pre-behavioralism in political science". The American Political Science Review, 73: 9-31. Walker, R. (1988): "An introduction to applied qualitative research", en Walker, R., Applied qualitative research. Gower Hants. Londres. Wanke, M. (1996): "Comparative judgments as a function of the direction of comparison versus word order". Public Opinion Quarterly, 60: 400-409. Wanke, M.; Schwarz, N. y Noelle-Neumann, E. (1995): "Asking comparative questions. The impact of the direction ofcomparison". Public Opinion Quarterly, 59: 347-372. Wanke, M. y Schwatz, N. (1997): "Reducing question order effects: the operation of buffer items", en Lyberg, L.; Biemer, P.;Collins, M.; De Leeuw, E.; Dippo, C.; Schwarz, N. y Trewin, D., Survey rneasurement and process quality. John Wiley and Sons Inc. Nueva York: 115-140. Warriner, K.; Goyder, J.; Gjerrsen, H.; Hohner, P. y McSpurren, K. (1996): "Charities, no; Jotteries, no; cash, yes". Public Opinion Quarterly, 60: 542-562. Webb, N. y Wybrow, R. (1981): The Gallup reporto Sphere books limited. Londres. Weeks, M. F. (1988): "Call scheduling withCATI: current capabilities and methods", en Groves, R. M.; Biemer, P. P.; Lyberg, L. E.; Massey, J. T.; Nicholls 11, W. L. y Waksberg, J., Telephone survey methodology. John Wiley and Sonso Nueva York: 403-420.

Bibliografía

493

Weinberg, E. (1983): "Data collection: planning and management", en Rossi, P. H.; Wrigth, J. D. Y Anderson, A. B., Handbook ofsurvey research. Academic Press Inc. Orlando: 329-358. Wells, R. H. Y Picau, J. S. (1981): American Sociology: theoretical and methodological structure. University Press of America. Washington. Wert, J. 1. (1992): "Problemas de calidad en las nuevas tecnologías de recogida de información: el caso de la entrevista telefónica", en ESOMAR, 1992: Congress Book of Papers. Madrid: 575-614. Wert, J. l. (2000): "La encuesta telefónica", en García Ferrando, M.; Ibáñez, J. y Alvira Martín, F., El análisis de la realidad social. Alianza. Madrid: 203-217. Wetherell, M. (1996): "Group conflict and the social psychology of racism", en Wetherell, M., Identities groups and social issues. Sage. Londres: 175-238. Wildman, R. C. (1977): "Effects of anonymity and social settings on survey responses". Public Opinion Quarterly, 41: 74-79. Willick y Ashey (1971): "Survey question order and the political party preferences of college students and their parents". Public Opinion Quarterly, 35: 189-199. Willimack, D. K.; Schuman, H.; Pennell, B. E. Y Lepkowski, J. M. (1995): "Effects of a prepaid nonmonetary incentive on response rates and response quality in a face-to-face survey". Public Opinion Quarterly, 59: 78-92. Wotruba, T. R. (1966): "Monetary inducements and mail questionnaire response". Journal of Marketing Research, 3: 393-400. Yammarino, F. J.; Skinner, S. J. y Childers, T. L. (1991): "Understanding mail survey response behavior". Public Opinion Quarterly, 55: 613-639. Yu, J. y Cooper, H. (1983): "A quantitative review of research design effects on response rates to questionnaires". Journal of Marketing Research, 20: 36-44. Zeller, R. A. Y Carmines, E. G. (1980): Measurement in the social sciences. Cambridge University Press. Cambridge. Zdep, S. M. y Rhodes, 1. N. (1976): "Making the randomized response technique work". Public Opinion Quarterly, 40: 531-537.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.