Introducción a la investigación educativa Especialización en Dirección de Instituciones Educativa s
Universidad Austral
ESCALA LIKERT ¿Cómo medir el nivel de satisfacción laboral, la actitud de los alumnos hacia una asignatura o hacia el trabajo en equipo, las expectativas de logro, etc.? He aquí el gran problema metodológico de las ciencias sociales y humanas. ¿Cómo evaluar variables cualitativas, por ej.: las actitudes? Un enfoque vigente (a pesar de que se publicara en 1932) y muy popularizado para medir la actitud1 es la escala Likert, cuyo nombre proviene de su creador, el psicólogo estadounidense Rensis Likert. En su versión original, consta de varios enunciados declarativos (juicios) que manifiestan un determinado punto de vista u opinión sobre un objeto para que el sujeto exprese el grado en que concuerda o no, eligiendo una categoría de respuesta. Es decir, se presentan los ítemes y se le solicita que, para cada uno, elija una categoría de respuesta. Ejemplos de las alternativas o categorías en la escala Likert: Afirmación: Votar es una obligación de todo ciudadano responsable. (Marque con una cruz) Alternativa 1 (....) Muy de acuerdo (....) De acuerdo (....) Ni de acuerdo ni en desacuerdo (....) En desacuerdo (....) Muy en desacuerdo Alternativa 2 (....) Totalmente de acuerdo (....) De acuerdo (....) Neutral (o: No estoy seguro/a (....) En desacuerdo (....) Totalmente en desacuerdo Alternativa 3 (....) Definitivamente sí
(....) Probablemente sí
(....) Indeciso/a (....) Probablemente no (....) Definitivamente no
Alternativa 4 (....) Completamente valedero (....) Valedero (....) Ni valedero, ni erróneo (....) Erróneo (....) Completamente erróneo Alternativa 5 (....) Lo apruebo totalmente (....) Lo apruebo (....) Estoy en duda (....) Lo desapruebo (....) Lo desapruebo totalmente Alternativa 6 (....) Casi siempre (o: Siempre) (....) Frecuentemente (....) A veces (....) Muy de vez en cuanto (o: Raras veces) (....) Casi nunca (o: Nunca) Alternativa 7 (....) Sumamente importante (....) Importante (....) Medianamente importante (....) Poco importante (....) Intrascendente En la actualidad, la escala original se ha extendido a preguntas y observaciones. Por ejemplo: ¿Cómo considera usted la gestión de ... (el Presidente de su país)? ( ) Muy buena
( ) Buena
( ) Regular
( ) Mala
( ) Muy mala
SU CONFECCIÓN Los pasos principales que se siguen en la construcción de una escala Likert son: I. Construcción de los indicadores. Implica: 1.
Definición conceptual de la variable o actitud que se va a medir y determinación de sus dimensiones o aspectos principales.
2. Recopilación de indicadores (enunciados, preguntas, etc.), reactivos que conceptúan el objeto de la actitud que se Disposición psicológica, adquirida y organizada a través de la experiencia, que incita al sujeto a responder de una manera característica frente a determinadas personas, objetos o situaciones, y que ha de ser inferida de las expresiones verbales o de la conducta observada. 1
1
Introducción a la investigación educativa Especialización en Dirección de Instituciones Educativa s
Universidad Austral
evalúa. Cuando Rensis Likert explica cómo armaron la escala para medir actitudes interraciales en su equipo de investigación (en Summers, 1976: 183) señala que, en primer lugar, examinaron cuestionarios aplicados, con los mismos propósitos, por otros psicólogos y más de 200 periódicos y revistas (en estos, seleccionaron declaraciones de opinión, sobre todo las más dogmáticas, que encontraban con mucha frecuencia en los editoriales). Se incluyeron reactivos tomados de libros, discursos y panfletos, y otros elaborados por los investigadores mismos; en estos últimos se esforzaron por satisfacer los requisitos de sencillez, claridad y brevedad. Por otra parte, los reactivos propiciaban un “juicio de valor” y no “juicios descriptivos” (abundan enunciados del tipo “los Estados Unidos deberían”, o “deberíamos”, o “a ninguna persona se le debe permitir”), esto es, “(...) tienen que referirse a deseos, anhelos, disposiciones voluntarias de los sujetos, y no a sus opiniones con respecto a meras situaciones de hecho.” (Ibid.: 184) Para elaborar la escala, el investigador debe conocer las características socioculturales de la población a la que se aplicará para adaptar, por ejemplo, el lenguaje de modo que su destinatario no la “sienta lejana”, “ajena a su medio cultural”. Es recomendable que, en lo posible, los enunciados reproduzcan el llamado “lenguaje del campo” (las expresiones lingüísticas usuales de ese ámbito sociocultural).
RASGOS IMPORTANTES En una escala tipo Likert, se asume que los enunciados miden la actitud hacia un único concepto subyacente; si se pretende medir actitudes hacia varios objetos, deberá confeccionarse una escala por objeto; aunque se presenten conjuntamente, se califican por separado. En cada escala, se considera que todos los ítemes tienen igual peso. Luego, si alguna dimensión de la variable reviste mayor importancia que otra/s, será necesario incluir más ítemes (indicadores) para que la representen. ¿Cuántos enunciados debe contener una escala Likert? En verdad, no hay una respuesta definitiva para esta pregunta, por cuanto el número varía según la complejidad de la variable que se quiere medir (los enunciados que se eligen pretenden ser una muestra del “universo de indicadores” de esa variable). Sin embargo, es común encontrar escalas con 20 enunciados o más. El número original de ítems puede disminuir cuando se lleva a cabo el análisis de las cualidades psicométricas de la escala (por ej.: poder de discriminación de cada reactivo o capacidad de cada ítem para diferenciar bien a las personas en la actitud medida o su potencialidad para hallar diferentes grados de intensidad de la actitud bajo examen).
Los enunciados pueden tener dirección favorable o desfavorable. Dicha dirección es muy importante para saber cómo se califican las cinco categorías de respuesta. Si el enunciado es favorable al objeto, cuanto más de acuerdo esté el sujeto con el mismo, más positiva es su actitud; por ejemplo, dada la afirmación El Ministerio Nacional de Educación es necesario para asegurar la unidad educativa del país, si está “muy de acuerdo” implica una actitud más favorable hacia el Ministerio Nacional de Educación que si sólo está “de acuerdo”. En el otro extremo, si el enunciado es desfavorable, cuanto más de acuerdo esté, más negativa es su actitud. Luego, respecto de la proposición El Ministerio Nacional de Educación es un organismo que atenta contra el principio de federalización, la respuesta “muy de acuerdo” muestra una actitud más desfavorable hacia el Ministerio Nacional de Educación que si sólo está “de acuerdo”. En cambio, si elige “muy en desacuerdo” implica una actitud favorable hacia dicho Ministerio, porque está rechazando la afirmación que lo valora negativamente. Hay escalas que sólo incluyen enunciados desfavorables (ejemplo: una escala que evalúa posición antisemita) porque, por un lado, muestran con mayor claridad distintos grados en la actitud en examen (desde -para
2
Introducción a la investigación educativa Especialización en Dirección de Instituciones Educativa s
Universidad Austral
seguir con el ejemplo- actitud muy antisemita hasta rechazo de la actitud antisemita) y, por otro, pueden redactarse de tal modo que expresen la hostilidad con mayor sutileza. También hay escalas que solo incluyen enunciados positivos2. En general, cuando la actitud por evaluar lo permite, se recomienda incluir ambos tipos de enunciados (favorables y desfavorables), en un número similar o igual, para evitar que el sujeto responda en forma mecánica (por ejemplo, decir en todos y cada uno de los enunciados: de acuerdo). El modo de asegurar la validez de contenido3 de la escala es que aproximadamente la mitad de los ítemes expresen posición favorable y la otra mitad, desfavorable. En ciertos casos, para obligar a los individuos a definir su posición, se puede emplear una Likert de “elección forzada”, es decir, de cuatro categorías porque se suprime la respuesta neutral (ej.: “indeciso/a”). Hay que mezclar los ítemes de forma equilibrada a fin de que no queden todos (o muchos) favorables seguidos y muchos desfavorables juntos. Si se aplican en un solo instrumento dos o tres escalas (es decir, si se miden las actitudes hacia dos o tres objetos), también conviene mezclar los enunciados de todas para evitar la respuesta mecánica. 3. Determinación de las categorías de respuesta, esto es, elegir entre algunas de las alternativas consignadas. El número y las categorías de respuesta deben ser los mismos para todos los enunciados. Likert utilizaba cinco categorías de acuerdo/desacuerdo en su escala original; pero, a veces, se acorta o se incrementa este número en función de la capacidad de discriminación de las personas a las que se destina. Si los encuestados tienen poca capacidad de discriminar, pueden incluirse tres categorías; por el contrario, si son personas con un nivel educativo elevado y capacidad de discriminación, pueden incluirse hasta siete categorías, en tanto se añaden opciones como “relativamente de acuerdo” y “relativamente en desacuerdo”. Ej.: Me gusta Completamente De acuerdo seguir un de acuerdo código estricto de conducta.
Relativamente de acuerdo
Indeciso/a
Relativamente En desacuerdo Completamente en en desacuerdo desacuerdo
4. Elaborar las instrucciones para el sujeto; por ej.: 1) En cada enunciado, debe marcar una sola opción (se considera dato inválido si el sujeto elige más de una); 2) Opte (por ej.: con una cruz dentro del casillero) por la categoría que mejor describe su actitud. II. Administración de la escala a una muestra piloto Una vez elaborada la escala, es necesario revisarla a fin de eliminar enunciados que resulten oscuros y/o ambiguos; para ello, se puede recurrir al auxilio de “jueces independientes”, es decir de expertos que no hayan participado en el proceso de confección de la escala (este acuerdo “inter-juez” es el camino para evaluar la ya referida validez de contenido de cualquier instrumento). Para este análisis, se aplican las siguientes reglas; cada enunciado debe: Ser “debatible”: no debe reflejar un hecho; 2
Ej.: Algunos ítemes de una escala sobre estrategias de estudio -Adaptada de: Taraban, Roman y col. (2000). Metacognition and Freshman Academic Performance. Journal of Developmental Education, 24(1), 12-20. (Trad. Ad hoc)- son: Reviso rápidamente el texto antes de leerlo; Trato de relacionar los puntos importantes entre sí en un intento de comprender el texto completo; Intento “traer al texto” mi conocimiento sobre el tema a fin de ayudarme a comprender lo que estoy leyendo; Mientras leo, me formulo preguntas sobre el contenido del texto para recordarlo mejor; Trato de anticipar información futura en el texto; A fin de recordar, cuando es apropiado, trato de visualizar el contenido del texto que estoy leyendo; Cuando advierto que no comprendo, cambio mis estrategias lectoras (por ejemplo, disminuyo la velocidad, releo); Al finalizar la lectura, intento elaborar un resumen comprehensivo. “Validez de contenido” significa que la escala contiene los indicadores centrales de la variable por medir, que representa de manera adecuada el contenido real de la actitud que se evalúa. 3
3
Introducción a la investigación educativa Especialización en Dirección de Instituciones Educativa s
Universidad Austral
Ser pertinente a la variable en estudio (de allí la importancia de una buena definición conceptual de la actitud que se evalúa); Expresar una actitud definida hacia un asunto único; luego, tendrá una sola interpretación posible para los encuestados (evitar, por ejemplo, doble negaciones); Ser simple, en lo que se refiere a la construcción gramatical de la oración (evitar, en lo posible, oraciones compuestas); Ser corto (conviene que no tenga más de 20 palabras); Dar la posibilidad de respuesta en toda la gama de intensidad de la actitud que se evalúa; luego, No incluir enunciados neutrales o aquellos cuyo carácter extremo llevaría a esperar que todos o prácticamente todos estén de acuerdo con ellos o los rechace, pues el propósito es distribuir las actitudes o características de los integrantes de la población o muestra a lo largo de un continuo (desde actitud muy positiva a actitud muy negativa). Apuntar al presente (evitar los ítemes que apuntan hacia el pasado). Como todo instrumento de investigación cuantitativa, se debe probar previamente en una muestra piloto. Para lograr una buena escala de 15 a 30 ítemes habría que partir de una batería inicial de 30 a 50 ítemes y aplicarla a 50-80 individuos. Cuando NO es posible cumplir con este requisito de validación, se puede administrar directamente a los sujetos de la investigación y sólo se pierde el trabajo de obtener respuestas para ítemes que pueden ser descartados después -cuando se establezca que tienen nulo o bajo poder de discriminación-. III. Asignación de puntajes a los ítemes Para asignar el valor numérico que alcanza el sujeto en cada enunciado, en una escala de cinco categorías (que es la versión original, como indicáramos), Likert califica los enunciados favorables de la siguiente manera: Muy de acuerdo (5 puntos); De acuerdo (4); Parcialmente de acuerdo (3); En desacuerdo (2); Muy en desacuerdo (1). Los desfavorables se califican de modo contrario: Totalmente de acuerdo (1 punto); De acuerdo (2); Parcialmente de acuerdo (3); En desacuerdo (4); Totalmente en desacuerdo (5)4. Este es el procedimiento empleado por Likert, a partir de que, en sentido estricto, esta escala es una medición de nivel ordinal en el cual no podemos saber si los intervalos entre las alternativas son constantes u homogéneos5. La puntuación final de un sujeto proviene de la suma de las puntuaciones que logra en cada enunciado. Dicha puntuación total representa la posición favorable o desfavorable hacia el fenómeno que se mide: un individuo con una actitud positiva estará de acuerdo con buena parte de los reactivos favorables al objeto y rechazará los desfavorables; de una persona ambivalente puede esperarse que responda desfavorablemente a unos y favorablemente a otros; un sujeto con una actitud negativa se mostrará de acuerdo con muchos ítemes desfavorables y se opondrá a los favorables. IV. Análisis de los resultados por ítem Para eliminar los reactivos inadecuados, es decir que no se ajustan bien a la actitud que se pretende medir:
Este es el procedimiento de Likert, pero existe otro criterio para la adjudicación de las ponderaciones que, a nuestro juicio, es más elocuente: El ítem favorable recibe un puntaje desde 4 (totalmente de acuerdo) a 0 (totalmente en desacuerdo) y uno desfavorable, desde 0 (totalmente de acuerdo) a 4 (totalmente en desacuerdo). 4
5
Esto es, si una persona obtiene una puntuación de 60 puntos en una escala Likert, no significa que su actitud hacia el fenómeno medido sea el doble que la de un individuo con 30 puntos, pero sí nos informa que el primero tiene una actitud más favorable que el segundo, de la misma forma que 40° C no son el doble de 20° C pero sí indican una temperatura más alta.
4
Introducción a la investigación educativa Especialización en Dirección de Instituciones Educativa s
Universidad Austral
En primer lugar, conviene descartar aquellos en los cuales todas las personas a las que se aplicó la escala (o un alto porcentaje de respuestas, esto es, casi todas) estuvieron muy de acuerdo (o en muy en desacuerdo). Obviamente, no tienen capacidad discriminativa. En segundo lugar, Likert propone un procedimiento sencillo y que demanda poco trabajo (llamado “método de la diferencia absoluta entre los cuartiles extremos”) para determinar el poder discriminativo de los restantes: 1º) se disponen en orden descendente las puntuaciones totales obtenidas por todas las personas a las cuales se les aplicó la escala; 2º) luego, se toma el 25% de las puntuaciones más altas (cuartil 6 superior) y el 25% de las más bajas (cuartil inferior); 3º) para cada enunciado, se calcula la diferencia entre los promedios de las puntuaciones de ambos cuartiles (Promedio del cuartil superior menos Promedio del cuartil inferior); 4º) para la escala definitiva, se seleccionan los ítemes con las diferencias absolutas (positivas o negativas) más altas. Otro método -denominado “validación mediante el análisis de los ítemes de los tercios superior e inferior” (Grant, 2002)- requiere: 1º) aplicar la escala al menos a 30 personas; 2º) disponerlas según las puntuaciones totales en orden descendente; 3º) dividir la muestra en tercios; 4º) Para cada ítem, calcular el número de sujetos en el tercio superior y en el inferior (tercios que deben ser de igual tamaño) que puntúan 4 y 5 (ó 3 y 4); 5º) Convertir el número en porcentaje; 6º) Calcular la diferencia de porcentaje; 7º) Aceptar los ítemes con una diferencia de 30% o más y rechazar los restantes. FORMAS DE APLICACIÓN Hay dos formas básicas de aplicar una escala Likert: 1º) autoadministrada (cada sujeto marca su respuesta en la escala) y 2º) en entrevista: el entrevistador lee los enunciados y las alternativas al sujeto, y anota lo que este contesta. Cuando se aplica de este segundo modo, es necesario que se le entregue al entrevistado una tarjeta donde se muestran las alternativas de respuesta o categorías. SU CALIFICACIÓN Como señaláramos, el puntaje que se le asigna a un sujeto se obtiene sumando la puntuación que logra en cada reactivo. Por ello, se denomina escala aditiva o escala de puntuación sumada; esto es, desde el punto de vista aritmético, es una escala sumatoria, ya que la puntuación de cada persona en la actitud que se evalúa se obtiene mediante la suma algebraica de sus respuestas a los diversos enunciados (o preguntas) que funcionan como disparadores. Luego, se calcula el promedio de cada sujeto en la escala, mediante la sencilla fórmula “puntuación total en la escala” dividido el “número de enunciados”, y entonces una puntuación se analiza en el continuo 1-5 ó 0-4 (la categorización elegida) de la siguiente manera: por ejemplo, quien obtuvo 40 en una escala que consta de 20 enunciados, tiene 2 (resultado de dividir 40 por 20), una actitud desfavorable hacia el objeto de que se trate. Las puntuaciones finales se pueden emplear directamente o se pueden agrupar en las categorías o nuevos índices que resultan del procedimiento anterior. Por ejemplo, en la aplicación de una Escala Likert sobre actitud hacia la metodología de la investigación en alumnos de 3º de la carrera de Ciencias de la educación, la escala con un rango entre 52 (puntaje mínimo) y 90 (puntaje máximo) queda categorizada de la siguiente manera: Positiva: Neutra:
84 a 90 puntos 52 a 69 puntos.
En su representación gráfica:
El conjunto total de las puntuaciones obtenidas ordenadas en forma decreciente se puede dividir en cuatro partes de igual tamaño. Se llama “cuartil” a cada una de estas partes, esto es, un cuartil representa el 25% de la muestra (o de la población si elegimos trabajar con la totalidad de individuos y no con una porción de ella); se denominan primer cuartil -o cuartil superior-, segundo cuartil, tercer cuartil y cuarto cuartil -o cuartil inferior-. 6
5
Introducción a la investigación educativa Especialización en Dirección de Instituciones Educativa s
Universidad Austral Positiva
33,3%
Neutra
66,7%
Ventajas de una escala Likert: Es de fácil construcción y aplicación.
Desventajas de unasino escala Likert: Puede incluir ítemes no relacionados de modo manifiesto con el tema, de forma latente, por lo cual se puede disimular Se hasta cierto grado la intención última de la escala, porque el peligro de los lo instrumentos puede obtener un mismo puntaje final con diferentes combinaciones detodos ítemes, que muestra que la misma denominados directos es que el sujeto falsee su actitud para asumir -lo que considera- la “imagen pública puntuación puede tener significados distintos. apropiada” o lo que cree que el encuestador “espera” de él. De todos modos, el problema está en determinar cuándo tiene consecuencias para el significado de una misma Las puntuaciones de una escala Likert proporcionan la base para una primera ordenación de la población en la puntuación el hecho de haberse alcanzado por distintos medios y cuándo no las tiene. característica o actitud que se mide. Texto preparado por la Prof. Difabio de Anglat sobre la base de: Briones, Guillermo (1990). Métodos y técnicas de investigación para las Ciencias sociales (137-150). México: Trillas. Hernández Sampieri, Roberto, Fernández Collado, Carlos y Baptista Lucio, Pilar (1998). Metodología de la investigación (2ª ed.) (256266). México: Mc Graw-Hill. Grant, Janet (2002). Undertaking research in medical education. Open University: Danish Association of Medical Education. Likert, Rensis (1976). Una técnica para medir actitudes. En: G. Summers (Comp.). Medición de actitudes (182-193). México: Trillas. (Trad. del original estadounidense de 1970). Padua, Jorge y col. (1982). Técnicas de investigación aplicadas a las ciencias sociales. México: Fondo de Cultura Económica. Polit, Dense y Hungler, Bernadette (1999). Investigación científica en Ciencias de la salud (5ª ed.). México: McGraw-Hill. (Trad. de la 5ª ed. Estadounidense de 1995).
6