Introducción a la Psicometría: La Medición. by LUANCASIL

REVISTA DIGITAL

La Medición *Fundamentos teóricos *Relación con Psicología *Niveles y escalas *Confiabilidad *Validez * Y más. 1

Fundamentos teóricos de la Medición Las raíces de la aplicación de pruebas, se encuentran en la antigüedad partiendo de los exámenes que se hacían en China para el servicio civil, hasta la aplicación de exámenes en Grecia para evaluar las habilidades físicas e intelectuales. De gran importancia fueron las aportaciones hechas en el siglo XIX por los médicos franceses, Esquirol y Seguin. Aporte fundamental para el establecimiento de la psicometría lo hicieron los investigadores Charles Darwin, Francis Galton, James McKeen Cattell, Krapelin, Charles Spearman, T.L. Kelly, L.L. Thurstone, E.B. Titchener y otros.

La medición de las funciones psicológicas ha sido un punto de relevante para quienes planteaban la idea de que las habilidades mentales podrían ser cuantificadas, por ejemplo, los trabajos de Alfred Binet y Francis Galton en su respectivos trabajos abordaron la medición de las diferencias individuales, la relación entre la inteligencia y herencia y la inteligencia como punto de partida para el aprendizaje (Benedet, 2002). 2

Fundamentos teóricos de la Medición

De esta manera la psicometría como tal, ha pasado a través de un tiempo a convertirse en una disciplina científica estructurada dentro del marco referencial teórico práctico (Meliá, 1990). De la misma manera que la neuropsicología, ha sido abordada en cuanto evaluación como un procedimiento ligado al análisis del proceso o función de la actividad psicológica (Luria, 1974), en su desarrollo inicial ha estado vinculado a la psicometría, debido a que en los años cuarenta del siglo XX, cuando no se disponía de otros medios como la tecnología actual en

imágenes para determinar si un paciente presentaba o no una lesión cerebral, la otra opción resultante en relación a una patología, era el uso de test psicométricos, que la denominada neuropsicología psicométrica hacía uso para la práctica clínica (Montañés y De Brigard, 2005). De acuerdo a Stevens (2001), medición y psicometría corresponde “Asignar números a objetos y eventos de acuerdo con reglas”, mientras que para Carmines y Zeller (1988), equivale a “Proceso de vincular conceptos abstractos con indicadores empíricos” . 3

Orígen histórico de la Medición en Psicología Ya desde 1895 Alfred Binet y su colega Victor Henrri publicarían varios artículos en los que abogaban por la medición de capacidades como la memoria y la comprensión social. 10 año más tarde Bidet y Simon publicarían una escala de medición de la inteligencia (Cohen, 2001). La medición psicológica se vio influenciada grandemente por los instrumentos y conceptos provenientes de la física, la química y la astronomía. Los científicos de esa época consideraban pertinente la aplicación de los métodos de la física en el estudio e investigación de la mente humana, lo que permitió el surgimiento de la psicofísica. El fisiólogo Ernest Weber utilizo estos métodos en sus

investigaciones sobre la medida de los umbrales diferenciales, un poco después y basado en estos trabajos Gustav Fechner investiga sobre las sensaciones y el juicio humano.

Origen histórico de la Medición en Psicología Adicionalmente, en la actualidad se reconoce que Edward Thorndike fue un investigador determinante en los inicios del desarrollo de los test psicológicos. En 1903 publico un libro sobre psicología educativa, más tarde en 1904 sale otro de sus libros llamado Introducción a la teoría de las mediciones mentales y sociales.

Thorndike trasladó el método de las ciencias exactas a sus investigaciones realizadas con animales, tiempo más tarde hizo lo mismo pero con personas esto le gano el merito de ser el pionero en el uso de tales métodos, él pensaba que la información obtenida al investigar problemas educativos podía cuantificarse y medirse.

La Medición en Psicología

La psicología se considera la ciencia que explora, estudia, comprende e interpreta rigurosamente los procesos mentales, las sensaciones, las percepciones y las conductas del ser humano, en términos de su interacción consigo mismo, con el contexto ambiental y con los otros. De allí, radica la importancia de la incorporación de la psicometría en el campo de dicha ciencia, debido a que permite, por un lado, al profesional adentrase con base a un enfoque teórico – técnico metodológico, la medición para la comprensión e

interpretación de las características y especificidades que presenta la persona, en lo relativo a cómo percibe, siente, actúa o busca de resolver las situaciones problemas que le afectan y, por otro lado, los resultados obtenidos en la aplicabilidad de los diversos métodos psicométricos, le proporciona las bases para la aplicabilidad de estrategias y técnicas terapéuticas, que pueden aplicarse a dicha situación, en pro del bienestar y ajuste adaptativo a quien va dirigido. 6

La Medición en Psicología En este sentido, se podría inferir entonces, en razón de los antes expuesto, que la psicología en sí misma, representa un universo científico inagotable, para la investigación del ser humano, que abarcaría desde los estudios rigurosos que se han generados en el campo de la neurociencia, las importantes investigaciones sobre la biopotencialidad, hasta la revisión, discusión y aportes trascendentales realizados a los diversos modelos teóricos ya existentes. Es decir, esta ciencia se encuentra en constante dinamismo y continúa actualización, en cuanto a sus enfoques, tendencias, procesos de medición psicológicos y los distintas modalidades psicoterapéuticas, que a través de ella se originan.

Niveles de Medición

Medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens, 1951), esta definición es adecuada para el área de ciencias naturales, en el campo de las ciencias sociales medir es “el proceso de vincular conceptos abstractos con indicadores empíricos” (Carmines y Zeller, 1979, p. 10). La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos de las escalas miden variables categóricas y las otras dos miden variables numéricas (Therese L. Baker, 1997).

Los niveles de medición se utilizan para ayudar en la clasificación de las variables, el diseño de las preguntas para medir variables, e incluso indican el tipo de análisis estadístico apropiado para el tratamiento de los datos. Una característica esencial de la medición es la dependencia que tiene de la posibilidad de variación. La validez y la confiabilidad de la medición de una variable depende de las decisiones que se tomen para incluirla en la operación y lograr una adecuada comprensión del concepto evitando imprecisiones y ambigüedad, por en caso contrario, la variable corre el riesgo inherente de ser invalidada debido a que no produce información confiable.

Escalas de Medición Medir es utilizar los procedimientos matemáticos para asignar números e identificar atributos físicos y psicológicos que permitan poner en claro las diferencias individuales. Una escala de medida permite al investigador determinar el tipo de análisis estadísticos que deberá utilizar para examinar una prueba y así poder considera a la prueba como buena. Son cuatro las escalas utilizadas para medir variables físicas y psicológicas. Si se utilizan números para describir o nombrar algo la escala debe ser nominal. En una escala ordinal los números se refieren a la clasificación ordenada de objetos o eventos en función del rasgo que se mide. En las escalas de intervalo la

distancia entre intervalos tendrá que establecer valores iguales. Este tipo de escalas son las más usadas para medir variables psicológicas y comparar diferencias interindividuales o intraindividuales. Las escalas de razón son las que poseen un cero real que significa ausencia total de lo que se quiere medir (Coolican,1997).

Nominal Escalas De Medición

Ordinal Intervalo Razón

Escala de Medición Nominal En este nivel de medición se establecen categorías distintivas que no implican un orden especifico. Por ejemplo, si la unidad de análisis es un grupo de personas, para clasificarlas se puede establecer la categoría sexo con dos niveles, masculino (M) y femenino (F), los respondientes solo tienen que señalar su género, no se requiere de un orden real.Así, si se asignan números a estos niveles solo sirven para identificación y puede ser indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la medición: 1=F y 2=M. En resumen en la escala nominal se asignan números a eventos con el propósito de identificarlos. No existe ningún referente cuantitativo. Sirve para nombrar las unidades de análisis en una investigación y es utilizada en cárceles, escuelas, deportes, etc. La relación lógica que se expresa es: A B (A es diferente de B).

Escala de Medición Ordinal Se establecen categorías con dos o mas niveles que implican un orden inherente entre si. La escala de medición ordinal es cuantitativa porque permite ordenar a los eventos en función de la mayor o menor posesión de un atributo o característica. Por ejemplo, en las instituciones escolares de nivel básico suelen formar por estatura a los estudiantes, se desarrolla un orden cuantitativo pero no suministra medidas de los sujetos. La relación lógica que expresa esta escala es A B (A es mayor que B). Clasificar a un grupo de personas por la clase social a la que pertenecen implica un orden prescrito que va de lo mas alto a lo mas bajo. Estas escalas admiten la asignación de números en función de un orden prescrito.

economía mexicana debe dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las siguientes alternativas:

Las formas mas comunes de variables ordinales son ítems (reactivos) actitudinales estableciendo una serie de niveles que expresan una actitud de acuerdo o desacuerdo con respecto a algún referente. Por ejemplo, ante el ítem: La

Las escalas de actitudes son ordinales pero son tratadas como variables continuas (Therese L. Baker, 1997).

Escala de Medición de Intérvalo La medición de intervalo posee las características de la medición nominal y ordinal. Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables continuas pero carece de un punto cero absoluto. El ejemplo mas representativo de este tipo de medición es un termómetro, cuando registra cero grados centígrados de temperatura indica el nivel de congelación del agua y cuando registra 100 grados centígrados indica el nivel de ebullición, el punto cero es arbitrario no real, lo que significa que en este punto no hay ausencia de temperatura. Una persona que en un examen de matemáticas que obtiene una puntuación de cero no significa que carezca de conocimientos, el punto cero es arbitrario por que sigue existiendo la característica medida.

Escala de Medición de Razón Una escala de medición de razón incluye las características de los tres anteriores niveles de medición anteriores (nominal, ordinal e intervalo). Determina la distancia exacta entre los intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe la característica o atributo que se mide. Las variables de ingreso, edad, número de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de razón se aplica tanto a variables continuas como discretas.

Métodos de elaboración de escalas

Cohen (2001) define “elaboración de escalas como el proceso de establecimiento de reglas para la asignación numérica en la medición. Es el proceso por el que se diseña y calibra un dispositivo de medición, y la forma en que se asignan números (u otros índices), valores de escala a diferentes cantidades del rasgo, atributo o característica que se este midiendo” (Cohen, 2001, pág. 288) Por lo regular existen diferentes métodos de medición escalar, los cuales pueden estar abocados a medir personas, estímulos y tipos de respuesta.

La medición escalar de estímulos se puede realizar con base a estimaciones subjetivas, ya que se requiere la tarea evaluativo del sujeto. Los modelos discriminativos son otra opción, estos modelos ponen énfasis en la variabilidad de la respuesta a cada estímulo. En la medición escalar de sujetos, los estímulos se constituyen en reactivos los cuales se le presentan al sujeto para que proporcione un tipo de respuesta. Son 3 los métodos para medir tipos de respuesta, los más importantes son: juicios y sentimientos, respuestas comparativas y absolutas, escala de respuesta. 14

El estudio de la conducta desde el punto de vista psicométrico Las pruebas psicometrías fueron un apoyo importante para la psicología experimental. La segunda guerra mundial trajo consigo al campo de la psicología un gran interés por el estudio de las diferencias individuales. Fechner, Wundt y Ebbinghaus demostraron, que fenómenos psicológicos eran susceptibles de medirse cuantitativamente (Airen, 1996).

En otras palabras, La importancia de la medición psicológica radica en su afán por establecer científicamente la diferencia entre los rasgos y estados psicológicos entre individuos para ello se utilizan diferentes escalas que apoyan la medición objetiva de los atributos conductuales. Existen diversas teorías que tratan sobre la razón por la cual las personas se comportan como lo hacen. Algunos teóricos centran el énfasis en la herencia y el ambiente como modeladores del comportamiento humano. Las teorías de los tipos, de los rasgos, psicoanalíticas, fenomenológicas, son útiles como guía hacia la medición y comprensión de la 15 personalidad.

Confiabilidad

Una prueba se considera buena cuando posee confiabilidad, y ĂŠsta se refiere a la consistencia de las puntuaciones obtenidas por las mismas personas cuando se les aplica de nuevo la misma prueba o su equivalente. Una prueba carece de confiabilidad cuando en aplicaciones diferidas hechas al mismo sujeto se obtienen medidas con una variaciĂłn significativa.

En otras palabras, la confiabilidad es una propiedad psicomĂŠtrica qu e hace referencia a la ausencia de errores de medida, o lo que es lo mismo, al grado de consistencia y estabilidad de las puntuaciones obtenidas a lo largo de sucesivos procesos de mediciĂłn con un mismo instrumento.

Tipos de métodos de cálculo de la confiablilidad El coeficiente de confiabilidad se deberá establecer a para cada prueba y para cada situación por lo tanto no es absoluto. Si las circunstancias y la población, cambian habrá que encontrar otro coeficiente de confiabilidad.

Procedimiento test-retest

Formas paralelas

Dos mitades

Tipos de métodos de cálculo de la confiablilidad

Procedimiento test-retest

Consiste en aplicar un test al menos en 2 situaciones diferentes, estas aplicaciones pueden hacerse simultáneamente o sea sin intervalo o hacer la próxima medición con un largo periodo de por medio, o sea con intervalo. Con base en esto y en función de si las puntuaciones de las personas en aplicaciones diferentes son las mismas determinaremos la consistencia interna del

test. Otro aspecto muy importante en este método es controlar la maduración y los cambios de los sujetos (las puntuaciones obtenidas por un sujeto en la primera prueba se correlacionan con sus puntuaciones obtenidas en la otra prueba) en ambas aplicaciones y correlacionar las medidas arrojadas por el test. 18

Tipos de métodos de cálculo de la confiablilidad Formas paralelas En este método también se usan dos tests, aplicados en dos momentos, obteniendo dos medidas de cada individuo, solo que en este caso, en la primera aplicación usamos un test y en la segunda otro test, que será equivalente al primero, puede hacerse con intervalo o sin el, no perder de vista que los dos habrán de medir las mismas características, pero partiendo de un modelo teórico diferente. Otro punto a considerar es que los dos test entre si deberán poseer medias y varianzas iguales 19

Tipos de métodos de cálculo de la confiablilidad Dos mitades

Este es un método útil y económico ya que se ahorra tiempo y dinero. Se aplica una sola vez y se corrige. El instrumento se divide en mitades, es importante que la división por mitades se haga de forma equivalente, una forma sería dividir en reactivos pares e impares, otra manera sería dividirlo al azar. Puntualizando lo anterior, para obtener el coeficiente de confiabilidad: *Se divide la prueba en mitades equivalentes *Se calcula una r de Pearson entre las puntuaciones en las dos mitades de la prueba. *La confiabilidad de la mitad de la prueba se ajusta usando la fórmula de Spearman-Brawn (Cohen, 2001; pág. 161). 20

Validez En primer lugar tiene que tenerse claro que se quiere medir, ya que la validez de una prueba se refiere al grado en que una ésta mide lo que se pretende medir. La validez de una prueba no es estable por lo que se tendrá que revisar con cierta periodicidad.

Es el resultado de un proceso de recopilación de evidencias empíricas sustentado en supuestos teóricos que, en suma, permiten emitir un juicio valorativo que afirme la pertinencia y la suficiencia de las interpretaciones basadas en los resultados de una prueba. Este juicio no depende únicamente de los ítems de la prueba, sino también de la muestra sobre la que se efectúe el test, y del contexto de aplicación.

Así, para Messick (1984, pp. 741), «la validez unificada integra consideraciones de contenido, criterio y consecuencias en un marco de referencia de constructo para la evaluación empírica de hipótesis racionales acerca del significado de las puntuaciones y de relaciones relevantes desde el punto de vista teórico, incluyendo las de naturaleza científica y aplicada».

MĂŠtodos de cĂĄlculo de la Validez

Validez de contenido

Validez de criterio

Validez de constructo

Validez convergente / discriminante

Métodos de cálculo de la Validez

Validez de contenido

Se dice que una prueba o test cumple con las condiciones de validez de contenido si constituye una muestra adecuada y representativa de los contenidos y alcance del constructo o dimensión a evaluar. En los casos en los que la materia objeto de medición se puede precisar con facilidad, la población de contenidos que se pretende evaluar está bien definida, por lo que la selección de los ítems del test no ofrece mayores dificultades, pudiéndose recurrir a métodos estadísticos de muestreo aleatorio para obtener una muestra

representativa de ítems. Un caso particular de la validez de contenido es la denominada «validez aparente». Una prueba posee una validez aparente adecuada cuando produce en los sujetos a los que se aplica la impresión de que efectivamente es una prueba adecuada. Es un tipo peculiar de validez de contenido, pero que tiene su parte de importancia al poder influir sobre la motivación de los participantes, que pueden mostrar una actitud negativa ante la prueba si no perciben que ésta tenga el sentido que se le supone. 23

Métodos de cálculo de la Validez

Validez de criterio

También conocida como «validez criterial», «validez relativa al criterio» o «validez de pronóstico», se refiere al grado de eficacia con que se puede predecir o pronosticar una variable de interés (criterio) a partir de las puntuaciones en un test. Existen distintos diseños experimentales que permiten determinar esta correlación. La elección de un diseño u otro dependerá de las necesidades y circunstancias específicas de cada caso:

•Validez concurrente o simultánea: El test y el criterio se miden al mismo tiempo (concurrentemente). Puede utilizarse para validar un nuevo test por comparación con otro ya validado previamente. •Validez de pronóstico o predictiva: El criterio se mide pasado un periodo de tiempo tras la aplicación del test. Es el tipo más habitual en los procesos de selección de personal, en los que se pretende predecir el rendimiento futuro de los sujetos. •Validez retrospectiva: El test se aplica un tiempo después del criterio que se pretende evaluar. Útil cuando se pretende dilucidar mediante una prueba algún aspecto del pasado que actualmente no es accesible. 24

Métodos de cálculo de la Validez Validez de constructo La validez de constructo, pues, hace referencia a la recogida de evidencias empíricas que garanticen la existencia de un constructo psicológico en las condiciones exigibles a cualquier otro modelo o teoría científica. Por todo ello, la validez de constructo se presenta como una condición indispensable a la hora de valorar la eficacia de un instrumento de evaluación sobre una variable psicológica determinada. Para Messick (1980; p.1015) «la validez de constructo es el concepto unificador que integra las consideraciones de validez de contenido y de criterio en un marco común para probar hipótesis acerca de relaciones teóricamente relevantes».

Asimismo, Cronbach (1984; p.126) refiere que «la meta final de la validación es la explicación y comprensión, y por tanto, esto nos lleva a considerar que toda validación es validación de constructo». Los procedimientos metodológicos más utilizados para la obtención de datos referentes a la validez de constructos psicológicos han sido el análisis factorial y la matriz multirrasgomultimétodo. Ambos sistemas son indicadores respectivos de las denominadas "validez factorial" y "validez convergente-discriminante“. 25

Métodos de cálculo de la Validez El análisis factorial es una técnica del análisis multivariado que permite realizar una estimación de los factores que dan cuenta de una serie de variables. Se trata de una técnica de reducción de datos que permite encontrar grupos homogéneos de variables a partir de un grupo de variables mucho más numeroso. Los criterios de formación de grupos se basan en la necesidad de que las variables a agrupar correlacionen entre sí, y cumplan el requisito de ser independiente

Es decir, formarán un grupo aquellas variables que, siendo independientes entre sí, muestren un índice de correlación elevado. Así, podremos hablar de validez factorial de un constructo en aquellos casos en los que todas las medidas que se hayan diseñado para evaluarlo arrojen resultados similares al ser sometidas a un análisis factorial.

Métodos de cálculo de la Validez

Validez convergente / discriminante

Este tipo de validez se determina a partir de los resultados arrojados por la matriz multirrasgo-multimétodo (diseño MRMM, sistematizado por Campbell y Fiske en 1959). El sistema consiste en realizar mediciones de varios rasgos con distintos métodos de medición. De este modo podemos encontrarnos con varios resultados. •Validez convergente: existe validez convergente cuando las mediciones del mismo rasgo realizadas con distintos métodos correlacionan entre sí. El hecho de que un mismo rasgo sea detectado por igual con varias metodologías diferentes, es un indicador fiable de la existencia real de ese rasgo. Se dice que en este caso, las medidas convergen.

•Validez discriminante: se refiere al grado de diferenciación entre distintos constructos a partir de un único sistema de medición. Es decir, las medidas de distintos rasgos por el mismo método muestran una baja correlación en comparación con la que muestran las medidas del mismo rasgo con diferentes métodos, señal de que los rasgos son independientes entre sí, e independientes al sistema de medición empleado. 27

Diferencia entre Métodos de cálculo de la Validez y de la confiabilidad Todo instrumento de recolección de datos debe cumplir con tres condiciones, la validez, la confiabilidad y la objetividad, de esa forma es la única manera que pueda considerarse su utilidad, legitimidad y aceptación, tanto del instrumento como de la investigación. Éstas condiciones simplemente deben probarse. Ahora bien, respecto a los métodos de cálculo de la validez y la confiabilidad, son en sí muy diferentes. La confiabilidad de un instrumento se refiere al grado en que su aplicación repetida al mismo sujeto u objeto, bajo las mismas condiciones, produce

resultados iguales, mientras que la validez, se refiere, al grado en que un instrumento realmente recolecte o mida el dato que pretende medir.

Validez y Confiabilidad

REVISTA DIGITAL

Edición y producción Luisa Camejo Expediente: HPS-142-00178V Carlos Sequera Expediente: HPS-152-00954V Elianny Yari Expediente: HPS- 152-00550V Asignación especial de: Profesor: MSc Albin Fumero Introducción a la Psicometría. Universidad Yacambú.