Los instrumentos de medición by VictorUnam

LOS INSTRUMENTOS DE MEDICIÓN •

Test Mental: El término fue creado por el psicólogo McK-Catell, quien lo usó para designar una serie de pruebas psicológicas utilizadas en el examen de las diferencias individuales de estudiantes universitarios. Con estas pruebas se medían funciones sensorio-motoras elementales.

DIFERENCIAS ENTRE PRUEBAS Y MEDICIÓN 1. Medición: Proceso de asignar valores numéricos a la ejecución de una persona, de acuerdo a reglas específicas. 2. Prueba: Instrumento de medición. Método para la observación sistemática de la conducta de una persona. Implicaciones: a. Determinar si la prueba contiene una muestra adecuada de reactivos del universo de reactivos posibles. b. Puesto que los procedimientos de las pruebas comparan la ejecución de una persona con otras, las escalas de las mediciones psicológicas no son absolutas, sino relativas, al ocuparse principalmente de las diferencias entre las personas. c. La medición de la conducta de las personas es lo que interesa a las pruebas por lo que es importante medir en realidad el atributo o características que deseamos.

DIFERENCIAS ENTRE MEDICIÓN Y EVALUACIÓN • •

Medición: Responde a la pregunta “¿Qué tanto? (cantidad) Evaluación: Responde a la pregunta “¿Qué tan bueno?” (cantidad)

Aunque la medición de características psicológicas no es tan simple como la de las características físicas, se siguen los mismos pasos. Sin embargo, es necesario controlar más las variables en las mediciones psicológicas, para obtener datos significativos.

TIPOS DE ESCALAS • • •

•

Nominales: Medición consiste en asignar las personas a categorías cualitativamente distintas. Ordinales: Clasifican a las personas en alguna dimensión. Aquí tenemos clasificación y magnitud, pero no tenemos ningún conocimiento sobre el tamaño de las unidades de la escala de medición. De Intervalos: Aquí, una diferencia de cierta magnitud significa lo mismo en todos los puntos de la escala. Las unidades de calificación son equivalentes en todos los puntos de la escala. Implica clasificación, magnitud y unidades de tamaños iguales. Operación crucial en el desarrollo de una escala de intervalos: Establecer el que las unidades sean de tamaños iguales. De Proporciones: Además de intervalos iguales, aquí se tiene también un punto cero significativo

RAZONES DEL INTERES DE LA PSICOLOGÍA POR LAS ESCALAS DE INTERVALOS 1. En estas, las calificaciones pueden transformarse en cualquier tipo de calificación lineal. Se puede sumar o restar una constante o multiplicar o dividir las calificaciones por una constante sin destruir las relaciones existentes entre los resultados. Consecuentemente, las calificaciones de una escala se pueden convertir a las de otra que utilice unidades diferentes. Las calificaciones en distintas pruebas se pueden transformar a una escala común, lo cual nos permite comparar directamente la ejecución en diferentes mediciones. 2. Las estadísticas que más se utilizan presuponen una Escala de Intervalos de medición. Hay que cuidar mucho la buena utilización de procedimientos utilizados para construir pruebas psicológicas, para asegurar que éstas alcancen sus finalidades y metas deseadas mediante la aplicación de los principios de medición. Puede establecerse una secuencia general, a pesar de que el procesos exacto varia según la prueba.

PASOS DE CONSTRUCCIÓN DE LAS PRUEBAS PSICOLÓGICAS

• • • •

Especificación de su finalidad Construcción y Comprobación de reactivos. Ensamble de la forma final de la prueba Análisis y estandarización de las calificaciones de la prueba psicológica

PROCESO DE DESARRROLLO DE PRUEBAS PSICOLÓGICAS

• • • • • •

Es una ciencia y un arte Utiliza tanto el razonamiento estadístico, como lógico Equilibra las consideraciones prácticas con las teóricas Meta: Desarrollar un instrumento técnicamente apropiado, dentro de las limitaciones prácticas. Una prueba es solamente uno de entre varios métodos posibles de obtención de la información deseada. Hay pruebas disponibles en la mayoría de los campos de la actividad psicológica, lo que nos posibilita utilizar frecuentemente una prueba ya existente, en lugar de tener que construir una nueva, con lo que ahorramos esfuerzos y tiempo.

FUNCIONES DE LAS PRUEBAS PREDICTIVAS 1. Como representación: Cuando sus reactivos son similares a las conductas que nos interesa medir. La muestra de reactivos incluida en las pruebas representa el “Dominio” o “Universo de reactivos disponibles”. Goodenough clasifica a las pruebas, de acuerdo a la claridad con las que se puede definir el universo de muestreo, en: a. Muestras: Cuando los reactivos se obtiene de un universo claramente definido. Se considera que describen el universo. b. Signos: Cuando el universo es abierto y no está claramente definido. Se considera que explican el universo. 2. Como Predicción: Sus calificaciones nos permiten predecir el modo en que se desempeña una persona en una situación cualitativamente diferente. El interés se enfoca en lo que se predice y no en el predictor. El elemento esencial en una prueba de este tipo, es que sus calificaciones se relacionan con el comportamiento de interés (el criterio). Pueden incluirse reactivos que parezcan no tener relación lógica alguna con la conducta que se esté tomando en consideración.

CONTENIDO DE LAS PRUEBAS

•

Pruebas Representativas: En las pruebas de rendimiento, primero se bosqueja el contenido y las habilidades que cubre la prueba. Para medir algún rasgo o alguna característica psicológica dada, deberá definirse lo más explícitamente posible, el rasgo que se medirá. Tiene que indicarse las conductas a través de las cuales se manifestará el rasgo, describiendo las conductas observables, las habilidades o las aptitudes que sean indicadores del rasgo que se medirá. Pruebas de Predicción: Primero se efectúa un análisis sistemático de la ejecución que se trata de predecir, haciendo un análisis de “puestos”. Los resultados del análisis deben indicar una medida apropiada de criterio, e identificar los rasgos y las conductas que se necesitan para que la ejecución sea satisfactoria. Criterio es una medida de éxito, es la conducta que debe predecir la prueba. Aquello que constituye una ejecución apropiada, debe definirse, específicamente un índice de éxito. Una medida adecuada de criterio debe medir el rendimiento apropiado, y estar libre de desviaciones tendenciosas.

DIFERENCIA ENTRE PRUEBAS PREDICTORAS Y PRUEBAS REPRESENATTIVAS. Dicotomía poco clara, porque la misma prueba puede ser de muestra y de predicción. Sin embargo, esta diferencia se refiere a si a los reactivos de la prueba y la conducta relevante, no contenida en ella, son similares o diferentes. •

•

Prueba Representativa: Cuando la prueba y la conducta no contenida en ella son esencialmente similares. Los reactivos se seleccionan sistemáticamente de un universo definido. La evaluación consiste en determinar lo adecuado del muestreo. Prueba de Predicción: Cuando la prueba y la conducta no contenida en ella son esencialmente diferente. Aquí, la etapa crucial es la de establecer empíricamente, que existe una relación entre el reactivo y la conducta que se intenta predecir.

El concepto de muestreo generalmente se considera más apropiado para las pruebas de rendimiento. Debe especificarse claramente el contenido y las habilidades que se deben medir. Pero al medir construcciones utilizadas en las teorías psicológicas, el universo muchas veces se define de modo incompleto. Cuando es así, es más apropiado considerarlas como pruebas de signos.

FINALIDAD DE LA PRUEBA Hay que tomar dos decisiones importantes cuando se construye una prueba • •

Determinar el contenido de la prueba. Determinar su formato.

Una prueba debe determinar las conductas, los conocimientos o las habilidades que cubrirá, así como la manera en que se presentarán los reactivos. Esto implica preguntarse: 1. ¿Para qué fines sirve la prueba? Generalmente, la prueba se desarrolla para alguna combinación de usos y finalidades, más que para un solo propósito, el cual conviene que declare sus fines de forma explícita y completa. 2. ¿Qué grupos de sujetos serán sometidos al examen? – Considerar la composición y las características del grupo al que se destina la prueba. 8edad, nivel intelectual, educación orígenes socioeconómicos y culturales y nivel de lectura). Las variables que serán pertinentes en circunstancias específicas dependerán del tipo y las finalidades de la prueba.

PLAN DE UNA PRUEBA PSICOLÓGICA Es el vehículo utilizado para especificar la amplitud de una prueba, una tabla que muestra los tópicos que se cubren y las habilidades que se medirán en la prueba, junto con la importancia relativa que se atribuye a cada categoría de contenido de las habilidades.

FINES: • •

En la etapa de elaboración de reactivos, indica la cantidad y el tipo de ellos que es necesario recordar. Después, se puede comparar la distribución real de los reactivos en la forma final de la prueba con las proporciones indicadas en el plan, para determinar si los reactivos sirven para efectuar un muestreo adecuado del universo de que se trate.

FORMATO DE LA PRUEBA Modo en el que se presentará los reactivos, siendo los más comunes. TIPO DE FORMATO Respuesta alternativa vs. Respuesta Libre

CARACTERISTICAS Alternativa: El examinado escoge la respuesta apropiada de entre varias alternativas (Ej. Reactivos de comparación, elección múltiple, verdadero o falso). Libre: El sujeto proporciona una respuesta (completamiento de frases, respuestas costas o preguntas de ensayo)

Pruebas de Velocidad vs. Pruebas de Poder

De Velocidad: Los reactivos son generalmente muy sencillos. Existe un tiempo límite estricto, y la calificación es un índice de la velocidad de las respuestas. De Poder: Compuesta de reactivos de dificultad variable. Tiene un límite de tiempo que permite dar respuesta a todos ellos. LA calificación refleja el nivel de dificultad de los reactivos a los que puede responder el sujeto. Ejecución Máxima: El sujeto recibe instrucciones de tratar de obtener la mejor calificación posible (pruebas de rendimiento y de aptitudes). Ejecución Típica: Interesa conocer el comportamiento habitual o normal del individuo (Pruebas de Personalidad) La distinción se refiere al modo en que se presentan los reactivos de una prueba, y como se dan las respuestas. Frecuentemente, las pruebas de ejecución implican la manipulación de algún aparato u objeto. Estructuradas: Se especifican claramente los estímulos y las tareas del sujeto. Se les llama con frecuencia “pruebas objetivas” refiriéndose a los procedimientos de calificación. Proyectivas: Los estímulos y las tareas son ambiguos.

Ejecución Máxima vs. Ejecución Típica

Papel y Lápiz vs. Ejecución

Pruebas Estructuradas vs. Proyectivas

Cualquier prueba combinará varias de esas dimensiones. Una prueba puede incluir varios tipos de reactivos, y casi siempre, cualquier reactivo puede presentarse en varios formatos, sólo que hay que elegir el mejor. Para elegir el formato debemos tomar en cuenta: • •

Las características de sujetos que tomarán la prueba Ciertos factores prácticos.

PASOS EN LA CONSTRUCCIÓN DE UNA PRUEBA PSICOLÓGICA •

Elaboración de los Reactivos: Las teorías de la personalidad, los vocablos y las frases que se utilizan para describirlas, son los que generalmente sugieren las preguntas o reactivos de los inventarios de personalidad. El Proceso de desarrollo de buenos reactivos es: a. Redacción b. Corrección c. Prueba d. Revisión

Al principio se escriben muchos más reactivos de los que se utilizarán, pero muchos de ellos se eliminarán mediante los análisis sucesivos. Después se revisan y corrigen las primeras reacciones de las preguntas lo que implica la eliminación de la redacción ambigua, el fortalecimiento de las alternativas débiles y la exclusión de reactivos duplicados e inútiles. •

Análisis y Comprobación de Reactivos: Los reactivos que sobreviven a esta selección inicial, se combinan en una o más formas de prueba previa, las cuales se aplican a una muestra de personas similares a las que se examinará con las pruebas terminadas. Es importante conocer la dificultad de los reactivos. El poder discriminativo de los reactivos es el índice más importante. Este análisis estadístico nos indica la amplitud con la que el reactivo mide lo que debe medir. Se comparan las respuestas a los reactivos individuales con las calificaciones totales, con el fin de determinar si las personas que obtuvieron calificaciones elevadas en la prueba respondieron a un reactivo en forma correcta con mayor frecuencia que las que obtuvieron calificaciones más bajas, Si esto ocurre, decimos que el reactivo “discrimina”

•

Discriminación: Efectuar distinciones entre personas que tengan conocimientos o habilidades mayores o menores en el área medida por la prueba.

•

Validación Cruzada: Cuando los análisis de reactivos se llevan a cabo con frecuencia en dos muestras independientes. Este procedimiento reduce las probabilidades de tomar decisiones basadas en procedimientos estadísticos que reflejan sólo las fluctuaciones aleatorias, en lugar de las verdaderas diferencias.

3. Ensamblaje de la Prueba: La etapa que sigue al análisis y comprobación de reactivos, es la de preparar la o las formas finales de la prueba. En el caso de que se construyan formas equivalentes de la prueba, el constructor de las mismas deberá también equiparar las formas en términos de contenido, dificultad y poder de discriminación así como también en función de otras dimensiones pertinentes. 4. Impresión de la prueba: Finalmente, después de hacer los cambios editoriales finales que se consideren oportunos, se imprime la prueba. Esto le da un estatus de existencia como entidad clara. Sin embargo, el hecho de si la prueba será buena o mediocre depende de su estandarización y de análisis técnicos posteriores.

ANÁLISIS DE LA PRUEBA En relación al análisis de la prueba que se está construyendo, un elemento muy importante a considerar es el de la Estandarización •

•

Estandarización: Proceso de desarrollo del control de los errores, de la minimización de la influencia de factores irrelevantes para los fines de la medición. Esto implica hacer que la situación de prueba sea lo más semejantes posible para todos los individuos, con el fin de obtener una estimulación tan precisa como sea posible de la ejecución de los sujetos. Estandarización una prueba: Significa que a cada sujeto deben presentársele los mismos reactivos (o equivalente), debido existir reglas específicas para la administración y la calificación de la prueba. Algunas veces se agrega el requisito de la utilización de normas de ejecución. La Estandarización se refiere a los procedimientos para obtener calificaciones, y no a los requisitos necesarios para interpretar los datos.

En general, cualquier prueba que satisfaga los criterios de contener los elementos esenciales de la Estandarización, se considera una “Prueba Estandarizada”. Estos son: • •

•

Contenido: Se considera como primer elemento esencial al conjunto de reactivos comunes que se aplican a todos los sujetos que se someten a la prueba. Aplicación: Aún aplicando los mismos reactivos a todos los sujetos, las calificaciones no serían comparables, a menos que se aplicaran estos reactivos en las mismas condiciones. Aunque la comparabilidad total no es posible, sí se puede eliminar gran parte de la variabilidad extraña, utilizando instrucciones prescritas para aplicación de las pruebas, límites de tiempo estándar y métodos objetivos de calificación. Además se requieren dos tipos de instrucciones: unas ara quien se somete a la prueba y otras para quien la aplica, las cuales debe venir en un manual separado y deben incluir tanto las indicaciones para el examinado, como indicaciones sobre otros aspectos de las condiciones de la prueba, tales como el registro de tiempo, distribución de materiales, manejo de calificaciones, etc. Calificaciones: Tercer elemento de la Estandarización. Se refiere a las calificaciones objetivas. La Objetividad implica un acuerdo entre dos o más calificadores competentes (preparados). Idealmente, el acuerdo tiene que ser perfecto, pero como esto no es posible, se sigue una regla empírica, la cual nos lleva a considerar la calificación como objetiva si el acuerdo promedio entre pares de calificadores competentes es de 90% o más. Solamente si la calificación es objetiva, se pueden atribuir las diferencias entre las calificaciones a las diferencias existentes entre los sujetos examinados.

ETAPAS PARA CONSIDERAR QUE UNA CALIFICACIÓN ES OBJETIVA: a. Registro inmediato y carente de ambigüedades de la respuesta. b. Lista de respuestas estándar o correctas: que haya una clave de calificación. Si es necesario, debe incluirse el número o la letra de la respuesta correcta a cada pregunta, una lista de respuestas correctas y las variaciones aceptables, o en el caso del ensayo, un bosquejo de los puntos que deben tocarse. Si es una prueba de personalidad, la clave designará las respuestas que indiquen la presencia o ausencia del rasgo o la característica que se mida. En el caso de que las respuestas diferentes reciban pesos diferentes, estos pesos deberán indicarse en la clave. c. Procedimientos para comparar las respuestas dadas por el sujeto con las que figuran en la clave: Procedimientos para clasificar objetivamente las respuestas. A veces, este procedimiento es directo y evidente (pruebas de elección múltiple). En el caso de ensayos, es sumamente importante el buen juicio del calificador, por lo que en estas situaciones, deben desarrollarse indicadores detalladas para la asignación de las calificaciones

** Es muy importante diferenciar al test mental del examen clínico y del escolar. El test mental es una situación experimental estandarizada, que sirve de estímulo a un comportamiento, el cual se evalúa por una comparación estadística con el de otros individuos colocados en la misma situación, lo cual permite clasificar al sujeto examinado, ya sea cuantitativamente, ya sea tipológicamente. Esto implica: 1. Que la situación experimental sea perfectamente definida y reproducida idénticamente en todos los casos 2. Que el registro del comportamiento provocado en el sujeto sea tan preciso y objetivo como sea posible. Este comportamiento es muy distinto en todos los casos. 3. Que el comportamiento así registrado sea valuado estadísticamente con respecto al de un grupo de individuos. Si una prueba no hace esta comparación, no debe considerarse mental. 4. Que la clasificación del sujeto examinado con respecto al grupo de referencia sea la meta final del test.

CARACTERÍSTICAS ESENCIALES DEL TEST • • •

Confiabilidad Sensibilidad y Fineza Discriminativa Validez

Características Confiabilidad

Sensibilidad o Fineza Discriminativa

Validez

Definición Cualidad que hace que una misma prueba, aplicada 2 veces seguidas al mismo sujeto, proporcione idénticos resultados. Depende de muchísimos factores. Los test de personalidad son generalmente menos fieles que los de inteligencia y aptitud. La confiabilidad se mide por varios procesos: d. Constancia Test-retest: Se aplica el mismo test a los mismos sujetos después de un intervalo de tiempo. A correlación entre estas 2 series de medidas se llama Coeficiente de Confiabilidad. Este depende del test y de la estabilidad del rasgo psicológico en los sujetos. e. Homogeneidad (Split-Half): Se divide el test en 2 partes equivalentes, y calcula la correlación entre los resultados obtenidos en las 2 mitades por los mismo sujetos. Muchas veces, se compara el resultado obtenido en las preguntas pares con las preguntas impares (Método Ar-Impar, u Odd-Even) f. Equivalencia: Se construyen 2 test paralelos que comprenden preguntas de naturaleza y dificultad análogas y se calcula la correlación entre los resultados de los mismos sujetos en ambas formas. Un test tiene mayor o menor Sensibilidad según incluya más o menos escalones para la clasificación de los sujetos y su diferenciación. La Sensibilidad es inversamente proporcional a la extensión medible, porque mientras más amplia es la gama de los comportamientos que puede medir un test, menos sensible es éste en el interior de esa gama. Cualidad por la que un test mide o que se pretende medir. La apreciación de la validez supone la existencia de criterios, los cuales pertenecen a 2 grandes grupos. g. Criterio objetivos de producto: Un índice numérico de la validez de un test es la correlación entre el resultado al test y la cantidad de palabras. h. Criterios objetivos de acción: Cuando la actividad del sujeto no deja producto medible, se utiliza como criterio una medida de esa actividad. i. Criterio Subjetivo: Es el más comúnmente empleado, pero es defectuoso por 2 razones: la definición del comportamiento o rasgo de personalidad generalmente no es objetiva y además, el observador aprecia ese comportamiento o ese rasgo con un juicio subjetivo.

El mayor campo de acción de los test es la Psicología aplicada: • • • • • • • •

Psicología educacional. Psicología Industrial Psicología Patológica Psicología social Psicología Militar Psicología Criminológica Psicología Clínica Antropología, etc.

Se trata de una teoría muy importante, pero su valor está íntimamente ligado a la investigación teórica que forma su base. Las pruebas miden la naturaleza y amplitud de las diferencias individuales. MODOS DE TOMAR EN CONSIDERACIÓN A LAS PRUEBAS PSICLOGÍCAS MODOS CARACTERISTICAS Usos Teóricos vs. Muchas veces se utilizan pruebas para proporcionar datos que nos ayudan a tomar Aplicados decisiones prácticas. Esta decisión puede incluir a individuos o tal vez, algún hipótesis. Lo adecuado de la decisión depende de la prueba que se aplique, pero también de otras consideraciones, tales como: la correlación en la formulación del problema, el tomar en consideración todos los factores importantes, así como el modo en que se interpretan y utilizan los datos. Entonces, la información exacta en las pruebas es una condición necesaria, pero no suficiente, para la toma de buenas decisiones. Las pruebas también pueden ayudar a desarrollar teorías psicológicas y educativas. Una de las forma de definir las leyes y las construcciones es mediante pruebas. Usos predictivos vs. En algunas ocasiones se utiliza las pruebas para proporcionar descripciones de un Descriptivos individuo. En otras, a veces necesitamos obtener una descripción de una población dada. Generalmente, los datos puramente descriptivos tienen una utilidad limitada. Casi siempre queremos saber que resultados se pueden predecir a partir de las calificaciones obtenidas en las pruebas. Requeriremos, entonces, datos relativos al grado de exactitud con el que la prueba predice el resultado deseado. Ejecución vs. Típica

Máxima Ejecución Máxima: En estas pruebas, quien se somete a ellas trata de obtener la máxima calificación posible. La meta es medir los límites de sus capacidades. Generalmente, todas las pruebas de rendimiento aptitudes y habilidades son medidas de este tipo. Ejecución Típica: Estas pruebas intentan evaluar las reacciones y conductas habituales o usuales de una persona. Aquí no interesa saber lo que puede hacer o si sabe o no como reaccionar, interesa conocer su conducta o reacción habitual la mayoría de las pruebas de personalidad, intereses y actitudes son medidas de este tipo.

USOS DE LAS PRUEBAS QUE IMPLICAN UN TOMA DE DESICIÓN •

•

Selección: Es lo más común puesto que generalmente hay mas solicitantes de los que se pueden aceptarse, es necesario tomar una decisión sobre quienes se aceptaran y quiénes no. La prueba se usa en este caso para identificar a las personas más prometedoras. Clasificación: Hay diversos individuos y diversos modos alternativos de actuar la mente es hacer coincidir los individuos y la alternativas de manera optima, determinar el curso alternativo de acción que debe promoverse. Diagnostico: Implica la comparación de la ejecución de un individuo en varios campos, para determinar sus puntos fuertes y debilidades relativas. Generalmente, los procedimientos de diagnostico se establecen cuando una persona tiene dificultades en algún campo. Después de identificar los campos de incapacidad podrá organizarse un programa de ayuda y corrección. El diagnostico se usa para determinar el tratamiento de corrección. Prueba de Hipótesis: Se usan muy frecuentemente en las investigaciones psicológicas. Las pruebas pueden utilizarse para construir hipótesis, y esto se ve claramente en las en cuestas y el uso de las pruebas para el asesoramiento. Estas hipótesis se comprobarían mediante estudios adicionales. Evaluación: Se utiliza mucho en los exámenes en las clases, para evaluar a los alumnos, para evaluar al maestro, o al método de instrucción. Una prueba de ejecución indica diferencias entre los estudiantes, y señala los temas que entienden los alumnos, así como los campos que son difíciles de comprender para ellos. Cuando un estudiante revisa su examen, puede determinar sus puntos fuertes y sus debilidades. Esto le da oportunidad de evaluar la eficiencia de su propia preparación.

OPINIONES EXTREMAS RESPECTO A LA EFICACIA DE LAS PRUEBAS PSICOLOGICAS •

•

Muchas sobreestiman la exactitud de las pruebas, considerando que las calificaciones que se obtienen a través de ellas proporcionan indicaciones casi perfectas de las capacidades de una persona, y las características de su personalidad. Cometen el error de no sopesar una gran variedad de factores. Muchas otras creen que las pruebas psicológicas son esencialmente inútiles, sosteniendo que, en muchos casos, el depender de ellas dará como resultado en que se tomen decisiones erróneas, por lo que no deben utilizarse. También existe la opinión de que las pruebas son anti democráticas, que son una intromisión en la vida privada. Estos sujetos sostienen que ciertas características, referidas generalmente algún aspecto de la personalidad, no deberían tomarse en cuenta en consideración al adoptar decisiones relativas a los individuos. Presuponen que ciertas características de personalidad no tiene que relacionarse con éxito, y pretenden que las actitudes y la personalidad de un individuo solo le conciernen a él y no se deben tomar en consideración en la adopción de decisiones practicas