Diseño de pruebas psicológicas Cartilla interactiva e ilustrativa
Universidad del Magdalena Programa de psicología
Elaborado por
Andres Ordoñez Maira Fernández María Larios Johan Penates Rosa Fuentes Daniel Urina
Primera Edición Abril del 2017
Hecho en Colombia
Página |1
1. Importancia de la Medición psicológica y Reseña histórica. 1.1 Reseña histórica de la Psicometría. 1.2 Medición, Evaluación, valoración y psicodiagnóstico. 1.3 Importancia de la estadística en psicometría 2. Premisas y cuestiones fundamentales de la psicometría 2.1 Clasificación de las pruebas. 2.2 Uso de las pruebas. 2.3 Consideraciones éticas y legales de la psicometría 2.4 Fuentes de información sobre las pruebas. 2.5 Fundamentos teóricos para la elaboración de las pruebas. 3. Normas. 3.1 Finalidad de las normas. 3.2 Tipos de normas. 3.3 Grupos normativos. 4. Concepto de confiabilidad 4.1 Métodos para determinar la confiabilidad 4.2 Interpretación de los coeficientes de confiabilidad. 5. Concepto de Validez. 5.1 Procedimientos estadísticos para determinar la validez. 5.2 Tipos de Validez: por criterio externo (predictiva, concurrente); de contenido; de constructo. 5.3 Interpretación del coeficiente de validez. 6. Planeación de la elaboración de pruebas 6.1 Tipos de preguntas o ítems (escalas de medidas). 6.2 Elaboración de Ítems para prueba. 6.3 Calificación de ítems o reactivos. 6.4 Análisis de los reactivos.
1
[Escriba el título del documento]
2
Diseño de pruebas psicológicas, es la primera cartilla interactiva del tomo ´aprendiendo con Lili´, se da una mirada y análisis general sobre cómo crear una prueba psicológica, desde los aspectos teóricos que la conforman, hasta los criterios que aseguran su confiablidad y validez, es decir, lo que asegura que la prueba está midiendo lo que realmente deseamos. Es así, como queridos amigos psicométricos, les mostraremos lo dinámico y divertido que puede ser este proceso!; es hora de animarse y pensar sobre qué les gusta más, y que siempre han querido investigar! Nuestra amiga Lili es la que nos guiará a través de toda esta aventura, esperamos que lo disfrutes tanto como nosotros.
¡Bienvenidos amigos Psicométricos, prepárense para una de las más grandiosas experiencias que tendrán en su formación como Psicólogos! Soy Lili, su guía y aliada en este proceso.
Página |3
¿Alguna vez te has preguntado quién hizo las clasificaciones de alegre, enojado, eufórico, o que hay amigos que sus personalidades no se ajustan a lo que tú eres?; precisamente, estas particularidades son las que nos hacen únicos y con habilidades, destrezas y capacidades que nos hacen sobresalir en algunos aspectos, pero que en otros no somos tan afortunados. La Psicometría, quién se encarga de medir los diferentes eventos y fenómenos psicológicos a través de técnicas, pruebas, y tests, se ha convertido en una rama útil en distintos espacios, donde es requerida una valoración objetiva, confiable y veraz del individuo, a nivel más que todo cognitivo, comportamental y emocional. De seguro en este momento ya has pensado en hacer uso de la Psicometría en alguien a ti cercano, ya que dudas de que su comportamiento sea del todo normal…
¡La psicometría nos permite ser más objetivos en la medición de las funciones y comportamiento del ser humano!
3
[Escriba el título del documento]
4
1. Importancia de la Medición psicológica y reseña histórica de la psicometría 1.1. Reseña Histórica de la psicometría
Página |5
¿Puedes traer a memoria lo que hablábamos hace un rato? ¿Si recuerdas que todos en algún aspecto diferimos de los demás? Bueno, resulta que todas esas diferencias se clasifican en 3 conjuntos muy generales: cognoscitivas, características de tu personalidad y la manera cómo te comportas; ¿ya quisieras ser en algún momento de otra manera, cierto? Resulta que todo comenzó cuando dos de los grandes filósofos más reconocidos por sus grandes pensamientos, conjeturas y análisis sobre la realidad, empezaron a hablar sobre esas diferencias, sabiendo ya que los antiguos chinos en el año 2200 a.c (Bowman, 1989) utilizaban pruebas para clasificar a los futuros soldados civiles, buscando que estos fueran aptos y contaran con las habilidades necesarias para pertenecer a su listado. Sin embargo, llegó un tiempo en donde ser único y diferente, no era tomado en cuenta; época donde primaba que tanto capital monetario tenías, y no se apreciaba la diversidad que a nuestro alrededor está: imagina no poder expresar todo lo que sientes y piensas porque te es prohibido, cuán difícil debió ser esos tiempos; pero como todo se supera, según Aiken (2003) en el siglo XVI, se empezó a considerar que nadie era igual a nosotros y escenarios sociales propiciaron más este pensamiento, pero fue hasta el siglo XIX que se desarrolló el
5
estudio científico, teniendo como punto central las habilidades sensorio motrices y mentales, las cuales debían ser observadas de manera muy detalladas, pero como eran tan variables, pensaron en crear instrumentos precisos que proporcionaran información verídica
[Escriba el título del documento]
Entre Las pruebas aplicadas por el emperador a sus soldados estaban el tiro con arco, música, aritmética y equitación.
Personajes Influyentes 6
Página |7
Fueron algunos psicólogos experimentales los que señalaron que procesos psicológicos podían ser medidos:
Gustav Fechner
Wilhem Wundt
Hermann Ebbinghaus
Pero, además, de los anteriores señores, quiénes tuvieron una incidencia directa sobre el desarrollo de la psicometría fueron: Francis Galton, J, McKeen Cattell y Alfred Bonet; por su parte Galton se interesó en como la inteligencia se es heredada y como se pueden medir las habilidades humanas, elaborando pruebas para medirlas. Cattell era asistente de Galton, quién así fue como tuvo conocimiento de estas pruebas, y luego más tarde en la Universidad de Columbia, buscó relacionar la medición del tiempo con y el logro académico. Por su Parte Binet, construyó la primera prueba mental, dando importancia a la formación académica.
7
1.2 Medición, evaluación y psicodiagnóstico. Al momento de entrar a hablar sobre pruebas psicológicas, es importante aclarar términos que son de obvia relevancia, de manera que se delimite su campo de acción y como se utilizan en diferentes momentos. A continuación, le daremos definición a cuatro (4) de ellos que se suelen usar con regularidad:
[Escriba el título del documento]
Medición: Proceso a través del cual se le asignan valores a las unidades de análisis (bien sea objetos o personas), de modo que representa la caracterización de unos niveles de calidad. (Mendoza & Garza, 2009). Evaluación: Es el conjunto de acciones que se usan para generar un juicio, medir algo o emitir una valoración, de acuerdo a unos criterios de valor que han sido establecidos. (Cano, 2005). Además, se considera un proceso que da cuenta de los resultados obtenidos, el análisis de las causas y el motivo del producto. (Mora, 2004). Psicodiagnóstico: Proceso en el cual se busca una proximidad con el individuo a investigar, de manera que se tenga un panorama más dinámico de él, integrando así, sus particularidades y detallándolo de forma específica en algún aspecto. (Cabrera & López, 2007)
8
Psicométricos, saber diferenciar los términos guiará mejor la creación de tu instrumento
Página |9
1,3. Importancia de la Estadística en la
Psicometría
Mis querido psicométricos, debido a que se hace necesario que se compruebe que las pruebas midan nuestras variables establecidas en un primer momento, y que se dén de manera efectiva la confiablidad y validez- las cuales profundizaremos en un capítulo para cada una es precisamente, el uso de los métodos estadísticos los que se vuelven indispensables para la traducción de los resultados obtenidos en información objetiva y precisa, de forma que sea entendible para cualquiera que tenga acceso a ella. Es así, como se debe tener conocimiento sobre conceptos, procesos, operaciones, y representaciones de la información básicas, que aseguren que cada una de las variables a considerar, les hacen un pertinente análisis y correlación. Se presume, que actualmente la medición estadística en el ámbito psicológico ha simplificado el trabajo de los profesionales orientados al análisis del comportamiento, gracias a que, por medio de la aplicación de pruebas, infieren en la precisión de determinadas conductas, habilidades o actitudes. (Reyes) La estadística nos permite que nuestras variables de estudio pueden ser cuantificables, y de esa manera tenga mayor valor científico
9
10 [Escriba el tĂtulo del documento]
P á g i n a | 11
2. PREMISAS
Características diferenciadoras de una persona y otra. Características que pueden ser cuantificables. Los rasgos de la personalidad perduran en el tiempo Pueden ser estos rasgos ser verificados.
2.1 CLASIFICACIÓN DE PRUEBAS Las pruebas se pueden clasificar según:
El contenido La forma en que se elaboraron El parámetro para cuya medición se diseñaron El propósito de su aplicación La manera en que se es administrada, calificada e interpretada. El tipo de material El tipo de tarea a realizar
2.2 OBJETIVOS Y USOS DE LAS PRUEBAS Las pruebas psicológicas e instrumentos de evaluación son aplicada en diversos campos ya sean académicos, clínicos, organizacionales, forenses, sociales entre otras. Los psicólogos desde las áreas mencionadas anteriormente asignan gran tiempo de su quehacer profesional y laboral a calificar e interpretar pruebas psicológicas.
11
El objetivo principal de las pruebas psicológicas es evaluar el comportamiento, las aptitudes, los rasgos de personalidad, problemas cognitivos, patologías y además de otras características que pueden ser individuales y de grupo.
[Escriba el título del documento]
Según Aiken (2003) las pruebas son usadas comúnmente para: 1. Selección de personal 2. Clasificar y colocar a las personas en contextos educativos y laborales. 3. Asesorar y guiar a las personas con propósitos de asesoría educativa, vocacional y personal. Conservar o despedir, promover y rotar estudiantes o empleados en programas educativos, de capacitación y en situaciones laborales. 4. Diagnosticar y prescribir tratamientos psicológicos y físicos 5. Evaluar cambios cognoscitivos en individuos 6. Evaluar ambientes Psicológicos, movimientos sociales y psicosociales.
2.3 CONSIDERACIONES ÉTICAS Y LEGALES DENTRO DE LA PSICOMETRÍA 12
Una de los principales cuestionamientos éticos y políticas, y temáticas a la cual se está incitando promover es el respeto a la utilización de los instrumentos, es decir que estos, sigan las instrucciones de los manuales de aplicación, midan y evalúen con exactitud lo que deben medir y
P á g i n a | 13
evaluar, plasmado por los autores y editores, quienes basados por un constructo o modelo teórico diseñaron estos para la evaluación y medición de diferentes problemáticas, patológicas, actitudes entre otras, en las distintas áreas del saber. De igual manera no se altere o de pie a fotocopiar o copiar la prueba respetando los derechos de autor (Aiken, 2003). Principios éticos para el uso eficaz de los instrumentos de medición y evaluación psicológica:
1. Dar seguridad a la pruebas, tanto antes como después de la aplicación. 2. Dar a firmar el consentimiento informado antes de la prueba, donde se especifique los objetivos y el fin de esta. 3. Dar confiabilidad de la prueba. 4. Entregar los resultados debidamente interpretados a la persona autorizada. 5. Tener confidencialidad de los datos que están siendo suministrados a través de la prueba.
13
2.4 FUENTES DE INFORMACION SOBRE LAS PRUEBAS La información correspondiente a tests psicológicos y otros instrumentos de evaluación psicológica que pueden ser de fácil acceso y encontrarse en páginas Web, Revistas y libros como por ejemplo las mencionadas a continuación:
[Escriba el título del documento]
1. La Psychological Corporation (áreas de evaluación psicológica, terapia ocupacional y Organizacional) 2. La empresa Pro.ed ((tests psicológicos; educación especial, rehabilitación, trastornos del desarrollo y en superdotados, primera infancia, y habla, lenguaje y audición) 3. Tests in Print V (Murphy, Impara y Plake, 1999) y Tests (Maddox, 1997) estas fuentes proporcionan información descriptiva sobre cientos de pruebas disponibles comercialmente. 4. The Mental Measurements Yearbook 5. El libro Measures for Clinical Practice de Corcoran y Ftsher (2000) especializado en instrumentos utilizado para caso de consulta clínica y asesoría. 6. Las bases de datos HAPI (Health and Psychosocial Instruments), PsycINFO y PsycLIT, las cuales contienen información de más de 15 mil instrumentos psicométricos. 7. Revistas profesionales como: American Educacional Research Journal, Journal of Educacional Measurement, Measurement and Evaluation in Counseling and Development, Personnel Psychology y Psychoeducational Assessment. 8. El Inventario Multifásico de Personalidad de Minnesota (MMPI), libro sobre pruebas individuales
:
14
P รก g i n a | 15
15
3. NORMAS
[Escriba el título del documento]
Se dice norma a los puntajes promedios sacados de las mediciones de un sujeto, la utilidad hace referencia al grado que las normas brindan una significancia o fundamento para la interpretación de una prueba, lo cual hace referencia a obtener una norma que sea estable que es determinada por el grupo normativo, es decir el número de casos dado en la estandarización y representativa dependiendo de lo que el autor de la prueba afirme sobre las normas (Hogan, 2015).
3.1 TIPOS DE NORMAS Existen tres tipos de normas que en general son usadas pruebas psicológicas, cabe mencionar que en casos donde hay muchas pruebas, se utilizan varios tipos de normas, de modo que podernos convertir un tipo de norma en otro, aunque esto no sea posible con todos los tipos de normas. Las relaciones entre las normas son importantes; por lo general, se conceptualizan en el contexto de la curva normal (Hogan, 2015).
16
Percentiles: indica el porcentaje del grupo normativo que se deja por debajo de la curva natural. Ej: un sujeto con un percentil 80 significa que obtiene puntuaciones superiores al 80% de los sujetos de su grupo normativo, o que tiene puntuaciones inferiores al 20% restante. (Hogan, 2015).
P á g i n a | 17
Puntuación Z: Indican que tanto se separa el sujeto de la media del grupo normativo, en función de lo que se separan los demás. La puntuación directa que obtiene un sujeto se transforma en otra puntuación en relación a la media del grupo pero tomando como unidad de medida la desviación típica de ese grupo. (Hogan, 2015). Puntuación de desarrollo: se usa esta puntuación cuando el constructo que se está midiendo progresa de manera sistemática en el tiempo. Existen dos puntuaciones de desarrollo: los equivalentes de edad (EE) se usan en pruebas de capacidad mental, en cuyo caso la puntuación se denomina edad mental y el equivalente de grado (EG) se define como la razón entre la edad mental y la edad cronológica. Las normas de desarrollo sólo tienen sentido en la medida en que el rasgo que se mide se desarrolla o crece con el tiempo en la población pertinente. En una norma de desarrollo, una puntuación natural se interpreta en términos de la edad o grado para el que dicha puntuación es típica (Hogan, 2015).
17
3.2 GRUPOS NORMATIVOS Según Gonzales (2007) son aquellos grupos o poblaciones de un espacio geográfico que comparten variables que se tienen en cuenta para la construcción de una prueba o test. Grupo normativo nacionales:
[Escriba el título del documento]
Grupo normativo internacionales:
18
P รก g i n a | 19
19
Confiabilidad La confiabilidad es un criterio de medición que se refiere al grado de exactitud
o
precisión
de
la
medida
de
un
instrumento,
independientemente de las circunstancias de la recogida de datos o de lo que se mide (Del Rio, 2013) La confiabilidad nos permite determinar el grado de congruencia con que se mide la variable que se pretende evaluar, en el sentido de que si se aplica el instrumento a muestras idénticas y esta arroja siempre los mismos resultados, es un instrumento confiable, es decir, entre menos [Escriba el título del documento]
variación produzca un instrumento luego de repetidas aplicaciones, más alto será su nivel de confiabilidad y precisión; en caso de ocurrir lo contrario, se estaría evidenciando la existencia de un importante error de medición (Arias, 2005). El error de medición o la carencia de confiabilidad siempre tienden a atenuar todo tipo de legitimidad científica. Cualquiera que sea el grado de certeza que exista en la naturaleza, resultara confusa si no se utilizan medidas efectivamente confiables para determinarla. El error de medición siempre tiene tendencia a convertir las correlaciones más próximas a cero (Nunnally, 1970).
20
P á g i n a | 21
Tipos de confiabilidad - Método test-retest (repetición): este método consiste en la aplicación de un mismo test en dos ocasiones, donde la correlación de los puntajes obtenidos será la estimación del coeficiente de confiabilidad. la confiabilidad arrojada por el test retest permite observar el grado en que los resultados de un instrumento puedan generalizarse, asi mismo, demuestra que a mayor confiabilidad mayor será la resiatencia a los cambios cotidianos y del entorno (Anastasi & Urbina, 1998) - Confiabilidad de formas alternas: en este caso, en lugar de utilizar el mismo test en dos ocasiones, se opta por emplear dos formas alternativas (denominadas también formas equivalentes o paralelas). Es decir, en lugar de elaborar una única forma para el instrumento, se construyen y se aplican dos formas muy semejantes. La correlación obtenida de las dos formas del instrumento representan el coeficiente de confiabilidad además de la consistencia de las respuestas arrojadas ante dos formas de reactivos (Anastasi & Urbina, 1998). - Confiabilidad de división por mitades: en este modelo en lugar de preparar formas alternativas del instrumento se divide la escala en dos mitades, lo que arroja dos puntuaciones para cada persona para luego hacer una comparación (Anastasi & Urbina, 1998). - Confiabilidad de consistencia interna: Este incluye el método de división por mitades de spearman, las formalas de Kuder Richardson y el coeficiente alfa de Cronbach, est método permite
21
la medición de la confiabilidad teniendo en cuenta las correlaciones de los ítems dentro de un test y las ecuaciones para las aplicaciones prácticas las cuales permitirán identificar el grado
[Escriba el título del documento]
de homogeneidad de las respuestas (Nunnally, 1970).
Método testretest
Formas equivalentes o paralelas
Confiabilidad de división por mitades
Confiabilidad de consistencia interna
Aplicación de un mismo test en dos ocasiones y la correlación de los puntajes obtenidos será la estimación del coeficiente de confiabilidad
En lugar de utilizar un mismo test en dos ocasiones, se construye y se aplican dos formas muy semejantes. la correlación de las dos formas representan el coeficiente
En lugar de preparar formas alternativas del instrumento se divide la escala en dos mitades, lo que arroja dos puntuaciones para cada persona para luego hacer una comparación
este permite la medición de la confiabilidad teniendo en cuenta las correlaciones de los ítems dentro de un test y las ecuaciones para las aplicaciones prácticas las cuales permitirán identificar el grado de homogeneidad
Nunnally, 1970). (Anastasi & Urbina, 1998).
22
P รก g i n a | 23
23
[Escriba el título del documento]
6. VALIDEZ La Validez de un test o prueba indica el grado de exactitud con el que mide el constructo teórico que pretende medir y si se puede utilizar y si es posible, utilizar con un fin anteriormente previsto. Es decir, un test es válido si ''mide lo que dice medir'', es la cualidad más grande de un instrumento de medida. Es importante aclarar que, un instrumento puede ser fiable y no valido; pero si es válido tiene que ser fiable. La validez está dividida en 3 grandes grupos:
Validez de Contenido Validez de Criterio Validez de Constructo
6.1 Validez De Contenido
24
La validez de contenido se refiere al grado en que el test o prueba presenta una muestra apropiada de los contenidos a los que se refiere, sin exclusión y sin desequilibrios de contenido; este tipo de validez se utiliza principalmente con tests de rendimiento, test educativos y relacionados al criterio, básicamente con este tipo de tests se busca comprobar los conocimientos respecto a una materia o un curso.
P á g i n a | 25
La validez de contenido descansa generalmente en el juicio de expertos (métodos de Juicio). Se define como el grado en que los ítems que componen el test representan el Contenido que el test trata de evaluar. Por tanto, la validez de contenido se basa en: La Definición precisa del dominio En el juicio sobre el grado de suficiencia con que ese dominio se evalúa.
Ejemplo 1. De un instrumento implementado con validez de contenido (fig. izquierda) y uno que carece de este tipo (Fig. derecha).
6.2 Validez de Criterio Este tipo de validez, hace referencia al grado en que el test se correlaciona con variables ajenas al test (criterio), con lo cual se espera por hipótesis que debe correlacionar de determinado modo. Entiéndase por ''Criterio'' a la variable distinta o ajena al test, que se toma como
25
referencia de un indicador de aquello que el test mide o relacionado con lo que el test pretende medir.
[Escriba el título del documento]
Dentro del concepto de validez de criterio, se puede distinguir 2 importantes grupos: A. Validez Externa y validez Interna B. Validez Concurrente y Validez Predictiva.
26
A). Hablamos de validez externa si el test se ha validado con respecto a un criterio externo, como por ejemplo, una evaluación de rendimiento. La correlación del test con el criterio da lugar al coeficiente de validez externa. Hace referencia a la posibilidad de generalización. Hablamos de validez interna si se correlaciona un test con otro con validez reconocida que mide el mismo rasgo; los coeficientes de validez interna suelen ser menores que los de validez externa y su interpretación es difícil. Para evitar errores de interpretación se suele correlacionar un test con todos los tests ya validados que miden lo mismo y calcular un coeficiente de correlación múltiple. B). La distinción entre validez concurrente y predictiva se emplea según se utilice un criterio disponible en el momento (validez concurrente) o cuando se pretenda predecir la conducta futura de un individuo (validez predictiva). Este tipo de validez se exige especialmente para los instrumentos que se utilizan en selección y orientación académica o profesional. 6.3 Validez de Constructo La validez de Constructo de un instrumento de evaluación psicológica se refiere al grado en que el instrumento mide un constructo particular, o concepto psicológico como los es la ansiedad, la motivación para el logro, al extroversión-introversión o el neuroticismo; cuando nos referimos a constructo, hace referencia a un concepto teórico psicológico inobservable (ej. la inteligencia, cada factor de personalidad, las aptitudes, las actitudes, etc.) La definición operativa de estos constructos presenta considerables dificultades en la práctica, ya que no
P á g i n a | 27
son directamente observables. Debido a esto, la validación de un constructo es un proceso laborioso y difícil. Para la estimación de la validez de constructo se utiliza una metodología variada. Algunos de los métodos más utilizados son:
1) Métodos correlaciónales Los coeficientes de correlación nos indican la relación del test con el conjunto de instrumentos de medida y criterios posibles, así como la relación entre el test y el constructo. - Correlación del test con un criterio externo - Correlación test con otros tests que pretenden medir los mismos aspectos o aspectos semejantes. - Correlación del test con otros tests que miden características, que nada tienen que ver con el constructo que subyace al test. Campbell y Fiske (1959) proponen que se calcule dos tipos de validez: a) Validez convergente: indica las correlaciones positivas con otros tests que miden lo mismo. b) Validez discriminante: indica las correlaciones nulas con tests que miden aspectos diferentes. A través de estos dos tipos de validez se podría ir definiendo un constructo psicológico.
2) Análisis Factorial del test El análisis factorial permite ordenar los datos y facilitar la interpretación de las correlaciones. Se espera un factor explicativo del constructo con saturaciones altas del test y los tests que miden aspectos parecidos, y con saturaciones bajas de aquellos tests que miden aspectos diferentes. Con frecuencia se habla de la estructura factorial de un test como validez estructural o validez factorial 3) Análisis de las diferencias individuales que pone de manifiesto un test Se refiere al análisis de la distribución de las puntuaciones de test y a comparaciones de estos aspectos en distintas muestras. Diferentes edades, sexos, niveles profesionales, etc. Estas comparaciones no son arbitrarias, sino que se derivan de hipótesis que se hacen en función de los conocimientos que se tiene del constructo.
27
4) Análisis de los cambios en las diferencias individuales Se refiere a la investigación diacrónica de los mismos sujetos con el mismo test. Este tipo de estudios permite conocer la estabilidad del rasgo a lo largo del tiempo y a través de situaciones.
[Escriba el título del documento]
5) Análisis lógico de los elementos del test Se refiere al análisis de ítems del test en relación con el constructo. Aquellos ítems que correlacionan positivamente entre sí, pertenecen al mismo constructo. Esto significa que el análisis de consistencia interna de un test no sólo aporta datos respecto a su fiabilidad, sino a su validez. Si se obtiene un coeficiente de consistencia interna bajo, significa que el test no mide un único constructo.
28
P รก g i n a | 29
29
Planeación de la elaboración de pruebas 1. Tipos de preguntas o ítems
[Escriba el título del documento]
Los tipos de reactivos de una prueba según Hogan (2015) son: Reactivos de respuesta cerrada: también llamados de respuesta múltiple, de opción múltiple o de opciones forzadas. Estos consisten en plantear al menos dos opciones de respuestas a elegir y hasta un número razonable de estas. Comúnmente las pruebas de capacidad y de aprovechamiento que se aplican grupalmente, manejan este tipo de reactivos con cuatro o cinco opciones de respuestas por cada uno. En algunos casos, hay reactivos de falso-verdadero, siendo estos de opción múltiple pero con solo dos opciones de repuestas, la cual es verdadera o falsa. Además de estas, también son usadas en pruebas de personalidad, actitud e intereses.
Dato curioso: Estos reactivos son los más usados
30
P á g i n a | 31
Entre este tipo se encuentran: Reactivos tipo likert: este tipo de reactivos usan una escala de cinco puntos, que comprende desde completamente de acuerdo hasta completamente en desacuerdo, o bien, desde nuca a siempre. Como por ejemplo en la prueba que estamos desarrollando de desarrollo psicoafectivo, que tiene una pregunta así:
¿Sientes miedo cuando tu madre se separa de ti? Nunca rara alguna casi siempre vez vez siempre
Escala de valoración gráfica: Las respuestas se escogerán en un continuo entre dos polos, y después, se convierten estas respuestas en una forma numérica. Estas respuestas pueden ser aplicadas en un formato de diferencial semántico, en el cual se valora con unas escalas que tienen atributos que contrastan en cada lado, por ejemplo: bien-mal, hostil-amigable.
31
[Escriba el título del documento]
Reactivos de respuesta abierta: también llamado de respuesta libre, Estos reactivos si bien muestran un estímulo, se diferencian de las anteriores en que estas no restringen al sujeto de escoger un número determinado de respuestas. Sino que en este caso, el sujeto debe diseñar o hacer una respuesta. Sin embargo, aunque no haya una limitación para el sujeto con respecto a la escogencia de respuestas, si existen unas condiciones que la regulan, estas pueden ser la forma (oral o escrita) y el tiempo en que se deben dar. Estas son bastante usadas en evaluaciones de personalidad.
2. Elaboración de ítems para pruebas Para la elaboración de los reactivos se tiene un primer objetivo que es el diseño de un bosquejo, en el cual se incluyen detalles específicos que son útiles para guiarse en la realización de los reactivos a evaluar o pronosticar objetivos. Cuando ya esto está listo, se procede a realizar los reactivos. Se recomienda que en las pruebas objetivas se haga un 20% más de reactivos de los que se necesiten, así pues habrá una cantidad considerable de reactivos para la versión final de la prueba.
32
Los reactivos de una prueba simbolizan procedimientos para recolectar información sobre las personas, pero esta información se alterará por la esencia de las tareas propuestas por distintos reactivos (Lewis, 2003).
P á g i n a | 33
RECOMENDACIÓN: debes ser proactivo cuando vayas a realizar los reactivos de una prueba. Es por esto que debes hacer un 20% más de preguntas.
3. Calificación de ítems o reactivos Según Hogan (2015) los ítems se califican de acuerdo al tipo de reactivos, así pues, habrá una calificación para los reactivos cerrados y otra para los reactivos abiertos. Calificación de los reactivos cerrados En las pruebas de capacidad y de aprovechamiento los reactivos de respuesta cerrada son calificados como correctos o incorrectos, en estos se otorga un punto por cada respuesta correcta y cero puntos por cada respuesta incorrecta. Teniendo como puntuación la cantidad total de respuestas correctas. Otras formas de calificar… 1. Se le otorga una aceptación mediana cuando escoge una respuesta que no es mala pero tampoco buena.
33
2. Otorgar valor extra a los reactivos de mayor importancia 3. Usar la corrección para las respuestas adivinadas En las pruebas de personalidad, actitudes e intereses, la calificación se da diferente. Pues en unos casos, se califica con 1 o 0 (guardando semejanza con las de correcta-incorreta, de las pruebas anteriormente expuestas), teniendo cada uno de estos una dirección, por ejemplo, más alegre, muy triste.
[Escriba el título del documento]
A estas pruebas se les determina una numeración que varía con respecto a las distintas respuestas en reactivos de pruebas, por ejemplo, en la pregunta anterior con respecto al apego, se le da una numeración de 5, 4, 3, 2, y 1 punto.
34
Calificación de reactivos abiertos… Esta calificación puede ser un poco tediosa debido a que son respuestas muy diversas. La calificación demanda del juicio en muchas ocasiones. La calificación aquí se da a través de dos factores: La confiabilidad interjueces: como calificar los reactivos demanda de un criterio, debe haber un acuerdo entre los jueces, pues si hay un mínimo desacuerdo, las calificaciones serán erradas. Aun cuando este acuerdo no es razón suficiente para que haya un grado de confiabilidad alto, ya que la que lo ofrece es el test-retest, sin este acuerdo lo demás no tendrá sentido.
P á g i n a | 35
Conceptualizar un esquema de calificación: esto es algo complejo debido a que los tipos de esquemas varían mucho. Esto se puede hacer a través de una calificación holística, una calificación analítica, sistema de puntos y calificación automatizada.
4. Análisis de los reactivos Una vez aplicada y calificada una prueba se hace necesario analizarla para detectar posibles problemas, ya que estos pueden surgir, pues nada es perfecto. Es por ello que las pruebas a distribuir, se aplican inicialmente a una muestra representativa de personas del grupo al que están designadas. Este análisis de resultados debe realizarse aun cuando sea una prueba estandarizada o elaborada por un experto. Aquí se deben dar respuestas a preguntas tales como: ¿El tiempo límite fue lógico? ¿Las instrucciones fueron entendidas de forma correcta? ¿Estaban los participantes en las condiciones adecuadas al realizar la prueba?. No es de esperar que se puedan detectar todos los problemas en la prueba piloto, es por ellos que el análisis posterior a la aplicación, ofrece datos y entusiasmo para prever y dominar estas situaciones en un futuro (Lewis, 2003).
35
Referencias -Aiken, L. (2003). Test psicológicos y evaluación. Ciudad de México, México. Ed Pearson Education. Recuperado de: https://books.google.com.co/books?id=2LvyL8JEDmQC&printsec=frontcover&hl=es& source=gbs_similarbooks_r&redir_esc=y#v=onepage&q&f=true -Gonzales, F. (2007). Instrumentos de evaluación psicológica. La Habana, Cuba. Ed Ciencias médicas. Recuperado de: http://newpsi.bvspsi.org.br/ebooks2010/en/Acervo_files/InstrumentosEvaluacionPsicologica.pdf
[Escriba el título del documento]
-Hogan, T. (2015). Pruebas psicológicas: una introducción práctica. Ciudad de México, México. Ed Manual moderno. Recuperado de: https://books.google.com.co/books?id=dHGFCgAAQBAJ&pg=PT130&lpg=PT130&d q=grupos+normativos+nacionales&source=bl&ots=3pDeWNnReJ&sig=MV6z9yydvE Ba7Ag19kVnywSX5jY&hl=es&sa=X&ved=0ahUKEwi1_8bd58PTAhWD8YMKHQ3 aCMsQ6AEISzAH#v=onepage&q=grupos%20normativos%20nacionales%20&f=false -Universidad Nacional de educacion abierta y a distancia. (2011). Tema 3: Los instrumentos de la evaluación psicológica. Psicode. Recuperado de: http://psicocode.com/apuntes/apuntes-de-tercero/ -Nunnally, J. (1970). Introducción a la medición psicológica. Buenos Aires, Argentina. Editorial páidos. Anastassi, A. & Urbina, S. (1998). Test psicológicos, 7ma ed. México. Recuperado de: https://books.google.com.co/books?id=FV01zgFuk0cC&printsec=frontcover&dq=tipos +de+confiabilidad+en+psicometria&hl=es&sa=X&ved=0ahUKEwjqk87LqMPTAhUJZ CYKHc4oCS8Q6AEIIDAA#v=onepage&q=confiabilidad&f=false Arias, J. (2005). Confiabilidad y validez para evaluar los instrumentos de medición. Universidad Ncional de Uruguay Chiner, E (S.F) Tema 6. La validez. Recuperado de: https://rua.ua.es/dspace/bitstream/10045/19380/25/Tema%206Validez.pdf
Cabrera, Y & López, E. (2007). Psicodiagnóstico, una mirada a su historia. Medisur, Vo., 5 (3), 85-91. 36
Cano, A (2005). Aspectos para una definición de Evaluación. Mendoza, J & Garza, J (2009). La medición en el proceso de investigación científica: Evaluación de validez de contenido y confiabilidad.
P á g i n a | 37
Mora, A (2004). La Evaluación Educativa: concepto, períodos y modelos. Actualidades Investigativas en Educación", vol. 4, núm. 2. Reyes, F (S, F). Importancia de la psicometría en la Psicología. Recuperado de: https://es.scribd.com/doc/58386407/Importancia-de-la-psicometria-enpsicologia
37