Diseño de pruebas psicológicas Cartilla interactiva e ilustrativa
Universidad del Magdalena Programa de psicología
Elaborado por
Andres Ordoñez Maira Fernández María Larios Johan Penates Rosa Fuentes Daniel Urina
Primera Edición Abril del 2017
Hecho en Colombia
Página |1
Tabla de contenido 1. Importancia de la Medición psicológica y Reseña histórica de la Psicometría. 1.1 Reseña histórica de la Psicometría. 1.2 Medición, Evaluación, valoración y psicodiagnostico. 2. Premisas y cuestiones fundamentales relacionadas con la psicometría. 2.1 Clasificación de las pruebas. 2.2 Uso de las pruebas. 2.3 Consideraciones éticas y legales de la psicometría 2.4 Fuentes de información sobre las pruebas. 3. Fundamentos teóricos para la elaboración de las pruebas psicométricos 4. Normas. 4.1 Tipos de normas. 4.2 Grupos normativos. 5. Concepto de confiabilidad 5.1 Métodos para determinar la confiabilidad 5.2 Interpretación de los coeficientes de confiabilidad. 6. Concepto de Validez. 6.1 Procedimientos estadísticos para determinar la validez. 6.2 Tipos de Validez: por criterio externo (predictiva, concurrente); de contenido; de constructo. 6.3 Interpretación del coeficiente de validez. 7. Planeación de la elaboración de pruebas 7.1 Tipos de preguntas o ítems (escalas de medidas). 7.2 Elaboración de Ítems para prueba. 7.3 Calificación de ítems o reactivos. 7.4 Análisis de los reactivos. 7.5 Instrucciones de la prueba. 1
[Escriba el título del documento]
Presentación
2
Diseño de pruebas psicológicas, es la primera cartilla interactiva del tomo ´aprendiendo con Lili´, se da una mirada y análisis general sobre cómo crear una prueba psicológica, desde los aspectos teóricos que la conforman, hasta los criterios que aseguran su confiablidad y validez, es decir, lo que asegura que la prueba está midiendo lo que realmente deseamos. Es así, como queridos amigos psicométricos, les mostraremos lo dinámico y divertido que puede ser este proceso!; es hora de animarse y pensar sobre qué les gusta más, y que siempre han querido investigar! Nuestra amiga Lili es la que nos guiará a través de toda esta aventura, esperamos que lo disfrutes tanto como nosotros.
¡Bienvenidos amigos Psicométricos, prepárense para una de las más grandiosas experiencias que tendrán en su formación como Psicólogos! Soy Lili, su guía y aliada en este proceso.
Página |3
Introducción ¿Alguna vez te has preguntado quién hizo las clasificaciones de alegre, enojado, eufórico, o que hay amigos que sus personalidades no se ajustan a lo que tú eres?; precisamente, estas particularidades son las que nos hacen únicos y con habilidades, destrezas y capacidades que nos hacen sobresalir en algunos aspectos, pero que en otros no somos tan afortunados. La Psicometría, quién se encarga de medir los diferentes eventos y fenómenos psicológicos a través de técnicas, pruebas, y tests, se ha convertido en una rama útil en distintos espacios, donde es requerida una valoración objetiva, confiable y veraz del individuo, a nivel más que todo cognitivo, comportamental y emocional. De seguro en este momento ya has pensado en hacer uso de la Psicometría en alguien a ti cercano, ya que dudas de que su comportamiento sea del todo normal…
¡La psicometría nos permite ser más objetivos en la medición de las funciones y comportamiento del ser humano!
3
4 [Escriba el tĂtulo del documento]
Página |5
1. Importancia de la Medición psicológica y reseña histórica de la psicometría 1.1. Reseña Histórica de la psicometría
¿Puedes traer a memoria lo que hablábamos hace un rato? ¿Si recuerdas que todos en algún aspecto diferimos de los demás? Bueno, resulta que todas esas diferencias se clasifican en 3 conjuntos muy generales: cognoscitivas, características de tu personalidad y la manera cómo te comportas; ¿ya quisieras ser en algún momento de otra manera, cierto? Resulta que todo comenzó cuando dos de los grandes filósofos más reconocidos por sus grandes pensamientos, conjeturas y análisis sobre la realidad, empezaron a hablar sobre esas diferencias, sabiendo ya que los antiguos chinos en el año 2200 a.c (Bowman, 1989) utilizaban pruebas para clasificar a los futuros soldados civiles, buscando que estos fueran aptos y contaran con las habilidades necesarias para pertenecer a su listado. Sin embargo, llegó un tiempo en donde ser único y diferente, no era tomado en cuenta; época donde primaba que tanto capital monetario tenías, y no se apreciaba la diversidad que a nuestro alrededor está: imagina no poder expresar todo lo que sientes y piensas porque te es
5
[Escriba el título del documento]
prohibido, cuán difícil debió ser esos tiempos; pero como todo se supera, según Aiken (2003) en el siglo XVI, se empezó a considerar que nadie era igual a nosotros y escenarios sociales propiciaron más este pensamiento, pero fue hasta el siglo XIX que se desarrolló el estudio científico, teniendo como punto central las habilidades sensorio motrices y mentales, las cuales debían ser observadas de manera muy detalladas, pero como eran tan variables, pensaron en crear instrumentos precisos que proporcionaran información verídica.
6
Entre Las pruebas aplicadas por el emperador a sus soldados estaban el tiro con arco, música, aritmética y equitación.
Página |7
Personajes Influyentes Fueron algunos psicólogos experimentales los que señalaron que procesos psicológicos podían ser medidos:
Gustav Fechner
Wilhem Wundt
Hermann Ebbinghaus
Pero, además, de los anteriores señores, quiénes tuvieron una incidencia directa sobre el desarrollo de la psicometría fueron: Francis Galton, J, McKeen Cattell y Alfred Bonet; por su parte Galton se interesó en como la inteligencia se es heredada y como se pueden medir las habilidades humanas, elaborando pruebas para medirlas. Cattell era asistente de Galton, quién así fue como tuvo conocimiento de estas pruebas, y luego más tarde en la Universidad de Columbia, buscó relacionar la medición del tiempo con y el logro académico. Por su Parte Binet, construyó la primera prueba mental, dando importancia a la formación académica. 7
1.2 Medición, evaluación y psicodiagnóstico.
[Escriba el título del documento]
Al momento de entrar a hablar sobre pruebas psicológicas, es importante aclarar términos que son de obvia relevancia, de manera que se delimite su campo de acción y como se utilizan en diferentes momentos. A continuación, le daremos definición a cuatro (4) de ellos que se suelen usar con regularidad: Medición: Proceso a través del cual se le asignan valores a las unidades de análisis (bien sea objetos o personas), de modo que representa la caracterización de unos niveles de calidad. (Mendoza & Garza, 2009). Evaluación: Es el conjunto de acciones que se usan para generar un juicio, medir algo o emitir una valoración, de acuerdo a unos criterios de valor que han sido establecidos. (Cano, 2005). Además, se considera un proceso que da cuenta de los resultados obtenidos, el análisis de las causas y el motivo del producto. (Mora, 2004). Psicodiagnóstico: Proceso en el cual se busca una proximidad con el individuo a investigar, de manera que se tenga un panorama más dinámico de él, integrando así, sus particularidades y detallándolo de forma específica en algún aspecto. (Cabrera & López, 2007) 8
Psicométricos, saber diferenciar los términos guiará mejor la creación de tu instrumento
Página |9
1.3 Importancia de la Estadística en la Psicometría
Mis querido psicométricos, debido a que se hace necesario que se compruebe que las pruebas midan nuestras variables establecidas en un primer momento, y que se dén de manera efectiva la confiablidad y validez- las cuales profundizaremos en un capítulo para cada una es precisamente, el uso de los métodos estadísticos los que se vuelven indispensables para la traducción de los resultados obtenidos en información objetiva y precisa, de forma que sea entendible para cualquiera que tenga acceso a ella. Es así, como se debe tener conocimiento sobre conceptos, procesos, operaciones, y representaciones de la información básicas, que aseguren que cada una de las variables a considerar, les hacen un pertinente análisis y correlación. Se presume, que actualmente la medición estadística en el ámbito psicológico ha simplificado el trabajo de los profesionales orientados al análisis del comportamiento, gracias a que, por medio de la aplicación de pruebas, infieren en la precisión de determinadas conductas, habilidades o actitudes. (Reyes) La estadística nos permite que nuestras variables de estudio pueden ser cuantificables, y de esa manera tenga mayor valor científico
9
10 [Escriba el tĂtulo del documento]
P á g i n a | 11
2. PREMISAS
Características diferenciadoras de una persona y otra. Características que pueden ser cuantificables. Los rasgos de la personalidad perduran en el tiempo Pueden ser estos rasgos ser verificados.
2.1 CLASIFICACIÓN DE PRUEBAS Las pruebas se pueden clasificar según:
El contenido La forma en que se elaboraron El parámetro para cuya medición se diseñaron El propósito de su aplicación La manera en que se es administrada, calificada e interpretada. El tipo de material El tipo de tarea a realizar
2.2 OBJETIVOS Y USOS DE LAS PRUEBAS Las pruebas psicológicas e instrumentos de evaluación son aplicada en diversos campos ya sean académicos, clínicos, organizacionales, forenses, sociales entre otras. Los psicólogos desde las áreas mencionadas anteriormente asignan gran tiempo de su quehacer profesional y laboral a calificar e interpretar pruebas psicológicas. 11
El objetivo principal de las pruebas psicológicas es evaluar el comportamiento, las aptitudes, los rasgos de personalidad, problemas
cognitivos, patologías y además de otras características que pueden ser individuales y de grupo.
[Escriba el título del documento]
Según Aiken (2003) las pruebas son usadas comúnmente para: 1. Selección de personal 2. Clasificar y colocar a las personas en contextos educativos y laborales. 3. Asesorar y guiar a las personas con propósitos de asesoría educativa, vocacional y personal. Conservar o despedir, promover y rotar estudiantes o empleados en programas educativos, de capacitación y en situaciones laborales. 4. Diagnosticar y prescribir tratamientos psicológicos y físicos 5. Evaluar cambios cognoscitivos en individuos 6. Evaluar ambientes Psicológicos, movimientos sociales y psicosociales.
2.3 CONSIDERACIONES ÉTICAS Y LEGALES DENTRO DE LA PSICOMETRÍA
12
Una de los principales cuestionamientos éticos y políticas, y temáticas a la cual se está incitando promover es el respeto a la utilización de los instrumentos, es decir que estos, sigan las instrucciones de los manuales de aplicación, midan y evalúen con exactitud lo que deben medir y
P á g i n a | 13
evaluar, plasmado por los autores y editores, quienes basados por un constructo o modelo teórico diseñaron estos para la evaluación y medición de diferentes problemáticas, patológicas, actitudes entre otras, en las distintas áreas del saber. De igual manera no se altere o de pie a fotocopiar o copiar la prueba respetando los derechos de autor (Aiken, 2003). Principios éticos para el uso eficaz de los instrumentos de medición y evaluación psicológica:
1. Dar seguridad a la pruebas, tanto antes como después de la aplicación. 2. Dar a firmar el consentimiento informado antes de la prueba, donde se especifique los objetivos y el fin de esta. 3. Dar confiabilidad de la prueba. 4. Entregar los resultados debidamente interpretados a la persona autorizada. 5. Tener confidencialidad de los datos que están siendo suministrados a través de la prueba.
13
2.4 FUENTES DE INFORMACION SOBRE LAS PRUEBAS La información correspondiente a tests psicológicos y otros instrumentos de evaluación psicológica que pueden ser de fácil acceso y encontrarse en páginas Web, Revistas y libros como por ejemplo las mencionadas a continuación:
[Escriba el título del documento]
1. La Psychological Corporation (áreas de evaluación psicológica, terapia ocupacional y Organizacional) 2. La empresa Pro.ed ((tests psicológicos; educación especial, rehabilitación, trastornos del desarrollo y en superdotados, primera infancia, y habla, lenguaje y audición) 3. Tests in Print V (Murphy, Impara y Plake, 1999) y Tests (Maddox, 1997) estas fuentes proporcionan información descriptiva sobre cientos de pruebas disponibles comercialmente. 4. The Mental Measurements Yearbook 5. El libro Measures for Clinical Practice de Corcoran y Ftsher (2000) especializado en instrumentos utilizado para caso de consulta clínica y asesoría. 6. Las bases de datos HAPI (Health and Psychosocial Instruments), PsycINFO y PsycLIT, las cuales contienen información de más de 15 mil instrumentos psicométricos. 7. Revistas profesionales como: American Educacional Research Journal, Journal of Educacional Measurement, Measurement and Evaluation in Counseling and Development, Personnel Psychology y Psychoeducational Assessment. 8. El Inventario Multifásico de Personalidad de Minnesota (MMPI), libro sobre pruebas individuales
14
:
P รก g i n a | 15
15
3. FUNDAMENTACION TEORICA DE LAS PRUEBAS En este capítulo queridos Psicométricos daremos a conocer la importancia de la fundamentación teórica para la elaboración de una prueba.
[Escriba el título del documento]
Después de una mirada general sobre la Psicometría, entraremos a uno de los puntos más importantes e indispensables para la creación de una prueba psicológica: las teorías sobre las cuales basaremos nuestra investigación y que nos servirán para darle forma a nuestro instrumento. Dado a que existen posturas, corrientes, concepciones y demás consideraciones diferentes, se hace necesario determinar, cuáles se ajustan más a las variables que vamos a evaluar , de forma que no abarquemos un gran conjunto de información que nos sea irrelevante.
16
Según Muñiz (1992) citado por Aragón (2004) Para toda elaboración de test o pruebas psicológica se hace importante la fundamentación teórica, puesto que gracias a esta se derivan los instrumentos psicológicos con el fin de evaluar y medir el constructo estudiado en la teoría que se esté trabajando para la medición de una prueba. La psicometría es el área de la psicológica encargada de garantizar que los test y pruebas creadas, tengan una validez científica, con el objetivo de brindar técnicas para modificar las problemáticas o trastornos en datos cuantificables, con el fin de dar valor a las respuestas de los instrumentos dados por los evaluados.
P á g i n a | 17
Es por eso, amigo psicométrico, que quizás aparte de la temática que quieres evaluar, debes tener unas buenas bases sobre las cuales apoyar tu investigación y que no parezca que lo que quieres medir, no tiene una trascendencia considerable que te haga dudar sobre lo que vienes trabajando. Como es bien sabido, la Psicología se caracteriza por el estudio de la conducta humana, y como son muchos y variados los elementos que la constituyen, los cuáles no pueden ser medidos de manera directa, se consideran como conceptos hipotéticos o constructos, que hacen parte de las teorías que intentan describir la conducta del individuo. Es por esto que todo instrumento o prueba va inmerso en todo un constructo teórico, algo fundamental que se debe tener en cuenta para la elaboración de un test o prueba psicológica, en donde se debe, identifica el constructo teórico, empaparse, realizar la lectura del contexto hacia esa teoría antes de empezar a construir un instrumento, y rectificar que tenga una validez científica, con el fin de evaluar y medir un rasgo, variable o constructo real y razonable.
17
Tal cual como la prueba Escalas de desarrollo Merrill Palmer tiene una fundamentación teórica, la cual daremos como ejemplo para aclarar dudas e inquietudes que tengan llegado hasta este punto.
[Escriba el título del documento]
Ejemplo
18
La Escalas de desarrollo Merrill Palmer instrumento que tiene como macro variable el desarrollo infantil, la cual gracias al interés de estudiar la secuencia normal del desarrollo infantil tiene el fin de tratar de identificar posibles desviaciones y retrasos en este. Este instrumento Tuvo gran influencia de los trabajos de Arnold Gessell, psicólogo y pediatra dedicado a estudios sobre el desarrollo infantil, debido a que brindaron gran información y descripciones del ciclo de maduración en un principio en el desarrollo motor, del lenguaje y social que se daban desde el nacimiento del infante. Más adelante publicaciones como la de las Escalas de desarrollo Merrill-Palmer en 1931 contribuyeron prometedora información en el campo del desarrollo infantil, implementando escalas como la del lenguaje expresivo, como posible elemento evaluador de trastorno en la comunicación. En los últimos tiempos el estudio del desarrollo infantil ha tenido gran demanda debido a ese despertador interés por identificar posibles anomalías o retrasos en el desarrollo infantil, por lo cual ha crecido la necesidad de crear herramientas confiables y con un sustrato valido para evaluar globalmente el desarrollo infantil. Hacia finales del siglo XX (1998) se realizó un proyecto de actualización de la Escalas de desarrollo Merrill Palmer que dio fin en inicios del siglo
P á g i n a | 19
XXI (2004) con la publicación, en Estados Unidos de las Escalas de desarrollo Merrill-Palmer MP-R revisadas, por lo cual el MP-R aparte de permitir hacer una evaluación comprehensiva del desarrollo infantil se convirtió en el instrumento más completo para hacerlo, esta nueva versión evalúa La misma macro variable del desarrollo infantil y además incluye unas micro variables como la cognición, el lenguaje, la motricidad, el desarrollo socioemocional y la conducta adaptativa y autocuidado que son las áreas del desarrollo que te dan una visión más global del estado del desarrollo del infante, permitiéndote evaluarlo desde el nacimiento hasta los 6 años. Esta prueba tiene bases teóricas como lo son:
¡Hola Psicometricos! Que gran idea…
La teoría de las habilidades cognitivas La teoría de la inteligencia fluida y cristalizada de Horn y Cattell (1966) El modelo jerárquico de la inteligencia en tres niveles propuesto por Gustafsson (1984). El modelo de exploración del juego de Uzgiris y Hunt (1975) que consiste la utilización de juguetes y estímulos comunes para la evaluación en niños El modelo de CHC basada en una escala de desarrollo cognitivo general La caja de problemas acrílica que proviene de los trabajos de Als (1986)
19
[Escriba el título del documento]
En general Las bases teóricas empleadas van en la búsqueda de los esquemas utilizado por los niños para resolver nuevos problemas con los juguetes, fundamento planteado por Piaget (1951), Robinson et al. (1985), Uzgiris y Hunt (1975) y Als (1986)
Es así amigo, que no podrás avanzar en la carrera, sino pones manos a la obra en la escogencia de tu constructo y las variables que deseas poner a prueba. Esperamos que te vaya muy bien y que logres cumplir con todos los requerimientos! 20
P รก g i n a | 21
21
3. NORMAS
[Escriba el título del documento]
Se dice norma a los puntajes promedios sacados de las mediciones de un sujeto, la utilidad hace referencia al grado que las normas brindan una significancia o fundamento para la interpretación de una prueba, lo cual hace referencia a obtener una norma que sea estable que es determinada por el grupo normativo, es decir el número de casos dado en la estandarización y representativa dependiendo de lo que el autor de la prueba afirme sobre las normas (Hogan, 2015).
3.1 TIPOS DE NORMAS
22
Existen tres tipos de normas que en general son usadas pruebas psicológicas, cabe mencionar que en casos donde hay muchas pruebas, se utilizan varios tipos de normas, de modo que podernos convertir un tipo de norma en otro, aunque esto no sea posible con todos los tipos de normas. Las relaciones entre las normas son importantes; por lo general, se conceptualizan en el contexto de la curva normal (Hogan, 2015).
P á g i n a | 23
Percentiles: indica el porcentaje del grupo normativo que se deja por debajo de la curva natural. Ej: un sujeto con un percentil 80 significa que obtiene puntuaciones superiores al 80% de los sujetos de su grupo normativo, o que tiene puntuaciones inferiores al 20% restante. (Hogan, 2015). Puntuación Z: Indican que tanto se separa el sujeto de la media del grupo normativo, en función de lo que se separan los demás. La puntuación directa que obtiene un sujeto se transforma en otra puntuación en relación a la media del grupo pero tomando como unidad de medida la desviación típica de ese grupo. (Hogan, 2015). Puntuación de desarrollo: se usa esta puntuación cuando el constructo que se está midiendo progresa de manera sistemática en el tiempo. Existen dos puntuaciones de desarrollo: los equivalentes de edad (EE) se usan en pruebas de capacidad mental, en cuyo caso la puntuación se denomina edad mental y el equivalente de grado (EG) se define como la razón entre la edad mental y la edad cronológica. Las normas de desarrollo sólo tienen sentido en la medida en que el rasgo que se mide se desarrolla o crece con el tiempo en la población pertinente. En una norma de desarrollo, una puntuación natural se interpreta en términos de la edad o grado para el que dicha puntuación es típica (Hogan, 2015).
Ejemplo Un ejemplo en donde se identifique el tipo de norma seria en la prueba Escalas de desarrollo Merrill Palmer en donde los puntajes de medición de los sujetos son de puntuación de desarrollo, ya que las variables a evaluar son áreas de desarrollo: cognitivo, socioemocional, motricidad, lenguaje, conducta adaptativa y autocuidado, siendo estas aspectos del desarrollo físico y psicológico en donde se presentan cambios en el tiempo, y que permiten de igual forma evaluar el progreso de estas en el infante, cabe resaltar que las puntuaciones de desarrollo hacen referencia a criterio, y por lo cual están relacionadas directamente con la dificultad de la tarea y el nivel de edad, aquí se buscar evaluar si el infante es capaz o no de hacer determinadas tareas, es decir, si ha alcanzado unos “criterios” definidos para su edad.
23
3.2 GRUPOS NORMATIVOS Según Gonzales (2007) son aquellos grupos o poblaciones de un espacio geográfico que comparten variables que se tienen en cuenta para la construcción de una prueba o test.
[Escriba el título del documento]
Grupo normativo nacionales:
24
Grupo normativo internacionales:
Un ejemplo: se evidencia que el grupo normativo en la prueba Escalas de desarrollo Merrill Palmer es internacional dada en dos países, Estados Unidos y España, en donde la primera estuvo compuesta por alrededor de 1.068 niños, y en la segunda, con una muestra representativa de 968 niños con edades comprendidas entre 1 y 78 meses, ambos seleccionados atendiendo a su edad, sexo, nivel educativo de los padres y distribución geográfica
P รก g i n a | 25
25
Confiabilidad Queridos psicométricos, en este apartado trataremos el concepto de confiabilidad y los diferentes tipos de métodos utilizados para medirla y así mismo ejemplificaremos el apartado desde la experiencia con la prueba MP-R. ¡Sigamos con esta aventura de conocimiento!
La confiabilidad es un criterio de medición que se refiere al grado de exactitud
o
precisión
de
la
medida
de
un
instrumento,
[Escriba el título del documento]
independientemente de las circunstancias de la recogida de datos o de lo que se mide (Del Rio, 2013) La confiabilidad nos permite determinar el grado de congruencia con que se mide la variable que se pretende evaluar, en el sentido de que si se aplica el instrumento a muestras idénticas y esta arroja siempre los mismos resultados, es un instrumento confiable, es decir, entre menos variación produzca un instrumento luego de repetidas aplicaciones, más alto será su nivel de confiabilidad y precisión; en caso de ocurrir lo contrario, se estaría evidenciando la existencia de un importante error de medición (Arias, 2005). El error de medición o la carencia de confiabilidad siempre tienden a atenuar todo tipo de legitimidad científica. Cualquiera que sea el grado de certeza que exista en la naturaleza, resultara confusa si no se utilizan medidas efectivamente confiables para determinarla. El error de medición siempre tiene tendencia a convertir las correlaciones más próximas a cero (Nunnally, 1970). 26
P á g i n a | 27
Tipos de confiabilidad - Método test-retest (repetición): este método consiste en la aplicación de un mismo test en dos ocasiones, donde la correlación de los puntajes obtenidos será la estimación del coeficiente de confiabilidad. la confiabilidad arrojada por el test retest permite observar el grado en que los resultados de un instrumento puedan generalizarse, asi mismo, demuestra que a mayor confiabilidad mayor será la resiatencia a los cambios cotidianos y del entorno (Anastasi & Urbina, 1998) - Confiabilidad de formas alternas: en este caso, en lugar de utilizar el mismo test en dos ocasiones, se opta por emplear dos formas alternativas (denominadas también formas equivalentes o paralelas). Es decir, en lugar de elaborar una única forma para el instrumento, se construyen y se aplican dos formas muy semejantes. La correlación obtenida de las dos formas del instrumento representan el coeficiente de confiabilidad además de la consistencia de las respuestas arrojadas ante dos formas de reactivos (Anastasi & Urbina, 1998). - Confiabilidad de división por mitades: en este modelo en lugar de preparar formas alternativas del instrumento se divide la escala en dos mitades, lo que arroja dos puntuaciones para cada persona para luego hacer una comparación (Anastasi & Urbina, 1998).
27
- Confiabilidad de consistencia interna: Este incluye el método de división por mitades de spearman, las formalas de Kuder Richardson y el coeficiente alfa de Cronbach, est método permite la medición de la confiabilidad teniendo en cuenta las correlaciones de los ítems dentro de un test y las ecuaciones para las aplicaciones prácticas las cuales permitirán identificar el grado
[Escriba el título del documento]
de homogeneidad de las respuestas (Nunnally, 1970).
Método testretest
Formas equivalentes o paralelas
Confiabilidad de división por mitades
Confiabilidad de consistencia interna
Aplicación de un mismo test en dos ocasiones y la correlación de los puntajes obtenidos será la estimación del coeficiente de confiabilidad
En lugar de utilizar un mismo test en dos ocasiones, se construye y se aplican dos formas muy semejantes. la correlación de las dos formas representan el coeficiente
En lugar de preparar formas alternativas del instrumento se divide la escala en dos mitades, lo que arroja dos puntuaciones para cada persona para luego hacer una comparación
este permite la medición de la confiabilidad teniendo en cuenta las correlaciones de los ítems dentro de un test y las ecuaciones para las aplicaciones prácticas las cuales permitirán identificar el grado de homogeneidad
Nunnally, 1970). (Anastasi & Urbina, 1998). 28
P á g i n a | 29
Ejemplo: Queridos psicométricos, en el caso del instrumento Merrill Palmer, fueron considerados dos tipos de coeficiente de confiabilidad: confiabilidad de consistencia interna y el método de test- retest
Para hallar la confiabilidad a través de método de consistencia interna se empleó el coeficiente alfa de Cronbach. Este coeficiente inspecciona si los ítems miden lo mismo, teniendo en cuenta la consistencia de las respuestas.
La tabla presenta la estimación de la fiabilidad por consistencia interna. Como se observa, todos los coeficientes correspondientes al índice global y a las principales escalas del instrumento se encuentran por encima de 0,80 y su mayoría supera el valor de 0,90 lo cual indica que los ítems que conforman la escala se encuentran interrelacionados y por tanto presenta un alto índice de confiabilidad.
29
En la aplicación del método test retest, el MP-R fue aplicado a una muestra de 128 niños. Este instrumento se aplicó en dos ocasiones con cuatro semanas de diferencia.
[Escriba el título del documento]
A continuación se observan las correlaciones obtenidas.
En la tabla se muestran correlaciones muy satisfactorias, lo que indican un grado de confiabilidad.
30
P รก g i n a | 31
31
6. VALIDEZ
[Escriba el título del documento]
La Validez de un test o prueba indica el grado de exactitud con el que mide el constructo teórico que pretende medir y si se puede utilizar y si es posible, utilizar con un fin anteriormente previsto. Es decir, un test es válido si ''mide lo que dice medir'', es la cualidad más grande de un instrumento de medida. Es importante aclarar que, un instrumento puede ser fiable y no valido; pero si es válido tiene que ser fiable. La validez está dividida en 3 grandes grupos:
Validez de Contenido Validez de Criterio Validez de Constructo
6.1 Validez De Contenido
32
La validez de contenido se refiere al grado en que el test o prueba presenta una muestra apropiada de los contenidos a los que se refiere, sin exclusión y sin desequilibrios de contenido; este tipo de validez se utiliza principalmente con tests de rendimiento, test educativos y relacionados al criterio, básicamente con este tipo de tests se busca comprobar los conocimientos respecto a una materia o un curso.
P á g i n a | 33
La validez de contenido descansa generalmente en el juicio de expertos (métodos de Juicio). Se define como el grado en que los ítems que componen el test representan el Contenido que el test trata de evaluar. Por tanto, la validez de contenido se basa en: La Definición precisa del dominio En el juicio sobre el grado de suficiencia con que ese dominio se evalúa.
Ejemplo 1. De un instrumento implementado con validez de contenido (fig. izquierda) y uno que carece de este tipo (Fig. derecha).
33
6.2 Validez de Criterio Este tipo de validez, hace referencia al grado en que el test se correlaciona con variables ajenas al test (criterio), con lo cual se espera por hipótesis que debe correlacionar de determinado modo. Entiéndase por ''Criterio'' a la variable distinta o ajena al test, que se toma como referencia de un indicador de aquello que el test mide o relacionado con lo que el test pretende medir.
[Escriba el título del documento]
Dentro del concepto de validez de criterio, se puede distinguir 2 importantes grupos: A. Validez Externa y validez Interna B. Validez Concurrente y Validez Predictiva. A). Hablamos de validez externa si el test se ha validado con respecto a un criterio externo, como por ejemplo, una evaluación de rendimiento. La correlación del test con el criterio da lugar al coeficiente de validez externa. Hace referencia a la posibilidad de generalización. Hablamos de validez interna si se correlaciona un test con otro con validez reconocida que mide el mismo rasgo; los coeficientes de validez interna suelen ser menores que los de validez externa y su interpretación es difícil. Para evitar errores de interpretación se suele correlacionar un test con todos los tests ya validados que miden lo mismo y calcular un coeficiente de correlación múltiple. B). La distinción entre validez concurrente y predictiva se emplea según se utilice un criterio disponible en el momento (validez concurrente) o cuando se pretenda predecir la conducta futura de un individuo (validez predictiva). Este tipo de validez se exige especialmente para los instrumentos que se utilizan en selección y orientación académica o profesional. 34
6.3 Validez de Constructo La validez de Constructo de un instrumento de evaluación psicológica se refiere al grado en que el instrumento mide un constructo particular, o
P á g i n a | 35
concepto psicológico como los es la ansiedad, la motivación para el logro, al extroversión-introversión o el neuroticismo; cuando nos referimos a constructo, hace referencia a un concepto teórico psicológico inobservable (ej. la inteligencia, cada factor de personalidad, las aptitudes, las actitudes, etc.) La definición operativa de estos constructos presenta considerables dificultades en la práctica, ya que no son directamente observables. Debido a esto, la validación de un constructo es un proceso laborioso y difícil. Para la estimación de la validez de constructo se utiliza una metodología variada. Algunos de los métodos más utilizados son:
1) Métodos correlaciónales Los coeficientes de correlación nos indican la relación del test con el conjunto de instrumentos de medida y criterios posibles, así como la relación entre el test y el constructo. - Correlación del test con un criterio externo - Correlación test con otros tests que pretenden medir los mismos aspectos o aspectos semejantes. - Correlación del test con otros tests que miden características, que nada tienen que ver con el constructo que subyace al test. Campbell y Fiske (1959) proponen que se calcule dos tipos de validez: a) Validez convergente: indica las correlaciones positivas con otros tests que miden lo mismo. b) Validez discriminante: indica las correlaciones nulas con tests que miden aspectos diferentes. A través de estos dos tipos de validez se podría ir definiendo un constructo psicológico.
2) Análisis Factorial del test El análisis factorial permite ordenar los datos y facilitar la interpretación de las correlaciones. Se espera un factor explicativo del constructo con saturaciones altas del test y los tests que miden aspectos parecidos, y con saturaciones bajas de aquellos tests que miden aspectos diferentes. Con frecuencia se habla de la estructura factorial de un test como validez estructural o validez factorial
35
3) Análisis de las diferencias individuales que pone de manifiesto un test Se refiere al análisis de la distribución de las puntuaciones de test y a comparaciones de estos aspectos en distintas muestras. Diferentes edades, sexos, niveles profesionales, etc. Estas comparaciones no son arbitrarias, sino que se derivan de hipótesis que se hacen en función de los conocimientos que se tiene del constructo.
[Escriba el título del documento]
4) Análisis de los cambios en las diferencias individuales Se refiere a la investigación diacrónica de los mismos sujetos con el mismo test. Este tipo de estudios permite conocer la estabilidad del rasgo a lo largo del tiempo y a través de situaciones.
36
5) Análisis lógico de los elementos del test Se refiere al análisis de ítems del test en relación con el constructo. Aquellos ítems que correlacionan positivamente entre sí, pertenecen al mismo constructo. Esto significa que el análisis de consistencia interna de un test no sólo aporta datos respecto a su fiabilidad, sino a su validez. Si se obtiene un coeficiente de consistencia interna bajo, significa que el test no mide un único constructo.
Ejemplo
Apreciados psicométricos, en el caso del instrumento Merrill Palmer, se presenta la confiabilidad, como una consistencia interna de las escalas de la batería cognitiva, es importante señalar que fue empleado un coeficiente alfa de Cronbach. Debe tenerse en cuenta que la escala abarca un amplio rango de edades, pero cada estimado se calculó por separado en los niños de cada grupo de edad de la muestra normativa; de esta manera los indicadores de confiabilidad no están inflados por el efecto de crecimiento evolutivo (que es lo que sucedería si se calculasen en la muestra normativa al completo
P รก g i n a | 37
37
Planeación de la elaboración de pruebas 1. Tipos de preguntas o ítems
[Escriba el título del documento]
Los tipos de reactivos de una prueba según Hogan (2015) son: Reactivos de respuesta cerrada: también llamados de respuesta múltiple, de opción múltiple o de opciones forzadas. Estos consisten en plantear al menos dos opciones de respuestas a elegir y hasta un número razonable de estas. Comúnmente las pruebas de capacidad y de aprovechamiento que se aplican grupalmente, manejan este tipo de reactivos con cuatro o cinco opciones de respuestas por cada uno. En algunos casos, hay reactivos de falso-verdadero, siendo estos de opción múltiple pero con solo dos opciones de repuestas, la cual es verdadera o falsa. Además de estas, también son usadas en pruebas de personalidad, actitud e intereses.
Dato curioso: Estos reactivos son los más usados
38
P á g i n a | 39
Entre este tipo se encuentran: Reactivos tipo likert: este tipo de reactivos usan una escala de cinco puntos, que comprende desde completamente de acuerdo hasta completamente en desacuerdo, o bien, desde nuca a siempre. Como por ejemplo en la prueba que estamos desarrollando de desarrollo psicoafectivo, que tiene una pregunta así:
¿Sientes miedo cuando tu madre se separa de ti? Nunca rara alguna casi siempre vez vez siempre
Escala de valoración gráfica: Las respuestas se escogerán en un continuo entre dos polos, y después, se convierten estas respuestas en una forma numérica. Estas respuestas pueden ser aplicadas en un formato de diferencial semántico, en el cual se valora con unas escalas que tienen atributos que contrastan en cada lado, por ejemplo: bien-mal, hostil-amigable.
39
[Escriba el título del documento]
Reactivos de respuesta abierta: también llamado de respuesta libre, Estos reactivos si bien muestran un estímulo, se diferencian de las anteriores en que estas no restringen al sujeto de escoger un número determinado de respuestas. Sino que en este caso, el sujeto debe diseñar o hacer una respuesta. Sin embargo, aunque no haya una limitación para el sujeto con respecto a la escogencia de respuestas, si existen unas condiciones que la regulan, estas pueden ser la forma (oral o escrita) y el tiempo en que se deben dar. Estas son bastante usadas en evaluaciones de personalidad.
2. Elaboración de ítems para pruebas
40
Para la elaboración de los reactivos se tiene un primer objetivo que es el diseño de un bosquejo, en el cual se incluyen detalles específicos que son útiles para guiarse en la realización de los reactivos a evaluar o pronosticar objetivos. Cuando ya esto está listo, se procede a realizar los reactivos. Se recomienda que en las pruebas objetivas se haga un 20% más de reactivos de los que se
P á g i n a | 41
necesiten, así pues habrá una cantidad considerable de reactivos para la versión final de la prueba. Los reactivos de una prueba simbolizan procedimientos para recolectar información sobre las personas, pero esta información se alterará por la esencia de las tareas propuestas por distintos reactivos (Lewis, 2003).
RECOMENDACIÓN: debes ser proactivo cuando vayas a realizar los reactivos de una prueba. Es por esto que debes hacer un 20% más de preguntas.
3. Calificación de ítems o reactivos Según Hogan (2015) los ítems se califican de acuerdo al tipo de reactivos, así pues, habrá una calificación para los reactivos cerrados y otra para los reactivos abiertos. Calificación de los reactivos cerrados En las pruebas de capacidad y de aprovechamiento los reactivos de respuesta cerrada son calificados como correctos o incorrectos, en
41
estos se otorga un punto por cada respuesta correcta y cero puntos por cada respuesta incorrecta. Teniendo como puntuación la cantidad total de respuestas correctas. Otras formas de calificar…
[Escriba el título del documento]
1. Se le otorga una aceptación mediana cuando escoge una respuesta que no es mala pero tampoco buena. 2. Otorgar valor extra a los reactivos de mayor importancia 3. Usar la corrección para las respuestas adivinadas En las pruebas de personalidad, actitudes e intereses, la calificación se da diferente. Pues en unos casos, se califica con 1 o 0 (guardando semejanza con las de correcta-incorreta, de las pruebas anteriormente expuestas), teniendo cada uno de estos una dirección, por ejemplo, más alegre, muy triste. A estas pruebas se les determina una numeración que varía con respecto a las distintas respuestas en reactivos de pruebas, por ejemplo, en la pregunta anterior con respecto al apego, se le da una numeración de 5, 4, 3, 2, y 1 punto.
Calificación de reactivos abiertos… Esta calificación puede ser un poco tediosa debido a que son respuestas muy diversas. La calificación demanda del juicio en muchas ocasiones. La calificación aquí se da a través de dos factores:
42
La confiabilidad interjueces: como calificar los reactivos demanda de un criterio, debe haber un acuerdo entre los jueces, pues si hay un mínimo desacuerdo, las calificaciones serán erradas. Aun cuando este acuerdo no es razón suficiente para que haya un grado de confiabilidad alto, ya que la que lo ofrece es el test-retest, sin este acuerdo lo demás no tendrá sentido.
P á g i n a | 43
Conceptualizar un esquema de calificación: esto es algo complejo debido a que los tipos de esquemas varían mucho. Esto se puede hacer a través de una calificación holística, una calificación analítica, sistema de puntos y calificación automatizada.
4. Análisis de los reactivos Una vez aplicada y calificada una prueba se hace necesario analizarla para detectar posibles problemas, ya que estos pueden surgir, pues nada es perfecto. Es por ello que las pruebas a distribuir, se aplican inicialmente a una muestra representativa de personas del grupo al que están designadas. Este análisis de resultados debe realizarse aun cuando sea una prueba estandarizada o elaborada por un experto. Aquí se deben dar respuestas a preguntas tales como: ¿El tiempo límite fue lógico? ¿Las instrucciones fueron entendidas de forma correcta? ¿Estaban los participantes en las condiciones adecuadas al realizar la prueba?. No es de esperar que se puedan detectar todos los problemas en la prueba piloto, es por ellos que el análisis posterior a la aplicación, ofrece datos y entusiasmo para prever y dominar estas situaciones en un futuro (Lewis, 2003).
43
Referencias -Aiken, L. (2003). Test psicológicos y evaluación. Ciudad de México, México. Ed Pearson Education. Recuperado de: https://books.google.com.co/books?id=2LvyL8JEDmQC&printsec=frontcover&hl= es&source=gbs_similarbooks_r&redir_esc=y#v=onepage&q&f=true
[Escriba el título del documento]
-Gonzales, F. (2007). Instrumentos de evaluación psicológica. La Habana, Cuba. Ed Ciencias médicas. Recuperado de: http://newpsi.bvspsi.org.br/ebooks2010/en/Acervo_files/InstrumentosEvaluacionPsicologica.pdf -Hogan, T. (2015). Pruebas psicológicas: una introducción práctica. Ciudad de México, México. Ed Manual moderno. Recuperado de: https://books.google.com.co/books?id=dHGFCgAAQBAJ&pg=PT130&lpg=PT130& dq=grupos+normativos+nacionales&source=bl&ots=3pDeWNnReJ&sig=MV6z9yy dvEBa7Ag19kVnywSX5jY&hl=es&sa=X&ved=0ahUKEwi1_8bd58PTAhWD8YMKH Q3aCMsQ6AEISzAH#v=onepage&q=grupos%20normativos%20nacionales%20&f =false -Universidad Nacional de educacion abierta y a distancia. (2011). Tema 3: Los instrumentos de la evaluación psicológica. Psicode. Recuperado de: http://psicocode.com/apuntes/apuntes-de-tercero/ -Nunnally, J. (1970). Introducción a la medición psicológica. Buenos Aires, Argentina. Editorial páidos. Anastassi, A. & Urbina, S. (1998). Test psicológicos, 7ma ed. México. Recuperado de: https://books.google.com.co/books?id=FV01zgFuk0cC&printsec=frontcover&dq=t ipos+de+confiabilidad+en+psicometria&hl=es&sa=X&ved=0ahUKEwjqk87LqMPT AhUJZCYKHc4oCS8Q6AEIIDAA#v=onepage&q=confiabilidad&f=false Arias, J. (2005). Confiabilidad y validez para evaluar los instrumentos de medición. Universidad Ncional de Uruguay Chiner, E (S.F) Tema 6. La validez. Recuperado de: https://rua.ua.es/dspace/bitstream/10045/19380/25/Tema%206-Validez.pdf 44
Cabrera, Y & López, E. (2007). Psicodiagnóstico, una mirada a su historia. Medisur, Vo., 5 (3), 85-91.
P á g i n a | 45
Cano, A (2005). Aspectos para una definición de Evaluación. Mendoza, J & Garza, J (2009). La medición en el proceso de investigación científica: Evaluación de validez de contenido y confiabilidad. Mora, A (2004). La Evaluación Educativa: concepto, períodos y modelos. Actualidades Investigativas en Educación", vol. 4, núm. 2. Reyes, F (S, F). Importancia de la psicometría en la Psicología. Recuperado de: https://es.scribd.com/doc/58386407/Importancia-de-la-psicometria-enpsicologia
45