Guia teoria de la medida plan 71

Page 1

1

1 1

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO FACULTAD DE PSICOLOGIA DIVISION DE UNIVERSIDAD ABIERTA

1

TEORIA DE LA MEDIDA

1

UNIDAD UNO

1 1 1 1 1 1

l. 1

1

1 1

1

IMPORTANCIA DE LA MEDICION EN PSICOLOGIA

INTRODUCCION. En esta unidad lo que se pretende es que el alumno conozca de una forma general lo que es la medición, siendo este no de los temas más apasionantes para los profesionales que se interesan en saber cuanto mide, cuanto pesa, que área tiene, quizá también que tipo de personalidad o cuanto de3 inteligencia tiene cual o tal persona. Esto de instrumentos que se han utilizado para tal fin han variado considerablemente. Si nos remontamos a la vieja Grecia encontramos que la longitud se media por codos y la pista del estadio donde se realizaban los juegos olímpicos tenia doscientos codos y la pista del estadio donde se realizaban los juegos olímpi~os tenia doscientos codos, el tiempo se media por medio de los llamados relojes solares, que no era otra cosa que una vara delgada y derecha que se enterraba en la tierra y conforme el sol avanzaba la sombra de la misma iba cambiando y de esa manera se sabia la hora. Así podríamos pasamos un buen rato comentando la historia de la medición. Al hablar de medición psicológica diremos que esta se inicia también erl la antigua Grecia donde se seleccionaban a los hombres que debían marchar a la guerra y los que desarrollaban habilidades artísticas, posteriormente hay un gran vacío en la historia de la medición psicológica y se vuelve a hablar de la medición hasta la creación del laboratorio antropométrico de Francis Galton (1981) y hablando ya de pruebas psicológicas como las conocemos hoy es en 1905 con Alfred Bidet. Todo esto nos indica que la medición fisica es tan vieja como el mismo hombre y que en un momento dado surge la necesidad de medir otras cosas como podrían ser algunas características fisicas del ser humano y esto se fue ampliando hasta intentar mediciones psicológicas. Pues bien de que manera se puede lograr esto. Lo primero sería analizar el concepto de medición, lo cual nos lleva en primera instancia a la relación matemática psicología, que de forma más aplicada nos referiremos a la estadística, analizando los diferentes tipos de la misma. Posteriormente analizaremos que es lo que vamos a medir y aquí estaríamos hablando de variables, que también hay que definir y cuales son las diferentes clasificaciones de las mismas después analizaremos las reglas que se toman en cuenta para llevar a cabo una medición o sea los diferentes niveles de medición, y por ultimo·


1 1 1 1

1 1 1 1 1

1 1 1 1 1 1

1 1

.1

consideraremos los tipos e instrumentos que se usan para llevar a cabo una medición psicológicamente hablando nos referimos a las Pruebas o Tests. OBJETIVO GENERAL El alumno describirá y aplicará el concepto de medición en genera y en psicología en particular. OBJETIVOS ESPECIFICOS El alumno: 1.1 Definirá lo que es medición en general 1.2 Definirá lo que es medición fisicas 1.3 Definirá lo que es medición psicológica 1.4 Diferenciará entre medición fisica y psicológica 1.5 Señalará la relación entre matemáticas, estadística y psicología 1.6 Enunciará las diferentes clasificaciones de la estadística 1.7 Definirá lo que es una variable y su clasificación 1.8 Describirá las características de cada una de las .escalas de medición 1.9 Definirá lo que es un instrumento de medición psicológica y su clasificación BIBLIOGRAFIA BASICA l. Nunnally Jum C. Introducción a la Medición Psicológica. México. Editorial Paidos. 1970. Cap. 1 BF39 N84

2. Nunnally Jum C. Teoría Psicometría. México. Editorial Trillas. 1991 Primera edición en español Cap. 1 BF39 N 5418 3. Magnusson D. Teoría de los Tests. Editorial Trillas. México. Cap. I BF39 M33 4. Siegel S. Estadistica no Parametrica Editorial Trillas. México. Cap. 3 H 61 S 585

BILBIOGRAFIA COMPLEMENTARIA l. Downie y Heat. Métodos Estadísticos Aplicados. México. Editorial Harla. 1973. Cap. I 2. Young y Veldman. Introducción a la Estadística Aplicada a las Ciencias del Comportamiento. México. Editorial Trillas. 1986. Cap. 1

SUGERENCIAS DE ESTUDIO Se recomienda al alumno leer primeramente el libro de Introducción a la Medición Psicológica de Nunnally para tener una idea clara de los conceptos que en esta unidad se manejan, posteriormente leerá el otro libro de Nunnally y el Siegel y como lectura final será el Magnusson. Si después de esto existen dudas las podrá resolver leyendo la bibliografía complementaria. Recordando siempre que existe la asesoría individual para resolver cualquier duda de índole académico .


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

EXAMEN DE AUTOEVALUACION l. Asignar valores a los atributos o características de los objetos o sujetos median te reglas perfectamente establecidas, así definimos: a) Escalar b) Medir e) Evaluar d) Asignar 2. Para cambiar una variable cualitativa en cuantitativa es necesario definirla en forma: a) Operacional b) Constitutiva e) Ordinal d) Nominal 3. Los números se emplean para nombrar, identificar o clasificar en la escala: a) De razón b) Intercalar e) Ordinal d) Nominal 4. Se considera a la herramienta que va a permitir obtener la información, acerca del fenómeno en cuestión: a) La medición b) La variable e) El test d) La validez


! i

1 1 1 1 1 1 1 1 1 1

1

1

1

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO FACULTAD DEPSICOLOGIA DIVISION DE UNIVERSIDAD ABIERTA TEORIA DE LA MEDIDA

UNIDAD DOS

PASOS PARA LA CONSTRUCCION DE LOS INSTRUMENTOS DE MEDICION

OBJETIVO GENERAL El estudiante será capaz de analizar evaluar y aplicar los conocimientos vertidos en esta unidad para desarrollar un instrumento de edición, siguiendo los pasos correspondientes según la metodología aplicada. OBJETIVOS ESPECIFICOS EL ESTUDIANTE: 2.1 Definirá que es un rasgo, atributo o característica 2.2 Describirá los diferentes tipos de instrumentos de medición 2.3 Describirá los pasos que se siguen en la construcción de un instrumento de medición psicologica. 2.4 Describirá los diferentes tipos de reactivos 2.5 Describirá lo que es un análisis de reactivos 2.6 Explicará lo que son las calificaciones crudas y. derivadas 2. 7 Explicará lo que es una norma 2.8 Explicará lo que es una norma 2.9 Describirá las diferentes tablas de normas


1 1 1 1 ·1 1 1 1 1 1

1 1 1 1 1 1 1

BIBLIOGRAFIA BASICA

13f:

l. Thorndike Robert L. Psicométrica Aplicada. Ed. Trillas. 1089. Cap. 2 1=tC T 2. Adkins W. Doroty. Elaboración de Tests Psicológicos. Ed. Trillas. 1990. Caps. 5, 6 y 7 LB 3051 W65 3. Brown Frederick G. Principios de la Medición en Psicología y Educación. Ed. El Manual Moderno. 1980. Cap. 2. LB 1131 B752 4. Lyman Howard B. Las puntuaciones de los tests y sus significados. Ed. El Manual Moderno. 1977. Cap. 6. LB 3051 L942

1 -b -as'

BIBLIOGRAFIA COMPLEMENTARIA l. Crombach L. J. Fundamentos de la Exploración Psicológica. Ed. Biblioteca Nueva. 1972 2. Thorndike Robert L. Test y Técnicas de Medición en Psicología y Educación. Ed. Trillas. 1982. SUGERENCIA DE ESTUDIO Se recomienda al alumno que lea en primera instancia el libro de Brown, por ser el más sencillo y comprensible dt} la bibliografía, extrayendo de esta lectura todos los aspectos prácticos en cuanto a los pásos que se deben dar al construir un instrumento de medida. Posteriormente deberá leer el libro de Adkins ya que este presenta un panorama muy completo en cuanto a reacción de reactivos se refiere. Por ultimo el libro de Thorndkike en el que podría observar de una manera más amplia parte del contenido de esta unidad, ya que lo que se refiere a calificaciones tendrá que leer el libro de Lyman, pues este reúne de forma muy abreviada lo referente a calificaciones. EXAMEN DE AUTOEV ALUACION l. a) b) e) d)

Cuando se planea desarrollar una prueba es importante considerar: La jerarquización de los programas o posiciones de entrenamiento Las decisiones de orientación El grupo al cual se aplicará La identificación de los servicios y la protección proporcionada

2. a) b) e) d)

El desarrollo de una prueba es un proceso complejo que requiere de: Muchas decisiones Grandes investigaciones Estricta redacción Múltiples ideas


1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1

3. Al planear una prueba se debe considerar de mayor prioridad entre otras cosas: a) b) e) d)

Las decisiones que se van a tomar de los resultados La dificultad que deben tener los reactivos El tiempo en el cual se va a aplicar la prueba El formato que va a tener la prueba ·

4. El primer pasa en la medición es: a) b) e) d)

medir el objeto cuantificar el atributo del objeto definir la variable a cuantificar tener un parámetro

5. Los tipos de calificaciones son: a) b) e) d)

comparación de un estándar absoluto, interindividual comparación interindividual, con un estándar absoluto e itraindividual comparación individual, interindividual e intraindividual letras, porcentajes y rangos


1 1

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO FACULTAD DE PSICOLOGIA

1 1 1 1 1

1 1 1 1 1 1 1 1 1

1 1

DIVISION DE UNIVERSIDAD ABIERTA TEORIA DE LA MEDIDA

UNIDAD TRES

CONFIABILIDAD DE LOS TESTS

OBJETIVO GENERAL. El estudiante definirá el termino confiabilidad, analizará los diferentes aspectos de la misma en una prueba y determinará el índice de esta al elaborar un instrumento psicológico. OBJETIVO ESPECIFICOS El estudiante: 3.1 Definirá el concepto de confiabilidad 3.2 Describirá los diferentes aspectos de la contabilidad de un test 3.3 Describirá los diferentes métodos para obtener los distintos índices de confiabilidad 3.4 Describirá el tipo de error que afecta la confiabilidad de la prueba 3.5 Describirá de que manera se ve afectada la confiabilidad de la prueba al incrementar el

BIBLIOGRAFIA BASICA l. Magnusson D. Teoría de los tests. Ed. Trillas. 1971. Caps. 5,9 BF39 M33

BIBLIOGRAFIA COMPLEMENTARIA l. Brown F. Principios de hi medición en Psicología y Educación. Ed. El Manual Moderno. Cap. 3,4.


-1

1

1 1

1 1 1 1 1

1 1 1 1 1

1 1 1 1 1

EXAMEN DE AUTOEV ALUACION l. Cuando nos referimos a la consistencia o precisión de la medición en una prueba estamos hablando de: a) confiabilidad b) correlación e) validez d) error de medida 2. El método estadístico por el cual obtenemos la equivalencia es: a) pruebas paralelas b) Kuder-Richardson e) Pares-impares d) test-retest

3. Los aspectos de la confiabilidad son: a) cinco b) cuatro e) tres d) dos 4. Para estimar la confiabilidad de una prueba en la cual todos los reactivos tiene el mismo peso utilizamos el método: a) pruebas paralelas b) pares y nones e) Kuder-Richardson d) mitades 5. Tienen el mismo contenido pero cambian en su aspecto formal las pruebas: a) de contenido b) paralelas e) de heterogeneidad d) iguales 6. El coeficiente de correlación aplicado a la confiabilidad también es llamado: a) difusión de los valores obtenidos b) ·Conocimiento de la confiabilidad e) coeficiente de confiabilidad d) expresión de la confiabilidad


{

1

1 1 1

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO

1 1

UNIDAD CUATRO

FACULTAD DE PSICOLOGIA DIVISION DE UNIVERSIDAD ABIERTA TEORIA DE LA MEDIDA

EL ERROR EN LA MEDICION

1 1 1

1 1 1

1 1

OBJETIVO GENERAL El estudiante definirá lo que es error de medición en psicología, diferenciará entre los tipos de error atribuibles a un test y enunciará los medio de control de los mismos calculando e interpretando el error de un test dado.

OBJETIVOS ESPECIFICOS El estudiante: 4.1 Definirá lo que es error en medición 4.2 Definirá los diversos tipos de error constante ó estándar y variable 4.3 Explicará la diferencia entre error constante ó estándar y variable 4.4 Calculará el error estándar de un conjunto de mediciones 4.5 Interpretará el significado del valor obtenido del error estándar 4.6 Describirá la formas de control de los diferentes tipos de error

1 1 1 1

BIBLIOGRAFIA BASICA l. Tenorio R. Raul. El error de medición en Psicología. (mecanograma) 1996. Facultad de Psicología. División de Universidad Abierta.


1

1 1

1 1 1

1

1 1 1 1

1 1

1 1

1 1 1

BIBLIOGRAFIA COMPLEMENTARIA l. Magnusson D. Teoría de los Test. Ed. Trillas. 1971. Caps. 6 y 8

SUGERENCIAS DE ESTUDIO Se recomienda al alumno leer la bibliografía básica, ya que esta da un panorama muy amplio de lo que es el error de medición en psicología, describiendo de una manera muy clara las diferencias entre los tipos de error y también los métodos de control de los mismos, recordando que este tema didácticamente queda como una unidad pero en la realidad hay una relación muy intima entre confiabilidad error y validez, al analizar un test. Si después de esto el alumno tiene dudas leer la bibliografía complementaria EXAMEN DE AUTOEV ALUACION l. Cuando existe variabilidad en la medición hablamos de: a) b) e) d)

poca confiabilidad Poca validez Error de medición Mucha dificultad de los reactivos

2. El puntaje error puede definirse como: a) b) e) d)

La suma de puntajes La división del puntaje observado entre el verdadero La diferencia de los puntajes observado y verdadero La suma de los puntajes de las pruebas A y A

3. A mayor amplitud del error estándar corresponde: a) b) e) d)

Mayor validez Mayor confiabilidad Menor confiabilidad Menor calificación

4. La media de los puntajes error es igual a cero por que: a) b) e) d)

Los errores al azar se cancelan entre si La probabilidad de que los errores disminuyen en cada test baja Son independientes de los puntajes observados No aparecen errores


.LJ i

1

1 1 1 1 1 1 1

1 1 1 1 1 1 1 1

1 1

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO FACULTAD DE PSICOLOGIA DIVISION DE UNIVERSIDAD ABIERTA TEORIA DE LA MEDIDA

UNIDAD CINCO

VALIDEZ DE LOS TESTS

OBJETIVO GENERAL El estudiante definirá el concepto validez, describirá los diferentes tipos de validez de los tests, describirá los procedimientos estadísticos para calcular los diferentes índices de validez.

OBJETIVOS ESPECIFICOS El estudiante: 5.1 Definirá el concepto de validez 5.2 Explicará la validez de contenido 5.3 Explicará el procedimiento para obtener el índice de validez de contenido 5.4 Describirá los instrumentos en los que se puede observar de manera más clara la validez de contenido. 5.5 Explicará la validez concurrente 5.6 Explicará el procedimiento para obtener el índice de validez 5.7 Describirá los instrumentos en los que se puede observar de manera más clara la validez concurrente. 5. 8 Explicará la validez predictiva 5.9 Explicará el procedimiento para obtener el índice de validez predictiva


1 1

1 1

1 1

1 1

1 1 1

1 1 1 1 1 1

1

Describirá los instrumentos en los que se puede observar de manera más clara la validez predictiva. Explicará la validez hipotética o de construcción Explicará el procedimiento para obtener el índice de validez hipotética o de Construcción. Describirá los instrumentos en los que se puede observar de manera más clara la validez hipotética o de construcción.

5.10

5.11 5.12

5.13

BIBLIOGRAFIA BASICA l. Magnusson D. Teoría de los Tests. Ed. Trillas. 1971. Cap. 10 BF39 M33

BIBLIOGRAFIA COMPLEMENTARIA l. Brown F. Principios de la Medición en Ps.ifología y Educación. Ed. El Manual Moemo. 1980. Cap. 7,8. ~

L---\9 \\3\ 0f5)..

SUGERENCIAS DE ESTUDIO Se recomienda al alumno primero entender el concepto de validez, una vez logrado esto, entender los diferentes tipos de validez, en cada uno de ellos describir como se logra y en que tipo de instrumentos se puede apreciar mejor la. validez e que se trate. Hay que tener mucho cuidado con la clasificación que se tome, pues los textos lo hace de diferente forma: unos hablan de cuatro tipos como los que se enuncian en esta guia y otros engloban a la concurrente y a la predictiva en un solo y la llaman de criterio, considerando entonces solo tres tipos. Atendiendo a lo anterior sugerimos leer primero el cap. 1O del Magnusson, donde se describen de forma bastante clara los tipos de validez. EXAMEN DE AUTOEV ALUACION l. a) b) e) d)

Cuando nuestro instrumento mide lo que pretende medir, hablamos de: Confiabilidad Objetividad Validez Sensibilidad

2. En una prueba de diagnostico clínico la validez que debemos obtener es la: a) b) e) d)

De contenido Predictiva De construcción Concurrente


1 1 1 1

3. La validez que tendremos que probar para una prueba que esta midiendo agresividad, es la: a) b) e) d)

De contenido De construcci贸n Concurrente Criterio

1

4. La variable que nos va a permitir conocer el indice de validez de un instrumento, se llama:

1 1

a) b) e) d)

Dependiente Discriminatoria Criterio Independiente

5. La validez de contenido se puede observar m谩s claramente en las pruebas

1

1 1 1

1 1 1

1 1 1 1

a) b) e) d)

Personalidad Rendimiento Aptitud Intereses


1

1 1

UNIVERSIDAD NACIONAL AUTONOMA DE MEXICO

1

EL ERROR DE MEDICIÓN EN PSICOLOGÍA

1 1

1 1

1 1 1

1 1

1 1 1

1 1

FACULTAD DE PSICOLOGIA DIVISIÓN DE UNIVERSIPAD ABIERTA

Elaborado por Lic. Raúl Tenorio Ramírez

Podemos partir de la suposición de que en cualquier medición que realice el hombre, se encuentra alguna cantidad de error involucrado, aunque los instrumentos de medición sean muy precisos, como en el caso de los utilizados en las ciencias exactas y con mucho mayor razón en los casos de los instrumentos de medición de las ciencias sociales o conductuales, como es precisamente el caso de la psicología. El error de medición puede ser de dos tipos: sistemático y aleatorio. El error sistemático es aquel que se comete cuando el instrumento de medición arroja datos que sub o sobreestiman la cantidad real del atributo poseído· por los sujetos o eventos que se están midiendo. Si este es el caso y las mediciones del atributo en cuestión se realizan con el mismo instrumentos, el problema no es tan grave ya que el error es constante y todos los eventos u objetos medidos lo tienen en la misma cantidad; en este caso se pueden obtener aún diferencias entre los eventos o personas. Estos sucedería por ejemplo, en el caso de que tuviéramos una cinta métrica que por algún extraño factor se hubiera alargado y en vez de tener metros de 1OOcm. Tuviéramos un metro de 103 cm. En este caso estaríamos obteniendo medidas de por ejemplo tela, que siempre estarían por debajo de la longitud real de la tela; pero sise midiera la tela siempre con el mismo metro (el alargado de 103 cm), las diferencias encontradas entre los diversos pedazos de tela se mantendrían y se podrían distinguir. Pero ¡que sucedería, si por algún factor desconocido, este metro algunos días fuera más chico y otros más grande y siempre fuera el aumento o disminución de un día a otro? En este caso estaríamos realizando errores aleatorios de medición. El error aleatorio sería entonces el hecho de que algunas veces se sobreestimaran las cantidades de atributo poseídas por el evento u objeto, otras se sobreestimaran, y lo peor de todo que estas sub o sobreestimaciones nunca fueran iguales; más aú, que nosotros no pudiéramos saber si estábamos sub o sobreestimando y mucho menos en cuanto. Es decir, que nuestro error de medición sería al azar; algunas veces por encima, otras por debajo de la cantidad real y nunca en la misma cuantía. Esto es lo que sucede por lo general con los instrumentos de medición que se utilizan en las ciencias sociales. Esto es lo que sucede por lo general con los instrumentos de medición que se utilizan e las ciencias sociales si las diferentas reportada por el instrumento en cuanto a la cantidad del atributo poseído por el evento o sujeto fueran reales, ya que quien pude estar seguro que al día siguiente nuestro instrumento se alargará o encogieran y en cuanto, lo que produciría que la repetición de las mediciones arrojara resultados diferentes a los obtenidos la primera vez. Y como el error es al azar, sería muy difícil determinar de que tamaño es y acalla donde: arriba o abajo. Por


!'f

1 1 1 1 1 1 1 1 1 1 1

1 1

otro lado, aunque pudiera concebirse un método empírico para determinar este tipo de error y su cuantía, el método empírico requeriría, por ejemplo, que repitieran las mediciones de los mismos sujetos o eventos un número de veces; que se sacara un promedio de los resultad arrojados por el instrumento a lo largo de ese n números de veces y aspa podríamos pensar en tener una aproximación a la cantidad real de atributo poseído por los sujetos. Pero, imagínese el repetir una prueba de inteligencia n numero de veces al mismo sujeto, por ejemplo, con el objeto de tener una aproximación más exacta de que tan inteligente es. Existirían varios factores que se tendrían que tomar en cuenta: entre los principales estaría el factor aprendizaje (o recordación) que el sujeto fuera adquiriendo con las sucesivas aplicaciones del mismo instrumentos, entre otros; la fatiga sería otro. Debido a esto, aunque los errores aleatorios nunca se pueden eliminar, se hacen esfuerzos para reducirlos hasta donde sea posible. Podemos decir que el instrumento de medición es confiable, o más confiable entre menor sea el error de medición. Ahora bien podemos decir que la confiabilidad de un instrumento de medición es el grado hasta el cual las medidas sean repetibles; es decir un mismo individuo al que se le aplican diferentes instrumentos que miden el mismo atributo arroja calificaciones semejantes, o el mismo instrumento aplicado en diferentes ocasiones arroja las mismas o por lo menos semejantes puntuaciones o calificaciones (cantidades de atributo poseídas por el sujeto). Con esto no queremos decir que una alta confiabilidad en el instrumento pone límites a la cantidad de validez que tenga el mismo. En 1904, Charles Spearman estableció los fundamentos de este modelo. Este es uno de los más importantes en psicología y la medición que. se haga en ella, sin embargo debemos recordar que el error de medición no hace tanto daño a la mayoría de la sin investigaciones como se quisiera suponer; que existen otros tópicos que se refieren a la medición en psicología que son más importantes Pero, este modelo matemático es uno de los más manejables en psicología; la teoría se pude derivar partiendo de solo unas cuantas suposiciones acerca de la naturaleza de los datos; las mismas formulas pueden derivarse de diferentes conjuntos de suposiciones. Todo esto hace que se tenga mucho interés en conocer el modelo. Se supone que cada persona tiene una "calificación verdadera", la que obtendría si no hubiesen errores de medición; pero sabemos que si los hay. Si aplicáramos el instrumento de medición al sujeto en diversas ocasiones, las medidas obtenidas producirían diferentes calificaciones, que variarían al azar, y las podríamos representar en la siguientes figura: (figura 1)

1 1 1 1

1

Entre mas alta sea la dispersión de las calificaciones alrededor de la calificación verdadera (el promedio de las calificaciones obtenidas en las diversas ocasiones), más error tiene el instrumento de medición. La desviación estándar de la distribución de calificaciones para cada persona sería un índice de la cantidad de error poseído por el instrumento de medicíón. La desviación estándar típica se llama error estándar de medición, y es un índice de la cantidad de error involucrado en el instrumento.


1 1 1 1 1 1

1 1 1 1 1

1 1 1 1 1 1 1

Supongamos el procedimiento convencional de aplicar una prueba en el sentido de que se le presentan al sujeto un número de reactivos que tiene que contestar. Cada respuesta se califica como buena o mala. La simple suma o la suma pesada de las respuestas correctas es tomada como la calificación en la prueba. Suponemos que la calificación numérica está basada en contar uno o más puntos por cada respuesta correcta y cero puntos por cada respuesta incorrecta. Lo que trataremos de determinar es la exactitud de la calificación.

l. Suposiciones Básicas del Modelo a) Xi = calificación observada (obtenida) de la persona i en la prueba que estamos considerando: Ti = calificación verdadera de la persona i en la prueba; Ei = componente de error para la misma persona b) La calificación observada (X) tiene dos componentes: T que representa la habilidad o atributo real poseído por la persona; una cantidad relativamente estable de prueba a prueba siempre y cuando las pruebas midan lo mismo; E el componente de error; que se puede deber a: a) Factores que pueden hacer que una persona conteste en forma correcta un reactivo que no conoce; b) Factores que hacen que conteste en forma incorrecta a un reactivo que si conoce. e) Xi = Ti + Ei o Ei = Xi - Ti Esta suposición establece la relación entre la calificación de error y la verdadera; es la ecuación que define lo que queremos decir con error; si aceptamos el concepto de que existe una calificación verdadera que es diferente de la observada, podemos decir que la diferencia entre estas dos será el error. · Determinación de las características de las calificaciones verdaderas y de error a) Hasta ahora tenemos una ecuación con dos incognitas (T) y €, que no se puede resolver para determinar los valores T y E para la persona; si aplicáramos la prueba a más personas seguiríamos igual, pero: b) Si tuviéramos las medidas de muchas personas, tendríamos tres distribuciones de frecuencia: una distribución de X, una distribución de T y una distribución de E. e) Existen dos aproximaciones equivalentes al problema de la determinación de las características de estas distribuciones: l. Se da una definición de calificación de error y se considera que T es simplemente la diferencia entre X y E. 2. Se define la calificación verdadera (T) y dejamos que la diferencia entre la X y la T se llame error.


.,}_¡ 1

1

1

Definiciones de errores al azar a) Existen, como ya dijimos antes, dos tipos de errores: errores al azar y errores sistemáticos o constantes. Si las medidas son consistentemente mayores o menores de lo que deben ser, tenemos el error constante. Si existen discrepancias en las mediciones, algunas veces grandes, otras pequeñas, algunas veces positivas y otras negativas, tenemos el error al azar. b) La teoría de las pruebas se refiere a la definición y estimación de los errores al azar. e) Como son errores al azar, es fácil suponer que a lo largo d un número suficientemente grande de casos el error promedio de este tipo será cero, ya que al sumarlos se anularían unos a otros.

1 1 1

1 1 1 1

E=O Y entre mayor sea el número de casos de la distribución, más cerca de la verdad estará la suposición. Por lo tanto, podeos definir a los errores al azar como aquellos que tienen un promedio de cero a lo largo de un gran número de casos. d) A medida que el número de casos aumenta, la correlación entre las calificaciones verdaderas y las de error se acerca a cero, ya que las calificaciones de error varían al azar y las verdaderas permanecen relativamente estables.

R=O

1 1

ET

1

La correlación entre dos conjuntos de errores al azar (cada uno de ellos varía al azar) es de cero o se acerca a cero a medida que el número de casos aumenta.

1 1 1

1 1 1

Esto también será más cierto entre mayor sea el número de casos. e) La correlación entre los errores de una prueba y su forma paralela o equivalente es:

2. Modelo Dominio - Muestra El modelo más útil para la discusión del error de medición es el que considera a cualquier medida particular, como compuesta por una muestra al azar de reactivos de una población o dominio hipotético de reactivos referentes a un atributo dado Por supuesto que de hecho esto no es cierto, ya que los reactivos que componen una prueba, casi nunca se muestrean al azar, sino más bien son construidos ex profeso para la prueba, sin embargo, este modelo lleva a predicciones bastante exactas en la práctica. El propósito de cualquier instrumento de medición particular es el de calcular la calificación o medida que se obtendría si se emplearan todo los reactivos del dominio. La calificación que cualquier sujeto obtuviera si le fueran aplicados todos los reactivos del dominio. La calificación verdadera. En la medida en que cualquier muestra de reactivos (prueba) correlacione con las calificaciones verdaderas, será la confiabilidad de la muestra (prueba).


2

1 1

1 1 1 "1

1 ~1

1 1 1 1 1 1 1 1 1 1

En este modelo, el número de reactivos de una prueba no tiene que estar determinado, puede ser abierto, de falso-verdadero, de opción múltiple, etc. Supongamos que partimos de una matriz infinitamente grande de correlaciones que presenta todas las intercorrelaciones entre los reactivos de un dominio. La correlación promedio (rij) de la matriz, indicaría el grado hasta el cual existe algo en común entre los reactivos del dominio. La dispersión de las correlaciones alrededor del promedio de correlaciones (rij) indicaría el grado hasta el cual los reactivos varían en la posesión de ese algo (supuestamente el atributo que deseamos medir) en común. Si suponemos que todos los reactivos tiene igual cantidad de eso en común, la correlación promedio de cada columna de la matriz hipotética sería la misma, y estas serían iguales a la correlación promedio de la matriz total. Es decir, si la correlación promedio de cada reactivo contra todos los demás fuera la misma para todos ellos, estas correlaciones serían igual a la correlación promedio total de la matriz. Aclaremos y recordemos, que la suposición no dice que todas las correlaciones o el promedio de las mismas, de cada reactivo contra todos los demas es la misma para todos los reactivos. Por lo general, los instrumentos de medición esta compuesto por un gran número de reactivos. El modelo se puede extender para aplicarse a pruebas en lugar de reactivos únicos. La matriz infinitamente grande de intercorrelaciones entre reactivos, pude pensarse que está dividida en grupos, cada uno conteniendo n reactivos. La suma de calificaciones en un grupo de reactivos constituiría una prueba. Si los reactivos estuvieran muestreados al azar para componerlas pruebas tenderían a ser las mismas iguales. Estas correlaciones de reactivos muestreados al azar se dice que constituyen pruebas paralelas al zar, ya que sus medias, desviaciones estándar y correlaciones con las calificaciones verdaderas difieren solo por azar.

2


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.