Sara Alemรกn HPS-093-00446 Docente: Albin Fumero
1
CONTENIDO
Fundamentos teóricos de la medición. La medición en Psicología. Niveles de medición. Escalas de medición. El estudio de la conducta desde el punto de vista psicométrico. Concepto de confiabilidad. Tipos de métodos de cálculo de la confiabilidad. Concepto de validez. Métodos de cálculo de la validez. Diferencia entre los métodos de cálculo de la validez y la confiabilidad.
2
Fundamentos teóricos de la medición La necesidad de medir es evidente en la mayoría de las actividades técnicas o científicas. Sin embargo, no interesa sólo contar con medidas sino también saber si dichas medidas son válidas. Para ello debemos recordar la definición de medición como el "proceso por el cual se asignan números o símbolos a atributos de entidades del mundo real de tal forma que los describa de acuerdo con reglas claramente definidas" [Fenton y Pfleeger, 1997,]
Los Test
tienen una influencia importante en la
vida y la carrera de ciudadanos de varios países en todo el mundo, se utilizan con propósito de evaluación, diagnostico, selección, ubicación y promoción. Como primer antecedente se puede mencionar
a
Platón
y
quienes
escribieron
Aristóteles sobre
las
diferencias individuales hace casi 2500 años y los precedieron los antiguos chinos. En el siglo XVI crecía la idea de que las personas eran únicas y estaban
capacitadas
para
hacer
valorar sus dotes naturales y mejorar 3
su destino, es por eso que el Renacimiento se considera como el restablecimiento del individualismo. Posteriormente los psicólogos experimentales alemanes demostraron que los fenómenos psicológicos se podían expresar en términos cuantitativos y racionales, por lo que las investigaciones por parte de psiquiatras y psicólogos franceses sobre los trastornos mentales influyeron en el desarrollo de las pruebas y técnicas de evaluación psicológica y así el concepto de edad mental se introdujo como forma de cuantificar el desempeño general de as persona que presenta la prueba. Entre algunos pioneros de la evaluación y los test psicológicos se encuentran Charles Spearman con su teoría de los test, Edward Thorndike en los test de capacidad, Lewis Terman en los test de inteligencia, Robert Woodworth y Hermann Rorschach en los test de personalidad y Edward Strong en la medición de los intereses; permitiendo el mejoramiento en la metodología estadística y los avances tecnológicos en la preparación y calificación de los test, así como el análisis de los resultados. Las raíces de las pruebas y la evaluación psicológica contemporánea puede encontrarse en Francia a principios del siglo XX: En 1905 Alfred Binet y un colega habían publicado una prueba que fue diseñada para ayudar a colocar a los niños parisienses en edad escolar en clases apropiadas. Esta prueba fue fundamental en el campo de la medición psicológica. Durante la 1º y 2º guerra mundial necesitaron pruebas para seleccionar reclutas en base a parámetros intelectuales y emocionales. La dependencia del gobierno a las pruebas psicológicas sirvió como un impulso al área. El apogeo de las pruebas psicológicas se dio en la década de 1950 y 4
principios de la de En muchas instituciones de salud mental, tanto públicas como privadas, a los pacientes se les administraba grupos de pruebas que por lo común incluían una de inteligencia, una de personalidad y una para examinar posibles daños neurológicos. En las escuelas se amplió la función de varias pruebas psicológicas y educativas para colocar a los alumnos y tomar otras decisiones. Luego empezaron los cuestionamientos sobre cuán determinante debía ser una prueba en la toma de una decisión. Más allá de ser un simple instrumento de medición, la prueba psicológica fue conceptualizada por muchos como una herramienta de un examinador muy capacitado. El valor de una prueba particular fue vinculado de manera íntima e irrevocable con la experiencia del usuario de esta prueba.
ADMINISTRACIÓN, VALORACIÓN E INTERPRETACIÓN DE INSTRUMENTOS EN PSICOLOGÍA Existen diversos tipos de test psicológicos entre los que se encuentran:
Estandarizado: tiene
instrucciones
fijas para la
aplicación y la
calificación, está diseñado por expertos y se aplica a un grupo representativo 5
de la población para quienes está dirigido. No estandarizado: están diseñados de manera informal por personas no especializadas. Individual: se aplica a una persona a la vez. Grupal: se puede aplicar de manera simultánea a varias personas. De velocidad: consiste en varios conceptos sencillos, pero los límites de tiempo son muy estrictos. Objetivo: tiene estándares de calificación fijos y precisos, por lo tanto, puede ser calificado por cualquier persona. De ejecución: requiere que quienes lo presenten manipulen objetos. Cognoscitivos: tratan de cuantificar los procesos y productos de la actividad mental. De logro: evalúa el conocimiento de alguna materia académica u ocupación. De aptitud: centra la atención en el comportamiento futuro, es decir, lo que la persona es capaz de aprender con una capacitación adecuada. Afectivos: evalúan los intereses, actitudes, valores, motivos, rasgos del temperamento y otras características de la personalidad Todos los test tienen como objetivo evaluar el entorno psicológico, los movimientos sociales y otros eventos psicosociales. La administración se realiza según el tipo de test del que se trate: 6
Tests verbales: Su administración son una serie de preguntas o la presentación de tarjetas estímulo para que el evaluado narre algo. Tests No verbales Gráficos: su aplicación por lo general consiste en solicitarle al evaluado que dibuje algo en una hoja en blanco. De ejecución: Se le solicita al evaluado la realización de una serie de procedimientos con el material que se le entregue (ej. Armar rompecabezas) La corrección y análisis se realiza de acuerdo a si son tests proyectivos o psicométricos: Tests proyectivos: Su corrección requiere de alto criterio y conocimiento clínico por parte del evaluador, puesto que cada protocolo del evaluado es único e irrepetible. Su análisis se hace de acuerdo a la escuela clínica que el evaluador elija. Tests psicométricos: Su corrección requiere mucha precisión, puesto que
los
resultados
serán
comparados
con
índices
cuantitativos
estandarizados. Su análisis es también cuantitativo, relacionando los resultados obtenidos con una determinada categoría en la que se ubicará al
7
evaluado.
calificaciones en el criterio de interés 3)
Validez
investigar
psicológicas
las
características
particulares
o
constructos medidos por la prueba De manera tradicional la validez se ha definido como el grado en que una
prueba
mide
lo
que
La validez de contenido se refiere a
está si la prueba produce un rango de respuestas que son representativas
diseñada para medir.
de l
unive rso
de
habilidade s,
Los métodos por los cuales puede entendimiento y otras conductas que determinarse la validez incluyen: 1) supuestamente debe medir la prueba. analizar el contenido de la prueba, 2) calcular
la
correlación
entre
las
Los procedimientos de validación
calificaciones en la prueba y las concurrente se emplean siempre que 8
una prueba se aplica a personas clasificadas
en
varias
La
validez
predictiva
es
la
categorías, precisión con que las puntuaciones de
una
prueba
predicen
puntuaciones de criterio, según lo indica la correlación entre la prueba (predictor)
y
un
criterio
del
desempeño futuro. La validez predictiva es de interés sobre
todo
para
las
pruebas
de
aptitud o de inteligencia, ya que las puntuaciones instrumentos como grupos de diagnóstico clínico o niveles
socioeconómicos,
propósito
de
determinar
con
el
si
las
puntuaciones en la prueba de las personas ubicadas en una categoría son significativamente diferentes de las de los individuos que se hallan en otras categorías.
en
esos a
tipos
de
menudo
se
correlacionan con las puntuaciones, notas de cursos, calificaciones de pruebas de aprovechamiento y otro criterios de desempeño.
Confiabilidad Ningún instrumento psicométrico puede considerarse de valor a menos
Si la calificación promedio varía de que sea una medida consistente o modo sustancial de una categoría a confiable. En consecuencia, una de puede las primeras cosas que será necesario usarse como otra forma, quizá más determinar acerca de una prueba de eficiente de asignar a la gente a esas elaboración reciente es si resulta lo otra,
entonces
categorías.
la
prueba
suficientemente confiable como para medir lo
que
fue
diseñado
para 9
medir. Si
entre en
ausencia
de
cualquier
cambio permanente en una persona
0.00
(falta
absoluta
de
confiabilidad de la medición) y 1.00 (confiabilidad perfecta).
debido al crecimiento, al aprendizaje,
La
confiabilidad
se
estima
a alguna enfermedad o lesión, las analizando los efectos de variaciones puntuaciones en una prueba varían con la ocasión o la situación, es probable que la prueba no sea lo suficientemente confiable como para ser usada en describir y evaluar a la gente y hacer predicciones sobre su conducta En la teoría clásica de los tests se supone que la calificación observada de una persona en una prueba está compuesta por una puntuación real más algún error no sistemático de medición. La
en
puntuación
real
de
una
persona en una prueba particular se define
como
el
puntuaciones
promedio
que
de
obtendría
las si
las
condiciones
de
la
administración y el contenido de la p rue ba
en
las
c a l i fic ac ione s
observadas. Los coeficientes de confiabilidad
presentara la prueba un número de instrumentos afectivos como las infinito de veces. La confiabilidad de las pruebas es un número decimal positivo que va
listas
de
verificación,
cali ficació n
e
escalas
inve nta rios
de de
personalidad, intereses o actitudes, por lo general son más bajos que los 10
ESCALAS DE MEDICIÓN EN PSICOLOGÍA
Medir es utilizar los procedimientos matemáticos para asignar números e identificar atributos físicos y psicológicos que permitan poner en claro las diferencias individuales.
de las pruebas cognitivas de aprovechamiento, inteligencia o habilidades especiales.
Una escala de medida permite al investigador determinar el tipo de análisis estadísticos que deberá utilizar para examinar una prueba y así poder considerarla prueba como buena. TIPOS DE ESCALAS
11
Escala nominal: Informan igualdad o desigualdad en una característica, es decir, se utiliza en todas aquellas modalidades o características en las que la única comprobación empírica que puede hacerse es la de igualdad o desigualdad. Supongamos que se dispone de un conjunto de n elementos (o1, o2, ., on) con una determinada característica que adopta k modalidades diferentes. A la modalidad de un objeto genérico oI, la representamos por m(oi), y al número que asignamos a dicha modalidad lo representamos por n(oi). La regla de asignación de números a los objetos, de modo que se preserven las relaciones empíricas observadas entre estos debe cumplir las siguientes condiciones: Si n(oi) = n(oj), entonces m(oI) = m(oj) Si n(oi) ¹ n(oj), entonces m(oI) ¹ m(oj) La transformación admsible es: cualquiera que preserve las relaciones de igualdad-desigualdad
de
los
objetos
respecto
a
una
determinada
característica. Escala ordinal: Permiten establecer relaciones de “mayor que” o “menor que”, pero no la magnitud de la diferencia, es decir, los objetos pueden manifestar determinada característica en mayor grado unos que otros. Ej. La dureza de los minerales. Supongamos que se dispone de un conjunto de n objetos (o1, o2, ., on) y cada uno posee una cierta magnitud de una determinada característica [m (o1), m(o2), ., m(on)].
12
La escala para asignar números a los objetos [n(o1), n(o2), ., n(on)],de modo que reflejen esos diferentes grados en que los objetos presenten la característica, ha de cumplir las siguientes condiciones: Si n(oi) = n(oj), entonces m(oi) = m(oj)
Si n(oi) > n(oj), entonces m(oi) > m(oj) Si n(oi) < n(oj), entonces m(oi) < m(oj) Transformación admisible: cualquier transformación es válida siempre que preserve el orden de magnitud, creciente o decreciente, en que los objetos presentan determinada característica. Escala de intervalo: Cuenta con una unidad de medida, permite establecer la magnitud de las diferencias, como Ej. Termómetro, calendario. Presumamos que los valores asignados a los objetos sean una representación numérica correcta de sus relaciones empíricas. Para todo cuarteto de objetos genéricos, oI, oj, ok, ol, los valores asignados n(oi), n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones: 13
Si n(oi) - n(oj) = n(ok) - n(ol), entonces m(oi) - m(oj) = m(ok) - m(ol). Si n(oi) - n(oj) > n(ok) - n(ol), entonces m(oi) - m(oj) > m(ok) - m(ol). Si n(oi) - n(oj) < n(ok) - n(ol), entonces m(oi) - m(oj) < m(ok) - m(ol). Las transformaciones admisibles deben seguir una condición del tipo: t[n(oi)] = a + b . n(oi), siempre que b > 0. Es decir, una trasformación lineal tal de los valores iniciales de una escala de intervalo deja la escala invariante respecto a las condiciones estipuladas en el párrafo anterior. Este tipo de transformación supone un cambio en los dos aspectos que caracterizan la escala de intervalo. Por un lado, el valor a, como constante aditiva, provoca un cambio en el origen. Por otro lado, el factor b provoca un cambio en la unidad de medida que se toma para construir la escala (sólo cuando b = 1 la unidad de medida no se altera). Escala de razón: Además de la unidad de medida contempla el valor cero como ausencia de la característica (igualdad de razones), es decir sirven para medir características en las que el valor cero no significa ausencia de 14
dicha característica. Los valores en una escala de razón tienen un valor absoluto, no arbitrario, o valor cero absoluto que sí significa ausencia de característica. Para todo cuarteto de objetos genéricos, oi, oj, ok, ol, los valores asignados n(oi), n(oj), n(ok), n(ol), a las magnitudes con que dichos objetos poseen una determinada característica m(oi), m(oj), m(ok), m(ol), deben cumplir las siguientes condiciones: Si n(oi)/n(oj) = n(ok)/n(ol), entonces m(oi)/m(oj) = m(ok)/m(ol). Si n(oi)/n(oj) > n(ok)/n(ol), entonces m(oi)/m(oj) > m(ok)/m(ol). Si n(oi)/n(oj) < n(ok)/n(ol), entonces m(oi)/m(oj) < m(ok)/m(ol). Al tener un origen de escala absoluto,
la
única
transformación admisible para la escala de razón es del tipo: t[n (oi)] = a . n(oI), siendo a > 0.
Hay que reconocer que el uso de pruebas es una práctica común de muchos psicólogos, aunque a veces se produce el uso y abuso
15
Uso
y Abuso
Por un lado se administran pruebas que no han sido elaboradas para nuestro medio y cuyas poblaciones de referencia son muy diferentes de las nuestras y por otro lado, se interpretan inadecuadamente los resultados, llegando a sesgarlos, muchas veces, en un sentido negativo. Cuando un psicólogo administra pruebas, lo importante y central es qué instrumentos utiliza y qué uso le da a los resultados. En este sentido, se deben elegir instrumentos apropiados para la población con la cual se trabaja y los resultados no deben limitarse a puntajes numéricos y puntuales. El uso de las pruebas forma parte de la Evaluación Psicológica que un proceso más amplio, por el cual se busca comprender al individuo en su Ecologfa Presente (Salvia y Ysseldike, 1978). Se trata de un proceso multifacético que va más allá de la mera administración. El desempeño de un individuo en una prueba no sólo depende de la tarea en sí, sino también de su historia y características individuales y del medio en el cual se desenvuelve. Asimismo no basta con sólo considerar la manera en que se ejecutan una variedad de tareas, sino el significado de sus resultados en términos del funcionamiento global del individuo y brindar explicaciones coherentes y consistentes para sus desempeños. Por lo general la información recogida tiene como 16
objetivo tomar una acción determinada o una decisión con relación al sujeto o sujetos evaluados. Puede
tratarse
de: despistaje, ubicación, planificación
de
programas, evaluación de programas o evaluación de progreso individual. Debemos, por lo tanto, encaminar nuestros esfuerzos para darles un uso dinámico y activo a las pruebas que permita tomar acciones coherentes y positivas. Dentro de este contexto, hay que
destacar
la
importancia de: El uso de pruebas que
han
sido
p r e v i a m e n t e adaptadas
para
la
población a la cual se le administra. Marín (1986), propone que los
in st r ume nt os
psicológicos
provenientes
de
culturas
diferentes
deben
ser
adaptados, debiendo demostrarse la equivalencia lingüística y métrica del constructo estudiado. Establecer y usar normas para la población con la cual se trabaja. Esto es particularmente importante cuando compararnos los puntajes obtenidos con normas establecidas. En estos casos 17
estarnos asumiendo que la persona evaluada tiene características similares a aquellos sujetos en los que la prueba fue estandarizada. En otras palabras asumirnos que su comparable,
aunque
cultura
no
es
necesariamente
n os ció lgun r a a lu idéntica. de eva saber ra po a a o un ? ari test p s el de s itir s e e o c m n e n u ad ne de ¿Quié va a ult • ¿Es s s El uso d e l o s e e a r ? s c tri izada que iar los l é i r e ar om da am go n f s psic mput nform resultados para o u l a ó li co de e sic onal a a d p d eb n s ez ie e u a per prop a pru valid d llevar a cabo e c n la ¿Pu ológi de las sa u r a u iz c psi eptos Si se arant intervenciones educacionales. • c g ? con arlo le de b lic ap onsa 009) Nuestra experiencia nos ha permitido p s .(2 C re , aja Jib constatar que detrás de muchos puntajes
globales se
esconden logros en los alumnos que éstos no nos
permiten captar. Por lo tanto, llevar a cabo un análisis cualitativo es
sumamente
enriquecedor
para
el
individuo
o
individuos
estudiados.
¿Cómó han evóluciónadó en lós ultimós cuarenta anós lós dós cónceptós basicós de la medición en psicólógía: la validez y la fiabilidad, para que digamós que existe una psicómetría clasica y una nueva psicómetría?
18
T
endencias actuales en la medición de los test psicológicos
Generalmente los modelos formales sobre los que se basan la construcción de los tests son de naturaleza matemático-estadística. El primer modelo de
puntuación observada, a través del cual se
intentó tratar el problema de la incertidumbre o error inherente a cualquiera de las medidas realizadas mediante la aplicación de un test, fue el presentado por Spearman en 1904, donde planteó el clásico “Modelo Lineal de Puntuaciones”. La teoría basada en el modelo de Spearman, fue denominada también “Teoría Clásica de las de las Puntuaciones Verdaderas” o “Teoría Clásica de los Tests”. Las hipótesis básicas de la denominada teoría clásica de las puntuaciones verdaderas son las de un modelo aditivo lineal, donde la variable endógena o dependiente es la que corresponde a la puntuación observada en las pruebas, es la variable explicada que viene determinada por el fenómeno que el modelo traduce; y la variable exógena o independiente es la correspondiente a las puntuaciones verdaderas de los sujetos.
H
ipótesis 19
Hipótesis Fundamental: Cualquier puntuación observada X es función de dos componentes, que son la puntuación verdadera V del sujeto y el error e. X=V+e En esta relación, X juega el papel de una variable aleatoria sobre una población Π de individuos que toma valores X = xg sobre g personas de una población de tamaño N. La variable V es otra variable aleatoria asociada que toma valores V = vg sobre Π. Hipótesis
de
nulidad
de
los
errores:
Los errores, en
promedio, se anulan. Por lo tanto, en el modelo hay que suponer que la media aritmética de los errores es cero. Esto indica que su esperanza matemática es cero: E (e) = 0 Además de ésta, se pueden hacer considerar otras hipótesis acerca de los errores pues para hacer inferencias se supone además que los errores se distribuyen según una ley normal y que el modelo es homocedástico, es decir, que para cualquier i , j las variancias de los errores son iguales.
3.
No
existe
correlación
entre
las
puntuaciones verdaderas y el error en una misma prueba. 20
4. No existe correlación entre los errores:
5. No existe correlación entre las puntuaciones verdaderas y los errores en formas distintas de un mismo test o en tests diferentes:
De las hipótesis del modelo lineal de Spearman se deducen las siguientes relaciones: a) El valor esperado de la
puntuación verdadera es igual al
valor esperado de la puntuación observada: E(V) = E(X) Es decir, bajo los supuestos del modelo, las medias de las puntuaciones observadas y las verdaderas coinciden. b) La ecuación de regresión de la puntuación observada sobre la
puntuación verdadera es la ecuación de una línea
recta que
pasa por el origen y que tiene pendiente unidad. c) La variancia de las puntuaciones observadas es igual a la suma de la variancia de las puntuaciones verdaderas más la variancia de los errores 21
Esta es una consecuencia inmediata de la hipótesis de no correlación entre la puntuación verdadera y el error. d) El cuadrado del coeficiente de correlación lineal entre las puntuaciones observadas y sus correspondientes puntuaciones verdaderas, es igual a la razón de la variancia de las puntuaciones verdaderas con respecto a la variancia de las observadas
e) De la expresión del coeficiente de determinación, como razón entre variancias, y de
, se deduce otra expresión para
r2XV:
f) El cuadrado de la correlación entre la puntuación observada y el error es igual a la razón de la variancia de los errores con respecto a la variancia de las puntuaciones observadas:
g) Una nueva relación es
la complementariedad a uno del
cuadrado de ambos coeficientes de correlación Un cambio fundamental en los conceptos de puntuación verdadera y de fiabilidad 22
Frente al modelo clásico de Spearman, la teoría de la Generalizabilidad (Generalizability) (G) es una teoría estadística acerca de la dependencia de las medidas del comportamiento, que abandona el sentido correlacional
dado
a la fiabilidad
en
el
contexto clásico. Esta
teoría
a
la
que
Cronbach
dio
el
nombre
de
"generalizability", como una contracción de las palabras generalize y ability, se desarrolla fundamentalmente en los años 50, aunque su exposición detallada aparece recién en 1972. La teoría G no admite el concepto tradicional de que un instrumento o procedimiento de medida es bueno si su coeficiente de fiabilidad es alto, pues las decisiones las basa en los resultados del análisis de las fuentes y tipos de error (Martínez Arias, 1995). El concepto clásico de la fiabilidad de las medidas está basado en el concepto de valor o puntuación verdadera y en la unicidad de esa
puntuación, de manera que considera que cualquier test u
observación posee un único valor verdadero en una familia de tests
El valor en un test u otra medida en la que se basa la decisión es sólo uno de los muchos valores que podrían servir al mismo propósito. Quien toma la decisión no está casi nunca interesado en la respuesta dada a objetos o preguntas estímulo particulares, a un examinador particular, a un momento particular de prueba. Al menos algunas de estas condiciones de medición pueden ser alteradas sin que el valor sea menos aceptable para el que decide....El dato ideal en el cual basar la decisión debe ser algo como el valor medio de la persona a través de todas las observaciones aceptables (p. 15).
23
paralelos. El coeficiente de fiabilidad se interpreta como el valor estimado del cuadrado de la correlación o como la razón de las variancias de los valores verdaderos con respecto a los valores observados. La teoría G considera que esta es una concepción muy limitada de la fiabilidad en tanto implica una única definición de las variancias verdadera y del error, sin tomar en consideración todas las posibles fuentes de error y la naturaleza de su procedencia. Cronbach, Gleser, Nanda y Rajaratnam (1972), establecieron la definición de fiabilidad (dependability) de la siguiente manera:
La fiabilidad, entonces, se refiere al grado de exactitud al generalizar a partir de un valor observado de una persona en un test u otra medida (por ejemplo, observación de conducta, encuesta de opinión) al valor promedio que la persona podría haber recibido bajo todas las posibles condiciones que el examinador estaría deseoso de aceptar. La suposición de actitud,
la habilidad, u
otro
que el
atributo medido
implícita en esta noción de fiabilidad; es
conocimiento, la es estable
está
decir, suponemos que
cualquier diferencia entre los valores obtenidos por un individuo en diferentes ocasiones se debe a una o más fuentes de error, y no a 24
cambios sistemáticos en el individuo debidos a la maduración o el aprendizaje. Un valor único obtenido en una ocasión en una forma particular del
test
con
un
único
examinador,
por
lo
tanto,
no
es
completamente confiable; es decir, es improbable que se asemeje al valor promedio de esta persona a través de todas las ocasiones, formas de test y administradores. El valor obtenido por
una
persona usualmente sería diferente en otras ocasiones, formas de test
o administradores. Cuáles son las fuentes más graves de
inconsistencia o error. La teoría clásica de los tests puede estimar separadamente sólo una
fuente de error por vez (por ejemplo, la
variación en los valores a
través
de las ocasiones puede ser
evaluada con el método test-retest de fiabilidad). La fuerza de la teoría G consiste en que múltiples fuentes de error en una medida pueden estimarse separadamente en un solo análisis. Consecuentemente, de una manera similar a la forma en que la fórmula de profecía de Spearman-Brown es usada para predecir la fiabilidad como una función de la longitud del test, la teoría G posibilita al que decide determinar de
test y administradores
cuántas
ocasiones,
formas
se necesitan para obtener valores
fiables. En el proceso la teoría G provee un coeficiente resumen que refleja el nivel de fiabilidad, un coeficiente de generalizabilidad que 25
es análogo al coeficiente de fiabilidad de la teoría clásica. El concepto de fiabilidad es aplicable tanto a universos simples como complejos a los cuales quien toma
las decisiones puede
querer generalizar. El caso más simple es aquel en el cual el universo
es
definido
por
una
fuente de variación principal
llamada faceta en la teoría G. Desde la perspectiva de la teoría
G, una medida es una
muestra extraída universo
de
un
de
observaciones
admisibles
que quien decide
desea tratar
c
o
m
o
intercambiables
con el fin de
tomar
una
decisión. (La
decisión
debe
ser práctica,
la
selección de
tal
como
los estudiantes con más altos valores para un programa acelerado, o puede ser la base de una conclusión científica tal como el impacto de un programa educativo sobre el logro en ciencia). Un universo de una faceta está definido por una fuente de error de medición, es decir, por una sola faceta. Si el investigador intenta generalizar a partir del conjunto de los ítems de un test a un conjunto mucho más grande de ítems, ITEM 26
es
Ética y medición: postura del psicólogo
una
faceta
de
medición;
el universo
de
ítems
deberá
En términos comunes, la ética es el conjunto de principios que definen lo que es bueno y lo que es malo en la vida humana. Alguien es calificado de "ético" cuando su actividad es consecuente con esos principios y realiza aquello que una determinada sociedad estipula como bueno. Toda profesión, en sentido amplio, supone un saber científico y técnico, tanto en el orden teórico como en el orden práctico. Es decir, toda profesión supone un conocimiento más o menos especializado y unas habilidades vinculadas a ese conocimiento y que permiten actuar el saber. Se trata, por consiguiente, de un saber teórico-práctico. La profesión, además, supone un ejercicio de ese saber a nivel público al interior de una determinada sociedad. La ética profesional es, en un primer momento, aquel conjunto de principios que permite distinguir lo bueno de lo malo en ese quehacer de un saber teórico-práctico en una sociedad, es decir, cuándo ese quehacer es bueno y cuándo es malo. Existen
algunas
concepciones
sobre
la
ética
profesional,
muy
extendidas en nuestro medio, y que, en nuestra opinión, representan dos
enfoques
erróneos
que
acarrean
graves
consecuencias:
la
concepción de la ética como un aditamento postizo y la concepción de la ética como un conjunto de ideales abstractos y universales. 27
PSICOLOGÍA Y MORAL
A
demás de todo lo dicho hasta aquí, un análisis de la praxis psicológica nos muestra que existe otra esfera en la que, en
forma reduplicativa, entran en relación la psicología y la ética : la esfera de lo que podemos llamar "orientación vital". Es bien sabido que el psicoterapeuta ha tomado en nuestra sociedad parte del papel antes encargado al sacerdote, al consejero espiritual o al pedagogo. Esto entraña un doble peligro : a) que la psicología pretenda convertirse en ética y que, por lo mismo, se juzgue que aquello que puede
28
ser técnicamente posible y aun recomendable es también, y por lo mismo, éticamente lo mejor ; b) que se pretenda reducir los problemas de valores a problemas de integración y adaptación psicológica. Las técnicas extremas de lavado cerebral y similares, aun cuando son mucho menos efectivas de lo que se ha hecho creer, muestran cierto campo para la manipulación. Es claro que un terapeuta puede jugar un papel decisivo en la opción de vida que adopte su paciente. Es claro, también, que la psicología se ha plegado a las exigencias más explícitas de la sociedad de consumo (de producción capitalista) en la estimulación y exacerbación de las ambiciones y necesidades por medio de la publicidad. Pero incluso puede haber manipulaciones mucho más sutiles del ámbito vital de las personas, condicionando sus relaciones interpersonales, las condiciones laborales, los ideales en la vida social, etc. Todo ello puede constituir de esta manera una absolutización de la técnica psicológica que significa la anulación de la esfera moral, convertida la ética en psicología y la psicología en tecnocracia al servicio del poder establecido.
29