Revista medir y evaluar no 1

Page 1

ISSN 2539-3677

MEDIR Y EVALUAR

Nยบ

Apoyan Facultad de Ciencias Humanas Direcciรณn de Bienestar Programa Gestiรณn de Proyectos Sede Bogotรก

1




Medir

y

E va l u a r

Volumen 1 / Numero 1 / ISSN 2539-3677 Universidad Nacional de Colombia Facultad de Ciencias Humanas Sede Bogotá

El grupo estudiantil Revista “Medir y Evaluar” nace en el Laboratorio de Psicometría del Departamento de Psicología, con el propósito de fomentar la publicación de artículos de carácter cualitativo, cuantitativo o mixto en

Rector Ignacio Mantilla Prada Vicerrector Jaime Franky Rodríguez

medición y evaluación en psicología y áreas afines, reali-

Director Bienestar Sede Bogotá

zados por estudiantes de pregrado y postgrado adscritos

Oscar Oliveros

a universidades nacionales y extranjeras.

Coordinadora Programa Gestión de Proyectos Elizabeth Moreno Decana de la Facultad de Ciencias Humanas

Contacto MEDIR Y EVALUAR mevalua_fchbog@unal.edu.co /Labpsicometria

Luz Amparo Fajardo Uribe Director Bienestar Ciencias Humanas Eduardo Aguirre Dávila

http://www.humanas.unal.edu.co/psicometria/ Edición Universidad Nacional de Colombia Cra 45 No 26-85 Edificio Uriel Gutiérrez Sede Bogotá www.unal.edu.co

Jazmine Escobar Pérez Ana Cristina Santana Espitia Coordinador William Ricardo Novoa Navarro Comité Editorial Jhon Alejandro Salgado Ortiz Luisa Fernanda Castañeda Ballesteros

Contacto PGP proyectoug_bog@unal.edu.co proyectougbog@gmail.com ugp.unal.edu.co /gestiondeproyectosUN issuu.com/gestiondeproyectos

Juan Daniel Barragán Fuentes Camilo Andrés Bonilla Hernández Ilustración portada María Camila Contreras Corrección de Estilo Diana C. Luque V. Diseño y Diagramación Nicole Angie Calderon Castaneda (PGP)

Los textos presentados en la siguiente

Impresión

publicación expresan la opinión de sus

GRACOM Gráficas Comerciales

respectivos autores y la Universidad Nacional no se compromete directamente con la opinión que estos pueden suscitar.

Derechos de Autor y Licencia de distribución. Atribución – No comercial - Sin Derivar.

3


Editorial

6

A RTÍCU LOS Recuperación de la información en la memoria de corto plazo: lectura

10

silenciosa versus lectura en voz alta Proceso de evaluación psicológica a un niño de quién se sospecha

22

habilidades cognitivas superiores La influencia de francis galton en la consolidación de la psicología como

40

disciplina científica Estudio experimental de la relación

4

MEDIR Y EVALUAR

entre la valencia y el recobro de imágenes en un grupo de

52

estudiantes universitarios E N S AYO S Discusiones actuales sobre el uso de instrumentos de medición psicológica

66

en procesos de evaluación La ética y los números

76

D I DÁCTICA G*power 3: software para el análisis de la potencia estadística S OF TWA R E Programa de análisis cualitativo o QDA (qualitative data analysis) en inglés

96

84


C O N T E N I D O 5


E D I T O R I A L

P

Ana Cristina Santana Espitia y Jazmine Escobar Pérez Editoras

MEDIR Y EVALUAR

6

ublicar es iniciar un diálogo con otros, quienes pueden estar a una gran distancia, o, incluso, en otro tiempo; es plantear una idea y esperar la interlocución del otro; es mostrar lo que se encontró en un estudio y sembrar nuevas preguntas en la comunidad académica. Publicar, también, es estar dispuestos a recibir retroalimentación de esa investigación o postura, para enriquecerla con otras miradas. Publicar es un ejercicio básico en la comunidad científica, así como el espacio fundamental para la divulgación de sus procesos investigativos. Es por esto que la investigación formativa debería culminar con ejercicios de publicación, ya que tanto la investigación como la publicación se aprenden en la práctica. Para ello, es necesario contar con espacios en los que los estudiantes de pregrado y postgrado puedan publicar los trabajos que surgen de sus asignaturas y de sus experiencias investigativas iniciales, las cuales, paulatinamente, configurarán su trayectoria como investigadores. Es un motivo de gran satisfacción presentar a la comunidad académica el primer número de la Revista Medir y Evaluar. Esta publicación, fruto del grupo estudiantil Medir y Evaluar, del Laboratorio de Psicometría de la Universidad Nacional de Colombia, busca dar respuesta a la necesidad presentada en


el párrafo anterior, fomentando la publicación de trabajos e investigaciones en medición y evaluación en psicología y áreas afines, realizados por estudiantes de pregrado y postgrado adscritos a universidades nacionales y extranjeras. La revista, con sus diferentes secciones, representa un espacio para compartir los hallazgos, reflexiones y aprendizajes de los estudiantes en un contexto de investigación formativa. La sección Artículos recoge tanto trabajos teóricos, como estudios empíricos y estudios de caso. La sección de Ensayos tiene como propósito ofrecer un análisis del autor en torno a una situación problemática o coyuntural presente en psicometría, medición o evaluación. La sección de Medición y Tecnología cuenta con escritos que se centran en la descripción de software relacionado con la psicometría y los métodos de investigación. La sección Didáctica se enfoca en el aprendizaje y la enseñanza de conceptos, métodos y procedimientos usados en la investigación, la evaluación psicológica y la psicometría. De esta manera, la revista Medir y Evaluar brinda espacios para diferentes etapas y aspectos del proceso investigativo. Queremos expresar nuestro agradecimiento a los estudiantes de pregrado y postgrado, quienes hacen parte del grupo y han contribuido con el nacimiento de este proyecto estudiantil; además de los miembros de los comités editorial y científico, sin cuya invaluable colaboración esta revista no sería posible. Agradecemos de manera muy especial a la docente Aura Nidia Herrera, directora del Laboratorio de Psicometría y de la revista Avances en Medición, quien nos ha alentado a emprender esta tarea, pues, de hecho, la revista Medir y Evaluar nace como una “hijita” dirigida al ámbito estudiantil de la revista Avances en Medición. Asimismo, agradecemos el apoyo institucional recibido a través de la Dirección de Bienestar – Programa Gestión de Proyectos y la Vicedecanatura de Bienestar Universitario de la Facultad de Ciencias Humanas, quienes también son responsables de este logro. Finalmente, extendemos una cordial invitación a la comunidad universitaria a participar con sus aportes en la medición y evaluación, aspectos que, sin lugar a dudas, enriquecen el desarrollo de la investigación en diferentes áreas.

7


Recuperación de la información en la memoria de corto plazo: lectura silenciosa versus lectura en voz alta

MEDIR Y EVALUAR

8

Proceso de evaluación psicológica a un niño de quién se sospecha habilidades cognitivas superiores

La influencia de francis galton en la consolidación de la psicología como disciplina científica

Estudio experimental de la relación entre la valencia y el recobro de imágenes en un grupo de estudiantes universitarios


A R T Í C U L O S 9


RECUPERACIÓN DE LA INFORMACIÓN EN LA MEMORIA DE CORTO PLAZO: LECTURA SILENCIOSA VERSUS L E C T U R A E N V O Z A LTA Recovering of the short-term memory information: Silent reading vs. loud reading

R esu m en

MEDIR Y EVALUAR

10

El objetivo del presente artículo es presentar los resultados de la investigación cuantitativa, realizada a fin de explorar la efectividad de la lectura en voz alta o mentalmente para el proceso de memoria. Como método se utilizó un muestreo de tipo aleatorio simple en población específica, conformada por 30 estudiantes de la Universidad Nacional de Colombia, correspondientes a su sede en la ciudad de Bogotá-Colombia, repartidos en dos grupos. A estos se les pidió leer en voz alta o mentalmente, intentando memorizar una lista de 15 palabras para identificar cuántas de ellas lograban recordar

tras 30 segundos. Como método de análisis estadístico se utilizó la prueba U de Mann-Whitney. El resultado de este análisis no mostró diferencias significativas al comparar los resultados de ambos grupos, por lo que se llegó a la conclusión de que aunque no se encontraron diferencias, estos resultados podrían servir como piloto para una prueba con mayor muestra.

Palabras clave: memoria a corto plazo, lectura mental, lectura en voz alta, investigación cuantitativa


Santiago Gil Bossa / sgilb@unal.edu.co Laura Ximena Restrepo Aristizabal / lxrestrepoa@unal.edu.co Daniel Santiago Patarroyo Guillen / dspatarroyog@unal.edu.co Estudiantes de PsicologĂ­a Universidad Nacional de Colombia, sede BogotĂĄ

A b stract

The objective of this work is present the results of quantitative research carried out, performed in order to explore the effectiveness of reading aloud or mentally for the memory process. As method was used the sample obtained by sampling simple random type in specific population consisted for 30 students of the National University of Colombia corresponding to their headquarters in BogotĂĄ-Colombia divided in two groups. Those groups were asked to read aloud or mentally, trying to memorize a list of 15 words in order to identify how many of

11

them were able to recall after 30 seconds. As a method of statistical analysis we used the statistical test U Mann-Whitney; the result of this analysis not found significant differences when comparing the results of both groups; so it is concluded that, although no differences were found, these results could serve as a test pilot for a bigger sample.

Keywords: short-term memory, mental reading, reading aloud, quantitative research.


L

a memoria constituye la capacidad de codificar y almacenar información o experiencias vividas; por tanto, es fundamental para el aprendizaje y pensamiento humano; a su vez, existe el proceso de evocación, definido como la capacidad de recuperar información almacenada; este, normalmente, no es fácil pero se puede hacer uso de mnemotécnicas o la relación entre dos campos diferentes de la memoria.

Memoria

MEDIR Y EVALUAR

12

Es la capacidad de retener y recuperar información y experiencias vividas por medio de procesos neurobiológicos; esta capacidad es fundamental para el aprendizaje y pensamiento, y está integrada por tres procesos básicos que son: codificación, proceso inicial para que la información sea almacenada en la memoria donde las experiencias vividas son codificadas en constructos para su posterior almacenamiento; el cual consiste en la creación de registros permanentes o la categorización de la información; este es un proceso relativamente flexible, que presenta cambios a lo largo de la vida; por último, la recuperación, consiste en la evocación del registro o categoría almacenada (Etchepareborda & Abad-Mas, 2005). La información almacenada se ve afectada por la manera en la que fue guardada y por el paso del tiempo. La memoria está dividida en dos grandes tipos: por un lado, la sensorial, donde son almacenados recuerdos o experiencias que son percibidos por los sentidos; este tipo de memoria, a su vez, estaría subdividido en: la memoria gustativa, sensorial, auditiva, visual, táctil y olfativa. Por otro lado, está la memoria en relación con el tiempo, la cual está concedida a través de una variable temporal y se encuentra dividida en: memoria de corto plazo (MCP), memoria de largo plazo (MLP) y memoria inmediata (MI).

Memoria

d e c o rto p l a zo

(MCP)

La memoria de corto plazo (MCP) es la capacidad de retención de información, presentada recientemente por breves periodos de tiempo, la cual ha pasado a través de los sentidos con anterioridad, con una capacidad de almacenar la información por un tiempo promedio de entre 15 y 30 segundos. Esta posee una duración mayor a la memoria sensorial y funciona bajo la directriz del número mágico 7 más o menos 2 (Manzanero, 2008). También, está regida bajo los efectos de la primicia y ultimidad, donde, en una serie de estímulos presentados, es más fácil recordar el primer y el último estímulo presentado; mientras que los que se encuentran en el medio tienden a ser olvidados más fácilmente. La MCP produce cambios en las estructuras neuronales implícitas, estos cambios son fugaces y se basan en cambios químicos o eléctricos de manera momentánea (Morgado, 2005), a diferencia de los cambios en la MLP, en donde se puede hablar sobre cambios permanentes


en la estructura neuronal. “La corteza prefrontal dorsolateral juega un papel crítico en los proceso realizado por la MCP, incluyendo procesos de la memoria sensorial” (Alain, Woods & Knigth, 1998, N.A). La importancia de la MCP radica en que por esta pasa la información cuando es percibida y, luego, es codificada, siendo este uno de sus roles más importantes ya que consolida la información (Manzanero, 2008); posteriormente, la transmite a la memoria de largo plazo (MLP) para su almacenamiento y posterior recuperación, debido a que la MCP es donde se activa la información procedente de la MLP (Manzanero, 2008). Fueron innumerables los trabajos con memoria de corto plazo; durante los años 60 donde se vio un auge por la investigación sobre este tema (Ballesteros, 1999), especialmente, con las investigaciones de George A. Miller, pionero de la psicología cognitiva, quien tuvo un interés particular sobre la memoria y cuya obra más célebre es “The magical number seven, plus or minus two: some limits on our capacity for processing information”, donde habla sobre las limitaciones de la capacidad de la memoria humana, llegando a la conclusión de que la capacidad de almacenamiento de los seres humanos es de 7 más o menos 2 trozos (chunk) de información, debido a la capacidades biológicas del ser humano, pero, también, a la atención, importancia y compresión del estímulo; con esto se comprende más acerca del procesamiento de la memoria (Manzanero, 2008).

Me m o r i a

a u d i t i va

La memoria auditiva se define como la capacidad de procesar, almacenar y recordar la información auditiva que escuchamos. Su importancia radica en el habla, puesto que gracias a esta aprendemos nuestra lengua materna; en esta se almacenan sonidos y tonos, la información sensorial auditiva es almacenada en la memoria ecoica. La información es registrada en la corteza auditiva primaria (Glass, Sachse y Suchodoletz, 2008). La memoria auditiva de corto plazo es la capacidad de recordar información auditiva por breves periodos de tiempo; posee un rango de duración de aproximadamente 3 a 5 segundos.

Memoria

ecoica

Es la encargada de conservar los registros y representaciones sensoriales de la memoria auditiva y tiene una duración aproximada de entre 30 y 100 milisegundos (Baddeley, 2002), por lo cual posee un almacenamiento limitado, su decaimiento se puede deber a características del estímulo, como tono, frecuencia e intensidad. Esta está dividida en dos fases: la primera relacionada con la memoria de corto plazo, debido a sus limitadas capacidades de retención, y la otra se relaciona más con la MLP, ya que la información es integrada por medio de la comparación

13


MEDIR Y EVALUAR

14

con patrones existentes. Los errores que se presentan en esta se pueden deber a fallos en el vocabulario, la pronunciación o dificultades en el procesamiento fonológico (Glass, Sachse & Suchodoletz, 2008). Investigaciones recientes, como la de Ozubko, Hourihan y Macleod (2012), donde realizaron 3 ensayos con diferentes intervalos de tiempo, dieron como resultado una mayor memorización en la lectura en voz alta que de manera silenciosa, los autores concluyen que leer en voz alta da como resultado cambios permanentes en la retención de información debido a la codificación adicional, lo cual fortalece la retención de información (MacLeod, 2011) y por ello puede ser un buen método de estudio. En un estudio anterior, MacLeod (2011) buscaba comprobar si las producciones de otra persona son recordadas de la misma manera que las producciones auto-realizadas. Como método, usó dos listas de palabras para dos grupos, una lista era leída en voz alta por el participante del experimento y la otra fue leída por otra persona en voz alta para los dos grupos; concluyó que es más sencillo recordar la auto-producción que la realizada por otra persona, revelando que hay un “gradiente” provocado por el efecto de la auto-producción. Otro estudio realizado por Robert G. Crowder en 1970, con el cual buscaba saber el papel de la voz propia en la memoria inmediata, por medio de dos experimentos, con los cuales comparaba la voz activa con la pasiva por medio de una serie de dígitos presentados visualmente. Los resultados de este experimento fueron, que la vocalización silenciosa permite la recuperación con mayor facilidad de los últimos dígitos de la serie, mientras que la vocalización activa mejora el recuerdo de los primeros puestos de la serie.

M é to d o diseño

Para cumplir con los objetivos del trabajo, se llevó a cabo un estudio cuantitativo de tipo experimental, con un muestreo de tipo aleatorio simple en población específica. pa r t i c i pa n t e s

El instrumento se aplicó a 30 personas de la Facultad de Ciencias Humanas en la Universidad Nacional de Colombia, en su sede ubicada en la ciudad de Bogotá-Colombia, a las cuales se les preguntó la edad, la carrera y el semestre al que corresponden, con el fin de evidenciar las características de la muestra empleada. La edad promedio fue 20,90 con una desviación de 3,122; una edad mínima de 17 y máxima de 33 años. La distribución por edad se puede apreciar en la Tabla 1. En cuanto a la distribución por género fue del 60 % masculino y 40 % femenino.


EDAD

FRECUENCIA

PORCENTAJE

17

1

3,3

18

2

6,7

19

9

30,0

20

6

20,0

21

4

13,3

22

1

3,3

23

3

10,0

24

1

3,3

25

1

3,3

26

1

3,3

33

1

3,3

Total

30

100

Tabla 1. Distribución de la muestra por edad.

La distribución por semestre fue del 6,7 % de las personas pertenecientes a primer semestre; 6,7 % a segundo semestre; 13,3 % a tercer semestre; 26,7 % a cuarto semestre; 23,3 % a quinto semestre; 6,7 % a sexto semestre; 6,7 % a séptimo semestre; 3,3 % a octavo semestre, y 6,7 % a decimo semestre. En relación con la carrera que cursan los participantes, se encontró que el 6,7 % pertenecen a la carrera de Lingüística; 10 % a Trabajo Social; 3,3 % a Geografía; 46,7 % a Psicología; 6,7 % a Filosofía; 16,7 % a Antropología, y 10 % a Sociología. i n s t r u m e n to s

Para realizar este experimento, se definieron dos variables: el método de lectura que le correspondió a cada participante representa la variable independiente; mientras que la cantidad de respuestas correctas (entiéndase por respuestas correctas, el número de palabras recordadas por el participante) es la variable dependiente. Además, en este experimento se usó una lista de quince palabras de tres sílabas cada una, todas pertenecientes a la categoría de sustantivos, extraída del Corpus de Referencia del Español Actual (CREA), realizado por la Real Academia Española1, junto con un cronómetro para medir el tiempo entre la presentación de la palabras y el cuestionamiento de cuántas recordaba. 1 Una muestra de la lista usada se encuentra en la sección de anexos (Anexo 1)

15


P ro c e d i m i e n to Se condujo a los participantes, junto con un investigador, de forma individual a un ambiente controlado, donde no se presentaron sonidos o acciones de un tercero que pudieran distraer al sujeto. De forma aleatoria, se repartió a los participantes en dos grupos de igual tamaño donde, dependiendo del grupo, se les pidió que realizaran una de las siguientes acciones: 1. Al primer grupo se le pidió que leyera la lista de palabras en voz alta una sola vez, intentando memorizarla. 2. Al segundo grupo se le pidió que leyera mentalmente una sola vez la misma lista de palabras, intentando, a su vez, memorizarlas. Tras la lectura de la última palabra por parte de los participantes, se esperó un tiempo de 30 segundos, tras los cuales se les solicitó que dijeran, en voz alta, la mayor cantidad de palabras que podían recordar, contabilizando el número de palabras recordadas, independientemente del orden en que las dijeran. Después de ordenar los datos, se observó el comportamiento de los mismos por medio de una prueba Shapiro-Wilk y una comparación de medias por medio de la prueba no paramétrica, U de Mann-Whitney, además de descriptivos en aquellos casos que era factible realizarlo. Esto se realizó por medio del programa IBM SPSS Stastistics V. 20.

Consideraciones

MEDIR Y EVALUAR

16

éticas

Para realizar esta investigación, se solicitó el consentimiento informado1 de la totalidad de los participantes, luego de informarles el procedimiento a realizar y el objetivo del mismo, además de darles la oportunidad de abandonar el experimento en el momento que así lo desearan.

R e s u lta d o s En la tabla número 2 se presentan los descriptivos correspondientes a los números de aciertos que presentaron la totalidad de participantes independiente del grupo al que pertenecieran.

Número de aciertos

Descriptivos

Valor

Media

5,93

Desviación estándar

2,638

Mínimo

2

Máximo

15

Tabla 2. Descriptivos del número de aciertos.

1 Una muestra del formato del consentimiento informado utilizado se encuentra en el Anexo 2.


Pruebas

de normalidad

Se realizó una prueba de normalidad de los resultados de la prueba, por medio del estadístico Shapiro-Wilk, donde se plantea como hipótesis nula que los datos tienen un comportamiento de una curva normal. Los resultados se presentan en la tabla 3.

Shapiro-Wilk

n.º aciertos

Estadístico

gl.

Sig.

0,894

30

0,006

Tabla 3. Prueba de normalidad Shapiro-Wilk.

Prueba U

de

M a n n -W h i t n e y

Debido a que los datos no presentan un comportamiento de una curva normal y ya que la cantidad de datos es menor a cincuenta, se procede a realizar una prueba U de Mann-Whitney planteando la hipótesis alternativa de que hay una diferencia estadísticamente significativa entre los grupos. Los resultados se presentan en la tabla 4. Estadísticos de Contraste U de Mann-Whitney

96,500

Sig. asintót. (bilateral)

0,503

Sig. exacta [2*(Sig. unilateral)]

0,512

Tabla 4. Prueba de Mann-Whitney Número de Aciertos - Grupo.

Debido a que se aceptó la hipótesis nula con una significancia de 0,05, se procedió a hallar los descriptivos de los números de aciertos en relación con los grupos para evidenciar más fácilmente los resultados obtenidos con la prueba U de Mann-Whitney. Los resultados se presentan en la Tabla 5.

17


Número de aciertos

Descriptivos

Valor

Media

5,93

Desviación estándar

1,792

Mínimo

3

Máximo

9

Media

5,93

Desviación estándar

3,348

Mínimo

2

Máximo

15

Lectura en voz alta

Lectura mental

Tabla 5. Descriptivos Número de Aciertos - Grupo.

Los resultados de la prueba denotan que no hay una diferencia significativa entre los grupos; por ello, se procedió a comprobar si existe alguna diferencia estadísticamente significativa en los resultados según el género. Los Resultados se presentan en la tabla 6 y, en la tabla 7, se presentan los descriptivos para evidenciar más claramente los resultados. Estadísticos de Contraste

MEDIR Y EVALUAR

18

U de Mann-Whitney

79,000

Sig. asintót. (bilateral)

0,215

Sig. exacta [2*(Sig. unilateral)]

0,232

Tabla 6. Prueba de Mann-Whitney Número de Aciertos – Género.

Número de Aciertos

Hombre

Mujer

Descriptivos

Valor

Media

6,44

Desviación estándar

2,77

Mínimo

3

Máximo

15

Media

5,17

Desviación estándar

2,329

Mínimo

2

Máximo

9

Tabla 7. Descriptivos Número de Aciertos – Género.


En relación con estos resultados, se encuentra que no hay una diferencia estadísticamente significativa de 0,05, entre los hombres y las mujeres en los números de resultados presentados en la prueba.

Discusión Los resultados de la investigación realizada han mostrado que no existe una diferencia significativa, con respecto a la influencia de la lectura en voz alta o mentalmente, en la memoria a corto plazo, a la hora de recordar una serie de palabras, lo cual replantearía la idea de que se da una mejor memorización de la información cuando se lee en voz alta. De acuerdo con los resultados, se presenta una leve referencia a lo estudiado por George A. Miller, puesto que la media de la población fue de 5.93, con una desviación estándar de 2,638, lo que permitiría indicar que su teoría del número mágico 7 más o menos 2, estaría en lo correcto; pero, debido a las limitaciones que presenta este experimento, no se puede afirmar totalmente esto, aunque se podría revisar con estudios posteriores. A pesar de que la muestra utilizada en el experimento es demasiado pequeña para hacer generalizaciones sobre el general de los universitarios, los resultados obtenidos en este proyecto sí presentan contradicciones bastante notorias con investigaciones como la de Ozubko, Hourihan y Macleod (2012), donde se plantea que hay una mejor memorización de información cuando se lee en voz alta que cuando se lee mentalmente, ya que en el estudio presentado no se encontró que estas diferencias fueran significativas. En conclusión, debido a que no se usó una gran tamaño de población, el resultado de este experimento no podría ser generalizado pues las diferencias entre estos resultados y los obtenidos anteriormente por otros investigadores podrían deberse a características específicas de la población utilizada o las diferencias intersubjetivas en la capacidad de memorización de cada sujeto; sin embargo, esta prueba podría servir de piloto para una con mayor muestra y que, a su vez, busque investigar la memoria a corto plazo.

19


Referencias Alain, C., Woods, D. & Knigth R. (1998). A distributed cortical network for auditory sensory memory in humans. Brain Research, 812(1998), 27-37. Recuperado de: http://www.ebire.org/hcnlab/papers/1999aAlain.pdf Baddeley, A. (2002). Human memory: theory and practice. Reino Unido: Taylor and Francis Group. Ballesteros, S. (1999). Memoria humana: investigación y teoría. Psicothema, 11(4),705-723. Crowder, R. (1970). The role of one's own voice in immediate memory. Cognitive Psychology, 1(2), 157-178. Recuperado de: http://www.sciencedirect. com/science/article/pii/0010028570900113 Etchepareborda, L. & Abad-Mas, L. (2005). Memoria de trabajo en los procesos básicos del aprendizaje. Revista de Neurología, 40(Supl. 1), S79-S83. Recuperado de: http://www.lafun.com.ar/PDF/21-MT_en_los_procesos_de_48C50.pdf 20

Glass, E., Sachse, S. & Suchodoletz, W. (2008). Development of auditory sensory

MEDIR Y EVALUAR

memory from 2 to 6 years: an MMN study. Journal of Neural Transmission, 115(8), 1221-1229. DOI: 10.1007/s00702-008-0088-6. MacLeod, C. M. (2011). I said, you said: The production effect gets personal. Psychonomic Bulletin & Review – Springer, (18), 1197-1202. Recuperado de: http://link.springer.com/article/10.3758%2Fs13423-011-0168-8/ fulltext.html Manzanero, A. L. (2008). Aspectos básicos de la memoria. En: A. L. Manzanero, Psicología del Testimonio (pp. 27-45). Madrid: Ed. Pirámide. Morgado, I. (2005). Psicobiología del aprendizaje y la memoria: fundamentos y avances recientes. Revisión en Neurociencia, 40(5), 289-297. Recuperado de: http://blocs.xtec.cat/escolamargalloedu/files/2013/06/Apr-y-MemRN-20053.pdf Ozubko, J., Hourihan, K., & MacLeod, C. (2012). Production benefits learning: the production effect endures and improves memory for text. Memory, 20(7), 717-727. Recuperado de: http://www.tandfonline.com/doi/abs/10.1080/096 58211.2012.699070?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_ dat=cr_pub%3dpubmed#preview.


ANEXO 1 M o d e lo d e l a

l i s ta d e pa l a b r a s u s a d a s

e n e l e x p e r i m e n to

Cultura Cabeza Gobierno General Partidos Trabajo Nacional Personas Sistema RelaciĂłn Problema Proyecto Militar Paciente Humano

ANEXO 2 M o d e lo d e l c o n s e n t i m i e n to

informado

Yo ______________________________________________ _________identificado(a) con ____ numero_______________ de _________________________ confirmo que fui informado (a) de los propĂłsitos y la metodologĂ­a del presente estudio sobre Lectura y Memoria, en el cual decido participar voluntariamente, teniendo en conocimiento que me puedo retirar del mismo en cualquier momento.

Firma _____________________________

21


P R O C E S O D E E VA L U A C I Ó N PSICOLÓGICA A UN NIÑO DE QUIÉN SE SOSPECHA H A B I L I DA D E S C O G N I T I VA S SUPERIORES P s yc h o l o g i c a l a s s e s s m e n t p r o c e s s with a child who suspected higher c o g n i t i ve a b i l i t i e s

R esu m en

MEDIR Y EVALUAR

22

El presente trabajo tiene como objetivo describir y sustentar el proceso de evaluación psicológica realizado en el Servicio de Atención Psicológica (SAP) a un niño de 10 años. La hipótesis inicial, con la cual lo remite su institución educativa es superdotación intelectual; esto debido a que sus maestros afirman observar, en él, algunas de las conductas típicas de esta población. Al presentar este caso como modelo de evaluación psicológica se pretende llamar la atención sobre la importancia de hacer una evaluación multidimensional cuando se busca evaluar la existencia de superdotación intelectual, de tal forma que el proceso logre responder al contexto particular del consultante. Dentro del proceso

se determinó evaluar inteligencia, atención, memoria, depresión y funcionamiento afectivo. A partir del contraste entre los resultados obtenidos con las pruebas aplicadas y la información aportada por la entrevista inicial se pudo hacer un análisis multidimensional que permitió falsear la hipótesis inicial.

Palabras clave: Evaluación psicológica, habilidades cognitivas superiores, superdotación intelectual, inteligencia, depresión.


Diana Marcela Botina Villarreal / dmbotinav@unal.edu.co María Fernanda Ferrucho Segura / mfferruchos@unal.edu.co Laura Alejandra Mora Gutiérrez / laamoragu@unal.edu.co Psicólogas Universidad Nacional de Colombia, sede Bogotá

A b stract

The

following paper aims to describe and support the process of psychological assessment conducted by the Servicio de Atención Psicológica (SAP) to a 10-year-old child. Initial hypothesis, provided by the educational institution, states intellectual giftedness; this is based on the child’s teachers that claim to notice some common behaviours of this population in him. By presenting this case as a psychological assessment model, it is intended to draw attention to the importance of conducting a multidimensional assessment when assessing the existence of intellectual giftedness so that the process is capable of responding to the patient particular context. Within the process, it was es-

23

tablished to assess intelligence, attention, memory, depression and emotional functioning. From the contrast between the results achieved by the conducted tests and the information provided by the initial interview, it was possible to make a multidimensional analysis that contradicted the initial hypothesis.

Keywords: Psychological assessment, higher cognitive abilities, intellectual giftedness, intelligence, depression.


Introducción

MEDIR Y EVALUAR

24

Evaluar es un proceso que nace de la necesidad de aplicar los principios del método científico para medir las diferencias individuales existentes entre personas (Nunes, García & Scortegagna, 2006). La inteligencia es una de las diferencias que interesa medir y, desde hace ya más de un siglo, se han desarrollado diferentes pruebas o test que parten de alguna determinada concepción acerca de lo que esta es. La primera Escala de Inteligencia fue la desarrollada por Binet y Simon (1905), y su objetivo era distinguir entre niños con retraso mental y niños con inteligencia normal. Cabe señalar que la postura de Binet, se centraba en los productos de la inteligencia y no en los parámetros psicofísicos de la misma, marcando una ruptura con la corriente que había iniciado Sir Francis Galton, quien consideraba que, a través de la medición de parámetros de orden fisiológico tales como: umbrales de percepción, tiempo de reacción, agudeza visual, capacidad respiratoria, entre otros, sería posible hacer una medición objetiva de la inteligencia (Mora & Martín, 2007). El objetivo que se propusieron Binet y Simon (1905) era completamente diferente: “Explorar procesos mentales de orden superior, tales como la memoria, las imágenes mentales, la comprensión o el juicio” (Mora & Martín, 2007, p. 308). Hoy en día existen procesos de evaluación, diseñados muy cuidadosamente, que permiten no sólo medir la inteligencia, sino también la personalidad, la salud emocional y muchos otros constructos que son de interés tanto para la psicología como para otras disciplinas. Para el caso de la psicología clínica, contar con instrumentos válidos y confiables es uno de los requerimientos previos principales para identificar el tratamiento apropiado a aplicar en cada caso específico (Caballo, 2005). Sin embargo, cabe aclarar que el proceso de evaluación psicológica puede incluir la aplicación de pruebas estándar y/o no estándar. Adicionalmente se requiere de una primera información que es recogida en una entrevista inicial de la cual se identifican características específicas del sujeto, del ambiente y la relación entre ellos (Nunes, García y Scortegagna, 2006), con esta información se obtiene una visión más amplia a partir de la cual se formula una hipótesis y de la misma manera se identifica qué instrumentos se van a utilizar (Fernández-Ballesteros, 1997). Otro aspecto importante de la evaluación psicológica, es el compromiso ético que asume el profesional, el cual consiste principalmente en evitar vulnerar los derechos y deberes del consultante. Además de la obligatoriedad de presentar el consentimiento informado al consultante, ó a su acudiente según corresponda, dicho compromiso se relaciona directamente con el buen uso de los instrumentos de medición disponibles de acuerdo con el fin, de tal forma que es un


requerimiento fundamental la adecuada comprensión de las técnicas a aplicar; sólo así es posible ofrecer y garantizar el mayor beneficio al consultante, respetando sus características particulares y evitando efectos nocivos o situaciones de riesgo. (Tribunal Nacional Deontológico y Bioético, 2012). A partir de lo anterior, y atendiendo al interés del psicólogo por obtener resultados válidos y confiables, los procedimientos e instrumentos a aplicar en un determinado caso deben responder a la particularidad del sujeto, teniendo en cuenta la edad, género, país de origen, entre otras variables que pueden limitar el rango de aplicabilidad de una prueba. Así mismo el manual debe aportar el suficiente sustento acerca de los criterios de validez y confiabilidad requeridos. En el apartado denominado “Método”, se describen los instrumentos elegidos para aplicar en el presente proceso de evaluación psicológica. Respecto al tema de la identificación de niños con habilidades cognitivas superiores, hay que decir que, aunque existe una vasta teoría, son pocos los acuerdos entre los postulados de distintos autores (Paba, Cerchiaro y Sánchez, 2008). Tal como lo afirma Sastre-Riba (2008), el conocimiento acerca de la naturaleza y el funcionamiento de la alta capacidad intelectual es borroso, por tal motivo todavía no hay unidad en los parámetros de identificación y tampoco en las pautas de intervención. La falta de claridad en la definición de lo que es poseer “superdotación a nivel cognitivo” ha dado origen a varias de las creencias equivocadas. Según lo reporta Castro (2012), algunos de los mitos principales sobre un posible “niño superdotado” son: Poseen características muy homogéneas entre sí; se definen exclusivamente por tener un alto cociente intelectual (CI) con puntuación superior a 130; gracias a su rendimiento académico superior no necesitan atención educativa específica; tienen necesariamente problemas de desadaptación social y una alta motivación por las actividades escolares; etc. Sin embargo, estas ideas no tienen sustento empírico suficiente, por lo tanto, no deben considerarse una base para definir un proceso de evaluación. Pese a las dificultades señaladas anteriormente, hoy en día se reconoce que ni la inteligencia, ni la superdotación intelectual son de carácter unifactorial, por el contrario, están conformadas por diversos factores, de forma similar a lo propuesto por Thurstone (1938), quien sostuvo que algunas de las aptitudes mentales primarias eran fluidez verbal, habilidad numérica, comprensión visual, percepción, memoria, razonamiento inductivo/deductivo, entre otras (Castello y de Batlle, 1998). Entonces, para identificar la existencia de superdotación intelectual es necesario no sólo basarse en la información aportada por un test de CI, sino también debe realizarse un proceso que permita hacer mediciones cognitivas multidimensionales (Sastre-Riba, 2008).

25


MEDIR Y EVALUAR

26

Para lograr una medición integral de las diferentes habilidades cognitivas que determinarían la existencia de superdotación intelectual, el primer paso es la aplicación de una prueba de inteligencia reconocida por su confiabilidad y validez. Para el presente caso, una prueba adecuada es la Escala de inteligencia de Wechsler para Niños, cuarta versión (WISC – IV). Sin embargo, en este punto vale mencionar que debemos atender a la alerta acerca de la medición de la inteligencia hecha por la American Psychological Association (2014), organización autora de la última versión del WISC, la cual afirma que los test de inteligencia no miden todos los tipos de inteligencia, como por ejemplo la inteligencia social; sino que únicamente evalúan el funcionamiento intelectual de una persona en comparación con una población de su misma edad y originaria de un contexto cultural cercano al del evaluado (en los casos en que existe una versión adaptada para el lugar de donde el sujeto es originario). Por lo anterior, es importante tener en cuenta que los resultados de este tipo de pruebas no pueden aportar un juicio concluyente con respecto a si una persona tiene o no habilidades cognitivas superiores; entonces, además del WISC-IV se requieren otras pruebas adicionales para dar un resultado al consultante. Para el presente caso resulta necesario evaluar adicionalmente la atención, la memoria y el nivel de depresión del consultante. A continuación, se realiza una breve explicación de cada uno de los constructos mencionados, y que se han tomado como referencia para efectos de la presente investigación. La atención es uno de los procesos psicológicos básicos, indispensable para el procesamiento de la información de cualquier tipo. La atención es un proceso que ayuda, facilita y participa en todos los procesos cognitivos superiores. Dado que los seres humanos están expuestos a una sobreestimulación ambiental, es indispensable el aprendizaje y desarrollo de mecanismos cognitivos capaces de seleccionar lo necesario, y así mismo, no saturar el cerebro de información inútil. La información obtenida a través de estímulos auditivos, visuales, olfativos, etc., debe ser filtrada y seleccionada por el sujeto, pues es imposible estar atento a todo lo que los rodea; y aunque existen órganos especializados en la recepción e interpretación de la información, el proceso cognitivo básico, el de mayor participación y más implicado en la selección de los estímulos necesarios para dar respuestas oportunas a las demandas del medio, es la atención. Sin embargo, ésta no siempre opera de manera óptima, puede alterarse y traer consigo dificultades laborales, familiares, escolares, entre otras, por lo que se hace necesario un proceso de evaluación e intervención. Entonces, la importancia de la atención no solo radica en el procesamiento de la información, sino también en que tiene implicaciones conductuales y emocionales (Londoño, 2009).


En cuanto a la memoria, es un proceso psicológico que sirve para almacenar experiencias e información, que más adelante se podrán recuperar en beneficio del individuo; este proceso se puede generar de manera voluntaria o involuntaria (Ballesteros, 1999). Hay ocasiones en que esta recuperación se hace de manera inmediata, por asociaciones con lugares o sonidos; sin embargo, también se da cuando se necesita traer de manera consciente alguna información importante en un momento indicado, permitiendo gestionar o administrar el pasado (Sola, 2013). En personas sanas el funcionamiento de la memoria es normal, contribuyendo así con una buena adaptación a la vida cotidiana y a las labores a las que se tenga que enfrentar; en efecto, la memoria está relacionada también con la supervivencia y la selección natural, ya que con la recuperación de información antes codificada se pueden prevenir episodios en los que la persona deba enfrentarse a un determinado peligro o simplemente recordar lugares en donde se encuentran los alimentos o notas importantes (Ballesteros, 1999). En personas cuyo funcionamiento o recuperación no es eficaz, se presentan problemas tales como olvidar cosas importantes, lugares y personas, puesto que la retención de información no es la mejor; esto hace que el desarrollo normal se vea afectado y la calidad de vida de la persona disminuya. Por otra parte, la depresión clínica es un trastorno del estado de ánimo caracterizado por una sensación de tristeza intensa, superior a dos meses (Piqueras y cols., 2008) que define un “estado personal de distinta experiencia subjetiva”, (Abello y cols., 2008, p. 5) y comúnmente se define por cuatro tipos de síntomas: afectivos (ej. tristeza), cognitivos (ej. pensamientos), conductuales (ej. actitud desganada) y físicos (ej. falta de energía) (Abello y cols., 2008). El modelo de depresión de Beck (1974) considera que esta patología es reflejo de los problemas cognitivos de la persona, que se evidencia cuando esta lleva a cabo la evaluación acerca de sí mismo, de su entorno y su futuro (triada cognitiva), y a su vez, en los esquemas y errores cognitivos; así, para Beck la depresión no es un trastorno afectivo sino cognitivo (Rodríguez de Alba y Suárez, 2012). En el caso de los niños, la depresión prevalece significativamente en las alteraciones del comportamiento, las cuales se manifiestan por ejemplo en alteraciones del humor. Este tema ha demandado importancia ya que su aparición en la infancia sigue un curso crónico y puede desarrollar consecuencias secundarias como alcoholismo, déficits psicosociales, personalidad antisocial, bajo rendimiento académico, etc. (Solloa, 2001; en Herrera, Núñez, Tobón y Arias, 2009). El caso objeto de estudio se describe en el apartado participante, y cabe mencionar que el interés por documentar dicho caso surgió a partir de la información obtenida durante la entrevista inicial de la que participaron el niño y su madre.

27


MEDIR Y EVALUAR

28

La madre del menor acude al SAP por solicitud de la institución educativa, ya que, según ella, los maestros reportaron que en el presente año lo han percibido muy aburrido en las actividades académicas, además, distraído, desobediente, desinteresado e incluso somnoliento. Lo anterior ha llevado a un brusco descenso en el rendimiento académico de A, sin embargo, la hipótesis formulada por los maestros es “habilidades cognitivas superiores”, basados en el hecho de que A siempre ha tenido un rendimiento académico destacado, y que, a pesar de los inconvenientes señalados, él contesta acertadamente la mayoría de preguntas que se le plantean en clase. Considerando el requerimiento con el que el participante es llevado a consulta, la primera hipótesis a falsear cuando se sospecha que un niño tiene altas capacidades intelectuales sería: el niño da muestra de que posee habilidades cognitivas y de procesamiento de información superiores a la media de acuerdo a su edad. Sin embargo es importante hacer énfasis en que, para falsear o confirmar dicha hipótesis, no es suficiente con aplicar un instrumento psicológico diseñado para la evaluación de la inteligencia del sujeto, pues como ya se mencionó estos instrumentos no permiten evaluar todas las dimensiones de la inteligencia, entonces deben evaluarse otras herramientas cognitivas asociadas al adecuado funcionamiento de la inteligencia social del consultante; más aun teniendo en cuenta que en la entrevista inicial el niño mostró actitudes de desinterés por las actividades académicas, tristeza, y también falta de atención y concentración, por lo que es posible inferir la existencia de problemáticas asociadas de un déficit atencional, un déficit de memoria y de desórdenes emocionales.

M é to d o P a r t i c i pa n t e Un niño de 10 años y 9 meses, de sexo masculino. El participante, quien en adelante será denominado A, cursa cuarto grado en un colegio bilingüe de la ciudad de Bogotá, Colombia, no posee alguna patología psicológica diagnosticada. Adicionalmente, ni A ni su familia pertenecen a alguna comunidad étnica o religiosa determinada. Con respecto a la vida académica del menor hay que resaltar que se trata de un colegio bilingüe de alta exigencia académica, y donde la jornada va desde las 7 am a las 2 pm, extendiéndose algunos días hasta las 4 pm por tutorías académicas. Adicionalmente A está inscrito en una fundación bilingüe a la que debe asistir todos los sábados de 8 am a 12 m. Los padres del niño determinaron matricular al niño en tales instituciones debido a que anhelan que A obtenga una beca de intercambio para estudios en el exterior y para ello requieren darle al niño la mejor formación posible.


El núcleo familiar de A está compuesto por sus padres biológicos y una hermana menor. La madre tiene 45 años y el padre 44, el nivel de escolaridad de los dos es profesional; la hermana menor tiene 4 años y cursa actualmente jardín. Con respecto a la situación socioeconómica, la madre comenta que la familia atravesaba por una crisis económica que los llevó a vender la casa donde el niño había pasado toda su infancia y a trasladarse a una vivienda mucho más pequeña, donde él debe compartir habitación con su hermana. Otro factor importante tiene que ver con la relación de A con su hermana menor, pues para él ha sido difícil aceptarla como un miembro de la familia, tanto así que él no muestra afecto hacia ella, y a su vez se muestra celoso de la madre, de quien actualmente demanda mucha mayor atención que antes de que la niña naciera, aunque en ocasiones su actitud es ambivalente y tiende a irrespetar el rol de autoridad que ella tiene. Los problemas familiares mencionados han llevado a la familia a acudir a terapia familiar en dos oportunidades anteriores. Cabe resaltar que, a partir de la entrevista inicial, realizada con A y su madre, fue posible obtener la información necesaria para establecer los instrumentos y procedimientos a aplicar en el proceso de evaluación psicológica.

I n s t ru m e n to s Escala Wechsler

d e i n t e l i g e n c i a pa r a

N i ñ o s (WISC- IV).

La inteligencia se midió a través del WISC-IV, adaptación española. Esta prueba explora y evalúa las capacidades cognoscitivas, consta de 15 subpruebas agrupadas en cuatro índices que representan habilidades intelectuales generales (comprensión verbal y razonamiento perceptivo) y habilidades de procesamiento cognoscitivo (memoria de trabajo y velocidad del procesamiento). Adicionalmente el test es aplicable preferentemente a sujetos que necesiten determinar su nivel de habilidades cognoscitivas o su funcionamiento neuropsicológico, entre ellas diagnóstico de altas capacidades. La existencia de criterios de confiabilidad y validez se encuentra ampliamente documentada en Wechsler (2005); allí se observa evidencia del análisis de confiabilidad de ítems pares e impares, excepto para el apartado denominado Retención de Dígitos, que requiere del uso de formas paralelas o equivalentes; y también existe información de datos de validez de contenido, de constructo y de criterio. El WISC-IV es aplicable a niños y adolescentes de edades comprendidas entre 6 años 0 meses y 16 años 11 meses (Consejo General de Colegios Oficiales de Psicólogos, s.f.).

29


Figura

MEDIR Y EVALUAR

30

compleja de

Rey

La figura compleja de Rey evalúa capacidades perceptivas y motrices, la habilidad de construcción en el plano gráfico y la organización visual (Lara, Galindo, Romero, Salvador y Domínguez (2003); se utiliza principalmente con personas que tienen problemas en fijar y retener información. Esta prueba consiste en copiar y luego reproducir de memoria un dibujo geométrico complejo que reúne propiedades como ausencia de significado y facilidad en la realización gráfica, pero con una estructura que en conjunto es lo suficientemente complicada para exigir actividad analítica organizadora. El tiempo estimado de aplicación es de 10 minutos, dando una pausa no mayor a 3 minutos entre la copia y la reproducción de memoria. Con la observación de la forma en que la persona copia la figura se puede conocer su actividad perceptiva hasta cierto punto, mientras que la realización de la figura sin la presencia de la figura original informa sobre el grado de memoria visual. Al sujeto se le muestra la figura, se le entrega una hoja en blanco y un color, se debe disponer de cinco o seis lápices de colores diferentes, y se le dan las indicaciones según indique el manual. Periódicamente se le pide al niño que cambie de color con el fin de poder analizar posteriormente el transcurso de copia que el sujeto llevó a cabo, por ejemplo, en el caso de niños se espera que empiecen de pequeños detalles a estructuras más grandes (Rey, 2009). Para calificar la prueba se toma como base una clasificación de tipo de dibujo que consta de siete categorías ordenadas de forma ascendente de acuerdo al grado de racionalidad que muestra el dibujo, racionalidad que está determinada por factores como la rapidez de la copia, la precisión del resultado y los hábitos intelectuales (Rey, 2009). Las propiedades psicométricas de esta prueba, como son la confiabilidad y la validez, han sido revisadas en varios países de habla hispana, ejemplo de esto es el estudio realizado por Cortes, Galindo y Salvador (1996), donde la confiabilidad hallada para el ejercicio de copia fue de 0,828, y para el ejercicio de memoria de 0,783. Adicionalmente, “el análisis factorial mostró que las dieciocho unidades perceptuales se agrupan en forma congruente en cuatro factores que explican 43.6 % de la varianza total de la copia y 38.6 % de la memoria” (Cortes, Galindo y Salvador, 1996, p. 42).

Test de colores y palabras Stroop Para evaluar el desempeño en atención selectiva, se decidió aplicar el test de colores y palabras Stroop, ya que es una herramienta utilizada ampliamente en la detección de disfunciones cerebrales que relacionadas con la atención, más específicamente la atención selectiva, la atención dividida y a la distractibilidad en general; también ha sido aplicada para medir procesos cognitivos muy diversos relacionados con la flexibi-


lidad, la capacidad de inhibición de respuestas automáticas y la velocidad de procesamiento de la información (Herreras y Santos, 2006). La prueba es apta para las edades entre 7 y 80 años, la duración es de 5 minutos y consta de tres láminas cada una con 100 elementos divididos en 5 columnas; en la primera se realiza la lectura de palabras; la segunda lámina es de denominación de colores; y la tercera lámina es la condición de interferencia palabras-colores. La fiabilidad del STROOP se ha mostrado muy consistente en las versiones existentes; los investigadores usaron el método test-retest comprendidos entre 1 minuto y 10 días entre aplicaciones (Golden, 1999).

Children's Depression Inventory (CDI) Se aplicó el CDI con el fin de determinar la existencia de sintomatología depresiva. El CDI es un cuestionario basado en un marco teórico cognitivo estrictamente psicológico. Se considera que este instrumento es bastante idóneo para medir el nivel de disforia y de autoestima negativa en niños de 7 a 15 años, pues posee la solidez psicométrica que demanda la comunidad científica (Kovacs, 2004). Consta de 27 ítems, cada uno con 3 enunciados ordenados de forma gradual en función del nivel de depresión, entendida esta como la sumatoria de los factores disforia y autoestima negativa (16 ítems evalúan la presencia de disforia y los 11 restantes evalúan autoestima negativa). La validez y confiabilidad de este instrumento está ampliamente documentada por numerosas investigaciones (Kovacs, 2004), incluyendo estudios realizados en Colombia (Segura y cols., 2010). Para la aplicación de la prueba se utiliza un ejemplar autocorregible (de dos páginas), un lápiz y un borrador. La portada del ejemplar trae las instrucciones de diligenciamiento de la prueba, sin embargo, el psicólogo debe también darlas de forma verbal, teniendo cuidado de no usar la palabra “depresión”. También es importante que el psicólogo se asegure de que el niño atendió a la explicación verificando con un ejemplo. De los tres enunciados de cada ítem, el niño deberá seleccionar aquel que mejor describa los sentimientos e ideas que lo han acompañado las últimas 2 semanas. Si el niño no responde una pregunta, el psicólogo debe animarlo a que lo haga. Cada enunciado tiene una puntuación que va de 0 (cero) a 2 (dos) de acuerdo con el nivel de depresión que expresa; para calificar el test simplemente se debe sumar la puntuación obtenida en cada ítem, luego se transforma esa puntuación en una puntuación escalar cuyos baremos van de 0 a 100; estas tablas están diferenciadas por edad y sexo. Para el caso de A, a partir de una puntuación de 90 se considera la existencia de sintomatología depresiva leve, y a partir de 96 se considera la presencia de depresión severa (Kovacs, 2004).

31


Test

d e lo s

C u e n to s

de

H a d a s (FTT)

El FTT es una prueba proyectiva utilizada para evaluar rasgos de personalidad, aptitudes y habilidades, este test está destinado a obtener información de las características psicológicas que son relevantes para el funcionamiento afectivo y/o cognitivo en niños de 6 a 12 años (Guevara, Da Silva Nunes y Borges, 2014). Consta de 21 láminas que se presentan al niño en grupos de tres, cada grupo presenta imágenes de cuentos de hadas muy populares, el tiempo en el que se administra es 50 a 60 min; para aplicar este test el niño debe conocer los cuentos, saber de qué tratan e identificar cada personaje, no es un test de memoria, es un test donde se proyectan experiencias, miedos y emociones. Se hacen algunas preguntas con respecto a cada imagen que se presenta y se pide al niño dar a conocer su opinión; las láminas deben presentarse en el orden que se indica en el lado posterior, adicionalmente se debe dejar claro que no hay respuestas correctas o incorrectas (Cougacoglou, 2002). La puntuación del FTT cuenta con 29 variables de personalidad que pueden ser clasificados bajo 5 componentes principales que son: 1. Deseos y necesidades, 2. Impulsos, 3. Relaciones objétales, 4. Estados emocionales, y 5. Funciones del Super Yo. Las variables pueden puntuarse en una escala de 1 a 3 de intensidad siendo: 1 Baja, 2 media y 3 alta. En cuanto al estudio de confiabilidad se realizó test-retest y calificación interjueces; y el estudio de validez fue realizado por medio de análisis factorial. En la prueba se utilizaron baremos españoles (Cougacoglou, 2002). 32

MEDIR Y EVALUAR

P ro c e d i m i e n to En la primera sesión, se dieron a conocer al consultante y a su madre, sus derechos y deberes, se les hizo entrega del Consentimiento Informado y se les explicó su contenido. Adicionalmente se les informó que durante el proceso se garantizaría el buen uso de los instrumentos a aplicar y el adecuado manejo que se le daría a toda la información a obtener. Ellos estuvieron de acuerdo y la firma del consentimiento quedó como soporte de su aceptación. En la primera y segunda sesión se realizó una entrevista con A y su madre, con el fin de obtener la mayor información posible del contexto; ya que un adecuado acercamiento al paciente permite obtener información valiosa, tanto de fuente verbal como no verbal, que facilita la compresión del problema (Navarro, s.f.). Por tal razón este espacio se debe usar un lenguaje común y mediando la percepción global mutua, pues el buen manejo de la primera entrevista constituye uno de los factores fundamentales para la evolución y desarrollo de la terapia (Davanzo, 2000). En dicha entrevista se logró


obtener información sobre el contexto de vida del niño, la conformación del núcleo familiar, y otros antecedentes. En la tercera y cuarta sesión, cada una con una duración de 45 minutos aproximadamente, se aplicó el WISC-IV, ya que el tiempo estimado de aplicación del test es de 60 a 75 minutos como lo indica su ficha técnica. En la quinta sesión, para evaluar la capacidad de memoria se aplicó la Figura de Rey y el Test de Colores y Palabras (STROOP). En la sesión número seis se llevó a cabo la aplicación del cuestionario CDI para descartar que A no presentara algún tipo de depresión debido a las observaciones de su estado de ánimo en las sesiones anteriores; adicionalmente se aplicó el Test de los cuentos de Hadas, con el fin de identificar las emociones, miedos y temores que pueden estar causando malestar en A.

R e s u lta d o s WISC-IV (N o r m a s

e s pa ñ o l a s )

PUNTUACIÓN COMPUESTA

RANGO PERCENTIL

RANGO DE INTERPRETACIÓN

Comprensión verbal

116

86

Promedio alto

Razonamiento perceptual

102

55

Promedio

Memoria de trabajo

88

21

Promedio Bajo

Velocidad de procesamiento

83

13

Promedio Bajo

…………

…………

…………………

100

50

Promedio

ÍNDICES

……………………………...… Puntaje Total

Tabla 1. Resultados de A en las cuatro dimensiones evaluadas.

Tal como se observa en la Tabla 1, A obtuvo un puntaje total de 100, lo que lo ubica en un rango promedio, con la probabilidad del 95 % de que su verdadero desempeño cognoscitivo se encuentre entre 95 y 105. Lo anterior evidencia que A se encuentra dentro de la normalidad en su capacidad de aprendizaje global y descarta la existencia de habilidades superiores.

Figura

de

R e y (N o r m a s E s pa ñ o l a s )

La puntuación de A en la primera fase se ubica en el percentil 90, en la fase de reproducción de memoria su puntuación se ubica en el percentil 50, lo cual indica que la copia y reproducción de la figura fue casi perfectamente conseguida y rica en detalles. Con respecto al tiempo de copia y de reproducción se ubicó en el percentil 90, lo cual indica que es

33


especialmente corto para su edad, y que tan solo el 1 % de los niños de su edad logran ejecutar la tarea en un tiempo menor. Por consiguiente, se descarta la hipótesis sobre problemas de memoria.

Test

de

S t ro o p

de

C o lo r e s

y

P a l a b r a s (N o r m a s

b o g ota n a s )

Este instrumento también fue aplicado en la quinta sesión para evaluar específicamente la atención. Esta prueba se puede usar en casos muy diversos independientemente del nivel cultural de los sujetos debido al corto tiempo que se requiere para administrarla y a la sencillez de sus estímulos. Se han realizado varios estudios americanos y españoles, sin embargo, esta prueba cuenta con baremos bogotanos, pero no se ha realizado la corrección para edad de niños. La puntuación obtenida por A en la lámina de palabras fue de 52, para la lámina de colores fue de 50, y la lámina de palabras colores arrojó 54, estas puntuaciones están ubicadas dentro del rango esperable: 40-60, en una escala que va de 1 a 100; adicionalmente se encontró que el niño obtuvo una puntuación de 64 en interferencia, lo que quiere decir que además de que se descarta algún problema neuropsicológico en los procesos atencionales, se identificó que el niño cuenta con una capacidad superior para producir respuestas automáticas.

C h i l d r e n ' s D e p r e s s i o n I n v e n t o r y (N o r m a s

MEDIR Y EVALUAR

34

e s pa ñ o l a s )

A se ubicó en el percentil 85 para la escala de depresión total, lo que lo ubica dentro del rango límite (muy cercano al percentil 90) de niños sin sintomatología. Para la escala de Autoestima Negativa las respuestas de A se ubicaron en el percentil 80 con una intensidad media en su autoeficacia relacionadas con la poca seguridad de que las cosas le saldrán bien, dificultad para tomar decisiones y aspectos del sí mismo que no le agradan. En la escala de Disforia el niño se ubicó en el percentil 85, lo que indica inexistencia de patología depresiva.

Test

d e lo s c u e n to s d e h a da s

(N o r m a s

e s pa ñ o l a s )

Para el caso de A se evidenció una baja puntuación en Autoestima = 25; altas puntuaciones en las variables de Agresión por Venganza = 69; Temor a la Agresión = 64, que refleja una posible amenaza o miedo presentado actualmente; Relación con la Madre = 64, adicionalmente se pudo percibir una pobre calidad en la misma debido a la exigencia y el castigo si se desobedece; Ansiedad = 62, con temor a acontecimientos desagradables; Depresión = 64 con en sentimientos de infelicidad y soledad; y finalmente en la Necesidad de Afecto = 65, como la necesidad de recibir amor. Es importante aclarar que, para afectos de interpretación, los puntajes brutos de todas las variables se convierten en puntajes pesados, con una media = 50 y una Desviación Estándar = 10. Los puntajes pesados que van de 40 a 60 son considerados dentro de los límites normales.


Perfil

d e l e va l u a d o

Acorde con los resultados obtenidos de las pruebas aplicadas a A se puede determinar que: en relación con las habilidades de comprensión verbal, y en concordancia con el WISC-IV (Wechsler, 2005); A expresa una alta capacidad para la formación de conceptos y expresar relaciones entre los mismos, así mismo precisión en la definición de palabras, demostrando agilidad e intuición verbal; posee habilidades para la comprensión social; tiene alta capacidad de abstraer y generalizar a partir de dos conceptos dados; posee amplio conocimiento léxico, tiene precisión conceptual y capacidad expresiva verbal; frente a la solución de problemas cotidianos, razona y logra emitir juicios sociales; adquiere, conserva y recupera conocimientos adquiridos; integra información, genera conceptos alternativos y condensa información. Por otra parte, en cuanto a razonamiento perceptual, A no demuestra habilidades superiores en comparación al promedio, sin embargo según su puntaje se puede inferir que es capaz de expresar habilidades práxicas constructivas, formar y clasificar conceptos no verbales, hace análisis visual y procesamiento simultáneo; posee habilidades de análisis, síntesis y organización viso-espacial durante tiempo controlado; se ubica en un nivel promedio en cuanto a formación de conceptos y categorías a partir de material visual; es capaz de hacer razonamientos por analogías visuales que implica integración de información visual; así mismo posee capacidades de reconocimiento y organización perceptiva a tiempo controlado. A obtuvo una puntuación por debajo del promedio en memoria de trabajo y velocidad de procesamiento, por lo cual se podría considerar que existen dificultades en general con la memoria inmediata y la memoria de trabajo, que implica habilidades como secuenciación, planificación, alerta y flexibilidad cognitiva; sin embargo este problema debe considerarse muy leve atendiendo a que el puntaje en el WISC-IV no es significativamente bajo (88), y a que los resultados observados en la aplicación de la prueba de la Figura de Rey permiten entender que no está fuertemente comprometida la memoria de trabajo de A, ni su capacidad perceptiva, así como tampoco sus capacidades atencionales, pues los resultados del Test de Figuras y Palabras Stroop se encuentran dentro del rango esperado para su edad. Adicionalmente, es necesario alertar acerca de los posibles efectos del estado afectivo del niño sobre la validez de las puntuaciones obtenidas en el WISC-IV; este tema se tratará con mayor amplitud en el apartado siguiente. A partir de los resultados obtenidos es recomendable implementar un tratamiento orientado a mejorar su capacidad de retención y almacenamiento de información, la forma de operar mentalmente con ésta, transformarla y generar nueva información; con lo que, en una próxima evaluación se esperaría que el consultante obtenga resultados aún más satisfactorios.

35


Por otra parte, de acuerdo con los resultados del CDI no hay sintomatología de depresión a nivel patológico, sin embargo, el puntaje indica que el consultante está al límite de presentarla. Esta idea se soporta además al tomar en consideración los resultados obtenidos en el FTT, e incluso, teniendo en cuenta la percepción del psicólogo evaluador, a quién el niño mostraba y reportaba sentimientos de tristeza y desmotivación durante las sesiones.

Discusión

MEDIR Y EVALUAR

36

Debido a la gran complejidad inherente a la caracterización del fenómeno de la superdotación intelectual, existe en las instituciones educativas la tendencia a lanzar la hipótesis de que un alumno tiene habilidades cognitivas superiores basándose en algunos de los mitos o falsas creencias existentes en relación con este tema. El asunto es más grave de lo que podría parecer, ya que al generar en los padres falsas expectativas, es posible que estos intensifiquen la demanda académica que hacen al niño a tal punto que se olvidan de las necesidades y bienestar psicológico, social y emocional. Tal es el caso de A, pues desde muy temprana edad sus padres recibieron comentarios acerca de su posible superdotación intelectual, por lo cual crearon un proyecto de vida para el niño enfocado completamente en el ámbito académico. Los resultados obtenidos a partir de las distintas pruebas son consistentes en soportar el hecho de que las habilidades cognitivas de A son normales o promedio para su edad. Sin embargo debe tenerse en cuenta que aunque la administración de las diferentes pruebas se realizó siguiendo cuidadosamente las indicaciones del respectivo manual de aplicación, no es posible garantizar la confiabilidad de las mediciones, esto teniendo en cuenta que se evidenció la existencia de una fuente de error no sistemático que afecta la confiabilidad y por ende la validez de los resultados (Henson, 2001), se trata de la hora en que A asistía a sus sesiones, al final de la tarde después de que A finalizaba su jornada académica, momento en que el niño reportaba cansancio, tensión emocional, y preocupación por las obligaciones escolares pendientes por realizar; por lo que su nivel de atención, concentración y disposición podría haberse visto afectado. Entonces, es de esperar que las puntuaciones de los diferentes componentes del test de inteligencia WISC-IV pudieron verse afectadas por el estado afectivo del niño en el momento en que se realizó la sesión. Por otra parte, la afirmación acerca de un alto riesgo de depresión en el consultante, no se hace sólo con base en los resultados en instrumentos aplicados como el CDI en el cual su puntuación está cercana al límite inicial de sintomatología leve de depresión como se explicó anteriormente, y el FTT que evidencia sentimientos de infelicidad y soledad, sino también en base a las observaciones durante las sesiones, pues en el inicio de


éstas siempre se le hacen preguntas respecto a su día o sus labores y lo que siempre relata es que sus responsabilidades académicas le impiden un descanso suficiente, puesto que, según la percepción del niño, le lleva mucho tiempo acabar sus tareas, por la cantidad y la extensión de las mismas, e incluso los domingos que visita a sus abuelos tiene que buscar espacios para terminar sus obligaciones académicas. Por otra parte, A ha hecho varias comparaciones con quienes él llama “niños normales”, pues argumenta que ellos sí tienen tiempo para divertirse, por ejemplo, ver televisión o jugar en ciertos tiempos, algo que él no suele hacer porque no le queda tiempo. Adicionalmente, al investigar cuáles fueron los ítems más altos se pudo observar que son los que reportan problemas para dormir, constante cansancio y dificultad para hacer sus deberes escolares.

Conclusiones

y recomendaciones

A no posee habilidades superiores como lo sospechaban sus maestros, sin embargo su nivel de comprensión verbal y de razonamiento perceptual se ubican por encima del promedio, características que pueden haber influido en la suposición hecha por los profesores. La evaluación en el área emocional puede considerarse un eje fundamental de tratamiento, ya que A presenta una sobrecarga académica que perjudica su estado de ánimo y por ende su rendimiento académico. Esta afirmación se soporta en el análisis de los resultados obtenidos en las pruebas CDI y FTT, y es consistente al contrastarla con los auto reportes del niño acerca de su estado de ánimo durante las sesiones. Por otra parte, se debe concientizar a los padres del menor acerca de la importancia que tiene para los niños el tiempo de ocio y descanso. Las instituciones académicas, específicamente los docentes, deben actuar con la mayor prudencia posible frente a la sospecha de un niño con superdotación intelectual, evitando crear falsas expectativas en el menor y en sus padres. Antes de emitir un juicio concluyente es necesario remitir al menor a un centro de atención psicológica calificado en evaluación psicológica, para que sea allí donde se hagan las pruebas pertinentes para poder dar al niño y a su familia un informe válido y confiable. El evaluador debe ser muy cuidadoso en el momento de reportar los resultados evitando generar sentimientos de desilusión en el menor y/o en sus padres, como también que el proceso de evaluación cause efectos nocivos, por ejemplo, en este caso, donde se debe tener en cuenta que los padres de A tenían la fuerte esperanza de confirmar que su hijo era un niño “superdotado intelectualmente”. Es recomendable hacer una sesión dedicada a los padres donde se les ayude a comprender la importancia de tener en cuenta los deseos, anhelos y aspiraciones del niño como agente de su propia vida, para evitar que él caiga en una patología depresiva mayor u otros problemas psicológicos o sociales.

37


Referencias Abello, R., Amarís, M., Blanco, A., Madariaga, C., Díaz, D. & Arciniégas, T. (2008). Bienestar, autoestima, depresión y anomia en personas que no han sido víctimas de violencia política y social. Investigación & Desarrollo, 16(2), 214-231. American Psychological Association [APA]. (2014). Intelligence. Recuperado de: http://www.apa.org/topics/intelligence/. Ballesteros, S. (1999). Memoria humana, investigación y teoría. Psicothema, 11(4), 705-723. Beck, A. (1974). The development of depression: A cognitive model. En: R. Friedman, & M. Katz (Eds.). Psychology of depression: Contemporary theory and research. (pp. 3-27). Washington, D. C.: Winston-Wiley. Binet, A. y Simon, Th. (1905). Méthodes nouvelles pour le diagnostic du niveau intellectual des anormaux. L’Année Psychologique, 11(1), 191-244. Caballo, V. (2005). Manual para la evaluación clínica de los trastornos psicológicos: estrategias de evaluación, problemas infantiles y trastornos de ansiedad. España: Ediciones Pirámide. Castello, C. & de Batlle, C. (1998). Aspectos teóricos e instrumentales en la identificación del alumnado superdotado y talentoso. Propuesta de un protocolo. Faisca: Revista de altas capacidades, (6), 26-66. Castro, M. L. (2012). Niños de altas capacidades intelectuales: ¿Niños en riesgo 38

social? Recuperado de: http://elblogdehiara.files.wordpress.com/2012/03/

MEDIR Y EVALUAR

alta-capacidad-desafiante.pdf Consejo General de Colegios Oficiales de Psicólogos (s.f.). Evaluación del test WISC-IV. Recuperado de: https://www.cop.es/uploads/PDF/WISC-IV.pdf Coulacoglou, C. (2002). FTT, Test de los Cuentos de Hadas. Madrid: TEA Ediciones S.A. Davanzo, H. (2000). Estudio clínico inicial: (Primera entrevista). Revista chilena de neuropsiquiatría, 38(1), 44-50. Fernández-Ballesteros, R. (1997). Evaluación Psicológica y Test. En: A. Cordero & Colls, La Evaluación Psicológica en el año 2000 (pp. 11-26). Madrid: TEA ediciones, S.A. Golden, C. (1999). STROOP Test de colores y palabras. Tea Ediciones S.A. Guevara, B., Da Silva Nunes, C., & Borges, V. (2014). Evidências de Validade com base na estrutura interna no teste dos contos de fadas. Psico-USF, 19(1), 107-118. Herrera, E., Núñez, A., Tobón, S. & Arias, D. (2009). Análisis bibliométrico de la depresión infantil. Pensamiento psicológico, 5(12) 59-70.


Herreras, E. y Santos, J. (2006). Utilidad del Stroop en la psicología clínica. Avances en Salud Mental Relacional, (5)1. Kovacs, M. (2004). CDI Inventario de Depresión Infantil. Tea Ediciones S.A. Lara, M. A., Galindo, G., Romero, M., Salvador, J. & Domínguez, M. (2003). La figura compleja de Rey en adolescentes que consumen disolventes inhalables. Salud Mental, 26(6) 17-26. Recuperado de http://www.redalyc.org/articulo.oa?id=58262603 Londoño, L. (2009). La atención: Un proceso psicológico básico. Revista de la Facultad de Psicología Universidad Cooperativa de Colombia, 5(8) 91-100. Mora, J. A. & Martín, M. L. (2007). La escala de inteligencia de Binet y Simon (1905) su recepción por la Psicología posterior. Revista de Historia de la Psicología, 28(2/3), 307-313. Navarro, B. (s.f.). La Entrevista Clínica I [Presentación]. Universidad de Córdoba. Recuperado de: http://www.uco.es/informacion/webs/fundacioncastilla/documentos/ archivos/formacion-residentes/la-entrevista-clinica-i.pdf Nunes, M., Garcia, C., & Scortegagna, S. (2006). Evaluación psicológica en salud: contextos actuales. Estudios Sociales, 14(28), 137-161. Paba, C., Cerchiaro, E., & Sánchez, L. (2008). Identificación de estudiantes con altas capacidades en el Distrito de Santa Marta, Colombia. Universitas Psychologica, 7(1), 251-262. Piqueras, J. A., Martínez, A., Ramos, V., Rivero, R., García, L., & Oblitas, L. (2008). Ansiedad, depresión y salud. Suma Psicológica, 15(1), 43-73. Rey, A. (2009). Test de copia y de reproducción de memoria de figuras complejas de Rey. 9a edición. Madrid: TEA ediciones, S.A. Rodríguez de Alba, U. & Suárez, Y. (2012). Relación entre inteligencia emocional, depresión y rendimiento académico en estudiantes de psicología. Psicogente, 15(28), 348-359. Sastre-Riba, S. (2008). Niños con altas capacidades y su funcionamiento cognitivo diferencial. Revista de Neurología, 46, 11-16. Segura, S., Posada, S., Ospina, M. L. & Ospina, H. (2010). Estandarización del inventario CDI en niños y adolescente entre 12 y 17 años de edad, del Municipio de Sabaneta del Departamento de Antioquia-Colombia. International Journal of Psychological Research, 3(2), 63-73. Sola, S. (2013). Memoria mediática y construcción de identidades. Tabula Rasa, (19), 301-314. Thurstone, L. L. (1938). Primary mental abilities. Psychometric monograph No.1. En: H. J. Eysenck. The Measurement of Intelligence (131-136). Chicago: Springer Netherlands Tribunal Nacional Deontológico y Bioético (2012). Manual deontológico y bioético del psicólogo – Tercera versión. Recuperado de: http://www.colpsic.org.co/quienessomos/normatividad/20 Wechsler, D. (2005). WISC-IV, escala Wechsler de inteligencia para niños. México: Manual Moderno.

39


LA INFLUENCIA DE FRANCIS G A LT O N E N L A C O N S O L I D A C I Ó N DE LA PSICOLOGÍA COMO DISCIPLINA CIENTÍFICA Fr a n c i s G a l t o n’ s i n f l u e n c e i n t h e c o n s o l i d a t i o n o f p s yc h o l o g y a s a scientific discipline

R esu m en

MEDIR Y EVALUAR

40

El presente artículo explora los inicios formativos, las influencias y el extenso trayecto académico del polímata Sir Francis Galton. Su amplio recorrido investigativo le ha sido merecedor de ser reconocido como el padre de la Psicometría y/o la Psicología Diferencial. Francis Galton desarrolló métodos cuantitativos y los aplicó en sus estudios sobre la herencia, publicados en su obra Hereditary Genius (1869). Además, el uso de test mentales, escalas de rango, cuestionarios estandarizados, coeficientes de correlación y regresión, y la aplicación de la curva de distribución normal en la medición de atributos psicológicos sobre grandes muestras de individuos han sido algunos de los logros de Galton, los cuales han

tenido repercusión hasta el día de hoy. El científico inglés, también, desempeñó un importante papel en el desarrollo de la Psicología Americana a través de su discípulo James M. Cattell, al igual que tuvo una notable influencia en el trabajo investigativo de científicos como Spearman, Cronbach, Thurstone y Burt.

Palabras clave: Francis Galton, psicología diferencial, psicometría, antropometría,


Leonardo Moreno Naranjo / lmorenon@unal.edu.co Javier RodrĂ­guez Cajamarca / fjrodriguezc@unal.edu.co Estudiantes de PsicologĂ­a Universidad Nacional de Colombia, sede BogotĂĄ

A b stract

This article explores the formative beginnings, influences and the broad academic path of the polymath Sir Francis Galton. His extensive research route gave him the recognition as the father of psychometrics and/or Differential Psychology. Francis Galton developed quantitative methods and applied them in his heredity studies published in his book Hereditary Genius (1869). In addition, some of the greatest achievements of Galton are: use of mental tests, scales range, standardized questionnaires, correlation and regression coefficients and the application of the normal distribution curve in measuring psychological attributes on larger samples of in-

41

dividuals, all of them have impacted psychology even these days. British scientist also plays an important role in the development of American psychology through his disciple James M. Cattell, as a significant influence on the research work of scientists like Spearman, Cronbach, Burt and Thurstone..

Keywords: Francis Galton, differential psychology, psychometry, anthropometry, heritage.


MEDIR Y EVALUAR

42

La psicología, desde sus inicios, tuvo raíces en distintas disciplinas académicas, las cuales se interesaron en entender al ser humano y sus facultades psicológicas. Por un lado, la filosofía de corte empirista tuvo gran interés en comprender cómo aprendemos a través de las sensaciones e ideas, dando pautas generales de lo que sería la primera aproximación científica del estudio de las asociaciones de ideas y la conciencia. Entre tanto, gracias al desarrollo en la ciencias biológicas con la teoría de la evolución de Darwin, se empezó a considerar que el ser humano estaba regido por aquellos principios evolutivos y que solo era parte de un largo proceso de selección natural (Pueyo, 1997). Coincidencialmente, esta teoría se interesó en el organismo humano y aportó un principio, que, aunque era evidente para muchos pensadores de la antigüedad, le dotó de un significado funcional y/o adaptativo: la variabilidad de la conducta. Si bien este es un postulado general para todos los seres vivos, en los humanos cobra gran importancia ya que la gran diversidad de estilos comportamentales sugiere que existe cierta flexibilidad en la adaptación de distintos ambientes, esto le permitió al hombre sobrevivir y fundar civilización alrededor del globo. Estas ideas suscitaron el interés en muchos científicos de diferentes áreas, quienes intentaron dar sustento empírico a estos supuestos teóricos, e incluso darles una aplicación social. Un primer paso para la comprensión del fenómeno de la variabilidad en los humanos fue el de tomar medidas descriptivas de distintos rasgos (Galton, 1896 & Goldstein, 2012). Para este tipo de tarea, la metodología cuantitativa era esencial al momento de condensar y representar los datos obtenidos de los distintos individuos (Goldstein, 2012). Es por esto que la estadística surge como una herramienta imprescindible para el estudio de las diferencias individuales y, a su vez, sirve de justificación empírica de las nacientes ciencias sociales a finales del siglo XIX. Es, en esta época, donde surge una de las figuras más reconocidas en el campo de la antropometría y la psicometría: Sir Francis Galton (Pueyo, 1997). En este trabajo se analizarán algunos de los aportes que realizó Francis Galton (Ver figura 1) en relación con la consolidación de la nueva ciencia del comportamiento y la mente. Aunque, originalmente, Galton no fue un psicólogo, se puede llegar a vislumbrar que tuvo un profundo impacto en sus discípulos, especialmente, en el área de la psicología correlacional (Cronbach, 1957). De igual modo, el afán por aplicar sus conocimientos al sistema social llevó a Galton y a sus seguidores a conformar una nueva doctrina conocida como la eugenesia, en la que la selección de rasgos ideales, sería el principio fundamental para formar una sociedad perfecta (Godin, 2007).


Figura 1. Francis Galton (1822-1909).

Reseña Biográfica Como se ha señalado, los múltiples aportes de Galton –Científico inglés nacido el 16 de Febrero de 1822– ayudaron al inicio y la consolidación de numerosas disciplinas, llegando a ser reconocido a los 87 años de edad –tres años antes de su muerte el 17 de enero de 1911 en Haslemere– con el título de Sir otorgado por el Reino Británico. Retrocediendo un poco más, ya sobre la edad de 22 años, entre el período transcurrido desde 1844 y hasta 1864, el joven científico luego de terminar sus estudios en el King's College de la Universidad de Londres y en el Trinity College de Cambridge, se centra en estudios geográficos y meteorológicos (Pueyo, 1997), sacando provecho de los viajes que realizó por el continente africano, más exactamente en Sudáfrica (1845-46) y en Damaraland (1850). Dichas exploraciones repercutirían, posteriormente, en el desarrollo de sus investigaciones sobre las capacidades individuales al notar como destacaban ciertas peculiaridades mentales en las diferentes razas; del mismo modo, los postulados teóricos de su primo Darwin ejercerían una influencia notable al momento de abordar estos temas. Más adelante, como resultado de estos viajes, publicaría, años después: Explorer in Tropical South Africa (1853) y Arte de viajar (Art of Travel, 1855). Posteriormente, entre los años 1865 y 1899, como lo señalan sus discípulos, se dedicó a estudiar a fondo las diferencias individuales y la relación que ocupa la herencia en este aspecto. Es así, como durante estos años, específicamente en 1883, escribió Inquiries into human faculty and it’s development, el cual, para Burt, representa la obra de

43


Galton más importante para la psicología, donde se analizan las diferencias individuales en la personalidad, como efecto conjunto de dos factores distintos aunque complementarios: Natura (factores biológicos) y Nurture (factores ambientales) (Pueyo, 19997). Así pues, gracias a los estudios que desarrolló con gemelos, Galton concluye, en esta obra, que los factores Natura cobran más relevancia sobre los Nurture cuando las diferencias en los factores ambientales no exceden las diferencias de crianzas normales que tienen las personas que pertenecen a un mismo nivel social (Pueyo, 1997). Luego, durante este mismo período, en 1875, Galton hace pública su teoría de la herencia; a su vez, en 1884, pone en funcionamiento el primer laboratorio de psicología experimental en Inglaterra, enfocado en la antropometría (Ver figura 2); allí, trabajaría con J. M. Cattell (Ver Imagen 3) y, en 1889, publicarían los análisis de los resultados obtenidos, con el fin de sustentar su teoría de la herencia que, en años posteriores, sería rechazada.

MEDIR Y EVALUAR

44

Figura 2. Portada de

Figura 3. James Mackeen

Hereditary Genius (1869).

Cattell (1860-1940).

Por último, algunos autores señalan una etapa final entre 1900 y 1911, caracterizada por la dedicación a la eugenesia de la que ya hemos hecho mención y su esmero por establecer modelos aplicados de sus investigaciones (Pueyo, 1997). Con todo, Sir Francis Galton, conocido como el padre de la estadística psicológica o psicometría, realizó aportes esenciales en el desarrollo de técnicas para el estudio de las diferencias individuales, test mentales, escalas de rango, cuestionarios estandarizados, coeficientes de correlación y regresión, y la aplicación de la curva de distribución normal (Burt, 1962).


M e to d o lo g í a

en el trabajo de

G a lt o n

Resulta notable, en los trabajos empíricos de Galton, su interés por la precisión de sus datos, considerando que él mismo fue pionero en el uso de distintos métodos estadísticos para estudiar diferentes variables asociadas a las capacidades del hombre, tanto físicas como mentales. En su obra más importante, Hereditary Genius (1869) (Ver figura 4), Galton describe una serie de procedimientos estadísticos para dar sustento a su teoría de la heredabilidad de las habilidades naturales del hombre. Para ello, consideró distintas variables que le permitieran cuantificar esos “dones” naturales del hombre, entre esas variables tuvo en cuenta el nivel de reputación como indicador de buenas habilidades de carácter heredable. Por esta razón, Galton usó una muestra de distintos grupos sociales, entre los que se encontraban jueces, estudiantes y profesionales de otras áreas.

45

Figura 4. Laboratorio de Antropometría de Francis Galton.

Ahora bien, la reputación no solamente consta del reconocimiento público; por eso, Galton tuvo en cuenta una lista de variables en la que los hombres se pudieran considerar ilustres; en primer lugar, postuló que la eminencia se podía medir en cuanto a una proporción de “un hombre en un millón” (Galton, 1869); de igual manera, empleó un test de habilidad para confirmar sus sospechas y, de esta manera, poder usar la ‘eminencia’ como criterio para evaluar los dones naturales. Para recoger este tipo de datos, lo haría examinando la vida profesional y social de los participantes de su estudio y estimaría este indicador según la proporción de méritos obtenidos por cada individuo. Por otra parte, Galton utilizó otro criterio de clasificación, el cual consistió en evaluar a los hombres por sus dotes naturales. En este aspecto, Galton menciona que las formas de clasificar que se habían


MEDIR Y EVALUAR

46

venido usando son ineficientes, dado que, de antemano, presentan una pretensión de equidad natural entre los hombres. Aunque Galton acepte, en parte, que existe una gran influencia de la educación y del poder de la práctica en el desarrollo de las habilidades mentales, él afirma que existe un máximo rendimiento, el cual es cuantificable y no puede superarse con la práctica de estas habilidades. De igual manera, sugiere que las habilidades están limitadas a pocos dominios donde los hombres alcanzan gran reputación, en otras palabras, estipula que existen diferencias intelectuales y que la preferencia por un dominio determinará la forma en que se explotan las habilidades naturales, esta última característica, afirma él, está presente en los genios. Igualmente, Galton, al revisar datos estadísticos sobre calificaciones de estudiantes universitarios, sugiere que la inteligencia manifiesta cierta tendencia a la media, esbozando, así, la idea de que la inteligencia presenta una distribución normal, adelantándose, en este sentido, a los científicos de su época. Para comprobar sus hipótesis sobre la teoría de la heredabilidad del ingenio, partiendo de un estudio inductivo (estadístico), Galton escogió una muestra por conveniencia de ingleses y sus redes familiares; pero, debido a la enorme diversidad de intelectos ingleses, decidió clasificar a los hombres de acuerdo con sus habilidades naturales, poniéndolos en clases separadas con igual grado de ‘mérito’. El método que Galton utilizaría, sería pionero en los estudios de inteligencia, puesto que se basaría en la aplicación de varios constructos estadísticos derivados de la ley de desviación a la media; esta metodología sería predecesora de los modernos análisis estadísticos sobre diferencias individuales e, incluso, tendría influencia sobre la creación de diseños experimentales en psicología básica. Asimismo, desarrolló las nociones básicas de correlación entre variables, pues, en su estudio trató de identificar y relacionar las medidas de las características de padres e hijos, este aspecto es esencial para comprender la manera en que Galton esperaba demostrar sus hipótesis sobre la herencia, además de dar paso a todo un desarrollo técnico sobre pruebas de correlación y análisis de regresión estadística (Goldstein, 2012). También es pertinente mencionar que Galton consideró varios sesgos que pudieran surgir durante sus estudios; el más importante consistía en que era posible que él estuviera sesgado por su teoría y, así, solo buscaría datos que la validarán; sin embargo, él apeló que sus pruebas estadísticas eran imparciales y presentaban pequeños márgenes de error, en otras palabras, confiaba plenamente en la precisión de sus mediciones, ya que, por experiencia, sabía de la eficacia de las pruebas estadísticas aplicadas en contextos sociales (Galton, 1869).


La

i m p o r ta n c i a d e l a ta x o n o m í a e n s u s i n v e s t i g a c i o n e s

Dentro de sus estudios, como ya lo hemos esbozado, Galton se enfrentó a la necesidad de medir las variables para que sus posteriores análisis tuvieran la rigurosidad necesaria y se consideraran factibles. Por ello, una vez iniciado su trabajo acerca de la heredabilidad del ingenio (plasmado en su obra Hereditary genius en 1869), con cerca de 300 familias, el científico británico empezó a clasificarlas de acuerdo con su rango de parentesco y sus profesiones. Entre estas familias, Galton identificó 977 hombres eminentes, dentro de los cuales denominó ilustres a 415, debido a que poseen características cognitivas superiores, al igual de contar con reconocimiento en su campo. En este punto, hay que señalar que Galton decidió no incluir hombres eminentes de los cuales no logró obtener mayores datos de sus familias. Los grados familiares con los que contó Galton en su estudio se agruparon, inicialmente, con el padre; luego con el hermano, el hijo, el abuelo, el tío; en seguida, con los sobrinos, los nietos, el bisabuelo, el tío abuelo, el primer primo, el sobrino nieto, el bisnieto; en una última casilla, incluyó a todos los demás. Siguiendo con su clasificación, el investigador británico seleccionó 8 profesiones notables de su época y las puso en un mismo plano, sin ningún grado de relevancia una de la otra. Las profesiones seleccionadas fueron: jueces, estadistas, comandantes, literatos, científicos, poetas, artistas y teólogos. Una vez tabulados los datos, Galton identifica que, independientemente, de la profesión de los hijos, hay un mayor número de individuos eminentes que en los grados de padres y hermanos (con particularidad en los comandantes), ese mismo descenso sigue por debajo del grado de hijo, aun cuando, en la categoría de tercer grado, los sobrinos, en todas las profesiones, exceptuando a los teólogos, logran tener la tasa más alta de eminencia dentro de los familiares de tercer grado o más (Galton, 1869). Posteriormente, Galton analizó, en su libro, algunos casos llamativos en su diagrama de datos e indagó las posibles causas de estos. Por ejemplo, señala el caso en el que resulta haber pocos hijos eminentes en la profesión de comandante; esto lo resuelve arguyendo que dentro de la vida militar es mucho más difícil conseguir pareja y, por tanto, generar descendencia. No obstante, se muestra un hecho interesante: no se presenta una variación notable con respecto a las otras profesiones en el grado de nietos; esto se debe, según el científico inglés, a que la superioridad de raza de los altos militares en el ejército, pese a tener pocos hijos, estos logran tener descendencia que, en su mayoría, logra ser eminente.

47


A su vez, explica la razón por la cual, según él, hay un número mucho mayor de hijos eminentes (60) en relación con la cantidad de padres con igual grado (26) en la profesión científica; esto se debe a que, inicialmente, el primer hombre de ciencia en la familia no proyecta mayores posibilidades de llegar a ser eminente y, por tanto, solo se dedica al ámbito formal y profesional de su cargo. Otro dato particular, explicado por Galton, es el de los artistas que muestran altos índices de eminencia en la categoría de hermanos e hijos; esto representa un dato clave para sugerir que el talento es heredado y se potencializa con la preparación profesional (Galton, 1869). Siguiendo con sus conjeturas, Sir Francis Galton menciona que la capacidad que tienen los hombres eminentes para conseguir pareja es notable puesto que, al parecer, se relacionan con su equivalente femenina, refiriéndose a las potenciales capacidades cognitivas, afectivas y conativas. Igualmente, menciona a los hombres cuyas capacidades físicas o sociales no son las mejores y que no logran tener descendencia con una mujer de buenas capacidades, quizás, por la misma razón de que sus rasgos son débiles. Sin embargo, Galton encuentra que algunos genios no generan descendencia, posiblemente, por la dedicación total a su trabajo o, incluso, como lo sugiere Prosper Lucas (Galton, 1869), sobre la infertilidad de los de prodigioso intelecto haciendo una comparación entre los gigantes y los enanos que, de igual manera, no se ven regularmente en la sociedad. De esta manera, Galton propone un trabajo pionero que se convertiría en un hito del estudio científico de las diferencias individuales (Godin, 2007). 48

MEDIR Y EVALUAR

El

legado de

mación de la

G a lt o n : e l pa p e l d e C at t e l l P s i c o lo g í a A m e r i c a n a

en la confor-

El trabajo de Galton suscitó la fascinación de muchos investigadores alrededor del mundo, incluso aunque su interés inicial no estaba enfocado en la nueva ciencia psicológica, sus estudios tuvieron gran impacto en la concepción de las habilidades mentales y las diferencias individuales (Eysenck, 1947; Cronbach, 1957; Pueyo, 1997; Goldstein, 2012). Por un lado, otorgó, a varios investigadores, la metodología necesaria para adelantar sus estudios y comprobar sus hipótesis de manera precisa; además de identificar, cuantificar y medir variables de carácter psicológico, las cuales apenas estaban cobrando importancia en la naciente psicología científica. De igual forma, gracias a la observación de correlaciones entre las variables que tuvo en cuenta en sus estudios, pudo inferir ciertas variables latentes, las cuales indicaban que existía algún factor relevante que intervenía en la variación de sus medidas. Bajo estas ideas, Spearman (1904) propone un nuevo modelo estadístico para estudiar la estructura de las facultades mentales.


Este modelo fue conocido como el análisis factorial, que, a su vez, se convertiría en el modelo estándar del estudio de las diferencias individuales, aplicado tanto para analizar la personalidad (Cattell, 1957; Eysenck, 1947) como para examinar la inteligencia (Spearman, 1904; Thurstone, 1924; Guildford, 1967). Si bien el trabajo de Galton atrajo la atención de muchos investigadores sociales, uno de sus seguidores prolongaría su legado en Norteamérica y continuaría su trabajo desde la psicología diferencial; se trató de James Mckeen Cattell, quien, gracias a sus experiencias con Galton, logró introducir nuevas técnicas estadísticas y de medición objetiva en la naciente psicología americana, además de acuñar el concepto de test mental (Pueyo, 1997). Cattell también es conocido como el más grande divulgador de la obra de Galton en América, así como un férreo defensor de sus ideas eugenésicas, promoviendo el uso de distintos métodos objetivos para evaluar la “calidad” de los hombres (Godin, 2007). De igual manera, Cattell promovió la imagen de la psicología como disciplina objetiva, ya que él creía que los métodos cuantitativos son una pieza clave para comprender la mente humana, más allá de los métodos introspeccionistas reinantes de su época (Cattell, 1917). Dentro de su trabajo investigativo, Cattell continuó realizando estudios estadísticos sobre capacidades mentales; en este aspecto, desarrolló una investigación con científicos americanos siguiendo la tradición galtoniana sobre estudios de grandes poblaciones (Cattell, 1906); en este estudio, Cattell recopiló información de cerca de 4000 científicos americanos de su época de las más variadas disciplinas, incluyendo los criterios de reputación (nivel de formación, número de publicaciones, pertenencia a comunidades académicas, méritos, etc.) para seleccionar su muestra de científicos, de modo similar a los procedimientos que realizó Galton en Hereditary Genius (1869). A través de esta investigación se reveló la distribución de científicos en diferentes áreas académicas logrando, también, identificar el desempeño de los hombres de ciencia en cuanto a sus profesiones (Cattell, 1906). Además de aportar nuevos hallazgos a la reciente disciplina psicológica, Cattell tuvo un papel esencial en la divulgación y acreditación de esta nueva ciencia, en parte, gracias a que colaboró en la fundación de las revistas Science y Psychological Review; igualmente, era miembro activo de la American Psychological Association. Su labor no solo se reducía a la divulgación sino que él creía que la psicología científica debería tener un papel preponderante en las distintas áreas de la vida social, empezando por la reformulación de la educación y la selección de estudiantes aptos para cada profesión por medio de métodos objetivos y científicamente reconocidos (Cattell, 1917; Pueyo, 1997; Goldstein, 2012).

49


C o m e n ta r i o s

finales

La vida y obra de Sir Francis Galton, a pesar de estar sometido a diferentes controversias, especialmente por su relación con la eugenesia, no para de representar un gran avance en la ciencia del siglo XIX. La visión de Galton fue esencial en la aplicación de los métodos estadísticos que usó en sus investigaciones sociales; de igual manera, no solo se restringió a sus constructos metodológicos, sino que creó todo un cuerpo teórico acerca de las diferencias individuales, hecho que dominaría el interés de muchos investigadores alrededor del mundo, especialmente de los psicólogos diferenciales. Por esta razón, el aporte de Galton resulta inconmensurable, en la forma en que dotó de métodos lo suficientemente precisos a una ciencia que apenas estaba acreditándose en la comunidad académica. Igualmente, gracias a que algunos seguidores continuaron su legado científico, se logró desarrollar toda una serie de métodos cuantitativos para medir las diferencias individuales, los cuales, actualmente, gozan de una alta precisión y son reconocidos en los distintos campos de la psicología aplicada y la psicometría. Así pues, para entender la contribución de Galton a la psicología, es necesario comprender tanto su legado, como el papel de sus discípulos, quienes continuaron su trabajo después de su muerte.

MEDIR Y EVALUAR

50


Referencias Burt, C. L. (1962). Francis Galton and his Contributions to Psychology, British Journal of Statistical Psychology, 15(1), 1-49. Cattell, J. M. (1906). A statistical study of American men of science. The selection of a group of one thousand men. Science 24, (621), 658-665. Cattell, J. M. (1917). Our psychological association and research, Science, 45(1160), 275-284. Cronbach, L. J. (1957). The two disciplines of scientific psychology. American Psychologist, 12, 671-684. Eysenck, H. J. (1947). Dimensions of Personality. Londres: Paul Kegan,Trench, Trubner & Co. Ltd. Galton, F. (1869). Hereditary Genius. Londres: Macmillan & Co. Gardner, H. (1983). Frames of mind: The theory of multiple intelligences. Nueva York: Basic Books. Godin, B. (2007). From eugenics to scientometrics: Galton, Cattell, and men of science. Social studies of science, 37(5), 691-728 Goldstein, H. (2012). Francis Galton, measurement, psychometrics and social progress. Assessment in Education: Principles, Policy & Practice, 19(2), 147-158. Guilford, J. P. (1967). The nature of human intelligence. Nueva York: McGraw-Hill. Pueyo, A. (1997). Manual de psicología diferencial. México: McGraw-Hill. Spearman, C. (1904). ‘General intelligence’ objectively determined and measured. American Journal of Psychology 15(2), 201-293. Thurstone, L. L. (1924/1973). The Nature of Intelligence. London: Routledge.

51


E S T U D I O E X P E R I M E N TA L D E LA RELACIÓN ENTRE LA VA L E N C I A Y E L R E C O B R O D E IMÁGENES EN UN GRUPO DE E S T U D I A N T E S U N I V E R S I TA R I O S Experimental study of the relationship between the valence and recall of pictures in a group of college students

R esu m en

MEDIR Y EVALUAR

52

En el presente artículo, se intenta encontrar mayor evidencia acerca de la relación entre la valencia de las imágenes (positiva, negativa y neutra) y el recobro de las mismas. Se empleó un diseño experimental intrasujeto, con una muestra de 30 personas (14 hombres y 16 mujeres) entre los 18 y los 26 años, con una edad media de 20,51, a los que se les aplicó una batería de imágenes de diferente valencia, con una posterior prueba de reconocimiento. En cuanto al análisis de datos, se utilizó el test de Friedman con la corrección Bonferroni (Técnica estadística que ajusta el nivel de significación en relación con el número de

pruebas estadísticas realizadas simultáneamente sobre un conjunto de datos.), ya que no se cumplió el supuesto de normalidad, el cual dio como resultado que las imágenes de valencia negativa y neutra fueron significativamente más recordadas que las de valencia positiva. Estos resultados concuerdan con la bibliografía encontrada, sin embargo es necesario controlar más variables para obtener resultados más confiables.

Palabras clave: memoria, emoción, valencia, recobro.


Estefanía Bedoya Lozano / ebedoyal@unal.edu.co Pablo Castrillón Camacho / pcastrillonc@unal.edu.co Wilson M. Madariaga Calderón / wmmadariagac@unal.edu.co Valentina Umaña Arenas / vumanaa@unal.edu.co Estudiantes de Psicología Universidad Nacional de Colombia, sede Bogotá

A b stract

The present article attempts to clarify the relationship between picture valence (positive, negative and neutral) and the recall thereof. A within-subject experimental design was used with a sample of 30 people (14 men and 16 women) between 18 and 26 years, with a mean age of 20.51, to which were applied a set of images of different valence, with a subsequent recognition test. For analysis of data the Friedman test with Bonferroni correction was used since no norma-

53

lity assumption was fulfilled, the result of which was that the images of negative and neutral valence were significantly recall in greater degree than positive valence. These results are consistent with the literature found, however is necessary to control more variables to obtain more reliable results.

Keywords: memory, emotion, valence, recall.


MEDIR Y EVALUAR

54

Desde hace varios años, en el campo de la neurociencia cognitiva, se ha venido trabajando la relación existente entre la memoria y la emoción, y la manera como esta última puede influir en el desempeño de las tareas de aprendizaje y en el recuerdo de eventos de la vida cotidiana. La memoria puede ser considerada como un mecanismo adaptativo, funcional en la supervivencia de los organismos, pues evita conductas de riesgo y permite la rápida reacción en situaciones de peligro (Yegiyan & Yonelinas, 2011). Paralelamente, para efectos del presente trabajo, se entenderá como emociones a ciertos estados perceptivos manifestados, que podrán ser de placer o displacer, los cuales siempre irán acompañados de respuestas biológicas y cognitivas (Aguado, 2002). Con respecto a la memoria emocional, esta se define como el resultado de la adquisición, almacenamiento y evocación de la huella emocional producida en un suceso determinado (Cahill & McGaugh, 1998). También puede ser entendida como un producto del almacenamiento de la información que está acompañada por factores de alarma o alerta, los cuales permiten una mejor consolidación de dicha información en la memoria (Justel, Psyrdellis & Ruetti, 2013). Dolcos, Labar y Cabeza (2004) estudiaron el recobro de imágenes en función de su grado de activación emocional y descubrieron que las imágenes que son más activantes, independientemente de su valencia, se recobran mejor que las imágenes neutras. Y dentro de las imágenes altamente activantes, se ha encontrado que la información negativa se recuerda mejor. Es posible que la distinción esté relacionada con la zona cerebral que codifica la información, pues las imágenes de contenido negativo se asocian con regiones de procesamiento sensorial como la corteza visual y el giro fusiforme. En contraste, la codificación de imágenes positivas se relaciona con la corteza prefrontal lateral y las regiones temporales asociadas al procesamiento de información semántica y conceptual (Yegiyan & Yonelinas, 2011). Una posible explicación de lo anterior, radica en el hecho de que, detectar lo antes posible un peligro y reaccionar ante él, es fundamental para la supervivencia, pues los eventos evolutivamente más significativos, como los relacionados con amenaza y peligro, deben ser prioritarios en el procesamiento. (Gordillo et al., 2010). Respecto a los contenidos positivos, la literatura no es tan clara, ya que se ha encontrado que estos son mejor recordados que los neutrales, mas, en menor medida, en comparación con la información negativa (Yegiyan & Yonelinas, 2011).


Como se puede observar, distintos autores han obtenido resultados contradictorios. Estas diferencias podrían explicarse por la metodología utilizada en cada uno de los experimentos y las variaciones en los componentes de la tarea experimental, los cuales tienen que ver con la manera como se presenta el estímulo, el tipo de codificación que se espera y los tiempos de exposición y retención de la tarea (Gordillo et al., 2010). Así mismo, el efecto de la emoción sobre la memoria puede variar según el tiempo que pasa desde que el sujeto codifica la información hasta que la recupera (Quevedo et al., 2003). Por ejemplo, periodos de retención cortos han sido poco documentados, pues la principal dificultad es la presentación del efecto techo, el cual hace referencia a que la tasa de aciertos es tan elevada que no es posible distinguir si es por efecto de la valencia de la información o por el corto tiempo que ha transcurrido entre la fase de exposición y la de recuperación. Igualmente, la manera como se pide que sea recuperada la información influye en los resultados, pues, en tareas de recuerdo libre, se ha evidenciado una tendencia a recordar mejor los estímulos y acontecimientos negativos, y con menor frecuencia los positivos y los neutros. Sin embargo, en tareas de reconocimiento, los resultados parecen menos claros. Algunas investigaciones que ponen a prueba la discriminación entre imágenes poco agradables e imágenes agradables, no encuentran una diferencia significativa (Gordillo et al., 2010), mientras que otros encuentran mayor discriminación en imágenes desagradables y otros para las agradables. Por otro lado, al estudiar el recobro de la información negativa, también se ha estudiado su fragilidad, debido a su papel influyente en la aparición de falsas memorias. Esta fragilidad y capacidad de recobro de la información negativa se ha llamado hipótesis paradójica de la emoción negativa (Porter, Spencer & Birt, 2003). Además, se ha planteado el paradigma de la desinformación (misinformation paradigm), el cual se refiere a la disminución de la precisión del recobro en la memoria, inducido por la presentación de información engañosa; esto explica el poder de la sugestión en el recobro (Van Damme & Smets, 2014). El paradigma de la desinformación se compone de tres fases. La primera consiste en que los participantes observan un evento (palabras, imágenes, videos). Posteriormente, en una segunda fase, los participantes son expuestos a información engañosa acerca del evento antes observado (palabras, imágenes, videos o preguntas que agregan información similar pero no igual a la ya expuesta). Por último, en la tercera fase, se les presenta a los participantes una prueba de me-

55


MEDIR Y EVALUAR

56

moria sobre los eventos inicialmente presentados. Este poder sugestivo de la nueva información puede llegar a implantar falsos recuerdos de eventos completos (Frenda, Nichols & Loftus, 2011). Paralelamente, se ha observado en estudios fisiológicos, que durante las situaciones con alto contenido emocional, se liberan hormonas adrenales, tales como la adrenalina y los glucocorticoides, los cuales pueden afectar, de manera diferencial, el desempeño en las tareas de aprendizaje, dependiendo del momento en que sean segregadas tales hormonas. Por ejemplo, inmediatamente después del entrenamiento, la aplicación de estas hormonas, facilita la memoria de eventos emocionalmente significativos; inversamente, los glucocorticoides aplicados antes de la prueba de retención o de recobro, deterioran la recuperación o evocación de la información previamente adquirida (Ruetti, Mustaca & Bentosela, 2008). Por consiguiente, la respuesta emocional puede ser incitada por medio de dos vías paralelas: una vía de acceso rápido, conocida como la vía simpático-adrenal-medular (SAM), donde el hipotálamo desencadena la activación de las glándulas adrenales (particularmente la región medular de dichas glándulas), liberando así las mencionadas catecolaminas en sangre. Por otra parte, la vía hipotálamo-pituitaria-glándulas adrenales (HPA), genera un aumento, por parte del hipotálamo, de la liberación de la hormona liberadora de corticotrofina y arginina vasopresina, las cuales aumentan, en la hipófisis, la producción de drenocorticotrofina en la circulación del cuerpo humano. Esta última actúa sobre la corteza de las glándulas adrenales, induciendo la síntesis y liberación de glucocorticoides, en particular del cortisol, los cuales, como se mencionó anteriormente, facilitan o deterioran el recuerdo de eventos emocionalmente significativos (Justel, Psyrdellis & Ruetti, 2013). En estudios con animales, se han obtenido resultados similares, que demuestran que el estrés puede afectar la función hipocampal, impidiendo la consolidación de la memoria a largo plazo; lo anterior podría explicar el bajo reconocimiento de fotografías con niveles de activación muy altos, debido al estado de estrés generado en los sujetos, el cual tiene repercusiones en la memoria y se hacen evidentes en la fase de recuperación de la información (Gordillo et al., 2010). Adicionalmente, se ha relacionado a la amígdala con la integración de la información sensorial acerca de estímulos emocionalmente significativos, a través de rutas corticales y subcorticales de procesamiento, mediante las cuales se elaboran reacciones defensivas integradas a estímulos aversivos a través del control de centros de respuesta autonómica y motora. Algunas de estas rutas corticales y subcorticales, integran el hipocampo y, en


general, los lóbulos frontales que son importantes para la adquisición y supresión de asociaciones de miedo (Labar, 2007). Adicionalmente, cabe resaltar que este estudio es pertinente dado que busca esclarecer la relación existente entre la valencia de las imágenes y el recuerdo posterior, ya que la literatura es contradictoria en cuanto a los resultados encontrados en experimentos anteriores. De acuerdo con toda la información presentada, se busca identificar el efecto del contenido de una serie de imágenes en la consolidación de la memoria emocional, haciendo uso de una batería de imágenes categorizadas según su valencia, la cual puede ser positiva, negativa o neutra mediante una prueba de reconocimiento, la cual evalúa la cantidad de respuestas correctas según la valencia de la imagen. Se espera que las imágenes de valencia negativa sean significativamente más recordadas que las positivas y las neutras.

M é to d o P a r t i c i pa n t e s En este estudio participaron 30 estudiantes de la Universidad Nacional de Colombia de diferentes carreras (14 hombres y 16 mujeres) entre los 18 y los 26 años, con una edad media de 20,51.

I n s t ru m e n to s Para medir la variable dependiente (número de imágenes recordadas por cada valencia) se utilizó el Test de discriminación de imágenes con contenido emocional construido por los autores del presente artículo, el cual consiste en la presentación de 30 imágenes (10 negativas, 10 positivas y 10 neutras) ; luego se realiza una prueba de distracción de tres ítems; por último, se presenta una prueba de reconocimiento con 60 imágenes1¹.

P ro c e d i m i e n to Primero, se realizó un diseño intrasujeto en el cual se tomó como variable independiente la valencia de las imágenes, ya sea positiva, negativa o neutra; y como variable dependiente se mide el número de aciertos en el recobro de imágenes de cada valencia, en una prueba de reconocimiento. Con el fin de poder atribuir el resultado de las mediciones a la manipulación de la variable independiente, se controlaron algunas de las variables que podrían afectar el resultado del experimento; estas se muestran en la Tabla 1, junto con el método que se utilizó para su control.

1 Ver Anexo 1. Media de las imágenes escogidas de la prueba piloto, ubicada en los apéndices del artículo.

57


VARIABLE A CONTROLAR Efecto de primacía y recencia

Control mediante aleatorización

Tiempo de exposición de las imágenes

Fase de exposición: 3 segundos. Fase de reconocimiento: 4 segundos.

Orden de presentación de las imágenes

Aleatorización por bloques de las imágenes.

MEDIR Y EVALUAR

58

MÉTODO DE CONTROL

Tabla 1. Variables controladas en el experimento.

Con anterioridad y con el fin de escoger las imágenes que se iban a utilizar en el experimento, se realizó una prueba piloto donde se presentó, a 30 participantes, una batería de 60 imágenes de forma aleatoria; posteriormente, se les pidió que calificaran cada imagen dentro de una escala de 1 a 5, donde 1 era “negativo” y 5 “positivo” y los puntajes intermedios, “neutro”. De este modo, se hizo una selección final de las 30 imágenes que representaran mejor cada valencia. Posteriormente, con los datos de la prueba piloto se desarrolló el instrumento Test de discriminación de imágenes con contenido emocional, el cual consta de 3 fases; en la primera se le presentó a los sujetos las 30 imágenes escogidas en la prueba piloto (10 positivas, 10 negativas y 10 neutras) de manera aleatoria con una exposición de 3 segundos por cada imagen. Posteriormente, en la fase de distracción, se les pidió a los participantes que realizarán tres ejercicios de razonamiento por un periodo de cinco minutos. Finalmente, en la fase de reconocimiento, se le pidió a los participantes que identificaran, dentro de una presentación de 60 imágenes, cuáles de estas fueron presentadas en la primera fase del experimento y cuáles no aparecieron previamente.

R e s u lta d o s En el análisis, no se cumplieron los supuestos de normalidad, por ello se usó la prueba de Friedman, con el fin de indagar si existen diferencias de medias entre el recobro de imágenes de valencia positiva, negativa y neutra. Como no existen pruebas post hoc para el estadístico de Friedman, se usó la prueba de Wilcoxon, la cual permite comparar la mediana de los grupos para mirar si hay algún tipo de diferencias; esta, a su vez, se extendió con la corrección de Bonferroni, método estadístico que nos permite hacer comparaciones múltiples, las cuales, para la presente investigación, serán: negativa, neutra y positiva.


Se tomaron en cuenta los aciertos en la calificación de la prueba, con lo cual se obtuvo = 47.5097, con un p= 0,0165 en la prueba de Friedman, concluyendo que existe diferencia entre, al menos, un par de grupos; por tanto, se procede con la comparación mediante la prueba de rangos signados de Wilcoxon corregida según el método de Bonferroni, es decir, usando un valor real de alfa de 0,05/3 = 0,01666667 (en vista de que son 3 pruebas de hipótesis por pares de grupos). Para la comparación entre las parejas de variables “valencia positiva”-“valencia negativa” (se encontró una p = (0,0189/3) = 0,0063 < 0,01666667, concluyendo que no hay igualdad entre las variables.), “valencia positiva”- “valencia neutra” (se encontró una p = (0,0102/3) = 0,0034 < 0,01666667, concluyendo que no hay igualdad entre las variables) y “valencia negativa”-”valencia neutra” (se encontró una p = (0,4118/3) = 0,13726667 > 0,01666667, concluyendo que si hay igualdad entre las variables). A partir de los resultados expuestos, se concluye que existe mayor recobro de las imágenes negativas y neutras que de las positivas.

Discusión El objetivo principal de esta investigación fue comprobar la incidencia que tiene la valencia de las imágenes en el recuerdo posterior, en una prueba de reconocimiento. La hipótesis planteada de que las imágenes de valencia negativa son más recordadas. Se encontró evidencia que sustenta la hipótesis planteada de que las imágenes de valencia negativa son más recordadas. De igual modo, se constituye como un aporte para el campo de la psicología del consumidor, puesto que arroja luces sobre qué tipo de contenidos son mejor recordados por las personas, posterior a su exposición; esto puede ser útil en el diseño de pautas publicitarias. Diversos autores han reportado resultados similares, respecto al mayor recuerdo de las imágenes negativas (Gordillo et al., 2010; Kensinger & Corkin, 2003; Mikels, Larkin, Reuter-Lorenz & Carstensen, 2005; Ochsner, 2000). Así mismo, otros autores han encontrado un mayor recuerdo de imágenes neutras, en condiciones experimentales similares (Gordillo et al., 2010; Fernández-Rey & Redondo, 2007). Estos resultados podrían entenderse a la luz de la perspectiva evolucionista, ya que se procesan más rápidamente las imágenes negativas, pues los estímulos relacionados con amenaza y peligro, deben ser prioritarios por su importancia en la supervivencia (Gordillo et al., 2010); esto podría ser útil en el diseño de campañas publicitarias con énfasis educativo, las cuales podrían hacer uso de imágenes negativas a fin de disminuir conductas riesgosas, tales como manejar a altas velocidades o conducir en estado de embriaguez.

59


Adicionalmente, es importante tener en cuenta que esta investigación se realizó con participantes jóvenes (18 a 26 años); por lo tanto, los resultados deben ser interpretados en relación con las características de este grupo etario, teniendo en cuenta que otras investigaciones han reportado que en la vejez, es mayor el recobro de información positiva (Lockenhoff & Carstensen, 2004). Esto puede ser de relevancia para el diseño de campañas de salud pública que vayan enfocadas a resaltar diverso tipo de información, según el grupo de edad al que se dirija. En posteriores estudios, es importante tener en cuenta que, dependiendo del tipo de información, ya sean imágenes o palabras, puede variar la calidad del recuerdo y su posterior recuperación. Igualmente, hay que considerar la manipulación de otras variables, como la prolongación de los tiempos de retención y consolidación para encontrar resultados más confiables. De igual modo, se sugiere abarcar un número más amplio de personas de diversas edades, para poder generalizar los resultados y tener la posibilidad de hacer comparaciones entre grupos etarios.

MEDIR Y EVALUAR

60


Referencias Aguado, L. (2002). Cognitive processes and emotional brain systems. Revista de Neurología, 34 (12), 1161-1170. Cahill, L. & McGaugh, J. L. (1998). Mechanisms of Emotional arousal and lasting declarative. Memory Trends in Neurosciences, 21 (7), 294-299. Dolcos, F., Labar, K. S. & Cabeza, R. (2004). Interaction between the amygdala and the medial temporal lobe memory system predicts better memory for emotional events. Neuron, 42(5), 855-863. Fernández-Rey, J. & Redondo, J. (2007). Recognition memory for pictorial stimuli: biasing effects of stimulus emotionality. Psicothema, 19(3), 375-380. Frenda, S. J., Nichols, R. M. & Loftus, E. F. (2011). Current issues and advances in misinformation research. Current Directions in Psychological Science, 20(1), 20-23. Gordillo, F., Arana, J., Mestas, L., Salvador, J., García, J., Carro, J., Pérez, E. (2010). Emoción y memoria de reconocimiento: la discriminación de la información negativa como un proceso adaptativo. Psicothema, 22(4), 765-771. Justel, N., Psyrdellis, M. & Rueltti, E. (2013) Modulación de la memoria emocional: una revisión de los principales factores que afectan los recuerdos. Suma psicológica, 20(2), 163-174. Kensinger, E. A. & Corkin, S. (2003). Effect of negative emotional content on working memory and longterm memory. Emotion, 3(4), 378-393. Labar, K. S. (2007). Beyond fear: emotional memory mechanisms in the human brain. Current Directions in Psychological Science, 16(4), 173-177. Lockenhoff, C. E. & Cartensen, L. L. (2004). Socioemotional selectivity theory, aging and health: the increasingly delicate balance between regulating emotions and making tough choices. Journal of personality, 72(6), 1395-1424. Mikels, J. A., Larkin, G. R., Reuter-Lorenz, P. A. & Carstensen, L. L. (2005). Divergent trajectories in the aging mind: Changes in working memory for affective versus visual information with age. Psychology and Aging, 20(4), 542-553. Ochsner, K.N. (2000). Are affective events richly recollected or simply familiar? The experience and process of recognizing feelings past. Journal of Experimental Psychology: General, 129(2), 242-261.

61


Porter, S., Spencer, L. & Birt, A. R. (2003). Blinded by emotion? Effect of the emotionality of a scene on susceptibility to false memories. Canadian Journal of Behavioural Science, 35(3), 165-175. Quevedo, J., Sant, M. K., Madruga, M., Lovato, I., de-Paris, F., Kapeznski, F., Izquierdo, I. & Cahill, L. (2003). Differential effects of emotional arousal in short- and long- term memory in healthy adults. Neurobiology of Learning Memory, 79(2), 132-135. Ruetti, E., Mustaca, A. & Bentosela, M. (2008). Memoria emocional: efectos de la corticoesterona sobre los recuerdos. Revista Latinoamericana de PsicologĂ­a. 40(3), 461-474. Van Damme, I., Smets, K. (2014). The power of emotion versus the power of suggestion: memory for emotional events in the misinformation paradigm. Emotion, 14(2), 310-320. Yegiyan, N. & Yonelinas, A. P. (2011). Encoding details: positive emotion leads to memory broadening. Cognition and emotion, 25(7), 1255-1262.

MEDIR Y EVALUAR

62


ANEXO 1 Media de las

imรกgenes escogidas de la

p ru e b a p i loto .

NO.

VALENCIA DE LA IMAGEN

MEDIA

1

Negativa

1.24

2

Negativa

1.36

3

Negativa

1.39

4

Negativa

1.52

5

Negativa

1.59

6

Negativa

1.68

7

Negativa

1.71

8

Negativa

1.81

9

Negativa

1.82

10

Negativa

1.84

11

Neutra

2.91

12

Neutra

2.92

13

Neutra

2.98

14

Neutra

2.98

15

Neutra

3.02

16

Neutra

3.04

17

Neutra

3.04

18

Neutra

3.15

19

Neutra

3.18

20

Neutra

3.36

21

Positiva

4.34

22

Positiva

4.37

23

Positiva

4.40

24

Positiva

4.40

25

Positiva

4.44

26

Positiva

4.46

27

Positiva

4.46

28

Positiva

4.49

29

Positiva

4.50

30

Positiva

4.52

63


MEDIR Y EVALUAR

64

Discusiones actuales sobre el uso de instrumentos de medición psicológica en procesos de evaluación

La ética y los números


E N S A Y O S 65


DISCUSIONES ACTUALES SOBRE EL USO DE INSTRUMENTOS DE MEDICIÓN PSICOLÓGICA EN P RO C E S O S D E E VA L UAC I Ó N

E

MEDIR Y EVALUAR

66

n la actualidad, la evaluación psicológica y el desarrollo de instrumentos de medición han experimentado una diversificación, no solo en cuanto a la población objetivo (paso de evaluaciones individuales a evaluaciones masivas de estudiantes en los diferentes niveles educativos, así como de personal que aspira a ingresar a cargos de carrera administrativa en el sector público y privado), sino también en cuanto a los atributos que se pretenden medir (paso de énfasis cognitivo, centrado en los conocimientos y competencias en áreas fundamentales de la educación básica y media, al análisis de competencias funcionales y comportamentales que se espera desplieguen los docentes y directivos docentes en su quehacer pedagógico, por citar solo un ejemplo), y a la finalidad de dichas evaluaciones (diagnóstico, selección, clasificación, ascenso, reubicación, nombramiento en propiedad) (Anitei & Buzea, 2012). Colombia no ha sido ajena a esta dinámica, de manera que se pueden apreciar tres tendencias importantes en lo que a procesos de evaluación masiva se refiere, procesos que, en sus diferentes fases, hacen uso de instrumentos psicológicos: 1. La reglamentación e implementación del Sistema Nacional de Evaluación de la Calidad de la Educación, en donde, a través del ICFES, se aplican anualmente evaluaciones censales a los estudiantes de 3, 5 y 9 grado (pruebas SABER 3, 5 y 9), grado 11 (SABER 11) y estudiantes de últimos semestres de educación superior (SABER PRO), donde se pretende analizar y hacer seguimiento al desarrollo de las competencias


Ana Cristina Santana Espitia / acsantanae@unal.edu.co Estudiante del Doctorado en Psicología Universidad Nacional de Colombia, sede Bogotá

básicas de los estudiantes en sus diferentes niveles educativos, en concordancia con los estándares básicos de competencias de las áreas que son evaluadas por las pruebas (Grupo de Investigación sobre Pruebas Masivas, 2008; Hoyos, 2010). 2. La promulgación de la Ley 909 de 2004, la cual consagra la estructura, organización y funciones de la Comisión Nacional del Servicio Civil (CNSC), entidad que, de acuerdo con el Artículo 130 de la Constitución Política de Colombia, es responsable de la administración y vigilancia de las carreras de los servidores públicos. Está orientada a Posicionar el mérito y la igualdad en el ingreso y desarrollo del empleo público; velar por la correcta aplicación de los instrumentos normativos y técnicos que posibiliten el adecuado funcionamiento del sistema de carrera; y generar información oportuna y actualizada, para una gestión eficiente del sistema de carrera administrativa. (Comisión Nacional del Servicio Civil, 2014)

La Ley 909 contempla también lo concerniente a empleo público, gerencia pública y normas de carrera administrativa

67


MEDIR Y EVALUAR

68

3. Específicamente, en el sistema de carrera para los docentes que se encuentran vinculados al sector público, mediante el Decreto 1278 de 2002, se ha incorporado la cultura de la evaluación en diferentes momentos del servicio docente: evaluación de ingreso, donde el aspirante a docente es evaluado en aptitud numérica, aptitud matemática, saber pedagógico, dominio sobre los conocimientos profesionales disciplinares básicos y prueba psicotécnica (actitudes, intereses y motivaciones que se ponen en juego cuando se abordan situaciones propias de procesos pedagógicos o de gestión institucional) (Instituto Colombiano para la Evaluación de la Educación, 2013); evaluación de período de prueba y de desempeño, en donde se evalúan competencias funcionales y comportamentales relacionadas con el cargo, y evaluación de competencias, dirigida a los docentes y directivos docentes que deseen ascender o reubicarse dentro del escalafón. Las discusiones contemporáneas sobre el uso de los instrumentos psicológicos, específicamente, en evaluaciones masivas en educación, aunque bien podrían ser aplicables en otras esferas de la sociedad donde la evaluación tiene lugar, se han centrado, principalmente, en la adecuación y pertinencia de las pruebas para evaluar a individuos con diferencias en cuanto a estrato socioeconómico, cultura, etnia, región de origen, ya que se aduce que las pruebas favorecen a los individuos de grupos específicos (ej. personas de estratos altos), mientras que las personas no pertenecientes a dichos grupos obtienen resultados inferiores a los esperados. Al respecto, Bustamante (2003) plantea, en su artículo, una serie de hipótesis sobre el uso de las evaluaciones masivas en Colombia, desde la perspectiva del sociólogo francés Pierre Bourdieu. Para efectos de este ensayo, se analizarán cuatro de ellas (las hipótesis 5, 6, 8 y 13), a fin de determinar sus pros y contras en el marco de la evaluación masiva nacional y, específicamente, en cuanto al uso de instrumentos de medición psicológica. La quinta hipótesis de Bustamante (2003), señala que “Si estas evaluaciones masivas entienden que la apropiación simbólica es igual para todos, que todos se benefician igualmente de ella, posiblemente poco ayuden a esclarecer los efectos estructurales de la desigualdad ligados al uso del lenguaje” (p. 36;énfasis agregado). En este orden de ideas, el autor menciona que no es posible garantizar el supuesto de homogeneidad en las condiciones de aplicación de las pruebas o la tenencia del atributo objeto de evaluación de la misma manera para todos los individuos, dado que el lenguaje que se usa en la construcción de las pruebas reproduce las desigualdades que se observan en la estructura social, y “como la apropiación simbólica se da a través de la estructura social, y como ésta no es igualitaria, por lo tanto, no todos tienen acceso a lo simbólico de la misma manera, ¡así se les


haya dicho lo mismo!” (p. 36), de manera que, en términos del autor, “la evaluación, más allá de medir algo, hace aparecer como diferencia de competencia individual (antes se decía “inteligencia”) lo que ha sido causado socialmente” (p. 36). Si bien es cierto que los usuarios de las evaluaciones masivas son individuos con diferencias culturales y geográficas importantes, no quiere decir que posean esquemas conceptuales diferentes por su pertenencia a dichos grupos, es decir, la manera como los individuos se apropian y organizan la información de las diferentes áreas del conocimiento o en la definición de los atributos y características que configuran su personalidad tienen aspectos comunes, con independencia de su pertenencia a uno u otro grupo social, comunalidades que hacen posible la comunicación entre los individuos y la difusión del conocimiento. En ese sentido, es preciso reconocer, no obstante, las comunalidades en los esquemas conceptuales, que existen acercamientos diferenciales a los objetos de la cultura por parte de los individuos, y estas diferencias no obedecen a criterios psicométricos o de construcción de los instrumentos, de modo que Bustamante (2003) sitúa como un problema de las evaluaciones aquello que es un problema de la manera como las personas acceden al conocimiento, bien sea a los instrumentos de producción de las competencias y a los lugares de expresión legítima (contextos de aplicación). Teniendo en cuenta lo anterior, lo que el sistema educativo debe garantizar es que todos los individuos tengan la misma disponibilidad y acceso a los objetos de la cultura en general, no solo los que son susceptibles de ser evaluados en estrategias de lápiz y papel. El contenido de los instrumentos de medición debe responder, precisamente, a esos objetos culturales y educativos que son aprehendidos por la totalidad de los estudiantes colombianos en el aula e, incluso, en las interacciones que se dan en el aula y fuera de ella (p. ej. piénsese el caso de las competencias ciudadanas). Al respecto Álvarez (2001), indica que: Entendida la educación como acceso a la cultura y a la ciencia –bienes comunes históricamente construidos–, el reto que cada profesor tiene es no dejar a nadie fuera. Tomar conciencia de este hecho es comprometerse con modos razonables de actuar con cada sujeto que se encuentre en esa situación delicada para no excluir a nadie de la participación del saber. (p. 13)

69


MEDIR Y EVALUAR

70

La sexta hipótesis de Bustamante (2003) menciona que “si estas evaluaciones masivas coadyuvan a construir la idea de una lengua ‘común’, su acción puede haber ido en detrimento de expresiones lingüísticas y comunicativas que son significativas desde el punto de vista social” (p. 37; énfasis agregado). En este apartado, el autor menciona que la escuela y las evaluaciones masivas privilegian una lengua oficial particular, una manera lingüística concreta en la cual están estructurados tanto los contenidos educativos como la arquitectura formal de las evaluaciones aplicadas en el aula y fuera de ella, generando con ello, en términos del autor, un desconocimiento y rechazo de las expresiones lingüísticas como dialectos y regionalismos provenientes del saber cultural de grupos considerados como minoritarios. Con relación a esta hipótesis, puede mencionarse que el autor presenta una confusión entre los criterios internos del uso de un conocimiento público, como lo son los criterios internos de una lengua, con las variaciones culturales válidas, reconocidas para comunidades minoritarias. Toda área del conocimiento tiene una estructura pública, que debe ser conocida por los usuarios de la misma, y la evaluación no puede ser ajena a las características formales y de contenido de dichas áreas, de manera que los instrumentos de medición son también objetos culturales públicos que no pueden violar los criterios públicos a los cuales deben obedecer; eso no significa que se ignoren las variaciones culturales pertinentes. La octava hipótesis de Bustamante (2003) indica que “si estas evaluaciones masivas fetichizan y relativizan el lenguaje, posiblemente contribuyan poco a entender el valor de uso de la lengua” (p. 37; énfasis agregado). En esta hipótesis, el autor menciona que, aunque en las evaluaciones educativas bien sea dirigidas a estudiantes o docentes se definan las competencias como un “saber hacer en contexto”, entendiendo el contexto como el brindado por los textos que se emplean para elaborar las preguntas, los instrumentos de evaluación son el contexto donde solo se evalúan las áreas de conocimiento en las situaciones creadas por la prueba. En cuanto a esta observación de Bustamante (2003), es importante señalar que la elaboración de instrumentos de medición psicológica de cualquier atributo sigue por un proceso riguroso de construcción en donde participan docentes expertos en las áreas de conocimiento (docentes, para el caso de las evaluaciones masivas de corte cognitivo), o expertos en las competencias funcionales y comportamentales (docentes y directivos docentes con vasta experiencia en el sector educativo, para el caso de las pruebas docentes en sus diferentes etapas), de modo que el contenido de los ítems que conforman las


pruebas no es artificial y arbitrario, sino producto de consensos entre profesionales expertos, donde hay acuerdos no solo en la naturaleza de las temáticas a evaluar, sino que las pruebas se sustentan en procesos de validación de constructo y de contenido que garantizan la calidad de las inferencias que pueden realizarse a partir de los resultados obtenidos por las pruebas. En ese sentido, Gómez e Hidalgo (2005) citan la posición de Messick respecto a la validez señalando que […] la validez no es del test o de la observación, lo que se valida son las inferencias derivadas de las puntuaciones del test o de otros indicadores, inferencias sobre el significado de las puntuaciones o la interpretación para propósitos aplicados y sobre las implicaciones para la acción, es decir, las consecuencias sociales y éticas. (p. 5)

La hipótesis 13 de Bustamante (2003), menciona que “por su propio funcionamiento, estas evaluaciones masivas pueden haber contribuido a unificar criterios curriculares, pedagógicos y lingüísticos” (p. 40; énfasis agregado). El autor menciona que a partir de los resultados de las evaluaciones masivas, pueden extraerse cuatro tipos de validez: 1. Validez de los usos lingüísticos, en términos de las respuestas correctas e incorrectas en pruebas nacionales de tipo censal o muestral. 2. Validez de las prácticas pedagógicas, en cuanto al fomento y promoción de aquellas que contribuyen a lograr buenos desempeños en las pruebas. 3. Validez de las costumbres educativas, ya que la cultura de la evaluación orienta la planeación y ejecución de los elementos curriculares (planes de área, de asignatura) en todas las áreas y grados. 4. Validez de las políticas educativas, pues tienen valor aquellas que apuntalen y sean direccionadas por las evaluaciones masivas. Con relación a esta hipótesis, no puede desconocerse que las inferencias resultantes de los procesos evaluativos han sido determinantes en la toma de decisiones en distintos niveles del sistema educativo y, en ese sentido, los instrumentos de medición (pruebas) son solo un insumo, no la única herramienta que se toma en cuenta para el diseño de políticas educativas a nivel local y nacional. Por ello, es tan importante garantizar la validez de los instrumentos de medida, porque lo que entra en juego es “la adecuación, significado y utilidad de

71


las inferencias específicas hechas con las puntuaciones de los tests” (APA, AERA, NCME, 1985, p. 8). En la determinación de la validez de un instrumento de medición, Una variedad de evidencias pueden obtenerse de las puntuaciones producidas por un test dado, y hay muchas formas de acumular evidencia para apoyar una inferencia específica. (…) Aunque la evidencia puede ser acumulada de muchas formas, la validez se refiere siempre al grado en que esa evidencia apoya las inferencias que se hacen a partir de las puntuaciones. (APA, AERA, NCME, 1985, p. 8).

MEDIR Y EVALUAR

72

Específicamente, la hipótesis de Bustamante (2003) señala 4 tipos de evidencia, los cuales pueden extraerse a partir de los resultados de las evaluaciones masivas a nivel educativo, las cuales deben ser analizadas cuidadosamente, para determinar su relevancia y pertinencia dentro del sistema educativo. En cuanto a la validez de los usos lingüísticos, ya se comentó, en un apartado anterior, que no se ignoran las variaciones culturales y lingüísticas de los grupos denominados minoritarios, sino que lo que pretende evaluar la prueba, en tanto objeto cultural público y accesible para todos los usuarios (estudiantes, en este caso), es un conjunto público de conocimientos y/o dimensiones cognitivas que configuran las áreas del saber, las cuales deben ser asequibles para todos los estudiantes. Por ello, no se evalúa como correcto o incorrecto el saber cultural de los estudiantes, sino se valora su desempeño en un producto público, que recoge una cierta evidencia de los aprendizajes en el aula, complementando las evidencias provenientes del proceso de evaluación formativa que se da en el aula de clase (Álvarez, 2001). La validez de las prácticas pedagógicas, a diferencia de lo planteado por Bustamante (2003), no se garantiza exclusivamente por los resultados de las pruebas externas. Las prácticas pedagógicas tienen su mayor evidencia de validez en la medida en que los estudiantes aprehendan los conocimientos y competencias propias del área; además, que estén en la capacidad de utilizar ese conocimiento en situaciones de la vida cotidiana, aspecto que puede comprobarse principalmente en los procesos de evaluación interna e, incluso, en las interacciones escolares y aquellas que trasciendan el espacio físico de la institución. Los resultados de las pruebas educativas no deben usarse para hacer procesos de entrenamiento mecánico en las instituciones educativas ni deben ser empleadas como mecanismo sancionatorio de X o Y abordaje pedagógico, el quid del asunto es lograr que los docentes se acerquen a los resultados de las pruebas externas no con temor y


recelo, sino que se haga un uso pedagógico de los resultados de dichas evaluaciones, en la medida en que permitan retroalimentar no solo las competencias y componentes en los que los estudiantes presentan altos y bajos desempeños, sino proporcionen pistas acerca de las posible continuidad o adecuación de aspectos pedagógicos, metodológicos y didácticos de la clase que podrían redundar en el desarrollo académico y convivencial de los estudiantes. Los docentes no deben enseñar e impartir conocimientos en función de los resultados de las pruebas externas y/o de las posibles consecuencias asociadas a ellas (evaluación de altas consecuencias) (Tierney, 2014), sino enseñar para formar mejores individuos en todos los aspectos, siendo la escuela el escenario privilegiado, donde tienen lugar los procesos de socialización que iniciaron desde el seno familiar. Álvarez (2001) define, de manera precisa, lo que debe ser la evaluación en educación: “En el ámbito educativo debe entenderse la evaluación como actividad crítica de aprendizaje, porque se asume que la evaluación es aprendizaje en el sentido que por ella adquirimos conocimiento” (p. 12). En cuanto a la validez de las costumbres educativas, es preciso indicar que la cultura de la evaluación no viene dada única y exclusivamente por los procesos de evaluaciones masivas. Cualquier proyecto educativo institucional y, en consonancia, cualquier modelo pedagógico que adopta una institución educativa, tiene de fondo una concepción de evaluación, de lo que se considera debe ser el objeto de la misma, inclusive, de las estrategias más eficaces para acceder a las evidencias que permitan dar cuenta del grado de aprehensión de dichos objetos evaluativos. La evaluación también, transversaliza, por así decirlo, los procesos mismos de gestión institucional, tal es el caso de los Planes de Asignatura y Área, Planes de Mejoramiento Institucional, Planes de Apoyo al Mejoramiento, Planes Operativos Anuales. El análisis de los desempeños docentes, a su vez, es visto desde la lupa de la evaluación de desempeño para los docentes regidos por el Decreto 1278 de 2002, en el que se analizan las competencias comportamentales y funcionales de cada cargo, frente a las evidencias que aporta el docente (rúbricas, portafolios, proyectos pedagógicos, observaciones de clase). Para este caso, aun cuando las competencias funcionales y comportamentales vienen dadas a partir de las directrices del Ministerio de Educación Nacional y la Comisión Nacional del Servicio Civil, hay consensos, desde principio de año, entre los docentes y los evaluadores sobre las actividades a desarrollar y los productos que serán tenidos en cuenta como objetos de evaluación. Finalmente, con relación a la validez de las políticas educativas, cabe anotar que las inferencias provenientes de los resultados de las evaluaciones masivas en educación aplicadas tanto a estudian-

73


MEDIR Y EVALUAR

74

tes como a docentes han tenido una considerable incidencia no solo en cuanto a la adopción de políticas públicas (ej. Promulgación de la Ley 1620 de 2013 de convivencia escolar, inclusión del componente de competencias ciudadanas en las pruebas SABER), sino en la estructuración de programas e iniciativas educativas diseñadas con el propósito de fortalecer las competencias de los estudiantes (Programa Todos a Aprender, Programa de Bilingüismo, promoción de mecanismos de convivencia ciudadana y defensa de los derechos humanos, sexuales y reproductivos). A nivel docente, los resultados de las evaluaciones masivas constituyen insumos para el desarrollo de Programas de Formación Docente, en aras de una cualificación permanente en su quehacer pedagógico. Una vez revisadas estas hipótesis, se aprecia la necesidad de continuar indagando sobre la naturaleza de las implicaciones sociales, éticas y económicas en la aplicación de instrumentos psicológicos en procesos de evaluación a gran escala. Si bien se han dado discusiones importantes en el sector educativo, en donde la tendencia general apunta al reconocimiento de la importancia de los procesos evaluativos tanto de procesos como de los miembros del sistema educativo, pese a las voces de oposición de ciertos gremios docentes y sindicales (Hoyos, 2010), es importante analizar la incidencia del uso de las pruebas en escenarios como la selección de personal administrativo y de carrera en otro tipo de organizaciones y esferas estatales (ej. rama judicial, organismos adscritos a ministerios como el de Salud, de Protección Social). El debate también puede darse en torno al uso de atributos psicológicos como personalidad, intereses, actitudes (Rothstein & Goffin, 2006), e incluso trascender las técnicas de evaluación tradicionales, como las pruebas de lápiz y papel, de modo que otras técnicas de aproximación al conocimiento psicológico de los individuos, como las entrevistas situacionales y la estructura que deben tener en esta clase de procesos de selección, sean aspectos tenidos en cuenta por psicólogos y psicómetras (Whetzel & McDaniel. 2009).


Referencias Álvarez, J. (2001). El campo semántico de la evaluación: Más allá de las definiciones. En: J. Álvarez (Ed.). Evaluar para conocer, examinar para excluir (pp. 11-26). Madrid: Ediciones Morata American Psychological Association [APA], American Educational Research Association [AERA], and National Council on Measurement in Education [NCME]. (1985). Standards for educational and psychological testing. Washington, D.C.: American Psychological Association Anitei, M. & Buzea, E. (2012). Models and applications in psychological selection and evaluation. Procedia - Social and Behavioral Sciences, 33, 756-760. Bustamante, G. (2003). Competencias y evaluaciones masivas en Colombia: Una mirada desde Bourdieu. Pedagogía y Saberes, (18), 33-44. Comisión Nacional del Servicio Civil (2014). ¿Quiénes somos? Recuperado de http://www.cnsc.gov.co/index.php/institucional/direccionamiento-estrategico/quienes-somos-cnsc Gómez, J. & Hidalgo, M. (2005). La validez en los tests, escalas y cuestionarios. Revista La sociología en sus escenarios, 12, 1- 14. Grupo de Investigación sobre Pruebas Masivas en Colombia. (2008). El surgimiento del Servicio Nacional de Pruebas del ICFES en las voces de sus protagonistas. Magistro, 2(3), 115-134. Hoyos, L. (2010). Evaluaciones masivas y estandarizadas, mal necesario, para medir la calidad de la educación en Colombia. Pedagogía Magna, 8, 108-119. Instituto Colombiano para la Evaluación de la Educación [ICFES]. (2013). Guía de orientación para las pruebas de aptitudes y competencias básicas y psicotécnica de ingreso a la carrera docente para directivos docentes y docentes de población mayoritaria. Bogotá: ICFES Rothstein, M. G. & Goffin, R. D. (2006). The use of personality measures in personnel selection: What does current research support? Human Resource Management Review, 16(2), 155-180. Tierney, R. D. (2014). Fairness as a multifaceted quality in classroom assessment. Studies in Educational Evaluation. Recuperado de: http://dx.doi.org/10.1016/j. stueduc.2013.12.003 Whetzel, D. L. & McDaniel, M. A. (2009). Situational judgment tests: An overview of current research. Human Resource Management Review, 19(3), 188-202.

75


LA ÉTICA Y LOS NÚMEROS

MEDIR Y EVALUAR

76

La ética es una de las áreas de estudio más difíciles de la psicología, debido a que no existen respuestas claras. A esta afirmación, realizada por Banyard y Flanagan (2005), se añadiría que su nivel de dificultad aumenta, además, porque la ética cambia a través del tiempo, a medida que la profesión se desarrolla hacia nuevas áreas. Así, la ética en psicología ha avanzado significativamente en áreas como la clínica, el desarrollo infantil y la investigación con sujetos no humanos; sin embargo, este avance no se ha presentado en aspectos como el manejo de datos, a pesar de que este último es un punto álgido en la construcción del conocimiento psicológico. Los números se asumen, en nuestra cultura, como sinónimos de objetividad, detrás de la cual se corre con la esperanza de encontrar la seguridad que da el tener un poco de realidad, o de “verdad”. No obstante, al escudriñar la raíz de estos números, se pueden encontrar sorpresas no muy agradables… ¿De dónde salieron? ¿De una medición realizada por humanos, con todos los sesgos que eso implica? El hecho de que esa medición haya sido equiparada con un número no cambia el sesgo que trae consigo. Esta fe ciega en los números, sin analizar cómo fueron obtenidos, es lo que se podría llamar una falacia numérica, una falacia que se tiene que analizar y, si es el caso, derrumbar. Ya que, aunque suene paradójico, el número tiene que ser bajado de su pedestal y ser cuestionado para que se convierta en algo más objetivo, no en el sentido de algo aséptico, sin error y sin sesgo, sino como algo que presenta


Jazmine Escobar Pérez / jaescobarpe@unal.edu.co Estudiante del Doctorado en Psicología Universidad Nacional de Colombia, sede Bogotá

esos sesgos (que no se pueden eliminar por completo) que están explícitos, de forma que se puede saber hasta qué punto ese número está dando información confiable. El sesgo y el error son omnipresentes en la investigación psicológica. Por ejemplo, siempre habrá sesgo en el investigador, y lo importante es tenerlo presente y realizar actividades de control para minimizarlo. Las faltas a la ética, en este aspecto, pueden ubicarse en un continuo desde los errores no intencionales hasta el fraude propiamente dicho. Grandes transgresiones a la ética, como fabricar datos o modificar los existentes, ya caen en un tipo de conducta claramente ilegal. Pero, fuera de estas violaciones monumentales, hay otras prácticas que también son faltas a la ética. La siguiente reflexión se centrará más en este tipo de prácticas, quizá porque son más cotidianas, y representan tentaciones en las que se puede caer más fácilmente.

Recolección

d e l o s d at o s

Esta es una de las fases más importantes de la investigación, ya que de ella se obtienen los datos que serán analizados y, finalmente, generarán conocimiento sobre el área. Una vez planteados los objetivos de la investigación, las hipótesis y la metodología que se va a seguir, se seleccionan los instrumentos por medio de los cuales se accederá a los datos. Esos instrumentos deberán estar validados para la población a la que se aplicarán. Utilizar instrumentos validados en otros países (así se tra-

77


MEDIR Y EVALUAR

78

te de países de habla hispana) no garantiza que se esté midiendo el mismo constructo que se quiere evaluar aquí. El número que resulta de esa medición no se puede interpretar, menos aún si se trata de comunidades con características particulares. Por ejemplo, una prueba de personalidad como el MMPI aplicada a la comunidad Wayuu puede puntuar para alguna patología comportamientos característicos de su cultura como el de “hablar con espíritus”. Otro caso que se puede presentar mucho en nuestro país tiene que ver con las pruebas que exigen un nivel determinado de comprensión lectora. Son muchas las pruebas que exigen, por ejemplo, mínimo cuarto grados de educación secundaria, pues presumen que así se tiene el nivel necesario para entender las instrucciones y los ítems. No obstante, eso no se puede garantizar, pues hay muchas personas que son “analfabetas funcionales”, es decir, que no entienden lo que leen. Por ello, se requieren entrevistas cognoscitivas, que indaguen si en realidad la población a la que va dirigida la prueba la entiende, o si se debe elaborar una forma alterna que requiera menores niveles de comprensión verbal. Este apartado incluye, también, todas las formas de sesgo que afectan la validez interna y de constructo de un estudio, pues es responsabilidad del investigador conocerlas y controlarlas mediante diseños adecuados. La ignorancia no disculpa el error en el que se incurra y las consecuencias que este puede llegar a tener. Por ejemplo, con frecuencia el diseño experimental requiere incluir diferentes tipos de personas en muestras representativas para poder hacer inferencias ciertas. Si se quiere hacer una investigación descriptiva sobre los efectos de una droga psicotrópica sobre las relaciones interpersonales, por ejemplo, las pruebas no se pueden aplicar únicamente a personas que no han tenido dificultades mayores en sus relaciones sociales o, por el contrario, solamente a personas que han tenido esas dificultades. Eso generaría claramente un sesgo hacia uno de los dos extremos. Por su parte, para acceder a los datos por medio de la observación, se requieren definiciones muy claras de lo que se va a observar e indicadores suficientes que permitan registrar la conducta blanco. Además, se requieren mínimo dos observadores, para realizar un acuerdo intersubjetivo que disminuya el sesgo de un solo observador.

Selección

t e n d e n c i o s a d e l o s d at o s

Este aspecto es muy delicado y tiene que ver con el momento en el que ya se cuenta con la base de datos y se toman decisiones poco éticas respecto a qué datos entrarán o no dentro del análisis. Hay varias prácticas claramente antiéticas en esta instancia, por ejemplo: seleccionar los datos que se ajustan a la hipótesis y descartar los que no lo hacen. Otra conducta antiética es el uso fraudulento de la estadística,


que permite ver más cosas de las que en realidad se tienen. En este caso, se selecciona la mediana, la moda o la media como medida de tendencia central según se ajuste más a lo que el investigador quiere mostrar. En el libro “Cómo mentir con estadística” se hacen explicitas este tipo de prácticas. Una decisión a la que se enfrentan los investigadores al iniciar el análisis es qué hacer con los datos atípicos o anómalos. El eliminarlos para mejorar la estadística no es una opción correcta, debido no solo a que es una forma de sesgar la información, sino a que estos datos pueden contener información muy valiosa. En el caso, por ejemplo, de un tipo de terapia que genere una sobre-sensibilización en pacientes con características particulares de activación fisiológica, la información sería clínicamente relevante. Si se presentan situaciones especiales en las que se hace necesario eliminar los datos atípicos, como en el caso de que una persona responda hacia un extremo (en lo que Kazdin [2001] ha denominado “sujeto negativo”), se debe sustentar la eliminación del dato y dejarla explícita.

Discusión

sesgada

Este apartado es de gran relevancia en los artículos científicos, ya que allí se explicita el aporte al conocimiento que se ha generado, y muchos lectores tomarán decisiones para su práctica profesional a partir de él. En la discusión, se suelen hacer muchas inferencias, pero es crucial que todas se hagan con el suficiente sustento empírico. Por ello, debemos preguntarnos: ¿los datos realmente permiten derivar esa inferencia?, ¿la interpretación se está sesgando para favorecer la hipótesis?, ¿se omitieron hallazgos que no están de acuerdo con la hipótesis o que son difíciles de explicar por la teoría?, ¿se está generalizando directamente de especies no humanas a la humana, sin tomar en cuenta mecanismos de acción y sin el suficiente sustento teórico y/o empírico?, ¿se está atribuyendo causalidad cuando se trata de estudios correlacionales o, menos aún, descriptivos? El valor de un artículo científico no se mide únicamente por la capacidad que tuvo el investigador de corroborar las hipótesis de trabajo (alterna) sino por la calidad del nuevo conocimiento que se produce o que, potencialmente, se puede producir. Esto último hace referencia al valor heurístico, por ejemplo, de esos hallazgos difíciles de explicar, o de datos atípicos que pueden generar nuevas preguntas de investigación.

Conclusión Siempre se debe tener presente que los datos se utilizan para tomar decisiones, muchas veces, con grandes consecuencias sobre la vida y el bienestar de las personas a corto, mediano y largo plazo. Los

79


resultados de una investigación pueden indicar acertada o equivocadamente, por ejemplo, qué terapia es significativamente más efectiva para una problemática particular (a corto plazo), qué modelo de aprendizaje explica y predice mejor la depresión (a mediano plazo) o en qué programa de promoción o prevención se invertirán determinados recursos públicos (a largo plazo). Es decir, los números y su interpretación tienen gran impacto social, y este puede ser positivo o negativo dependiendo de la ética con que se hayan manejado. Finalmente, recuerde evitar siempre la Ley de Murphy para la estadística: “Si torturas suficientemente los datos, ellos dirán lo que tú quieres oír”.

MEDIR Y EVALUAR

80


Referencias Banyard, P. & Flanagan, C. (2005). Ethical issues and guidelines in Psychology. New York: Routledge Huff, D. (1991). How to lie with statistics. New York: Penguin Books. Kazdin, A. (2001). Métodos de investigación en psicología clínica. México: Pearson.

81


MEDIR Y EVALUAR

82

G*power 3: software para el análisis de la potencia estadística


D I D Á C T I C A 83


G * P O W E R 3 : S O F T WA R E PA R A E L A N Á L I S I S D E L A P OT E N C I A E S TA D Í S T I C A La potencia (statistical power) de una prueba estadística es la probabilidad de que la hipótesis nula (N0) sea rechazada cuando esta es falsa, en otras palabras, es la probabilidad de obtener resultados estadísticamente significativos (Cohen, 1992).

A

MEDIR Y EVALUAR

84

unque el concepto de potencia estadística es bastante conocido en la investigación experimental, son muy pocos los trabajos en los que se toma en cuenta, lo que indica una desatención importante por parte de los investigadores. Algunos estudios muestran el escaso interés de gran parte de autores por controlar la potencia, así como la omisión de exigencias al respecto por parte de las revistas especializadas (Bono & Arnau, 1995; Valera, Sánchez, Marín & Velandrino, 1998). Asimismo, se observa un sobreuso y mal uso de la técnica de comprobación de la hipótesis nula en el grueso de la investigación psicológica (Krantz, 1999; Jones & Sommerlund, 2007). Otro error común es buscar solamente saber si la relación entre las variables que se estudian es "estadísticamente significativa", desconociendo la potencia que puedan tener sus resultados (Barker-Baussel, R. & Li, 2002). Algunos autores (Barker-Baussel, R. & Li, 2002) consideran que la inferencia estadística cuenta con dos pilares: La significancia estadística y la potencia estadística, siendo este último el más débil, en cuanto a uso y dominio de esta noción se refiere. Según Bono & Arnau (1995), ambos pilares hacen parte de dos corrientes teóricas diferentes en estadística, donde se enseñan temáticas que tiene la potencia estadística con el nivel de significancia (α), tamaño de la muestra (n), y tamaño del efecto (TE). Cuando los valores de cualquiera de los cuatro son modificados, los otros tres cambian y cuando tres de las cuatro variables son modificadas, la cuarta resulta determinada.


Víctor Alexander Rivera Mancilla / variveram@unal.edu.co Psicólogo Universidad Nacional de Colombia, sede Bogotá

Tamaño

del

E f e c t o (TE)

El tamaño del efecto es el grado de discrepancia entre la H₀ y la H₁, en otras palabras, es el grado en el que la hipótesis nula es falsa. El tamaño del efecto es un indicador del distanciamiento de la evidencia experimental frente a la H₀. Por ejemplo, en una prueba t de diferencia de medias, cuanto más se aleje el índice t de 0, mayor será el tamaño del efecto y mayores serán las probabilidades de rechazar la hipótesis nula (H₀= no hay diferencias, es decir, un índice igual a 0). Cuando el tamaño del efecto es muy bajo, aumenta el riesgo de cometer error tipo II si se rechaza la hipótesis nula, esto depende del nivel de significancia con el que se trabaje. Cuando se realizan análisis de potencia es necesario especificar el TE, lo cual no es sencillo, ya que, muchas veces, no se tiene conciencia de la magnitud de los fenómenos. La dificultad para determinar el tamaño del efecto se debe, principalmente, al sobreuso de las pruebas de significación, donde solo se presta atención a la significancia, la cual nos dice si hay diferencias significativas o no; sin embargo, poco informa sobre la magnitud real del fenómeno bajo estudio (Cohen, 1992a). Para conocer la importancia de un TE determinado, es necesario remitirse a investigaciones anteriores del tema que se esté abordando y/o adoptar ciertos criterios, como, por ejemplo, los aportados por Cohen (1992b). Este mismo autor advierte sobre los riesgos de excederse en las convencionalidades y propone un uso razonable de las mismas.

85


Nivel

de significancia

(α)

El nivel de significancia (α) se refiere a la probabilidad de rechazar la hipótesis nula siendo cierta. Generalmente se fija en un valor convencional de .05, el cual podría ser mayor o menor dependiendo del tipo de estudio que se realice (por ejemplo, en un estudio exploratorio es recomendable fijar valores de α un poco mayores). Cuando el valor de α es muy estricto (por ejemplo, α=0,001), se reduce el riesgo de incurrir en error tipo I; no obstante, se aumenta la probabilidad de incurrir en error tipo II, denotada como β, reduciendo la potencia (ya que esta última es el complemento de β). Teniendo esto en mente, es importante ponderar los riesgos de cometer ambos tipos de error, tratando de mantener un balance.

Tamaño

muestral

(N)

El tamaño muestral (N) también afecta la potencia. Valores grandes de N en las investigaciones aumentan la potencia, puesto que se reduce el error aleatorio y hay una mayor probabilidad de que el fenómeno bajo estudio se presente (Arnau & Bono, 1995). Las conclusiones que se deduzcan del estudio de una muestra, dependen de qué tan representativa sea, así como de qué tanto se acerque al tamaño de la población.

G*P o w e r 3

MEDIR Y EVALUAR

86

Dada la relación que hay entre estos conceptos y la importancia de cada uno de ellos en el campo de la investigación social, es importante contar con herramientas que permitan realizar estudios que incluyan análisis de las cuatro importantes variables descritas anteriormente. Este tipo de análisis son conocidos como estudios de potencia. G*Power es un software de uso libre, creado por investigadores de la Universidad Heinrich Heine de Düsseldorf en Alemania, el cual permite realizar varios estudios de potencia para los test estadísticos más usados (Universitat Dusseldorf, 2016): • • • • •

A priori Compromiso Criterio Post-hoc Sensibilidad

Faul, Erdfelder, Lang y Buchner (2007) mencionan que cualquiera de estos análisis en G*Power 3 debe hacerse siguiendo cuatro pasos: 1) Seleccionar el test estadístico, 2) escoger uno de los cinco tipos de análisis de potencia, 3) proporcionar los valores de entrada requeri-


dos para el análisis, y 4) seleccionar el botón “calculate” y obtener los resultados. A continuación, se ofrecerá un ejemplo de cómo realizar un análisis paso a paso de un estudio a priori. En este tipo de estudios se calcula el tamaño muestral en función de un nivel α preestablecido, un nivel 1 - β y el tamaño del efecto que se busca encontrar.

E j e m p lo

de caso

En una investigación, se tiene como objetivo general encontrar diferencias en la puntuación en una prueba de matemáticas entre estudiantes que hicieron parte de un método de enseñanza piloto (grupo A) y otros que siguieron la instrucción tradicional (grupo B). Se trabajará con un nivel α=0,05, una potencia esperada de 0,90 y un tamaño del efecto grande (≥0,8). Los investigadores quieren conocer el tamaño de muestra requerido para encontrar diferencias significativas que den cuenta de que el método A es mucho más efectivo que el B. La prueba estadística que se utilizará será la t diferencia de medias en muestras independientes. Para realizar este análisis, se debe iniciar el programa, el cual muestra una ventana tal como se observa en la Figura 1.

87

Figura 1. Ventana principal del G*Power 3.


En primer lugar, se escoge el test estadístico que se utilizará. Para este caso, se trata de una prueba t. Primero se selecciona la familia del test (Figura 2) y, después, el test específico planeado para nuestro trabajo (Figura 3).

Figura 2. Selección de la familia de test.

MEDIR Y EVALUAR

88

Figura 3. Selección del test. .


Después, en el siguiente menú desplegable, se escoge el estudio de potencia que se desea realizar. En este caso, se trata de un estudio a priori (Figura 4).

Figura 4. Selección del tipo de análisis de potencia – A priori.

En seguida, verificamos si los valores que aparecen por defecto en los parámetros de entrada corresponden con los que se trabajarán en la investigación, de lo contrario se realizan los cambios pertinentes (Figura 5). También se incluye la razón entre un grupo y el otro, en este caso, dicha razón será de 1:1. Cabe recordar que los valores que ingresemos en este paso, dependen de la naturaleza de nuestro estudio y de las características que los investigadores crean que deban tener sus resultados. En este tipo de análisis a priori, se pueden modificar los parámetros, para ver cómo cambia el tamaño de muestra requerido en función de ellos. Por ejemplo, si cambiamos el nivel α a un nivel más restrictivo, seguramente aumentará el tamaño de muestra requerido para evitar el error tipo I. Finalmente, se escoge la opción “Calculate” que está en la parte inferior derecha de la ventana (Figura 6).

89


Figura 5. Identificación del módulo de parámetros de entrada.

MEDIR Y EVALUAR

90

Figura 6. Definición de los parámetros de entrada y botón para calcular lo de salida.


Después de esto, obtenemos los parámetros de salida con su respectiva gráfica, tal como se observa en la Figura 7. El tamaño de muestra que se requiere, dados los niveles de error aceptados y el tamaño de efecto esperado, es de 28 estudiantes para cada grupo.

Figura 7. Output del análisis a priori según los parámetros especificados.

91

Además de esta información, podemos obtener distintas gráficos para modelar la relación entre los distintos parámetros de entrada con el de salida (Figuras 8, 9 y 10).

Figura 8. Relación entre n y potencia.


Figura 9. Relación entre n y α.

MEDIR Y EVALUAR

92

Figura 10. Relación entre n y TE.

En este ejemplo se aprecia la utilidad del programa y la facilidad para hacer uso de él. G*Power 3 ofrece distintos tipos de análisis para una gran variedad de test estadísticos, lo cual pone al alcance de la mano una herramienta bastante útil para los investigadores de diferentes disciplinas.


Referencias Barker-Baussel, R. & Li, Y. F. (2002). Power Analysis for Experimental Research. A practical guide for the biological, medical and social sciences. Nueva York: Cambridge University Press. Bono, R. & Arnau, J. (1995). Consideraciones generales en torno a los estudios de potencia. Anales de psicología, 11(2), 193-202. Cohen, J. (1992). Statistical Power Analysis. Current Directions in Psychological Science, 1(3), 98-101. Cohen, J. (1992a). Cosas que he aprendido (hasta ahora). Anales de Psicología, 8(1-2), 3-18. Cohen, J. (1992b). A power primer. Psychological Bulletin, 112 (1), 155-159. Faul, F., Erdfelder, E., Lang, A.-G. & Buchner, A. (2007). G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods, 39(2), 175-191. DOI: 10.3758/ BF03193146 Jones, A. & Sommerlund, B. (2007). A critical discussion of null hypothesis significance testing and statistical power analysis within psychological research. Nordic Psychology, 59(3), 223-230. Kraemer, H. C. (1985). A strategy to teach the concept and application of power of statistical tests. Journal of Educational Statistics, 10(3), 173-195. Krantz, D. (1999). The null hypothesis testing controversy in psychology. Journal of the American Statistical Association, 94(448), 1372-1381. Universitat Dusseldorf. (2016). G*Power 3.1 Manual. Recuperado de: http://www. gpower.hhu.de/fileadmin/redaktion/Fakultaeten/Mathematisch-Naturwissenschaftliche_Fakultaet/Psychologie/AAP/gpower/GPowerManual.pdf Valera, A., Sánchez, J., Marín, F. & Velandrino, A. P. (1998). Potencia estadística de la revista de Psicología General y Aplicada. Revista de Psicología General y Aplicada (1990-1992), 51(2), 233-246.

93


MEDIR Y EVALUAR

94

Programa de análisis cualitativo o QDA (Qualitative Data Analysis) en inglés


S O F T W A R E 95


PROGRAMA DE ANÁLISIS C U A L I TAT I V O O Q D A ( Q UA L I TAT I V E D ATA A N A LY S I S ) E N I N G L É S

L

MEDIR Y EVALUAR

96

os programas usados como herramientas en investigaciones en ciencias humanas no son solo de corte cuantitativo; su uso, al igual que sus parientes, supone una gran ayuda en el análisis y en la organización de la información recogida durante la investigación. A continuación, les presentaremos diferentes opciones, desde las más reconocidas hasta las más novedosas, las cuales les ayudará a escoger el programa que más se ajuste a los intereses de su investigación.

Más usados ATLAS . t i

en

C o lo m b i a

Atlas.ti es un software desarrollado por ATLAS.ti Scientific Software Development GmbH, usado principalmente para investigación y análisis de datos cualitativos. Esta herramienta ayuda a los investigadores a descubrir y analizar sistemáticamente fenómenos complejos ocultos en datos no estructurados (texto, multimedia, geoespacial). El programa provee herramientas que permiten, al usuario, localizar, codificar y añadir anotaciones a datos obtenidos de primera mano, para sopesar y evaluar su importancia; además de visualizar las usualmente complejas relaciones entre ellos. Es uno de los programas cualitativos más usados a nivel mundial (Lewins & Silver, 2007). Para conseguirlo se puede consultar: https://atlasti.cleverbridge.com/74/purl-order


Santiago Posada Jaramillo / sposadaj@unal.edu.co Estudiante de psicología Universidad Nacional de Colombia, sede Bogotá

Ethnograph Ethnograph es un software desarrollado por Qualis Research Associates, usado para hacer el análisis de los datos recolectados en investigaciones cualitativas (Software-shop, 2016). Permite crear proyectos etnográficos, crear diferentes tipos de memorandos, escribir memorandos en cualquier momento y lugar, añadir automáticamente palabras clave mientras se codifican los archivos, copiar mensajes de texto al procesador de palabras, etc. Fue uno de los primeros programas para análisis cualitativo del mundo (Informer Technologies Inc., 2016). Para conseguirlo se puede consultar: http://www.qualisresearch.com/

NV i v o Nvivo es un software desarrollado por QSR International. Fue diseñado para investigaciones cualitativas que trabajen con texto y/o multimedia, donde se necesiten profundos niveles de análisis de los datos (QSR Intenational Pty Ltd., 2016). Permite clasificar, sortear y organizar la información; examinar relaciones en los datos; y combinar el análisis con referencias, con búsquedas y con modelos de datos. Con este programa se pueden poner a prueba teorías, identificar patrones y hacer examinaciones cruzadas en la información (Dearne, 2008). Para conseguirlo se puede consultar: http://www.qsrinternational.com/pro-

97


duct

N o ta n u s a d o s e n C o lo m b i a , H y p e r RESEARCH

p e r o s í e n e l r e s to d e l m u n d o

HyperRESEARCH es un software desarrollado por ResearchWare, y utilizado para investigación y análisis de datos cualitativos. Permite la codificación y la recuperación del material de origen, la construcción de teorías y el análisis de los datos. El programa trabaja con datos gráficos, de texto, de audio y de video; mientras que permite compartir los datos y las fuentes con otros usuarios. Es reconocido por ser fácil de emplear; por su uso de diferentes tipos de metodologías para el análisis; por el hecho de funcionar tanto en Windows como en Mac y por sus capacidades multimedia (“HyperRESEARCH: What it is”, 2016). Para conseguirlo se puede consultar: http://www.researchware.com/products/hyperresearch.html

MAXQ DA

MEDIR Y EVALUAR

98

MAXQDA es un software desarrollado por VERBI GmbH para analizar datos tanto de texto como multimedia y tanto para investigación cualitativa como mixta. A diferencia de la mayoría de programas de este tipo, el MAXQDA no fue diseñado con la separación entre cualitativo y cuantitativo en mente, por lo que su uso se puede extender a investigaciones cualitativas, cuantitativas y mixtas, siendo esta una de sus características más representativas (ReStore, 2016; Lewins & Silver, 2007). Pueden usarse hasta cuatro diferentes pantallas para la visualización y organización de los datos, con la ayuda de memorandos y codificación. Existe una versión básica (MAXQDA), una extendida (MAXQDAplus, que permite la creación de diccionarios y la selección de archivos de texto), una de lectura (MAXQDA Reader, que permite leer archivos de MAXQDA sin licencia) y una para dispositivos móviles (MAXApp, es un poco más limitada que la versión básica y es gratis) (MAXQDA, 2016). Para conseguirlo se puede consultar: http://www.maxqda.com/ products


Referencias Lewins, A., y Silver, C. (2007). Using Software in qualitative research: a step-bystep guide. Los Angeles: Sage. Software-shop. (2016). Informaciรณn General de Ethnograph. En: Software-shop. com. Recuperado de: http://www.software-shop.com/in.php?mod=ver_ producto&prdID=52 Informer Technologies, Inc. (2016). E6 Ethnograph. Recuperado de: http://ethnograph.software.informer.com/ QSR Intenational Pty Ltd. (2016). What is Qualitative Research? Recuperado de http://www.qsrinternational.com/blog/what-is-qualitative-research Dearne, K. (2008). Not easy being green, but audits help. En: The Australian. Business Review. Recuperado de: http://www.theaustralian.com.au/business/technology/not-easy-being-green-but-audits-help/story-e6frganx-1111116779996 ResearchWare, Inc. (2016). HyperRESEARCH: What it is. En: ResearchWare, Inc. Recuperado de: http://www.researchware.com/ ReStore. (2016). MAXqda Resources. En: ReStore. A sustainable web resources repository. Recuperado de: http://www.restore.ac.uk/lboro/research/ software/maxqda.php MAXQDA. (2016). Software for qualitative and mixed methods analysis. En: MAXQDA. The art of data analysis. Recuperado de http://www.maxqda. com/products

99


MEDIR Y EVALUAR

10 0

La revista Medir y Evaluar se terminó de imprimir en las instalaciones de GRACOM Gráficas Comerciales ubicada en la Ciudad de Bogotá, Colombia en la carrera 69K nº 7076 en el mes de Noviembre de 2016. El tiraje es de 300 ejemplares en papel bulky. Las familias tipográficas usadas fueron: DIN Next LT Pro Lato


Universidad Nacional de Colombia

Revista Medir y Evaluar


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.