Estadística

Page 1



Estadística Aplicada a la Educación


FACULTAD DE EDUCACIÓN DECANO Dr. Carlos Barriga Hernández DIRECTORA ACADÉMICA Dra. Elsa Barrientos Jiménez DIRECTOR ADMINISTRATIVO Prof. Enrique Pérez Zevallos PROGRAMA DE LICENCIATURA PARA PROFESORES SIN TÍTULO PEDAGÓGICO EN LENGUA EXTRANJERA DIRECTORA Mg. María Emperatriz Escalante López COMITÉ DIRECTIVO Dra. Edith Reyes de Rojas Lic. Walter Gutiérrez Gutiérrez

Violeta Nolberto Sifuentes Estadística Aplicada a la Educación Serie: Textos para el Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera Primera edición Lima, junio de 2009 ©

Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera, Facultad de Educación, Universidad Nacional Mayor de San Marcos Av. Germán Amézaga s/n. Lima 1, Ciudad Universitaria UNMSM - Pabellón Administrativo de la Facultad de Educación - 2.º piso, oficina 203 Teléfono: 619-7000 anexos 3021, 3022 / E-mail: prog_idiomas_edu@unmsm.edu.pe Website: www.unmsm.edu.pe/educacion/licenciatura/index.htm

Diseño, diagramación e impresión: Centro de Producción Editorial e Imprenta de la UNMSM Este libro es propiedad del Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera de la Facultad de Educación de la Universidad Nacional Mayor de San Marcos. Ninguna parte de este libro puede ser reproducida o utilizada por cualquier medio, sea éste electrónico, mecánico o cualquier otro medio inventado, sin permiso por escrito del Programa.


Para Doroteo y Benita (mis queridos padres)



ÍNDICE Prefacio Agradecimiento

9 11 UNIDAD I INTRODUCCIÓN Y CONCEPTOS BÁSICOS

1.1. Introducción 1.2. Conceptos básicos 1.3 Variable 1.4 Medición y escalas de medición 1.5 Estadística Ejercicios propuestos

13 14 16 18 20 24

UNIDAD II ESTADÍSTICA DESCRIPTIVA UNIVARIANTE 2. 1 Tablas y gráficos de frecuencias univariantes 2.2 Tablas y gráficos de frecuencias bidimensionales 2.3. Medidas de resumen para datos de una variable cuantitativa 2.4 Gráfico de caja Ejericios propuestos

55 66 74 89 93

UNIDAD III NOCIONES DE PROBABILIDAD 3.1 Introducción 3.2 Objetivos de la teoria de la probabilidad 3.3 Experimento aleatorio 3.4 Espacio muestral y evento 3.5 Eventos especiales y operaciones con eventos 3.6 Enfoques de la probabilidad 3.7 Definicion axiomatica de la probabilidad 3.8 Probabilidad condicionada 3.9 Independencia de eventos 3.10 Variable aleatoria 3.11 Distribución de probabilidad 3.12 Distribucion de probabilidad binomial 3.13 Distribución de probabilidad normal Ejercicios propuestos

99 99 99 100 101 104 105 107 109 109 111 113 116 124


UNIDAD IV ANÁLISIS DE REGRESIÓN LINEAL SIMPLE 4.1 Introducción 4.2 Modelo de regresión lineal simple: 4.3 Gráfico o diagrama de dispersión 4.4 Estimación del modelo de regresión lineal simple 4. 5 Evaluación del ajuste global del modelo: coeficiente de determinación 4.6 Coeficiente de correlación lineal Ejercicios propuestos

129 130 130 132 135 137 142

Bibliografía

144


PREFACIO El Presente libro se ha elaborado a solicitud del Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera de la Facultad de Educación de la Universidad Nacional Mayor de San Marcos y tiene como objetivo ser una guía del Curso Estadística Aplicada a la Educación que se desarrolla en el presente programa. Por ello se ha escrito tomando en cuenta a un grupo heterogéneo de alumnos, ya que en su quehacer profesional no emplean las herramientas estadísticas cotidianamente, por tanto espero que el esfuerzo realizado para preparar este libro logre los objetivos del Programa y por supuesto de sus alumnos. Es imposible dejar de lado tanto la teoría como su aplicación empleando cálculos, más que nada es para que los lectores conozcan el cómo y el porqué del uso de las herramientas estadísticas; y a la vez se entienda la interpretación de los resultados obtenidos. No se pretende adiestrar a lo lectores en cálculos sino que aprendan los conocimientos teóricos estadísticos a nivel básico (SABER), el aplicar las herramientas estadísticas (SABER HACER) y generar una actitud positiva hacia la Estadística en el lector, esto es, que la estadística no solo es cálculo, o un simple uso de las fórmulas; sino es razonamiento crítico basado en evidencias objetivas que se obtienen de la población bajo estudio (SER). Una vez que el lector haya asimilado los conocimientos estadísticos y su aplicación desarrollados en el presente libro, está en la capacidad de usar softwares estadístico, que es un instrumento, comparable a una calculadora pero con más capacidad; y sirve de apoyo para obtener en forma precisa y rápida los gráficos y cálculos estadísticos. Agradezco por el uso que se brinde a este libro y por los aportes que me alcancen a fin de mejorarlo. VIOLETA ALICIA NOLBERTO SIFUENTES e-mail: vnolbertos@unmsm.edu.pe



AGRADECIMIENTOS A la Mg. María Emperatriz Escalante López Directora del Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera de la Facultad de Educación de la Universidad Nacional Mayor de San Marcos por confiarme la elaboración del presente libro y así poder contribuir con la difusión de la Estadística. A mis profesores de pregrado del Departamento Académico de Estadística (UNMSM), quienes me formaron en tan importante especialidad, cuyas enseñanzas y exigencias académicas para con la preparación profesional en estadística, han permitido que pueda seguir enseñando, aprendiendo nuevas teorías y aplicaciones de la estadística. A los alumnos y profesionales (no estadísticos), por la paciencia e interés en aprender estadística, por sus comentarios y sugerencias para con nuestro desempeño docente. En general todo aquel que tomará decisiones basadas en evidencias objetivas, en concordancia con el mundo en que vivimos, caracterizado por el constante aprendizaje y el manejo adecuado de la información, en particular de la información estadística. Así mismo, por alcances, comentarios, observaciones y dudas respecto a lo tratado en el presente libro; los mismos que contribuirán con la enseñanza y la difusión de la estadística. Lima, junio 2009


Programa de Licenciatura para Profesores sin TĂ­tulo PedagĂłgico en Lengua Extranjera

12


Estadística Aplicada a la Educación

UNIDAD I INTRODUCCIÓN Y CONCEPTOS BÁSICOS 1.1. INTRODUCCIÓN Estamos en una sociedad globalizada, caracterizada por el constante aprendizaje, conocimiento y manejo de información, diversos campos del quehacer profesional y de investigación hace que nos enfrentamos a un volumen de información que cada vez va en aumento y que es necesario manejarla ágilmente y eficientemente; en particular la información cuantitativa. En este contexto la Estadística se constituye en una buena opción para hacerlo. Etimológicamente Estadística proviene del latín statisticum collegium (consejo de Estado), fue usada en 1749 por el alemán Gottfried Achenwall para referirse al análisis de datos del gobierno, conocido también como aritmética política.del vocablo Estado, consultado en http://es.wikiversity.org/wiki/Unidad_I:_Estad%C3%ADstica_b%C3%A1sica(13/04/09). Tradicionalmente ha sido función de los gobiernos centrales llevar los registros de población, nacimientos, defunciones, exportaciones, impuestos, etc. Contar y medir estos y otros hechos genera muchas clases de datos, que posteriormente se transforma en información estadística, que permite tomar decisiones acertadas. Como un procedimiento de toma de decisiones, la Estadística se ha convertido en un instrumento cotidiano de los investigadores y profesionales de todos los campos del conocimiento, quienes necesitan tener alguna familiaridad con principios estadísticos para poder emitir y evaluar sus informes y evitar malos usos de la Estadística. En la presente Unidad, se tiene como objetivo: Homogenizar o alinear entre los alumnos del presente programa, los conceptos básicos de la Estadística para iniciarse en el estudio y aplicación de las herramientas que ésta tiene. BREVE HISTORIA DE LA ESTADÍSTICA La Estadística ha existido en forma sencilla desde el inicio de las civilizaciones por ejemplo, en el Antiguo Testamento de la Biblia, en el libro Crónicas, dice que el Rey David ordenó que se hiciese un censo en Israel. Los babilonios, egipcios, chinos, mayas e incas y griegos, por mencionar algunas culturas, recopilaban y analizaban datos de sus gobiernos utilizando algún tipo de estadísticas. Asimismo, se puede encontrar estadísticas en el libro Números. En la Edad Media se realizaron los primeros censos formales (en 1066 el censo de Inglaterra encargado por Guillermo I), pero no fue hasta el siglo XVII que surge lo que podríamos llamar la disciplina Estadística, con el estudio de Grannt (1620-1674) sobre

13


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

mortalidad en Londres, seguido de Halley (1656-1742). Por estas épocas se inicia el desarrollo de las dos escuelas: la demográfica social y la enciclopédica matemática. La primera escuela culmina con la fundación de la demografía como disciplina, y la segunda deriva en la Estadística en su concepción actual. Durante los siglos XVIII y XIX, se tienen grandes contribuciones de matemáticos como Gauss (1777-1855), Poisson (1781-1840), Bayes (1702-1761), Galton (1822-1911) y Pearson (1857-1936), quienes permiten sentar las bases de una teoría que le da cuerpo a la Estadística como una disciplina científica. Entre los que desarrollaron esta teoría podemos señalar a Neyman (1894-1981), Lehmann (1917) y a Ronald Aylmer Fisher (1890-1962), quien es considerado el Padre de la Estadística Moderna, ya que realizó importantes contribuciones a la metodología estadística, que, aunque fuertemente motivadas por problemas genéticos, biológicos y de la agricultura, pronto se usaron en la industria, en trabajos de investigación social y en todas las áreas donde se utilizan la experimentación y la observación científica. Fue así como, durante la década de los años 30 a los 60 del siglo XX, se realizó una intensa actividad de investigación y aplicación en la metodología estadística. Se introdujo la Estadística en los centros de investigación y en la producción industrial, con lo que apareció una comunidad de profesionales de esta disciplina. En las universidades, se incorporó a los planes de estudio de carreras como Agronomía, Biología, Ciencias Sociales, Psicología, Economía e Ingeniería, entre otras. Aparecieron así los Departamentos de Estadística y los laboratorios de consultoría. En la Universidad Nacional Mayor de San Marcos se creó en el año 1967 la Escuela Académico Profesional de Estadística. Con la llegada de las computadoras, las técnicas para el manejo y explotación de los datos y de información se hacen imprescindibles. Durante las décadas de los 60 hasta 90, la masificación de los softwares computacionales estadísticos hizo que casi cualquier profesional o técnico tuviese la posibilidad de aplicar la Estadística sin tener necesidad de realizar dificultosos cálculos. Hoy en día, los métodos más complejos requieren sólo minutos de procesamiento computacional, además de que hay grandes facilidades de visualización gráfica.

1.2. CONCEPTOS BÁSICOS A continuación se presentan algunos conceptos básicos utilizados con frecuencia en el estudio y aplicación de la Estadística, necesarios para el inicio del uso y aplicación de la Estadística. 1.2.1 Población Es el conjunto de elementos (personas, plantas, organismos, objetos, etc.) que contienen una o más características o atributos comunes observables, acerca del cual deseamos obtener conclusiones o tomar decisiones. En términos de investigación, es el conjunto

14


Estadística Aplicada a la Educación

sobre el que recae la investigación y de cuyos elementos obtendremos datos de sus características o atributos. Toda población debe delimitarse temporal y espacialmente 1.2.2 Censo Se realiza un censo cuando se recolecta datos de toda la población bajo investigación. Un censo se realiza generalmente por política de estado, ya que son costosas y sus resultados son la base para investigaciones más especificas. Etimológicamente el vocablo “Censo” proviene del latín Census, que significa “padrón o lista que los censores romanos hacían de las personas y haciendas”. Más exactamente también significa “evaluar”. Consultado en http://www.educarchile.cl/Portal.Base/Web/VerContenido.aspx?ID=195815 (13/04/09)

1.2.3 Muestra Es un subconjunto de la población, seleccionada de acuerdo a un plan o regla con el fin de obtener datos de la población del cual se extrajo la muestra. La muestra debe ser representativa de la población y esto significa que debe ser de tamaño adecuado y que tenga las mismas propiedades que la población. 1.2.4 Unidad estadística Es el objeto elemental o elemento indivisible sobre la base del cual se obtienen los datos. También se le llama unidad de observación si los datos se han recolectado mediante la observación y se la unidad experimental si los datos se han recolectado a través de la experimentación. 1.2.5 Dato Según el Diccionario de la Lengua Española, es un antecedente para llegar al conocimiento exacto de un hecho. Es una magnitud o caracterización de algo. Son estáticos. No cambian una vez obtenidos. Cuando se les procesa y presenta en un contexto apropiado pueden generar entendimiento. Si un investigador dispone de la edad (años cumplidos) de cada paciente, cada edad es un dato y es estático. 1.2.6 Información Según el diccionario de la lengua española, es la reseña, representación o concepción derivada de la observación, lectura o instrucción. Es conocimiento en relación con un hecho, que surge de la confrontación de datos con los conocimientos que existen sobre el mismo. La información es dinámica

15


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1.3 VARIABLE Es una característica o atributo que posee la población o muestra en estudio que puede tomar diferentes valores. La variable es un aspecto específico de la realidad referida a la unidad estadística y que es susceptible de ser medida. Se le representa mediante la letra X. Formalmente, es una función X de una población A, en los números reales, veamos el siguiente Gráfico Nº 1.1, la población denotada por A es el dominio de la variable X y su rango es un conjunto no vació de números reales.

Gráfico Nº 1.1. Definición formal de variable

Ejemplo 1.1: Se hizo un estudio descriptivo, con una muestra de 180 estudiantes de inglés como lengua extranjera, para determinar la relación existente entre la motivación interna y el rendimiento académico. Asimismo, se determinaron las actitudes motivacionales más comunes de los participantes y sus características demográficas. La recolección de los datos se hizo a través de un cuestionario donde se pidió a los participantes reportar su componente motivacional hacia el aprendizaje del inglés. La muestra fue extraída entre estudiantes del tercer, cuarto y quinto año de la EAP de Educación mención Inglés, de la Universidad Nacional Mayor de San Marcos matriculados en el presente semestre académico. Para este caso odentificar la población, la muestra y unidad estadística: Solución: Siguiendo los conceptos correspondientes: Población: Estudiantes del tercero, cuarto y quinto año de la EAP de Educación mención Inglés, de la Universidad Nacional Mayor de San Marcos, matriculados en el semestre académico 2009-I.

16


Estadística Aplicada a la Educación

Muestra: 180 estudiantes de Educación mención Inglés, de la Universidad Nacional Mayor de San Marcos, matriculados en el semestre académico 2009-I. Unidad estadística: Un alumno de esta población y es una unidad observacional, porque para recolectar datos no se ha controlado ningún factor alguno. Ejemplo 1.2: Identificar las variables bajo estudio del ejemplo 1.1. Solución: Son dos las variables bajo investigación motivación interna y el rendimiento académico, cuyos indicadores o variables empíricas o simplemente variables (como los llamamos para aplicar Estadística) son: -

Puntaje que se obtiene al aplicar un cuestionario que mide la motivación interna.

-

Puntaje que ha obtenido como promedio ponderado, que indica el rendimiento académico.

Ejemplo 1.3: La Directiva Nº 177-2006/DM/SPE, tiene por finalidad normar la aplicación de la evaluación censal a docentes de los niveles de Inicial, Primaria y Secundaria de Educación Básica Regular, para obtener información pertinente que permita al Ministerio de Educación diseñar un conjunto de acciones para el desarrollo profesional del docente, como parte del Programa “Mejores Maestros, Mejores Alumnos”, para mejorar la calidad de la educación peruana. Para mayor información visitar: http://www.minedu.gob.pe/normatividad/directivas/DIR177-2006-DM-SPE.pdf (consulta 13/04/09) Se le llama Censal a esta evaluación docente porque se evalúan a todos los docentes, nombrados y contratados, de Educación Básica Regular de las instituciones educativas públicas. También se considera en esta evaluación, los docentes que laboran en las instituciones educativas que tienen convenio con el Ministerio de Educación. La investigación es un Censo porque se ha trabajado con toda la población de docentes, según lo indica la presente directiva. La unidad estadística es el docente, nombrado o contratado, de Educación Básica Regular de las instituciones educativas públicas o que laboran en las instituciones educativas que tienen Convenio con el Ministerio de Educación.

17


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1.4 MEDICIÓN Y ESCALAS DE MEDICIÓN El establecimiento de una variable permite la asignación de números a cada una de las unidades estadísticas que forman la población (medición), de modo que los números sean susceptibles de análisis. Pero esa asignación no es indiscriminada es conforme a reglas llamadas ESCALAS DE MEDICION. Estas escalas permiten hacer una equivalencia entre el sistema numérico real (R) y las características o atributos que se miden de la unidad estadística. Medir significa “asignar números a objetos y eventos de acuerdo a reglas” (Stevens, 1951), esta definición es adecuada para el área de ciencias naturales, en el campo de las ciencias sociales medir es “el proceso de vincular conceptos abstractos con indicadores empíricos” (Carmines y Zeller, 1979, p. 10). Las escalas de medición son:

DE RAZÓN 3.INTERVALAR 2. ORDINAL 1. NOMINAL

Gráfico Nº 1.2. Escalas de Medición de una Variable

Se define a continuación cada tipo de escala. Descripción de las Escalas de Medición 1.4.1 Escala Nominal.- La asignación de valores sirven únicamente para identificar clases mutuamente excluyentes, a las que se les llama categorías. 1.4.2 Escala Ordinal.- Se establecen categorías con dos o mas niveles que implican un orden inherente entre si. Esta permite ordenar a los eventos en función de la mayor o menor posesión de un atributo o característica. Esta escala posee características de la escala nominal.

18


Estadística Aplicada a la Educación

1.4.3 Escala Intervalar: Esta escala posee las características de la medición nominal y ordinal. Establece la distancia entre una medida y otra, pero carece de un punto cero absoluto, es decir si la variable que se mide admite el valor cero, el cero es una base o referencia, es un punto de base arbitrario. 1.4.4 Escala de Razón. Esta escala de medición, tiene las características de las tres escalas anteriores. Determina la distancia exacta entre los intervalos de una categoría. Adicionalmente tiene un punto cero absoluto, es decir, es decir si la variable admite el valor cero, el cero indica que no existe la característica o atributo que se mide; así mismo la razón entre los valores de dos unidades estadísticas distintas indica magnitud de la variable que se mide. Ejemplo 1.4: Supongamos se realiza un estudio para conocer el nivel de comprensión lectora en una muestra de alumnos del quinto grado de educación secundaria de instituciones educativas tanto estatales como particulares, entre diversas variables se ha considerado: • • • •

Sexo Estrato socioeconómico Edad (años cumplidos) Puntaje de la prueba que mide habilidades básicas de comprensión lectora (escala vigesimal) ¿Cuál es la Escala de Medición empleada para cada variable? Solución: La variable Sexo se ha medido mediante escala nominal, por que esta variable tiene dos posibles categorías, que son mutuamente excluyentes, a cada una de ellas se le asigna cualquier valor, porque esos valores identifican a la unidad estadística a cuál de las dos categorías pertenece: Masculino (1) Femenino (2) La variable Estrato socioeconómico se ha medido mediante escala ordinal, por que esta variable tiene tres posibles niveles, que son mutuamente excluyentes y denotan orden o jerarquía, a cada una de ellas se le asigna valores que reflejen orden o jerarquía, al mayor nivel se le asigna valor máximo y se va decreciendo conforme baja de nivel: Muy Alto (5) Alto (4) Medio (3) Bajo (2) Muy Bajo (1)

19


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

La variable Edad (años cumplidos) se ha medido mediante escala de razón, porque admite el valor cero e indica ausencia de edad en años cumplidos, pero para este tipo de población no se da por que se trata de alumnos del quinto grado de educación secundaria. Si Juan tiene 15 años y Pedro 17 años, la razón de las edades Pedro/ Juan es 1.27 años, es decir la edad de Pedro es 1.27 años respecto a la de Juan. La variable Puntaje de la prueba que mide habilidades básicas de comprensión lectora (escala vigesimal) se ha medido mediante escala intervalar, por que el valor cero de la escala vigesimal no indica ausencia de habilidades básicas de comprensión lectora, es solo un referente se trata del puntaje mínimo. Si Juan obtuvo 16 en esta prueba y Pedro 8, la razón de los puntajes Juan/Pedro es 2, no indica que Juan tiene el doble de habilidades básicas de comprensión lectora. No tiene sentido esta razón. Clasificación de variables Según la escala de medición empleada puede ser: 1. Variable Cualitativa o Categórica, si la variable se ha medido mediante escala nominal u ordinal. 2. Variable Cuantitativa, si la variable se ha medido mediante escala intervalar o de razón, estas se clasifican como: 2.1.

Variable Cuantitativa Discreta, si los valores resultantes de la medición son enteros.

2.2.

Variable Cuantitativa Continua, si los valores resultantes de la medición es cualquier valor real.

Ejemplo 1.5: Clasificar las variables del ejemplo 1.4, siguiendo las definiciones correspondientes. Solución: La clasificación se presenta en la Tabla Nº 1.1, para su construcción se ha seguido los conceptos de las diferentes escalas de medición, así como para clasificar cada una de las variables.

1.5 ESTADÍSTICA Según Sierra Bravo, R. (1991), la Estadística es una ciencia formada por un conjunto de teorías y técnicas cuantitativas, que tienen por objeto: la organización, presentación, descripción, resumen y comparación de conjunto de datos, obtenidos de poblaciones bajo estudio o de muestras que representan a las poblaciones estudiadas. Estudia su

20


Estadística Aplicada a la Educación

variación, propiedades, relaciones, comportamiento probabilístico de dichos datos y la inferencia de los resultados obtenidos de muestras, respecto a las poblaciones que aquellas representan. La American Statistical Association la define así: La estadística es el uso científico de principios matemáticos a la colección, al análisis, y a la presentación de datos numéricos. Contribuyen con la investigación científica diseñando pruebas y experimentos; la colección, el proceso, y el análisis de datos; y la interpretación de los resultados. Los métodos estadísticos se aplican a la biología, economía, ingeniería, medicina, salud pública, psicología, comercialización, educación y deportes. Muchas decisiones económicas, sociales, políticas, y militares no se pueden tomar objetivamente sin el empleo adecuado de la estadística. Tabla Nº 1.1 Variable Sexo

Estrato socioeconómico

Escala de Medición Nominal

Ordinal

Categorías / Niveles o valores Masculino Femenino Muy Alto Alto Medio Bajo Muy Bajo

Tipo de variable Cualitativa o Categórica Cualitativa o Categórica

Edad (años cumplido)

De Razón

15, 16, 17,18

Cuantitativa Discreta

Puntaje de la prueba que mide habilidades básicas de comprensión lectora (escala vigesimal)

Intervalar

0,1,2….18,19,20

Cuantitativa Discreta

La Estadística para su estudio se clasifica en: 1.5.1 Estadística Descriptiva Trata del resumen y presentación de datos, mediante métodos adecuados. Tiene como objetivo: Caracterización de los datos (mediante gráficos o de forma analítica) para resaltar las propiedades de los elementos bajo estudio. La siguiente pregunta: ¿En promedio el número total de respuestas correctas, de una prueba de compresión lectora, es la misma en todas las secciones de quinto grado de primaria de Instituciones Educativas de Lima Metropolitana?, se resuelve con el apoyo de la Estadística Descriptiva.

21


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1.5.2 Estadistica Inferencial Estudia el comportamiento y propiedades de las muestras, pero de carácter aleatoria. Tiene como objetivo: Generalizar las propiedades de la población bajo estudio, basado en los resultados de la muestra aleatoria. Esta generalización de tipo inductivo, está basada en la PROBABILIDAD. La siguiente pregunta: ¿El instrumento PERSO, clasifica y discrimina adecuadamente, a partir de variables de personalidad, a los alumnos de Educación Básica Secundaria según requieran o no una escolarización especial?, se resuelve con el apoyo de la Estadística Inferencial. En cuanto a la Probabilidad, Juez Martel, Pedro y Diez Vegas, Francisco Javier (1997) manifiestan que “hoy en día la Probabilidad y la Estadística, íntimamente unidas en sí, desempeñan un papel fundamental en prácticamente todos los campos del saber, tanto en las ciencias naturales como en las ciencias humanas, papel que va cobrando cada vez mayor importancia”. La siguiente pregunta: ¿Cuánto es la probabilidad de que un alumno de Educación Básica Secundaria requiera una escolarización especial, a partir de las variables de su personalidad?, es un caso típico que se resuelve con el apoyo de la probabilidad y se logra empleando modelos probabilísticos. Ejemplo 1.6: Una investigación tiene como objetivo identificar los estilos de aprendizaje cognoscitivos, sensoriales y afectivos predominantes en los estudiantes de la carrera profesional de Educación de la especialidad de inglés. Para el logro de este objetivo, se emplea la estadística descriptiva, porque se trata de caracterizar a los estudiantes respecto a cuáles estilos de aprendizaje emplean en su especialidad. Una posible respuesta puede ser que un 48% emplea el estilo cognoscitivo, el 32% emplea estilo sensorial y el resto emplea estilo afectivo. Ejemplo 1.7: El siguiente resumen, amerita el uso de Estadística Inferencial, de los datos que se recolecten de la muestra, Título: Aprendizaje y técnicas de enseñanza del inglés en la escuela Autor: Fleta Guillén, M. Teresa Palabras clave: adquisición del lenguaje, aprendizaje temprano de segundas lenguas, contexto de aprendizaje, datos lingüísticos del entorno, rutinas, transiciones y fórmulas.

22


Estadística Aplicada a la Educación

Fecha: 2006 Editor: Universidad de Alcalá. Servicio de Publicaciones Resumen: Este artículo tiene como finalidad plantear ideas básicas y prácticas que sirvan de orientación y apoyo a los docentes de segundas lenguas (lenguas extrajeras) en la escuela. En primer lugar, se hace referencia a la adquisición del lenguaje y concretamente al aprendizaje temprano de una segunda lengua. A continuación, abordamos específicamente las rutinas, las transiciones y las fórmulas como posibles vías para enseñar inglés en Infantil y en Primaria. El Apéndice incluye rimas, canciones y fórmulas para ayudar a los docentes a presentar el inglés en clase. URL: http://hdl.handle.net/10017/1200 Aparece en las colecciones: Encuentro - Número 16, 2006 En este caso se ha aplicado la Estadística Inferencial, porque es necesario emplear una muestra aleatoria de niños y se emplea las rutinas, las transiciones y las fórmulas como posibles vías para enseñar inglés Infantil y en Primaria. Como este método posteriormente será empleado por otros docentes para alumnos de esta población, la generalización del uso de este método debe estar basada en la generalización de los resultados de la muestra aleatoria para toda la población que empleará este método. IMPORTANTE: 1. Estadística Descriptiva es básica para la aplicación de la Estadística Inferencial. 2. La precisión de los datos, de buena calidad, permitirá que el análisis estadístico sea capaz de suministrar la respuesta adecuada a un problema científico. 3. La Estadística Inferencial tiene dos enfoques: Estimación y Prueba de Hipótesis.

RECUERDE Ningún método estadístico puede corregir los defectos por una inadecuada selección del problema que se investiga, o por una mala recolección de datos. Una investigación que empieza mal, con seguridad termina mal. CON DATOS DE MALA CALIDAD NO SERÁ POSIBLE DAR RESPUESTA ADECUADA A UN PROBLEMA CIENTÍFICO.

23


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

EJERCICIOS PROPUESTOS 1.1 Del presente artículo de investigación Se solicita que lo lea completamente, a fin de que: 1. Defina la población 2. Defina la muestra 3. Defina la(s) variable(s) bajo estudio. Indicar la escala de medición empleada y el tipo de variable. Facultad de Ciencias Médicas y Biológicas “Dr. Ignacio Chávez”, Morelia, Michoacán Competencias docentes en los profesores de medicina de la Universidad Michoacana de San Nicolás de Hidalgo M.Sc. Lidia Manzo Rodríguez1. Dra. Natacha Rivera Michelena2 y Dr. Alain R Rodríguez Orozco3 1

Profesor colaborador de Investigación, 2 Profesora Titular, 3Profesor-investigador.

RESUMEN Para la identificación de un grupo de competencias docentes básicas en los profesores que se desempeñan en la licenciatura en medicina en la Facultad de Medicina “Dr. Ignacio Chávez”, objetivo fundamental del presente trabajo, se utilizaron métodos teóricos y empíricos. Se aplicó una encuesta a una muestra seleccionada de docentes y alumnos. Se emplearon procedimientos estadísticos para el análisis de los resultados y se elaboraron tablas. A partir de la identificación de las necesidades de aprendizaje de los profesores estudiados, en relación con la dirección del proceso enseñanza-aprendizaje y los referentes teóricos sobre el tema, se realizó un análisis integrador para valorar los datos obtenidos, lo que permitió la caracterización de los docentes objeto de investigación, en relación con las competencias docentes básicas propias de una gestión formativa pertinente. Se tomaron en consideración los principios metodológicos más actuales acerca de la formación de recursos humanos en la educación superior en sentido general y en particular en la educación médica superior. Palabras clave: Competencias docentes, proceso de enseñanza-aprendizaje, claustro, atención primaria de salud, formación pedagógica. El quehacer sistemático del claustro de profesores de la Facultad de Medicina “Dr. Ignacio Chávez”, considerado en este estudio, ha venido evidenciando una serie de dificultades con relación a su formación pedagógica, realidad esta poco estudiada hasta este momento, lo que unido al incremento de matrícula, y al análisis del plan de estudios actual, permitió observar que las estrategias de enseñanza tienen poca vinculación con la gestión docente que se debe desarrollar. Un factor determinante en relación con el

24


Estadística Aplicada a la Educación

desempeño académico es la capacidad de controlar y evaluar la calidad de los resultados del proceso educacional, de atención médica y de investigación que se produce en los servicios de salud. Los mecanismos de monitoreo y control de la calidad del desempeño de los profesores y demás profesionales que laboran en las instituciones de salud, pueden estimular y promover un sentido de responsabilidad institucional. En diferentes universidades se examinan periódicamente la calidad y pertinencia de los programas académicos y su eficiencia, entre otros elementos (1). Las evaluaciones a los profesores, los resultados docentes, los controles a las actividades, los criterios de los estudiantes y sus organizaciones, constituyen fuertes herramientas en este empeño(2). El proceso de acreditación de la Facultad de Medicina considerado en este trabajo, efectuado en el curso escolar 2003-2004 con relación a los indicadores para llevar a cabo este proceso, específicamente en el apartado correspondiente a los alumnos, los profesores y a la preparación pedagógica de estos últimos; se refiere a lo siguiente: “La Escuela o Facultad debe ofrecer a los estudiantes asesoría académica y psicopedagógica por personal especializado”(3). Se concluyó, que esta asesoría se realizaba por los profesores de tiempo completo y el Departamento de Psicología y Psicometría de la Universidad, y fue asumida como una debilidad. En este mismo proceso, en el apartado referido a los profesores de la escuela o facultad, se plantea que los mismos deben tener perfiles relacionados con los contenidos en su disciplina, grados académicos mayores al de la educación media superior, incluyendo los estudios de posgrado con reconocimiento universitario, formación pedagógica, vocación docente, capacidad para desarrollar investigación científica y disposición para el trabajo en equipo; con relación a estos aspectos se consideró lo siguiente: la plantilla docente en capacitación pedagógica en ciclos básicos, es de un 12 % y en ciclos clínicos solo un 10 % (4,5). El proceso de acreditación al final de este trabajo diagnóstico, concluyó que el claustro de la facultad objeto de análisis tiene insuficiencias en el orden pedagógico (3, 6). No obstante, este proceso no profundizó acerca del desarrollo de las competencias docentes básicas que tienen que caracterizar al profesor, lo que sirvió de importante incentivo para la realización de este trabajo. Resulta una exigencia social de primer orden, en relación con los procesos formativos, valorar una capacitación pedagógica del claustro profesoral pensada en términos de las competencias docentes que tienen que caracterizar al profesor para el desempeño de una docencia comprometida con el modelo profesional en salud que la sociedad actual exige, de forma tal que la gestión profesoral de respuesta a este reclamo social, que se sustenta en el hecho de contar con recursos humanos de salud que tengan los niveles requeridos de competencia y desempeño profesional que les permita resolver con profundidad, creatividad, independiente e integralmente los problemas de salud que se presenten en el individuo, la familia y la comunidad.

25


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

El proceso de formación de profesionales en la actualidad exige una conducción docente que considere como requisito esencial el carácter contextualizado del mismo, su enfoque sistémico y dinámico, valorando como componente curricular rector, a los problemas profesionales que deben ser resueltos por el futuro egresado. Esta realidad impone un reto a la dirección del Proceso Enseñanza Aprendizaje (PEA), y por lo tanto un reto para los actores principales; profesores y estudiantes, ya que la asimilación de los contenidos en el que aprende, debe tener lugar en el marco de desarrollo de las competencias necesarias y suficientes que permitan el desempeño esperado en la solución de los problemas que afrontará en su práctica profesional (2,7). Son muchos los conceptos y definiciones que sobre competencias existen, desde la primera mitad del siglo pasado es amplia la literatura sobre estos temas (8-10). Los autores de este trabajo tienen en cuenta no una definición acabada de competencia, sino un concepto operacional que incorpora los aspectos esenciales que la definen como valioso instrumento para la identificación de las mismas, por ello, se asume que las competencias constituyen “la posibilidad real que tiene el ser humano de integrar y movilizar sistemas de conocimientos, habilidades, hábitos, actitudes, motivaciones y valores para la solución exitosa de las actividades vinculadas a la satisfacción de sus necesidades cognitivas y profesionales expresadas en su desempeño en la toma de decisiones y la solución de situaciones que se presenten en su esfera de trabajo” (8). Si bien en la literatura consultada aparecen considerables referencias en relación con las tendencias y estrategias para la educación médica, la relación de la educación médica y el encargo social y las necesidades de la superación pedagógica del profesor como formador de recursos humanos en salud, no son frecuentes experiencias concretas relacionadas con la identificación de competencias docentes básicas en los profesores encargados de la formación de recursos humanos en salud, hecho que incentiva a los autores para la realización del presente estudio, dirigido a caracterizar la formación pedagógica de los profesores objeto de la investigación e identificar un grupo de competencias básicas para la gestión docente de la carrera de medicina en la Facultad “Dr. Ignacio Chávez”, lo que pone de manifiesto la importancia teórico-práctica y social, así como el impacto que estos resultados puedan tener en la formación del profesional médico de la facultad, ámbito de este trabajo. MATERIAL Y MÉTODO Se realizó un análisis documental de las siguientes fuentes: Proceso de acreditación de la Facultad de Medicina “Dr. Ignacio Chávez” efectuado en el curso escolar 2003-2004, literatura especializada en educación superior y literatura especializada en competencias docentes. De igual forma, fueron analizados otros documentos relacionados con el tema de las competencias docentes y de la metodología de investigación. Se utilizó la encuesta, con la aplicación de dos cuestionarios, dirigidos a profesores y estudiantes respectivamente; se seleccionó mediante un muestreo aleatorio simple a 151 profesores y 300 estudiantes, de los cinco años de la carrera objeto de estudio.

26


Estadística Aplicada a la Educación

Se realizó una entrevista a cinco expertos en el área de las competencias docentes, considerados como tal por tener más de 15 años de experiencia en la gestión docente y en la formación de varias generaciones de profesionales dedicados a la labor de profesor en la educación médica. Los temas abordados en la entrevista a expertos abarcaron aspectos relacionados con la efectividad y calidad de la docencia, importancia de la formación pedagógica centrada en las competencias docentes, dificultades más significativas que debilitan la práctica docente en la formación médica, así como la caracterización de las competencias docentes.

RESULTADOS Encuesta a profesores Es importante hacer notar, como se muestra en la tabla 1, que del total de los profesores encuestados, la mayoría, 90,72 % tienen la formación profesional de médicos, seguida de un porcentaje muy bajo de las otras profesiones, lo cual evidencia que la multidisciplinariedad, tiene insuficiencias, esto influye desfavorablemente en el trabajo en equipo como condición para la calidad de la educación. El predominio de la profesión médica impacta en la impartición de las ciencias básicas, las que pudieran verse favorecidas con un perfil de profesional más amplio que puede enriquecerse con profesores de otras áreas como químicos farmacobiólogos, o incluso por médicos con una mayor capacitacitación básica clínica y epidemiológica. Por otra parte, se obtuvo la información que 42,38 % de los profesores imparten clases en el área clínica quirúrgica, seguidos, por el área básica 20,52 %, mientras que el área sociomédica muestra solo un 5,29 %, lo que está en relación con el plan de estudios de la carrera. Esto se correspondió con el número de profesores con especialidades clínicas, quirúrgicas y diagnósticas que se solicitan en el período de la convocatoria de las plazas de las asignaturas correspondientes. Tabla 1. Formación profesional del claustro de la licenciatura en medicina Formación profesional Médicos Químicos Fármacobiólogos Psicólogos Biólogos Odontólogos Enfermeras Doctor en Ciencias Técnico en Histología Ingeniero Químico No contestaron Total

Número 137 3 1 6 0 1 1 1 1 0 151

% 90,.72 1,98 0,66 3,97 0 0,66 0,66 0,66 0,66 0 100

N= 151

27


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Es importante notar según la tabla 2, que el claustro de profesores estudiados tiene un bajo nivel en la formación académica ya que, como se observa, tan solo 2,65 % tienen doctorado, seguido por 6,62 % con el grado de maestría y 24,50 % la especialidad médica. Vale la pena significar que 66,23 % de los encuestados no contestaron, esto podría relacionarse con el hecho de tener solamente el nivel de licenciatura. Estos resultados concuerdan con los obtenidos en el proceso de acreditación de la carrera de medicina en la Facultad, donde entre las recomendaciones realizadas se encuentra la necesidad de incrementar la capacitación científico técnica y pedagógica (3). Tabla 2. Distribución de profesores según formación académica Nivel de preparación Doctorado Maestría Especialidad No contestaron

Número 4 10 37 100 N= 151

% 2,65 6,62 24,50 66,23

Según se muestra en la tabla 3, más de la mitad de los docentes estudiados (54,96 %) consideran que los objetivos de la asignatura no están en función del perfil del egresado y que los programas de la asignatura no están actualizados, lo cual se ratifica con las respuestas del 55,00 % de los estudiantes (Anexo1) cuando valoraron de malo y regular la concepción de los objetivos, para su futuro desempeño profesional. Estos resultados avalan la necesidad inmediata de la superación pedagógica del claustro profesoral, en aras de elevar la calidad del futuro egresado, valoración esta que coincide con lo planteado en la bibliografía consultada, donde se expresa que el perfil del egresado debe sustentar a las estrategias docentes, siendo determinante en la respuesta que debe dar la educación médica a los cambios de la práctica médica (8). Se encontró que, 81,40 % de los profesores encuestados refirieron hacer uso de los objetivos para planificar el proceso docente, argumentando que lo hacen para la más efectiva adquisición de los conocimientos por parte del alumno y cumplimiento del programa, no obstante, al preguntar en el cuestionario aplicado a los estudiantes (Anexo 1) sobre los problemas más relevantes que deben ser resueltos por la facultad donde estudian, estos manifestaron que, generalmente no se les dice sobre los conocimientos que deben alcanzar en las diferentes asignaturas, situación esta que influye incluso hasta en el momento de la evaluación. Estas respuestas apuntan hacia una incongruencia entre lo planteado por los profesores y los estudiantes en la dirección docente.

28


Estadística Aplicada a la Educación

Tabla 3. Profesores según declaración de los objetivos de la asignatura que imparte en función del perfil del egresado Declaración de objetivos de la asignatura en función del perfil del egresado Sí No No contestaron Total

Número

%

62 83 6 151

41,06 54,96 3,98 100

N= 151 Como muestra la tabla 4, las respuestas más comunes de los profesores fueron la valoración de bueno en la derivación de objetivos (66.20%), lo que está en concordancia con el porcentaje de profesores que refirieron hacer uso de los objetivos para planificar su actividad docente, no obstante, los criterios de los estudiantes no coinciden con esta valoración (Anexo 1). Tabla 4. Profesores según grado de dominio del proceso de derivación de objetivos Grado de dominio del proceso de derivación de objetivos Muy bueno Bueno Regular Insuficiente No contestaron Total

Número

%

19 100 24 3 5 151

12,58 66.22 15,89 1,98 2,33 100

N= 151 Es importante observar que más de la mitad de los profesores encuestados, 51,65 % manifiestan dominio en la aplicación de los métodos de enseñanza, como muestra la tabla 5. En esta misma pregunta, se le solicitaba al profesor que expresara cuáles métodos de enseñanza utilizaba, llama la atención en este sentido, las respuestas de 143 profesores (94,70 %), que demuestran no saber o equivocarse al plantear los métodos utilizados, pues confundieron los medios o recursos del aprendizaje con los métodos de enseñanza. Por otra parte, en las respuestas obtenidas en la pregunta abierta de este cuestionario, donde se le pide al profesor que exprese cuál método de enseñanza recomendaría para el desarrollo de competencias profesionales del futuro médico, las que más se repitieron evidenciaron falta de conocimientos en relación con esta categoría didáctica.

29


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Tabla 5. Profesores según grado de dominio en relación con los métodos de enseñanza Grado de dominio en relación con los métodos de enseñanza Muy bueno Bueno Regular Insuficiente No contestaron Total

Número

%

43 78 22 6 2 151

28,47 51,65 14,57 3,97 1,34 100

N= 151 Según la tabla 6, el 46,35 % de los profesores mantiene una buena comunicación en el proceso docente. Sin embargo, entre los problemas planteados por los estudiantes en el cuestionario aplicado (Anexo 1), en relación con los problemas de la Facultad, estos manifestaron insatisfacción en cuanto a la relación afectiva profesor-alumno, calificándola de regular a nula. Considerando la opinión de los expertos, la mayoría de ellos expresaron que la comunicación pedagógica profesor-alumno constituye un elemento clave en el PEA, así como la comunicación verbal y extraverbal, las que valoraron como básicas. Tabla 6. Profesores según grado de comunicación que establece con los alumnos en el proceso docente Grado de comunicación que establece con los alumnos en el proceso docente Muy bueno Bueno Regular Insuficiente No contestaron Total

Número

%

65 70 6 0 10 151

43,04 46,35 3,97 0 6,64 100

N= 151 Según los datos de la tabla 7, un elevado número de profesores encuestados 87,41% manifiestan la necesidad de actualizarse y superarse en su práctica docente. Estos resultados fueron de gran significación para el trabajo que se presenta ya que ponen de manifiesto la importancia y necesidad sentida en los profesores estudiados, en relación con la capacitación pedagógica centrada en las competencias docentes, como expresión concreta de la ausencia o poco desarrollo de las mismas.

30


Estadística Aplicada a la Educación

Tabla 7. Profesores según interés en participar en un curso centrado en competencias docentes Participación en curso centrado en competencias docentes Sí No No contestaron Total

Número

%

132 13 6 151

87,41 8,60 3,8 100

N= 151 Entrevista a expertos El 100% de los expertos entrevistados expuso la importancia del dominio de los contenidos de las asignaturas que se imparten y su actualización sistemática. Se planteó de igual forma, la importancia de la motivación del profesor hacia la gestión docente, lo que favorece el manejo de las situaciones de aprendizaje y de la comunicación pedagógica como elementos clave en el proceso de enseñaza-aprendizaje. En este sentido, expresaron cómo la planificación del trabajo en grupo constituye una importante estrategia en una dirección docente centrada en la productividad del aprendizaje. Es importante hacer notar que la motivación del profesor en relación con la gestión docente ayuda a animar situaciones de aprendizaje; en este sentido Perrenoud plantea, desarrollar una práctica reflexiva en el oficio de enseñar va destinado, en primer lugar a todos los profesionales que analizan y transforman sus prácticas, pero también a los que les acompañan: asesores, formadores, responsables de proyectos innovadores o equipos directivos de la escuela.10 Por otra parte, el 100 % de los expertos estuvo de acuerdo en que el perfil adecuado del profesor para impartir la asignatura y la preparación posgradual, son elementos importantes para el desarrollo de las competencias docentes académica y didáctica. Asimismo, fue valorada como fundamental la comunicación pedagógica verbal y extraverbal, y la relación profesor-alumno como elemento clave en el proceso de enseñazaaprendizaje. Los expertos expresaron que el desarrollo de la comunicación pedagógica debe ser entendido como un proceso que enriquece la personalidad del estudiante, es decir que contribuye a su crecimiento personal, integrando los aspectos cognoscitivos, la aplicación de estos, el aprender a convivir en su entorno y el aprender a ser. El 40% de los expertos entrevistados planteó que el profesor de ahora y en el futuro debe tener una valoración y autoestima de su persona muy elevada, para poder impartir la docencia con optimismo en espera de un mundo mejor. La generalidad de los entrevistados (80%) dio su punto de vista acerca de las competencias docentes básicas que debe adquirir y desarrollar un profesor: La competencia organizativa y su importancia para la gestión docente, fueron valoradas en relación con la planificación, organización, ejecución y control de todas las acciones

31


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

didácticas involucradas en el proceso educacional, asumiendo que el enfoque de dirección del proceso docente educativo que el profesor desarrolle debe considerar además, el romper con la espontaneidad y la improvisación. Fueron importantes para el trabajo que se presenta, las opiniones de los expertos que argumentaron cómo en el proceso de la formación de competencias del docente, la investigación de sus necesidades de aprendizaje resulta fundamental, pues entre otros aspectos, ello está relacionado con los logros e insuficiencias en el uso y dominio de las mismas. La generalización de esta valiosa información permitió la consideración de las siguientes competencias docentes: •

Manejo de las relaciones profesor-estudiante, que le permita al docente, organizar y dirigir las situaciones de aprendizaje, involucrando al estudiante en su propio aprendizaje.

Concepción sistémica, del proceso enseñanza-aprendizaje.

Dirección del proceso docente, a partir de su carácter bilateral, es decir relación profesor-estudiante.

Importancia de trabajar en grupo.

Superación constante del profesor durante toda su práctica.

Desarrollo de la comunicación pedagógica, entendida como un proceso que enriquece la personalidad del estudiante.

Competencia organizativa, relacionada con la planificación, organización, ejecución y control de todas las acciones didácticas involucradas en el proceso educacional.

DISCUSIÓN El análisis y valoración de las fuentes teóricas consultadas y la integración de estos criterios con los resultados obtenidos mediante los métodos empíricos utilizados, permitieron la identificación de un grupo de competencias docentes básicas que tienen que caracterizar al profesor de la licenciatura en medicina en su desempeño. Estos resultados van dirigidos al perfeccionamiento del proceso de formación de recursos humanos en salud, el cual debe distinguirse por su profundidad teórica, su aplicabilidad y actualidad. El carácter novedoso de este trabajo se puso de manifiesto en el hecho de que no se habían realizado estudios similares en relación con el claustro de profesores objeto de análisis. En la investigación llevada a cabo se pudo constatar que el claustro de profesores que se desempeñan en la carrera de medicina en la Facultad de Ciencias Médicas y Biológicas “Dr. Ignacio Chávez”, presentan insuficiencias de conocimientos y habilidades relacionadas con este desempeño, cuya causa multifactorial abarca desde su propia formación como especialistas hasta las numerosas tareas que deben afrontar en el doble rol docente-asistencial.

32


Estadística Aplicada a la Educación

Las competencias docentes básicas identificadas se relacionaron con los aspectos señalados por Perrenoud, en relación con aquellas que deben caracterizar al personal docente encargado de la dirección del proceso de enseñanza aprendizaje, tales como, competencia académica, competencia didáctica y competencia organizativa. La importancia teórico-metodológica del estudio desarrollado está relacionada con su enfoque contextualizado, lo que contribuye al desarrollo de la didáctica particular de las asignaturas que integran a la carrera de medicina en la Facultad, ámbito de este estudio, y a la aplicación de estrategias formativas que propicien elevar la calidad de la actuación del profesional egresado en sus futuros escenarios laborales.

CONCLUSIONES 1. El claustro de profesores que se desempeñan en la carrera de medicina en la Facultad de Ciencias Médicas y Biológicas “Dr. Ignacio Chávez”, presentan insuficiencias de conocimientos y habilidades relacionadas con este desempeño, cuya causa multifactorial abarca desde su propia formación como especialistas, hasta las numerosas tareas que deben afrontar en el doble rol docente-asistencial. 2. Se identificaron necesidades de aprendizaje en los profesores de la Facultad de Ciencias Médicas y Biológicas “Dr. Ignacio Chávez”, considerados en este trabajo, en relación con las competencias docentes básicas que tienen que distinguir a la gestión docente. La caracterización lograda en este sentido constituye una importante referencia para la planificación, organización y ejecución de las actividades capacitantes que en el orden pedagógico integren a la educación posgraduada de la Facultad, ámbito de este estudio. Anexo 1 Encuesta aplicada a los estudiantes de la Facultad de Ciencias Médicas y Biológicas “Dr. Ignacio Chávez”. Encuesta a estudiantes: Estimados alumnos, la presente encuesta tiene por objeto conocer su valiosa opinión sobre la dirección y desarrollo del proceso docente en nuestra institución, así como también aspectos relacionados con el plan de estudio de la carrera que cursan. Sus opiniones podrán enriquecer y contribuir de modo importante al rediseño curricular que se efectúa en estos momentos, e indudablemente favorecerán al proceso de elevación de la calidad educacional en la Facultad de Medicina, estudio este en el cual nos encontramos inmersos, por lo que esperamos su estimada contribución. Les reiteramos que su participación en este trabajo es totalmente voluntaria y anónima. Para contestar esta encuesta es necesario que tengan en cuenta las siguientes definiciones:

33


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Habilidad: capacidad para realizar una tarea con éxito. Destreza: nivel de perfeccionamiento y automatización con que se realiza una tarea. Pertinencia médica: acciones de salud y características que distinguen a la profesión médica para responder a una necesidad social. De antemano les damos las gracias por su colaboración. Muchas Gracias. Instrucciones Las preguntas del cuestionario que consideran opciones de respuestas de: “excelente”, “bien”, “regular” y “mal” se corresponden con una escala numérica de 5, 4, 3 y 2; los valores 5 y 2 representan las valoraciones máxima y mínima, respectivamente. 1. Datos Generales: Edad _____años Sexo F ___ M___ 2. ¿Considera que la Universidad ha desarrollado en usted hábitos de autoaprendizaje? Sí ( )

No ( )

¿Por qué? ________________________________________________ 3. ¿Los profesores le orientan para mejorar su proceso de aprendizaje? Sí ( )

No ( )

De contestar Sí, especifique la forma y frecuencia en que recibe la orientación. (Puede marcar más de un elemento) ( ) Oral ____ en forma de guías ___en formato digital ____ permanentemente ( ) En ocasiones ( ) Otros formas. 4. ¿Especifique cuál o cuáles? Asesoría personal. ______________________________________________________________ 5. ¿Cómo usted valora la adquisición de conocimientos en general, que le ha proporcionado el proceso de enseñanza en la Facultad de Medicina? Excelente________ Bien____________ Regular_________ Mal____________

34


Estadística Aplicada a la Educación

6. ¿Cómo usted valora la adquisición de las habilidades para su futuro desempeño profesional, que le ha proporcionado el proceso de enseñanza en la Facultad de Medicina? Excelente_________ Bien_____________ Regular__________ Mal______________ 7. ¿Cómo calificaría usted de modo general su grado de satisfacción como estu diante de la Facultad de Medicina “Dr. Ignacio Chávez”? Excelente________ Bueno___________ Regular__________ Mal_____________ 8. Mencione los problemas que a su juicio, considere como relevantes y que deban ser resueltos de manera urgente en la Facultad de Medicina ______________________________________________________________ ¡¡ MUCHAS GRACIAS POR SU PARTICIPACIÓN!! Summary Teaching competencies found in medical professors of Universidad Michoacana de San Nicolas de Hidalgo To identify a group of basic teaching competencies of professors working at “Dr. Ignacio Chavez” Faculty of Medicine, which is the main objective of this paper, theoretical and empirical methods were used. A selected sample of professors and students was surveyed. Statistical procedures for the analysis of results and design of tables were also used. Based on the detection of learning needs of the surveyed professors as far as leading of teaching-learning process is concerned and on the theoretical references on this topic, a more comprehensive analysis was made to assess collected data, which allowed characterizing those professors under study as to basic teaching competencies inherent to relevant formative management. The latest methodological principles about the formation of human resources in higher education, particularly in higher medical education, were considered. Key words: Teaching competencies, teaching-learning process, faculty, primary health care, teaching formation.

35


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

REFERENCIAS BIBLIOGRÁFICAS 1. Byrne N, Rozental M. Tendencias actuales de la educación médica. Educ Med Salud. 1994;28(1). 2. Nolla N. Un instrumento para la evaluación y certificación del diseño curricular [tesis para optar por el título de Master en Educación Médica Superior]. Ciudad de La Habana: ISCM-H; 2001. 3. Consejo Mexicano para la Acreditación de la Educación Médica, AC. Informe de la visita de Verificación. Morelia: Universidad Michoacana de San Nicolás de Hidalgo. Noviembre. 2003:31-2. 4. Universidad Michoacana de San Nicolás de Hidalgo. Instrumento de autoevaluación para la acreditación de la facultad de medicina “Dr. Ignacio Chávez” ante la AMFEM y la CÓMAMEM. Morelia: Universidad Michoacana de San Nicolás de Hidalgo; 2003. 5. Facultad de Medicina. Informe de los resultados de las encuestas aplicadas a los profesores en el actual proceso de rediseño de la carrera de medicina. Morelia: Facultad de Medicina; 2004. 6. Informe del Consejo Mexicano para la Acreditación de la Educación Médica. Universidad Michoacana de San Nicolás de Hidalgo, Morelia: UMNSH; 2003. 7. Conferencia Mundial Sobre Educación Superior. UNESCO. Material Bibliográfico de la Maestría en Educación. Médica. Centro Nacional de perfeccionamiento médico, La Habana. (2003), París 5-9 de octubre de 1998. 2003. 8. Nogueira Sotolongo M, Rivera Michelena N, Blanco Horta F. Desarrollo de competencias para la gestión docente en la educación médica superior. [2004 junio 5]: [4 pantallas]. Disponible en:http://bvs.sld.cu/revistas/ems/vol17_3_03/ems04303.htm 9. Perrenoud P. Pedagogia diferenciada. Porto Alegre, Brasil: ARTMED. 2002. 10. Perrenoud PE, Gather TM. As competências para ensinar no século XXI. Editorial ARTMED. Porto Alegre, Brasil; 2002. Recibido: 17 de septiembre de 2006. Aprobado: 23 de octubre de 2006. M.C. Lidia Manzo Rodríguz. Facultad de Ciencias Médicas y Biológicas. Dr. Ignacio Chávez”. Morelia, Michoacán México. E-mail: lidiamanzo2@hotmail.com.mx.

36


Estadística Aplicada a la Educación

1.2 Leer el siguiente artículo a fin de responder: a. ¿Por qué se ha empleado tanto la estadística descriptiva como inferencia lograr los objetivos de esta investigación? b. ¿Se ha empleado censo o una muestra para recolectar datos? PERCEPCIÓN DE LOS ESTUDIANTES UNIVERSITARIOS DE SUS PROPIAS HABILIDADES DE INVESTIGACIÓN Mtra. María Elena Rivera Heredia y Mtra. Claudia Karina Torres Villaseñor merivera@bolivar.usb.mx; ambiental@bolivar.usb.mx Universidad Simón Bolívar RESUMEN El objetivo de esta investigación fue identificar la percepción que tienen los estudiantes universitarios respecto a sus habilidades de investigación, para lo cual se utilizó un instrumento llamado “Autoevaluación de habilidades de investigación” (Rivera, Torres, García Gil de Muñoz, Salgado, Arango, Caña y Valentín, 2005). Participaron 119 estudiantes de los cuales 73.7% fueron mujeres y 26.3% hombres, entre ellos, el 88.2% se encontraba realizando estudios de licenciatura y el 11.8% de posgrado. Se contó con representantes de cuatro áreas de conocimiento: Ciencia y tecnología, Ciencias humanas, Ciencias económico administrativas, y Educación. La confiabilidad del instrumento aplicado fue alta (Alfa de Cronbach =.9557). Se encontró que la mayoría de los estudiantes asignan calificaciones altas a sus habilidades de investigación y que por lo general los hombres y las mujeres evalúan sus habilidades de investigación de manera semejante; cuando aparecen diferencias significativas, son los hombres quienes se asignan puntajes más altos. Se discuten las diferencias entre los resultados arrojados por este cuestionario con los de otras estrategias de evaluación. Palabras clave: evaluación, habilidades, competencias, investigación, estudiantes. INTRODUCCIÓN Las universidades desde su surgimiento tienen como funciones sustantivas la docencia, la investigación, y la difusión de la cultura. Por lo que el vincular la formación profesional de los estudiantes con el desarrollo de habilidades de investigación es una tarea que se requiere promover dentro del ámbito educativo y en los diferentes niveles de educación, logrando una mayor definición de éstas en el nivel universitario a partir de la licenciatura y con mayor fuerza en el posgrado. De ahí que para las instituciones educativas de enseñanza superior cobra relevancia identificar las habilidades de investigación que requieren incrementar en sus estudian-

37


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

tes, para lo cual son necesarias diferentes estrategias de evaluación y diagnóstico. Por lo que desarrollar instrumentos de evaluación de habilidades e identificar la percepción que los estudiantes universitarios respecto a sus propias habilidades de investigación se torna en una actividad necesaria para la retroalimentación y diseño de planes y programas de estudio tanto a nivel curricular como extracurricular. La investigación es “un proceso que, mediante la aplicación del método científico, procura obtener información relevante y fidedigna, para entender, verificar, corregir o aplicar el conocimiento” (Tamayo y Tamayo, 2005, p. 37). El ser humano cuenta con la capacidad de observación, y de cuestionamiento de la realidad observada así como con el planteamiento de posibles explicaciones al respecto. Cuando este proceso se sistematiza utilizando el método científico: “La investigación científica, como base fundamental de las ciencias, parte de la realidad, investiga esa realidad, la analiza, formula hipótesis y fundamenta nuevas teorías” (Tamayo y Tamayo, 2005, p.39). Uno de los principales problemas al hacer investigación es el de tomar la decisión de qué tan bien se desea hacerla, puesto que el éxito de encontrar la información pertinente, necesaria y de vanguardia depende tanto de la actitud como de las destrezas de quien hace la investigación (Walker, 2005). Al respecto Chavarti (2004, p. 52) comenta: “El investigador debe desarrollar competencias que le permitan enfrentar el problema de manera dinámica y flexible. Para dedicarse a esta actividad se requiere de una especie de filtro cognitivo que consiste en cuestionarse acerca de lo datos, confrontar la teoría con la evidencia y desarrollar la capacidad para reconocer falsas teorías. Estas habilidades cognitivas sofisticadas son conocidas como habilidades de orden superior o metacognitivas”. El proceso de investigación científica debe ser sistemático. Hernández, Fernández y Baptista (2004) lo dividen en 10 pasos: 1) concebir la idea a investigar, 2) plantear el problema de investigación, 3) elaborar el marco teórico, 4) definir el nivel de alcance de la investigación (exploratoria, descriptiva, correlacional o explicativa) 5) establecer las hipótesis, detectar y definir las variables, 6) seleccionar el diseño apropiado, 7) seleccionar la muestra, 8) recolectar los datos, 9) analizar los datos y 10) presentar los resultados. Los propósitos de la investigación tradicionalmente han sido el producir conocimiento y teorías, lo cual corresponde a la investigación básica y el resolver problemas prácticos, que ha sido denominado investigación aplicada (Hernández et al., 2004). Para Tamayo y Tamayo (2005) en la investigación básica se plantea la teoría, mientras que en la aplicada se confronta la teoría con la realidad, y ésta última puede ser histórica (describe lo que era), descriptiva (interpreta lo que es) o experimental (describe lo que será). El camino para formarse como investigador en el área experimental, de acuerdo con lo señalado por Bolívar Zapata en el simposio sobre formación de grupos de investigación organizado por la FIMPES (2004) es el siguiente:

38


Estadística Aplicada a la Educación

“...se inicia como aprendiz de brujo: uno se pega a un gran maestro o a un buen investigador y de él aprende y ahí en el laboratorio ve cómo va obteniendo las cosas y observa cómo se está pensando, y esto es parte de la cultura y de la formación de los estudiantes, no nada más cursos en el Laboratorio. Lo anterior es parte importante en este proceso de ir formando a los nuevos investigadores, a la gente que piensa cómo están organizadas las cosas y tratar a partir de aquí entender y señalar que así funciona este sistema, así funciona la célula, así funciona la célula infectada, así funciona la célula cancerosa, cuáles son las analogías, cuáles son las diferencias” (p. 58). Las competencias están conformadas por los motivos, rasgos, conceptos de sí mismo, conocimientos y capacidades cognoscitivas y conductuales; expresan los requerimientos humanos valorados en la relación hombre-trabajo (Cowling y James, 1997). De tal manera que las habilidades son un componente de las competencias. Dentro del amplio campo de las habilidades que se relacionan con el razonamiento científico, Zimmerman (2000) se concentra en el razonamiento y las estrategias de solución de problemas que se involucran en las fases de experimentación y de evaluación de las evidencias, señalando que inicialmente la investigación en este campo se enfocó en tareas basadas en el conocimiento actual o en tareas en las que las personas demostraran sus conocimientos previos, Klahr y Dunbar (1998 en Zimmerman, 2000) desarrollaron un modelo integrado del descubrimiento científico que ha servido como marco al estudio de la interacción entre conocimiento conceptual y el conjunto de habilidades cognitivas utilizadas en el razonamiento científico, a partir de este modelo, las investigaciones más recientes examinan el desarrollo y utilización de estrategias en dominios moderadamente complejos para examinar las condiciones bajo las cuales las teorías de las personas (o su conocimiento previo) influyen en la experimentación, evidencia, evaluación y en la revisión de creencias. Consideran que estos trabajos realizan aportaciones tanto para la ciencias de la educación como para las conceptualizaciones sobre la ciencia. Otras de las habilidades estrechamente relacionadas con la investigación son la búsquedas de información especializada en bibliotecas y bancos de datos tanto el manejo de análisis estadísticos para la toma de decisiones y al respecto Williams II & Winston (2003) contextualizan dicha habilidad al trabajo de los académicos asignados a los departamentos de biblioteca de las universidades, y a su papel tanto como investigadores como en su rol de apoyo en las búsquedas de información especializada por parte de los estudiantes. Las habilidades de investigación pueden desarrollarse desde temprana edad. Por ejemplo, French (2004) describe las características y efectividad de un programa llamado “ScienceStart!” , que traducido al español sería ¡El inicio de la Ciencia! o ¡Empezando la Ciencia! Cada día la clase de ciencia está estructurada de acuerdo con un ciclo sencillo de razonamiento científico: reflejar y preguntar, planear y predecir, actuar y observar, reportar y reflejar. Los contenidos relacionados con matemáticas y ciencias sociales se integran. También se planean actividades artísticas y recreativas fuera del salón de clase y dentro de este mismo programa. En sí, apoya el óptimo desarrollo de los niños

39


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

durante la etapa preescolar, particularmente en las áreas de lenguaje, adquisición de requisitos para la lecto-escritura, solución de problemas, interacción social, autorregulación, planeación y administración de la atención. Promueve que los niños sean capaces de adquirir una rica base de conocimientos que apoyarán la adquisición de vocabulario y el uso de habilidades cognitivas de alto nivel, como la planeación, la predicción, la generación de inferencias. Así como el intercambio de información, el planteamiento de preguntas, y la planeación de cómo dar respuesta a ellas, el leer en voz alta, consultar libros por información, hacer tablas y gráficas, dictar reportes y describir cuidadosamente las observaciones realizadas. Los niños que han participado en este programa han obtenido un incremento notable en sus habilidades cognitivas, evaluado mediante instrumentos estandarizados (Peabody Picture Vocabulary Test), además de mostrar interés e involucramiento en las actividades, se les observa socialmente activos y con escasas conductas disruptivas. Cada una de las habilidades y competencias mencionadas son piezas clave de las diferentes fases proceso de investigación, por lo que tendrían que irse desarrollando desde el menor hasta el mayor grado de estudios. Entre las investigaciones que han evaluado competencias en estudiantes universitarios pueden mencionarse las de Norman, Watson, Murrells, Calman y Redfern (2002) quienes concluyen que no hay un método exclusivo para evaluar las competencias, sino sugieren una amplia estrategia de medición que incluya múltiples métodos la cual asegure que los estudiantes hayan adquirido el complejo repertorio de conocimientos, habilidades y actitudes que se requieren para demostrar competencia profesional. Bajo la misma línea Brochlehurst y Rowe (2003) analizan un instrumento de evaluación de habilidades en salud pública y determinan su confiabilidad y validez; identificaron 10 dominios de competencia utilizando un análisis factorial. Los estudios que reportan la percepción de las habilidades en los estudiantes, por lo general se han orientado a la conexión de dichas habilidades con el mercado laboral (Cox y Fallas, 2001) o a la medición de las habilidades de pensamiento y cognitivas (Amestoy de Sánchez, 2002). En México, escasamente se encuentran estudios que reporten las habilidades que en materia de investigación tienen los estudiantes, como tampoco se cuenta con instrumentos al respecto, lo que lleva cuestionar ¿cuál es la percepción que tienen los estudiantes universitarios de sus habilidades de investigación? OBJETIVO Identificar la percepción que tienen los estudiantes universitarios de sus habilidades de investigación. MÉTODO Participantes: en esta investigación se contó con 119 participantes de los cuales el 73.7% fueron mujeres y 26.3% hombres. El 88.2% se encontraba realizando estudios de licenciatura y el 11.8% estudios de posgrado. El número de estudiantes que participó

40


Estadística Aplicada a la Educación

de acuerdo a la facultad o escuela profesional a la que pertenecen es el siguiente: De la facultad de Ciencia y tecnología, 39 personas, de la facultad de Ciencias humanas, 37 personas, de la facultad de Ciencias económico administrativas, 23 personas y de la Escuela profesional de educación, 20 personas. Instrumentos: se aplicó el instrumento titulado “Autoevaluación de Habilidades de Investigación” desarrollado en el 2005 por María Elena Rivera, Claudia Karina Torres, Fernando García Gil de Muñoz, Rosa Salgado Brito, Lidia Elena Caña, Luis Gabriel Arango, Nadina Valentín Kajatt y Elizabeth Palacios. Se trata de un instrumento de autoreporte conformado por 50 reactivos, en donde cada participante realiza una evaluación de sus habilidades de investigación de acuerdo a su percepción (ver anexo). Para la construcción de este instrumento en un primer momento los autores analizaron las actitudes, habilidades, destrezas y conocimientos que pueden indicar que una persona cuenta con competencias en investigación y determinaron un listado de las mismas el cual se adaptó a manera de escala de evaluación en la que el puntaje mínimo es 1 y el máximo es 10. Tabla1. Instrumento de autoevaluación de habilidades de investigación Nombre ________________________ Materia:________________________

Sexo____ Edad___ Fecha________ Programa Académico________________ 1

2 3 4 5 6 7 8 9 10

TRABAJO EN EQUIPO VALORES Y ACTITUDES

RESPETO RESPONSABILIDAD HONESTIDAD AUTOCONTROL OBSERVACIÓN ANÁLISIS

HABILIDADES COGNITIVAS

SÍNTESIS SISTEMATIZACIÓN EVALUACIÓN SOLUCIÓN DE PROBLEMAS TOMA DE DECISIONES

DOMINIO TECNOLÓGICO BASICO DOMINIO TECNOLÓGICO ESPECIALIZADO

WORD EXCEL POWER POINT INTERNET SPSS MACROMEDIA OTRO________

41


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

COMUNICACIÓN ORAL Y ESCRITA BÁSICA

COMPRENSIÓN DE LECTURA EN ESPAÑOL ORTOGRAFÍA Y REDACCIÓN EN ESPAÑOL INTERPRETACIÓN DE CÓDIGOS Y GRÁFICAS LECTURA EN INGLES

COMUNICACIÓN ORAL Y ESCRITA ESPECIALIZADO

REDACCIÓN EN INGLES EXPRESIÓN VERBAL EN INGLES ESTRUCTURA DE UN REPORTE DE INVESTIGACIÓN

AUTOEVALUACIÓN DE HABILIDADES DE INVESTIGACIÓN 1 2 3 4 BÚSQUEDA DE LIBROS Y REVISTAS EN BIBLIOTECA SELECCIÓN DE MATERIAL BIBLIOGRÁFICO EN INTERNET DOMINIO TÉCNICO BAÁICO

BÚSQUEDA DE BASES ELECTRÓNICAS DE INFORMACIÓN ELABORACIÓN DE FICHAS DOCUMENTALES ELABORACIÓN DE FICHAS DE TRABAJO INFORMACIÓN DE VANGUARDIA SOBRE EL TEMA DE ESTUDIO

DOMINIO TÉCNICO ESPECIALIZADO (MARCO TEÓRICO)

INFORMACIÓN CLÁSICA SOBRE EL TEMA DE ESTUDIO MODELOS TEÓRICOS QUE DAN EXPLICACIÓN AL MODELO DE ESTUDIO COMPARACIÓN ENTRE PLANTEAMIENTOS, POSTURAS Y AUTORES.

42

5

6

7

8

9

10


Estadística Aplicada a la Educación

RECOLECCIÓN DE LOS DATOS DOMINIO TÉCNICO ESPECIALIZADO RESULTADOS

SISTEMATIZACIÓN DE LOS RESULTADOS OBTENIDOS DESCRIPCIÓN DE LOS RESULTADOS OBTENIDOS INTERPRETACIÓN DE LOS RESULTADOS

DOMINIO TÉCNICO ESPECIALIZADO DISCUSIÓN

CONCLUSIONES

DOMINIO TÉCNICO ESPECIALIZADO REFERENCIA

ELABORACIÓN DE REFERENCIAS DE ACUERDO AL MODELO APA PARTICIPAR EN ALGUNA FASE DE UNA INVESTIGACIÓN CIENTÍFICA PARTICIPAR EN ALGUNA FASE DE INVESTIGACIÓN CUALITATIVA REDACTAR UN INFORME DE INVESTIGACIÓN

DOMINIO TÉCNICO ESPECIALIZADO EXPERIENCIAS EN INVESTIGACIÓN

PUBLICAR UN INFORME DE INVESTIGACIÓN PRESENTAR EN CONGRESOS UN INFORME DE INVESTIGACIÓN DISEÑAR UNA INVESTIGACIÓN DIRIGIR UNA INVESTIGACIÓN OBTENER FINANCIAMIENTO A UNA INVESTIGACIÓN

Procedimiento: se invitó a un grupo de docentes a colaborar con esta investigación aplicando el instrumento de “Autoevaluación de Habilidades de Investigación” dentro del salón de clases y en la asignatura que ellos imparten. La aplicación se llevó a cabo al inicio del ciclo escolar. Se aclaró que la finalidad del instrumento era conocer la percepción que cada estudiante tiene en respecto a sus habilidades de investigación. Tanto la participación de los docentes como la de los estudiantes fue voluntaria.

43


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Análisis de los datos: para el análisis de los datos recabados se utilizó el programa SPSS PC versión 10.0. Se realizaron análisis estadísticos tanto de tipo descriptivo como inferencial. En el primer caso se realizaron análisis de frecuencias y medias, y en el segundo, se realizaron análisis de varianza, de correlaciones y de Alfa de Cronbach. RESULTADOS Dado que en este estudio se puso por primera vez a prueba un cuestionario para evaluar las habilidades y competencias de investigación, a éste se le realizó un análisis de confiabilidad utilizando la prueba de Alfa de Cronbach a cada uno de los dominios (también llamados escalas) del cuestionario, así como se llevó a cabo un análisis global al total de reactivos del cuestionario. Tabla 2. Confiabilidad del instrumento DOMINIOS O ESCALAS

NÚMERO DE ALFA DE REACTIVOS CRONBACH

Valores y actitudes

5

.7475

Habilidades cognitivas

7

.8753

Dominio tecnológico básico + especializado

6

.7494

Comunicación oral y escrita básica

3

.7548

comunicación oral y escrita especializada –inglés–

4

.8568

Dominio técnico básico –búsqueda bibliográfica–

6

.8833

Dominio técnico especializado –marco teórico–

4

.8784

Dominio técnico especializado –resultados–

3

.8930

3

.8647

8

.9171

49

.9557

Dominio técnico especializado –discusión + referencias– Dominio técnico especializado –experiencias en investigación– TOTAL

Se encontró una alta consistencia interna en cada una de las escalas del cuestionario que variaron entre .7475 hasta .9171; en el caso del análisis global de la escala (los 50 reactivos en su conjunto –a excepción del reactivo 19 cuya respuesta era abierta) fue todavía mayor obteniendo un valor alfa de .9557. En la tabla 2 se describe el nombre de cada escala, el total de reactivos que la conformaron y su consistencia interna (Alfa de Cronbach).

44


Estadística Aplicada a la Educación

Cabe aclarar que para el análisis de la confiabilidad de las escalas del instrumento que se presenta en la Tabla 2 se unieron los reactivos pertenecientes al dominio tecnológico básico y los del dominio tecnológico especializado, así como el reactivo del dominio técnico especializado –referencias– con los reactivos del dominio técnico especializado –discusión-, por lo que se analizaron 10 escalas o dominios en lugar de las 12 planteadas originalmente en el instrumento.

Figura 1. Calificación que los estudiantes se asignan en cada una de las dimensiones. De las 11 escalas que conforman el cuestionario, los estudiantes se autoevaluaron con puntajes superiores al 8.0 en 6 de ellas (Dominio técnico especializado –discusión-, Dominio técnico especializado –resultados-, Comunicación oral y escrita básica, Dominio tecnológico básico, Habilidades cognitivas, y Valores y actitudes), con puntajes entre 7.0 y 8.0 en 2 escalas (Dominio técnico especializado –marco teórico- y Dominio técnico especializado –búsqueda bibliográfica-); con puntajes entre 6.0 y 7.0, una escala (Comunicación oral y escrita especializada –inglés-) y con puntajes entre 5.0 y 6.0 en 1 escala (Dominio técnico especializado –experiencias en investigación-). Finalmente la escala donde se evaluaron con menores puntajes fue calificada entre 3.0 y 4.0 (Dominio tecnológico especializado).

45


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Tabla 3. Comparación entre hombres y mujeres PROMEDIO DE LOS HOMBRES

PROMEDIO DE LAS MUJERES

F

SIGNIFICANCIA

Elaboración de la discusión

8.79

8.17

7.570

.007

Habilidades cognitivas

8.52

8.15

2.984

.087

Experiencias como expertos

6.32

5.35

3.150

.079

NOMBRE DE LA DIMENSIÓN

Cuando se comparan los hombres y las mujeres en cuanto a su autopercepción en sus habilidades y competencias de investigación utilizando un análisis de varianza de una vía, se encuentra una gran similitud en ambos grupos, encontrándose diferencias significativas únicamente en una de las once escalas: Elaboración de la discusión (promedio de los hombres= 8.79 y promedio de las mujeres= 8.17; p.=.007), en donde los hombres se perciben con mayores habilidades que las mujeres en dicho rubro. En dos de las escalas a pesar de no encontrarse diferencias significativas entre hombres y mujeres, se encuentran tendencias a calificarse de manera distinta en las escalas de Habilidades cognitivas y Experiencia de investigación. Encontrándose una tendencia semejante a la mencionada anteriormente, en donde los hombres se califican con puntajes más altos que las mujeres (ver Tabla 3).

DISCUSIÓN En el presente trabajo fue posible alcanzar el objetivo planteado, el cual era “Identificar la percepción que tienen los estudiantes universitarios de sus habilidades de investigación”. Esto permite establecer un diagnóstico inicial de la perspectiva que tienen los estudiantes de las habilidades que han desarrollado hasta el momento de la evaluación. También es un punto de referencia y reflexión para el trabajo de quienes tienen el interés de promover la investigación en las instituciones educativas y en los diferentes actores del proceso educativo, tales como la Comisión de Investigación de la Federación de Instituciones Mexicanas Particulares de Educación Superior (FIMPES). Las habilidades en donde los estudiantes se evaluaron con puntajes más altos fueron las relacionadas con los dominios de valores y actitudes, las cuales corresponden a un nivel genérico por lo que son promovidas en los estudiantes desde las diferentes disciplinas y asignaturas. Estas habilidades forman parte del rubro de competencias personales en el ámbito de las competencias profesionales y cada vez son más valoradas a nivel empresarial y social. También obtuvo puntajes altos el dominio de la elaboración de la discusión, lo cual va relacionado tanto con el dominio de habilidades cognoscitivas como con el dominio de técnico especializado de obtención de resultados.

46


Estadística Aplicada a la Educación

Por otro lado el dominio con menor puntaje fue el dominio tecnológico especializado, lo que nos indica que es necesario capacitar a los estudiantes en esta área que la mayoría de las veces se deja a un lado. De manera colateral se puso a prueba, el instrumento de “autoevaluación de las habilidades de investigación” obteniendo una confiabilidad alta en cada una de las dimensiones evaluadas. Esto permite tener un instrumento que puede servir como punto de partida para identificar cuales son las fortalezas y carencias que el estudiante percibe en el momento de la aplicación del instrumento. Asimismo, dicho instrumento puede utilizarse como un recurso didáctico con el que el estudiante evalúe qué tanto avance en obtuvo en las diferentes habilidades en determinada asignatura, o que el docente utilice a manera de pretest-postest, después de hacer una intervención sobre desarrollo de habilidades investigación en su asignatura. También puede utilizarse como un instrumento que el docente utilice en la planeación didáctica de sus asignaturas, en donde plantee en sus objetivos del curso el desarrollo de determinadas habilidades relacionadas con la investigación, así como las estrategias de enseñanza y aprendizaje que requiere para lograrlo. Otra posibilidad de uso de este instrumento es la de monitoreo del desempeño de cada estudiante, a partir del cual se podrán proponer estrategias de enseñanza y de aprendizaje que aprovechen las habilidades más desarrolladas y promuevan el incremento de las habilidades que no se han abordado hasta el momento. Debido a que se trata de un instrumento de autopercepción, los resultados obtenidos mediante éste posiblemente estén alejados de los resultados que se recabarían con otro tipo de instrumentos que evalúen ya no la percepción sino la competencia en sí. El interés por la evaluación de competencias es creciente (Zimmerman, 2000; Williams II & Winston, 2003; Norman et al., 2002; Brochlehurst y Rowe, 2003; Cox y Fallas, 2001; Amestoy, 2002), sin embargo la evaluación de habilidades y competencias en investigación en México todavía es incipiente. Esperar al desarrollo de estas habilidades hasta el nivel universitario implica haber perdido muchos años de oportunidad, pues éstas deberían desarrollarse desde el más temprano desarrollo, tal como lo propone el programa desarrollado por French (2004) para el desarrollo de habilidades científicas en preescolares. Entre las posibles explicaciones a las calificaciones altas que los estudiantes se autoatribuyen se puede mencionar el desconocimiento de lo que cada habilidad es e implica, así como la falta de experiencia en materia de investigación, donde pueden creer que dominan determinada habilidad hasta que no se les enfrenta a una tarea que la involucre, mediante la cual demuestren la posesión de la misma (Irigoin, 2003). Esto puede explicarse debido a que los reactivos del cuestionario mencionan el nombre de una habilidad pero no la definen en sí, lo que puede implicar que los estudiantes interpreten determinada habilidad inadecuadamente. Ejemplo de ello podrían ser sus puntajes altos

47


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

en la habilidad de “elaboración de la discusión”, la cual es tiene una naturaleza compleja pues requiere habilidades de análisis, síntesis, evaluación, relación de la revisión teórico con los resultados encontrados, habilidades comunicación oral y escrita especializadas, entre otras. Aunque la muestra conformada por 119 sujetos no es muy amplia, sin embargo, si permite hacer una primera aproximación al tema, y generar puntos de partida para futuras investigaciones. El instrumento también puede utilizarse en los procesos de selección de personal para los puestos de docente- investigador, siempre y cuando vaya acompañado de otro instrumento que evalúe la habilidad en sí. Para ello se requiere desarrollar instrumentos para evaluar los mismos rubros, mediante la demostración de competencias de investigación específicas. Se espera que la presente investigación sea un punto de partida para futuros trabajos que colaboren en la formación de jóvenes investigadores. CONCLUSIÓN La confiabilidad del instrumento de Autoevaluación de habilidades de investigación probado por primera vez en población universitaria es alta (Alfa de Cronbach de .9557). Se presenta una tendencia en los estudiantes a calificarse con puntajes altos en las diferentes habilidades de investigación evaluadas. No se encuentran diferencias significativas entre hombres y mujeres respecto a su percepción en sus habilidades de investigación a excepción de la elaboración de la discusión, en donde ellos se asignan puntajes más altos que ellas. Se continuará perfeccionando el instrumento de evaluación así como las diferentes alternativas para el manejo de dicho instrumento no solo como parámetro de la percepción de los estudiantes sino como recurso didáctico, que colabore en el desarrollo de las habilidades de investigación dentro del ámbito universitario. REFERENCIAS 1. Amestoy, M. (2002). La investigación sobre el desarrollo y la enseñanza de las habilidades de pensamiento. Revista electrónica de Investigación Educativa, 4, 1. Recuperado el 30 de enero de 2006 en http://redie.uabc.mx/contenido/vol4no1/contenido_amestoy.pdf 2. Brocklehurst, N.J. y Rowe, A. (2003). The development and application of a public health skills assessment tool for use in primary care organizations. Public Health, 117, 3, 165-172. 3. Charavatti, M. (2004). ¿Metacognición o serendipia en la investigación? Panorama de la Investigación en la Universidad Anáhuac. Logros y Retos. Memorias del primer simposio. México: Universidad Anáhuac

48


Estadística Aplicada a la Educación

4. Cowling, A y James P. (1997), La esencia de la administración de personal y las relaciones industriales, Ed. Prentice Hall Hispanoamericana, México. 5. Cox, A. y Fallas, J. (2002). Estudio de empleadores de los profesionales en ingeniería en Costa Rica. 2001. Informe final, recuperado el 30 de enero de 2006 en http://opes. conare.ac.cr/catalogos/doctoexcomp/opes/OPESOS_2002.pdf. 6. FIMPES (2004). Formación de grupos de investigación. Memorias de un simposio. Cuernavaca Morelos, Enero 2004. 7. French, L. (2004). Science as the center of a coherent, integrated early childhood curriculum. Early Childhood Research Quarterly, 19, 1, 138-149. 8. Hernández, R., Fernández, C. y Baptista, P. (2004). Metodología de la Investigación. Tercera edición. D.F. México: McGrawHill. 9. Irigoin, M. (2003) en SENCE- Innovación y Desarrollo- Departamento de Estudios. Apunte técnico 1 Enfoque de capacitación por competencias. Recuperado el 2 de enero de 2006 de http://www.sence.cl/CAPACITxCOMPETENCIA/Apunte-TEcnicoCapacitaciOnbasadAenCompetencias2.pdf. 10. Norman, I. J., Watson, R. Murrells, T, Calman, L. & Redfern, S. (2002). The validity and reliability of methods to assess the competence to practise of pre-registration nursing and midwifery students. International Journal of Nursing Studies, 39, 2, 133145. 11. Rivera, M.E., Torres, C. K., Gil de Muñoz, L. F.; Brito, R., Valentín, N., Caña, L.E., Arango, L.G. (2005). Taller de habilidades de investigación. Proyecto de Investigación institucional dentro del programa de Planeación Institucional 2005-2010. Documento de circulación interna. Universidad Simón Bolívar, México. 12. Tamayo y Tamayo M. (1999). El proceso de la investigación científica. Incluye Evaluación y administración de proyectos de investigación. D.F., México: Limusa, Noriega editores, 1991. 13. Williams, J. F. II, & Winston, M.D. (2003). Leadership competencies and the importance of research methods and statistical analysis in decision making and research and publication: a study of citation patterns. Library & Information Science Research, 25, 4, 287-402. 14. Walker, M. (2005). Cómo escribir trabajos de investigación. Barcelona, España: Gedisa, 1997. 15. Zimmerman, C. (2000). The development of scientific reasoning Skills. Developmental Review, 20, 1, 99-149.

49


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

AUTOEVALUACIÓN DE HABILIDADES DE INVESTIGACIÓN Instrumento desarrollado por: María Elena Rivera Heredia, Claudia Karina Torres Villaseñor, Fernando Luis García Gil de Muñoz, Rosa Salgado Brito, Luis Gabriel Arango Pinto, Lidia Elena Caña Díaz, Nadina Valentín Kajatt y Elizabeth Palacios Universidad Simón Bolívar Nombre __________________________ Sexo_____ Edad____ Fecha_________ Materia:___________________ Semestre: __________________________________ Nombre del Programa Académico: __________________________________________ Universidad: ___________________________________________________________

VALORES Y ACTITUDES 1.

TRABAJO EN EQUIPO

0

1

2

3

4

5

6

7

8

9 10

1.

RESPETO

0

1

2

3

4

5

6

7

8

9 10

1.

RESPONSABILIDAD

0

1

2

3

4

5

6

7

8

9 10

1.

HONESTIDAD

0

1

2

3

4

5

6

7

8

9 10

1.

AUTOCONTROL

0

1

2

3

4

5

6

7

8

9 10

1.

CURIOSIDAD

0

1

2

3

4

5

6

7

8

9 10

1.

CREATIVIDAD

0

1

2

3

4

5

6

7

8

9 10

HABILIDADES COGNITIVAS 1.

OBSERVACIÓN

0

1

2

3

4

5

6

7

8

9 10

1.

ANÁLISIS

0

1

2

3

4

5

6

7

8

9 10

1.

SÍNTESIS

0

1

2

3

4

5

6

7

8

9 10

1.

SISTEMATIZACIÓN

0

1

2

3

4

5

6

7

8

9 10

1.

EVALUACIÓN

0

1

2

3

4

5

6

7

8

9 10

1.

SOLUCIÓN DE PROBLEMAS

0

1

2

3

4

5

6

7

8

9 10

1.

TOMA DE DECISIONES

0

1

2

3

4

5

6

7

8

9 10

DOMINIO TECNOLÓGICO BÁSICO 1.

WORD

0

1

2

3

4

5

6

7

8

9 10

1.

EXCEL

0

1

2

3

4

5

6

7

8

9 10

1.

POWER POINT

0

1

2

3

4

5

6

7

8

9 10

50


Estadística Aplicada a la Educación

DOMINIO TECNOLÓGICO ESPECIALIZADO 1. INTERNET 1. 1.

PAQUETES ESTADÍSTICOS COMPUTARIZADOS MACROMEDIA (FLASH, DREAMWEAVER, ETC)

COMUNICACIÓN ORAL Y ESCRITA BÁSICA 1. COMPRENSIÓN DE LECTURA EN ESPAÑOL 1. ORTOGRAFÍA Y REDACCIÓN EN ESPAÑOL 1. INTERPRETACIÓN DE CÓDIGOS Y GRÁFICAS COMUNICACIÓN ORAL Y ESCRITA ESPECIALIZADO

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

1.

LECTURA EN INGLÉS

0

1

2

3

4

5

6

7

8

9 10

1.

REDACCIÓN EN INGLÉS

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

1. 1.

EXPRESIÓN VERBAL EN INGLÉS ESTRUCTURA DE UN REPORTE DE INVESTIGACIÓN DOMINIO TECNICO BÁSICO 1.

BÚSQUEDA DE LIBROS Y REVISTAS EN BIBLIOTECA

0

1

2

3

4

5

6

7

8

9 10

1.

SELECCIÓN DE MATERIAL BIBLIOGRÁFICO EN INTERNET

0

1

2

3

4

5

6

7

8

9 10

1.

BÚSQUEDA DE BASES ELECTRÓNICAS DE INFORMACIÓN

0

1

2

3

4

5

6

7

8

9 10

1.

ELABORACIÓN DE FICHAS DOCUMENTALES

0

1

2

3

4

5

6

7

8

9 10

1.

ELABORACIÓN DE FICHAS DE TRABAJO

0

1

2

3

4

5

6

7

8

9 10

1. INFORMACIÓN DE VANGUARDIA SOBRE EL TEMA DE ESTUDIO

0

1

2

3

4

5

6

7

8

9 10

1. INFORMACIÓN CLÁSICA SOBRE EL TEMA DE ESTUDIO

0

1

2

3

4

5

6

7

8

9 10

DOMINIO TECNICO ESPECIALIZADO (MARCO TEÓRICO)

51


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

1. MODELOS TEÓRICOS QUE DAN EXPLICACIÓN AL MODELO DE ESTUDIO 1. COMPARACIÓN ENTRE PLANTEAMIENTOS, POSTURAS Y AUTORES DOMINIO TÉCNICO ESPECIALIZADOMETODOLOGÍA

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

1. PLANTEAMIENTO DEL PROBLEMA DE INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

1. PLANTEAMIENTO DE LOS OBJETIVOS DE LA INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

1. REDACCIÓN ADECUADA DE LOS OBJETIVOS DE INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

1. PLANTEAMIENTO DE HIPÓTESIS

0

1

2

3

4

5

6

7

8

9 10

1. CONOCIMIENTO SOBRE DISEÑOS DE INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

1. SELECCIÓN DEL DISEÑO DE INVESTIGACIÓN ADECUADO SEGÚN EL PROBLEMA

0

1

2

3

4

5

6

7

8

9 10

1. DETERMINACIÓN Y SELECCIÓN DE LA MUESTRA O UNIDAD DE ESTUDIO

0

1

2

3

4

5

6

7

8

9 10

1. SELECCIÓN DE INSTRUMENTOS Y/O MATERIALES PARA RECABAR LOS DATOS

0

1

2

3

4

5

6

7

8

9 10

1. CONSTRUCCIÓN DE INSTRUMENTOS

0

1

2

3

4

5

6

7

8

9 10

1. CONOCIMIENTO DE LAS IMPLICACIONES ÉTICAS DE LA METODOLOGÍA UTILIZADA

0

1

2

3

4

5

6

7

8

9 10

DOMINIO TECNICO ESPECIALIZADORESULTADOS 1.

RECOLECCIÓN DE LOS DATOS

0

1

2

3

4

5

6

7

8

9 10

1.

SISTEMATIZACIÓN DE LOS RESULTADOS OBTENIDOS

0

1

2

3

4

5

6

7

8

9 10

1.

DESCRIPCIÓN DE LOS RESULTADOS OBTENIDOS

0

1

2

3

4

5

6

7

8

9 10

52


Estadística Aplicada a la Educación

DOMINIO TÉCNICO ESPECIALIZADODISCUSIÓN 1.

INTERPRETACIÓN DE LOS RESULTADOS

0

1

2

3

4

5

6

7

8

9 10

1.

CONCLUSIONES

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

1. PARTICIPAR EN ALGUNA FASE DE UNA INVESTIGACIÓN CIENTÍFICA

0

1

2

3

4

5

6

7

8

9 10

1. PARTICIPAR EN ALGUNA FASE DE INVESTIGACIÓN CUALITATIVA

0

1

2

3

4

5

6

7

8

9 10

DOMINIO TÉCNICO ESPECIALIZADOREFERENCIA 1. ELABORACIÓN DE REFERENCIAS DE ACUERDO AL MODELO APA DOMINIO TÉCNICO ESPECIALIZADO EXPERIENCIAS EN INVESTIGACIÓN

1. REDACTAR UN INFORME DE INVESTIGACIÓN 1. PUBLICAR UN INFORME DE INVESTIGACIÓN 1. PRESENTAR EN CONGRESOS UN INFORME DE INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

0

1

2

3

4

5

6

7

8

9 10

1. DISEÑAR UNA INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

1. DIRIGIR UNA INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

1. OBTENER FINANCIAMIENTO PARA UNA INVESTIGACIÓN

0

1

2

3

4

5

6

7

8

9 10

53


Programa de Licenciatura para Profesores sin TĂ­tulo PedagĂłgico en Lengua Extranjera

54


Estadística Aplicada a la Educación

UNIDAD II ESTADISTICA DESCRIPTIVA UNIVARIANTE 2. 1 TABLAS Y GRÁFICOS DE FRECUENCIAS UNIVARIANTES 2.1.1 Introducción Cuando se dispone de datos de una población o de una muestra, como resultado de medir variables, antes de realizar análisis estadísticos más complejos, es preferible presentarlo mediante tablas y gráficos de frecuencias, para visualizar el comportamiento de la variable de una manera más sistemática y resumida. Esto es, como los trabajos de investigación requieren explorar la naturaleza o comportamiento de las características o variables de una población o muestra bajo estudio, y medir su intensidad. Por tanto una vez recolectado los datos, es necesario presentarlos de manera adecuada, de forma tal que contribuya a una mejor comprensión y exposición de los datos, en función de los objetivos del trabajo. Existen dos tipos fundamentales de presentación: Tabular (cuadro estadístico) y Gráfica. En la presente unidad se pretende lograr los siguientes objetivos: 1. Construir tablas y gráficos de frecuencias, así como se interpretan, tanto para datos de variable categórica como para variable cuantitativa. 2. Resumir e interpretar datos de una variable cuantitativa. 3. Construir tablas y gráficos de frecuencias, para datos de dos variables categóricas. 2.1.2 Tabla y Gráficos de Frecuencias El objetivo principal de un cuadro o tabla de frecuencias, al que se le llama también distribución de frecuencias es presentar los datos recolectados, de forma tal que el lector pueda encontrar fácilmente las diferencias para los posibles valores que pueda tomar la variable o niveles o categorías. Sirven para condensar los datos obtenidos. Los gráficos son medios o herramientas para presentar datos, se emplean para tener una representación visual de la totalidad de los datos. Las frecuencias se presentan en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros. Transmiten información cuantitativa, de manera simple y comprensible para cualquier tipo de usuario

55


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

En síntesis la tabla de frecuencias o el grafico constituyen una forma sintetizada y más comprensible de mostrar los datos de una variable sobre todo cuando la información es de tipo repetitivo. Además permiten mostrar frecuencias, relaciones, contrastes, variaciones y tendencias mediante una presentación ordenada de los datos. El investigador debe abocarse a que las tablas o gráficos sean autoexplicativas, es decir que el lector no tenga necesidad de acudir al texto para conocer de qué trata determinada tablao gráfico de frecuencias. 2.1.3 Partes de una tabla de frecuencias Para presentar una tabla de frecuencias consideremos las siguientes partes: 1. Número de orden: Se emplea para facilitar la referencia a la tabla en el texto. Debe asignársele un número consecutivo a cada tabla siguiendo el orden en que se citan por primera vez en el texto. Este número la identifica y se coloca precediendo al título. 2. Título: Debe ser completo, claro y conciso, es decir, debe reflejar claramente en qué consiste el contenido y con qué criterios se clasificaron los elementos a que se hace referencia, ubicándolo además en tiempo y lugar. 3. Cuadro o cuerpo de la tabla: Esta constituido por un grupo de casillas o celdas formadas por el entrecruzamiento de filas y columnas. La primera fila se reserva para indicar a qué se refieren los datos subyacentes y que unidad de medida se utilizó. En la primera columna se reflejan las diferentes clases según el tipo de variable. En la segunda y las sucesivas las frecuencias correspondientes. 4. Notas explicativas o píe: Sirven para indicar la fuente de donde se obtuvieron los datos y, de ser pertinente, la significación estadística o alguna breve nota aclaratoria del contenido, que puede indicarse por llamadas mediante símbolos colocados como exponentes. Un gráfico estadístico tiene las mismas partes, salvo que en lugar de cuadro o cuerpo es el gráfico en sí que tiene como base una figura geométrica plana o espacial. 2.1.4 Tablas y gráficos de frecuencias para datos de variables categóricas Una tabla de frecuencias contiene los posibles valores que toman una variable y la ocurrencia de cada categoría o nivel. Al número de posibles valores lo representamos mediante k, el lugar que ocupa cada posible valor se le llama clases, por tanto hay k clases. Para la construcción de una tabla de frecuencias de variable categórica se tendrá k categorías o niveles, según sea la escala de medición empleada. Las veces que se repite cada categoría o nivel se llama frecuencia y cuando se expresa en valores absolutos se trata de la frecuencia absoluta ( fi ) (2.1)

56


Estadística Aplicada a la Educación

A partir de la frecuencia absoluta se calcula la frecuencia relativa ( hi) o porcentual (hi x 100) , obtenida como:

hi =

ƒi n

i = 1,2 ...., k

(2.2)

Para facilitar la interpretación, cada tabla se debe acompañar con un gráfico adecuado, que puede ser: 1. Gráfico circular: Se emplea el círculo que equivale al 100% de frecuencias y se divide en sectores, cada sector representa a cada categoría o nivel de la variable categórica y su tamaño es proporcional a su tamaño relativo (%). 2. Gráfico de barras simples: Se emplea el plano cartesiano, en uno de los ejes se representa a cada categoría o nivel de la variable categórica y sobre ella se levanta una barra proporcional a su frecuencia absoluta o relativa (%). Se pueden construir gráficos de barras horizontales o verticales. Ejemplo 2.1: Un profesor de inglés averigua entre los alumnos del cuarto grado de primaria de una institución educativa estatal, mediante cuál medio le resulta más amigable las clases de inglés. Los datos obtenidos son: 4 1 3 3 1 1 4 Donde:

1 3 4 3 1 2 4

2 3 1 3 1 1 4

1 3 1 3 1 3 2

2 1 3 2 2 3 4

3 4 1 3 1 1 2

1 3 1 3 1 3 1

3 1 2 1 4 1 4

1 3 2 4 1 1 4

3 1 2 3 1 4 3

4 3 1 3 1 1 4

2 1 3 1 3 1 4

1 1 2 1 1 4

1: canciones, 2: poesías, 3: juegos, 4: cuentos.

Se solicita: 1. Presentar los datos mediante tabla de frecuencias. Interprete. 2. Graficar las frecuencias empleando el gráfico circular. Solución: 1. La siguiente tabla de frecuencias tiene 4 clases, por que son los posibles métodos más amigables para las clases de inglés, que declara el alumno.

57


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Tabla Nº 2.1. Distribución de niños según medio más amigable para las clases de inglés Medios

Nº de niños

% de niños

Canciones

37

41.11

Poesías

12

13.33

Juegos

25

27.78

Cuentos

16

17.78

90

100.00

Total

La mayoría de alumnos, 41.11%, prefieren como medio para sus clases de Inglés, emplear canciones, para que sea más amigable sus clases. En el Gráfico 1.1, se muestra el gráfico circular que muestra la frecuencia porcentual de cada categoría. Gráfico Nº 2.1. Distribución de niños según medio más amigable para las clases de inglés

La interpretación es similar que la tabla salvo que se refiere a frecuencias porcentuales. Ejemplo 2.2: En el año 2007, el MINEDU reporto la siguiente información sobre alumnos matriculados en la Región Callao.

58


Estadística Aplicada a la Educación

Inicial

Nº de matriculados 40729

Primaria

100459

Secundaria

71324

Total

212512

Nivel

Represente gráficamente esta información empleando el grafico de barras simples. Interpretar. Solución: El gráfico de barras se emplea para este tipo de datos, porque la tabla contiene datos categóricos, se trata de la matrícula según nivel de educación básica. El gráfico indica que hay mayor matrícula en el nivel primaria. También se puede presentar mediante gráfico circular. Gráfico Nº 2.2 Matrícula según nivel de educación en la Región Callao (2007)

Fuente: MINEDU

La matrícula en el nivel primaria fue mayor que en los otros niveles de educación básica. Una variante del gráfico de barras es emplear cilindros, en lugar de rectángulos su interpretación es similar a lo realizado para el gráfico anterior.

59


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2.1.5 Tablas y gráficos estadísticos para datos de variables cuantitativas discretas Para este tipo de datos en la tabla de frecuencias se presentan los posibles valores ordenadamente (ascendente o descendente), nosotros usaremos la forma ascendente. El número de posibles valores lo representamos mediante k (clases), cuando el rango (R) de los datos de la variable es corta. El rango de una variable cuantitativa se define como: R = Max(X) – Min (X)

(2.3)

Para cada valor posible de este tipo de variable se indica el número de veces que se repite cada posible valor, al que se le llama frecuencia absoluta ( fi ) y que a partir de ella se puede calcular la frecuencia relativa ( hi ) o porcentual ( hi x 100), obtenida como para tablas de datos categóricos; pero se pueden obtener otras frecuencias como: Las frecuencias absolutas acumuladas, para la j-ésima clase: j

H j = ∑ hi

(2.4)

i =1

que es la suma de frecuencias absolutas de un valor de la variable con todas las anteriores Las frecuencias relativas acumuladas, para la j-ésima clase: j

H j = ∑ hi i =1

(2.5)

(puede ser porcentual, también), que es la suma de frecuencias relativas de un valor de la variable con todas las anteriores.

60


Estadística Aplicada a la Educación

Ejemplo 2.3: Se aplica una prueba de ortografía del idioma inglés a una muestra de alumnos del primer grado de educación primaria y se observa el número de palabras mal escritas, de un total de 10 palabras. Los datos obtenidos son: 5 2 4 3

5 6 5 0

5 6 4 5

4 4 3 2

6 3 6 4

4 2 5 4

3 1 4 5

2 2 5 5

4 5 5 1

2 2 3 5

4 4 3 4

3 5 4 3

1

5

5

5

4

2

1

3

2

4

2

5

3

6

4

0

5

3

5

5

5

1

5

3

1

4

5

0

5

4

3

6

1. Construir una tabla de frecuencias para los datos recolectados. Interprete. 2. Represente gráficamente las frecuencias absolutas. Solución: 1. El rango de la variable bajo estudio es: R = Max(X) – Min (X) = 6 – 0 = 6 (valor pequeño) Entonces cada clase está reservada para cada valor de este tipo de variable de forma ascendente; cada dato recolectado se ubica en la clase correspondiente, la tabla de frecuencias es como sigue. Tabla Nº 2.2. Distribución de alumnos según errores cometidos en la Prueba de Ortografía de Inglés* Errores

Nº de Alumnos

% de Alumnos

0

3

3.8

1

6

7.5

2

10

12.5

3

13

16.3

4

18

22.5

5

24

30.0

6

6

7.5

Total

80

100

*Alumnos de primer grado de primaria. Prueba de 10 palabras

61


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Esta tabla muestra que la mayoría de alumnos ha cometido 5 errores (de un total de 10 palabras) y represente un 30 % del total de alumnos. El gráfico de las frecuencias es como sigue.

*Alumnos de primer grado de primaria. Prueba de 10 palabras

Gráfico Nº 2.3. Distribución de alumnos según errores cometidos en la Prueba de Ortografía de Inglés* La interpretación del gráfico es similar al de la Tabla Nº 2.2 , de los resultados la mayoría a cometido 5 errores ortográficos de un total de 10 palabras. 2.1.6. Tablas y gráficos de frecuencias para datos de una variable cuantitativa continua Para la construcción de tablas de frecuencias, para este tipo de variable, se agrupan los datos de la variable continua mediante intervalos de clases, nosotros emplearemos semiabierto por la derecha; [ ). Por ejemplo si un intervalo es [ 12 – 26 ), significa que contiene valores de 12 a menos de 26, entonces si un dato toma valor igual a 13, se le considera en el presente intervalo, si el dato es 16 no se considera en este intervalo.. 1. Con el siguiente procedimiento construiremos los intervalos de clase: 2. Calcular el rango de la variable R = Max(X) – Min (X) 3. Elegir el número de clases ( k ) , se sugiere entre 4 y 10 inclusive, depende del número de datos y de la amplitud de la variable. 4. Calcular la amplitud de las clases (amplitud de los intervalos de clases) c, que está ; en lo posible que sea entero. Si se redondea el valor de c debe dada por modificarse los valores mínimo y máximo.

62


Estadística Aplicada a la Educación

El primer intervalo de clase se construye a partir del Mínimo considerado, que es el límite inferior, el límite superior es igual al límite inferior mas c unidades. En cuanto a los gráficos de frecuencias puede emplearse: 1. El histograma, empleando el plano cartesiano en el eje de la abcisa (eje horizontal) se representa a cada intervalo de clase de esta variable y sobre ella se levanta una barra proporcional a su frecuencia absoluta o relativa (%) que se representa en el eje de la ordenada (eje vertical), pero las barras son adyacentes, una junta a la otra. 2. El polígono de frecuencias, empleando el plano cartesiano en el eje de la abcisa (eje horizontal) se representa a cada marca de clase es el promedio entre el límite inferior y límite superior de cada intervalo de clase, haciéndole corresponder a cada una de ellas su frecuencia absoluta o relativa (%) que se representa en el eje de la ordenada (eje vertical). Ejemplo 2.4: El gasto (S/.) efectuado por fotocopias para ayuda de sus clases, de una muestra de 70 docentes que estudian la Maestría en Educación, de la UNMSM, en el presente semestre es: 58.5

42.2

30.4

36.7

42.7

50

38.2

37.6

56.2

38.6

43.4

54

37.8

35.5

54.7

41

53.4

36.3

44.9

45

44.1

55

41.7

53.4

42

36

36.9

46

51.1

31

46.1

42.5

52.9

46.7

34.7

43.9

47.8

44.7

44.5

39

57.2

49.3

40.7

43.4

44.7

43.5

35.7

49.7

34

39.4

48.7

53.4

40.5

33.7

43.5

42.6

57.1

32

44.7

44.1

55.6

52.7

49.1

52.4

46.3

46.3

47.8

44.9

58.2

37.3

1. Presentar los datos mediante tabla de frecuencias. 2. Obtenga el histograma de frecuencias simples. Interprete. 3. Obtenga el polígono de frecuencias porcentuales simples. Interprete. Solución: 1. Para construir la tabla de frecuencias para este tipo de datos, se sigue el procedimiento para construir los intervalos de clase. 1. Calcular el rango de la variable R = Max(X) – Min (X) = 58.5 – 30.4 = 28.1

63


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2. Elegir el número de clases ( k ), por ejemplo 5 clases. 3. Calcular la amplitud de las clases (amplitud de los intervalos de clases) c, que c =

R

=

28.1

= 5.62

está dada por ; se redondea a 6, entonces debe modifik 5 carse los valores mínimo y máximo para que tenga rango igual a 30. Se modifican el máximo a 60 y el mínimo a 30, ahora el rango es 30, es decir: R = Max(X) – Min (X) = 60 – 30 = 30 El primer intervalo tiene límite inferior igual a 30 y el superior es,

30+6=36.

El segundo intervalo tiene límite inferior igual a 36 y el superior es, 36+6=42. El tercer intervalo tiene límite inferior igual a 42 y el superior es,

42+6=48.

El cuarto intervalo tiene límite inferior igual a 48 y el superior es,

48+6=54.

El quinto intervalo tiene límite inferior igual a 54 y el superior es,

54+6=60.

Cada dato se ubica en la clase correspondiente, por tanto la tabla de frecuencias es como sigue. Tabla Nº 2.3. Distribución de docentes estudiantes de la Maestría en Educación (UNMSM) según gasto (S/.) efectuado por fotocopias [ S /. ) 30-36 36-42 42-48 48-54 54-60 Total

Nº 8 15 26 12 9 70

% 11.43 21.43 37.14 17.14 12.86 100.00

La mayoría de alumnos docentes gastan entre 42 soles y menos de 48 soles, que es equivalente al 37.14 % de docentes que estudian en esta maestría, en el presente semestre. 2. El histograma de frecuencias simples, se muestra en el Gráfico Nº 1.5 y también muestra que la mayoría de alumnos docentes gastan entre 42 soles y menos de 48 soles, que es equivalente al 37.14 % de docentes que estudian en esta maestría, en el presente semestre. 3. El polígono de frecuencias porcentuales simples. Interprete. Para graficar el polígono de frecuencias se debe trabajar con las marcas de clase que son los promedios de los límites inferior y superior de cada intervalo de clase. En

64


Estadística Aplicada a la Educación

la siguiente tabla se muestran las marcas de clase y sus frecuencias porcentuales correspondientes. [ S /. ) % 30 0 33 11.43 39 21.43 45 37.14 51 17.14 57 12.86 60 0 Gráfico Nº 2.4. Gasto (S/.) efectuado por fotocopias de los docentes que estudian la Maestría en Educación (UNMSM)

Gráfico Nº 2.5. Gasto (S/.) efectuado por fotocopias de los docentes que estudian la Maestría en Educación (UNMSM)

La interpretación es similar que el gráfico histograma, salvo que nos referimos a marca de clase, esto es, la mayoría de docentes alumnos de la presente maestría han realizado gastos por fotocopias igual a 45 soles.

65


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2.2 TABLAS Y GRÁFICOS DE FRECUENCIAS BIDIMENSIONALES 2.2.1 Introducción El objetivo de esta clase es el estudio conjunto de dos variables categóricas cuyos datos se presentan mediante tablas de frecuencias denominadas bidimensionales, también se les conoce como tablas cruzadas o tablas de contingencia. Estas tablas de frecuencias se emplean para estudiar el comportamiento conjunto de dos variables categóricas. 2.2.2 Tabla de contingencia Sean A y B dos variables categóricas que tiene respectivamente r y c categorías y/o niveles, que se presentan de la siguiente forma:

A

B ….

….

Bc

ƒi .

B1

B2

A1

ƒ11

ƒ12

ƒ1c .

ƒ1 .

A2 .

ƒ21

ƒ22

ƒ2c

ƒ2 .

.

.

.

.

.

.

.

.

.

.

.

.

.

Ar

ƒr1

ƒr2

ƒrc

ƒr .

ƒ. j

ƒ. 1

ƒ. 2

ƒ. c

N

La tabla de contingencia es una tabla de doble entrada, tiene r filas y c columnas, en cada casilla o celda figurará el número de casos o individuos que perteneces a la i-ésima fila y a la j-ésima columna (categorías o niveles de las variables categóricas bajo estudio). Las tablas de contingencia tienen dos objetivos fundamentales: 1. Organizar los datos recolectados de dos variables categóricas. 2. A partir de la tabla de contingencia se puede además analizar si existe alguna relación o no entre las categorías o niveles de las variables cualitativas objeto de estudio. El hecho de que dos variables categóricas no tengan relación o asociación significa que los valores de una de ellas no se relaciona con las categorías y/o niveles que adopte la otra.

66


Estadística Aplicada a la Educación

2.2.3 Frecuencias Bidimensionales Para tablas de contingencia, las frecuencias son bidimensionales, es decir se debe referir a una fila y columna correspondiente. Veamos: ƒij :

Es la frecuencia absoluta conjunta que corresponde a la i-ésima fila y a la jésima columna. i = 1, 2, ….,

ƒi :

y

j = 1, 2, …., c

(2.6)

Es la frecuencia absoluta marginal que corresponde a la i-ésima fila, i = 1, 2, …., r . Es el total de casos para cada una de las categorías o niveles de la variable categórica A (2.7)

ƒ. j :

Es la frecuencia absoluta marginal que corresponde a la j-ésima columna, j = 1, 2, …., c . Es el total de casos para cada una de las categorías o niveles de la variable categórica B (2.8)

hij :

Es la frecuencia relativa conjunta que corresponde a la i-ésima fila y a la jésima columna. i = 1, 2, …., r y

hij = hi. :

ƒ ij n

j = 1, 2, …., c. Se obtienen como (2.9)

Es la frecuencia relativa marginal que corresponde a la i-ésima fila, i = 1, 2, …., r . De cada una de las categorías o niveles de la variable categórica A. Se obtienen como

h.j = h.j :

ƒ.j n

(2.10)

Es la frecuencia relativa marginal que corresponde a la j-ésima columna, j = 1, 2, …., c . De cada una de las categorías o niveles de la variable categórica B. Se obtienen como

h.j =

ƒ.j n

(2.11)

Las frecuencias relativas (2.9), (2.10) y (2.11) también se expresan porcentualmente.

67


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejemplo 2.5: En un trabajo de investigación sobre las actividades extraescolares relacionadas con la ciencia y la tecnología, que realizan alumnos de educación primaria de 7 a 9 años cumplidos, se ha aplicado un instrumento pertinente para la recolección de datos correspondiente, en una muestra de la población bajo estudio. Se desea saber si existe alguna relación entre el nivel de educación del niño (A) y el ítem “hace productos lácteos como yogur, mantequilla, queso” (B). Los datos recolectados se presentan en la siguiente tabla de contingencia: Tabla Nº 2.4. Frecuencia para hacer productos lácteos como yogur, mantequilla, queso y Nivel de Educación de una muestra de niños Nivel

Respuesta

Total

nunca

poco

bastante

mucho

primer grado

46

38

27

17

128

segundo grado

60

47

35

28

170

tercer grado

35

30

23

16

104

Total

141

115

85

61

402

1. Interprete las siguientes frecuencias: ƒ24 , ƒ3 . y ƒ. 4 2. ¿Cuántos alumnos son del primer grado y hacen productos lácteos como yogur, mantequilla, queso con mucha frecuencia? 3. ¿Qué porcentaje de alumnos son del tercer grado y nunca hacen productos lácteos como yogur, mantequilla, queso? 4. ¿Qué porcentaje de alumnos son del segundo grado? 5. ¿Qué porcentaje de alumnos hacen productos lácteos como yogur, mantequilla, queso, con poca frecuencia? Solución: 1. Interpretando las frecuencias: ƒ24 :

28 alumnos del segundo grado hacen productos lácteos como yogur, mantequilla, queso con mucha frecuencia

ƒ3 . :

104 alumnos pertenecen al tercer grado de primaria.

ƒ. 2 :

115 alumnos hacen productos lácteos como yogur, mantequilla, queso con poca frecuencia.

68


Estadística Aplicada a la Educación

2. Corresponde al valor de la frecuencia absoluta conjunta ƒ14 , esto es, son 17 alumnos. 3. Corresponde al valor de la frecuencia relativa conjunta h31, esto es:

h31 =

ƒ 31 35 = = 0.0871 n 402

En términos porcentuales es 8.71 %. Esto es, el 8.71 % de alumnos son del tercer grado de primaria y nunca hacen productos lácteos como yogur, mantequilla, queso. 4. Corresponde al valor de la frecuencia relativa marginal h2. esto es:

h.2 =

ƒ.2 115 = = 0.2861 n 402

En términos porcentuales es 42.29 %, es decir el 42.29 % de alumnos son del segundo grado de primaria. 5. Corresponde al valor de la frecuencia relativa marginal h.2 , esto es:

h.2 =

ƒ.2 115 = = 0.2861 n 402

En términos porcentuales es 28.61 %, es decir el 28.61 % de alumnos hacen productos lácteos como yogur, mantequilla, queso, con poca frecuencia? 2.2.4 Frecuencias condicionales Una frecuencia condicional es la distribución de frecuencias de todas las categorías o niveles de una variable categórica condicionada o sujeta a una categoría o nivel de la otra variable categórica. Se denota como: Frecuencia condicional de las c categorías o niveles de la variable categórica B, condicionada a la i-ésima categoría o nivel de la variable categórica A.

ƒ (B j A i ) =

ƒ ij ƒ i.

,

j = 1,2,...,c

(2.12)

Frecuencia condicional de las r categorías o niveles de la variable categórica A, condicionada a la j-ésima categoría o nivel de la variable categórica B. ƒ (B j A i ) =

ƒ ij ƒ i.

,

j = 1,2,...,c

(2.13)

69


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejemplo 2.6: Considere la Tabla de Contingencia del Ejemplo 2.5, para obtener e interpretar las frecuencias condicionales: 1. Por filas 2. Por columnas. Solución: 1. Para las frecuencias condicionales por filas se emplea la expresión (2.12): ƒ ƒ B j A i = ij , j = 1,2,...,c ƒ i.

(

)

Para el primer grado: ƒ ij ƒ Ai Bj = , ƒ. j

(

)

i = 1,2,3

Para el segundo grado: ƒ (B j A 3 ) =

ƒ3 j ƒ1.

j = 1,2,3,4

,

Para el tercer grado: ƒ (B j A 3 ) =

ƒ3 j ƒ1.

,

j = 1,2,3,4

Los cálculos se muestran en la siguiente tabla, expresada en porcentajes: Tabla Nº 2.5. Frecuencia para hacer productos lácteos como yogur, mantequilla, queso y Nivel de Educación de una muestra de niños Nivel primer grado segundo grado tercer grado

nunca 35.94 35.29 33.65

Respuesta poco bastante 29.69 21.09 27.65 20.59 28.85 22.12

mucho 13.28 16.47 15.38

Total 100.00 100.00 100.00

A representación gráfica de esta tabla se le llama gráfico de perfil fila, que se muestra en el Gráfico Nº 2.6, cuya interpretación es como sigue: Observe que las porcentajes de los tres grados de educación primaría son casi similares para cada tipo de respuesta., el mismo que se refleja en el gráfico perfil fila e indica que

70


Estadística Aplicada a la Educación

no hay ninguna relación o asociación por que para cada grado el comportamiento de las 4 respuestas son de similar porcentaje.

Gráfico Nº 2.6. Frecuencia para hacer productos lácteos como yogur, mantequilla, queso y Nivel de Educación de una muestra de niños.

Como se observa cada barra que representa a cada grado de primaria se ha segmentado en 4 niveles de la otra variable; y los porcentajes son similares para cada uno de ellos. Lo cual es un indicador de que no hay asociación entre el nivel de educación del niño (A) y el ítem hace productos lácteos como yogur, mantequilla, queso (B). Esta actividad tan sencilla es menos frecuente y estando al alcance de los niños, es una actividad manual, de la vida diaria fuera de la escuela que interactúa continuamente con la (re)construcción de los aprendizajes escolares. Estas experiencias afectan a los aprendizajes escolares de ciencia y tecnología, facilitándolos, en el caso de que la experiencia sea intensa y enriquecedora, o dificultándolos, en el caso que las experiencias sean inadecuadas o deficitarias. Para las frecuencias condicionales por columnas se emplea la expresión (2.13):

(

ƒ Ai Bj

)=

ƒ ij ƒ.j

,

i = 1,2,3

Para nunca: : ƒ ( A i B1 ) =

ƒ i1 , ƒ.1

i = 1,2,3

Para poco: ƒ ( A B ) = ƒ i4 , i 4 ƒ.4

Para bastante

ƒ ( A i B3 ) =

i = 1,2,3 ƒ i3 , ƒ.3

i = 1,2,3

71


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Para mucho: ƒ ( A i B4 ) = ƒ i4 , ƒ.4

i = 1,2,3

Los cálculos se muestran en la siguiente tabla, expresada en porcentajes: Tabla Nº 2.6. Frecuencia para hacer productos lácteos como yogur, mantequilla, queso y Nivel de Educación de una muestra de niños. Nivel primer grado segundo grado tercer grado Total

Nunca 32.62 42.55 24.82 100.00

poco 33.04 40.87 26.09 100.00

Respuesta Bastante 31.76 41.18 27.06 100.00

mucho 27.87 45.90 26.23 100.00

La representación gráfica de esta tabla se le llama gráfico de perfil columna, que se muestra en el siguiente Gráfico Nº 2.7. La interpretación de este gráfico es similar al caso del perfil fila, como se observa la segmentación de cada grado según la respuesta brindada es similar. Ambos gráficos tiene la misma interpretación para la publicación se debe elegir aquel que sea mas informativo para el usuario, podemos elegir el Gráfico Nº 2.6.

Gráfico Nº 2.7. Frecuencia para hacer productos lácteos como yogur, mantequilla, queso y Nivel de Educación de una muestra de niños.

Ejemplo 2.7: En la Tabla Nº 2.7 se presentan los resultados sobre una evaluación realizada para estudiar la relación que existe entre comprensión lectora y nivel de educación de la madre de una muestra de niños de 9 años de edad, que asisten a instituciones educativas estatales.

72


Estadística Aplicada a la Educación

Para evaluar la comprensión lectora el equipo de investigación diseño una prueba pertinente la misma que fue evaluada en su confiabilidad y validez, el rango del puntaje de esta prueba es de 0 a 100. El equipo considero los siguientes rangos o niveles para los puntajes correspondientes: Comprensión lectora inferior: puntaje de 0 a 30 Comprensión lectora regular: puntaje de 31 a 69 Comprensión lectora superior: puntaje de 70 a 100 ¿Existe alguna asociación entre el nivel de comprensión lectora y el nivel de educación de la madre de estos niños? Comprensión Lectora Inferior Regular Superior Total

Sin nivel 20 24 30 74

Nivel de Educación Primaria Secundaria 31 30 36 42 46 52 113 124

Superior 24 40 58 122

Total 105 142 186 433

*Instituciones educativas estatales

Gráfico Nº 2.8. Nivel de comprensión lectora y nivel de educación de la madre de niños de 9 años de edad*

Solución: Se emplea el gráfico perfil columna, Gráfico Nº 2.8, obtenida mediante Excel:

*Instituciones educativas estatales

Gráfico Nº 2.8. Nivel de comprensión lectora y nivel de educación de la madre de niños de 9 años de edad*

73


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Si existe relación entre estas dos variables, eso es, a mayor nivel de educación de la madre el nivel de comprensión lectora es superior. Observar que para cada nivel de educación de la madre la segmentación para los niveles de comprensión lectora son diferentes.

RECUERDE Una tabla de distribución de frecuencias describe la manera de cómo están distribuidos o cómo varían los valores (datos cuantitativos) de una variable, permitiendo una buena ayuda para formularse interrogantes acerca de los datos y es un punto de partida en la búsqueda de un modelo teórico para analizar tal distribución.

2.3. MEDIDAS DE RESUMEN PARA DATOS DE UNA VARIABLE CUANTITATIVA 2.3.1 Introducción Al emplear tablas y gráficos de frecuencias solamente podemos observar el comportamiento de la variable cuantitativa en términos de veces en que el valor de la variable se repite, pero no es posible absolver las siguientes preguntas: ¿Alrededor de qué valor de la variable se agrupan los datos?, si se agrupan alrededor de un valor, ¿cómo lo hacen?, ¿con poca concentración?, ¿con mucha concentración?. Para resolver estas interrogantes se emplean las medidas de resumen, que pueden ser: Medidas de Posición Medidas de Dispersión Medidas de Forma Cuyo objetivo es mostrar las características más relevantes, en términos cuantitativos, de una variable cuantitativa. Los cálculos se realizaran empleando Excel y/o el software estadístico SPSS. Para el caso del gráfico de caja, se emplea el software estadístico SPSS. En ambos casos los docentes encargados del curso brindarán la guía necesaria para lograr los objetivos propuestos en esta unidad.

74


Estadística Aplicada a la Educación

2.3.2 Medidas de posición Al medir una variable cuantitativa, X, y obtener un conjunto de datos cuyos valores son: x1, x2, x3, ...., xn, las medidas de posición permiten que se obtenga información estadística que nos permita describirlo mediante un valor, que elige como resumen de datos a un valor central, alrededor del cual se encuentran distribuidos los valores de la variable. También se afirma que son medidas estadísticas cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por eso también se les llama Medidas de Tendencia Central. 2.3.2.1 Media Aritmética

(x)

La Media Aritmética de los valores, de la variable X, que toma valores: x1, x2, x3, ...., xn, , es la suma de todos los valores de la variable dividida por el número de datos, es decir: n

x =

∑x i =1

n

i

(2.14)

Características: 1. Para su cálculo intervienen todos los datos. Toma en cuenta el número de datos. 2. Afectada por valores extremos. Propiedades: 1. La media aritmética de un valor constante es la misma constante. 2. Si la media aritmética de una variables es x, entonces la media aritmética de la transformación, y = ax + b es: y = ax + b, siendo a y b constantes reales. Ejemplo 2.8: Calcular e interpretar la media aritmética de las calificaciones semanales de los exámenes de práctica de ortografía en ingles de una muestra de 5 alumnos del primer grado de secundaria:

Solución:

Semana 1 2 3

12 10 13

CALIFICACIONES 15 14 16 17 13 12 16 12 16

15 11 15

La media aritmética de las calificaciones de la primera semana es: n

x =

∑x i =1

n

i

=

12 + 15 + 14 + 16 + 15 72 = = 14.4 5 5

75


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Siguiendo el mismo procedimiento las medias aritméticas para las semanas 2 y 3 son respectivamente, 12.6 y 14.4. En promedio las calificaciones de la práctica en ortografía son iguales en la primera y tercera semanas 2.3.2.2 Mediana (Me) La mediana de los datos ordenados (creciente) de una variable es el valor que por debajo de ella se encuentra el 50% de datos con valores más bajos y sobre ella se encuentra el 50% de datos con valores más altos. Se calcula de la siguiente manera:

x n/2 + x (n/2) +1

Si n es par:

Me =

Si n es impar:

Me = x (n + 1) / 2

2

(2.15) (2.16)

Características: 1. Para su cálculo no intervienen todos los datos. Solo el valor que esta en la posición central o el promedio de valores que están en la posición central de datos ordenados de una variable. 2. No está afectada por valores extremos. Ejemplo 2.9: Considere el caso del ejemplo 2.1, para calcular e interpretar el valor de la mediana de las calificaciones. Solución: Los datos (calificaciones) ordenados de cada semana, forma creciente son: Semana 1 2 3

12 10 12

CALIFICACIONES 14 15 15 11 12 13 13 15 16

16 17 16

Empleamos la expresión (2.16), por que le numero de datos es impar, n = 5, la mediana es igual a: Me = x3 Es decir la mediana es el dato que ocupa la posición 3, que es la posición central. Por tanto el valor de la variable que está en esa posición es la mediana. Las medianas son respectivamente:

76


Estadística Aplicada a la Educación

Semana 1: Me = 15 Semana 2: Me = 12 Semana 3: Me = 15 Para el caso de la Semana 1 y 3: El 50% inferior de los alumnos tienen calificaciones menores de 15 o equivalentemente el 50% de alumnos con calificaciones más bajas han obtenido menos de 15. Ejemplo 2.10: El tiempo (minutos) que demora un niño en resolver un problema sencillo de aritmética, que esta cursando el segundo grado de primaria, es una variable de interés para una investigación. En una muestra de 10 niños, los datos recolectados son: 2.38

3.13

4.46

3.15

2.15

5.37

2.35

2.42

2.33

3.13

Calcule e interprete la mediana de esta variable. Solución: Los datos ordenados de de cada semana, forma creciente son: Nº de orden Tiempo

1

2

3

4

5

6

7

8

9

10

2.15

2.33

2.35

2.38

2.42

3.13

3.13

3.15

4.46

5.37

Empleamos la expresión (2.15), por que le numero de datos es par, n = 10, la mediana es igual a:

Me =

x5 + x6 2

El promedio de los datos que ocupan la posición 5 y 6 de datos ordenados, por tanto:

Me =

2.42 + 3.13 = 2.775 2

El 50% inferior de los alumnos del segundo grado de primaria se demora en resolver un problema sencillo de aritmética menos de 2.78 minutos o equivalentemente el 50% de alumnos con tiempos más bajos para resolver un problema sencillo de aritmética se demoran menos de 2.78 minutos.

77


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2.3.2.3 Moda (Mo) Es el valor que se presenta con mayor frecuencia absoluta en un conjunto de datos de una variable. En el primer gráfico se observa que la variable tiene una sola moda, por eso le denomina unimodal, en el segundo gráfico hay dos modas, por ello se le denomina bimodal y cuando tiene más de tres modas se le denomina multimodal.

Grafico Nº 2.9. Formas de una distribución de frecuencias en relación a la Moda Características: Si existe Moda para el conjunto de datos de una variable puede no ser la única (unimodal), puede tener 2 modas (bimodal) o más de 2 modas (multimodal). Un conjunto de datos de una variable puede no tener Moda, al que se denomina amodal.

El gráfico (4) corresponde a una variable amodal, o equivalentemente las frecuencias son iguales. Ejemplo 2.11: Considere el caso del ejemplo 2.1, para calcular e interpretar el valor de la moda. Solución. Solo observe, cual es el valor de la variable que más se repote para cada semana. Semana 1: Mo = 15 Semana 2: Amodal Semana 3: Mo = 16

78


Estadística Aplicada a la Educación

Las calificaciones obtenidas en la semana dos es amodal, es decir ninguna calificación se repite más de una vez. La media aritmética y mediana de las calificaciones de la semana 1 y 3 son los mismos valores, pero tienes distinta moda. 2.3.2.4 Percentiles (Pk) El percentil de un conjunto de valores ordenados (creciente) de una variable es el valor por debajo del cual se encuentra un porcentaje determinado del total de datos. Siendo 0 < k < 100, por ejemplo el percentil de orden 15, es el valor por debajo del cual se encuentra el 15% de observaciones, por tanto el 85% restante toma valores mayor o igual que el percentil 15. Para calcular los percentiles se procede de la siguiente manera, primero calcular el k porciento de n (total de casos), al cual le denominamos nk entonces: Si nk no es entero: Si nk es entero:

Pk =

Pk = x[nk]+1 x nk + x nk +1 2

(2.17) (2.18)

Características: 1. Medida muy útil para caracterizar a una variable que es muy dispersa. 2. Se usa para comparar un valor individual con una norma. 3. De uso frecuente en epidemiología para conocer curvas endémicas Percentiles Especiales Cuartiles: son tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales: El primer cuartil, Q1 , es el máximo valor de la cuarta parte (25%) de los datos de valores más bajos. El segundo cuartil, Q2 , es el máximo valor de la mitad (50%) de los datos de valores más bajos; se trata de la Mediana. El tercer cuartil, Q3 , es el máximo valor de la tres cuartas partes (75%) de los datos de valores más bajos. Quintos: son cuatro valores que dividen al conjunto de datos ordenados en cinco partes iguales: El primer quintil es el P20 , es el máximo valor de la quinta parte (20%) de los datos con valores más bajos.

79


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

El segundo quintil, P40, es el máximo valor del 40% inferior de los datos con valores más bajos. El cuarto quintil, P80, es el máximo valor del 80% inferior de los datos con valores más bajos, por tanto es el mínimo del 20% superior o quinto superior. Deciles: son nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. Ejemplo 2.12: Considerar los datos del ejemplo 2.4, para calcular e interpretar P30 y P15 Solución: Previamente ordenamos los datos: 1

2

3

4

5

6

7

8

9

10

11

30.4

31

32

33.7

34

34.7

35.5

35.7

36

36.3

36.7

12

13

14

15

16

17

18

19

20

21

22

36.9

37.3

37.6

38.6

39

39.4

40.5

40.7

41

23

24

25

28

29

30

31

32

33

41.7

42

42.2

42.7

43.4

43.4

43.5

43.5

43.9

34

35

36

39

40

41

42

43

44

44.1

44.1

44.5

44.7

44.9

44.9

45

46

46.1

45

46

47

50

51

52

53

54

55

46.3

46.3

46.7

48.7

49.1

49.3

49.7

50

51.1

56

57

58

61

62

63

64

65

66

52.4

52.7

52.9

53.4

54

54.7

55

55.6

56.2

67

68

69

70

57.1

57.2

58.2

58.5

37.8 38.2 26

27

42.5 42.6 37

38

44.7 44.7 48

49

47.8 47.8 59

60

53.4 53.4

Cálculo del Percentil 30: (n = 70) Primero calculamos el 30% de 70, nk = 21, es un valor entero, entonces se emplea la expresión (2.18) cuando nk es entero:

Pk =

80

x nk + x nk +1 x 21 + x 22 40.7 + 41 = = = 40.85 2 2 2


Estadística Aplicada a la Educación

Como se observa se ha promediado los valores que están en las posiciones, 21 y 22, que son respectivamente 40.7 y 41. Es decir el 30% de gastos más bajos es menor de S/. 40.85. Cálculo del Percentil 75: (n= 70) Primero calculamos el 75% de 70, nk = 52.5, no es un valor entero, entonces se emplea la expresión (2.17) cuando nk no es entero:

Pk = x[nk]+1 = x[52.5]+1 = x 53 = 49.7 Como se observa se ha tomado el máximo entero de 52.5, que es igual a 52, más uno, es igual a 53, entonces el valor de la variable que está en la posición 53 es el percentil 75. Es decir el 75% de gastos más bajos es menor de S/. 49.7. Ejemplo 2.13: Cuánto es el gasto mínimo del 20% superior Solución: Se trata de calcular el Percentil 80: Calculando el 80% de 70, nk = 56, es un valor entero, entonces se emplea la expresión (2.18) cuando nk es entero:

Pk =

x nk + x nk +1 x 56 + x 57 52.4 + 52.7 = = = 52.55 2 2 2

Por tanto el valor mínimo del 20% superior, cuya región se le llama quinto superior, es igual a S/. 52.55. Es decir el 20% de alumnos con gastos más altos tiene gasto mínimo de 52.55 soles. Ejemplo 2.7: Cuánto es el gasto máximo del 25% inferior. Solución: Se trata de calcular el Percentil 25: Calculando el 25% de 70, nk = 17.5, no es un valor entero, entonces se emplea la expresión (2.17) para este caso.

Pk = x[nk]+1 = x[17.5]+1 = x18 = 39 Por tanto el valor mínimo del 25% inferior, cuya región se le llama cuarto inferior, es igual a S/. 39.00 .Es decir el 25% de alumnos con gastos más bajos tiene gasto menor de 39 soles.

81


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2.3.3 Medidas de Dispersión 2.3.3.1 Introducción Cuando se ha resumido los datos de una variable cuantitativa usando una medida de posición, una pregunta interesante es: ¿Los datos de ésta variable qué tan alejados o cercanos se encuentran respecto a esa medida de posición? ¿Qué tan dispersa es la variable cuantitativa estudiada?, Para absolver estas interrogantes se emplean las medidas de dispersión o llamadas también medidas de variabilidad y se clasifican como: 1. Medidas de dispersión absoluta: Son aquellas que se expresan en unidades de la variable, siendo las más usadas: Rango o Amplitud, Varianza, Desviación Estándar llamada también Desviación Típica, y Rango Intercuartílico. 2. Medidas de dispersión relativa: Son aquellas que no se expresan en unidades de la variable, siendo la más usada, el Coeficiente de Variación. Por tanto estas medidas permiten identificar la concentración de los datos, respecto a una medida de posición, implica que a menor dispersión o variabilidad, mayor es la concentración de los datos respecto o alrededor de esa medida de posición. 2.3.3.2 Rango Se define como la diferencia entre el valor máximo y mínimo de la variable, su cálculo es: Rango = Max – Min

(2.19)

Esta medida se usa frecuentemente en el control estadístico de calidad o es un recurso para emplear otras herramientas estadísticas, como se vio en la sección: 1.6,se usa para calcular los intervalos de clase. Características: 1. De fácil cálculo. 2. Para su cálculo no intervienen todos los datos, solo los valores extremos. No toma en cuenta el número de datos. Ejemplo 2.15: Calcular e interpretar el Rango de los datos del ejemplo 2.1. Solución: Empleamos la expresión (2.19), para obtener el rango:

82


Estadística Aplicada a la Educación

Semana 1: Semana 2: Semana 3:

Rango = Max – Min = 16 – 12 = 4 Rango = Max – Min = 17 – 10 = 7 Rango = Max – Min = 16 – 12 = 4

Existe mayor dispersión o variabilidad para los datos de la semana 2, dado que tiene mayor Rango. 2.3.3.3 Varianza Se define como el promedio de la suma de los cuadrados de las desviaciones de los valores de una variable respecto a su media aritmética. Mide la dispersión de los datos respecto a su media aritmética, se calcula mediante la expresión:

∑(x − x) n

S2 =

i =1

i

2

(2.20)

n

Su valor está expresado en unidades al cuadrado. Es la medida de dispersión más usada, por su forma de cálculo, ya que se compara cada valor de la variable respecto a su media aritmética, pero elevado al cuadrado. Cuanto mayor sea la varianza de una variable mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética. Esto sucede sobretodo cuando la media aritmética está afectada por valores extremos. La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado. Características: 1. Para su cálculo intervienen todos los datos. Toma en cuenta el número de datos. 2. Está afectada por valores extremos. Propiedades: 1. La varianza de un valor constante es cero. 2 2. Si la varianza de una variables es S X , entonces la varianza de la transformación, 2 2 Y = aX + b es: a S X , siendo a y b constantes reales. Ejemplo 2.16: Calcular e interpretar la varianza de cada uno de los conjuntos de datos del ejemplo 2.1. Solución: En la siguiente tabla de trabajo, se muestra el cálculo de la varianza para las calificaciones de la Semana 1, recordar que la media aritmética de las calificaciones, para esta semana es 14.4.

83


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

xi

(xi – 14.4)

(xi – 14.4)2

12 15 14 16 15 Total

-2.40 0.60 -0.40 1.60 0.60 0.00

5.76 0.36 0.16 2.56 0.36 9.2

Empleando la expresión (2.20) y reemplazando valores adecuadamente:

∑(x − x) n

S2 =

i =1

2

i

= 9.2 =1.84

n 5 Calculando de manera similar la varianza de las calificaciones para la segunda y tercera semana son 5.84 y 2.64 respectivamente. Por tanto en la semana 1 el rendimiento de los alumnos es más homogéneo respecto a su respectiva media aritmética, tener menor varianza respecto a los otros dos. 2.3.3.4.Desviacion Estandar Se define como la raíz cuadrada positiva de la varianza, esto es: S = + S2

(2.21)

Tiene la misma ventaja y desventajas que la varianza, así como sus propiedades, manteniendo su propia definición. De uso más frecuente que la varianza por que las unidades de los valores de la desviación estándar es lineal. Ejemplo 2.17: Calcular e interpretar la desviación estándar de cada uno de los conjuntos de datos del ejemplo 2.1 ¿Hay algún cambio respecto a los resultados del ejemplo 2.9? Solución: Extrayendo la raíz cuadrada de la varianza de las calificaciones de cada semana se obtiene respectivamente: 1.36, 242 y 1.62 respectivamente; observándose que en la semana 1 el rendimiento de los alumnos es más homogéneo respecto a su respectiva media aritmética, por tener menor desviación estándar, respecto a las otras dos. No hay ningún cambio respecto a los resultados del ejemplo 2.16.

84


Estadística Aplicada a la Educación

2.3.3.5 Rango Intercuartilico Se define como la diferencia entre los cuartiles 3 y 1, por tanto es el intervalo que contiene al 50% central de datos, esto es: IQR = Q3 – Q1 (2.22) Se usa como medida de dispersión cuando se ha empleado a la mediana como medida de posición. Características: Su valor no está influenciado por valores extremos. Ejemplo 2.11: Considere los datos del ejemplo 2.4 para calcular e interpretar el rango intercuartílico. Solución: Empleamos la expresión (2.22): IQR = Q3 – Q1 = 49.6 - 39.1 = 10.5 Lo cual indica que el 50% central de los casos gastan entre 39.1 y 49.6 Ejemplo 2.19: El curso Inglés Avanzado para Negocios Internacionales se dicta en dos grupos, para los alumnos de la EAP Negocios Internacionales, se desea determinar la dispersión del rendimiento en este curso a partir de la siguiente información: Turno

Q1

Q3

Diurno

13.46

19.10

Nocturno

14.55

17.31

Calcular el Rango Intercuartílico para ambos turnos. Interpretar. Solución: Empleamos la expresión (2.22): Diurno: IQR = Q3 – Q1 = 19.10 – 13.46 = 5.64 Nocturno: IQR = Q3 – Q1 = 17.31 - 14.55 = 2.76 Por tanto el grupo que tiene rendimiento más homogéneo respecto a su mediana, es dl turno tarde por que tiene menor Rango Intercuartílico.

85


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

2.3.3.6 Coeficiente de Variación Expresa en porcentaje la relación que existe entre la desviación estándar y la media aritmética, es decir, la desviación estándar como un porcentaje de la media aritmética. Se calcula como: CV(X) = Características:

S x100 (2.23) x

1. Su valor se expresa sin considerar la unidad de la variable, por ello es útil para comparar la dispersión de datos de variables diferentes. También de grupos de observaciones diferentes en donde se analizan la dispersión de la misma variable, pero tienen igual desviación estándar con medias diferentes. 2. No es recomendable calcular esta medida cuando el valor de la media tiende al valor cero o para variables que pueden tener valores negativos. Ejemplo 2.20: Las calificaciones del primer examen de dos cursos distintos de una muestra de alumnos son: Obs. N C

1 12 11

2 16 12

3 12 15

4 11 10

5 10 16

6 14 16

7 10 15

8 10 16

9 15 16

10 12 16

N: Inglés Avanzado para Negocios Internacionales C: Inglés Avanzado para Ciencias Básicas ¿En cuál curso el rendimiento es más heterogéneo? Solución: Primero se deben calcular dos medidas de resumen como son la media aritmética y la desviación estándar y posteriormente empleando la expresión se calcula el Coeficiente de Variación. Curso

Media Aritmética

N C

12.27 14.60

Desviación Estándar Coeficiente de Variación 1.95 1.99

15.88 13.65

Como se observa en el cuadro anterior el Coeficiente de Variación del curso Inglés Avanzado para Ciencias Básicas es menor respecto al curso Inglés Avanzado para Negocios Internacionales, por tanto es más homogéneo o menos disperso, respecto a su media aritmética.

86


Estadística Aplicada a la Educación

Ejemplo 2.21: El curso Inglés Avanzado para Negocios Internacionales se dicta en dos grupos, para los alumnos de la EAP Negocios Internacionales, se desea determinar la dispersión o variabilidad del rendimiento en este curso a partir de la siguiente información: Turno Diurno

14.63

3.7

Nocturno

16.22

3.7

x

S

Solución: Se observa que en ambas grupos la variabilidad es igual, conforme a los valores de la Desviación estándar, pero tienen diferente media aritmética; por tanto debemos emplear el Coeficiente de Variación, expresión (2.23). El cálculo para cada turno es: Diurno: CV(X) =

S 3.7 x100 = x100 = 25.29 % 16.22 x

CV(X) =

S 3.7 x100 = x100 = 22.81 % 16.22 x

Nocturno:

En el turno diurno hay mayor dispersión dado que tiene mayor coeficiente de variación. Es decir el rendimiento es más heterogéneo. 2.3.4 Medida de Forma Es una medida que permite tener una idea de la forma de la distribución de una variable cuantitativa, es frecuente que los valores de una distribución tiendan a ser similares a ambos lados de las medidas de posición, pero en otros casos no se comporta así. Para evaluar la forma de una variable unimodal se emplea el Coeficiente de Asimetría o llamado también Sesgo de Pearson, que está dado por la siguiente expresión:

Cuyo valor se interpreta como:

CS =

(

3 x − Me

)

(2.24)

S

Si Cs > 0, la variable tiene distribución con asimetría positiva (cola a la derecha). Los datos de la variable bajo estudio se concentran más en valores bajos de la variable. Si Cs < 0, la variable tiene distribución con asimetría negativa (cola a la izquierda). Los datos de la variable bajo estudio se concentran más en valores altos de la variable.

87


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Si Cs = 0, la variable tiene distribución simétrica. Los datos de la variable bajo estudio se concentran más en valores centrales o intermedios de la variable. Según el resultado obtenido al calcular el valor del presente coeficiente, la forma de la variable se muestra en el siguiente gráfico.

Grafico Nº 2.10. Formas de una distribución de frecuencias, según el valor del coeficiente de Asimetría

Característica: Una característica importante es que el valor de este coeficiente no se expresa en unidades de la variable, de ahí que se puede compara la forma de diferentes variables. Ejemplo 2.22: Para la enseñanza de Inglés en niños de 3 a 5 años de edad se dispone de dos métodos: el método Play (P) y el método Fun (F). Una Escuela para niños de esta población está empleando ambos métodos en dos secciones diferentes con niños de 4 años. El objetivo es conocer la forma de los resultados de la primera evaluación, cuyo puntaje es del 1 al 30, siendo unimodal para cada tipo de método empleado. Las medidas de resumen del puntaje son: Método

Media Aritmética

Mediana

Desviación Estándar

Play

18

24

5.4

Fun

23

20

6.9

Solución: Para cada método se analiza la forma del puntaje, empleando el coeficiente de asimetría, expresión (2.24).

88


Estadística Aplicada a la Educación

Método Play: CS =

3

( x − Me ) S

=

3 (18 − 24 ) 5.4

= − 3.33

La forma del puntaje es con asimetría negativa, es decir los puntajes obtenidos se concentran en valores de puntajes altos, como en el siguiente gráfico.

Método Fun: CS =

(

3 x − Me S

) = 3 ( 23 − 20) 6.9

= 1.30

La forma del puntaje es con asimetría positiva, es decir los puntajes obtenidos se concentran en valores de puntajes bajos, como en el siguiente gráfico.

Según los resultados anteriores el método Play da mejores resultados, porque la mayoría obtiene mejores puntajes y como se observa también tiene menor variabilidad o dispersión. 2.4 GRAFICO DE CAJA 2.4.1 Introduccion Es un gráfico representativo de un conjunto de datos de variable cuantitativa y que para su construcción se usan cinco medidas de resumen que hemos estudiado: La mediana, primer cuartil, tercer cuartil, valor máximo y valor mínimo de la variable Es una presentación de los datos de una variable pero de manera visual, asocia las cinco medidas de resumen antes mencionada, que como se ha tratado y aplicado en las secciones anteriores, se emplean para el análisis de datos de forma individual.

89


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Presenta al mismo tiempo, información sobre la tendencia central, dispersión y simetría de los datos bajo estudio. También permite identificar con claridad y de forma individual, observaciones que se alejan de manera poco usual del resto de los datos. A estas observaciones se les conoce como valores atípicos (outliers) Por su facilidad de construcción e interpretación, permite también comparar a la vez varios grupos de datos, que resultan de medir una misma variable, sin perder información ni saturarse de ella. 2.4.2 Partes del Gráfico de Caja El nombre original del gráfico introducido por Jhon Tukey en 1977 es Box and whisker plot, es decir, diagrama de caja y bigote. En efecto, el gráfico consiste en un rectángulo (caja) de cuyos lados superior e inferior se derivan respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes). En el Gráfico Nº 2.11 se muestra el gráfico de caja para una variable simétrica, sin datos u observaciones atípicas.

Grafico Nº 2.11. Gráfico de caja de una variable simétrica

¿Cómo se interpreta un gráfico de caja? Si la caja y los bigotes son largos, entonces se trata de una variable muy dispersa. Si la mediana está ubicada relativamente en el centro de la caja la distribución es simétrica. Si la mediana se acerca al primer o tercer cuartil, la distribución pudiera ser sesgada a la derecha (asimétrica positiva) o sesgada a la izquierda (asimétrica negativa) respectivamente. Si la mediana coincide con los cuartiles o con los límites de los bigotes, es por que se concentran muchos datos en un mismo punto, en este caso. Puede ser el caso de una distribución sesgada o de una distribución muy homogénea.

90


Estadística Aplicada a la Educación

o52

18

* Grafico Nº 2.12. Gráfico de caja de una variable con datos atípicos Los datos atipicos son datos de valores extremos altos o bajos. La construcción del gráfico de caja se facilita usando softwares estadísticos, uno de ellos con el software SPSS. Ejemplo 2.23: Analizar los datos del ejemplo 2.4, mediante el gráfico de caja. Solución: Apoyado por el software SPSS

* alumnos docentes de la Maestría de Educación

Grafico Nº 2.13. Gasto (S/.) que realizan por fotocopia*

91


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

La variable gasto (S/.) que realizan los alumnos docentes de la Maestría en Educación es simétrica, veamos las cinco medidas de resumen: Minimum

Maximum

Mediana

Cuartil 1

Cuartil 3

30.4

58.5

44.3

38.9

49.78

La media aritmética es igual a S/. 44.65, un valor muy cercano a la mediana , de ahí que la forma de la caja indica que el gasto tiene comportamiento simétrico. Ejemplo 2.24: Las calificaciones del último examen del curso Inglés avanzado para Ejecutivos, de dos secciones distintas, A y B, se muestran en el siguiente gráfico. Realizar el análisis correspondiente sobre el rendimiento de los alumnos de ambas secciones, en este examen.

Grafico Nº 2.13. Las calificaciones del último examen del curso Inglés avanzado para Ejecutivos Solución: La calificación mediana de la sección A es menor que la de B. Tienen igual dispersión y la forma es simétrica. En la sección A, existe un caso atípico, se trata de un alumno identificado con 9 que ha obtenido una calificación muy alta comparada con el resto de la sección.

92


Estadística Aplicada a la Educación

EJERCICIOS PROPUESTOS 2.1 La alimentación es el principal factor que determina el estado de nutrición y salud en particular en niños de 2 a 5 años de edad (de 24 a 59 meses), motivo por el que un grupo de investigadores han seleccionado una muestra aleatoria de niños de esta población en el presente año. Se presentan datos de algunas variables estudiadas en la Tabla Nº 2.7. var Sexo Área educa

Nombre Sexo del niño Área de residencia Nivel de educación de la madre

Categorías/Niveles 1: masculino 2: femenino 1: urbana 2. rural 0: Sin nivel 1: primaria 2: secundaria 3: superior

vivienda

Material predominante de la vivienda

1: noble

2: madera

3: cartón

Nº de veces que asistió a una consulta odontológica (último año) calorías Consumo diario de calorías (Kcal) proteínas Consumo diario de proteínas (g) odon

1. Identificar la población y la muestra bajo estudio. 2. Para cada variable indique la escala de medición empleada y el tipo de variable. 3. Presente los datos de cada variable categórica mediante tabla y gráfico de frecuencias adecuados. Interprete. 4. Presente los datos de cada variable cuantitativa mediante tabla y gráfico de frecuencias adecuados. Interprete. 5. Compare el número de veces que asistió el niño a una consulta odontológica (último año) según sexo y también según área de residencia de la muestra, empleando tablas y gráficos de frecuencias.¿Conclusión?. 6. Compare el consumo de calorías según sexo y también según área de residencia de la muestra, empleando tablas y gráficos de frecuencias simples. ¿Conclusión?. 7. Compare el consumo de proteínas según sexo y también según área de residencia de la muestra, empleando tablas y gráficos de frecuencias simples. ¿Conclusión?. 8. Repetir los ejercicios 5, 6 y 7 pero usando el gráfico de cajas. ¿Se obtiene el mismo resultado?. Interprete cada resultado. ¿Hay datos atípicos? 9. Obtenga la tabla bidimensional de las variables Nivel de educación de la madre y Material predominante de la vivienda. Interprete.

93


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

10. Respecto al ejercicio anterior obtenga el gráfico de perfil fila y de perfil columna y elija el adecuado para una mejor comprensión del comportamiento de ambas variables. 11. Se evidencia relación entre las variables Nivel de educación de la madre y Material predominante de la vivienda. ¿Por qué?. 12. Obtenga la tabla bidimensional de las variables Nivel de educación de la madre y Consumo diario de calorías (Kcal). Interprete. 13. Respecto al ejercicio anterior obtenga el gráfico de perfil fila y de perfil columna y elija el adecuado para una mejor comprensión del comportamiento de ambas variables. 14. Se evidencia relación entre las variables Nivel de educación de la madre y Consumo diario de calorías (Kcal). ¿Por qué?. 15. Obtenga la tabla bidimensional de las variables Nivel de educación de la madre y Consumo diario de proteínas (g). Interprete. 16. Respecto al ejercicio anterior obtenga el gráfico de perfil fila y de perfil columna y elija el adecuado para una mejor comprensión del comportamiento de ambas variables. 17. Se evidencia relación entre las variables Nivel de educación de la madre y Consumo diario de proteínas (g). ¿Por qué?. 18. Compare mediante medidas de posición el Consumo diario de calorías (Kcal) entre los niños del área urbana y área rural. 19. En cuál área el Consumo diario de calorías (Kcal) es más dispersa si emplea la media aritmética como medida de posición. Cuál cuando emplea la mediana. 20. Estudiar la forma, empleando el coeficiente de asimetría, del Consumo diario de calorías (Kcal) según área de residencia. 21. Compare mediante medidas de posición el Consumo diario de proteínas (g) entre los niveles de ecuación de la madre. 22. Estudiar la dispersión absoluta del Consumo diario de proteínas (g) cuando emplea la media aritmética como medida de posición y cuando emplea la mediana, según nivel de educación de la madre. 23. Estudiar la forma, empleando el coeficiente de asimetría, del Consumo diario de proteínas (g) según nivel de educación de la madre. 24. Cuál de las variables es más homogénea Consumo diario de calorías (Kcal), del Consumo diario de proteínas (g) o el Número de veces que asistió a una consulta odontológica (último año). 25. Considerando las variables del ejercicio anterior, cuál de las tres tiene tendencia a ser simétrica.

94


Estadística Aplicada a la Educación

26. Obtenga los percentiles 33.33, 40, 60 y 80 para cada una de las variables del ejercicio 24. Interprete. 27. Entre que valores del Consumo diario de calorías (Kcal) se encuentra el 60% central de niños según área de residencia. Interprete. 28. Entre que valores el Consumo diario de proteínas (g) se encuentra el 40% central de niños según nivel de educación de la madre. Interprete. 29. Entre que valores del Consumo diario de calorías (Kcal) se encuentra el 70% central de niños según sexo. Interprete. 30. Entre que valores el Consumo diario de proteínas (g) se encuentra el 80% central de niños según Material predominante de la vivienda. Interprete. 2.2 El Agotamiento Profesional es el responsable de la desmotivación que sufren los profesionales en particular de Educación y se presenta como un trastorno adaptativo crónico, asociado a las demandas psicosociales del trabajo directo con personas a través de una relación de interdependencia mutua, como consecuencia de un desbalance prolongado (más de 6 meses) entre demandas y recursos de afrontamiento. Un equipo de investigadores estudia esta problemática, por que han observado que va en incremento, para tal fin han construido y evaluado en su confiabilidad y validez un cuestionario que evalúa si un profesional padece de agotamiento profesional. Los puntajes obtenidos indican que a mayor puntaje existe mayor agotamiento profesional. Los resultados de las medidas de resumen para la variable bajo estudio se muestra en el siguiente cuadro, basado en muestras de docentes, quienes están trabajando en la institución educativa correspondiente más de 6 meses. Institución Educativa 4348 5677 4020

n

x

Me

60 84 43

30.4 35.6 27.8

36.7 32.8 30

Mo 43 30 31

S

Q1

Q3

P20

P80

6.1 8.2 4.7

29.3 30.3 26.1

40 34 30.7

26.2 28.4 23

43.5 34.8 33

1. Comparar e interpretar las medias aritméticas. ¿Cuál es la conclusión?. 2. ¿Cuánto es el valor mínimo del 50% superior de docentes para cada institución educativa?. ¿Conclusión? 3. Para cada institución educativa, cuál es puntaje más frecuente. 4. ¿En cuál de las instituciones educativas, existe presencia de datos extremos?. ¿Por qué?. 5. Realizar el análisis de dispersión en base a la desviación estándar. ¿Conclusión?.

95


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

6. Compara e interpretar el rango intercuartílico. ¿Conclusión?. 7. Analizar y comparar los quintos extremos, es decir el quinto inferior y el quinto superior, de cada institución educativa. ¿Conclusión?. 8. ¿En cuál de las instituciones educativas el puntaje es más simétrico?. Graficar la forma del puntaje para cada una de ellas. 9. Analizar la dispersión relativa del puntaje. Tabla 2.7. Datos del ejercicio 2.1 unidad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

96

sexo 1 2 2 1 1 2 2 1 2 1 1 1 1 2 2 2 1 1 1 1 1 1 1 1 2 2 1 1

area 2 1 2 1 1 2 2 1 2 1 1 1 1 1 1 1 2 2 1 1 1 1 1 1 2 2 2 2

educa 1 2 1 2 2 1 0 1 2 2 2 3 3 2 1 1 1 2 3 2 1 1 1 1 1 2 0 0

vivienda 3 1 2 1 1 1 1 1 2 1 1 1 1 2 2 3 3 3 1 1 2 2 2 1 2 2 3 3

odon 0 0 0 1 1 0 0 1 0 1 1 1 2 2 2 2 0 0 2 2 2 3 2 2 0 0 1 1

calorías 955 1,300 946 1,120 1,134 923 889 1,071 936 1,162 1,148 1,236 1,200 1,276 997 1,071 902 905 1,267 1,100 952 909 1,050 982 942 1,046 802 906

proteínas 84 70 85 190 96 81 70 120 87 167 163 80 160 89 90 171 94 71 94 174 143 136 79 138 93 84 73 94


Estadística Aplicada a la Educación

29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66

2 1 1 2 1 1 1 1 1 1 1 1 1 1 2 2 1 1 2 2 1 1 1 1 1 1 1 1 1 2 2 1 1 1 1 2 2 1

2 2 2 2 2 2 1 1 1 1 1 1 1 2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2

0 1 0 1 1 2 1 2 2 2 2 2 3 2 0 1 1 1 1 3 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 2 1

3 2 2 2 2 2 1 1 1 1 1 1 1 1 3 2 2 2 2 1 3 2 2 2 2 2 3 3 3 2 2 3 2 3 3 3 3 3

0 0 0 0 1 1 1 1 1 0 0 0 0 1 1 1 0 0 1 1 0 0 0 2 2 1 1 1 1 0 0 1 1 0 0 0 0 0

857 1,114 866 871 810 830 976 1,021 1,017 1,120 1,073 1,092 1,146 800 839 1,043 820 883 929 1,100 909 781 855 828 936 1,000 839 1,000 830 855 828 846 856 917 982 946 1,000 873

84 92 71 73 73 100 143 90 139 136 153 166 160 98 81 125 70 73 91 117 102 73 83 71 95 123 119 117 85 72 113 81 87 116 94 100 184 118

97


Programa de Licenciatura para Profesores sin TĂ­tulo PedagĂłgico en Lengua Extranjera

67 68 69 70 71 72 73 74 75 76 77 78 79 80

98

2 2 2 2 2 2 2 2 2 2 2 2 2 2

2 1 1 2 1 1 1 2 1 1 2 2 2 2

2 3 3 2 2 2 2 0 1 2 1 1 2 2

2 1 1 3 1 2 2 1 3 3 1 2 2 2

1 0 1 0 3 1 0 0 1 1 0 0 0 0

1,016 1,079 942 909 1,099 1,041 1,192 932 997 1,021 913 941 1,000 1,023

141 126 113 87 147 166 198 116 86 163 121 88 193 187


Estadística Aplicada a la Educación

UNIDAD III NOCIONES DE PROBABILIDAD 3.1 INTRODUCCION Al estudiar las partes de una casa, la profesora de Inglés de una Institución Educativa Privada, de educación inicial, enseña a pronunciarlas adecuadamente. Al final de la clase elige al azar a 3 alumnos de su aula, para verificar si pronuncian bien o mal la palabra kitchen, ¿cuál es el resultado que se obtendrá?, ¿será cierta su respuesta?, ¿por qué?. Para absolver las preguntas estamos ante la incertidumbre y debe ser cuantificada, lo podemos hacer empleando la probabilidad. Esta Unidad tiene como objetivo: El estudio y aplicaciones de la probabilidad situaciones de incertidumbre. 3.2 OBJETIVOS DE LA TEORIA DE LA PROBABILIDAD La teoría de la probabilidad proporciona los modelos para estudiar los fenómenos que se caracterizan por la variabilidad de sus resultados. Estos modelos se llaman modelos aleatorios. Los modelos aleatorios describen los resultados de los llamados experimentos aleatorios, que es el objeto de estudio de la teoría de la probabilidad. 3.3 EXPERIMENTO ALEATORIO Es todo proceso que se puede repetir indefinidamente obteniéndose resultados imprevisibles. Existen experimentos cuyos resultados son imprevisibles pero que no pueden repetirse cuantas veces se desea. Estos experimentos irrepetibles también son considerados como experimentos aleatorios por aquellos que suelen llamarse subjetivistas, en contraposición con los frecuentistas, quienes aceptan como experimentos aleatorios aquellos que son repetibles cuantas veces se desee. Los principios generales de la Teoría de la Probabilidad se aplican bajo cualquiera de los dos enfoques.

99


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Ejemplo 3.1: Una profesora de educación inicial de una Institución Educativa Privada, enseña a pronunciar varias palabras relacionadas con la cocina entre otras partes de una casa. Al final de la clase elige al azar a 3 alumnos de su aula, para verificar si pronuncian bien (B) o mal (M) la palabra kitchen. Los resultados que se obtendrán para los tres alumnos es desconocido, hasta que se haya evaluado a los alumnos, por tanto se trata de un experimento aleatorio. 3.4 ESPACIO MUESTRAL Y EVENTO El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio y se le denota mediante Ω; este conjunto constituye el espacio muestral asociado al experimento aleatorio descrito. Ejemplo 3.2: Considerando el experimento aleatoria del ejemplo 3.1, describir el espacio muestral asociado a este experimento. Solución: En el siguiente Gráfico Nº 3.1, se describe este experimento, B, indica que pronuncia bien y M que pronuncia mal la palabra kitchen, el niño evaluado. Del gráfico El espacio muestral es el conjunto está integrado por 9 ternas: Ω = { (B, B, B), (B, B, M), (B, M, B), (B, M, M), (M, B, B), (M, B, M), (M, M, B), (M, M, M)} Un evento es cualquier subconjunto del espacio muestral Ω, y se le denota con letras mayúsculas A, B,C,........... El evento es propuesto por el investigador según los resultados que le interese estudiar.

100


Estadística Aplicada a la Educación

Gráfico Nº 3.1. Espacio muestral del ejemplo 3.2

Ejemplo 3.3: Del espacio muestral descrito en el ejemplo 3.2, anote los elementos de los siguientes eventos definidos como: A: Los tres niños no pronuncian bien la palabra kitchen. B: Exactamente dos de los niños pronuncian bien la palabra kitchen C: Uno de los niños prefiere cantar canciones cortas, para su edad, en inglés. Solución: A = { ( M, M, M ) } B = { ( B, B, M ), (B, M, B), (M, B, B) } No hay resultados para este evento C, asociado al experimento aleatorio descrito. 3.5 EVENTOS ESPECIALES Y OPERACIONES CON EVENTOS A continuación se presentan algunos eventos especiales. 1) Evento Seguro: Representado mediante Ω. Es el evento que siempre ocurre. 2) Evento Imposible: Representado mediante ∅ . Es el evento que nunca ocurre.

101


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

c

3) Evento Complementario del evento A: Representado mediante A o A Es el conjunto de elementos que están en Ω pero no en el evento A.

4) Evento Unión de A y B: Representado mediante A ∪ B Es el conjunto de elementos de Ω que están en A o en B o en están en ambos eventos.

5) Evento Intersección de A y B: Representado mediante A ∩ B Es el conjunto de elementos de Ω que están en el evento A y en el evento B.

102


Estadística Aplicada a la Educación

6) Eventos Mutuamente Excluyentes: Dos eventos son mutuamente excluyentes si ambos no pueden ocurrir simul táneamente, es decir A ∩ B = ∅, como en el siguiente gráfico.

7) Evento Diferencia A – B Es el evento cuyos elementos son elementos que solamente pertenecen al evento A. c

De ahí que también se expresa así: A – B = A ∩ B .

Ejemplo 3.4: c

Considerando el ejemplo 3.3, efectuar las siguientes operaciones: B , A ∪ B, A ∩ B, Solución: Los eventos resultados de las operaciones son: Bc = { (B, B, B) (B, M, M) (M, B, M) (M, M, B) (M, M, M) } A ∪ B = { (B, B, M), (B, M, B), (M, B, B), (M, M, M) } A ∩ B = ∅, es decir A y B son eventos mutuamente excluyentes. C = ∅, es un evento imposible, porque no puede ocurrir con el espacio muestral asociado al experimento aleatorio respectivo.

103


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

3.6 ENFOQUES DE LA PROBABILIDAD La probabilidad, tiene varios enfoques, para valorar la probabilidad de la ocurrencia de un evento. 3.6.1 Subjetivista: Un especialista en la enseñanza del Idioma Inglés considera que para los tiempos actuales es necesario que el futuro docente de esta especialidad conozca y aplique Curriculum Design Based in Standards, a fin que tenga ejerza la profesión de manera eficiente. Juan Pérez Gómez es alumno del último año de estudios y está planeando llevar el curso sobre la materia mencionada. ¿Cuánto es la probabilidad de que Juan Pérez se anime a matricularse en el mencionado curso?. Varios factores como la edad del alumno, su motivación por su carrera y su actitud hacia la superación y el aprendizaje constante, entre otros factores intervienen en la decisión de Juan por asistir al curso mencionado en este caso. Juan no se ha enfrentado antes a un caso exactamente igual a éste, quizás no se enfrentara a otro igual en el futuro, por tanto cualquier probabilidad que se asigne al evento “matricularse en el mencionado curso Curriculum Design Based in Standards” es una apreciación personal o de tipo subjetivista. 3.6.2 Frecuentista: Un investigador de la enseñanza en idioma inglés afirma que de 2000 alumnos del primer grado de educación secundaria que emplean el método EASY para aprender Inglés básico, 1680 logran aprenderlo al término del uso de este método. Es natural suponer, que la probabilidad de que ocurra lo mismo en otro alumno de este grado de secundaria es aproximadamente 0.84 (1680/2000). En base a este estudio se informa que el método EASY es efectivo en un 84 por 100 para aprender Inglés básico. Como se observa esta probabilidad no es una apreciación personal, sino basada en la repetición de una experiencia y en la observación de los resultados. Se trata de hecho de una frecuencia relativa, que es la proporción de veces que un evento ocurrirá si se hubiese repetido el experimento un gran número de veces. 3.6.3 Priori: Requiere el conocimiento de un modelo teórico, llamado distribución de probabilidad, el que describe la probabilidad de que todos los resultados del experimento ocurran. Por ejemplo, la teoría genética permite conocer la distribución de probabilidad que un recién nacido nazca con ojos azules si su madre tiene ojos azules y su padre ojos negros, conociendo todos los posibles genotipos de colores de ojos en el recién nacido y sus probabilidades.

104


Estadística Aplicada a la Educación

3.7 DEFINICION AXIOMATICA DE LA PROBABILIDAD Como vemos se usa la probabilidad para medir lo incierto. En términos intuitivos, la probabilidad es una medida de la posibilidad de la ocurrencia de un evento. La probabilidad se define axiomáticamente o matemáticamente también, veamos sus axiomas: 1. La probabilidad del espacio muestral es 1. P (Ω ) = 1 2. La probabilidad de cualquier evento es un número no negativo P (A) > 0 , para todo evento A 3. Sean A1, A2, A3, …………….. una sucesión de eventos mutuamente excluyentes, entonces P (A1 ∪ A2 ∪ A3 ∪….) = P (A1) + P (A2) + P (A3) + ……. Estos axiomas conducen a establecer las siguientes propiedades de la probabilidad: 1. P (∅) = 0 La probabilidad del evento imposible es cero. 2. 0 < P (A) < 1, para cualquier evento A La probabilidad de cualquier evento toma valores entre cero y uno. 3. A ∩ B = ∅ entonces P ( A ∪ B) = P (A) + (B) Si dos eventos son mutuamente excluyentes, la probabilidad de la unión de estos eventos es igual a la suma de las probabilidades de estos eventos. 4. Si A ⊂ B, entonces P (A) < P (B) Si A es un evento subconjunto de B, entonces la probabilidad del evento A es menor o igual que el evento B. c

5. P (A ) = 1 – P (A) La probabilidad del evento complementario de A es igual a, uno menos la probabilidad del evento A. 6. P (A ∪ B) = P (A) + P (B) – P (A ∩ B), para dos eventos cualesquiera A y B. La probabilidad de la unión de dos eventos cualesquiera, digamos A y B, es igual a la suma de las probabilidades de estos eventos, menos la probabilidad de la intersección de estos eventos. Ejemplo 3.5: Un estudio realizado en Lima Metropolitana reporta que el 26% de docentes del nivel secundario de Instituciones Educativas Estatales que enseñan Inglés tienen estrés, el 31%

105


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

presenta dolor lumbar y el 41% tiene estrés o dolor lumbar o ambos problemas de salud. Si se elige al azar a un docente de esta población, cuánto es la probabilidad de que: 1. Presente ambos problemas de salud? 2. Tenga estrés pero no tenga dolor lumbar? Solución: Definamos los eventos: A: Profesor de Inglés tiene stress B: Profesor de Inglés tiene dolor lumbar Las probabilidades que enuncia el problema son: P (A) = 0.26 P (B) = 0.31 P (A ∪ B) = 0.41 1. Probabilidad de que presente ambos problemas de salud: Se refiere a que el docente tenga ambos problemas de salud, entonces usamos la siguiente propiedad: P (A ∪ B) = P (A) + P (B) – P (A ∩ B) Reemplazando los valores de probabilidades respectivamente: 0.41 = 0.26 + 0.31 – P (A ∩ B) Por tanto: P (A ∩ B) = 0.16. Es decir la probabilidad de que presente ambos problemas de salud es igual a 0.16 (16%). 2. Probabilidad de tenga estrés pero no tenga dolor lumbar: Es decir solamente tenga estrés y no padezca de dolor lumbar, se presenta en el siguiente gráfico:

106


Estadística Aplicada a la Educación

El área con líneas verticales, corresponde al evento solamente tenga estrés y no padezca de dolor lumbar, observar que: c

P (A) = P (A ∩ Β ) – P (A ∩ B) y reemplazando las probabilidades respectivas. c

0.26 = P (A ∩ Β ) + 0.16, por tanto: c

P (A ∩ Β ) = 0.26 – 0.16 = 0.10 (10%) . Por tanto la probabilidad de que un docente tenga estrés pero no tenga dolor lumbar es igual a 0.10 (10%). 3.8 PROBABILIDAD CONDICIONADA Supóngase que pretendemos conocer la probabilidad de la ocurrencia del evento A2 dado que ocurrió el evento A1. Para tal fin emplearemos la notación P (A2 | A1), para designar la probabilidad de ocurrencia del evento A2 dado condicionada por el hecho de que haya ocurrido previamente el evento A1. Veamos su definición: Sean dos eventos A1 y A2 tal que la P ( A1 ) ≠ 0, la probabilidad condicionada de A2 dado A1, se define como: P ( A 2 A1 ) =

P ( A1 ∩ A 2 )

(3.1)

P ( A1 )

Ejemplo 3.6: Usando el ejemplo 3.5, si el docente elegido al azar: 1. Tiene estrés, ¿cuánto es la probabilidad de que tenga dolor lumbar? 2. Tiene dolor lumbar, ¿cuánto es la probabilidad de que tenga estrés? Solución: Considerando los eventos y sus probabilidades respectivas: A : Profesor de Inglés tiene stress, P (A) = 0.26 B : Profesor de Inglés tiene dolor lumbar, P(B) = 0.31 P ( A ∪ B ) = 0.41 y P ( A ∩ B ) = 0.16 1. Si el docente tiene estrés, ¿cuánto es la probabilidad de que tenga dolor lumbar? P ( A ∩ B) Empleando la expresión (3.1): P (B A ) =

P(A)

y reemplazando valores adecuadamente: P (B A ) =

P ( A ∩ B) P(A)

=

0.16 0.26

= 0.6154

107


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Si el docente tiene estrés, la probabilidad de que tenga dolor lumbar es 0.6154 (61.54 %) 2. Si el docente tiene dolor lumbar, ¿cuánto es la probabilidad de que tenga estrés? P ( A ∩ B) Empleando la expresión (3.1): P ( A B) = cuadamente: P (B ) P ( A B) =

P ( A ∩ B) P (B )

=

y reemplazando valores ade-

0.16 = 0.5161 0.31

Si el docente tiene dolor lumbar, la probabilidad de que tenga estrés es 0.5161 (51.61 %) Se ha comprobado que: P ( A B) =

P ( A ∩ B) P (B )

≠ P (B A ) =

P ( A ∩ B) P(A)

En general la probabilidad condicionada no tiene propiedad de ser conmutativa, por que: P ( A B ) ≠ P (B A )

(3.2)

Ejemplo 3.7: Un equipo de investigadores estudio el clima institucional en las Instituciones Educativas, se eligio una muestra de docentes del nivel secundario y los resultados se muestran en la siguiente tabla. Tabla Nº 3.5. Docentes según tipo de institución educativa y clima institucional Institución

Clima Institucional Desfavorable En proceso

Favorable

Muy Favorable

Total

Estatal

200

316

153

79

748

Particular laico

44

68

255

163

530

37

51

130

177

395

281

435

538

419

1673

Particular religioso Total

Si se elige al azar a un docente calcular la probabilidad: 1. De que trabaje en una institución educativa particular religioso. 2. De que considere el clima institucional en proceso.

108


Estadística Aplicada a la Educación

3. De que trabaje en una institución educativa particular laico, si se sabe que considere el clima institucional favorable. 4. De que considere el clima institucional desfavorable, si se sabe que trabaja en una institución educativa estatal. Se sugiere que estos ejercicios los desarrolle con su profesor (a) del curso. 3.9 INDEPENDENCIA DE EVENTOS Dos eventos A y B son independientes si: P ( A B ) = P(A) (3.3)

Equivalentemente:

P ( A ∩ B ) = P(A) * P(B) (3.4)

Ejemplo 3.8: Considere los datos de la Tabla Nº 3.5, para verificar si los eventos docente de institución educativa particular laico y que considere que el clima institucional es favorable son independientes. Solución: Sea A, el evento docente de institución educativa particular laico y sea B, el evento considerar que el clima institucional es favorable, entonces emplearemos la expresión (3.3): P ( A B ) = P(A) Calculamos, la probabilidad condicionada del evento A dado el evento B: P(A ∩ B) 255 / 1673 255 = = = 0.474 P ( A B) = P(B) 538 / 1673 538 También calculamos la probabilidad del evento A:

σ 2π

Es claro que: P(X ≤ 4) = 0.997

Por tanto los eventos A y B no son independientes. 3.10 VARIABLE ALEATORIA Una variable aleatoria X es una función definida en el espacio muestral Ω (dominio) y que toma valores reales (rango). Mediante la variable aleatoria se representa los resultados de un experimento aleatorio en números. Según los valores que pueden tomar las variables aleatorias se clasifican en:

109


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

3.10.1 Variable Aleatoria Discreta Una variable aleatoria es discreta si su rango es un conjunto de valores reales enumerables pudiendo ser finito o infinito. Ejemplo 3.9: Las siguientes variables aleatorias son discretas •

Número de hijos de sexo masculino que tiene una familia con 4 hijos vivos.

Número de casos de cáncer al pulmón detectados mensualmente, en sujetos expuesto al asbesto.

3.10.2 Variable Aleatoria Continua Una variable aleatoria es continua si su rango es un conjunto de valores no enumerables, pudiendo ser finito o infinito. Ejemplo 3.10: Las siguientes variables aleatorias son continuas •

El tiempo que tarda (horas) un sujeto en recuperarse de una intoxicación por consumo de agua contaminado por mercurio, después de iniciar el tratamiento médico correspondiente.

El gasto (S/.) que invierte un docente universitario, anualmente, para su actualización.

Ejemplo 3.11: Consideremos el ejemplo 3.2 y se define la variable aleatoria (VA) X: Número de niños que pronuncian bien la palabra kitchen ¿Cuál es el rango de esta VA, equivalentemente cuáles son los valores que toma esta VA? Solución: Recordemos que el espacio muestral es: Ω = { (B, B, B), (B, B, M), (B, M, B), (B, M, M), (M, B, B), (M, B, M), (M, M, B), (M, M, M)} Para determinar cuáles son los valores que toma esta VA, se debe aplicar a cada resultado la variable aleatoria definida y anotar el valor correspondiente.

110


Estadística Aplicada a la Educación

X ( ( M,M,M ) ) = 3

X ( ( B,M,M ) ) = X ( ( M,B,M ) ) = X ( ( M,M,B ) ) = 2

X ( ( B,M,M ) ) = X ( ( M,B,M ) ) = X ( ( M,M,B ) ) = 1 X ( ( M,M,M ) ) = 0 Los valores que toma esta variable aleatoria son: 0, 1, 2 y 3; por tanto se trata de una VA discreta por que su rango es enumerable, en este caso finito. 3.11 DISTRIBUCIÓN DE PROBABILIDAD La distribución de probabilidad de una VA es una manera de modelar la variabilidad o la forma como se distribuyen los valores del rango de la VA. La distribución de probabilidad generalmente se representa mediante una tabla, un gráfico o una fórmula. De tal modo, que se muestre todos los valores posibles de la variable con sus probabilidades respectivas (caso discreto). Las distribuciones de probabilidad son modelos teóricos para representar distribuciones empíricas y como tales, asociadas a ellas están su media y su varianza. La media de una variable aleatoria comúnmente llamada Esperanza, se denota con E(X) o μ. La varianza 2 de una variable aleatoria se denota con σ . Cada distribución de probabilidad está caracterizada por uno, dos o más parámetros, que bien pueden ser la media o la varianza, por ejemplo. Ejemplo 3.12: La distribución de probabilidad del número de estudiantes (nivel secundaria) que tienen actitud negativa hacia la educación ambiental, para un grupo de cinco estudiantes es: X : Nº de alumnos que tienen actitud negativa hacia la educación ambiental x

0

1

2

3

4

5

P (X = x)

0,12

0,20

0,28

0,17

0,16

0,07

En una muestra aleatoria de 5 estudiantes de este nivel se les examina mediante una prueba que mide la actitud hacia la educación ambiental: 1. ¿Cuánto es la probabilidad de que 3 tengan actitud negativa hacia la educación ambiental? 2. ¿Cuánto es la probabilidad de que a lo sumo 2 tengan actitud negativa hacia la educación ambiental?

111


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

3. ¿Cuánto es la probabilidad de que por lo menos 3 tengan actitud negativa hacia la educación ambiental?. 4. Calcular e interpretar la esperanza y varianza de la variable aleatoria bajo estudio. Solución: La variable aleatoria X : Nº de alumnos que tienen actitud negativa hacia la educación ambiental Es discreta por que toma valores enumerables (enteros), de la distribución de probabilidad que es de forma tabular, cada probabilidad asignada para cada valor de la VA correspondiente se le llama probabilidad puntual dado que la probabilidad es para un valor que toma la VA. 1. ¿Cuánto es la probabilidad de que 3 tengan actitud negativa hacia la educación ambiental?. De la tabla se observa que P(X > 2) =0.17. 2. ¿Cuánto es la probabilidad de que a lo sumo 2 tengan actitud negativa hacia la educación ambiental?. A lo sumo 2 alumnos tengan actitud negativa hacia la educación ambiental, significa que como máximo 2 alumnos tengan actitud negativa.

P(X > 2) = P(X > 2) + P(X > 2) + P(X > 2) = 0.12 + 0.20 + 0.28 = 0.60 3. ¿Cuánto es la probabilidad de que por lo menos 3 tengan actitud negativa hacia la educación ambiental?. Por lo menos 3 alumnos tengan actitud negativa hacia la educación ambiental, significa que como mínimo 3 alumnos tengan actitud negativa.

P(X > 2) = P(X => 2) + P(X > 2) + P(X > 2) = 0.17 + 0.16 + 0.07 = 0.40 4. Calcular e interpretar la esperanza y varianza de la variable aleatoria bajo estudio. El cálculo de la esperanza y varianza de una variable aleatoria discreta es: k

μ = E ( X ) = ∑ x i * P(X = x i ) (3.5) i =1

k

σ2 = V ( X ) = ∑ ( x i − μ ) * P(X = x i ) (3.6) respectivamente. Empleando la expresión (3.5): μ = E(X)

112

i =1

2


Estadística Aplicada a la Educación

= 0 * P(X > 2) + 1 * P(X > 2) + 2 * P(X > 2) + 3 * P(X > 2) + 4 * P(X > 2) + 5 * P(X > 2) = 0 * 0.12 + 1 * 0.20 + 2 * 0.28 + 3 * 0.17 + 4 * 0.16 + 5 * 0.07 = 2.26 μ = 2.26, lo cual indica que en promedio, de 5 alumnos de esta población, 2.26 tienen actitud negativa hacia la educación ambiental. Empleando la expresión (3.6): σ2 = V ( X ) 2 2 2 = ( 5 − 2.26 ) * P(X > 2) + ( 5 − 2.26 ) * P(X > 2) + ( 5 − 2.26 ) 2 * P(X > 2) + ( 5 − 2.26 )2 * P(X > 2) + ( 5 − 2.26 ) * P(X > 2) 2 + ( 5 − 2.26 ) * P(X > 2) 2 2 = ( 5 − 2.26 ) *0.12 + ( 5 − 2.26 ) *0.20 + ( 5 − 2.26 ) * 0.28 + ( 5 − 2.26 ) 2

2

* 0.17 + ( 5 − 2.26 ) * 0.16 + ( 5 − 2.26 ) *0.07 2

2

= 0.6129 + 0.3175 + 0.0189 + 0.0931 + 0.4844 + 0.5255 = 2.0523 σ2 = 2.26, en consecuencia la desviación estándar es: σ σ

= σ 2 = 1.4326

Por tanto el coeficiente de variación es: σ CV(X) = * μ 100 = 63.39 % Este valor resultante indica la variable aleatoria tiene alta dispersión. 3.12 DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL Para estudiar a esta distribución de probabilidad primero explicaremos que es un proceso de Bernoulli, llamado también experimento de Bernoulli. 3.12.1 Proceso de Bernoulli Cuando un experimento aleatorio tiene las siguientes características: 1. Sólo hay dos resultados posibles: - Éxito (A) - Fracaso (A c ) 2. P(X > 2) (es constante) y P(A c ) = 1 − p = q 3. Los resultados de las observaciones son independientes

113


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Se dice que es un proceso de Bernoulli. Cabe indicar que el evento denominado éxito es de interés para el estudio del investigador. Ejemplo 3.13: Los siguientes casos que siguen el proceso Bernoulli son (¿Por qué?): • • •

Un sujeto puede o no tener VIH La condición socioeconómica de una familia como pobre o no pobre. Causa de muerte de un sujeto sea por un desastre natural o no.

3.12.2 Variable Aleatoria Binomial Si se repite un número fijo de veces, n, un experimento de Bernoulli con parámetro p , el número de éxitos que ocurren en repeticiones u observaciones, sigue una distribución Binomial con parámetros n y p En este caso la variable aleatoria Binomial es: X: Nº de éxitos que ocurren en n observaciones. cuya distribución de probabilidad se expresa como: ⎛n⎞ (3.7) P(X = x) = ⎜ ⎟ p x qn− x , x = 0,1,2,.....n ⎝x⎠ Asimismo esta variable aleatoria tiene esperanza y varianza

E(X) = np y E(X) = 1.1 respectivamente Notación.: X ~ B(n,p) , y se lee: la V.A. X tiene distribución de probabilidad Binomial, con parámetros n y p 3.12.3 Cálculo de una Probabilidad Binomial Para calcular probabilidades de una variable aleatoria Binomial, X ~ B(n,p) , empleando el software Excel, para los siguientes casos es 1. Para probabilidades puntuales, esto es, P (X = x): Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR BINOM → Núm_éxitos x → Ensayos n→ Prob_éxitos p → Acumulado: FALSO 2. Para probabilidades acumuladas, esto es, P (X < z): Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:: DISTR BINOM → Núm_éxitos x → Ensayos n → Prob_éxitos p → Acumulado: VERDADERO

114


Estadística Aplicada a la Educación

Ejemplo 3.14: Se afirma que el 11% de alumnos de educación secundaria tiene nivel medio sobre conocimientos de educación ambiental, en la población de Lima Metropolitana. Si elige al azar a 10 personas de esta población, cuánto es la probabilidad de que: 1. Exactamente 3 personas tengan nivel medio sobre conocimientos de educación ambiental. 2. A lo sumo 4 personas tengan nivel medio sobre conocimientos de educación ambiental. 3. Más de 2 personas tengan nivel medio sobre conocimientos de educación ambiental. Solución: Primero veamos si el experimento aleatorio sigue un proceso Bernoulli: Sólo hay dos resultados posibles: Éxito: alumno de educación secundaria que tiene nivel medio sobre conocimientos de educación ambiental (A) Fracaso. Lo contrario (A c ) c P(A) = p = 0,11 (es constante) y P(A ) = 1 − p = q = 0,89

Los resultados de las observaciones son independientes El número de observaciones es fijo n = 10 La variable aleatoria Binomial es, X: Nº de alumnos de educación secundaria que tiene nivel medio sobre conocimientos de educación ambiental, de un total de 10 personas. Con distribución de probabilidad, reemplazando en (3.7), igual a: ⎛ 10 ⎞ P(X = x) = ⎜ ⎟ 0,11x 0,8910− x , x = 0,1,2, 3.....,10 ⎝x ⎠

Con E(X) = np = 10 * 0.11 = 1.1 V(X) = npq = 10 * 0.11* 0.89 = 0.979 Usando los procedimientos pertinentes, los resultados son: 1. P(X = 3) La probabilidad a calcularse es puntual por ello se sigue el procedimiento: Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR BINOM → Núm_éxitos x (3) → Ensayos n (10)→ Prob_éxitos p (0.11) → Acumulado: FALSO

115


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Por tanto P(X ≤ 4) = 0.997 2. P(X > 2) La probabilidad a calcularse es acumulada por ello se sigue el procedimiento: Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función:: DISTR BINOM → Núm_éxitos x (4) → Ensayos n (10) → Prob_éxitos p (0.11) → Acumulado: VERDADERO Por tanto P(X ≤ 4) = 0.997 3. P(X > 2)

Este tipo de probabilidad no está programado en Excel, pero empleamos la propiedad 5 que se derivan de los axiomas de la definición de Probabilidad. P(X > 2) = 1 − P(X ≤ 2) Observe que P(X > 2) es una probabilidad acumulada, siguiendo el procedimiento anterior : P(X > 2) = 0.912 y reemplazando adecuadamente: P(X > 2) = 1 − P(X ≤ 2) = 1 − 0.912 Por tanto P(X > 2) = 0.088 Ejemplo 3.15: Calcule e interprete el coeficiente de variación para el caso del ejemplo 3.14 . Solución: Se sabe que E(X) = 1.1 y V(X) = 0.979 , de ahí que σ = 0.979 = 0.989 Por tanto el coeficiente de variación es: CV(X) =

σ *100 = 89.91 % ; lo cual indica la variable aleatoria tiene alta dispersión. μ

3.13 DISTRIBUCIÓN DE PROBABILIDAD NORMAL 3.13.1 Introduccion Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas, es la base de la inferencia estadística (en particular de la inferencia paramétrica), por ello es muy empleada. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma Normal o de campana.

116


Estadística Aplicada a la Educación

Por ejemplo: 1. Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, por ejemplo; tallas, pesos, diámetros, perímetros,... 2. Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. 3. Caracteres sociológicos, por ejemplo: consumo (soles) de cierto producto por un mismo grupo de individuos, puntuaciones de examen, etc. 4. Otras distribuciones como la Binomial o la de Poisson son aproximaciones normales, ... 3.13.2 Función de Densidad Su función de densidad (distribución de probabilidad de una variable aleatoria Normal) esta dada por: f X ( x) =

1

σ 2π

e

1 ⎡ x−μ ⎤ 2 − ⎢ 2 ⎣ σ ⎥⎦

x ∈ R, μ ∈ R y σ > 0

(3.8)

La expresión (3.8), indica que la variable aleatoria Normal, puede tomar cualquier valor real, igual que μ. 2

Sus parámetros son: μ = E (X) y σ = V (X) Su gráfica, llamada curva normal, se muestra en el gráfico 3.2, tiene forma de campana, hay mayor concentración en valores centrales de la variable, a medida que decrece sus valores o crecen, las probabilidades disminuyen.

Gráfico Nº 3.2. Curva de la distribución Normal de probabilidad.

Al gráfico de la distribución Normal se le llama campana de Gauss en honor a Carlos Gauss eminente matemático alemán, que en 1823 publicó Theoria combinationis observationum erroribus minimis obnoxiae, en el cual se dedica a la distribución normal.

117


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera 2

Notación: X ~ N (μ, σ ) y se lee así, la variable aleatoria Normal, X, tiene distribución 2 de probabilidad normal con parámetros μ y σ . 3.13.3 Propiedades Esta distribución tiene propiedades muy importantes que se deben considerar a fin de usarla apropiadamente: Para una mejor comprensión de las propiedades observar el Gráfico Nº 3.2. 1. Es simétrica respecto a su esperanza μ. Significa que a la izquierda y a la derecha de μ, la probabilidad es igual a 0.50 (50%). 2. Es monótona creciente en (–∞, μ) y monótona decreciente en (μ, + ∞). En el intervalo (–∞, μ) la curva crece y en el intervalo (μ, + ∞) decrece la curva. 3. Tiene puntos de inflexión en x = μ ± σ Se refiere a que en los puntos x = μ – σ y x = μ + σ, la curva cambia de sentido. En el intervalo (–∞, μ – σ) la curva es cóncava hacia arriba, en el intervalo (μ - σ, μ + σ) la curva es cóncava hacia abajo y en el intervalo (μ, +∞), la curva es cóncava hacia arriba. 4. Es asintota al eje de la abcisa. La abcisa es el eje vertical, como se observa para valores bien bajos y bien altos de la variable aleatoria Normal, las probabilidades tienden a cero. 5. Toma su valor máximo en ⎛⎜ μ, ⎝

1 ⎞ ⎟. σ 2π ⎠

Toma un valor máximo en μ y en el eje vertical toma el valor

1 . σ 2π

6. En el Intervalo (μ – σ, μ + σ) está aproximadamente el 68 % de probabilidad 7. En el Intervalo (μ – 2σ, μ + 2σ) está aproximadamente el 95 % de probabilidad 8. En el Intervalo (μ – 3σ, μ + 3σ) está aproximadamente el 99 % de probabilidad 3.11.4 Funcion de Distribucion Acumulada Esta función, sirve para calcular probabilidades, y se trata de una probabilidad acumulada que matemáticamente está dada por: 1 ⎡ x −μ ⎤2 σ ⎥⎦ 2

− ⎢ 1 P(X ≤ t) = FX (t) = ∫ e 2⎣ −∞ σ 2π t

118

dx (3.9)


Estadística Aplicada a la Educación

Esta probabilidad es un área en la curva Normal, situada en el extremo inferior; es decir acumula probabilidad desde el valor mas pequeño de la variable aleatoria Normal hasta un cierto valor. El gráfico de la expresión (3.9) es:

t Gráfico Nº 3.3. Probabilidad Acumulada de la distribución Normal de probabilidad.

3.13.5 Tipificación o Estandarización de la V.A. Normal 2

Si la X ~ N (μ, σ ), entonces la variable aleatoria estandarizada de X , está dada por:

Z=

X −μ ~ N (0,1) σ

(3.10)

Como se observa la variable aleatoria X sufre transformación, porque se le resta su media μ y se luego se divide sobre su desviación estándar σ. La función de densidad de la variable aleatoria estandarizada normal, denotada mediante Z, es: 2 1 − 2z 2 (3.11) fZ (z) = e z ∈R 2π Su Función de Distribución Acumulada (FDA) es:

P ( Z ≤ z ) = FZ (z) = Φ ( z ) =

z

−∞

1 − 2t 2 e dt (3.12) 2π

Característica de la distribución normal estandarizada: 1. No depende de ningún parámetro 2. Su media es 0, su varianza es 1 y su desviación típica es 1. 3. La curva es simétrica respecto z = 0 y toma aquí su máximo valor. 4. Tiene dos puntos de inflexión en z = 1 y z = -1.

119


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Su representación gráfica se llama curva normal estandarizada, en donde también se representa a la FDA, tiene la siguiente forma, observe el siguiente gráfico 3.4, ahora la curva está centrada en cero.

Gráfico Nº 3.4. Probabilidad Acumulada de la distribución Normal Estandarizada

3.13.6. Cálculo de probabilidad para una variable aleatoria normal 2

Para calcular probabilidades de una variable aleatoria X ~ N (μ, σ ) empleando el software Excel, para los siguientes casos es: Para calcular probabilidades puntuales, esto es, P (X = x): Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR. NORM → x → Media → Desv_estándar→ Acumulado: FALSO → Aceptar Para probabilidad acumulada, esto es, P (X ≤ x): Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR. NORM → x → Media→ Desv_estándar→ Acumulado: VERDADERO →Aceptar 2

3.11.7 Cálculo del valor de una V.A. normal X ~ N (μ, σ ) P (X ≤ x) = p, ¿x?, esto es dada una probabilidad acumulada igual a p, queremos 2 saber cuanto es el valor de la la variable aleatoria Normal X ~ N (μ, σ ) empleando el software Excel, es: Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR. NORM.INV → Probabilidad (p) → Media→ Desv_estándar→ Aceptar Ejemplo 3.16: El puntaje del examen de ingreso en el presente año académico a la Maestría de Educación, Mención Enseñanza del Idioma Inglés de una Universidad Estatal de los postulantes, tiene distribución normal, con media igual a 1000 y varianza 144400. Si se elige al azar a un postulante, cuando es la probabilidad de que

120


Estadística Aplicada a la Educación

1. Haya obtenido a lo sumo 1300 de puntaje. 2. Más de 830 de puntaje 3. Entre 660 y 1450 de puntaje. Solución: Sea X, la variable aleatoria normal, puntaje del examen de ingreso a la Maestría de Educación, Mención Enseñanza del Idioma Inglés de una Universidad Estatal Si la varianza del puntaje es 144400, entonces la desviación estándar, es su raíz cuadrada igual a 380. Empleando la notación correspondiente, X ~ N (1000, 144400). μ = 1000 (Media) 2

σ = 144400, entonces σ = 380

Para cada caso se sigue el procedimiento del cálculo de probabilidad. 1. P (X ≤ 1300)

El siguiente gráfico muestra la probabilidad por calcularse, como se observa es una probabilidad acumulada, de ahí que se usa la notación P (X ≤ 1300) .

Siguiendo el procedimiento correspondiente: Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR. NORM → x (1300) → Media (1000) → Desv_estándar (380) → Acumulado: VERDADERO →Aceptar P(X ≤ 1300) = 0.78 2. P (X > 830) El siguiente gráfico muestra la probabilidad por calcularse, como se observa es una probabilidad que comprende un área extrema hacia la derecha de un valor en este caso es 830, de ahí que se usa la notación P (X > 830)

121


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Este tipo de probabilidad no está programado en Excel, pero empleamos la propiedad 5 de las que se derivan de los axiomas de la definición de Probabilidad. P (X > 830) = 1 – P (X ≤ 830) Observe que P (X ≤ 830) es una probabilidad acumulada, siguiendo el procedimiento anterior P (X > 830) = 1 – P (X ≤ 830) = 1 – 0.3273 = 0.672 Por tanto P (X > 830) = 0.672 3. P (660 ≤ X ≤ 1450) El siguiente gráfico muestra la probabilidad por calcularse, como se observa es una probabilidad que está comprendida entre dos valores de la variable aleatoria, de ahí que se usa la notación P(660 ≤ X ≤ 1450)

Este tipo de probabilidad no está programado en Excel, pero empleamos la operación diferencia en este caso de dos probabilidades acumuladas que hemos calculado anteriormente: P (660 ≤ X ≤ 1450) = P (X ≤ 1450) – P (X ≤ 660) P (660 ≤ X ≤ 1450) = 0.8818 – 0.1855 = 0.7964 Ejemplo 3.17: 1. Considerando el caso anterior, se desea determinar el valor: 2. Máximo del puntaje obtenido por el tercio inferior de postulantes. 3. Mínimo del puntaje obtenido por el quinto superior de postulantes.

122


Estadística Aplicada a la Educación

Solución: Ahora se trata de calcular el valor de la variable puntaje de ingreso conociendo una probabilidad acumulada. 1. Máximo del puntaje obtenido por el tercio inferior de postulantes. El tercio inferior comprende al 33.33% de postulantes que han obtenido los puntajes más bajos; por tanto, el máximo valor para esa área es el P33.33 como se observa en el siguiente gráfico:

P(X ≤ P33.33), ¿ P33.33?, esto es dada una probabilidad acumulada igual a 0.3333, queremos saber cuanto es el valor de la variable aleatoria Normal, para tal caso, seguimos el procedimiento siguiente: Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR. NORM.INV → Probabilidad (0.3333) → Media (1000)→ Desv_estándar (380)→ Aceptar El valor resultante es 835.98 , e indica que el 33.33% de alumnos con notas más bajas o que se encuentra en el tercio inferior, tienen puntaje máximo igual a 835.98. 2. Mínimo del puntaje obtenido por el quinto superior de postulantes. El quinto superior comprende al 20 % de postulantes que han obtenido los puntajes más altos; por tanto el mínimo valor para esa área es el P80, que a su vez es el máximo valor para el 80% inferior, como se observa en el siguiente gráfico:

123


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

P(X ≤ P80), ¿ P80?, esto es dada una probabilidad acumulada igual a 0.80, queremos saber cuanto es el valor de la variable aleatoria Normal, para tal caso, seguimos el procedimiento siguiente: Insertar → Función → Seleccionar una categoría: Estadísticas → Seleccionar una función: DISTR. NORM.INV → Probabilidad (0.80) → Media (1000)→Desv_estándar (380)→ Aceptar El valor resultante es 1319.82 , e indica que el 20 % de alumnos con puntajes más altos o que se encuentra en el quinto superior, tienen puntaje mínimo igual a 1319.82. EJERCICIOS PROPUESTOS 3.1 En una escuela se ofrece tres cursos extracurriculares como son: Desarrollo personal, Defensa personal y Ajedrez, con la finalidad que los alumnos puedan inscribirse gratuitamente a uno de estos curso. De esta escuela se eligen dos alumnos al azar para saber en cual de los tres cursos se va a inscribir. 1. Describir el espacio muestral correspondiente. 2. Anote los elementos de los siguientes eventos: A: Los dos alumnos se inscriben en el mismo curso. B: Exactamente uno se inscribe en el curso de Ajedrez C: Por lo menos uno de ellos se inscribe en el curso de defensa personal. 3. Realizar las siguientes operaciones: c

c

c

B , A ∪ B, A ∩ B, A ∩ B , B ∩ C, B ∩ C

4. En el caso de que todos los eventos elementales (elementos) del espacio muestral sean equiprobables, se define la probabilidad del evento A como el cociente entre el número de resultados favorables a que ocurra el suceso A en el experimento y el número de resultados posibles del experimento (Definición denominada como de Laplace). Emplear esta definición y asignar la probabilidad de ocurrencia de los eventos propuestos en el ejercicio 2. 5. Emplear la definición dada en el ejercicio 4, para aplicarlo al ejercicio 3. 3.2. La probabilidad de que el grupo Dionisio instale una institución educativa particular en la ciudad de Arequipa es 0.76 la probabilidad de que se instale en la ciudad del Cuzco es 0.4 y la probabilidad de que se instale en Arequipa o Cuzco o en ambas ciudades es 0.9. ¿Cuánto es la probabilidad de que el grupo Dionisio instale instituciones educativas particulares: 1. ¿En ambas ciudades?. Representar gráficamente. 2. ¿En ninguna de estas ciudades?. Representar gráficamente.

124


Estadística Aplicada a la Educación

3. ¿Solamente en el Cuzco?. Representar gráficamente. 4. ¿Solamente en arequipa?. Representar gráficamente. 3.3 Suponga que en un grupo de 492 docentes socios del asociación de cesantes y jubilados se ha detectado que 210 tiene problemas de salud de las vías altas respiratorias, 260 de ellos fuman y 122 tiene problemas de salud de las vías altas respiratorias y fuman. Si se selecciona al azar un miembro de este grupo, encuentre la probabilidad de que el docente socio: 1. Fume pero no tenga problemas de salud de las vías altas respiratorias. 2. Fume o tenga problemas de salud de las vías altas respiratorias o tenga ambas características. 3. ¿Es el evento tener problemas de salud de las vías altas respiratorias independiente del evento fumar? ¿Por qué?. 3.4 En la siguiente Tabla, se presentan los resultados de la evaluación realizada para estudiar la relación que existe entre el nivel de comprensión lectora y el nivel de educación de la madre de una muestra de niños de 9 años de edad, que asisten a instituciones educativas estatales. Comprensión Lectora Inferior Regular Superior Total

Sin nivel 20 24 30 74

Nivel de Educación Primaria Secundaria 31 30 36 42 46 52 113 124

Superior 24 40 58 122

Total 105 142 186 433

Si se elige al azar a un alumno de esta población: 1. ¿Cuánto es la probabilidad de que un niño tenga nivel de comprensión lectora inferior y su madre tenga nivel de educación primaria? 2. ¿Cuánto es la probabilidad de que un niño tenga nivel de comprensión lectora superior y su madre tenga nivel de educación primaria? 3. ¿Cuánto es la probabilidad de que un niño tenga nivel de comprensión lectora regular? 4. ¿Cuánto es la probabilidad de que un niño tenga madre sin nivel de educación? 5. ¿El nivel de comprensión lectora inferior es independiente de que la madre del niño no tenga nivel de educación? 6. ¿El nivel de comprensión lectora regular es independiente de que la madre del niño no tenga nivel de educación secundaria?

125


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

7. Resulta que su madre tiene nivel de educación superior, ¿cuánto es la probabilidad de que tenga nivel de comprensión lectora superior?. 8. Resulta que el niño tiene nivel de comprensión lectora superior, ¿cuánto es la probabilidad de que su madre tenga nivel de educación secundaria?. 3.5. Investigadores sociales afirman que los alumnos del quinto grado de secundaria de instituciones educativas estatales cuando se pelearían con sus amigos y estuvieran deprimidos, dan los siguientes resultados: el 70% recurriría a sus otros amigos, el 40% recurriría a sus padres y el 20% a ambos (amigos y padres). Si se elige al azar a un alumno de esta población, representar gráficamente: 1. La probabilidad de que solamente recurría a sus amigos. 2. La probabilidad de que solamente recurría a sus padres. 3. La probabilidad de que recurría a otras personas. 3.6. Considere el enunciado del ejercicio 3.5, para responder lo siguiente: 1. ¿Son los eventos “recurriría a sus otros amigos” y “recurriría a sus padres” complementarios?. ¿Por qué? 2. ¿Son los eventos “recurriría a sus otros amigos” y “recurriría a sus padres” mutuamente excluyentes?. ¿Por qué? 3. ¿Son los eventos “recurriría a sus otros amigos” y “recurriría a sus padres” independientes?. ¿Por qué? 3.7. La distribución de probabilidad del número (X) de docentes que afirman tener insatisfacción laboral, en una muestra de 6 docentes es: x

0

1

2

3

4

5

6

P(X = x)

0.04

0.06

0.18

K

0.30

0.12

0.02

Si se eligen al azar a 6 docentes, calcular la probabilidad de que: 1. 2. 3. 4.

Todos estén insatisfechos. A lo sumo tres estén insatisfechos. Exactamente 5 estén insatisfechos. Menos de la mitad estén insatisfechos.

3.8. Considere el enunciado del ejercicio 3.7 para calcular la esperanza, la varianza, la desviación estándar y el coeficiente de variación de la variable aleatoria bajo estudio. 3.9. El Bullying (maltrato entre compañeros) es un problema que se está incrementando en las instituciones educativas, se reporta que el 48% de alumnos del nivel secundario ha sufrido de Bullying el año pasado, para estudiar esta problemática un psicólogo elige una muestra de 20 alumnos de esta población. ¿Este caso corresponde a un proceso o experimento aleatorio de Bernoulli?. Justificar.

126


Estadística Aplicada a la Educación

3.10. El 20% de alumnos del nivel primaria afirman que consultaría problemas de educación sexual con sus maestros, se elige una muestra aleatoria de 10 alumnos de este nivel de educación para realizar un focus group sobre esta temática. ¿Este caso corresponde a un proceso o experimento aleatorio de Bernoulli?. Justificar. 3.11. La variable aleatoria número de docentes capacitados en el uso de las TIC’s para la enseñanza Historia del Perú, tiene distribución de probabilidad Binomial. Se dispone de la siguiente información: Instituciones Educativas Lima Metropolitana Lima Provincias

n 40 26

p 0.31 0.22

Comparar la bajo variable bajo estudio empleando su esperanza y varianza. 3.12. El 30% de instituciones educativas estatales tiene infraestructura física de nivel bajo, si se eligen a azar 20 instituciones educativas. Cuánto es la probabilidad que: 1. Solo 5 instituciones educativas estatales tienen infraestructura física de nivel bajo. 2. Más de la mitad de instituciones educativas estatales tengan infraestructura física de nivel bajo. 3. Menos de 4 instituciones educativas tengan infraestructura física de nivel bajo 3.13 El 30% de docentes de arte emplean las TIC’s para su desempeño profesional en aula de clase, en los Institutos de Educación Superior no Universitaria; si se eligen al azar 8 docentes de esta población, cuánto es la probabilidad que: 1. No más de 2 emplean las TIC’s para su desempeño profesional en aula de clase. 2. Exactamente 5 emplean las TIC’s para su desempeño profesional en aula de clase. 3. A lo sumo 3 emplean las TIC’s para su desempeño profesional en aula de clase. 3.14. El puntaje de al prueba que mide el analfabetismo digital (la incapacidad de manejar las nuevas tecnologías por falta de conocimientos, ignorancia o exclusión) en la población de alumnos del último año de secundaria tiene distribución de probabilidad Normal, con los siguientes parámetros: Zona Norte Lima Metropolitana Sur

Media 50 60 60

Desviación Estándar 24 18 24

127


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Graficar esta información simultáneamente e interpretar la variable bajo estudio, considerando que el rango de la prueba es de 20 a 100, cuánto más puntaje se obtenga menor es el analfabetismo digital. 3.15. La actitud hacia el curso de Estadística en alumnos de pregrado de la EAP de Educación en la UNMSM, ha sido investigado por un equipo de investigadores y se ha establecido que tiene distribución Normal con media igual a 83 y varianza 121, antes del inicio de las clases. Si se elige un alumno al azar de esta población, cuánto es la probabilidad de que: 1. Obtenga menos de 60 en la prueba correspondiente? 2. Obtenga por lo menos 99 en la prueba correspondiente? 3. Obtenga entre 70 y 90 en la prueba correspondiente? 3.16. Considere el ejercicio anterior, 3.15, para determinar los siguientes valores del puntaje: 1. Máximo del 35% inferior de alumnos. 2. Mínimo del tercio superior de alumnos. 3. Del 40% central de alumnos. 3.17. Se aplica una prueba a los alumnos de la Maestría en Educación, Mención Docencia en el Nivel Superior, el primer día de clases para evaluar si aplican debidamente las herramientas de la Estadística Descriptiva para el análisis de datos. La calificación de esta prueba tiene distribución Normal con media 13 y desviación estándar 3.25. Determine el porcentaje de alumnos que: 1. Desaprobaran la prueba. 2. Obtendrán más de 16 en la prueba. 3. Obtendrán entre 12 y 15 en la prueba. 3.18. Considere el ejercicio 3.17, para determinar los siguientes valores de la calificación: 1. Mínima del quinto superior. 2. Máxima del 10% inferior. 3. Del 60% central de alumnos. 3.19. Si Z ~ N (0,1) calcular: 1. P (Z ≤ 1.25) 2. P (Z ≥ –1) 3. P (-0.95 ≤ Z ≤ –1.69) 3.20. Si Z ~ N (0,1) calcular: 1. K tal que P (Z ≤ K) = 0.20 2. K tal que P (Z ≥ K) = 0.05 3. J y K tal que P (J ≤ Z ≤ K) = 0.90

128


Estadística Aplicada a la Educación

UNIDAD IV ANÁLISIS DE REGRESIÓN LINEAL SIMPLE 4.1 INTRODUCCIÓN Una tabla de contingencia sirve no solo para presentar datos categóricos, sino analizarlas conjuntamente, y observar o describir cómo es la relación o asociación que existe entre ellas. Esta Unidad tiene como objetivo el estudio conjunto simultáneo de los datos de dos variables medidas por lo menos en escala intervalar. De igual forma podemos analizar conjuntamente cómo se relacionan dos variables cuantitativas, para ello usaremos el Modelo de Regresión, para referirnos a una función matemática que intenta modelar probabilísticamente una variable respuesta bajo estudio (variable dependiente) que lo representamos mediante Y , en relación a uno o más predictores (variable(s) independiente(s)) de interés. El modelo más simple está constituido por una relación lineal entre dos variables que responde a la pregunta: dado un valor x de la variable predictora, ¿cuál sería el valor promedio (o esperanza) de todos los posibles valores de Y observables en presencia de X=x ?, observe el siguiente gráfico.

Gráfico Nº 4.1. Relación Lineal entre dos variables cuantitativas Esta forma, que es la más simple, puede ser algebraicamente más compleja en la medida que hay más variables predictoras, que algunas de estas variables son categóricas (como el sexo por ejemplo) y/o la relación entre las variables no es lineal. Cuando queremos conocer el grado de asociación lineal entre las variables utilizamos el Coeficiente de Correlación (R). Regresión y Correlación son dos conceptos vinculados, pero no equivalentes. Regresión se refiere a modelar la variable respuesta en relación o en función a las variables predictoras

129


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

para evidenciar una relación estructural que nosotros postulamos o conjeturamos; para estimar el valor más probable de la respuesta Y para las unidaes con un perfil particular de valores de las variables predoctoras. Por tanto, la(s) variable(s) predictora(s) y la respuesta Y desempeñan roles claramente distintos. La correlación pretende medir el grado de asociación lineal entre la respuesta y la(s) variable(s) predictora(s) sin diferenciar entre variable respuesta o predictora.

4.2 MODELO DE REGRESION LINEAL SIMPLE: Cuando hablamos de regresión lineal simple, nos referimos a la relación entre una variable predictora y una variable respuesta, ambas de carácter cuantitativo continuo. El modelo de regresión lineal es el más utilizado y por ser el matemáticamente más simple facilita entender otros modelos de regresión más generales. El modelo se define por la siguiente expresión:

Donde:

y = β0 + β1x + ε

(4.1)

y: variable dependiente o de respuesta. Es la variable por modelar o predecir. x: variable independiente o regresora. Es la variable que se utiliza para modelar o predecir. β0: parámetro del modelo; es la ordenada en el origen, β1: parámetro del modelo, pendiente de la recta, indica la magnitud del incremento o decremento de y por cada unidad de incremento en x. ε: error o perturbación aleatoria, explica la variabilidad en y, que no puede ser explicada en el modelo. Para estimar la expresión (4.1), se observan n unidades, independientes entre sí, para “estimar” los coeficientes, los datos bivariantes son:

(x1 , y1 ), (x2 , y2 ),......, (xn , yn ) 4.3 GRÁFICO O DIAGRAMA DE DISPERSIÓN Se le llama también nube de puntos y es de gran utilidad para estudiar la relación entre dos variables cuantitativas, para tal fin se usa el plano cartesiano, el primer eje, horizontal o de la abcisa, se reserva para representar a los datos de la variable predictora y el segundo eje, vertical o de la ordenada, se reserva para representar a los datos de la variable respuesta. La representación es conjunta o por pares, de tal manera que los puntos graficados nos mostrarán la naturaleza y la fuerza de la relación entre dichas variables. Veamos los siguientes casos:

130


Estadรญstica Aplicada a la Educaciรณn

Grรกfico Nยบ 4.2. Formas de relaciรณn entre dos variables cuantitativas.

En el grรกfico (a), las variables ( x, y ) se incrementan mostrando una tendencia lineal directa los valores se la variable predictora y respuesta se relaciona en el mismo sentido. Se incrementan los valores una variable y tambiรฉn se incrementa los valores de la otra variable. En el grรกfico (b) las variables muestran una relaciรณn lineal inversa lineal, al incrementarse los valores de x disminuyen los valores de la otra. En el grรกfico (c) no se observa ninguna relaciรณn lineal entre ambas variables.

Ejemplo 4.1: Se realiza un estudio para determinar la relaciรณn que existe entre el tiempo (horas diarias) que se dedican a realizar prรกcticas extraescolares de razonamiento matemรกtico y su rendimiento en el curso de matemรกticas, basรกndose en una muestra aleatoria de 30 alumnos del tercer grado de educaciรณn secundaria. Los datos recolectados son: Nยบ Tiempo Puntaje Nยบ Tiempo Puntaje Nยบ Tiempo Puntaje

1 3.30 10 11 2.00 8 21 5.26 15

2 2.30 9 12 4.30 13 22 3.10 9

3 3.24 11 13 2.40 7 23 2.00 7

4 2.50 9 14 2.50 11 24 2.14 8

5 2.14 8 15 4.15 14 25 2.26 8

6 3.30 11 16 3.50 9 26 2.26 9

7 8 9 3.45 2.40 3.28 12 10 10 17 18 19 3.10 2.30 4.20 9 9 13 27 28 29 5.20 4.20 2.30 15 12 7

10 2.30 9 20 4.37 12 30 5.10 14

Estudiar grรกficamente la relaciรณn que existe entre las dos variables.

Soluciรณn: Se emplea el grรกfico de dispersiรณn

131


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Grafico Nº 4.3 Tiempo que se dedican a realizar prácticas extraescolares de razonamiento Matemático y su rendimiento en el curso de matemáticas.

Se observa una relación lineal ascendente o directa, esto es, se incrementan los valores del tiempo, también se incrementan los valores del puntaje del examen de matemáticas en esta muestra.

4.4. ESTIMACIÓN DEL MODELO DE REGRESION LINEAL SIMPLE Para estimar los parámetros del modelo de regresión lineal simple, el modelo lineal con una sola variable predictora, se utiliza el Método de los Mínimos Cuadrados, procedimiento que permite estimar los parámetros del modelo, y tiene como objetivo, minimizar la suma de los cuadrados de las desviaciones entre los valores de la variable de respuesta (valores de la muestra) y los valores estimados de la variable de respuesta (obtenidos en la ecuación estimada de regresión lineal simple). Veamos que es una desviación para este caso, sea: Yi: El valor observado (muestral) de la variable de respuesta para la i-ésima observación. Ŷi: El valor estimado de la variable de respuesta para la i-ésima observación. Valor resultante al emplear la ecuación de regresión lineal estimada. Entonces la desviación es la siguiente diferencia: Yi - Ŷi, estas desviaciones se elevan al cuadrado y se suman para todos los casos, entonces se tiene: n

∑ ( yi − yˆ i ) i =1

2

(4.2)

Al cual se le llama SCE, el método de mínimos cuadrados justamente busca minibar SCE, es decir:

132


Estadística Aplicada a la Educación

n

Min SCE = Min ∑ ( y i − yˆ i ) (4.3) 2

i =1

En el siguiente gráfico se muestra las desviaciones antes mencionada.

⎧ ⎨ ⎩

( yi - yˆ i )

Gráfico Nº 4.4. Desviaciones entre valor observado y estimado de la variable respuesta

Utilizando el cálculo diferencial se calculan los valores que minimizan la expresión (4.2) y se obtienen de las siguientes ecuaciones: ∂SCE ∂β0

∂SCE ∂β1 βˆ

ˆ 0 ,β ˆ1 β

ˆ

n

n

i =1

i =1

= 0 ⇒ ∑ y i = nβˆ 0 + βˆ 1 ∑ x i n

n

n

i =1

i =1

i =1

(4.4)

= 0 ⇒ ∑ x i y i = βˆ 0 ∑ x i + βˆ 1 ∑ x i2

0 ,β1

(4.5)

Resolviendo las ecuaciones (4.4) y (4.5) se obtiene:

βˆ 1 =

Ejemplo 4.2:

n

n

i =1

i =1

n

n∑ xi y i− ∑ xi ∑ y i i =1

2

⎛ ⎞ (4.6) n∑ x − ⎜ ∑ xi ⎟ i =1 ⎝ i=1 ⎠ n

2 i

n

βˆ 0 = y −βˆ 1 x

( 4.7)

Use la expresión (4.6) y (4.7) para estimar los coeficientes de la ecuación de regresión lineal simple, para los datos del ejemplo 4.1. Interprete.

133


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Solución: La Tabla Nº 4.1 muestra los cálculos realizados para estimar los parámetros de la ecuación de regresión lineal simple. Empleando la expresión (4.6): βˆ 1 =

n

n

i =1

i =1

n

n∑ xi y i− ∑ xi ∑ y i i =1

⎛ ⎞ n∑ xi2 − ⎜ ∑ xi ⎟ i =1 ⎝ i=1 ⎠ n

n

2

=

30(1037.84) − (94.85) * (308) 30 * (329.77) − (9485)2

31135.20 − 29213.80 1921.4 βˆ 1 = = 9893.10 − 8996.52 896.58

βˆ 1 = 2.14 Empleando la expresión (4.7):

βˆ 0 = y −βˆ 1 x = 10.27 − (2.14) * (3.16) = 10.27 − 6.76 β0 = 3.51 Entonces la ecuación de regresión estimada, para las variables bajo estudio es: Ŷ = 3.51 + 2.14x Se interpreta como sigue, por cada unidad de hora de practica en razonamiento matemático, el puntaje en la prueba de matemáticas se incrementa en 2.14 unidades Tabla Nº 4.1. Cálculos del ejemplo 4.2 Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

134

xi 3.30 2.30 3.24 2.50 2.14 3.30 3.45 2.40 3.28 2.30 2.00 4.30 2.40 2.50 4.15

yi 10 9 11 9 8 11 12 10 10 9 8 13 7 11 14

x i * yi 33 20.7 35.64 22.5 17.12 36.3 41.4 24 32.8 20.7 16 55.9 16.8 27.5 58.1

x i2 10.89 5.29 10.50 6.25 4.58 10.89 11.90 5.76 10.76 5.29 4.00 18.49 5.76 6.25 17.22


Estadística Aplicada a la Educación

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 TOTAL

3.50 3.10 2.30 4.20 4.37 5.26 3.10 2.00 2.14 2.26 2.26 5.20 4.20 2.30 5.10 94.85

9 9 9 13 12 15 9 7 8 8 9 15 12 7 14 308.00

31.5 27.9 20.7 54.6 52.44 78.9 27.9 14 17.12 18.08 20.34 78 50.4 16.1 71.4 1037.84

12.25 9.61 5.29 17.64 19.10 27.67 9.61 4.00 4.58 5.11 5.11 27.04 17.64 5.29 26.01 329.77

4. 5. EVALUACIÓN DEL AJUSTE GLOBAL DEL MODELO: COEFICIENTE DE DETERMINACIÓN Una vez estimado la ecuación de regresión lineal simple, es importante determinar ¿Qué tan bien se ajusta el modelo regresión lineal simple a los datos?. Para tal fin, se evalúa el ajuste global del modelo regresión lineal simple, mediante el Coeficiente de Determinación, que es una herramienta descriptiva A este Coeficiente se le denota mediante R2, y es una medida que se sirve para evaluar la bondad del ajuste del modelo de regresión lineal simple, pero globalmente. Para apreciar mejor la utilidad de este coeficiente, se tiene para una observación lo siguiente:

Gráfico Nº 4.5. Partición de la Desviación Total

135


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Observar como la desviación total se descompone en dos, la Desviación total = Desviación explicada + Desviación no explicada

y − y = yˆ − y + y − yˆ i i i i

Si se miden estas desviaciones para cada valor de la variable de respuesta, se eleva al cuadrado cada desviación, y se suman para todos los “n” datos de la muestra, se tiene lo siguiente: Suma Total de Cuadrados = Suma de Cuadrados debido a la regresión SCT =

SCR

2 n ∑ yi − y = i=1

(

2 n ˆ ∑ y −y i=1 i

)

(

)

+

Suma de Cuadrados de los Residuos

+

SCE

+

2 n ˆ (4.7) ∑ y −y i=1 i i

(

)

El coeficiente de determinación se define como la razón entre la Suma de Cuadrados de los Residuos (SCR) y la Suma Total de Cuadrados (SCT), es decir:

∑ ( yˆ − y )

2

∑(y − y)

2

n

R2 =

SCR = SCT

(4.8)

i

i =1 n

i

i =1

Si la expresión (4.7) se divide entre SCT se obtiene: n

R2 = 1−

SCE = 1− SCT

∑ ( yi − yˆ i )

2

i =1

∑(y − y) n

i =1

2

(4.9)

i

La interpretación de este coeficiente es como sigue: Si R2 → 0, el modelo no representa adecuadamente a los datos, las variaciones de la variable respuesta no son explicadas por el modelo de regresión estimado. R2 → 1, el modelo representa adecuadamente a los datos, es decir casi todas las variaciones de la variable de respuesta son explicadas por el modelo de regresión estimado.

Ejemplo 4.3: Evaluar la ecuación de regresión estimada obtenida en el ejemplo 4.2.

Solución: La Tabla Nº 4.2 muestra los cálculos realizados para obtener el valor del coeficiente de determinación lineal. Empleando la expresión (4.8):

136


Estadística Aplicada a la Educación

∑ ( yˆ − y )

2

∑(y − y)

2

n

R2 =

SCR = SCT

i =1 n i =1

i

=

4.7541 = 0.9226 5.1529

i

El 92.26 % de la variabilidad de rendimiento en el curso de matemáticas se explica mediante el tiempo (horas diarias) que se dedican a realizar prácticas extraescolares de razonamiento matemático.

4.6. COEFICIENTE DE CORRELACIÓN LINEAL Se define como la raíz cuadrada del coeficiente de determinación lineal y mide el grado de relación o asociación lineal que hay entre dos variables cuantitativas. Esto es: R = ±√ R2

(4.10)

Se le denota mediante R, , toma valores entre –1 y 1. El coeficiente de correlación lineal es con signo positivo si el coeficiente de regresión lineal estimado es con signo positivo. Si este coeficiente tiene signo negativo, el coeficiente de correlación lineal es con signo negativo. La interpretación de este coeficiente es como sigue: Si R → –1, significa que existe buena asociación lineal inversa. Es decir cuando se incrementan los valores de la variable predicta, los valores de la variable respuesta decrecen linealmente. R2 → +1, significa que existe buena asociación lineal directa. Es decir cuando se incrementan los valores de la variable predicta, los valores de la variable respuesta también se incrementan linealmente. Si R → 0 , significa ausencia de asociación lineal.

137


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Tabla 4.2. Cálculos para el ejemplo 4.3

Xi

1 3.3 2 2.3 3 3.24 4 2.5 5 2.14 6 3.3 7 3.45 8 2.4 9 3.28 10 2.3 11 2 12 4.3 13 2.4 14 2.5 15 4.15 16 3.5 17 3.1 18 2.3 19 4.2 20 4.37 21 5.26 22 3.1 23 2 24 2.14 25 2.26 26 2.26 27 5.2 28 4.2 29 2.3 30 5.1 TOTAL 94.85

Yi 10 9 11 9 8 11 12 10 10 9 8 13 7 11 14 9 9 9 13 12 15 9 7 8 8 9 15 12 7 14 308

yi − y

(y − y) i

yˆ i

-0.27 -1.27 0.73 -1.27 -2.27 0.73 1.73 -0.27 -0.27 -1.27 -2.27 2.73 -3.27 0.73 3.73 -1.27 -1.27 -1.27 2.73 1.73 4.73 -1.27 -3.27 -2.27 -2.27 -1.27 4.73 1.73 -3.27 3.73 -0.10

0.0729 1.6129 0.5329 1.6129 5.1529 0.5329 2.9929 0.0729 0.0729 1.6129 5.1529 7.4529 10.6929 0.5329 13.9129 1.6129 1.6129 1.6129 7.4529 2.9929 22.3729 1.6129 10.6929 5.1529 5.1529 1.6129 22.3729 2.9929 10.6929 13.9129 163.867

10.57 8.43 10.44 8.86 8.09 10.57 10.89 8.65 10.53 8.43 7.79 12.71 8.65 8.86 12.39 11.00 10.14 8.43 12.50 12.86 14.77 10.14 7.79 8.09 8.35 8.35 14.64 12.50 8.43 14.42 308.28

2

yi − y

(y − y)

0.30 -1.84 0.17 -1.41 -2.18 0.30 0.62 -1.62 0.26 -1.84 -2.48 2.44 -1.62 -1.41 2.12 0.73 -0.13 -1.84 2.23 2.59 4.50 -0.13 -2.48 -2.18 -1.92 -1.92 4.37 2.23 -1.84 4.15 0.18

0.0912 3.3782 0.0301 1.9881 4.7541 0.0912 0.3881 2.6374 0.0672 3.3782 6.1504 5.9634 2.6374 1.9881 4.4986 0.5329 0.0159 3.3782 4.9640 6.7174 20.2176 0.0159 6.1504 4.7541 3.7002 3.7002 19.0794 4.9640 3.3782 17.2557 136.8662

2

i

Otra forma de calcular el coeficiente de correlación lineal es empleando la siguiente expresión:

138


Estadística Aplicada a la Educación

Cov (x,y) Sx Sy

R=

(4.11)

Donde: Cov ( x, y) , es la covarianza de las variables

x y y , se calcula como:

∑ ( x − x )( y − y ) n

Cov(x,y) =

i =1

i

i

(4.12)

n

Sx : es la desviación estándar de la variable X. Sy : es la desviación estándar de la variable Y.

Ejemplo 4.4: Calcular e interpretar la correlación que existe entre las variables del ejemplo 4.2. Solución: 2 Del ejemplo anterior se obtuvo R = 0.9226 , entonces la correlación es igual a:

R = 0.9226 = 0.9605 Este valor indica que la correlación es alta y directa por que es con signo positivo ya que el coeficiente de regresión 2.14 es también con signo positivo, calculado en el ejemplo 4.2.

Ejemplo 4.5: Un psicólogo estudia la relación que existe entre el rendimiento en el curso de Matemática Básica y la estabilidad emocional de una muestra de alumnos de la EAP de Genética y Biotecnología. Los datos recolectados son: Nº M E

1 14 34

2 12 28

3 4 5 6 7 8 13 15 12 12 14 12 31 39 28 25 39 26

9 16 47

10 13 35

11 12 13 14 12 16 36 29 50

14 13 33

15 15 43

Siendo: M: Promedio del curso Matemática Básica E: Puntaje de la prueba que mide estabilidad emocional. ¿Estas variables guardan alguna relación?

139


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

Solución: Primeramente se realiza un análisis gráfico de esta variable, empleando el gráfico de dispersión. Ver siguiente gráfico.

Gráfico Nº 4.6. Promedio del curso Matemática Básica y Puntaje de la prueba de estabilidad emocional.

En este gráfico se observa que existe una relación lineal directa, pero en este caso no hay una variable respuesta y una predictora, sino que las variables están asociadas o son interdependienets o concomitantes. Para medir el grado de asociación que las variables bajo estudio tienen se calcula el coeficiente de correlación lineal, expresión (4.11).

R= En este ejemplo:

Cov (x,y) Sx Sy

X: Promedio del curso Matemática Básica. Y: Puntaje de la prueba que mide estabilidad emocionalLos cálculos para obtener la covarianza se muestran en la Tabla Nº 4.3, la descuación estándar de cada variable se obtiene mediante la expresión (4.11) de esta Unidad.

140


Estadística Aplicada a la Educación

Tabla Nº 4.3. Cálculos para el ejemplo 4.5 Nº 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total

(y − y)

Xi

Yi

14 12 13 15 12 12 14 12 16 13 14 12 16 13 15 203

34 28 31 39 28 25 39 26 47 35 36 29 50 33 43 523

(y − y)

i

i

0.47 -1.53 -0.53 1.47 -1.53 -1.53 0.47 -1.53 2.47 -0.53 0.47 -1.53 2.47 -0.53 1.47 0.05

-0.87 -6.87 -3.87 4.13 -6.87 -9.87 4.13 -8.87 12.13 0.13 1.13 -5.87 15.13 -1.87 8.13 -0.05

(y − y) (y − y) i

i

-0.4089 10.5111 2.0511 6.0711 10.5111 15.1011 1.9411 13.5711 29.9611 -0.0689 0.5311 8.9811 37.3711 0.9911 11.9511 149.07

Sx= 1.41 Sy= 7.31 Empleando la expresión (4.12) se calcula el valor de la covarianza:

∑ ( x − x )( y − y ) n

Cov(x,y) =

i =1

i

i

n

=

149.07 = 9.94 15

Entonces el coeficiente de de correlación lineal, empleando la expresión (4.11) es:

R=

Cov (x,y) 9.94 9.94 = = = 0.9641 Sx Sy (1.41) * (7.31) 10.31

Regresión y Correlación son dos conceptos vinculados, pero no equivalentes. Regresión se refiere a modelar la variable respuesta en relación a las variables predictoras para evidenciar una relación estructural que nosotros postulamos y para estimar el valor más probable de la respuesta Y para las unidades estadísticas con un perfil particular de valores de las variables predictoras, es decir, la(s) variable(s) predictora(s) y la respuesta y desempeñan roles claramente distintos. En cambio correlación se refiere a que se cuantifica el grado de asociación que existe entre un par de variables cuantitativas

141


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

EJERCICIOS PROPUESTOS 4.1 En un estudio se desea determinar la relación que existe entre la actitud hacia le curso de Estadística Básica y el Rendimiento en el mismo. Para tal efecto los responsables del estudio han aplicado dos pruebas uno que mide la actitud hacia esta asignatura y la otra es una prueba que mide el rendimiento a los alumnos matriculados. Los datos obtenidos son: Alumno

1

2

3

4

5

6

7

8

9

10

Actitud

63

64

65

57

53

48

63

66

66

52

Rendimiento

14

15

16

14

13

12

16

16

15

13

Alumno

11

12

13

14

15

16

17

18

19

20

Actitud

54

55

57

58

55

54

63

61

63

65

Rendimiento

13

12

15

15

16

13

16

15

14

14

Alumno Actitud

21 58

22 59

23 60

24 61

25 57

26 55

27 69

28 72

Rendimiento

13

14

16

15

15

12

17

17

Donde: actitud es el puntaje de la prueba de actitud y rendimiento es el puntaje de la prueba de Estadística Básica. 1. Realizar un análisis gráfico del comportamiento de estas dos variables. 2. Cuantificar la relación de estas dos variables. 3. Emplear el análisis de regresión lineal simple para representar la relación de ambas variables. 5. Evaluar la ecuación de regresión obtenida. 4.2. Los puntajes de la prueba que mide comprensión lectora y razonamiento matemático obtenido de una muestra de 40 alumnos del quinto año de primaria es:

142

Alumno CL RM

1 48 36

2 46 35

3 48 34

4 50 34

5 43 33

6 46 35

7 40 34

8 54 35

9 57 37

10 46 35

Alumno CL RM

11 42 35

12 48 34

13 49 35

14 50 36

15 42 34

16 38 33

17 33 32

18 48 36

19 51 36

20 51 35


Estadística Aplicada a la Educación

Alumno CL RM

21 37 33

22 39 33

23 40 34

24 42 35

25 43 35

26 40 36

27 39 33

28 48 36

29 41 35

30 54 39

Alumno CL RM

31 57 37

32 45 32

33 48 40

34 48 36

35 49 35

36 42 34

37 38 31

38 33 32

39 48 36

40 51 39

Para analizar estos datos justificar que tipo de análisis va a realizar: 1. Análisis de Regresión Lineal Simple. 2. Análisis de Correlación Lineal. 3. Ambos análisis. Según sea la respuesta conveniente para este caso interprete los cálculos y gráficos adecuados. 4.3. La comprensión lectora en alumnos del tercer grado de secundaria, se va a estudiar en relación a número de horas que asiste semanalmente a la biblioteca de su escuela, para leer textos distintos a los empleados en el aula de clases. Los datos obtenidos de una muestra de 21 alumnos son: Nº CL H

1 2 12

2 3 10

3 1 9

Nº CL H

12 0 11

13 4 15

14 3 9

4 4 10 15 5 11

5 5 13 16 3 12

6 0 9 17 1 10

7 5 14 18 4 12

8 3 13 19 2 12

9 1 8

10 4 11 20 3 11

11 2 9

21 5 12

Siendo: CL: Puntaje de la Prueba que mide comprensión lectora. H: Número de horas que asiste semanalmente a la biblioteca de su escuela, para leer textos distintos a los empleados en el aula de clases Analizar si ambas variables guardan alguna relación, si es así resumir el comportamiento conjunto de ambas variables. ¿Es posible predecir el puntaje de comprensión lectora a partir del número de número de horas que asiste semanalmente a la biblioteca de su escuela, para leer textos distintos a los empleados en el aula de clases?

143


Programa de Licenciatura para Profesores sin Título Pedagógico en Lengua Extranjera

BIBLIOGRAFÍA IMPRESA Amau, Grass, Jaime (1978): Métodos de Investigación en las Ciencias Humanas. Omega S.A. España. Amau, Grass, Jaime (1991): Diseños Experimentales en Psicología y Educación. Vol 1. Trillas. México. Festinger, León y Katz, Daniel (1992): Los Métodos de Investigación en Ciencias Sociales. Paidos. España Glass V., Gene y Stanley C., Julián (1986): Métodos Estadísticos Aplicados a las Ciencias Sociales. Prentice Hall. México. Hernández S. R., Fernández C. C y Baptista L. P. (1999): Metodología de la Investigación. Ed. McGraw-Hill. México. Hopkins, Keneeth D., Hopkins, B.R. y Glass Gene, V. (1997): Estadística Básica para las Ciencias Sociales y del Comportamiento. Prentice Hall. México.* Murillo Alfaro, Félix (2002): Análisis Estadístico y Uso de base de Datos con SPSS. Ediciones y Distribución INFO XXI. Lima. Perú. Nolberto, Violeta y Ponce, Estela (2008): Estadística Inferencial Aplicada. UPG de la Facultad de Educación de la Universidad Nacional Mayor de San Marcos. Textos de la Maestría en Educación. Lima. Papua, Jorge (1993): Técnicas de Investigación Aplicadas a las Ciencias Sociales. Fondo de Cultura Económica. México. Rodrígues, Aroldo (1980): Investigación Experimental en Psicología y Educación. Trillas. México. Sierra Bravo, R. (1991): Diccionario Práctico de Estadística. Paraninfo S.A. Madrid. Sierra Bravo, R. (1992): Técnicas de Investigación Social, Teoría y Ejercicios. Paraninfo S.A. Madrid. Solanas Antonio, Salafranca Lluìs, Fauquet Jordi, Nuñez M. Isabel. (2005): Estadística Descriptiva en Ciencias del Comportamiento. Thomson. Madrid. España. Visauta, B. (1997). Análisis estadístico con SPSS para Windows. Estadística Básica. Madrid: McGraw Hill.

144


Estadística Aplicada a la Educación

BIBLIOGRAFÍA DIGITAL http://es.wikiversity.org/wiki/Unidad_I:_Estad%C3%ADstica_b%C3%A1sica (13/04/09). http://www.educarchile.cl/Portal.Base/Web/VerContenido.aspx?ID=195815 (13/04/09) http://www.minedu.gob.pe/normatividad/directivas/DIR177-2006-DM-SPE.pdf (13/04/09) http://hdl.handle.net/10017/1200 (14/04/09) bvs.sld.cu/revistas/ems/vol20_2_06/ems08206.htm (14/04/09) www.usb.edu.mx/investigacion/cif/proyectos/proyecto3/habilidades.doc (14/04/09) www.amstat.org www.oeiperu.org www.unesco.org

145


CEPREDIM

SE TERMINÓ DE IMPRIMIR 2009

EN EL MES DE JUNIO DE

EN LOS TALLERES GRÁFICOS DEL

CENTRO DE PRODUCCIÓN EDITORIAL E IMPRENTA DE LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS JR. PARURO 119. LIMA 1. TELÉFONO: 619-7000 ANEXOS: 6009, 6011, 6015 / FAX: 6016 E-MAIL: VENTAS.CEPREDIM@GMAIL.COM TIRAJE: 1000 EJEMPLARES


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.