ESTADÍSTICA BREVE INTRODUCCIÓN PARA DOCENTES
COORDINACIÓN 2012 LICEO N° 2 HÉCTOR MIRANDA
PROF. TERESITA FUSTER BARDIER
2
OBJETIVOS El objetivo principal del curso es mostrar a los colegas docentes una breve introducci贸n a la Estad铆stica, algunas de sus aplicaciones relacionadas con el trabajo diario del docente, formas de presentar los datos ya procesados y la lectura de los mismos.
3
CONTENIDO DEL CURSO Estadística:
qué es, para qué sirve, cómo pueden usarla los docentes. Investigación estadística Datos estadísticos: formas de recolección. Variables estadísticas Variables de resumen Gráficos y tablas: construcción y lectura
4
DEFINICIÓN Es la ciencia que tiene por objeto la recolección, la organización, el análisis y la presentación de datos, con el fin de brindar información que facilite la toma de decisiones.
5
APLICACIONES (ejemplos) Recopilación de datos de los alumnos, análisis de los mismos y toma de decisiones a nivel grupal e individual. Prueba diagnóstica Análisis comparativo de escritos o pruebas, ya sea dentro del grupo o entre diferentes grupos. Análisis de los datos de promoción, relacionarlos (si es posible) con otros datos de los alumnos y análisis comparativos. Recordar que todos estos ejemplos deben utilizarse como base para otros análisis y tomas de decisiones y no como un fin en sí mismos.
6
INVESTIGACION ESTADÍSTICA Objetivos
de la investigación. Pregunta problema. Hipótesis (si la hubiera). ¿Investigación cualitativa o cuantitativa? Determinación de la forma de recoger los datos. Determinación del tipo de formulario a emplear.
7
INVESTIGACIÓN CUANTITATIVA Plan
de tabulados (de acuerdo al objetivo planteado). Determinación de las preguntas a incluir (para cumplir con el plan de tabulados). Recogida de datos (trabajo de campo). Introducción, depuración y análisis de los datos. Publicación de resultados.
8
CONCEPTOS BÁSICOS Población:
Una población finita (o simplemente población) es un conjunto finito de elementos. O sea, puede determinarse sin ambigüedad si un elemento pertenece o no al conjunto. Denominaremos población objetivo, a la población finita sobre la cual deseamos obtener alguna información estadística. Muestra: Es un subconjunto de la población: no tenemos los datos totales de la población, sino solamente de una parte de ella. En estos casos, las conclusiones extraídas de estos datos pueden extenderse o no a la población dependiendo de cómo se haya extraído la muestra.
9
RECOLECCIÓN DE DATOS Registros
administrativos
Censos
Encuestas
por muestreo
10
RECOLECCIÓN DE DATOS REGISTROS
ADMINISTRATIVOS: son datos que fueron recolectados con fines no estadísticos, pero que pueden ser una base para el análisis estadístico.
CENSOS:
los datos se recogen directamente con finalidad estadística. Se aplica el cuestionario a toda la población objetivo.
11
RECOLECCIÓN DE DATOS ENCUESTAS:
las encuestas también se aplican con fines estadísticos. La diferencia con el censo es que se recolectan datos de una porción de la población. ENCUESTAS
POR
MUESTREO
ALEATORIO:
tienen detrás un diseño de muestreo que permite expandir eficazmente sus resultados al total de la población.
ENCUESTAS
POR MUESTREO NO ALEATORIO:
no tienen un diseño muestral detrás. Sus resultados no pueden generalizarse al total poblacional.
12
VARIABLES ALEATORIAS
Una variable es cualquier dato sujeto a medida o cuenta. Es aleatoria si no se puede predecir su valor. Ejemplos: La hora de salida del sol cada día no es una variable aleatoria, ya que los astrónomos saben de antemano la hora exacta de la misma para cada día del año. La cantidad de lluvia caída durante un período específico sí es una variable aleatoria, ya que no puede predecirse. También son variables aleatorias:
La cantidad de alumnos inscriptos en cada liceo determinado año. El número de alumnos que promueven el curso.
13
VARIABLES ALEATORIAS Cualitativas:
También se llaman categóricas. Los datos están divididos en clases o categorías. Por ejemplo: sexo del alumno, orientación, etc.
Pueden
clasificarse en:
Nominales:
las categorías no siguen ningún ordenamiento. Ejemplo: sexo, barrio en el que vive el alumno.
Ordinales:
las categorías presentan cierto orden lógico. Ejemplo, preguntas de opinión cuya valoración es Bueno, Regular, Malo.
14
VARIABLES ALEATORIAS Cuantitativas:
Son datos numéricos. Se clasifican
en: Discretas: son aquellos datos que se pueden contar o numerar. Ejemplos: edad del alumno, cantidad de alumnos matriculados en cada clase; cantidad de profesores de Matemática; cantidad de horas libres que tiene el Liceo por día. Continuas: datos numéricos que pueden tomar cualquier valor (en general, entre ciertos límites). Por ejemplo: salario por hora docente en el tiempo o en diferentes grados; altura y peso de una persona.
15
ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES UNIVARIADAS Distribución de frecuencia y frecuencia acumulada La frecuencia de una variable (ya sea discreta o cualitativa) es la cantidad de veces que el dato se repite. Normalmente los datos se presentan agrupados según una tabla de frecuencias, que puede contener frecuencias absolutas (número de casos) o frecuencias relativas (porcentajes). Si la variable es ordinal o cuantitativa puede presentarse una distribución de frecuencia que acumula cantidades desde la menor a la mayor.
16
ESTADÍSTICA DESCRIPTIVA
El siguiente ejemplo corresponde a respuestas a la pregunta sobre la opinión del estudiante sobre Matemática, recogida en la prueba diagnóstica 2011 de 3 grupos de 5° año.
Opinión sobre Matemática No me gusta Me disgusta algo Ni me gusta ni me disgusta Me gusta algo Me gusta mucho Total
Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
2 2
3,17 3,17
3,17 6,35
12 29 18 63
19,05 46,03 28,57 100
25,40 71,43 100,00
17
GRAFICAS UNIVARIADAS El
tipo de gráfica depende de la variable con la cual se está trabajando: Variables
cualitativas: gráficas de barras, gráficas de torta o circulares. Variables cuantitativas discretas: histogramas, gráficas de puntos. Variables cuantitativas continuas: gráficas de puntos.
18
Gráficas de barras Siguiendo el ejemplo anterior: número de alumnos por opinión sobre Matemática Número de alumnos 35 30 25 20 15
10 5 0
No me gusta
Me disgusta algo
Ni me gusta ni Me gusta algo me disgusta
Me gusta mucho
19
Gr谩ficas circulares Para los alumnos que realizaron la misma prueba diagn贸stica. La variable utilizada es el sexo de los alumnos. Total de alumnos
Femenino Masculino
20
Histogramas Siguiendo el ejemplo visto anteriormente, la variable es la edad de los alumnos en a単os cumplidos al momento de la prueba. Numero de alumnos 45 40 35 30
25 20 15 10 5 0
15
16
17
18
19
21
Gráficas de puntos En el mismo ejemplo anterior, la gráfica representa el número de alumnos según la edad. N° de alumnos 45 40 35 30
25 20 15 10 5
0
14
15
16
17
18
19
20
22
MEDIDAS DE RESUMEN Se
tratan de medidas que ofrecen un resumen de la distribución de los datos, con la menor pérdida de información posible.
Se
utilizan también para comparar distribuciones distintas de la misma variable (diferencia temporal o geográfica, por ejemplo)
Se
consideran dos tipos de variables de resumen: las medidas de tendencia central (o de posición y las medidas de dispersión.
23
Variables cualitativas El
único resumen que puede darse es la variable de tendencia central llamada MODO (o Moda) Representa el o los valores de la variable con mayor frecuencia. Por
ejemplo, en los casos vistos anteriormente : Opinión sobre Matemática: el modo es “Me gusta algo” Sexo de los alumnos: el modo es: “Femenino”
24
Variables cualitativas Medidas
de tendencia central:
Modo Media Medidas
de posición:
Percentiles
o cuantiles Cuartiles, quintiles, deciles Medidas
de dispersión:
Rango
Varianza
(o variancia) Desvío (o desviación) estándar (o típica)
25
Variables cuantitativas Tendencia central: modo ď‚› Modo:
valor o valores de la variable que tiene la mayor frecuencia. ď‚› En
16.
el ejemplo de las edades de los alumnos, el modo es
26
Variables cuantitativas Tendencia central: media ď‚›
27
Variables cuantitativas Tendencia central: media Variable
agrupada por frecuencia
Edad 15 16 17 18 19 Total
N° de alumnos 5 40 12 4 2 63
Edad*N° alumnos 75 640 204 72 38 1029
28
Variables cuantitativas Medidas de posición
Indican el valor de la distribución de la variable ordenada que ocupa el lugar indicado. Por ejemplo:
Cuartiles: el primer cuartil es el valor de la variable que deja al 25% de la distribución con valores menores. El segundo cuartil (o mediana) es el valor de la variable que ocupa el medio de la distribución ordenada. El tercer cuartil deja el 75% de la distribución de la variable con valores menores. Quintiles: la distribución de la variable ordenada se separa en 5 grupos de igual tamaño. Deciles: idem con 10 grupos de igual tamaño. Cuantiles o percentiles: lo mismo, con 100 grupos de igual tamaño.
29
Variables cuantitativas Medidas de posiciĂłn ď‚› Ejemplo:
se tienen las edades de 13 alumnos. Se ordenan de menor a mayor. 14, 14, 15, 15, 15, 15, 16, 16, 16, 16, 17, 17, 18
En este caso la mediana es 16 ya que hay 6 alumnos con edades menores y 6 alumnos con edades mayores
30
Variables cuantitativas Medidas de dispersi贸n
El siguiente ejemplo muestra las notas obtenidas por 10 alumnos de 3 grupos distintos en un escrito: Grupo 1 6 6 6 6 6 6 6 6 6 6
Grupo 2 5 5 5 6 6 6 6 7 7 7
Grupo 3 1 2 3 4 5 7 8 9 10 11
En los tres casos, la media es 6
31
Variables cuantitativas Medidas de dispersi贸n
Las gr谩ficas correspondientes son: Grupo 1
Grupo 2
8
8
6
6
4
4
2
2
0
0 1
2
3
4
5
6
7
8
9
1
10
2
3
4
Grupo 3 12 10 8 6 4 2 0 1
2
3
4
5
6
7
8
9
10
5
6
7
8
9
10
32
Variables cuantitativas
Medidas de dispersión: Rango Se define el rango como la diferencia entre el mayor valor que toma la variable en esa distribución y el menor valor de esa variable. En
los ejemplos de escritos vistos:
En
el primer caso el rango es: 6 – 6 = 0
En
el segundo grupo es: 7 – 5 = 2
En
el grupo 3, el rango es: 11 – 1 = 10
Puede
observarse que el tercer grupo es el “más desparejo” de los tres (los valores de la variable tienen mayor dispersión)
33
Variables cuantitativas Medidas de dispersión: varianza La
varianza puede definirse como un promedio de la diferencia al cuadrado entre los valores que toma la variable y la media de la distribución. Esta diferencia debe considerarse al cuadrado porque, por la propia definición de la media, sería siempre 0.
34
Variables cuantitativas Medidas de dispersiĂłn: varianza ď‚›
Nota 1 2 3 4 5 7 8 9 10 11 Suma
Nota - media (Nota - media)^2 -5 25 -4 16 -3 9 -2 4 -1 1 1 1 2 4 3 9 4 16 5 25 0 110
35
Variables cuantitativas
Medidas de dispersión: desvío estándar
Para el cálculo de la varianza, se eleva la diferencia con la media al cuadrado, por lo que la unidad de medida que se está usando también queda elevada al cuadrado. Si se quiere considerar la unidad de medida original, se calcula la raíz cuadrada de la varianza. A este valor se le llama desvío estándar, desviación estándar o desvío típico. En el caso visto anteriormente, el desvío estándar es 3,49. Esto significa que, en promedio, las notas obtenidas en los escritos de desvían 3,49 unidades de la media.
36
Diagrama de caja y bigotes • El cuerpo de la caja muestra el recorrido intercuartílico (RIC) (entre el primer y el tercer cuartil) • La línea en la caja muestra la mediana. • Los “bigotes” se encuentran a 1,5 RIC de los bordes de la caja. • Los valores que quedan fuera de este rango se denominan atípicos (outliers) • Es un diagrama muy útil para comparar distribuciones, ya que muestra también la dispersión de las mismas.
37
Diagrama de caja Diagrama de caja que representa la nota obtenida por los alumnos de 5°B1 y 5°B2 (2012) en la Prueba Diagnóstica de puntaje máximo 30. El número 18 corresponde al orden del alumno que tuvo el máximo puntaje (la nota se observa en los valores del eje)
38
Otras medidas de resumen: tasas Las
tasas o ratios son cocientes entre cantidades específicas de una variable o de dos variables. Se calcula en general como el total de veces que se presenta el fenómeno estudiado sobre el total poblacional. Como ejemplo se verán las tasas de escolarización bruta y la tasa de escolarización neta.
Las definiciones y cuadros siguientes fueron extraídos del Observatorio de la Educación de ANEP.
39
Tasas de escolarización. La tasa bruta de escolarización (TBE) se calcula como el número total de alumnos de cualquier edad matriculados en un determinado nivel de enseñanza, expresado en porcentaje de la población del grupo en edad oficial de cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial, 6 a 11 años para educación primaria, 12 a 17 años para educación media general, 12 a 14 años para ciclo básico de educación media, 15 a 17 años para segundo ciclo de educación media y 18 a 24 años para educación terciaria). Los alumnos matriculados surgen de los registros estadísticos de cada uno de los subsistemas. La población en edad oficial (o teórica) surge de las proyecciones al 30 de junio de cada año realizadas por el Instituto Nacional de Estadística.
40
Tasa bruta de escolarización 2000
2001
2002
2003
AÑO 2004 2005
TOTAL EDUCACIÓN MEDIA Pública Secundaria CETP Privada
94,5 83,4 64,9 18,4 11,1
97,8 86,7 68,4 18,3 11,0
103,2 92,2 73,2 19,0 11,0
107,0 96,3 76,0 20,3 10,7
105,7 94,7 74,3 20,4 11,0
102,6 91,3 71,9 19,4 11,3
102,4 91,0 70,6 20,5 11,4
100,1 88,6 68,1 20,5 11,5
101,7 89,3 69,1 20,2 12,4
103,4 90,6 70,1 20,5 12,8
102,4 89,6 70,0 19,6 12,8
Total ciclo básico Pública Secundaria CETP Privada
93,9 80,3 71,3 9,0 13,6
97,0 83,5 74,7 8,8 13,5
100,5 87,4 78,4 9,0 13,1
101,8 89,4 79,9 9,5 12,4
100,4 87,7 78,1 9,6 12,7
98,0 85,5 75,8 9,7 12,6
98,7 85,7 75,9 9,8 13,1
98,3 85,1 75,2 9,9 13,2
104,4 89,7 79,0 10,8 14,7
107,4 92,0 80,1 11,9 15,4
108,0 92,5 80,2 12,3 15,4
Total segundo ciclo Pública Secundaria CETP Privada
82,3 73,6 58,5 15,2 8,6
86,0 77,4 62,0 15,4 8,5
93,3 84,5 68,0 16,5 8,8
98,7 89,7 72,0 17,7 8,9
98,0 88,8 70,5 18,3 9,2
95,9 85,8 67,9 17,9 10,1
94,1 84,4 65,1 19,3 9,7
90,5 80,6 60,8 19,8 9,9
88,6 78,6 59,0 19,6 10,0
90,8 80,6 59,8 20,8 10,1
90,7 80,6 59,7 20,9 10,1
Fuente: Observatorio de la Educación - ANEP
2006
2007
2008
2009
2010
41
Tasa neta de escolarización La tasa neta de escolarización (TNE) se calcula como el número total de alumnos de edad oficial para el nivel, matriculados en un determinado nivel de enseñanza, expresado en porcentaje de la población del grupo en edad oficial de cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial, 6 a 11 años para educación primaria, 12 a 17 años para educación media general, 12 a 14 años para ciclo básico de educación media, 15 a 17 años para segundo ciclo de educación media y 18 a 24 años para educación terciaria).
42
DISTRIBUCIONES MULTIVARIADAS
En la mayoría de los estudios estadísticos no alcanza con estudiar la distribución de una variables, sino que es necesario su vinculación con otras, por ejemplo, involucrando variables demográficas (edad y sexo principalmente), variables económicas o variables temporales. Estas vinculaciones dan mayor riqueza al análisis y a la comprensión del fenómeno que se está estudiando. Como ejemplo, se verán cuadros y gráficas que involucren más de una variable. No es conveniente usar más de tres variables en un cuadro y siempre que, al menos una de ellas, tenga pocas categorías. De lo contrario, se tendrán cuadros inmanejables por su tamaño.
43
Cuadros con dos variables: valores absolutos
Distribución de alumnos de 1° Bachillerato por sexo según grupo (año 2011 Liceo Miranda) Grupo Total 1 2 3 4 5 6 7 8 9
Total 312 32 35 35 36 34 35 35 36 34
Sexo Femenino 180 20 20 23 17 19 23 19 19 20
Masculino 132 12 15 12 19 15 12 16 17 14
44
Cuadros con dos variables: valores relativos
En estos casos se pueden presentar tres tipos de tablas, dependiendo de cuál es la referencia considerada:
Porcentajes de columnas (en el caso anterior, el total es la cantidad de casos femeninos y se consideran porcentajes de cada grupo, lo mismo para el total masculino y el general). Porcentajes de filas (el total es el número de alumnos de cada grupo y se calculan los porcentajes de casos femeninos y masculinos) Porcentajes de tabla (el total es el número total de alumnos y se calculan los porcentajes de cada una de las casillas, o sea, qué porcentaje del total de alumnos son chicas de 4°1, etc.)
45
Cuadro con tres variables: valores absolutos Edad Total
15
16
17
18 y mรกs
Sexo Total Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total Femenino Masculino
Total 54 37 17 6 6 0 37 22 15 6 5 1 5 4 1
Resultado de Matemรกtica (2011) Aprobado Por examen Pendiente Repite o recursa 37 7 7 3 26 5 4 2 11 2 3 1 6 0 0 0 6 0 0 0 0 0 0 0 27 7 3 0 16 5 1 0 11 2 2 0 2 0 2 2 2 0 2 1 0 0 0 1 2 0 2 1 2 0 1 1 0 0 1 0
46
Gráficas con dos variables Distribución de alumnos por sexo según grupo (Primer año bachillerato, Liceo Miranda, año 2011) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Total
1
2
3
4
Sexo Femenino
5
6
7
Sexo Masculino
8
9
47
Gráficas con dos variables Distribución de alumnos por sexo, según fallo reunión final de profesores (Primer año bachillerato, Liceo Miranda, año 2011) 200 180 160 140 120 100
Femenino
80
Masculino
60 40 20 0 Total
Promovido
Fallo en suspenso
Fallo reunión final de profesores
Repite
48
Gráficas con dos variables: usos de escala En
el siguiente ejemplo se observará como el cambio de escala en los ejes de la gráfica influye en la interpretación de la observación.
Valor nominal mensual de la hora docente (efectivos e interinos titulados, tiempo extendido, segundo ciclo) según grado. Salario Grado Nominal 1 704 2 739 3 773 4 815 5 868 6 925 7 987
Diferencia porcentual 4,97 4,60 5,43 6,50 6,57 6,70
49
GrĂĄficas con dos variables: usos de escala Salario nominal por hora, segĂşn grado 1000 900 800 700 600 500 400 300 200
100 0 1
2
3
4
5
6
7
50
GrĂĄficas con dos variables: usos de escala Salario nominal por hora, segĂşn grado 1000 950 900 850 800 750
700 650 1
2
3
4
5
6
7
51
Propuestas finales Se
propone que el conjunto de los docentes decidan un tema a investigar durante el año lectivo, de manera que sus conclusiones sean de utilidad a la comunidad educativa. Este tema puede involucrar solo uno de los niveles, ser general para el liceo o incluso, involucrar los liceos de donde provienen la mayoría de nuestros alumnos.
52
MUCHAS GRACIAS POR SU ATENCIÓN. ESPERO QUE ESTAS JORNADAS HAYAS SIDO DE INTERÉS PARA TODOS Y PUEDAN SER DE UTILIDAD PARA MEJORAR LOS PROCESOS EDUCATIVOS.