ornadas de introducción a la investigación estadística

Page 1

ESTADÍSTICA BREVE INTRODUCCIÓN PARA DOCENTES

COORDINACIÓN 2012 LICEO N° 2 HÉCTOR MIRANDA

PROF. TERESITA FUSTER BARDIER


2

OBJETIVOS El objetivo principal del curso es mostrar a los colegas docentes una breve introducci贸n a la Estad铆stica, algunas de sus aplicaciones relacionadas con el trabajo diario del docente, formas de presentar los datos ya procesados y la lectura de los mismos.


3

CONTENIDO DEL CURSO  Estadística:

qué es, para qué sirve, cómo pueden usarla los docentes.  Investigación estadística  Datos estadísticos: formas de recolección.  Variables estadísticas  Variables de resumen  Gráficos y tablas: construcción y lectura


4

DEFINICIÓN Es la ciencia que tiene por objeto la recolección, la organización, el análisis y la presentación de datos, con el fin de brindar información que facilite la toma de decisiones.


5

APLICACIONES (ejemplos) Recopilación de datos de los alumnos, análisis de los mismos y toma de decisiones a nivel grupal e individual.  Prueba diagnóstica  Análisis comparativo de escritos o pruebas, ya sea dentro del grupo o entre diferentes grupos.  Análisis de los datos de promoción, relacionarlos (si es posible) con otros datos de los alumnos y análisis comparativos. Recordar que todos estos ejemplos deben utilizarse como base para otros análisis y tomas de decisiones y no como un fin en sí mismos. 


6

INVESTIGACION ESTADÍSTICA  Objetivos

de la investigación.  Pregunta problema.  Hipótesis (si la hubiera).  ¿Investigación cualitativa o cuantitativa?  Determinación de la forma de recoger los datos.  Determinación del tipo de formulario a emplear.


7

INVESTIGACIÓN CUANTITATIVA  Plan

de tabulados (de acuerdo al objetivo planteado).  Determinación de las preguntas a incluir (para cumplir con el plan de tabulados).  Recogida de datos (trabajo de campo).  Introducción, depuración y análisis de los datos.  Publicación de resultados.


8

CONCEPTOS BÁSICOS  Población:

Una población finita (o simplemente población) es un conjunto finito de elementos. O sea, puede determinarse sin ambigüedad si un elemento pertenece o no al conjunto. Denominaremos población objetivo, a la población finita sobre la cual deseamos obtener alguna información estadística.  Muestra: Es un subconjunto de la población: no tenemos los datos totales de la población, sino solamente de una parte de ella. En estos casos, las conclusiones extraídas de estos datos pueden extenderse o no a la población dependiendo de cómo se haya extraído la muestra.


9

RECOLECCIÓN DE DATOS Registros

administrativos

Censos

Encuestas

por muestreo


10

RECOLECCIÓN DE DATOS  REGISTROS

ADMINISTRATIVOS: son datos que fueron recolectados con fines no estadísticos, pero que pueden ser una base para el análisis estadístico.

 CENSOS:

los datos se recogen directamente con finalidad estadística. Se aplica el cuestionario a toda la población objetivo.


11

RECOLECCIÓN DE DATOS  ENCUESTAS:

las encuestas también se aplican con fines estadísticos. La diferencia con el censo es que se recolectan datos de una porción de la población.  ENCUESTAS

POR

MUESTREO

ALEATORIO:

tienen detrás un diseño de muestreo que permite expandir eficazmente sus resultados al total de la población.

 ENCUESTAS

POR MUESTREO NO ALEATORIO:

no tienen un diseño muestral detrás. Sus resultados no pueden generalizarse al total poblacional.


12

VARIABLES ALEATORIAS

Una variable es cualquier dato sujeto a medida o cuenta. Es aleatoria si no se puede predecir su valor. Ejemplos:  La hora de salida del sol cada día no es una variable aleatoria, ya que los astrónomos saben de antemano la hora exacta de la misma para cada día del año.  La cantidad de lluvia caída durante un período específico sí es una variable aleatoria, ya que no puede predecirse.  También son variables aleatorias:  

La cantidad de alumnos inscriptos en cada liceo determinado año. El número de alumnos que promueven el curso.


13

VARIABLES ALEATORIAS  Cualitativas:

También se llaman categóricas. Los datos están divididos en clases o categorías. Por ejemplo: sexo del alumno, orientación, etc.

 Pueden

clasificarse en:

 Nominales:

las categorías no siguen ningún ordenamiento. Ejemplo: sexo, barrio en el que vive el alumno.

 Ordinales:

las categorías presentan cierto orden lógico. Ejemplo, preguntas de opinión cuya valoración es Bueno, Regular, Malo.


14

VARIABLES ALEATORIAS  Cuantitativas:

Son datos numéricos. Se clasifican

en:  Discretas: son aquellos datos que se pueden contar o numerar. Ejemplos: edad del alumno, cantidad de alumnos matriculados en cada clase; cantidad de profesores de Matemática; cantidad de horas libres que tiene el Liceo por día.  Continuas: datos numéricos que pueden tomar cualquier valor (en general, entre ciertos límites). Por ejemplo: salario por hora docente en el tiempo o en diferentes grados; altura y peso de una persona.


15

ESTADÍSTICA DESCRIPTIVA DISTRIBUCIONES UNIVARIADAS Distribución de frecuencia y frecuencia acumulada La frecuencia de una variable (ya sea discreta o cualitativa) es la cantidad de veces que el dato se repite. Normalmente los datos se presentan agrupados según una tabla de frecuencias, que puede contener frecuencias absolutas (número de casos) o frecuencias relativas (porcentajes). Si la variable es ordinal o cuantitativa puede presentarse una distribución de frecuencia que acumula cantidades desde la menor a la mayor.


16

ESTADÍSTICA DESCRIPTIVA 

El siguiente ejemplo corresponde a respuestas a la pregunta sobre la opinión del estudiante sobre Matemática, recogida en la prueba diagnóstica 2011 de 3 grupos de 5° año.

Opinión sobre Matemática No me gusta Me disgusta algo Ni me gusta ni me disgusta Me gusta algo Me gusta mucho Total

Frecuencia absoluta

Frecuencia relativa

Frecuencia acumulada

2 2

3,17 3,17

3,17 6,35

12 29 18 63

19,05 46,03 28,57 100

25,40 71,43 100,00


17

GRAFICAS UNIVARIADAS El

tipo de gráfica depende de la variable con la cual se está trabajando:  Variables

cualitativas: gráficas de barras, gráficas de torta o circulares.  Variables cuantitativas discretas: histogramas, gráficas de puntos.  Variables cuantitativas continuas: gráficas de puntos.


18

Gráficas de barras Siguiendo el ejemplo anterior: número de alumnos por opinión sobre Matemática Número de alumnos 35 30 25 20 15

10 5 0

No me gusta

Me disgusta algo

Ni me gusta ni Me gusta algo me disgusta

Me gusta mucho


19

Gr谩ficas circulares Para los alumnos que realizaron la misma prueba diagn贸stica. La variable utilizada es el sexo de los alumnos. Total de alumnos

Femenino Masculino


20

Histogramas Siguiendo el ejemplo visto anteriormente, la variable es la edad de los alumnos en a単os cumplidos al momento de la prueba. Numero de alumnos 45 40 35 30

25 20 15 10 5 0

15

16

17

18

19


21

Gráficas de puntos En el mismo ejemplo anterior, la gráfica representa el número de alumnos según la edad. N° de alumnos 45 40 35 30

25 20 15 10 5

0

14

15

16

17

18

19

20


22

MEDIDAS DE RESUMEN  Se

tratan de medidas que ofrecen un resumen de la distribución de los datos, con la menor pérdida de información posible.

 Se

utilizan también para comparar distribuciones distintas de la misma variable (diferencia temporal o geográfica, por ejemplo)

 Se

consideran dos tipos de variables de resumen: las medidas de tendencia central (o de posición y las medidas de dispersión.


23

Variables cualitativas  El

único resumen que puede darse es la variable de tendencia central llamada MODO (o Moda)  Representa el o los valores de la variable con mayor frecuencia.  Por

ejemplo, en los casos vistos anteriormente :  Opinión sobre Matemática: el modo es “Me gusta algo”  Sexo de los alumnos: el modo es: “Femenino”


24

Variables cualitativas  Medidas

de tendencia central:

 Modo  Media  Medidas

de posición:

 Percentiles

o cuantiles  Cuartiles, quintiles, deciles  Medidas

de dispersión:

 Rango

 Varianza

(o variancia)  Desvío (o desviación) estándar (o típica)


25

Variables cuantitativas Tendencia central: modo ď‚› Modo:

valor o valores de la variable que tiene la mayor frecuencia. ď‚› En

16.

el ejemplo de las edades de los alumnos, el modo es


26

Variables cuantitativas Tendencia central: media ď‚›


27

Variables cuantitativas Tendencia central: media  Variable

agrupada por frecuencia

Edad 15 16 17 18 19 Total

N° de alumnos 5 40 12 4 2 63

Edad*N° alumnos 75 640 204 72 38 1029


28

Variables cuantitativas Medidas de posición 

Indican el valor de la distribución de la variable ordenada que ocupa el lugar indicado. Por ejemplo: 

 

Cuartiles: el primer cuartil es el valor de la variable que deja al 25% de la distribución con valores menores. El segundo cuartil (o mediana) es el valor de la variable que ocupa el medio de la distribución ordenada. El tercer cuartil deja el 75% de la distribución de la variable con valores menores. Quintiles: la distribución de la variable ordenada se separa en 5 grupos de igual tamaño. Deciles: idem con 10 grupos de igual tamaño. Cuantiles o percentiles: lo mismo, con 100 grupos de igual tamaño.


29

Variables cuantitativas Medidas de posiciĂłn ď‚› Ejemplo:

se tienen las edades de 13 alumnos. Se ordenan de menor a mayor. 14, 14, 15, 15, 15, 15, 16, 16, 16, 16, 17, 17, 18

En este caso la mediana es 16 ya que hay 6 alumnos con edades menores y 6 alumnos con edades mayores


30

Variables cuantitativas Medidas de dispersi贸n

El siguiente ejemplo muestra las notas obtenidas por 10 alumnos de 3 grupos distintos en un escrito: Grupo 1 6 6 6 6 6 6 6 6 6 6

Grupo 2 5 5 5 6 6 6 6 7 7 7

Grupo 3 1 2 3 4 5 7 8 9 10 11

En los tres casos, la media es 6


31

Variables cuantitativas Medidas de dispersi贸n

Las gr谩ficas correspondientes son: Grupo 1

Grupo 2

8

8

6

6

4

4

2

2

0

0 1

2

3

4

5

6

7

8

9

1

10

2

3

4

Grupo 3 12 10 8 6 4 2 0 1

2

3

4

5

6

7

8

9

10

5

6

7

8

9

10


32

Variables cuantitativas

Medidas de dispersión: Rango  Se define el rango como la diferencia entre el mayor valor que toma la variable en esa distribución y el menor valor de esa variable.  En

los ejemplos de escritos vistos:

 En

el primer caso el rango es: 6 – 6 = 0

 En

el segundo grupo es: 7 – 5 = 2

 En

el grupo 3, el rango es: 11 – 1 = 10

 Puede

observarse que el tercer grupo es el “más desparejo” de los tres (los valores de la variable tienen mayor dispersión)


33

Variables cuantitativas Medidas de dispersión: varianza  La

varianza puede definirse como un promedio de la diferencia al cuadrado entre los valores que toma la variable y la media de la distribución. Esta diferencia debe considerarse al cuadrado porque, por la propia definición de la media, sería siempre 0.


34

Variables cuantitativas Medidas de dispersiĂłn: varianza ď‚›

Nota 1 2 3 4 5 7 8 9 10 11 Suma

Nota - media (Nota - media)^2 -5 25 -4 16 -3 9 -2 4 -1 1 1 1 2 4 3 9 4 16 5 25 0 110


35

Variables cuantitativas

Medidas de dispersión: desvío estándar 

 

Para el cálculo de la varianza, se eleva la diferencia con la media al cuadrado, por lo que la unidad de medida que se está usando también queda elevada al cuadrado. Si se quiere considerar la unidad de medida original, se calcula la raíz cuadrada de la varianza. A este valor se le llama desvío estándar, desviación estándar o desvío típico. En el caso visto anteriormente, el desvío estándar es 3,49. Esto significa que, en promedio, las notas obtenidas en los escritos de desvían 3,49 unidades de la media.


36

Diagrama de caja y bigotes • El cuerpo de la caja muestra el recorrido intercuartílico (RIC) (entre el primer y el tercer cuartil) • La línea en la caja muestra la mediana. • Los “bigotes” se encuentran a 1,5 RIC de los bordes de la caja. • Los valores que quedan fuera de este rango se denominan atípicos (outliers) • Es un diagrama muy útil para comparar distribuciones, ya que muestra también la dispersión de las mismas.


37

Diagrama de caja Diagrama de caja que representa la nota obtenida por los alumnos de 5°B1 y 5°B2 (2012) en la Prueba Diagnóstica de puntaje máximo 30. El número 18 corresponde al orden del alumno que tuvo el máximo puntaje (la nota se observa en los valores del eje)


38

Otras medidas de resumen: tasas  Las

tasas o ratios son cocientes entre cantidades específicas de una variable o de dos variables. Se calcula en general como el total de veces que se presenta el fenómeno estudiado sobre el total poblacional.  Como ejemplo se verán las tasas de escolarización bruta y la tasa de escolarización neta. 

Las definiciones y cuadros siguientes fueron extraídos del Observatorio de la Educación de ANEP.


39

Tasas de escolarización. La tasa bruta de escolarización (TBE) se calcula como el número total de alumnos de cualquier edad matriculados en un determinado nivel de enseñanza, expresado en porcentaje de la población del grupo en edad oficial de cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial, 6 a 11 años para educación primaria, 12 a 17 años para educación media general, 12 a 14 años para ciclo básico de educación media, 15 a 17 años para segundo ciclo de educación media y 18 a 24 años para educación terciaria). Los alumnos matriculados surgen de los registros estadísticos de cada uno de los subsistemas. La población en edad oficial (o teórica) surge de las proyecciones al 30 de junio de cada año realizadas por el Instituto Nacional de Estadística.


40

Tasa bruta de escolarización 2000

2001

2002

2003

AÑO 2004 2005

TOTAL EDUCACIÓN MEDIA Pública Secundaria CETP Privada

94,5 83,4 64,9 18,4 11,1

97,8 86,7 68,4 18,3 11,0

103,2 92,2 73,2 19,0 11,0

107,0 96,3 76,0 20,3 10,7

105,7 94,7 74,3 20,4 11,0

102,6 91,3 71,9 19,4 11,3

102,4 91,0 70,6 20,5 11,4

100,1 88,6 68,1 20,5 11,5

101,7 89,3 69,1 20,2 12,4

103,4 90,6 70,1 20,5 12,8

102,4 89,6 70,0 19,6 12,8

Total ciclo básico Pública Secundaria CETP Privada

93,9 80,3 71,3 9,0 13,6

97,0 83,5 74,7 8,8 13,5

100,5 87,4 78,4 9,0 13,1

101,8 89,4 79,9 9,5 12,4

100,4 87,7 78,1 9,6 12,7

98,0 85,5 75,8 9,7 12,6

98,7 85,7 75,9 9,8 13,1

98,3 85,1 75,2 9,9 13,2

104,4 89,7 79,0 10,8 14,7

107,4 92,0 80,1 11,9 15,4

108,0 92,5 80,2 12,3 15,4

Total segundo ciclo Pública Secundaria CETP Privada

82,3 73,6 58,5 15,2 8,6

86,0 77,4 62,0 15,4 8,5

93,3 84,5 68,0 16,5 8,8

98,7 89,7 72,0 17,7 8,9

98,0 88,8 70,5 18,3 9,2

95,9 85,8 67,9 17,9 10,1

94,1 84,4 65,1 19,3 9,7

90,5 80,6 60,8 19,8 9,9

88,6 78,6 59,0 19,6 10,0

90,8 80,6 59,8 20,8 10,1

90,7 80,6 59,7 20,9 10,1

Fuente: Observatorio de la Educación - ANEP

2006

2007

2008

2009

2010


41

Tasa neta de escolarización La tasa neta de escolarización (TNE) se calcula como el número total de alumnos de edad oficial para el nivel, matriculados en un determinado nivel de enseñanza, expresado en porcentaje de la población del grupo en edad oficial de cursar ese nivel (3 a 5 o 4 a 5 años para educación inicial, 6 a 11 años para educación primaria, 12 a 17 años para educación media general, 12 a 14 años para ciclo básico de educación media, 15 a 17 años para segundo ciclo de educación media y 18 a 24 años para educación terciaria).


42

DISTRIBUCIONES MULTIVARIADAS 

 

En la mayoría de los estudios estadísticos no alcanza con estudiar la distribución de una variables, sino que es necesario su vinculación con otras, por ejemplo, involucrando variables demográficas (edad y sexo principalmente), variables económicas o variables temporales. Estas vinculaciones dan mayor riqueza al análisis y a la comprensión del fenómeno que se está estudiando. Como ejemplo, se verán cuadros y gráficas que involucren más de una variable. No es conveniente usar más de tres variables en un cuadro y siempre que, al menos una de ellas, tenga pocas categorías. De lo contrario, se tendrán cuadros inmanejables por su tamaño.


43

Cuadros con dos variables: valores absolutos 

Distribución de alumnos de 1° Bachillerato por sexo según grupo (año 2011 Liceo Miranda) Grupo Total 1 2 3 4 5 6 7 8 9

Total 312 32 35 35 36 34 35 35 36 34

Sexo Femenino 180 20 20 23 17 19 23 19 19 20

Masculino 132 12 15 12 19 15 12 16 17 14


44

Cuadros con dos variables: valores relativos 

En estos casos se pueden presentar tres tipos de tablas, dependiendo de cuál es la referencia considerada: 

Porcentajes de columnas (en el caso anterior, el total es la cantidad de casos femeninos y se consideran porcentajes de cada grupo, lo mismo para el total masculino y el general). Porcentajes de filas (el total es el número de alumnos de cada grupo y se calculan los porcentajes de casos femeninos y masculinos) Porcentajes de tabla (el total es el número total de alumnos y se calculan los porcentajes de cada una de las casillas, o sea, qué porcentaje del total de alumnos son chicas de 4°1, etc.)


45

Cuadro con tres variables: valores absolutos Edad Total

15

16

17

18 y mรกs

Sexo Total Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total Femenino Masculino

Total 54 37 17 6 6 0 37 22 15 6 5 1 5 4 1

Resultado de Matemรกtica (2011) Aprobado Por examen Pendiente Repite o recursa 37 7 7 3 26 5 4 2 11 2 3 1 6 0 0 0 6 0 0 0 0 0 0 0 27 7 3 0 16 5 1 0 11 2 2 0 2 0 2 2 2 0 2 1 0 0 0 1 2 0 2 1 2 0 1 1 0 0 1 0


46

Gráficas con dos variables Distribución de alumnos por sexo según grupo (Primer año bachillerato, Liceo Miranda, año 2011) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% Total

1

2

3

4

Sexo Femenino

5

6

7

Sexo Masculino

8

9


47

Gráficas con dos variables Distribución de alumnos por sexo, según fallo reunión final de profesores (Primer año bachillerato, Liceo Miranda, año 2011) 200 180 160 140 120 100

Femenino

80

Masculino

60 40 20 0 Total

Promovido

Fallo en suspenso

Fallo reunión final de profesores

Repite


48

Gráficas con dos variables: usos de escala  En

el siguiente ejemplo se observará como el cambio de escala en los ejes de la gráfica influye en la interpretación de la observación.

Valor nominal mensual de la hora docente (efectivos e interinos titulados, tiempo extendido, segundo ciclo) según grado. Salario Grado Nominal 1 704 2 739 3 773 4 815 5 868 6 925 7 987

Diferencia porcentual 4,97 4,60 5,43 6,50 6,57 6,70


49

GrĂĄficas con dos variables: usos de escala Salario nominal por hora, segĂşn grado 1000 900 800 700 600 500 400 300 200

100 0 1

2

3

4

5

6

7


50

GrĂĄficas con dos variables: usos de escala Salario nominal por hora, segĂşn grado 1000 950 900 850 800 750

700 650 1

2

3

4

5

6

7


51

Propuestas finales  Se

propone que el conjunto de los docentes decidan un tema a investigar durante el año lectivo, de manera que sus conclusiones sean de utilidad a la comunidad educativa.  Este tema puede involucrar solo uno de los niveles, ser general para el liceo o incluso, involucrar los liceos de donde provienen la mayoría de nuestros alumnos.


52

MUCHAS GRACIAS POR SU ATENCIÓN. ESPERO QUE ESTAS JORNADAS HAYAS SIDO DE INTERÉS PARA TODOS Y PUEDAN SER DE UTILIDAD PARA MEJORAR LOS PROCESOS EDUCATIVOS.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.