Instituto de Educación Superior Pedagógico José Jiménez Borja
Módulo de Autoaprendizaje Curso: Matemática IV
Profesor: Angel Mamani Callacondo
Tacna- 2013
Competencias de la Unidad
1. APLICA MÉTODOS Y TÉCNICAS DE ESTADÍSTICA BIVARIADA PARA PLANTEAR Y RESOLVER UN PROBLEMA Identifica variables en la línea de investigación elegida.
UNIDAD II
ESTADÍSTICA BIVARIADA
Competencia
APLICA MÉTODOS Y TÉCNICAS DE ESTADÍSTICA BIVARIADA PARA PLANTEAR Y RESOLVER UN PROBLEMA, DEMOSTRANDO INICIATIVA AL DESARROLLAR UNA PROPUESTA DE INVESTIGACIÓN DE SU ENTORNO EDUCATIVO
Señoritas estudiantes.
Para iniciar con la unidad II es fundamental aplicar dos instrumentos para la recopilar datos acerca de dos variables a fin de que la información obtenida sirva de insumo práctico y real a los contenidos de la presente unidad “Estadística bivariada”.
Entre las variables que propongo a investigar son las siguientes (no obstante usted puede elegir otra de acuerdo a su interés)
Estrategias de aprendizaje de adquisición
Estrategias de aprendizaje de codificación
Estrategias de aprendizaje de recuperación
Estrategias de aprendizaje de ayuda
Motivación
Autoestima
Habilidad social
Empatía.
Actitudes hacia la matemática
Actitudes hacia la ciencia
Aprendizaje significativo
Actitud hacia el deporte
Actitud hacia la lectura
A continuación te presento un instrumento que se refiere actitudes hacia la ciencia y la forma de puntuación y categorización:
INVENTARIO DE ACTITUDES HACIA LA CIENCIA DATOS GENERALES SEXO: F ( ) M ( ) CARREARA PROFESIONAL: _________________________________ SEMESTRE______ TD = Totalmente en Desacuerdo D = En desacuerdo Responde tu primera impresión. No hay N = Neutral, ni de acuerdo ni en desacuerdo A = De acuerdo respuestas preguntas buenas o malas TA = Totalmente de acuerdo MARCA CON UNA ASPA (X)
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14.
Afirmaciones Tenemos un mundo mejor para vivir gracias a la ciencia A nadie le gusta la ciencia La ciencia ayuda a ahorrar tiempo y esfuerzo. La ciencia es muy difícil de aprender Las enfermedades pueden curarse gracias a la ciencia. A mayor conocimiento científico, más preocupaciones hay para nuestro mundo. La ciencia no es aburrida La ciencia ayuda a la gente en todos los sitios La ciencia es sensata Me siento mal sólo de pensar en la ciencia. La curiosidad es lo esencial de la ciencia. La gente vive más saludablemente gracias a la ciencia. La ciencia no puede resolver los problemas energéticos Para destacar en ciencia hay que ser muy inteligente
TD
D
N
DA
TA
15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50.
Los alumnos estudian ciencia porque se les obliga. La ciencia es el camino para conocer el mundo en que vivimos La ciencia estimula la curiosidad No hay nada mejor que trabajar en ciencia La ciencia es algo realmente valioso. Conocer la luna y los planetas a través de la ciencia nos ayuda aquí en la tierra. En las clases de ciencia no hay actividad La peor materia escolar es la ciencia. La ciencia debería ser eliminada de las escuelas La gente tienen una vida más larga gracias a la ciencia Los alumnos en clase son como robots La ciencia desanima la curiosidad La ciencia nos ayuda a pensar mejor Estudiar ciencia es una pesadilla La gente sería mejor estudiante si no tuviera ciencia La ciencia no tiene mucho sentido para la gente común. La ciencia nos ayuda a evitar catástrofes Un futuro mejor depende de la ciencia La ciencia nos enseña a prepararnos para el futuro La ciencia es un riesgo para la salud. La vida sería monótona sin ciencia. No deberíamos haber enviado gente a la luna. La ciencia es completamente aburrida La ciencia es una excusa para juguetear La ciencia es detestable La ciencia es extremadamente útil La ciencia es necesaria para todos. Estudiando ciencia se satisface la curiosidad La ciencia no tiene utilidad La ciencia nos enseña a aceptar muchas opiniones diferentes La ciencia nos defiende de la superstición Apreciar las ideas nuevas es valioso en ciencia Una vez aceptado, el conocimiento científico no puede ser cambiado. La ciencia es una superstición La ciencia parece ser muy interesante. Estudiar ciencia sirve a la gente, incluso cuando deja la escuela.
FICHA TÉCNICA DEL INSTRUMENTO
I.
Identificación de oraciones positivas y negativas.
Son oraciones positivas (directas) aquellas que están redactadas favorablemente a la variable. Ejemplo: N° 1: Tenemos un mundo mejor para vivir gracias a la ciencia
La forma de puntuación: Totalmente en Desacuerdo TD
En desacuerdo D
Neutral, ni de acuerdo ni en desacuerdo N
De acuerdo A
Totalmente de acuerdo TA
1
2
3
4
5
Son negativas (inversas) variable
aquellas que están redactadas desfavorablemente a la
Ejemplo: N° 2: A nadie le gusta la ciencia
La forma de puntuación: Totalmente en Desacuerdo TD
En desacuerdo D
Neutral, ni de acuerdo ni en desacuerdo N
De acuerdo A
Totalmente de acuerdo TA
5
4
3
2
1
Resumen
II.
Tipo de oración
N° de oración
Clave de puntuación
DIRECTO
1, 3, 5, 7, 8, 9, 11, 12, 16, 17, 18, 19, 20, 24, 27, 31, 32, 33, 40, 41, 42, 44, 45, 46, 47, 49, 50.
TD=1 D=2 I=3 A=4 TA=5
INVERSO
2, 4, 6, 10, 13, 14, 15, 21, 22, 23, 25, 26, 28, 29, 30, 34, 35, 36, 37, 38, 39, 43, 48
TD=5 D=4 I=3 A=2 TA=1
Categorización de variables Los resultados de la encuesta están expresados en puntajes o sea, números. Estos pueden ser transformados a niveles o categorías: Bajo - Medio – Alto. Recuerde que el puntaje mínimo en cada pregunta es 1 y el máximo es 5. Siga las siguientes instrucciones: 1. 2. 3. 4. 5. 6.
N° de ítems del instrumento = 50 Puntaje mínimo al responder las 50 preguntas = 50x1=50 Puntaje mínimo al responder las 50 preguntas = 50X5=150 Rango: 50 ; 150 puntos Restar: 150–50 =100 Dividir entre 3: 100/3 =33.33 (Es /3, debido a tres niveles bajo, medio y alto)
7. Formar los niveles: Bajo Medio Alto
: mínimo=50 máximo: 50+33= 83 : mínimo=84 máximo: 84+33= 117 : mínimo=118 máximo: 118+32= 150
Por lo tanto: Bajo Medio Alto
: 50 – 83 : 84 – 117 : 118 - 150
En MS Excel deberรก consignar los respuestas de cada pregunta de la siguiente forma:
DIAGRAMA DE DISPERSIÓN Definición También llamada nube de puntos. Es una representación cartesiana de los pares (x,y) de dos variables numéricas. Donde X=cada punto de la primera variable Y=cada punto de la primera variable
La disposición de los puntos indica si las variables de estudio presentan algún tipo de relación (lineal, exponencial, polinómica). En las investigaciones educativas a menudo son del tipo lineal. Ejemplo. Sean los datos de dos variables recopiladas en una muestra de 6 estudiantes del IESPP José Jiménez Borja N 1 2 3 4 5 6
horas DE ESTUDIO (X) 1 2 3 4 5 3
Rendimiento en un examen (Y) 3 4 4 5 8 6
Realizar la nube de puntos. Solución: Los pares (x,y) son: (1,3) (2,4) (3,6) (4,5) (5,8) (3,6) Al ubicarlos en un plano cartesiano tenemos la siguiente figura:
Interpretación: De la gráfica podemos apreciar que los puntos (x,y) tienden a un modelo tipo lineal, es decir, las horas de estudio y el rendimiento en un examen, presentan una relación de tipo lineal.
******************* IMPORTANTE ************************ EN LO SUCESIVO SÓLO SE ESTUDIARAN LAS RELACIONES DE TIPO LINEAL
*****************************************************************
TIPOS DE MODELOS LINEALES a) Relaci贸n lineal positiva: Es cuando el modelo es ascendente
b) Relaci贸n lineal negativa: Es cuando el modelo es descendente
PRACTICA 1 Grafique la nube de puntos para cada par de variables e interprete si presenta un modelo lineal, luego interprete. N
PESO
ESTATURA RENDIMIENTO INTELIGENCIA ESTRÉS
1
74
175
18
19
8
2
55
160
19
17
11
3
65
162
16
13
12
4
68
173
14
11
8
5
68
168
18
17
12
6
54
160
18
11
12
7
69
170
13
9
17
8
68
168
16
18
11
9
60
165
18
15
8
10
58
160
7
11
17
11
72
174
18
15
9
12
74
176
19
16
10
13
68
160
12
16
15
14
76
168
11
13
16
15
70
169
15
15
11
16
58
155
14
11
13
17
82
178
15
12
12
18
60
155
13
14
11
19
76
174
16
14
12
20
78
180
16
17
12
MUY IMPORTANTE
PARA LA REALIZACIÓN DE LA NUBE DE PUNTOS, ELIJA USTE CUAL VARIABLE SE CONSIDERA “X” Y CUAL “Y”. LA FIGURA E INTERPRETACIÓN DA EL MISMO EFECTO (POR AHORA)
ACTIVIDADES DE EXTENSIÓN Nube de puntos en el programa Excel
Nube de puntos en el programa SPSS Ruta: Gráficos Cuadros de dialogo antiguos Dispersión/puntos Al eje x: variable hora de estudio Al eje y: variable rendimiento
COEFICIENTE DE CORRELACION R DE PEARSON El coeficiente de correlación r de Pearson mide el grado de relación entre dos variables numéricas. La fórmula es la siguiente:
rxy
n( xy ) ( x)( y ) (n( x 2 ) ( x) 2 )(n( y 2 ) ( y ) 2 )
Donde: X= son los puntajes de la primera variable (independiente) Y= son los puntajes de la segunda variable (dependiente) x= suma de los valores de la variable X x= suma de los valores de la variable Y xy= suma de los productos XY n=tamaño de la muestra
El coeficiente varia de 0 a 1.
0 indica correlación nula 1 e indica correlación perfecta
Sin correlación 0.0 Correlación mínima
0.2
0.4
Correlación baja
0.6
Correlación moderada
0.8
Correlación buena
Correlación perfecta 1.0 Correlación muy buena
Puede ser positivo o negativo
Si r es positivo entonces la relación entre las variables x e Y es directa, es decir: A mayor x mayor Y, y viceversa.
Está asociada a una nube de puntos lineal positiva:
Si r es negativo, entonces la relación entre las variables x e Y es inversa, es decir: A mayor x menor Y, y viceversa.
Está asociada a una nube de puntos lineal negativa:
Ejemplo 1 Calcular el coeficiente de correlación r de Pearson
e interpretar en la siguiente
información: N 1 2 3 4 5 6
horas DE ESTUDIO (X) 1 2 3 4 5 3
Rendimiento en un examen (Y) 3 4 4 5 8 6
Solución: n 1 2 3 4 5 6 SUMATORIA
X 1 2 3 4 5 3 18
rxy
Y 3 4 4 5 8 6 30
XY 3 8 12 20 40 18 101
XX 1 4 9 16 25 9 64
YY 9 16 16 25 64 36 166
n( xy ) ( x)( y ) (n( x 2 ) ( x) 2 )(n( y 2 ) ( y ) 2 )
INTERPRETACIÓN: Las variables horas de estudio y rendimiento en un examen están relacionadas directamente (0,87) en un nivel muy bueno. A mayor horas de estudio mayor rendimiento en el examen. VIDEO: http://www.youtube.com/watch?v=lV5xfIbd_cY
Ejemplo 1
Calcular el coeficiente de correlación r de Pearson
e interpretar en la siguiente
información: Estrés (X) 1 1 2 4 5
N 1 2 3 4 5
Rendimiento académico (Y) 4 5 4 3 1
Solución: n 1 2 3 4 5 SUMATORIA
rxy
X 1 1 2 4 5 13
Y 4 5 4 3 1 17
XY 4 5 8 12 5 34
XX 1 1 4 16 25 47
YY 16 25 16 9 1 67
n( xy ) ( x)( y ) (n( x 2 ) ( x) 2 )(n( y 2 ) ( y ) 2 )
INTERPRETACIÓN: Las variables estrés y rendimiento académico están relacionadas de manera inversa (-0,93) en un nivel muy bueno. A mayor estrés menor rendimiento y viceversa.
PRACTICA 2 Calcular el coeficiente de correlación r de Pearson para cada par de variables de la siguiente base de datos e interpretar. N
PESO
ESTATURA RENDIMIENTO INTELIGENCIA ESTRÉS
1
74
175
18
19
8
2
55
160
19
17
11
3
65
162
16
13
12
4
68
173
14
11
8
5
68
168
18
17
12
6
54
160
18
11
12
7
69
170
13
9
17
8
68
168
16
18
11
9
60
165
18
15
8
10
58
160
7
11
17
11
72
174
18
15
9
12
74
176
19
16
10
13
68
160
12
16
15
14
76
168
11
13
16
15
70
169
15
15
11
16
58
155
14
11
13
17
82
178
15
12
12
18
60
155
13
14
11
19
76
174
16
14
12
20
78
180
16
17
12
Para el cálculo elija usted qria ue variable lo considera como “x” y cual “y”. El valor del coeficiente no varía en cualquier caso
ACTIVIDADES DE EXTENSIÓN Coeficiente de correlación r de Pearson en el programa Excel Del ejemplo 1
VIDEO: http://www.youtube.com/watch?v=DXFJicXBv5k
Coeficiente de correlación r de Pearson en el programa SPSS l Del ejemplo 2 Ruta: Menú Analizar Bivariadas (llevar las dos variables) luego aceptar Resultados
VIDEO: http://www.youtube.com/watch?v=8Cd6fNZWju4
SIGNIFICANCIA DEL COEFICIENTE R DE PEARSON
Dos variables pueden tener algún nivel de relación, pero no todas ellas se consideran realmente “significativas”. ¿Y qué es significativo? RPTA. Es afirmar categóricamente que el valor de r de Pearson es muy distante de cero (bajo ciertos parámetros que por ahora no se menciona), es decir que si es el caso “Existe una relación significativa entre las variables”. En cambio cuando el valor r se acerca demasiado, diremos que no existe relación significativa.
Para la decisión debe tener dos valores a comparación. Al primero le llamaremos T de crítico que es igual a 2,011; y el otro valor lo llamaremos T calculado, sale de la siguiente fórmula:
t
r 1 r 2 n2
Dónde: r=coeficiente r de Pearson n=tamaño de muestra
REGLA DE DECISIÓN
Si T calculado < -2,011 ó T calculado > 2,011, entonces decimos categóricamente que las variables x e Y están relacionadas en un nivel r de manera significativa
Ejemplo: Determinar la significancia del confidente de Pearson a) r= 0,87 para una muestra de n=30 b) r= 0,56 para una muestra de n=50 c) r= 0,24 para una muestra de n=40 d) r= 0,24 para una muestra de n=80
Solución: 1) r= 0,87 para una muestra de n=30
t
r 1 r n2 2
0,87 1 0,87 30 2
2
9,34
Decisión: Como t = 9,34 es mayor a 2,011, entonces existe relación significativa entre las variables X e Y.
2) r= 0,56 para una muestra de n=50
t
r 1 r n2 2
0,56 1 0,56 50 2
2
4,68
Decisión: Como t = 4,68 es mayor a 2,011, entonces existe relación significativa entre las variables X e Y.
3) r= 0,24 para una muestra de n=40
t
r 1 r n2 2
Decisión: Como
0,24 1 0,24 40 2
2
1,52
t = 1,52 no es mayor a 2,011, entonces no existe relación
significativa entre las variables X e Y.
4) r= 0,24 para una muestra de n=80
t
r 1 r n2 2
Decisión: Como
0,24 1 0,24 80 2
2
2,18
t = 2,18 no es mayor a 2,011, entonces no existe relación
significativa entre las variables X e Y.
REGRESIÓN LINEAL 1. REGRESIÓN LINEAL Es un modelo matemático para estimar el efecto de una variable sobre otra. Está asociado con el coeficiente r de Pearson. Se consideran dos variables. A una se le considera independiente (X) y a la otra dependiente (Y). La regresión lineal se determina en base en el diagrama de dispersión. En el ejemplo anterior se muestra el diagrama de dispersión y ahora se muestra la línea de tendencia de las puntuaciones. Esta línea puede expresar mediante una ecuación: Y = mX + b
Para calcular la ecuación Y = a + bX, usaremos la siguiente expresión:
Y Y r(
Sy Sx
) X r(
Sy Sx
)X
Donde: Y =media de la variable Y X =media de la variable Y r =coeficiente de correlación de Pearson entre las variables X eY S y =Desviación estándar de los valores de la variable Y
S x =Desviación estándar de los valores de la variable X
Ejemplo Calcular la ecuación de regresión lineal para la información del ejercicio anterior. Además pronostique el coeficiente intelectual para: Pedro (x=19), Martha (x=10) y José (16)
horas DE ESTUDIO (X) María 1 OLGA 2 SUSANA 3 ALDO 4 JUAN 5 JHON 3 ALUMNO
Rendimiento en un examen (Y) 3 4 4 5 8 6
SOLUCIÓN
Como x=horas de estudio y Y=rendimiento:
RENDIMIENTO = 1,1(HORAS DE ESTUDIO) +1,7
INTERPRETACION DE LA RECTA DE REGRESIÓN LINEAL
Consideremos los resultados de la siguiente información:
ALUMNO
horas DE ESTUDIO (X)
Rendimiento en un examen (Y)
LUIS MARÍA OLGA SUSANA ALDO JUAN MARIO SANYO PEDRO
0 1 1 1 2 2 2 3 4
3 6 5 4 5 8 8 8 10
1) PENDIENTE DE LA RECTA “a” En la ecuación de la recta Y=ax + b, el valor “a” se llama pendiente de la recta y se interpreta como:
Por cada unidad de variación de la variable “X” la variable “Y” se incrementa en “a” unidades.
2) Ordenada en el origen “b” Cuando X=0 entonces Y=3
3) Pronóstico Dado un valor de X podemos pronosticar un valor Y ¿Cuál es el rendimiento si un alumno estudia se 2,5 horas? Y=2(2,5)+3=8 de rendimiento 4) Significancia del modelo El modelo es significativo si el r de Pearson lo es. En nuestro ejemplo r es significativo ya que t=5,24>2,011
EJERCICIOS INTERPRETA CADA SITUACIÓN
1. Relacion entre hábitos de estudio y rendimiento
¿Cuánto tendrá de rendimiento si se tiene 10 puntos de hábitos?
2. Relacion entre estrés y rendimiento
¿Cuál es el rendimiento para un estrés de 2 puntos?
1. Relacion entre peso y rendimiento
¿Cuál es el rendimiento para un peso de 55 kg?