10/10/2020
UNIDAD 2: INTRODUCCIÓN AL ENTORNO DEL PROGRAMA SPSS M.Sc. Jimmy Delgado Villca
Encuesta y Operacionalización de variables
1
10/10/2020
Encuesta Es una técnica que persigue conocer la opinión, posición de un sector de la población que es objeto de observación o estudio. Tiene que ver con un problema científico, ubicada en tiempo y espacio determinados. La encuesta se hace a través de formularios. Las preguntas deberán ser ordenadas lógica y coherentemente (Agreda, 2003, p. 46)
PREGUNTAS
PREGUNTAS
CERRADAS
ABIERTAS
• Contienen categorías o alternativas, para respuestas, que han sido delimitadas por el investigador. • Fáciles de codificar y preparar para su análisis. • Para formular las preguntas, es necesario anticipar las respuestas posibles.
•
• •
•
Útiles cuando no hay información sobre las posibles respuestas. Para profundizar los motivos de un comportamiento. Difíciles de codificar, clasificar y preparar para su análisis. Puede presentar sesgos de distinta naturaleza. Ej. dificultad para expresarse.
2
10/10/2020
Reglas para el diseño de cuestionarios ● ● ● ●
● ●
●
Hacerlos cortos Utilizar términos claros y precisos, y una redacción sencilla. El tamaño debe facilitar su manejo. Los espacios de llenado deberán ser suficientes para las respuestas. Señalar siempre en su cuerpo los objetivos que persigue. De preferencia, hacer preguntas cerradas, para facilitar el procesamiento de la información. Adjuntar instrucciones para su manejo.
Operacionalización de variables Operacionalizar es definir las variables para que sean medibles y manejables, significa definirlas operativamente. Un investigador necesita traducir los conceptos (variables) a hechos observables para lograr su medición. Las definiciones señalan las operaciones que se tienen que realizar para medir la variable, de forma tal, que sean susceptibles de observación y cuantificación. De acuerdo con Hempel (1952:50): “la definición operacional de un concepto
consiste en definir las operaciones que permiten medir ese concepto o los indicadores observables por medio de los cuales se manifiesta ese concepto.”
3
10/10/2020
Proceso de Operacionalización de Variables
Variable teórica
Concepto Definición conceptual
Dimensiones Definición operacional de cada dimensión
Variable empírica
Indicadores
OPERACIONALIZACIÓN DE VARIABLES E INSTRUMENTOS DE RECOLECCIÓN DE DATOS Observación
VARIABLE
CONCEPTUALIZACION Definición Conceptual
V1
DEFINICION
OPERACIONALIZACION Dimensiones
Indicadores
DIMENSION 1
INDICADOR 1
Itemes (preguntas) ITEM 1 ITEM 2
Cuestionario
INDICADOR 2 DIMENSION 2 DIMENSION 3
Entrevista Test
APLICACIÓN DE LA ESTADÍSTICA
DATOS
4
10/10/2020
CONCEPTUALIZACIÓN Y OPERACIONALIZACIÓN DE VARIABLES Variable (como concepto)
Accesibilidad a los servicios de salud
Definición conceptual
Mayor o menor posibilidad de tomar contacto con los servicios de salud para recibir asistencia
Dimensiones (variables contenidas en la definición conceptual) •
Indicadores
Items
•
1.Accesibilidad geográfica
2.Accesibilidad económica
3.Accesibilidad cultural
Tiempo medido en horas y minutos que tarda una persona para trasladarse de su domicilio al centro de salud. Distancia en Km recorrida
• Cantidad de dinero que gasta para recibir la atención. • Disponibilidad económica para cubrir ese gasto.
• Conocimientos sobre la atención que se da en el centro de salud. • Percepción del problema de salud.
EJEMPLO 1 VARIABLE
Accesibili dad a los servicios de salud
DEFINICIÓN CONCEPTUAL
Mayor o menor posibilidad de tomar contacto con los servicios de salud para recibir asistencia
DIMENSIONES
Accesibilidad Geográfica
INDICADORES
•
• Accesibilidad económica
• •
Accesibilidad cultural
•
•
ITEMS
INSTRUMENTO
Tiempo medido en horas y minutos que tarda una persona para trasladarse de su domicilio al centro de salud. Distancia en Km recorrida
¿Dónde vive? ¿Cuánto tiempo tarda en trasladarse de su casa al centro de salud? ¿Qué distancia recorre de su casa al CS?
Cuestionario
Cantidad de dinero que gasta para recibir la atención. Disponibilidad económica para cubrir ese gasto.
¿Cuánto dinero gasta al mes en la atención médica? ¿Trabaja?; ¿Cuál es su ocupación? ¿Cuánto es su ingreso mensual?
Cuestionario
Conocimientos sobre la atención que se da en el centro de salud. Percepción del problema de salud.
¿Conoce la atención que se da en el CS? ¿Cómo se entero de la atención que realiza el CS? ¿Qué hace cuando se enferma? ¿Con qué frecuencia va al CS?
Cuestionario
5
10/10/2020
EJEMPLO 2 VARIABLE
Desempeño de los estudiantes en la formación virtual
DIMENSIONES
1.- Entrega de trabajos
2.- Participación en clases de videoconferenci a
INDICADORES
1.1.- Número de trabajos realizados 1.2.- Número de trabajos no realizados 1.3.- Entrega de trabajos retrasados 1.4.- Trabajos individuales
1.5.- Trabajos grupales
ITEMS
¿Cuántos trabajos entrego?
INSTRUMENTO
Cuestionario
¿Cuántos trabajos no entrego? ¿Entrego algunos trabajos después de la fecha límite? ¿Con qué frecuencia realiza trabajos individuales? ¿Cuántos trabajos realizó de forma individual? ¿Con qué frecuencia realiza trabajos grupales? ¿Cuántos trabajos realizó de forma grupal?
3.- Trabajos en grupo
Grado de Confiabilidad Este coeficiente consiste en la media de las correlaciones entre las variables que forman parte de la escala, y puede calcularse de dos maneras: a partir de las varianzas (Alfa de Cronbach) o de las correlaciones de los ítems (Alfa de Cronbach estandarizado) (Psicología y mente, 2020)
De 0,0 a 0,2 MUY BAJA De 0,2 a 0,4 BAJA De 0,4 a 0,6 MODERADA De 0,6 a 0,8 BUENA De 0,8 a 1,0 ALTA
6
10/10/2020
Presentación de Datos en Tablas TABLAS de distribución de frecuencias
Permiten organizar y sistematizar losdatos en bruto a través de la TABULACIÓN, para establecer tendencias o patrones que facilitan su descripción e interpretación.
7
10/10/2020
CUESTIONARIO
DATOS:
I. DATOS GENERALES Nombre y Apellidos: ___________________ Edad: ______________ Sexo: V M II. PREGUNTAS 1. ¿Qué refrescos te gusta tomar? Coca Cola (C) Fanta (F) Sprite (S) Pepsi (P) Mineragua (M) La Cascada (L) Jugos del Valle (J) Otros…………… 2. ¿Cuántos hermanos tienes? o - 1 - 2 - 3 - 4 - 5 - más de 5 3. ¿Cuántas horas estudias al día? o - 1 - 2 - 3 - 4 - 5 - más de 5 4. ¿Te gusta escuchar música? Si No 5. ¿Cuál es tu rendimiento académico? Bueno Regular Deficiente
EDAD: 21 20 19 19 20 20 19 21 21 22 22 20 22 19 19 20 20 20 21 21 21 23 20 19 19 21 20 20 22 27 22 27 21 20 19 20 19 19 19
REFRESCOS: C F S C S S F F J P P F S C P M L F F M M L J L M C C F C L J P S P L F M M J C C S P J M C F M M C P M L C F L J S P
1.- Partes o elementos Código: o numeración que permite ordenar la presentación de los cuadros. El título: primario: ¿Qué? (Población o Unidad de Observación), ¿Cómo? (Variable) y secundario: ¿Dónde? (Lugar o institución), ¿Cuándo? (Tiempo expresado en mes y año) Matriz: conformado por la primera fila (Variable y frecuencias) y primera columna (Variable y sus valores) del cuadro. Cuerpo: Son las celdas o cedulas donde están las cifras numéricas. Notas aclaratorias o Fuente: en donde se menciona la fuente de los datos o algunas notas aclaratorias.
8
10/10/2020
CODIGO
CUADRO Nº 1:
DOCENTES SEGÚN NÚMERO DE HIJOS
TITULO
F
Fa
p
pa
P%
Pa%
1
10
10
0,15
0,15
15%
15%
2
22
32
0,33
0,48
33%
48%
3
16
48
0,24
0,72
24%
72%
4
12
60
0,18
0,90
18%
90%
5
4
64
0,06
0,96
6%
96%
6
3
67
0,04
1,00
4%
100%
TOTAL
67
--
1,00
--
100%
--
MATRIZ
Nº DE HIJOS
Fuente: Elaboración propia en base a cuestionario aplicado en junio de 2015
CUERPO
FACULTAD DE HUMANIDADES – UMSS - 2003
NOTAS ACLARATORIAS
2. Frecuencias a) Absolutas Frecuencia Absoluta (F) Es el número de veces u observaciones que se repite el valor de la variable en la tabla.
F F F F ..... F N 1
2
3
I
Frecuencia Absoluta Acumulada (Fa) Resulta de considerar la misma frecuencia absoluta más las frecuencias anteriores a esta.
Fa1 F1; Fa2 F1 F2 ; Fai F1 F2 ..... Fi
9
10/10/2020
b) Relativas Proporción (p) Son frecuencias relativas ya que su referente es la unidad y no la totalidad, que debe redondearse hasta dos decimales después de la coma. Fórmula:
p
F N
p p p 1
2
p3..... pi 1
Proporción acumulada (pa) Resulta de considerar la proporción acumulada mas las anteriores a esta.
pa1 p1; pa2 p1 p2 ; pai p1 p2..... pi
Porcentaje (P%) Tiene como referente al 100 como valor máximo, se redondean a entero. Fórmula:
P%
F 100 N
P% P P P ..... P 100 1
2
3
i
Porcentaje acumulado (Pa%) Es el mismo porcentaje más la suma de los anteriores porcentajes a este.
Pa1 P1; Pa2 P1 P2 ; Pai P1 P2 ..... Pi
10
10/10/2020
3. ELABORACIÓN DE TABLAS
3.1. Tablas Estadísticas Simples (Una Variable) a) Variable Cualitativa Datos sobre la preferencia de refrescos, obtenidos en una encuesta aplicada a 60 pobladores de Cbba. el año 2015. Donde: Coca Cola (C), Fanta (F), Sprite (S), Pepsi (P), Mineragua (M), La Cascada (L), Jugos del Valle (J).
C F L F M
C S M M M
F C C M C
S P C J P
C M F C M
S L C C L
S F L S C
F F J P F
F M P J L
J M S M J
P L P C S
P J L F P
CUADRO Nº 1 POBLADORES SEGÚN PREFERENCIA DE REFRESCO CIUDAD DE COCHABAMBA – 2015
REFRESCO
COCA COLA
F
Fa
p
pa
P%
Pa%
FANTA SPRITE PEPSI
MINERAGUA
LA CASCADA
JUGOS DEL VALLE TOTAL
Fuente: Encuesta , junio de 2005
11
10/10/2020
C
C
F
S
C
S
F
S
C
P
M
L
L
M
C
C
F
C
F
M
M
J
C
C
M
M
C
P
M
L
S
F
F
J
P
P
MINERAGUA
F
F
M
M
L
J
LA CASCADA
L
J
P
S
P
L
JUGOS DEL VALLE
S
P
J
M
C
F
TOTAL
C
F
L
J
S
P
REFRESCO
F 12
COCA COLA FANTA SPRITE PEPSI
CUADRO Nº 1 POBLADORES SEGÚN PREFERENCIA DE REFRESCO CIUDAD DE COCHABAMBA – 2015
REFRESCO
F
Fa
10
22
8
37
COCA COLA
12
SPRITE
7
FANTA PEPSI
MINERAGUA
10
JUGOS DEL VALLE
6
LA CASCADA
TOTAL
p
12
0,20
29
47
P%
Pa%
17%
37%
0,2
20%
0,12
0,49
12%
49%
0,17
0,79
17%
79%
0,1
1,01
0,17
0,13
7
54
0,12
60
--
1,01
60
pa
0,37
0,62
13%
0,91
12%
--
101%
10%
20%
62% 91%
101% --
Fuente: Elaboración propia en base a encuesta , junio de 2015
12
10/10/2020
Ejercicio 1: Suponga que después de una encuesta sobre los sabores de los helados PANDA se ha establecido las siguientes preferencias: granizado (G), dulce de leche (L), frutilla (F), vainilla (V), chocolate (C), tumbo (T) y durazno (D). Entre 65 encuestados
C T F C C
C C G G F
G G D F L
L V C C V
C D L L F
G T V C D
T C T G D
V L D F T
G G C G C
L D F C V
F V L L F
G C T F L
F V L D G
CUADRO Nº 2 ENCUESTADOS SEGÚN PREFERENCIA DE SABORES DE HELADO
SABORES
F
Fa
p
pa
P%
Pa%
GRANIZADO
11
11
0,17
0,17
17%
17%
DULCE DE LECHE
10
21
0,15
0,32
15%
32%
FRUTILLA
10
31
0,15
0,47
15%
47%
VAINILLA
7
38
0,11
0,58
11%
58%
CHOCOLATE
14
52
0,22
0,80
22%
80%
TUMBO
6
58
0,09
0,89
9%
89%
DURAZNO
7
65
0,11
1,00
11%
100%
65
---
1,00
---
100%
---
TOTAL Fuente: Elaboración propia
13
10/10/2020
Descripción de frecuencias: F1 = 11 • •
Una cantidad (Frecuencia) de 11 encuestados prefieren el sabor Granizado. Por cada 65 encuestados, 11 de ellos responden que prefieren el helado granizado. Fa3 = 31 Una frecuencia de 31 encuestados prefieren los sabores de helado granizado, dulce de leche y frutilla.
Descripción de proporciones: p5 = 0,22
Una proporción de 0,22 encuestados prefieren el sabor de helado Chocolate. La probabilidad de que un sujeto elija el sabor chocolate es de 0,22 es decir, una probabilidad baja.
pa2 = 0,32 Una proporción de 0,32 encuestados prefieren los sabores de helado granizado y dulce de leche. La probabilidad de que un sujeto elija los sabores granizado y dulce de leche es de 0,32 vale decir, una probabilidad baja.
14
10/10/2020
Descripción de porcentajes: P%3 = 15%
El 15% de los encuestados prefieren el sabor de helado frutilla. La probabilidad de que un sujeto prefiera el helado de frutilla es del 15% es decir una probabilidad muy baja. Por cada 100 personas, 15 de ellas prefieren el sabor frutilla.
P%a4 = 58%
Un 58% de la población prefiere los sabores de helado vainilla, dulce de leche, granizado y frutilla. Existe una probabilidad del 58% (probabilidad media) de que un sujeto prefiera los sabores de helado vainilla, dulce de leche, granizado y frutilla.
Ejercicio 2: Datos sobre la Religión, obtenidos en una encuesta aplicada a 59 estudiantes de 2º semestre de la materia de Estadística I, en septiembre de 2010. Donde: Evangélico (E), Católico (C), Ateo (A), Testigo de Jehová (TJ), Otros/Ninguno (ON).
E A A C C
C C E C C
C E C C C
E C C ON ON C C C E C C TJ E C A
C C C C C
C E C E E
C C E C E
C E C C E
E ON ON ON C C C ON E
15
10/10/2020
CUADRO Nº 3 ESTUDIANTES SEGÚN RELIGIÓN 2º SEMESTRE – II/2010
RELIGIÓN
F
Fa
p
pa
P%
Pa%
EVANGÉLICO CATÓLICO ATEO TESTIGO DE JEHOVA OTROS/NINGUNO TOTAL Fuente: Encuesta , septiembre de 2010
b) Variable Cuantitativa Discreta Con el objeto de premiar a los titulados más sobresalientes del semestre II/2014, la Dirección Académica de la Fac. de Humanidades ha efectuado un conteo del número de materias reprobadas por parte de 56 titulados, con los siguientes resultados.
Valor Máximo
2-5–4–2–7–5–2–2–5–4–0–4–3–4 3-5–2–5–4–5–4–7–2–2–2–4–7–7 4-4–2–5–4–0–4–2–0–5–8–4–2–5 5-2–4–0–2–5–2–4–5–0–4–3–1–0 Valor Mínimo
16
10/10/2020
2 2 3 4 2 2 0 5 2 1
5 2 4 5 4 5 5 2 4 0
4 5 3 4 7 4 8 4 5
2 4 5 7 7 0 4 0 0
7 0 2 2 4 4 2 2 4
5 4 5 2 4 2 5 5 3
F
Nº MAT. REPROB.
0 1 2 3 4 5 6 7 8 TOTAL
CUADRO Nº 4 TITULADOS SEGÚN Nº DE MATERIAS REPROBADAS FAC. HUMANIDADES – GESTIÓN II/2014 Nº MAT. REPROB.
F
Fa
p
pa
P%
Pa%
0
6
6
0,11
0,11
11%
11%
1
1
7
0,02
0,13
2%
13%
2
14
21
0,25
0,38
25%
38%
3
3
24
0,05
0,43
5%
43%
4
15
39
0,27
0,70
27%
70%
5
12
51
0,21
0,91
21%
91%
6
0
51
0,00
0,91
0%
91%
7
4
55
0,07
0,98
7%
98%
8
1
56
0,02
1,00
2%
100%
TOTAL
56
--
1,00
--
100%
--
Fuente: Cuestionario, 2004
17
10/10/2020
Ejercicio 3: Los siguientes datos corresponden al número de hermanos de un grupo de estudiantes de 2do semestre de la carrera de Ciencias de la Educación (2011).
4
3
5
5
3
6
1
3
5
5
5
7
8
2
4
7
3
4
3
3
4
8
4
8
1
4
1
6
6
4
3
6
4
2
4
3
9
4
8
8
3
3
5
CUADRO Nº 5 ESTUDIANTES DE 2DO SEMESTRE SEGÚN NÚMERO DE HERMANOS Nº de Hermanos
F
Fa
p
pa
P%
Pa%
1 2 3 4 5 6 7 8 9 TOTAL Fuente: Cuestionario, 2011
18
10/10/2020
Ejercicio 4: Con los siguientes datos que corresponden a los años de servicio de 60 empleados de la empresa QUIMBOL, en el año 2004, realizar un cuadro de distribución.
4 3 8 7 6
3 8 3 9 7
4 10 5 8 8
5 6 7 10 7 8 7 6 6 7
7 8 9 10 9 10 7 8 6 10 9 7 5 7 10 8 6 8 10
8 10 8 9
4 8 5 8
8 6 8 7 3 8 10 7
Ejercicio 5: Los siguientes datos corresponden a las horas de estudio/día de los estudiantes de 2º semestre en la gestión II/2007.
5
1
5
5
4
5
3
4
5
4
4
4
5
5
4
5
2
2
6
2
5
6
5
5
4
5
5
3
3
1
2
4
3
4
5
6
2
1
3
3
5
5
2
4
5
6
4
2
4
4
3
19
10/10/2020
Ejercicio 6: CUADRO Nº 6 ESTUDIANTES DE 2DO SEMESTRE POR HORAS DE ESTUDIO HORAS DE ESTUDIO
F
Fa
p
pa
1
0,06
2
0,20
3
0,34
P%
Pa%
100
---
0,59 5
0,92
6
1
TOTAL
51
---
1
---
Fuente: Cuestionario, 2007
c) Variable Cuantitativa Continua (Tabla con Intervalos de Clase) Pasos a seguir:
Ubicar el datos más pequeño y el más alto (VMIN y VMAX) Calcular la Amplitud Total (A) A = (VMAX – VMIN) + 1 Determinar el número de intervalos de clase (m)
m
m
N
A i
Calcular el recorrido de intervalo (i)
i
A m
20
10/10/2020
Ejemplo: Información sobre las notas de los estudiantes en la Materia de Estadística II, el año 2012. Valor Máximo
63
69
48
35
100
53
75
63
72
63
45
72
36
42
25
25
50
85
42
50
49
39
82
90
90
36
45
70
45
80 21
82 72
75
57
36
38
65
30
40
50
30
28
57
71
81
41
67
58
72
75
57
50
63
35
41
67
40 22
58
Valor Mínimo
Amplitud total:
A (VMAX VMIN ) 1 A (100 21) 1 A 80
Número de Intervalos:
m
N
m
60
m 7 , 74 m 8
Recorrido de Intervalo:
A m 80 i 8 i 10unidades i
21
10/10/2020
Construcción de la Tabla INTERVALOS DE CLASE
F
p
P
m = 8 intervalos de clase
21 - 30 31 - 40 41 - 50 51 - 60 61 - 70 71 - 80 81 - 90 91 - 100 i = 10 unidades
Comprobación del recorrido de intervalo (i) Primer intervalo de clase: 21 - 30 Límite Superior de Clase (Ls)
Límite Inferior de Clase (Li)
21 - 22 - 23 - 24 - 25 - 26 - 27 - 28 - 29 - 30 i = 10 unidades i = (Ls – Li) + 1
= (30 - 21) + 1
= 9 + 1 = 10
22
10/10/2020
CUADRO Nº 7 ESTUDIANTES SEGÚN NOTAS MATERIA ESTADISTICA EDUCATIVA II – GESTIÓN 2012 TARJAS
NOTAS
F
Fa
p
pa
P%
Pa%
21 - 30 31 - 40 41 - 50 51 - 60 61 - 70 71 - 80 81 - 90 91 - 100 TOTAL Fuente: Elaboración propia en base a registro de notas materia estadística, 2005
Ejemplo del tarjado: 63
69
48
30
100
53
75
63
30
40
67
58
49
39
70
80
82
57
36
28
57
57
50
40
90
72
63
45
72
36
42
25
50
30
72
75
82
90
45
21
72
38
65
71
81
63
35
22
36
45
25
50
75
85
42
50
41
41
67
58
F 8
p
P
TARJAS
NOTAS 21 - 30 31 - 40 41 - 50 51 - 60 61 - 70
8
13 6 9
81 - 90
9 6
91 - 100
1
71 - 80
TOTAL
23
10/10/2020
CUADRO Nº 7 ESTUDIANTES SEGÚN NOTAS MATERIA ESTADISTICA EDUCATIVA II – GESTIÓN 2012 NOTAS
F
Fa
p
pa
P%
Pa%
21 - 30
8
8
0,13
0,13
13%
13%
31 - 40
8
16
0,13
0,26
13%
26%
41 - 50
13
29
0,22
0,48
22%
48%
51 - 60
6
35
0,10
0,58
10%
58%
61 - 70
9
44
0,15
0,73
15%
73%
71 - 80
9
53
0,15
0,88
15%
88%
81 - 90
6
59
0,10
0,98
10%
98%
91 - 100
1
60
0,02
1,00
2%
100%
TOTAL
60
--
1,00
--
100%
--
Fuente: Elaboración propia en base a registro de notas materia estadística, 2012
Ejercicio 7:
ESTUDIANTES SEGÚN NOTAS
MATERIA ESTADISTICA EDUCATIVA II – GESTIÓN 2010
NOTAS
P%
Pa%
21 - 36
20
20
37 - 52
28
48
-
22
70
69 - 84
23
93
- 100 TOTAL
F
Fa
p
pa
4 60
--
1,00
--
100%
--
Fuente: Elaboración propia en base a registro de notas materia estadística, 2005
24
10/10/2020
Ejercicio 8:
ESTUDIANTES SEGÚN CALIFICACIONES ESTADÍSTICA – GESTIÓN 2015
CALIFICACIÓN 37 -
F
Fa
p
pa
-
P% 3%
11%
49 - 54
19%
-
22%
-
8%
-
22%
-
79 -
TOTAL
Pa%
8% 150
--
--
7%
100%
--
Ejercicio 9: Puntuaciones obtenidas en un test psicológico (2008).
56 28 42 56 47 78 82 55 56 41 68 48 56 42 60 62 54 42 48 53 48 47 52 50 39 44 47 52 42 68 62 54 66 55 57 65 38 62 37 72 81 67 76 76 52 39 38 29 79 76 Elaborar una tabla con 5 intervalos de clase, con todas las frecuencias.
25
10/10/2020
Ejercicio 10: Los siguientes datos corresponden a las calificaciones de los estudiantes en la materia de estadística durante la gestión 2016.
59 48 53 47 57 64 62 62 65 57 81 83 48 61 60 37 51 51 63 81 60 77 71 57 82 66 76 50 57 58 52 57 40 53 66 71 61 61 55 59 50 59 69 67 66 47 56 60 43 54 47 81 53 61 70 50 76 47 50 63 65 54 73 76 Elaborar una tabla con recorrido de 6 unidades, con todas las frecuencias.
Ejercicio 11:
Se tiene los pesos, en kg., de un grupo de alumnos de primero de la escuela “María Micaela” en la gestión 2017: 45, 42, 48, 46, 39, 57, 48, 57, 68, 64, 56, 48, 60, 53, 58, 72, 59, 46, 62, 53, 59, 64, 70, 56, 62, 48, 56, 61, 58, 50, 48, 53, 58, 59, 62, 52, 63, 70, 44, 55, 51, 58.
26
10/10/2020
Ejercicio 12: Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas: a) Obténgase una distribución de datos en intervalos de amplitud 5, b) Calcúlese el porcentaje de personas de peso menor que 65 Kg. c) ¿Cuántas personas tienen peso mayor o igual que 70 Kg. pero menor que 85?
60 ; 66 ; 77 ; 70 ; 66 ; 68 ; 57 ; 70 ; 66 ; 52 ; 75 ; 65 ; 69 ; 71 ; 58 ; 66 ; 67 ; 74 ; 61 ; 63 ; 69 ; 80 ; 59 ; 66 ; 70 ; 67 ; 78 ; 75 ; 64 ; 71 ; 81 ; 62 ; 64 ; 69 ; 68 ; 72 ; 83 ; 56 ; 65 ; 74 ; 67 ; 54 ; 65 ; 65 ; 69 ; 61 ; 67 ; 73 ; 57 ; 62 ; 67 ; 68 ; 63 ; 67 ; 71 ; 68 ; 76 ; 61 ; 62 ; 63 ; 76 ; 61 ; 67 ; 67 ; 64 ; 72 ; 64 ; 73 ; 79 ; 58 ; 67 ; 71 ; 68 ; 59 ; 69 ; 70 ; 66 ; 62 ; 63 ; 66.
Ejercicio 13: Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de Cuarto año de Educación Media. 1,67 1,75 1,73 1,85 1,75 1,88 1,78 1,77 1,79
1,72 1,84 1,75 1,84 1,80 1,75 1,77 1,77 1,88
1,81 1,86 1,78 1,93 1,79 1,79 1,74 1,84 1,66
1,72 1,73 1,77 1,82 1,84 1,87 1,73 1,83 1,80
1,74 1,84 1,67 1,69 1,86 1,79 1,83 1,79 1,72
1,83 1,87 1,83 1,70 1,80 1,77 1,76 1,82 1,75
1,84 1,83 1,83 1,81 1,77 1,67 1,83 1,76 1,79
1,88 1,81 1,72 1,66 1,80 1,74 1,77 1,76 1,77
1,92 1,77 1,71 1,76 1,76 1,75 1,75 1,76
Realizar: a) Un cuadro de distribución de frecuencias (m=6) b) Describir F2, pa3 y P%5 c) Calcular la proporción de estudiantes que tiene una estatura igual o menor a 1,60 mts. d) Calcular el porcentaje de estudiantes con estatura igual o mayor a 1,80 mts.
27
10/10/2020
3.2. Tablas Estadísticas Compuestas (Dos o más variables) Datos sobre Sexo (M: Masculino; F: Femenino) y Rendimiento Académico (B=Bueno; R=Regular; D=Deficiente) de un grupo de estudiantes de la carrera de Psicología en el año 2014. SEXO
REND.
SEXO
REND.
SEXO
REND.
SEXO
REND.
M
B
F
D
M
R
F
R
M
R
M
B
M
B
M
R
F
B
F
B
F
D
F
B
F
D
M
D
M
B
M
R
M
R
F
B
F
B
M
B
F
D
F
R
F
R
F
D
M
R
M
R
F
B
F
R
F
R
F
D
F
R
F
D
F
B
M
R
M
R
M
D
F
B
M
R
M
B
M
R
Diseño de la tabla: Variable 1 Variable 2
TOTAL (Columnas)
F
P%
100%
F
P%
100%
TOTAL (Filas) F P%
Total general
100%
28
10/10/2020
Ejemplo del tabulado doble: SEXO
REND
SEXO
REND
SEXO
REND
SEXO
REND
SEXO
REND
M
B
F
D
M
R
F
R
F
B
M
R
M
B
M
B
M
R
F
B
F
B
F
B
F
D
F
B
M
R
F
D
M
D
M
B
M
R
M
R
M
R
F
B
F
B
M
B
M
R
F
D
F
R
F
R
F
D
M
B
M
R
M
R
F
B
F
R
M
D
F
R
F
D
F
R
F
D
M
R
SEXO
FEMENINO
RENDIMIENTO
P%
F 100 N
MASCULINO
TOTAL
F
P%
F
P%
F
P%
BUENO
8
38%
6
31%
14
35%
REGULAR
6
29%
11
58%
17
42%
DEFICIENTE
7
33%
2
11%
9
22%
TOTAL
21
100
19
100
40
99
Porcentajes por columnas: CUADRO Nº 8 ESTUDIANTES SEGÚN RENDIMIENTO ACADÉMICO POR SEXO CARRERA DE PSICOLOGÍA – GESTIÓN 2014 SEXO
FEMENINO
MASCULINO
TOTAL
F
P%
F
P%
F
P%
BUENO
8
38%
6
31%
14
35%
REGULAR
6
29%
11
58%
17
42,5%
DEFICIENTE
7
33%
2
11%
9
22,5%
21
100%
19
100%
40
100%
RENDIMIENTO
TOTAL
Fuente: Elaboración propia en base registros SIS, 2014
29
10/10/2020
Porcentajes por filas: CUADRO Nº 8 ESTUDIANTES SEGÚN RENDIMIENTO ACADÉMICO POR SEXO CARRERA DE PSICOLOGÍA – GESTIÓN 2014 FEMENINO
SEXO
MASCULINO
TOTAL
F
P%
F
P%
F
P%
BUENO
8
57%
6
43%
14
100%
REGULAR
6
35%
11
65%
17
100%
DEFICIENTE
7
78%
2
22%
9
100%
21
52%
19
48%
40
100%
RENDIMIENTO
TOTAL
Fuente: Elaboración propia en base registros SIS, 2014
Ejercicio 14:
Los siguientes datos corresponden a las variables sexo y Programa televisivo que prefieren un grupo de estudiantes de 2º semestre de Pedagogía en el año 2010. F M M M M M F F F F M
Noticias Documentales Documentales Documentales Novelas Noticias Novelas Noticias Deportivo Películas Películas
F F F F F F F M M F M
Noticias Películas Películas Novelas Novelas Películas Películas Deportivo Deportivo Noticias Películas
F F F F F M F M F F F
Películas Farándula Noticias Series Noticias Documentales Documentales Películas Farándula Películas Películas
M F F F F M F M F F F
Musical Películas Películas Películas Películas Deportivo Películas Películas Películas Películas Novelas
30
10/10/2020
Ejercicio 15: Los siguientes datos corresponden a la edad y situación laboral de un grupo de personas de la ciudad de Cbba. En el año 2010. 18 17 24 18 24 17 18 19 19 20 22 27 25 21 22
S S S S N N N S N S N N S S S
18 25 19 20 18 19 19 23 24 18 18 19 19 18 18
N N S N N N N S S S N N N N N
19 18 18 19 19 18 20 19 19 19 18 18 19 23 21
N N S N S N N N S S S S N N S
24 22 22 20 19 19 19 16 18 19 18 18 18 20 20
N S S S S N S S S S N S N S S
Presentación de Datos en GRÁFICOS 31
10/10/2020
DEFINICIÓN DE GRÁFICO ESTADÍSTICO: Un gráfico estadístico es una representación visual de una serie de datos estadísticos. Es una herramienta muy eficaz, ya que un buen gráfico: • Capta la atención del lector; • Presenta la información de forma sencilla, clara y precisa; • No induce a error; • Facilita la comparación de datos y destaca las tendencias y las diferencias; • Ilustra el mensaje, tema o trama del texto al que acompaña.
PARTES
32
10/10/2020
CLASIFICACIÓN:
Diagrama Circular o de Sector Gráfico de Anillo Diagrama de Barras (Simple y Múltiple) Perfil Radial Gráfico de Línea Gráfico de Área Diagrama de Caja Histograma de Frecuencias Polígono de Frecuencias Ojiva Diagrama de Dispersión Píctograma
1.- CICLOGRAMA O GRÁFICO DE SECTOR Son gráficos en los que a cada valor o modalidad se reasigna un sector circular de área proporcional a la frecuencia que representan. Se utilizan para representar una variable cualitativa o para comparar grupos. Para representarlo solo se emplea un tipo de frecuencia (absoluta o porcentaje)
INFORMACIÓN SOBRE EL CAMPO LABORAL DE LA CARRERA ELEGIDA Necesito informació n 26%
Alguna 65%
No, ninguna 3% Bastante 6%
33
10/10/2020
INFORMACIÓN SOBRE CAMPO LABORAL Necesito información; 16 Alguna; 40 No, ninguna; 2 Bastante; 4
2.- gráfico de anillos Al igual que un gráfico circular, un gráfico de anillos muestra la relación de las partes con un todo, aunque puede contener más de una única serie de datos Tipo de vivienda de los encuestados 15
3
21
Propia de mí
45
Propia de mis padres
Alquilada
Anticrético
34
10/10/2020
3.- DIAGRAMA DE BARRAS (COLUMNAS) a) Una variable Es un gráfico sobre ejes cartesianos en el que distribuimos en el eje X o eje de abscisa: Las modalidades si el carácter es cualitativo Los valores si la variable es no agrupada Sobre ellos se levantan barras o rectángulos de igual base (que no se solapen) cuya altura sea proporcional a sus frecuencias. También se suelen utilizar para series cronológicas y pueden, asimismo, representarse horizontalmente, intercambiando los ejes.
35
10/10/2020
CONEXION DE COMPUTADORAS 31,6
OPINION
No sabe 5,3
Si, en todas
47,4
Si, en algunas 15,8
No, en ninguna 0
10
20
30
40
50
b) Dos variables (Diagrama de Barras Múltiple) Cuando la intensión es comparar una o más series estadísticas con otra. El diagrama de barras múltiples, es un conjunto de barras simples identificados por distintos colores y sombreados, identificando esta distribución bajo el título de leyendas. Las barras serán puestas en el gráfico una al lado de las otras separando cada grupo de series de una de las variables.
36
10/10/2020
C) Dos variables (Diagrama de Barras PROPORCIONAL O ACUMULADO) Se emplea cuando la intensión es comparar una o más series estadísticas con otra. Se caracteriza por presentan en una sola figura geométrica datos cuyo conjunto forman un todo, mostrando la proporción de cada una de las partes con relación al total. La diferencia con las barras simples, dobles y múltiples está en que todos los datos están representados en una sola barra la cual esta dividida en porciones
UMSS: DISTRIBUCIÓN DEL PERSONAL ADMINISTRATIVO DE PLANTA SEGÚN SEXO. GESTIONES 2003 - 2007 1200 1000
334
800 600
224
215
214
531
515
524
2004
2005
400 200
249
603
691
0
2003
MASCULINO
2006
2007
FEMENINO
37
10/10/2020
4.- GRÁFICO DE LINEAS EVOLUCIÓN DE LA MATRICULA ESTUDIANTIL - UMSS GESTIONES 1994 - 2004
Estos gráficos se utilizan más que todo para representar variables de series cronológicas. En esta gráfica el tiempo (años, meses, días, etc.) se ubica en el eje horizontal (X), en el eje vertical (Y), llamada escala numérica o de valores, se representa el valor de los datos, ambas escalas son independientes. El gráfico puede representar una sola variable en función al tiempo o más de dos variables en función al tiempo.
60.000 49.640 47.336
50.000
MATRICULA
40.000
38.594 40.024
33.916 34.683 30.000 23.282
20.000
40.641
27.980 26.334 26.611
10.000 0 1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
GESTION
Fuente: SISS y Departamento de Registros e Inscripciones.
CRECIMIENTO DE LA POBLACIÓN URBANA Y RURAL EN BOLIVIA URBANA
RURAL
6.000.000
5.501.859 5.000.000
4.335.506
4.000.000
3.000.000
2.919.249
2.000.000
2.107.869
3.309.777 2.942.944
3.763.227 3.636.497
1.000.000
0
1976
1984
1994
2005
Fuente: INE
38
10/10/2020
5.- GRÁFICO DE ÁREAS Un gráfico de área es un gráfico de líneas en el que el área entre la línea y el eje aparece sombreada con un color. Estos gráficos normalmente se usan para representar los totales acumulados a lo largo del tiempo y son la forma convencional de visualizar líneas apiladas.
6.- PERFIL RADIAL Este tipo de gráficos se utiliza generalmente para representar variables cualitativa, pero aquellas que tengan más de 4 categorías, caso contrario la figura del gráfico es diferente de su referencia habitual. En esta gráfica los ejes son polígonos concéntricos, donde cada polígono representa las frecuencias, y los vértices externos muestran las categorías o valores de la variable.
39
10/10/2020
7.- HISTOGRAMA DE FRECUENCIAS
Se usa para representar gráficamente las distribuciones de frecuencias absolutas o relativas de datos cuantitativos continuos agrupados en clases. El fenómeno estudiado queda representado por una serie de rectángulos semejantes a los del diagrama de barras; sin embargo las barras de histograma se colocan solo verticalmente y debe ir uno al lado de las otras sin que haya un espacio que las separe. La base de cada rectángulo es la amplitud del intervalo de clase correspondiente.
UMSS: DISTRIBUCIÓN DE DOCENTES SEGÚN ANTIGÜEDAD 350
323
300
Frecuencia
250
202
200
156
215 178
150
118
100
63
50 0
16 0–4
5–9
10 – 14
15 – 19
20 – 24
25 – 29
30 – 34
35 – 39
ANTIGUEDAD Fuente: Unidad de Recursos Humanos, 2007
40
10/10/2020
8.- POLÍGONO DE FRECUENCIAS Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de las bases superiores de los rectángulos en el histograma, o también se puede construir solo sin el histograma. Este gráfico sirve para variables cuantitativas continuas. Para elaborar el polígono se deben buscar las marcas de clase en cada intervalo (Xm), las cuales Irán en el eje X y las frecuencias absolutas o relativas en el eje Y.
UMSS: DOCENTES SEGÚN ANTIGÜEDAD GESTIONES 2007 Y 2008 600
2007
2008
37
42
500
400
300
200
100
0
0
2
7
12
17
22
27
32
Fuente: Unidad de Recursos Humanos,
41
10/10/2020
9.- OJIVA (Mayor Que)
También llamada Polígono de Porcentajes Acumulados, es la representación gráfica de una distribución de frecuencias relativas acumuladas (Porcentajes acumulados), considerando los limites reales superiores. permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. 120 100 80 60 40 20 0 142,5
147,5
152,5
157,5
162,5
167,5
ESTATURA (cm)
10.- DIAGRAMA DE CAJA
172,5
177,5
188,5
194,5
a) Una variable
El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa continua. El gráfico permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc. Se compone de: •
•
•
Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2) Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza en el tercer cuartil y acaba en el máximo. Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen ciertos requisitos de heterogeneidad de los datos.
42
10/10/2020
8.- DIAGRAMA DE CAJA
b) Dos variables cualitativa)
(Una variable cuantitativa con
43
10/10/2020
11.- DIAGRAMA DE DISPERSIÓN (dos variables cuantitativas)
12.-GRÁFICO DE PIRÁMIDE DE POBLACIÓN Es una representación gráfica de las características de una población perteneciente a una localidad, ciudad o país, en un momento en el tiempo. Se muestra con barras en posición horizontal, la longitud de cada barra tiene una relación directamente y proporcional al número de individuos de la población. Generalmente se emplean rangos de edades que son quinquenales (por ejemplo de 0 a 4 años, de 5 a 9 años, 10 a 14 años y así sucesivamente). No obstante, tal como vemos en la siguiente imagen, los rangos pueden ser diferente
44
10/10/2020
13.-PICTOGRAMAS Son gráficos con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a la frecuencia que representan; dicha frecuencia se suele representar. Los pictogramas pueden comparan las frecuencias entre diferentes categorías o períodos de tiempo.
45
10/10/2020
46
10/10/2020
Resumen de gráficos estadísticos GRÁFICO
TIPO DE VARIABLE
# DE VARIABLES
DIAGRAMA DE SECTOR O TORTA
Cualitativas y Cuantitativas Discretas
Una variable
PICTOGRAMA
Cualitativas y Cuantitativas indistintamente
Una o más variable
PERFIL RADIAL
Cualitativas
Una variable
GRAFICO DE LÍNEA
Temporales o de Series Cronológicas
Una o dos variables
DIAGRAMA DE BARRAS SIMPLE
Cualitativas o Cuantitativas Discretas
Una variable
DIAGRAMA DE BARRAS DOBLE Y MÚLTIPLE
Cualitativas o Cuantitativas Discretas
Dos variables
DIAGRAMA DE BARRAS PROPORCIONAL
Cualitativas o Cuantitativas Discretas
Dos variables
HISTOGRAMA
Cuantitativas Continuas
Una variable
POLÍGONO
Cuantitativas Continuas
Una o dos variables
OJIVA
Cuantitativas Continuas
Una variable
Programa SPSS 47
10/10/2020
Origen e historia En 1968, Norman Nie, mientras se encontraba Proceso Cuantitativo estudiando para graduarse pordel laAnálisis Washington University, tuvo que enfrentarse a la desalentadora tarea de analizar una ingente cantidad de información. Para la elaboración de su tesina, realizó un cuestionario a lo largo de 7 países, de ello obtuvo miles de respuestas de fuentes individuales. Resultaba muy complicado trabajar con tal ¿EN QUÉ CONSISTE EL ANÁLISIS cantidad de información, por lo cual, juntoESTADÍSTICO? a2 jóvenes ingenieros informáticos creó este software estadístico.
Norman Nie
El primitivo SPSS le facilitó enormemente el tratamiento y análisis de información para su tesina (Revista digita IBM SPSS, 2017)
El IBM SPSS es un software o Proceso del Análisis programa de los más conocidos en Cuantitativo el mundo si se tiene en cuenta su Proceso del Análisis Cuantitativo capacidad para trabajar con grandes bases de datos y una simple y sencilla interfaz que se utiliza para la mayoría de los análisis realizados en este. SPSS son las siglas de ‘’Stadistical ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? Package for the social Sciences’’ que en su traducción español ¿ENal QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? quedaría como “Paquete estadístico para las ciencias sociales’’ (Revista digita IBM SPSS, 2017)
48
10/10/2020
Versiones del programa SPSS 1 - 1968 SPSSx release 2 - 1983 (para grandes servidores tipo UNIX) Proceso del Análisis Cuantitativo SPSS 5.0 - diciembre 1993 SPSS 6.1 - febrero 1995 SPSS 7.5 - enero 1997 SPSS 8.0 - 1998 SPSS 9.0 - marzo 1999 SPSS 10.0.5 - diciembre 1999 SPSS 10.0.7 - julio 2000 SPSS 10.1.4 - enero 2002 SPSS 11.0.1 - abril 2002 SPSS 11.5.1 - abril 2003 SPSS 12.0.1 - julio 2004 ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? SPSS 13.0.1 - marzo 2005 (Permite por primera vez trabajar con múltiples bases de datos al mismo tiempo.) SPSS 14.0.1 - enero 2006 SPSS 15.0.1 - noviembre 2006 SPSS 16.0.1 - noviembre 200
SPSS 17.0.1 - noviembre 2008 SPSS 16.0.2 - abril 2008 SPSS Statistics 17.0.1 - diciembre 2008 (Incorpora aportes importantes como el ser multilenguaje).) SPSS Statistics 17.0.2 - marzo 2009del Análisis Cuantitativo Proceso PASW Statistics 17.0.3 - septiembre 2009 (IBM adquiere los derechos y cambia su denominación de SPSS por PASW 18) PASW Statistics 18.0 - agosto 2009 PASW Statistics 18.0.1 - diciembre 2009 PASW Statistics 18.0.2 - abril 2010 PASW Statistics 18.0.3 - septiembre 2010 IBM SPSS Statistics 19.0 - agosto 2010 IBM SPSS Statistics 19.0.1 - diciembre 2010 IBM SPSS Statistics 20.0 - agosto 2011 ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? IBM SPSS Statistics 20.0.1 - marzo 2012 IBM SPSS Statistics 21.0 - agosto 2012 IBM SPSS Statistics 22.0 - agosto 2013 IBM SPSS Statistics 23.0 - agosto 2014 IBM SPSS Statistics 24.0 - junio 2016 IBM SPSS Statistics 25.0 - marzo 2017 IBM SPSS Statistics 26.0 - 2019
49
10/10/2020
Módulos del programa • Modelos de Regresión Proceso del Análisis Cuantitativo • Modelos Avanzados: Reducción de datos, Clasificación y Pruebas no paramétricas • Tablas • Tendencias • Categorías • Análisis • Pruebas Exactas • Análisis de Valores Perdidos ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? • Muestras Complejas • SamplePower (cálculo de tamaños muestrales) • Árboles de Clasificación. • Validación de Datos (Wikipedia, 13-07-2020)
¡Gracias por su atención!
50
20/10/2020
UNIDAD 2: INTRODUCCIÓN AL ENTORNO DEL PROGRAMA SPSS M.Sc. Jimmy Delgado Villca
Encuesta y Operacionalización de variables
1
20/10/2020
Encuesta Es una técnica que persigue conocer la opinión, posición de un sector de la población que es objeto de observación o estudio. Tiene que ver con un problema científico, ubicada en tiempo y espacio determinados. La encuesta se hace a través de formularios. Las preguntas deberán ser ordenadas lógica y coherentemente (Agreda, 2003, p. 46)
PREGUNTAS
PREGUNTAS
CERRADAS
ABIERTAS
• Contienen categorías o alternativas, para respuestas, que han sido delimitadas por el investigador. • Fáciles de codificar y preparar para su análisis. • Para formular las preguntas, es necesario anticipar las respuestas posibles.
•
• •
•
Útiles cuando no hay información sobre las posibles respuestas. Para profundizar los motivos de un comportamiento. Difíciles de codificar, clasificar y preparar para su análisis. Puede presentar sesgos de distinta naturaleza. Ej. dificultad para expresarse.
2
20/10/2020
Reglas para el diseño de cuestionarios ● ● ● ●
● ●
●
Hacerlos cortos Utilizar términos claros y precisos, y una redacción sencilla. El tamaño debe facilitar su manejo. Los espacios de llenado deberán ser suficientes para las respuestas. Señalar siempre en su cuerpo los objetivos que persigue. De preferencia, hacer preguntas cerradas, para facilitar el procesamiento de la información. Adjuntar instrucciones para su manejo.
Operacionalización de variables Operacionalizar es definir las variables para que sean medibles y manejables, significa definirlas operativamente. Un investigador necesita traducir los conceptos (variables) a hechos observables para lograr su medición. Las definiciones señalan las operaciones que se tienen que realizar para medir la variable, de forma tal, que sean susceptibles de observación y cuantificación. De acuerdo con Hempel (1952:50): “la definición operacional de un concepto
consiste en definir las operaciones que permiten medir ese concepto o los indicadores observables por medio de los cuales se manifiesta ese concepto.”
3
20/10/2020
Proceso de Operacionalización de Variables
Variable teórica
Concepto Definición conceptual
Dimensiones Definición operacional de cada dimensión
Variable empírica
Indicadores
OPERACIONALIZACIÓN DE VARIABLES E INSTRUMENTOS DE RECOLECCIÓN DE DATOS Observación
VARIABLE
CONCEPTUALIZACION Definición Conceptual
V1
DEFINICION
OPERACIONALIZACION Dimensiones
Indicadores
DIMENSION 1
INDICADOR 1
Itemes (preguntas) ITEM 1 ITEM 2
Cuestionario
INDICADOR 2 DIMENSION 2 DIMENSION 3
Entrevista Test
APLICACIÓN DE LA ESTADÍSTICA
DATOS
4
20/10/2020
CONCEPTUALIZACIÓN Y OPERACIONALIZACIÓN DE VARIABLES Variable (como concepto)
Accesibilidad a los servicios de salud
Definición conceptual
Mayor o menor posibilidad de tomar contacto con los servicios de salud para recibir asistencia
Dimensiones (variables contenidas en la definición conceptual) •
Indicadores
Items
•
1.Accesibilidad geográfica
2.Accesibilidad económica
3.Accesibilidad cultural
Tiempo medido en horas y minutos que tarda una persona para trasladarse de su domicilio al centro de salud. Distancia en Km recorrida
• Cantidad de dinero que gasta para recibir la atención. • Disponibilidad económica para cubrir ese gasto.
• Conocimientos sobre la atención que se da en el centro de salud. • Percepción del problema de salud.
EJEMPLO 1 VARIABLE
Accesibili dad a los servicios de salud
DEFINICIÓN CONCEPTUAL
Mayor o menor posibilidad de tomar contacto con los servicios de salud para recibir asistencia
DIMENSIONES
Accesibilidad Geográfica
INDICADORES
•
• Accesibilidad económica
• •
Accesibilidad cultural
•
•
ITEMS
INSTRUMENTO
Tiempo medido en horas y minutos que tarda una persona para trasladarse de su domicilio al centro de salud. Distancia en Km recorrida
¿Dónde vive? ¿Cuánto tiempo tarda en trasladarse de su casa al centro de salud? ¿Qué distancia recorre de su casa al CS?
Cuestionario
Cantidad de dinero que gasta para recibir la atención. Disponibilidad económica para cubrir ese gasto.
¿Cuánto dinero gasta al mes en la atención médica? ¿Trabaja?; ¿Cuál es su ocupación? ¿Cuánto es su ingreso mensual?
Cuestionario
Conocimientos sobre la atención que se da en el centro de salud. Percepción del problema de salud.
¿Conoce la atención que se da en el CS? ¿Cómo se entero de la atención que realiza el CS? ¿Qué hace cuando se enferma? ¿Con qué frecuencia va al CS?
Cuestionario
5
20/10/2020
EJEMPLO 2 VARIABLE
Desempeño de los estudiantes en la formación virtual
DIMENSIONES
1.- Entrega de trabajos
2.- Participación en clases de videoconferenci a
INDICADORES
1.1.- Número de trabajos realizados 1.2.- Número de trabajos no realizados 1.3.- Entrega de trabajos retrasados 1.4.- Trabajos individuales
1.5.- Trabajos grupales
ITEMS
¿Cuántos trabajos entrego?
INSTRUMENTO
Cuestionario
¿Cuántos trabajos no entrego? ¿Entrego algunos trabajos después de la fecha límite? ¿Con qué frecuencia realiza trabajos individuales? ¿Cuántos trabajos realizó de forma individual? ¿Con qué frecuencia realiza trabajos grupales? ¿Cuántos trabajos realizó de forma grupal?
3.- Trabajos en grupo
Grado de Confiabilidad Este coeficiente consiste en la media de las correlaciones entre las variables que forman parte de la escala, y puede calcularse de dos maneras: a partir de las varianzas (Alfa de Cronbach) o de las correlaciones de los ítems (Alfa de Cronbach estandarizado) (Psicología y mente, 2020)
De 0,0 a 0,2 MUY BAJA De 0,2 a 0,4 BAJA De 0,4 a 0,6 MODERADA De 0,6 a 0,8 BUENA De 0,8 a 1,0 ALTA
6
20/10/2020
Presentación de Datos en Tablas TABLAS de distribución de frecuencias
Permiten organizar y sistematizar losdatos en bruto a través de la TABULACIÓN, para establecer tendencias o patrones que facilitan su descripción e interpretación.
7
20/10/2020
CUESTIONARIO
DATOS:
I. DATOS GENERALES Nombre y Apellidos: ___________________ Edad: ______________ Sexo: V M II. PREGUNTAS 1. ¿Qué refrescos te gusta tomar? Coca Cola (C) Fanta (F) Sprite (S) Pepsi (P) Mineragua (M) La Cascada (L) Jugos del Valle (J) Otros…………… 2. ¿Cuántos hermanos tienes? o - 1 - 2 - 3 - 4 - 5 - más de 5 3. ¿Cuántas horas estudias al día? o - 1 - 2 - 3 - 4 - 5 - más de 5 4. ¿Te gusta escuchar música? Si No 5. ¿Cuál es tu rendimiento académico? Bueno Regular Deficiente
EDAD: 21 20 19 19 20 20 19 21 21 22 22 20 22 19 19 20 20 20 21 21 21 23 20 19 19 21 20 20 22 27 22 27 21 20 19 20 19 19 19
REFRESCOS: C F S C S S F F J P P F S C P M L F F M M L J L M C C F C L J P S P L F M M J C C S P J M C F M M C P M L C F L J S P
1.- Partes o elementos Código: o numeración que permite ordenar la presentación de los cuadros. El título: primario: ¿Qué? (Población o Unidad de Observación), ¿Cómo? (Variable) y secundario: ¿Dónde? (Lugar o institución), ¿Cuándo? (Tiempo expresado en mes y año) Matriz: conformado por la primera fila (Variable y frecuencias) y primera columna (Variable y sus valores) del cuadro. Cuerpo: Son las celdas o cedulas donde están las cifras numéricas. Notas aclaratorias o Fuente: en donde se menciona la fuente de los datos o algunas notas aclaratorias.
8
20/10/2020
CODIGO
CUADRO Nº 1:
DOCENTES SEGÚN NÚMERO DE HIJOS
TITULO
F
Fa
p
pa
P%
Pa%
1
10
10
0,15
0,15
15%
15%
2
22
32
0,33
0,48
33%
48%
3
16
48
0,24
0,72
24%
72%
4
12
60
0,18
0,90
18%
90%
5
4
64
0,06
0,96
6%
96%
6
3
67
0,04
1,00
4%
100%
TOTAL
67
--
1,00
--
100%
--
MATRIZ
Nº DE HIJOS
Fuente: Elaboración propia en base a cuestionario aplicado en junio de 2015
CUERPO
FACULTAD DE HUMANIDADES – UMSS - 2003
NOTAS ACLARATORIAS
2. Frecuencias a) Absolutas Frecuencia Absoluta (F) Es el número de veces u observaciones que se repite el valor de la variable en la tabla.
F F F F ..... F N 1
2
3
I
Frecuencia Absoluta Acumulada (Fa) Resulta de considerar la misma frecuencia absoluta más las frecuencias anteriores a esta.
Fa1 F1; Fa2 F1 F2 ; Fai F1 F2 ..... Fi
9
20/10/2020
b) Relativas Proporción (p) Son frecuencias relativas ya que su referente es la unidad y no la totalidad, que debe redondearse hasta dos decimales después de la coma. Fórmula:
p
F N
p p p 1
2
p3..... pi 1
Proporción acumulada (pa) Resulta de considerar la proporción acumulada mas las anteriores a esta.
pa1 p1; pa2 p1 p2 ; pai p1 p2..... pi
Porcentaje (P%) Tiene como referente al 100 como valor máximo, se redondean a entero. Fórmula:
P%
F 100 N
P% P P P ..... P 100 1
2
3
i
Porcentaje acumulado (Pa%) Es el mismo porcentaje más la suma de los anteriores porcentajes a este.
Pa1 P1; Pa2 P1 P2 ; Pai P1 P2 ..... Pi
10
20/10/2020
3. ELABORACIÓN DE TABLAS
3.1. Tablas Estadísticas Simples (Una Variable) a) Variable Cualitativa Datos sobre la preferencia de refrescos, obtenidos en una encuesta aplicada a 60 pobladores de Cbba. el año 2015. Donde: Coca Cola (C), Fanta (F), Sprite (S), Pepsi (P), Mineragua (M), La Cascada (L), Jugos del Valle (J).
C F L F M
C S M M M
F C C M C
S P C J P
C M F C M
S L C C L
S F L S C
F F J P F
F M P J L
J M S M J
P L P C S
P J L F P
CUADRO Nº 1 POBLADORES SEGÚN PREFERENCIA DE REFRESCO CIUDAD DE COCHABAMBA – 2015
REFRESCO
COCA COLA
F
Fa
p
pa
P%
Pa%
FANTA SPRITE PEPSI
MINERAGUA
LA CASCADA
JUGOS DEL VALLE TOTAL
Fuente: Encuesta , junio de 2005
11
20/10/2020
C
C
F
S
C
S
F
S
C
P
M
L
L
M
C
C
F
C
F
M
M
J
C
C
M
M
C
P
M
L
S
F
F
J
P
P
MINERAGUA
F
F
M
M
L
J
LA CASCADA
L
J
P
S
P
L
JUGOS DEL VALLE
S
P
J
M
C
F
TOTAL
C
F
L
J
S
P
REFRESCO
F 12
COCA COLA FANTA SPRITE PEPSI
CUADRO Nº 1 POBLADORES SEGÚN PREFERENCIA DE REFRESCO CIUDAD DE COCHABAMBA – 2015
REFRESCO
F
Fa
10
22
8
37
COCA COLA
12
SPRITE
7
FANTA PEPSI
MINERAGUA
10
JUGOS DEL VALLE
6
LA CASCADA
TOTAL
p
12
0,20
29
47
P%
Pa%
17%
37%
0,2
20%
0,12
0,49
12%
49%
0,17
0,79
17%
79%
0,1
1,01
0,17
0,13
7
54
0,12
60
--
1,01
60
pa
0,37
0,62
13%
0,91
12%
--
101%
10%
20%
62% 91%
101% --
Fuente: Elaboración propia en base a encuesta , junio de 2015
12
20/10/2020
Ejercicio 1: Suponga que después de una encuesta sobre los sabores de los helados PANDA se ha establecido las siguientes preferencias: granizado (G), dulce de leche (L), frutilla (F), vainilla (V), chocolate (C), tumbo (T) y durazno (D). Entre 65 encuestados
C T F C C
C C G G F
G G D F L
L V C C V
C D L L F
G T V C D
T C T G D
V L D F T
G G C G C
L D F C V
F V L L F
G C T F L
F V L D G
CUADRO Nº 2 ENCUESTADOS SEGÚN PREFERENCIA DE SABORES DE HELADO
SABORES
F
Fa
p
pa
P%
Pa%
GRANIZADO
11
11
0,17
0,17
17%
17%
DULCE DE LECHE
10
21
0,15
0,32
15%
32%
FRUTILLA
10
31
0,15
0,47
15%
47%
VAINILLA
7
38
0,11
0,58
11%
58%
CHOCOLATE
14
52
0,22
0,80
22%
80%
TUMBO
6
58
0,09
0,89
9%
89%
DURAZNO
7
65
0,11
1,00
11%
100%
65
---
1,00
---
100%
---
TOTAL Fuente: Elaboración propia
13
20/10/2020
Descripción de frecuencias: F1 = 11 • •
Una cantidad (Frecuencia) de 11 encuestados prefieren el sabor Granizado. Por cada 65 encuestados, 11 de ellos responden que prefieren el helado granizado. Fa3 = 31 Una frecuencia de 31 encuestados prefieren los sabores de helado granizado, dulce de leche y frutilla.
Descripción de proporciones: p5 = 0,22
Una proporción de 0,22 encuestados prefieren el sabor de helado Chocolate. La probabilidad de que un sujeto elija el sabor chocolate es de 0,22 es decir, una probabilidad baja.
pa2 = 0,32 Una proporción de 0,32 encuestados prefieren los sabores de helado granizado y dulce de leche. La probabilidad de que un sujeto elija los sabores granizado y dulce de leche es de 0,32 vale decir, una probabilidad baja.
14
20/10/2020
Descripción de porcentajes: P%3 = 15%
El 15% de los encuestados prefieren el sabor de helado frutilla. La probabilidad de que un sujeto prefiera el helado de frutilla es del 15% es decir una probabilidad muy baja. Por cada 100 personas, 15 de ellas prefieren el sabor frutilla.
P%a4 = 58%
Un 58% de la población prefiere los sabores de helado vainilla, dulce de leche, granizado y frutilla. Existe una probabilidad del 58% (probabilidad media) de que un sujeto prefiera los sabores de helado vainilla, dulce de leche, granizado y frutilla.
Ejercicio 2: Datos sobre la Religión, obtenidos en una encuesta aplicada a 59 estudiantes de 2º semestre de la materia de Estadística I, en septiembre de 2010. Donde: Evangélico (E), Católico (C), Ateo (A), Testigo de Jehová (TJ), Otros/Ninguno (ON).
E A A C C
C C E C C
C E C C C
E C C ON ON C C C E C C TJ E C A
C C C C C
C E C E E
C C E C E
C E C C E
E ON ON ON C C C ON E
15
20/10/2020
CUADRO Nº 3 ESTUDIANTES SEGÚN RELIGIÓN 2º SEMESTRE – II/2010
RELIGIÓN
F
Fa
p
pa
P%
Pa%
EVANGÉLICO CATÓLICO ATEO TESTIGO DE JEHOVA OTROS/NINGUNO TOTAL Fuente: Encuesta , septiembre de 2010
b) Variable Cuantitativa Discreta Con el objeto de premiar a los titulados más sobresalientes del semestre II/2014, la Dirección Académica de la Fac. de Humanidades ha efectuado un conteo del número de materias reprobadas por parte de 56 titulados, con los siguientes resultados.
Valor Máximo
2-5–4–2–7–5–2–2–5–4–0–4–3–4 3-5–2–5–4–5–4–7–2–2–2–4–7–7 4-4–2–5–4–0–4–2–0–5–8–4–2–5 5-2–4–0–2–5–2–4–5–0–4–3–1–0 Valor Mínimo
16
20/10/2020
2 2 3 4 2 2 0 5 2 1
5 2 4 5 4 5 5 2 4 0
4 5 3 4 7 4 8 4 5
2 4 5 7 7 0 4 0 0
7 0 2 2 4 4 2 2 4
5 4 5 2 4 2 5 5 3
F
Nº MAT. REPROB.
0 1 2 3 4 5 6 7 8 TOTAL
CUADRO Nº 4 TITULADOS SEGÚN Nº DE MATERIAS REPROBADAS FAC. HUMANIDADES – GESTIÓN II/2014 Nº MAT. REPROB.
F
Fa
p
pa
P%
Pa%
0
6
6
0,11
0,11
11%
11%
1
1
7
0,02
0,13
2%
13%
2
14
21
0,25
0,38
25%
38%
3
3
24
0,05
0,43
5%
43%
4
15
39
0,27
0,70
27%
70%
5
12
51
0,21
0,91
21%
91%
6
0
51
0,00
0,91
0%
91%
7
4
55
0,07
0,98
7%
98%
8
1
56
0,02
1,00
2%
100%
TOTAL
56
--
1,00
--
100%
--
Fuente: Cuestionario, 2004
17
20/10/2020
Ejercicio 3: Los siguientes datos corresponden al número de hermanos de un grupo de estudiantes de 2do semestre de la carrera de Ciencias de la Educación (2011).
4
3
5
5
3
6
1
3
5
5
5
7
8
2
4
7
3
4
3
3
4
8
4
8
1
4
1
6
6
4
3
6
4
2
4
3
9
4
8
8
3
3
5
CUADRO Nº 5 ESTUDIANTES DE 2DO SEMESTRE SEGÚN NÚMERO DE HERMANOS Nº de Hermanos
F
Fa
p
pa
P%
Pa%
1 2 3 4 5 6 7 8 9 TOTAL Fuente: Cuestionario, 2011
18
20/10/2020
Ejercicio 4: Con los siguientes datos que corresponden a los años de servicio de 60 empleados de la empresa QUIMBOL, en el año 2004, realizar un cuadro de distribución.
4 3 8 7 6
3 8 3 9 7
4 10 5 8 8
5 6 7 10 7 8 7 6 6 7
7 8 9 10 9 10 7 8 6 10 9 7 5 7 10 8 6 8 10
8 10 8 9
4 8 5 8
8 6 8 7 3 8 10 7
Ejercicio 5: Los siguientes datos corresponden a las horas de estudio/día de los estudiantes de 2º semestre en la gestión II/2007.
5
1
5
5
4
5
3
4
5
4
4
4
5
5
4
5
2
2
6
2
5
6
5
5
4
5
5
3
3
1
2
4
3
4
5
6
2
1
3
3
5
5
2
4
5
6
4
2
4
4
3
19
20/10/2020
Ejercicio 6:
F p N F p* N
CUADRO Nº 6 ESTUDIANTES DE 2DO SEMESTRE POR HORAS DE ESTUDIO HORAS DE ESTUDIO
F
Fa
p
pa
1
3
0,06
0,06
2
7
0,14
0,20
3
P%
Pa%
100
---
0,34 0,59
5
0,92
6
1
TOTAL
51
---
1
---
Fuente: Cuestionario, 2007
c) Variable Cuantitativa Continua (Tabla con Intervalos de Clase) Pasos a seguir:
Ubicar el datos más pequeño y el más alto (VMIN y VMAX) Calcular la Amplitud Total (A) A = (VMAX – VMIN) + 1 Determinar el número de intervalos de clase (m)
m
m
N
A i
Calcular el recorrido de intervalo (i)
i
A m
20
20/10/2020
Ejemplo: Información sobre las notas de los estudiantes en la Materia de Estadística II, el año 2012. Valor Máximo
63
69
48
35
100
53
75
63
72
63
45
72
36
42
25
25
50
85
42
50
49
39
82
90
90
36
45
70
45
80 21
82 72
75
57
36
38
65
30
40
50
30
28
57
71
81
41
67
58
72
75
57
50
63
35
41
67
40 22
58
Valor Mínimo
Amplitud total:
A (VMAX VMIN ) 1 A (100 21) 1 A 80
Número de Intervalos:
m
N
m
60
m 7 , 74 m 8
Recorrido de Intervalo:
A m 80 i 8 i 10unidades i
21
20/10/2020
Construcción de la Tabla INTERVALOS DE CLASE
F
p
P
m = 8 intervalos de clase
21 - 30 31 - 40 41 - 50 51 - 60 61 - 70 71 - 80 81 - 90 91 - 100 i = 10 unidades
Comprobación del recorrido de intervalo (i) Primer intervalo de clase: 21 - 30 Límite Superior de Clase (Ls)
Límite Inferior de Clase (Li)
21 - 22 - 23 - 24 - 25 - 26 - 27 - 28 - 29 - 30 i = 10 unidades i = (Ls – Li) + 1
= (30 - 21) + 1
= 9 + 1 = 10
22
20/10/2020
CUADRO Nº 7 ESTUDIANTES SEGÚN NOTAS MATERIA ESTADISTICA EDUCATIVA II – GESTIÓN 2012 TARJAS
NOTAS
F
Fa
p
pa
P%
Pa%
21 - 30 31 - 40 41 - 50 51 - 60 61 - 70 71 - 80 81 - 90 91 - 100 TOTAL Fuente: Elaboración propia en base a registro de notas materia estadística, 2005
Ejemplo del tarjado: 63
69
48
30
100
53
75
63
30
40
67
58
49
39
70
80
82
57
36
28
57
57
50
40
90
72
63
45
72
36
42
25
50
30
72
75
82
90
45
21
72
38
65
71
81
63
35
22
36
45
25
50
75
85
42
50
41
41
67
58
F 8
p
P
TARJAS
NOTAS 21 - 30 31 - 40 41 - 50 51 - 60 61 - 70
8
13 6 9
81 - 90
9 6
91 - 100
1
71 - 80
TOTAL
23
20/10/2020
CUADRO Nº 7 ESTUDIANTES SEGÚN NOTAS MATERIA ESTADISTICA EDUCATIVA II – GESTIÓN 2012 NOTAS
F
Fa
p
pa
P%
Pa%
21 - 30
8
8
0,13
0,13
13%
13%
31 - 40
8
16
0,13
0,26
13%
26%
41 - 50
13
29
0,22
0,48
22%
48%
51 - 60
6
35
0,10
0,58
10%
58%
61 - 70
9
44
0,15
0,73
15%
73%
71 - 80
9
53
0,15
0,88
15%
88%
81 - 90
6
59
0,10
0,98
10%
98%
91 - 100
1
60
0,02
1,00
2%
100%
TOTAL
60
--
1,00
--
100%
--
Fuente: Elaboración propia en base a registro de notas materia estadística, 2012
Ejercicio 7:
ESTUDIANTES SEGÚN NOTAS
MATERIA ESTADISTICA EDUCATIVA II – GESTIÓN 2010
NOTAS
P%
Pa%
21 - 36
20
20
37 - 52
28
48
-
22
70
69 - 84
23
93
- 100 TOTAL
F
Fa
p
pa
4 60
--
1,00
--
100%
--
Fuente: Elaboración propia en base a registro de notas materia estadística, 2005
24
20/10/2020
Ejercicio 8:
ESTUDIANTES SEGÚN CALIFICACIONES ESTADÍSTICA – GESTIÓN 2015
CALIFICACIÓN 37 -
F
Fa
p
pa
-
P% 3%
11%
49 - 54
19%
-
22%
-
8%
-
22%
-
79 -
TOTAL
Pa%
8% 150
--
--
7%
100%
--
Ejercicio 9: Puntuaciones obtenidas en un test psicológico (2008).
56 28 42 56 47 78 82 55 56 41 68 48 56 42 60 62 54 42 48 53 48 47 52 50 39 44 47 52 42 68 62 54 66 55 57 65 38 62 37 72 81 67 76 76 52 39 38 29 79 76 Elaborar una tabla con 5 intervalos de clase, con todas las frecuencias.
25
20/10/2020
A (VMAX VMIN ) 1
Amplitud total:
A (82 28) 1 A 55
Número de Intervalos:
m5 A m 55 i 5 i 11unidades i
Recorrido de Intervalo:
PUNTUACIONES EN TES DE PSICOLOGÍA
NOTAS
F
Fa
p
pa
--
1,00
--
P%
Pa%
28 - 38 39 - 49 50 - 60 61 - 71 72 - 82 TOTAL
--
26
20/10/2020
Ejercicio 10: Los siguientes datos corresponden a las calificaciones de los estudiantes en la materia de estadística durante la gestión 2016.
59 48 53 47 57 64 62 62 65 57 81 83 48 61 60 37 51 51 63 81 60 77 71 57 82 66 76 50 57 58 52 57 40 53 66 71 61 61 55 59 50 59 69 67 66 47 56 60 43 54 47 81 53 61 70 50 76 47 50 63 65 54 73 76 Elaborar una tabla con recorrido de 6 unidades, con todas las frecuencias.
Ejercicio 11:
Se tiene los pesos, en kg., de un grupo de alumnos de primero de la escuela “María Micaela” en la gestión 2017: 45, 42, 48, 46, 39, 57, 48, 57, 68, 64, 56, 48, 60, 53, 58, 72, 59, 46, 62, 53, 59, 64, 70, 56, 62, 48, 56, 61, 58, 50, 48, 53, 58, 59, 62, 52, 63, 70, 44, 55, 51, 58.
27
20/10/2020
Ejercicio 12: Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas: a) Obténgase una distribución de datos en intervalos de amplitud 5, b) Calcúlese el porcentaje de personas de peso menor que 65 Kg. c) ¿Cuántas personas tienen peso mayor o igual que 70 Kg. pero menor que 85?
60 ; 66 ; 77 ; 70 ; 66 ; 68 ; 57 ; 70 ; 66 ; 52 ; 75 ; 65 ; 69 ; 71 ; 58 ; 66 ; 67 ; 74 ; 61 ; 63 ; 69 ; 80 ; 59 ; 66 ; 70 ; 67 ; 78 ; 75 ; 64 ; 71 ; 81 ; 62 ; 64 ; 69 ; 68 ; 72 ; 83 ; 56 ; 65 ; 74 ; 67 ; 54 ; 65 ; 65 ; 69 ; 61 ; 67 ; 73 ; 57 ; 62 ; 67 ; 68 ; 63 ; 67 ; 71 ; 68 ; 76 ; 61 ; 62 ; 63 ; 76 ; 61 ; 67 ; 67 ; 64 ; 72 ; 64 ; 73 ; 79 ; 58 ; 67 ; 71 ; 68 ; 59 ; 69 ; 70 ; 66 ; 62 ; 63 ; 66.
Ejercicio 13: Consideremos los siguientes datos, expresados en metros, correspondientes a las estaturas de 80 estudiantes de Cuarto año de Educación Media. 1,67 1,75 1,73 1,85 1,75 1,88 1,78 1,77 1,79
1,72 1,84 1,75 1,84 1,80 1,75 1,77 1,77 1,88
1,81 1,86 1,78 1,93 1,79 1,79 1,74 1,84 1,66
1,72 1,73 1,77 1,82 1,84 1,87 1,73 1,83 1,80
1,74 1,84 1,67 1,69 1,86 1,79 1,83 1,79 1,72
1,83 1,87 1,83 1,70 1,80 1,77 1,76 1,82 1,75
1,84 1,83 1,83 1,81 1,77 1,67 1,83 1,76 1,79
1,88 1,81 1,72 1,66 1,80 1,74 1,77 1,76 1,77
1,92 1,77 1,71 1,76 1,76 1,75 1,75 1,76
Realizar: a) Un cuadro de distribución de frecuencias (m=6) b) Describir F2, pa3 y P%5 c) Calcular la proporción de estudiantes que tiene una estatura igual o menor a 1,60 mts. d) Calcular el porcentaje de estudiantes con estatura igual o mayor a 1,80 mts.
28
20/10/2020
3.2. Tablas Estadísticas Compuestas (Dos o más variables) Datos sobre Sexo (M: Masculino; F: Femenino) y Rendimiento Académico (B=Bueno; R=Regular; D=Deficiente) de un grupo de estudiantes de la carrera de Psicología en el año 2014. SEXO
REND.
SEXO
REND.
SEXO
REND.
SEXO
REND.
M
B
F
D
M
R
F
R
M
R
M
B
M
B
M
R
F
B
F
B
F
D
F
B
F
D
M
D
M
B
M
R
M
R
F
B
F
B
M
B
F
D
F
R
F
R
F
D
M
R
M
R
F
B
F
R
F
R
F
D
F
R
F
D
F
B
M
R
M
R
M
D
F
B
M
R
M
B
M
R
Diseño de la tabla: Variable 1 Variable 2
TOTAL (Columnas)
F
P%
100%
F
P%
100%
TOTAL (Filas) F P%
Total general
100%
29
20/10/2020
Ejemplo del tabulado doble: SEXO
REND
SEXO
REND
SEXO
REND
SEXO
REND
SEXO
REND
M
B
F
D
M
R
F
R
F
B
M
R
M
B
M
B
M
R
F
B
F
B
F
B
F
D
F
B
M
R
F
D
M
D
M
B
M
R
M
R
M
R
F
B
F
B
M
B
M
R
F
D
F
R
F
R
F
D
M
B
M
R
M
R
F
B
F
R
M
D
F
R
F
D
F
R
F
D
M
R
SEXO
FEMENINO
RENDIMIENTO
P%
F 100 N
MASCULINO
TOTAL
F
P%
F
P%
F
P%
BUENO
8
38%
6
31%
14
35%
REGULAR
6
29%
11
58%
17
42%
DEFICIENTE
7
33%
2
11%
9
22%
TOTAL
21
100
19
100
40
99
Porcentajes por columnas: CUADRO Nº 8 ESTUDIANTES SEGÚN RENDIMIENTO ACADÉMICO POR SEXO CARRERA DE PSICOLOGÍA – GESTIÓN 2014 SEXO
FEMENINO
MASCULINO
TOTAL
F
P%
F
P%
F
P%
BUENO
8
38%
6
31%
14
35%
REGULAR
6
29%
11
58%
17
42,5%
DEFICIENTE
7
33%
2
11%
9
22,5%
21
100%
19
100%
40
100%
RENDIMIENTO
TOTAL
Fuente: Elaboración propia en base registros SIS, 2014
30
20/10/2020
Porcentajes por filas: CUADRO Nº 8 ESTUDIANTES SEGÚN RENDIMIENTO ACADÉMICO POR SEXO CARRERA DE PSICOLOGÍA – GESTIÓN 2014 FEMENINO
SEXO
MASCULINO
TOTAL
F
P%
F
P%
F
P%
BUENO
8
57%
6
43%
14
100%
REGULAR
6
35%
11
65%
17
100%
DEFICIENTE
7
78%
2
22%
9
100%
21
52%
19
48%
40
100%
RENDIMIENTO
TOTAL
Fuente: Elaboración propia en base registros SIS, 2014
Ejercicio 14:
Los siguientes datos corresponden a las variables sexo y Programa televisivo que prefieren un grupo de estudiantes de 2º semestre de Pedagogía en el año 2010. F M M M M M F F F F M
Noticias Documentales Documentales Documentales Novelas Noticias Novelas Noticias Deportivo Películas Películas
F F F F F F F M M F M
Noticias Películas Películas Novelas Novelas Películas Películas Deportivo Deportivo Noticias Películas
F F F F F M F M F F F
Películas Farándula Noticias Series Noticias Documentales Documentales Películas Farándula Películas Películas
M F F F F M F M F F F
Musical Películas Películas Películas Películas Deportivo Películas Películas Películas Películas Novelas
31
20/10/2020
Ejercicio 15: Los siguientes datos corresponden a la edad y situación laboral de un grupo de personas de la ciudad de Cbba. En el año 2010. 18 17 24 18 24 17 18 19 19 20 22 27 25 21 22
S S S S N N N S N S N N S S S
18 25 19 20 18 19 19 23 24 18 18 19 19 18 18
N N S N N N N S S S N N N N N
19 18 18 19 19 18 20 19 19 19 18 18 19 23 21
N N S N S N N N S S S S N N S
24 22 22 20 19 19 19 16 18 19 18 18 18 20 20
N S S S S N S S S S N S N S S
Presentación de Datos en GRÁFICOS 32
20/10/2020
DEFINICIÓN DE GRÁFICO ESTADÍSTICO: Un gráfico estadístico es una representación visual de una serie de datos estadísticos. Es una herramienta muy eficaz, ya que un buen gráfico: • Capta la atención del lector; • Presenta la información de forma sencilla, clara y precisa; • No induce a error; • Facilita la comparación de datos y destaca las tendencias y las diferencias; • Ilustra el mensaje, tema o trama del texto al que acompaña.
PARTES
33
20/10/2020
CLASIFICACIÓN:
Diagrama Circular o de Sector Gráfico de Anillo Diagrama de Barras (Simple y Múltiple) Perfil Radial Gráfico de Línea Gráfico de Área Diagrama de Caja Histograma de Frecuencias Polígono de Frecuencias Ojiva Diagrama de Dispersión Píctograma
1.- CICLOGRAMA O GRÁFICO DE SECTOR Son gráficos en los que a cada valor o modalidad se reasigna un sector circular de área proporcional a la frecuencia que representan. Se utilizan para representar una variable cualitativa o para comparar grupos. Para representarlo solo se emplea un tipo de frecuencia (absoluta o porcentaje)
INFORMACIÓN SOBRE EL CAMPO LABORAL DE LA CARRERA ELEGIDA Necesito informació n 26%
Alguna 65%
No, ninguna 3% Bastante 6%
34
20/10/2020
INFORMACIÓN SOBRE CAMPO LABORAL Necesito información; 16 Alguna; 40 No, ninguna; 2 Bastante; 4
2.- gráfico de anillos Al igual que un gráfico circular, un gráfico de anillos muestra la relación de las partes con un todo, aunque puede contener más de una única serie de datos Tipo de vivienda de los encuestados 15
3
21
Propia de mí
45
Propia de mis padres
Alquilada
Anticrético
35
20/10/2020
3.- DIAGRAMA DE BARRAS (COLUMNAS) a) Una variable Es un gráfico sobre ejes cartesianos en el que distribuimos en el eje X o eje de abscisa: Las modalidades si el carácter es cualitativo Los valores si la variable es no agrupada Sobre ellos se levantan barras o rectángulos de igual base (que no se solapen) cuya altura sea proporcional a sus frecuencias. También se suelen utilizar para series cronológicas y pueden, asimismo, representarse horizontalmente, intercambiando los ejes.
36
20/10/2020
CONEXION DE COMPUTADORAS 31,6
OPINION
No sabe 5,3
Si, en todas
47,4
Si, en algunas 15,8
No, en ninguna 0
10
20
30
40
50
b) Dos variables (Diagrama de Barras Múltiple) Cuando la intensión es comparar una o más series estadísticas con otra. El diagrama de barras múltiples, es un conjunto de barras simples identificados por distintos colores y sombreados, identificando esta distribución bajo el título de leyendas. Las barras serán puestas en el gráfico una al lado de las otras separando cada grupo de series de una de las variables.
37
20/10/2020
C) Dos variables (Diagrama de Barras PROPORCIONAL O ACUMULADO) Se emplea cuando la intensión es comparar una o más series estadísticas con otra. Se caracteriza por presentan en una sola figura geométrica datos cuyo conjunto forman un todo, mostrando la proporción de cada una de las partes con relación al total. La diferencia con las barras simples, dobles y múltiples está en que todos los datos están representados en una sola barra la cual esta dividida en porciones
UMSS: DISTRIBUCIÓN DEL PERSONAL ADMINISTRATIVO DE PLANTA SEGÚN SEXO. GESTIONES 2003 - 2007 1200 1000
334
800 600
224
215
214
531
515
524
2004
2005
400 200
249
603
691
0
2003
MASCULINO
2006
2007
FEMENINO
38
20/10/2020
4.- GRÁFICO DE LINEAS EVOLUCIÓN DE LA MATRICULA ESTUDIANTIL - UMSS GESTIONES 1994 - 2004
Estos gráficos se utilizan más que todo para representar variables de series cronológicas. En esta gráfica el tiempo (años, meses, días, etc.) se ubica en el eje horizontal (X), en el eje vertical (Y), llamada escala numérica o de valores, se representa el valor de los datos, ambas escalas son independientes. El gráfico puede representar una sola variable en función al tiempo o más de dos variables en función al tiempo.
60.000 49.640 47.336
50.000
MATRICULA
40.000
38.594 40.024
33.916 34.683 30.000 23.282
20.000
40.641
27.980 26.334 26.611
10.000 0 1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
GESTION
Fuente: SISS y Departamento de Registros e Inscripciones.
CRECIMIENTO DE LA POBLACIÓN URBANA Y RURAL EN BOLIVIA URBANA
RURAL
6.000.000
5.501.859 5.000.000
4.335.506
4.000.000
3.000.000
2.919.249
2.000.000
2.107.869
3.309.777 2.942.944
3.763.227 3.636.497
1.000.000
0
1976
1984
1994
2005
Fuente: INE
39
20/10/2020
5.- GRÁFICO DE ÁREAS Un gráfico de área es un gráfico de líneas en el que el área entre la línea y el eje aparece sombreada con un color. Estos gráficos normalmente se usan para representar los totales acumulados a lo largo del tiempo y son la forma convencional de visualizar líneas apiladas.
6.- PERFIL RADIAL Este tipo de gráficos se utiliza generalmente para representar variables cualitativa, pero aquellas que tengan más de 4 categorías, caso contrario la figura del gráfico es diferente de su referencia habitual. En esta gráfica los ejes son polígonos concéntricos, donde cada polígono representa las frecuencias, y los vértices externos muestran las categorías o valores de la variable.
40
20/10/2020
7.- HISTOGRAMA DE FRECUENCIAS
Se usa para representar gráficamente las distribuciones de frecuencias absolutas o relativas de datos cuantitativos continuos agrupados en clases. El fenómeno estudiado queda representado por una serie de rectángulos semejantes a los del diagrama de barras; sin embargo las barras de histograma se colocan solo verticalmente y debe ir uno al lado de las otras sin que haya un espacio que las separe. La base de cada rectángulo es la amplitud del intervalo de clase correspondiente.
UMSS: DISTRIBUCIÓN DE DOCENTES SEGÚN ANTIGÜEDAD 350
323
300
Frecuencia
250
202
200
156
215 178
150
118
100
63
50 0
16 0–4
5–9
10 – 14
15 – 19
20 – 24
25 – 29
30 – 34
35 – 39
ANTIGUEDAD Fuente: Unidad de Recursos Humanos, 2007
41
20/10/2020
8.- POLÍGONO DE FRECUENCIAS Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de las bases superiores de los rectángulos en el histograma, o también se puede construir solo sin el histograma. Este gráfico sirve para variables cuantitativas continuas. Para elaborar el polígono se deben buscar las marcas de clase en cada intervalo (Xm), las cuales Irán en el eje X y las frecuencias absolutas o relativas en el eje Y.
UMSS: DOCENTES SEGÚN ANTIGÜEDAD GESTIONES 2007 Y 2008 600
2007
2008
37
42
500
400
300
200
100
0
0
2
7
12
17
22
27
32
Fuente: Unidad de Recursos Humanos,
42
20/10/2020
9.- OJIVA (MENOR Que)
También llamada Polígono de Porcentajes Acumulados, es la representación gráfica de una distribución de frecuencias relativas acumuladas (Porcentajes acumulados), considerando los limites reales superiores. permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. 120 100 80 60 40 20 0 142,5
147,5
152,5
157,5
162,5
167,5
ESTATURA (cm)
10.- DIAGRAMA DE CAJA
172,5
177,5
188,5
194,5
a) Una variable
El diagrama de caja es un gráfico utilizado para representar una variable cuantitativa continua. El gráfico permite visualizar, a través de los cuartiles, cómo es la distribución, su grado de asimetría, los valores extremos, la posición de la mediana, etc. Se compone de: •
•
•
Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja una línea indica dónde se encuentra la mediana (segundo cuartil Q2) Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza en el tercer cuartil y acaba en el máximo. Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen ciertos requisitos de heterogeneidad de los datos.
43
20/10/2020
8.- DIAGRAMA DE CAJA
b) Dos variables cualitativa)
(Una variable cuantitativa con
44
20/10/2020
11.- DIAGRAMA DE DISPERSIÓN (dos variables cuantitativas)
12.-GRÁFICO DE PIRÁMIDE DE POBLACIÓN Es una representación gráfica de las características de una población perteneciente a una localidad, ciudad o país, en un momento en el tiempo. Se muestra con barras en posición horizontal, la longitud de cada barra tiene una relación directamente y proporcional al número de individuos de la población. Generalmente se emplean rangos de edades que son quinquenales (por ejemplo de 0 a 4 años, de 5 a 9 años, 10 a 14 años y así sucesivamente). No obstante, tal como vemos en la siguiente imagen, los rangos pueden ser diferente
45
20/10/2020
13.-PICTOGRAMAS Son gráficos con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a la frecuencia que representan; dicha frecuencia se suele representar. Los pictogramas pueden comparan las frecuencias entre diferentes categorías o períodos de tiempo.
46
20/10/2020
47
20/10/2020
Resumen de gráficos estadísticos GRÁFICO
TIPO DE VARIABLE
# DE VARIABLES
DIAGRAMA DE SECTOR O TORTA
Cualitativas y Cuantitativas Discretas
Una variable
PICTOGRAMA
Cualitativas y Cuantitativas indistintamente
Una o más variable
PERFIL RADIAL
Cualitativas
Una variable
GRAFICO DE LÍNEA
Temporales o de Series Cronológicas
Una o dos variables
DIAGRAMA DE BARRAS SIMPLE
Cualitativas o Cuantitativas Discretas
Una variable
DIAGRAMA DE BARRAS DOBLE Y MÚLTIPLE
Cualitativas o Cuantitativas Discretas
Dos variables
DIAGRAMA DE BARRAS PROPORCIONAL
Cualitativas o Cuantitativas Discretas
Dos variables
HISTOGRAMA
Cuantitativas Continuas
Una variable
POLÍGONO
Cuantitativas Continuas
Una o dos variables
OJIVA
Cuantitativas Continuas
Una variable
Programa SPSS 48
20/10/2020
Origen e historia En 1968, Norman Nie, mientras se encontraba Proceso Cuantitativo estudiando para graduarse pordel laAnálisis Washington University, tuvo que enfrentarse a la desalentadora tarea de analizar una ingente cantidad de información. Para la elaboración de su tesina, realizó un cuestionario a lo largo de 7 países, de ello obtuvo miles de respuestas de fuentes individuales. Resultaba muy complicado trabajar con tal ¿EN QUÉ CONSISTE EL ANÁLISIS cantidad de información, por lo cual, juntoESTADÍSTICO? a2 jóvenes ingenieros informáticos creó este software estadístico.
Norman Nie
El primitivo SPSS le facilitó enormemente el tratamiento y análisis de información para su tesina (Revista digita IBM SPSS, 2017)
El IBM SPSS es un software o Proceso del Análisis programa de los más conocidos en Cuantitativo el mundo si se tiene en cuenta su Proceso del Análisis Cuantitativo capacidad para trabajar con grandes bases de datos y una simple y sencilla interfaz que se utiliza para la mayoría de los análisis realizados en este. SPSS son las siglas de ‘’Stadistical ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? Package for the social Sciences’’ que en su traducción español ¿ENal QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? quedaría como “Paquete estadístico para las ciencias sociales’’ (Revista digita IBM SPSS, 2017)
49
20/10/2020
Versiones del programa SPSS 1 - 1968 SPSSx release 2 - 1983 (para grandes servidores tipo UNIX) Proceso del Análisis Cuantitativo SPSS 5.0 - diciembre 1993 SPSS 6.1 - febrero 1995 SPSS 7.5 - enero 1997 SPSS 8.0 - 1998 SPSS 9.0 - marzo 1999 SPSS 10.0.5 - diciembre 1999 SPSS 10.0.7 - julio 2000 SPSS 10.1.4 - enero 2002 SPSS 11.0.1 - abril 2002 SPSS 11.5.1 - abril 2003 SPSS 12.0.1 - julio 2004 ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? SPSS 13.0.1 - marzo 2005 (Permite por primera vez trabajar con múltiples bases de datos al mismo tiempo.) SPSS 14.0.1 - enero 2006 SPSS 15.0.1 - noviembre 2006 SPSS 16.0.1 - noviembre 200
SPSS 17.0.1 - noviembre 2008 SPSS 16.0.2 - abril 2008 SPSS Statistics 17.0.1 - diciembre 2008 (Incorpora aportes importantes como el ser multilenguaje).) SPSS Statistics 17.0.2 - marzo 2009del Análisis Cuantitativo Proceso PASW Statistics 17.0.3 - septiembre 2009 (IBM adquiere los derechos y cambia su denominación de SPSS por PASW 18) PASW Statistics 18.0 - agosto 2009 PASW Statistics 18.0.1 - diciembre 2009 PASW Statistics 18.0.2 - abril 2010 PASW Statistics 18.0.3 - septiembre 2010 IBM SPSS Statistics 19.0 - agosto 2010 IBM SPSS Statistics 19.0.1 - diciembre 2010 IBM SPSS Statistics 20.0 - agosto 2011 ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? IBM SPSS Statistics 20.0.1 - marzo 2012 IBM SPSS Statistics 21.0 - agosto 2012 IBM SPSS Statistics 22.0 - agosto 2013 IBM SPSS Statistics 23.0 - agosto 2014 IBM SPSS Statistics 24.0 - junio 2016 IBM SPSS Statistics 25.0 - marzo 2017 IBM SPSS Statistics 26.0 - 2019
50
20/10/2020
Módulos del programa • Modelos de Regresión Proceso del Análisis Cuantitativo • Modelos Avanzados: Reducción de datos, Clasificación y Pruebas no paramétricas • Tablas • Tendencias • Categorías • Análisis • Pruebas Exactas • Análisis de Valores Perdidos ¿EN QUÉ CONSISTE EL ANÁLISIS ESTADÍSTICO? • Muestras Complejas • SamplePower (cálculo de tamaños muestrales) • Árboles de Clasificación. • Validación de Datos (Wikipedia, 13-07-2020)
¡Gracias por su atención!
51