Creación de tablas de frecuencias Variable cualitativa Variable cuantitativa Gráficos Estadísticos Estadígrafos o indicadores estadísticos
Regresión Simple
http://www.luwalasoft.da.ru
luwala@hotmail.com
TABLA DE DISTRIBUCION DE FRECUENCIAS CREACIÓN
DE UNA
VARIABLE CUALITATIVA
Los siguientes datos corresponden a un grupo de estudiantes del tercer ciclo sobre la preferencia de los cursos que mas le agrada.
A
B
C
1
MKT
MATEMATICA
2
MATEMATICA
CONTABILIDAD
MKT
3
MKT
ACCESS
INGLES
D
E
F
G
H
I
J
MKT
CONTABILIDAD
MATEMATICA
ACCESS
LENGUAJE
LENGUAJE
ACCESS
LENGUAJE
ESTADISTICA
LENGUAJE
MKT
MKT
ACCESS
ESTADISTICA
MKT
ACCESS
ESTADISTICA
ACCESS
MKT
INGLES
MATEMATICA CONTABILIDAD
PASOS PARA LA CONSTRUCCIÓN DE LA TABLA. TABLAS DINÁMICAS Paso 1: Identificar la variable
Xi : curso que mas le gusta Paso 2: Los datos se tienen que llevar obligatoriamente a una matriz columna.
Paso 3: En la ficha insertar / tabla dinámica.
PASOS PARA LA CONSTRUCCIÓN DE LA TABLA. TABLAS DINÁMICAS Paso 4: Aceptar
Paso 5: Arrastrar la variable curso a etiqueta de fila y sumatoria de valores
Paso 6: Finalmente se obtiene.
Paso 7: Completamos la tabla
INTERPRETACIÓN f2: Significa que a 3 alumnos le gusta el curso de CONTABILIDAD. h4: Significa que 2 de cada 30 alumnos le gusta el curso de INGLES h4 %: Significa que al 7% de los alumnos les gusta el curso de INGLES.
VARIABLE CUANTITATIVA
Se va a utilizar un Complemento de Excel y tiene que estar activado: Si no esta activado los pasos son:
Archivo opciones complemento Ir activar Herramientas para análisis. Aceptar
Ya esta instalado Anรกlisis de Datos(Datos/ Anรกlisis de datos )
Se va a la Ficha Datos Grupo Anรกlisis ( Anรกlisis de datos )
Teniendo activado el Complemento y las MATRICES DE DATOS Y LA DE CLASE
4 5 6
A
B
C
D
E
F
G
H
I
J
3 2 2
4 3 1
2 2 0
0 1 4
2 0 2
3 2 4
4 3 2
3 0 3
2 3 2
0 2 1
Matriz de clase
0 1 2 4
Matriz de DATOS
En el cuadro de di谩logo completar la informaci贸n
En rango de entrada : Marcar la matriz de DATOS En rango de clase : Marcar la matriz de CLASES La casilla de verificaci贸n debe estar deshabilitada. En opciones de salida puede elegir cualquiera de las tres opciones. Y en las tres ultimas casillas activar : Porcentaje acumulado Crear Grafico
Resultado de la tabla
Clase
0 1 2 4 y mayor...
% Frecuencia acumulado
5 16,67% 3 26,67% 11 63,33% 11 100,00% 0 100,00%
Paso 8: Completamos la tabla
xi
fi
Fi
hi
Hi
100hi
100Hi
0 1 2 3 4
5 3 11 7 4
5 8 19 26 30
0.17 0.10 0.37 0.23 0.13
0.17 0.27 0.63 0.87 1.00
17% 10% 37% 23% 13%
17% 27% 63% 87% 100%
30
Interpretación f2: Significa que 3 empleados han tenido 1 error. h4: Significa que 7 de cada 30 empleados han tenido 3 errores. h4 % : Significa que al 23% de los empleados has tenido 3 errores. H4 % : Significa que al 87% de los empleados has tenido como máximo 3 errores.
Tabla para una variable de tipo cuantitativa de rango grande. Los siguientes datos corresponden a las edades de un grupo de trabajadores de una localidad
A
BB
C
D
E
F
G
H
I
J
1
81
53
67
60
80
64
56
54
91
61
2
68
88
67
65
52
72
74
65
73
69
3
43
54
76
70
94
68
82
75
79
60
4
39
87
76
71
86
45
60
43
65
76
5
92
72
82
80
70
65
50
58
70
56
Pasos para la construcción de la tabla Excel : Análisis de Datos Nota : Tiene que estar activo el complemento Herramientas de análisis . Boton de office / opciones de Excel / complementos/ Herramienta para análisis y luego Ir luego activar Herramientas de análisis. Clase Paso 1: Primero identifico la variable 46 Xi : número de errores encontrados en las declaraciones juradas54de un grupo de empleados. 62 Paso 2: Debo tener 2 matrices la de datos y la de clase. 70 78
86 94
Paso 3: En la ficha datos / Anรกlisis de datos /Histograma
Paso 4: Clic en aceptar
Paso 5: Completamos la tabla Ii
fi
Fi
hi
Hi
100hi
100Hi
39 47
4
4
0.08
0.08
8%
8%
47 55
5
9
0.10
0.18
10%
18%
55 63
7
16
0.14
0.32
14%
32%
63 71
13
29
0.26
0.58
26%
58%
71 79
9
38
0.18
0.76
18%
76%
79 87
7
45
0.14
0.90
14%
90%
87 95
5
50
0.10
1.00
10%
100%
50
Recordar que Ii es edad de los trabajadores y fi nĂşmero de trabajadores de esa localidad.
Interpretación
f2: Significa que 5 trabajadores de esa localidad tienen edad mayor o igual a 47 años pero menor que 55 años. h4: Significa que 13 de cada 50 trabajadores de esa localidad tienen edad mayor o igual a 63 pero menor a 71 años. h4: Significa que 26% de los trabajadores de esa localidad tienen edad mayor o igual a 63 pero menor a 71 años. H4: Significa que 58% de los trabajadores tienen una edad mayor o igual a 39 pero menor que 71 años.
GrĂĄficos estadĂsticos
luwala@hotmail.com
DIAGRAMA RECTANGULAR Número de alumnos por curso que mas le agrada VFOX
8
Curso
VBASIC
6
MATE
4
LENGUA
4
INGLES
2
ESTAD
3
CONTAB
3 0
1
2
3
4
5
6
Número de alumnos
7
8
9
Diagrama Circular Porcentaje de alumnos por curso que mas le agrada
VFOX 27%
CONTAB 10% ESTAD 10%
INGLES 7% LENGUA 13%
VBASIC 20% MATE 13%
Diagrama de barras TĂtulo del grĂĄfico 12
NĂşmero de alumnos
10
8
6
4
2
0
0
1
2 edades
3
4
HISTOGRAMAS NĂşmero de trabajadores por edades 14
13
NĂşmero de trabajadores
12 10
9
8
7
6
7
5
5
4
4 2 0 39
47
55
63
71 edades
79
87
95
POLIGONO DE DISTRIBUCION DE FRECUENCIAS 14
Número de trabajadores
12
10
8
6
4
2
0
39
43
51
59
67 edades
75
83
91
94
DIAGRAMA ESCALONADO Porcentaje de trabajadores por edades 120% 100%
100% Porcentaje de trabajadores
90% 76%
80%
58%
60%
40%
32% 18%
20%
8% 0% 39
47
55
63
71 edades
79
87
95
OJIVA 60
NĂşmero de trabajadores
50
40
30
20
10
0 47
55
63
71 edades
79
87
95
EstadĂgrafos ( Datos no agrupados )
luwala@hotmail.com
Paso 1: Debo tener mi matriz de datos en una columna ( OBLIGATORIO )
Paso 2: Ir a la ficha datos, grupo análisis comando análisis de datos, estadística descriptiva
Paso 3: En el cuadro de dialogo ingreso los datos correspondientes. Paso 4: Aceptar
Paso 4 : Clic en aceptar
Cálculos de otros estadígrafos con Excel
Media
=PROMEDIO(bloque)
Mediana
=MEDIANA(bloque)
Moda
=MODA(bloque)
Media geométrica
=MEDIA.GEOM(bloque)
Media armónica
=MEDIA.ARMO(bloque)
Desviación media
=DESVPROM(bloque)
Varianza
=VAR(bloque)
Desviación estándar
=DESVESTP(bloque)
Cuartil 1
=CUARTIL(bloque;1)
Decil 2
=PERCENTIL(bloque;0.20)
Percentil 12
=PERCENTIL(bloque;0.12)
Coeficiente de asimetría Coeficiente de curtosis
=COEFICIENTE.ASIMETRIA (bloque) =CURTOSIS(bloque)
REGRESION LINEAL Tiene la forma :
y* a b x
x : variable independiente y : variable dependiente
Un editor tomo una muestra de 6 libros anotando el precio y el número de páginas respectivo, obteniendo los siguientes datos :
Nº de pág.
Precio
630 550 400 250 370 320
10 8 7 4 6 6
1) Trazar la nube de puntos 2) Determine una funcion lineal entre el precio y el número de páginas con el fin de predecir precios. 3) Si el libro tiene 600 páginas estimar el precio del libro 4) Determinar el coeficiente de correlación 5) Hallar el error estandar de estimación
1) Primero trazamos la nube de puntos o diagrama de dispersi贸n para ver como es su tendencia. 12 10 8 6
Series1
4 2 0 0
200
400
600
800
2) Se observa que tiene una tendencia lineal. Procedemos a calcular la recta que mas se ajusta a la nube de puntos. TABLA 1: B C D E F G
X 630 550 400 250 370 320 2520
y 10 8 7 4 6 6 41
x2 396900 302500 160000 62500 136900 102400 1161200
xy 6300 4400 2800 1000 2220 1920 18640
y2 100 64 49 16 36 36 301
( y - y*)^2 0.0706967 0.3957079 0.1961881 0.2353068 0.0203553 0.3002926 1.218547
Aplicamos las fórmulas :
a
å yå x
a=
2
-
å xy å x
æ ö N å x 2 - çç å x ÷÷ è ø
2
b
N å xy Nå x2
å xå
æ ö - çç å x ÷÷ è ø
1.0318
y 2
0.0138
b=
Por lo tanto la ecuación por los minimos cuadrados será :
y*=
3) Si el libro tiene
1.0318
600
Aproximadamente :
+
0.0138x
páginas costaría : 9
9.31
dólares
4) Calculo del coeficiente de correlación:
r
n å xy - å xå y æç n å x 2 - (å x )2 ö÷æç n å y 2 - (y )2 ö÷ è øè ø
=
0.97
5) Calculo de error estandar Agregamos una columna mas (VER TABLA 1 COLUMNA G )
S yx
å ( y - y *)
2
n-2
=
0.5519
=
0.5519
Otra formula para hallar el error estandar :
S yx
å y2 - aå y - bå xy n-2
Funciones de excel : Forma 1: Usando las funciones: Para a:
INTERSECCION.EJE(conocidoy;conocidox)
Para b: Coef. de correlación Error estandar
PENDIENTE(conocidoy;conocidox) person(matriz1;matriz2) ERROR.TIPICO.XY(CONOCIDO_Y,CONOCIDO_X)
a=
1.0318
b=
0.0138
r=
0.97
Syx=
1
Forma 2: Herramientas/ An谩lisis de datos/ Regresi贸n y en el cuadro de dialogo complete la informaci贸n
Forma 3: Teniendo el grafico, marcar la serie de dartos clic derecho y elegir linea de tendencia, completar cuadro de dialogo. No olvidarse de la ficha opciones.
Forma 4: ESTIMACION.LINEAL(conocidoy, conocidox, constante,estadsitica)
Por forma 2 Resumen
Por forma 3 12
y = 0.0138x + 1.0318 R² = 0.9415
10 8
Series1
6
Lineal (Series1)
4 2 0 0
200
400
600
800
Por forma 4 b
a
0.0138 0.0017 0.9415 64.387 19.615
1.0318 0.7573 0.5519 4.0000 1.2185 a b
y*=
= =
1.0318 0.0138
r2 = Syx=
0.941509728 0.5519
1.0318
+
r=
0.0138x
0.97
12
y = -7E-06x2 + 0.0199x - 0.1965 R虏 = 0.944
10 8
Series1
6
Polin贸mica (Series1) 4 2 0 0
200
400
600
800
REGRESION POTENCIAL Aplicando Excel Forma 3: Teniendo el grafico, marcar la serie de datos clic derecho y elegir lĂnea de tendencia, completar cuadro de dialogo. No olvidarse de la ficha cuadro de opciones.
25 y 20
= 1.8717x0.7375 R² = 0.9138
15
10
Series1
5 Potencial (Series1) 0 0
10
20
30
APLAUSOS Gracias
Consultas :http://www.luwalasoft.da.ru email : luwala@hotmail.com