Escala Nominal:
Está asociada a variables cualitativitas y es denominada de este modo si no se pueden hacer operaciones aritméticas entre sus valores, pues éstos son únicamente ETIQUETAS. Ejemplo: sexo, código postal, estado civil, número telefónico, número al correr en un maratón, deporte favorito, carrera a estudiar, etc.
Escala Ordinal:
Los valores de la variable que tienen un ORDEN con un nivel específico, pero no se pueden hacer operaciones aritméticas entre ellas. Ejemplo: Pésimo – Malo – Regular – Bueno – Excelente Primaria – Secundaria – Preparatoria - Licenciatura
Escala de Intervalo:
En ella existe un orden entre los valores de la variable y además una NOCIÓN DE DISTANCIA aunque no se puedan realizar operaciones. El cero o punto de inicio no es único, es más bien un punto de referencia. Ejemplo: Escalas de temperatura, la edad de la Tierra, la línea del tiempo de la humanidad.
Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el cero absoluto, existe orden, se puede determinar cuántas veces es mayor uno que otro. Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Fuentes de información Encuesta:
Recopilar los datos mediante el uso de cuestionarios o entrevistas.
Experimento: Procedimiento utilizado en la investigación científica para obtener información que permita conocer el comportamiento de algún proceso.
Fuentes de Información
Investigación Documental: Procedimiento para obtener datos mediante la consulta de información ya escrita y concentrada en documentos que se localicen en libros o revistas en bibliotecas, hemerotecas, o en centros virtuales.
Redondeo de datos, notación científica y cifras significativas.
Redondeo:
El redondeo de datos es un procedimiento que consiste en escribir un número que representa a una cantidad con menos cifras de las que tiene realmente para tener una idea rápida de la cantidad.
Notación Científica Es una manera de escribir en forma breve cifras
muy grandes o pequeñas. La forma general es n a x 10 , en donde “a” es un número entre 1 y 9, “n” es un número entero. Ejemplo:
4
-4 El número 25 000 se escribe 2.5 x 10 , o el número 0.00025 se escribe como 2.5 x 10 .
Cifras Significativas A los dígitos exactos que se utilizan para escribir una cifra, a
parte de los ceros para localizar el punto decimal, se les llama cifras significativas.
Ejemplos: 3.22 tiene 3 cifras significativas.
0.0032 = 3.2 x 10 tiene 2 cifras significativas.
-3
0.00320 = 3.20 x 10 tiene 3 cifras significativas.
-3
La cifra 3.22 se encuentra realmente entre
3.215 y 3.225.
La cifra 0.0032 es un valor que se encuentra
entre
0.00315 y 0.00325.
La cifra 0.00320 se encuentra entre las cifras
0.003195 y 0.003205
Orden de datos La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.
Hay dos métodos comunes: •
Listado en orden •ascendente Método de tallo y hojas
Ejemplo  Considera que la variable de estudio es el peso
de 25 estudiantes. Los pesos se encuentran en la siguiente tabla: Peso de 25 estudiantes (en kg) 40 56 52 63 57
43 44 62 50 66
48 42 44 56 63
51 55 50 55 51
49 52 59 45 58
Listado en orden ascendente  El proceso consiste en ordenarlos de menor a
mayor
Peso de 25 estudiantes (en kg) 42 56 52 63 57
40 44 62 50 66
48 43 44 56 63
51 55 50 55 51
49 52 59 45 58
Peso de 25 estudiantes (en kg) 40 45 51 55 59
42 48 51 56 62
43 49 52 56 63
44 50 52 57 63
44 50 55 58 66
Método de tallo y hojas Si los números de los datos están formados
por dos dígitos, se hace una columna con el primer dígito (decenas) y a la derecha de cada uno de ellos se escribe, en fila, sólo el segundo dígito (unidades) de cada uno de los datos que tengan el mismo primer dígito.
 Datos sin ordenar: 4 5 6
2,0,8,9,4,3,4,5 1,6,5,2,2,0,9,0,6,5,7,1,8
2,3,6,3
 Datos ordenados: 4 5 6
Peso de 25 estudiantes (en kg) 42 56 52 63 57
40 44 62 50 66
48 43 44 56 63
51 55 50 55 51
0,2,3,4,4,5,8,9 0,0,1,1,2,2,5,5,6,6,7,8,9 2,3,3,6
49 52 59 45 58
Doble tallo Una variante de este método es en lugar de dividir en un
grupo las decenas, se divide en dos grupos. El primero abarcando los dígitos del 0 al 4 y el segundo del 5 al 9.
El ejemplo anterior
queda:
4 4 5 5 6 6
0,2,3,4,4 5,8,9 0,0,1,1,2,2, 5,5,6,6,7,8,9 2,3,3 6
Caso de variables cualitatitivas El procedimiento es: Se identifican todos los valores diferentes y se
acomodan en columna.
Se agrega una segunda columna en donde se van
registrando, mediante una línea vertical, la veces que aparece el valor dado.
Ejemplo Considera que la variable de estudio es el color
de playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla: rosa
azul
blanco
azul
rosa
gris
blanco
café
negro
blanco
rosa
azul
café
blanco
blanco
gris
azul
blanco
rosa
gris
gris
blanco
café
negro
verde
Color
rosa
azul
blanco azul
gris
blanco café
negro
rosa
azul
café
blanco blanco
gris
azul
blanco rosa
gris
blanco café
negro
rosa
Azul
blanco
Blanco Café
gris
Gris
verde
Negro Rosa Verde
Frecuencia
IIII IIII II III IIII II IIII I
Tabla de Frecuencia de Datos Una vez que se tenga ordenados los datos, se
acomodan en la “Tabla de distribución de frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de valores
x-y, dónde “x” representa el dato y “y” representa la frecuencia.
La frecuencia es el número de veces que
aparece cada dato.
Hay dos clases de tablas de frecuencias: Para datos NO agrupados. Para datos agrupados.
Tabla de frecuencias para datos NO agrupados Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “f”, a esta frecuencia se le llama frecuencia absoluta o frecuencia observada.
Ejemplo  Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg) 40 45 51 55 59
42 48 51 56 62
43 49 52 56 63
44 50 52 57 63
44 50 55 58 66
xi
f
xi
f
40
1
52
2
42
1
55
2
43
1 2
56
2
44
1
57
1 1
45
1
58
1
48
1
59
1
49
2
62
2 1
50 51
2
63 66
25
Frecuencia relativa y acumulada Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “fr” y la de la frecuencia acumulada “fa”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato dado.
Ejemplo 1/25 xi
f
fr
xi
f
fr
fa
0.04
fa 1
40
1
52
2
0.08
14
42
1
0.04
2
55
2
43
1
3
56
2
16 18
44
2
0.04 0.08
0.08 0.08
1
6
1
45
0.04
57
0.04
0.04
1
0.04
21
48
1
0.04
7 8
58
0.04
19 20
59
1
0.04
22
49
1
10
62
1
50
2
0.08 0.08
12
63
2
0.08 0.04
24 25
51
2
66
1
5
2/25
Tota l
1
25 Siempre es 1
Siempre es el nĂşmero total
Intervalo de clase En ocasiones es conveniente acomodar los datos en pequeños grupos de igual tamaño, llamados intervalos de clase. El punto medio o marca de clase “xi”, se obtiene con:
El tamaño del intervalo se obtiene mediante la diferencia de los
límites superior e inferior.
Marca de clase = Límite inferior + límite superior 2
Ejemplo Límite inferior
Límite superior
Intervalo de clase 38 – 42 43 – 47 48 – 52 53 – 57 58 – 62 63 – 67
+5
+5
Lím inf + Lim sup 2
Punto medio “xi” 40 45 50 55 60 65
+5
Límite verdadero del intervalo Frontera de clase o límite verdadero del
intervalo: Intervalo de clase
40 – 2.5
+5
37.5 – 42.5 42.5 – 47.5 47.5 – 52.5 52.5 – 57.5 57.5 – 62.5 62.5 – 67.5
40 + 2.5
Punto medio “xi” 40 5/2 = 2.5 45 50 55 60 65
+5
Tabla de intervalos con límites verdaderos Usando símbolos de Está incluido No está incluido
desigualdad
Usando y Está incluidoparéntesis No está incluido
corchetes
Intervalo de clase
Punto medio “xi”
Intervalo de clase
Punto medio “xi”
37.5 ≤ x < 42.5
40
[37.5 , 42.5)
40
42.5 ≤ x < 47.5
45
[42.5 , 47.5)
45
47.5 ≤ x < 52.5
50
[47.5 , 52.5)
50
52.5 ≤ x < 57.5
55
[52.5 , 57.5)
55
57.5 ≤ x < 62.5
60
[57.5 , 62.5)
60
62.5 ≤ x < 67.5
65
[62.5 , 67.5)
65
El tamaño del intervalo es de 5
Si por alguna razón no es fácil decidir el ancho
del intervalo y el número de ellos, se pueden utilizar las siguientes fórmulas: K = 1 + 3.3 log (n) Donde K = número aproximado de clases ● n = número de datos. Amplitud de los intervalos = Rango / K Donde Rango = diferencia entre el dato mayor y el dato menor.
Ejemplo Para el ejemplo de los datos de los pesos de 25
alumnos, el valor de K: K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6. Por lo tanto se requieren aproximadamente 6 intervalos.
Y la amplitud de los intervalos sería: Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64. Aproximadamente 5 unidades es la amplitud de los intervalos.
Tabla de distribución de frecuencias para datos Se elabora con los intervalos de clase, sus puntos medios y agrupados
Datos sin agrupar
las frecuencias correspondientes para cada uno de los intervalos.
xi
f
52
2
40
1
55
2
42
1
56
43
1
44
Datos agrupados Punto medio “xi”
f
2
Intervalo de clase
57
1
38 – 42
40
2
58
1
43 – 47
45
2 4
45
1
59
1
48
1
62
1
48 – 52
50
49
1
63
2
53 – 57
55
50
2
66
1
58 – 62
60
3
51
2
Total
25
63 - 67
65
25
8 5 3
Se agregan las columnas de frecuencia relativa
“fr” y frecuencia acumulada “fa”: Intervalo de clase
Punto medio “xi”
f
38 – 42
40
2
43 – 47
45
4
48 – 52
50
8
53 – 57
55
5
58 – 62
60
3
63 - 68
65
3
Total
25
fr
0.08 0.16 0.32 0.20 0.12 0.12 1
Fa 2 6 14 19 22 25
2/25 4/25 8/25
Por último se agregan las columnas: Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
Frecuencia relativa acumulada “fra”, se obtiene
sumando las frecuencias relativas anteriores a un dato dado.
Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.
x Tablas de frecuencias 0.08 100 absoluta, relativa y 0.08 x 2/25 100 acumulada Punto f fr f% fa fra f%a
Intervalo de clase
medio “xi”
38 – 42
40
2
0.08
43 – 47
45
4
0.16
48 – 52
50
8
0.32
53 – 57
55
5
0.20
58 – 62
60
3
0.12
63 - 68
65
3
0.12
25
1
Total
8 16 32 20 12 12 100
2 6 14 19 22 25
0.08 0.24 0.56
8 24 56 76
0.76 0.88 88 1 100
Gráfica de Datos Existen dos tipos de gráficas mas usuales: Polígono de Frecuencias Histograma
Otros gráficos: Gráfica de barras Pictograma Gráfico Circular o de pastel.
Polígono de Frecuencias Es la representación mediante un gráfico de
línea. En él se muestra la distribución de frecuencias y está formado por segmentos de línea que unen los puntos correspondientes a la frecuencia de cada una de las clases. 60 50
El eje “x” representa el dato “xi”
y el eje “y” las frecuencias.
40 30 20 10 0
Ejemplo Polígono de Frecuencias
Intervalo de clase
Punto medio “xi”
f
38 – 42
40
2
43 – 47
45
4
48 – 52
50
8
53 – 57
55
5
58 – 62
60
3
63 - 68
65
3 Total
25
10 8 6 f 4 2 0 35
40
45
50
55
xi
60
65
70
El eje “y” puede ser sustituido por las
frecuencias relativas o porcentuales. Polígono de Frecuencia Relativa 0.35 0.3
fr
0.25 0.2 0.15 0.1 0.05 0 35
40
45
50
55
xi
60
65
70
PolĂgono de Frecuencia Porcentual
35 30 25
%f
20 15 10 5 0 35
40
45
50
xi
55
60
65
Histograma 14
Es la representación gráfica de
los datos mediante una sucesión de rectángulos.
12 10 8 6 4 2 0
0,95
2,95
4,95
Está formado por rectángulos cuya anchura
representa a cada uno de los intervalos y la altura corresponde a la frecuencia.
En el eje “x” estarán los límites verdaderos, los
puntos medios y en el eje “y” las frecuencias.
Ejemplo
Histograma
Intervalo de clase
Punto medio “xi”
f
38 – 42
40
2
43 – 47
45
4
48 – 52
50
8
53 – 57
55
5
58 – 62
60
3
63 - 68
65
3 Total
10 8 6 f
4 2 0
35
40
45
50 xi
55
60
65
25
ď&#x201A;§ TambiĂŠn podemos usar la frecuencia relativa y
la frecuencia porcentual.
Histograma con frecuencias relativas 0.35 fr
0.3 0.25 0.2 0.15 0.1 0.05 0
35
40
45
50
xi
55
60
65
Ojiva Es la representación gráfica de las
frecuencias acumuladas mediante un gráfico de línea. Se muestra la distribución de frecuencias acumuladas de los datos.
En el eje “x” estarán los puntos medios y en
el eje “y” las frecuencias acumuladas.
Histograma con frecuencias porcentuales 35 30 25 %f
20 15 10 5 0
35
40
45
50 xi
55
60
65
Pirámide Poblacional Una variante en el histograma es colocar en el
eje “x” de tal manera que las columnas quedarán en forma horizontal, es muy común en datos poblacionales.
Ejemplo
Intervalo de clase
Punto medio “xi”
f
fr
fa
38 – 42
40
2
0.08
2
43 – 47
45
4
0.16
6
48 – 52
50
8
0.32
14
53 – 57
55
5
0.20
19
58 – 62
60
3
0.12
22
63 - 68
65
3
0.12
25
25
1
Total
Ojiva 30 25
25 22
20
19
fa 15
14
10 6
5 0 35
0
2
40
45
50
xi
55
60
65
Usando la frecuencia acumulada y la frecuencia
porcentual.
Intervalo Punto medio de clase “xi”
f
fr
f%
fa
fra
f%a
38 – 42
40
2
0.08
8
2
0.08
8
43 – 47
45
4
0.16
16
6
0.24
24
48 – 52
50
8
0.32
32
14
0.56
56
53 – 57
55
5
0.20
20
19
0.76
76
58 – 62
60
3
0.12
12
22
0.88
88
63 - 68
65
3
0.12
12
25
1
100
25
1
100
Total
Ojiva con frecuencia relativa acumulada 1 0.88
0.8
0.76
0.6
fra
0.56
0.4 0.24
0.2 00 35
0.08
40
45
50
xi
55
60
Ojiva con frecuencia porcentual acumulada 100 88
80
76
60
f%a
56
40 24
20 8
00 35
40
45
50
xi
55
60
65
Gráfico Circular También es llamado gráfico de pastel. Sólo se representan datos de frecuencias
relativas o frecuencias porcentuales.
Se debe dividir el área del círculo de manera
proporcional a las frecuencias.
13%
13%
17%
57%
PERRO PAJARO HAMSTER GATO
Agregaremos una columna a nuestra tabla
de frecuencias “Frecuencia relativa al círculo”, multiplicando (fr)(360°), para mostrar la parte proporcional de círculo medida en grados que corresponde a cada intervalo.
Ejemplo 1
Intervalo de clase
Punto medio “xi”
f
38 – 42
40
2
0.08
43 – 47
45
4
0.16
48 – 52
50
8
0.32
53 – 57
55
5
0.20
58 – 62
60
3
0.12
63 - 68
65
3
0.12
25
1
Total
fr
0.08 x 360°
(fr ) (360°) 28.8° 57.6°
115.2° 72° 43.2° 43.2° 360°
0.16 x 360°
Grรกfico Circular 65; 12% 60; 12%
55; 20%
40; 8%
45; 16%
50; 32%
Ejemplo 2 Color
Azul Blanco Café Gris Negro Rosa Verde
Frecuencia
Conteo
IIII IIII II III
4
IIII II IIII I
4
Color de Playera
7
Azul Negro
3
16%
Blanco Rosa
4%
Café Verde
Gris
16%
8%
2 4 1
28% 16% 12%
Otros Gráficos La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO consecutivos. Frecuencia absoluta
60 50 40 30 20 10
0 PERRO
PAJARO HAMSTER
GATO
Carrera
Alumnos
Medicina
8
Mecánica
11
Civil
8
Agronomía
3
Físico - Matemáticas
3
Leyes
6
Contaduría
11
Elección de Carrera
8
11
11
8 3
Medicina
Agronomía
3
6
Contaduría
Pictograma ď&#x201A;§ Similar al de barras, sĂłlo que se sustituyen por
figuras, generalmente relacionadas con la variable estudiada.