Capítulo dos: Descripción de los datos: distribuciones de frecuencias y representaciones gráficas Competencias: Al terminar este capítulo el estudiante podrá: UNO
Organizar los datos en una distribución de frecuencias. DOS
Presentar una distribución de frecuencias en un histograma, un polígono de frecuencias y un polígono de frecuencias acumuladas. TRES
Desarrollar una representación de tallo y hoja. CUATRO
Presentar datos mediante técnicas de graficación: como gráficas de líneas, de barras y circulares. Dr. Wilson Nina
2-2
Distribución de frecuencias • Distribución de frecuencias: agrupamiento de datos en categorías o intervalos que muestran el número de observaciones en cada categoría mutuamente excluyente. • Mutuamente excluyente: Propiedad de un conjunto de categorías, implica que una persona, objeto o medición se ha de incluir en sólo una categoría.
2-2
Distribución de frecuencias • Recorrido de la variable: la diferencia entre el valor máximo y el valor mínimo. • Intervalo de Clase: es el número o símbolo que define o contiene una clase, marca el limite inferior y superior Ej: (10 - 19) • Intervalo de Clase abierto: ej: 60 y más años • Frontera de clase, o límite de clase verdadero. número en el que teóricamente pueden incluirse medidas acerca del límite inferior y superior del intervalo de clase Ej: 9.5 - 19.5
2-4
DISTRIBUCIÓN DE FRECUENCIAS • Marca de clase (punto medio): punto que divide a la clase en dos partes iguales. Es el promedio entre los límites superior e inferior de la clase.
2-4
DISTRIBUCIÓN DE FRECUENCIAS • PASOS PARA UNA DISTRIBUCIÓN DE FERECUENCIAS: 1.Ordeno los datos y determino el recorrido de la variable RV 2.Determino el número de intervalos, clases o categorías(K): K= 1 + 3,322 (log n ) 3.Obtener el tamaño o amplitud de cada intervalo W= RV/K(No de intervalos 4.Ubicar cada observación individual en C/intervalo.
2-3
ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS p re g u n ta q u e se desea re s p o n d e r
r e c o le c c ió n d e d a to s ( d a t o s o r ig in a le s )
o r g a n iz a c ió n d e d a to s
d is t r ib u c ió n d e fr e c u e n c ia s
p r e s e n t a c ió n d e d a to s ( g r á fic a )
o b t e n c ió n de c o n c lu s io n e s
2-5
Tabla No.1 distribuci贸n de frecuencias de las presiones sist贸locas de 144 adolescentes moderadamente obesos:
PS 143 142 141 140 139 138 137 136 135
Frec. 2 0 0 4 6 3 11 3 8
PS
Frec. PS
Frec PS
Frec
128
3
113
0
98
2
127 126 125 124 123 122 121 120
3 7 4 4 2 3 1 3
112 111 110 109 108 107 106 105
0 3 3 1 0 2 1 2
97 96 95 94 93 92 91 90
2 2 3 0 1 2 0 1
2-5
Tabla No.1 distribuci贸n de frecuencias de las presiones sist贸locas de 144 adolescentes moderadamente obesos:
PS 134 133 132 131 130 129
Frec. 5 8 4 3 5 3
PS 119 118 117 116 115 114
Frec. 2 2 1 3 6 2
PS 104 103 102 101 100 99
Frec 0 1 1 0 4 1.
PS 89 88 87 86
Frec 0 0 0 1
2-4
• PASOS PARA UNA DISTRIBUCIÓN DE FERECUENCIAS: 1.Ordeno los datos y determino el recorrido de la variable RV = (143-86) = 57 2.Determino el número de intervalos, clases o categorías(K): K= 1 + 3,322 (log144) = 8.17 3.Obtener el tamaño o amplitud de cada intervalo W= RV/K = (57/8.17) = 6.9 = 7 4.Ubicar cada observación individual en C/intervalo.
2-6
EJEMPLO 1 continuaci贸n
Intervalo 86-93 94-101 102-109 110-117 118-125 126-133 134-141 142-149 Total
Frecuencia, absoluta 2 40 36 21 18 8 14 5 144
Frecuencia, relativa 0.014 0.278 0.250 0.146 0.125 0.056 0.097 0.035
2-5
EJEMPLO 2 • El director de la escuela de Medicina de la UNACH desea determinar cuánto estudian los alumnos de tercer semestre en la cátedra de Bioestadística. Para ello selecciona una muestra aleatoria de 30 estudiantes y determina el número de horas por semana que estudia cada uno: • 15.0, 23.7, 19.7, 15.4, 18.3, 23.0, 14.2, 20.8, 13.5, 20.7, 17.4, 18.6, 12.9, 20.3, 13.7, 21.4, 18.3, 29.8, 17.1, 18.9, 10.3, 26.1, 15.7, 14.0, 17.8, 33.8, 23.2, 12.9, 27.1, 16.6. • Organice los datos en una distribución de frecuencias.
2-6
EJEMPLO 2
continuaci贸n
Considere las clases 8-12 y 13-17. Las marcas de clase son 10 y 15. El intervalo de clase es 5 (13 - 8).
Horas de estudio 8-12 13-17 18-22 23-27 28-32 33-37
Frecuencia, f 1 12 10 5 1 1
2-7
SUGERENCIAS PARA ELABORAR UNA DISTRIBUCIÓN DE FRECUENCIAS • Los intervalos de clase usados en la distribución de frecuencias deben ser iguales. • Determine un intervalo de clase sugerido con la fórmula: i = (valor más alto - valor más bajo)/número de clases.
2-8
SUGERENCIAS PARA ELABORAR UNA DISTRIBUCIÓN DE FRECUENCIAS
• Use el intervalo de clase calculado sugerido para construir la distribución de frecuencias. Nota: este es un intervalo de clase sugerido; si el intervalo de clase calculado es 97, puede ser mejor usar 100. • Cuente el número de valores en cada clase.
2-9
DISTRIBUCIÓN DE FRECUENCIA RELATIVA • La frecuencia relativa de una clase se obtiene dividiendo la frecuencia de clase entre la frecuencia total. Horas 8-12
Frecuencia, Frecuencia f relativa 1 1/30=.0333
13-17
12
12/30=.400
18-22
10
10/30=.333
23-27
5
5/30=.1667
28-32
1
1/30=.0333
33-37
1
1/30=.0333
TOTAL
30
30/30=1
T
2-10
REPRESENTACIONES DE TALLO Y HOJA • Representaciones de tallo y hoja: técnica estadística para representar un conjunto de datos. Cada valor numérico se divide en dos partes: los dígitos principales son el tallo y el dígito siguiente es la hoja. • Nota: una ventaja de la representación de tallo y hoja comparado con la distribución de frecuencias es que no se pierde la identidad de cada observación.
2-11
EJEMPLO 2 โ ข Colin logrรณ las siguientes calificaciones en el doceavo examen de contabilidad del semestre: 86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82, 85. Construya una representaciรณn de tallo y hoja para los datos. tallo
hoja
6
9
7
89
8
234568
9
126
2-12
PRESENTACIÓN GRÁFICA DE UNA DISTRIBUCIÓN DE FRECUENCIAS • Las tres formas de gráficas más usadas son: – Histogramas – Polígonos de frecuencia – Distribuciones de frecuencias acumuladas (ojiva).
• Histograma: Gráfica donde las clases se marcan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por las alturas de las barras y éstas se trazan adyacentes entre sí.
2-13
PRESENTACION GRÁFICA DE UNA DISTRIBUCIÓN DE FRECUENCIAS • Un polígono de frecuencias consiste en segmentos de línea que conectan los puntos formados por el punto medio de la clase y la frecuencia de clase. • Una distribución de frecuencias acumulada (ojiva) se usa para determinar cuántos o qué proporción de los valores de los datos es menor o mayor que cierto valor.
2-14
HISTOGRAMA PARA LAS HORAS DE ESTUDIO Frecuencia
14 12 10 8 6 4 2 0 10
15
20
25
Horas de estudio
30
35
2-15
POLÍGONO DE FRECUENCIAS PARA LAS HORAS DE ESTUDIO 14
Frecuencia
12 10 8 6 4 2 0 10
15
20
25
Horas de estudio
30
35
2-16
DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS MENOR QUE PARA LAS HORAS DE ESTUDIO 35
Frecuencia
30 25 20 15 10 5 0 10
15
20
25
Horas de estudio
30
35
2-17
GRÁFICA DE BARRAS • Una gráfica de barras se puede usar para describir cualquier nivel de medición (nominal, ordinal, de intervalo o de razón). • EJEMPLO 3: construya una gráfica de barras para el número de personas desempleadas por cada 100 000 habitantes de ciertas ciudades en 1995.
2-18
EJEMPLO 3
continuaci贸n
Ciudad
N煤mero de desempleados por 100 000 habitantes
Atlanta, GA Boston, MA Chicago, IL Los Angeles, CA New York, NY Washington, D.C.
7300 5400 6700 8900 8200 8900
2-19
# desempleados/100 000
GRテ:ICA DE BARRAS PARA LOS DATOS DE DESEMPLEADOS 10000 8000
8900 7300
8200
8900
6700 5400
6000
Atlanta Boston Chicago Los Angeles New York Washington
4000 2000 0 1
2
3
4
Ciudades
5
6