Estadística descriptiva Jóse Luis Peréz

Page 1

ESTADISTICA

La estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Después de analizarlas e interpretarlas. Para realizar exitosamente estos analices, es importante conocer tres conceptos básicos de los estudios estadísticos.

POBLACION: Es el conjunto total de individuos, objetos o eventos que tienen la misma características y sobre el que estamos interesados en obtener conclusiones.

MUESTRA: Es el subconjunto de los individuos de una población estadística. Estas muestran permiten inferir las propiedades del total del conjunto.

VARIABLE: Es la característica o atributos que se estudia sobre cada uno de los elementos de la población o muestra.


Las variables estadísticas son dos clases: 1. La variable cualitativa: clasifica o describe las diferencias entre los elementos de la muestra de acuerdo con sus atributos o características. Ejemplos: El color de tu cabello, el color de un carro, el sabor de helado y comidas preferidas. 2. La variable cuantitativa: Expresa las diferencias entre los elementos de la muestra con valores numéricos.  Las discretas: Admiten únicamente valores en el conjunto de los números naturales, como el número de hijos que hay en una familia.  Las continúas: Permiten el manejo de valores comprendidas entre dos números naturales consecutivos, como la variable estatura. TABLA DE FRECUENCIA Con el objeto de obtener una mayor síntesis de datos, esto se puede agrupar en interna los de clase o clases para luego presentarlos en distribuciones o tablas de frecuencia que registra la siguiente información. INTERVALOS DE CLASES: Es cada uno en los cuales se decide agrupar parcialmente algunos datos con el objeto de presentar el resumen de ellos, cada intervalo se simboliza con la notación (a,b ). LONGITUD DEL INTERVALO: La longitud del intervalo es la diferencia entre el dato mayor y el dato menor de una lista de datos (RANGO) entre el número de intervalos (k). Para construir la tabla o distribuciones de frecuencias es importante el número de intervalos que se van a considerar para el resumen de datos, algunos ESTADISTICO sugieren o recomiendan de 4 – s intervalos si los datos de 10 a 100 0 8 – 11 intervalos si los


datos van de 100 a 1000 o 11 – 14 intervalos si los datos van de 1000 a 10000. Otros. Recomiendan utilizar la FORMULA DE STURGES para determinar el número de intervalos; así: K= 1 + 3,322 log Dónde: N: es el número de datos K= es el número de intervalos de clases MARCA DE CLASES: Es el punto medio de un intervalo de clases (m), se calcula así: (a,b) = ( a+b ) 2 FRECUENCIA ABSOLUTA: Es el número de veces que se repite un dato, dentro de todas los valores. FRECUENCIA RELATIVA: Brinda información sobre que parte de la población o muestra corresponde a las características analizada. La frecuencia relativa de cada dato se obtiene dividiendo la frecuencia absoluta por el número total de datos; este resultado puede expresarse como fracción o como número decimal. ACTIVIDAD PRÁCTICA 1. Una compañía dedicada a fabricar medicamentos para la diabetes debe probar la efectividad de un nueva medicina, para ello, reúne un grupo de 5.000 personas que padecen de la enfermedad y suministra el medicamento a algunos pacientes cada 6 horas, a otros 8 horas, y a otros 12 horas, dependiendo de la edad de cada uno de ellos. Identifica: a. Población b. Muestra c. Variables d. Clases de variables 2. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:


3, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11, 34, 36, 12, 22, 17, 33, 43, 19, 48, 38, 25, 36, 32, 38, 28, 30, 36, 39, 40. Construir la tabla de distribuciones de frecuencias. 3. Las calificaciones de 50 alumnos en matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. TABLA DE FRECUENCIA

UNTUACION NTERVALOS)

3-10)

11-18)

19-26)

27-34)

35-42)

43-50)

MARCA DE CLASE

FRECUENCI A ABSOLUTA

3+ 10 2 ¿6,5 11 +18 2 ¿ 14,5 19+ 26 2 ¿ 22,5 27 +34 2 ¿ 30,5 35+ 42 2 ¿ 38,5 43+50 2 ¿ 46,5

3 4 7 10 12 3

FRECUENCI A RELAIVA

3 40 4 40 7 40 10 40 12 40 3 40

FRECUENCI A ABSOLUTA ACUMULAD A

3 7

FRECUENC IA RELATIVA ACUMLAD A

0.075 0.175

14

0.35

24

0.6

36

0.9

39

0.975

SOLUCION Para solucionar la tabla de frecuencia se realiza lo siguiente.


 Primero se calcula el tamaño del intervalo teniendo en cuenta que: el dato mayor 48 y el dato menor 3 entre el número de intervalos k= 6,3 intervalos. 48−3  Tamaño del intervalo= =7 6 La FORMULA DE STAURES para determinar el número de intervalos, así: K= 1 + 3,322 long K=1 + 3,322 log (40) K=6,3 DONDE: N: es el número de datos k=es el número de intervalos de clase. Segundo, se hallan los intervalos: Primer intervalo:  Límite inferior: 3  Límite superior: 3 + 7= 10 Segundo intervalo:  Límite inferior: 10+1=11  Límite superior:11+7=18 Tercer intervalo:  Límite inferior: 18+1=19  Límite superior: 19+7=26 Cuarto intervalo:  Límite inferior: 26+1=27  Límite superior: 27+7=34 Quinto intervalo:


 Límite inferior:34+1=35  Límite superior: 35+7=42 Sexto intervalo:  Límite inferior:42+1=43  Límite superior: 43+7=50 Evaluación Primer intervalo:  Límite inferior: 0+1=0  Límite superior: 0+1,5=1,5 Segundo intervalo:  Límite inferior: 1,5+1=2,5  Límite superior: 2,5+1,5=4,0 Tercer intervalo:  Límite inferior: 4,0+1= 5,0  Límite superior: 5,0+1,5=6,5 Cuarto intervalo:  Límite inferior: 6,5+1=7,5  Límite superior: 7,5+1,5=9 Quinto intervalo:  Límite inferior: 9+1=10  Límite superior: 10+1,5=11,5 Sexto intervalo:  Límite inferior: 11,5+1=12,5  Límite superior: 12,5+1,5=14 TABLA DE FRECUENCIA


PUNTUACION

MARCA DE CLASE

(O-1,5) (2,5-4,0) (5,0-6,5) (7,5-9) (10-11,5) (12,5-14)

FRECUENCIA ABSOLUTA

FRECUENCIA RELATIVA

FRECUENCIA ABSOLUTA ACUMULADA

FRECUANCIA RELATIVA ACUMULADA

0+1,5 2 ¿ 0,75 2,5+ 4,0 2 ¿ 3,25 5,0+ 6,5 2 ¿5,75 7,5+ 9 2 ¿ 8,25 10+ 11,5 2 ¿ 10,75 12,5+14 2 ¿ 13,25

EVALUACION 1. La puntuación final de 50 estudiantes de grado séptimo, en una de matemáticas, se registra de la siguiente manera: 6,8 7,8 5,8 7,9 8,0 10,0 7,5 8,0 6,5 3,3 7,0 3,5 7,0 9,0 5,6 1,5 2,8 4,7 7,5 4,5 7,8 2,8 8,0 8,0 8,0 4,0 7,0 5,5 3,0 8,0 9,3 9,4 3,5 4,6 5,7 7,5 9,5 9,2 3,8 4,9 9,6 8,8 8,9 7,9 5,5 10,0 8,5 9,3 8,4 9,5 Construye una tabla de frecuencias ordenando los datos en intervalos de amplitud 1,5 y halla la marca de clase. Puntuación

(1,5-3) (3-4,5) (4,5-6)

Marca de clase

1,5+ 3 2 ¿2,25 3+ 4,5 2 ¿ 3,75 4,5+6 2 ¿ 5,25

Frecuenc ia absoluta

3 6 9

Frecuenc ia relativa 3 50 6 50 9 50

Frecuenc ia absoluta acumula da

Frecuencia relativa acumulada

3

0,06

9

0,1

18

0,2


(6-7,5) (7,5-9,0) (9,0-10,5)

6 +7,5 2 ¿ 6,8 7,5+ 9,0 2 ¿ 8,3 9,0+10,5 2 ¿ 9,8

5 10 8

5 50 10 50 8 50

23

0,1

33

0,2

51

0,2

ACTIVIDAD 1. Construye en tu cuaderno una tabla estadística con los datos obtenidos al lanzar un dado 33 veces. 43241566411 22355514363 13263214456 PUNTUACIO N

( 1,2 ) ( 2,3 ) ( 3,4 ) ( 4,5 ) ( 5,6 )

MARC FRECUENCI A DE A CLASE ABSOLUTA 1+2 2 ¿ 1,5 2+3 2 ¿ 2,5 3+ 4 2 ¿ 3,5 4+5 2 ¿ 4,5 5+6 2 ¿ 5,5

6 5 6 6 5

FRECUENCI A RELATIVA

6 33 5 33 6 33 6 33 5 33

FRECUENCI A ABSOLUTA ACUMULAD A

FRECUENCI A RELATIVA ACUMULAD A

6

0,18

11

0,15

17

0,18

23

0,18

28

0,15


2. Reúnanse en grupos de tres estudiantes y analicen la información de la tabla 4.9, luego, determinen la marca de la clase del segundo y el séptimo intervalo. SALARIOS SEMANALES EN PESOS SALARIO

NUMERO DE EMPLEADOS 8

(30000,39999)

MARCA DE CLASE 30000+ 39999 2 34999

(40000,59999)

10

40000+59999 2 49999

(60000,79999)

16

60000+ 79999 2 69999

14

80000+ 89999 2 84999

(90000,99999)

10

90000+99999 2 94999

(100000,10999 9)

5

100000+109999 2 104999

(11000,119999)

2

110000 +119999 2 114999

(80000,89999)

TABLA 4.9  ¿Cómo resolvieron las inquietudes que surgieron al desarrollar la actividad? RTA: Resolvimos la tabla sumando la cantidad de números que nos daban y luego el resultado lo dividimos en 2.


3. Los tiempos que tardan diez niños en lavarse los dientes son: 1 min 30 s 2 min 45 s 3 min 30 s 1 min 20 s 1 min 30 s 0 min 45 s 3 min 00 s 3 min 15 s 1 min 45 s 2 min 35 s Haz una tabla estadística en tu cuaderno agrupando los datos en tres clases. 4. Haz una tabla estadística en tu cuaderno con los datos sobre la duración, en minutos, de 20 películas agrupándolas en clases de amplitud 25 min. 90 120 122 95 145 75 66 207 45 77 148 69 110 180 88 90 95 110 85 125 5. Completa la tabla 4.10. INTERVAL O DE CLASE (0,10) (10,20) (20,30) (30,40) (40,50) (50,60)

XI

FI 6 4 7 5 3 5

HI

FI 6 17

TABLA 4.10

6. Se realiza una encuesta a tres cursos de séptimo grado sobre las tareas domésticas. Una de las preguntas es sobre el tiempo que se tarda en tender la cama. Los resultados son los siguientes:


DURACION (MINUTOS) NUMERO DE ESTUDIANTE S

(1, 2) 11

(2, 3)

(3, 4)

(4, 5)

25

28

0

(5, 6) 4

a) ¿Hay algún estudiante que tarde seis minutos en tender la cama? ¿y un minuto? Explica tus respuestas. b) ¿Qué porcentaje de estudiantes tarda más de cuatro minutos en tender la cama? c) ¿Qué porcentaje de estudiantes tarda menos de dos minutos en tender la cama? 7. Se recogieron los datos de la tabla 4.12 respecto al lugar de vacaciones preferido por 100 personas escogidas al azar. Lugar Montaña Playa Campo Ciudad No sale de viaje

fi 17 45 15 10 13 Tabla 4.12

a) Elabora en tu cuaderno la tabla de frecuencias. b) ¿Cuál es el porcentaje de personajes que visita en vacaciones la playa? c) ¿Qué porcentaje de personajes no visita algunos de los lugares mencionados? d) ¿Qué lugar es el preferido por el 10% de los encuestados? 8. Las edades de 40 personas que aspiran a ingresar a la universidad son: 16 17 19 15 19 17 18 15 16 15 20 17 20 16 19 21 18 21 18 22 18 19 18 17 15 19 16 20 23 21


a) Si se quiere agrupar los datos en cuatro intervalos, ¿Cuál debe ser su longitud? b) ¿Cuáles serán los intervalos? d) Construye en tu cuaderno la tabla de frecuencias para estos intervalos.

CP-E


Puntuac Marc Frecue Frecue ión a de ncia ncia (interva clase absolut relativa los) a 3+10 2 ¿=6,5 11+18 (11-18) 2 ¿=14,5 19+26 (19-26) 2 ¿=22,5 27+34 (27-34) 2 ¿=30,5 35+ 42 (35-42) 2 ¿=38,5 43+50 (43-50) 2 ¿=46,5 Escriba aquí laecuación .

(3-10)

3 4 7 10 13 3

3 40 4 40 7 40 10 40 13 40 3 40

Frecue ncia absolut a acumul ada

Frecue ncia relativa acumul ada

3 7

0,175

14 0,35 24

0,6

37 0,325 40

0,075

Primero, se calcula el tamaño del intervalo teniendo en cuenta que: el dato mayor es 10 y el dato menor 0 entre el numero de inérvalos k= 6,6 Tamaño del intervalo =

10−0 =1,5 6,6

La fórmula de surges para determinar el número de intervalos, así: K= 1+3,322 log 50 K=1+3,322 log(50)


K=6,6 Donde: N: es el numero de datos K=es el numero de intervalos de clases Segundo, se hallan los intervalos: Primer intervalo: Limite inferior:0 Limite superior:0+1,5=1,5

Segundo intervalo: Limite inferior: 1,5+1=2,5 Limite superior:2,5+1,5=4,0

Tercer intervalo: Limite inferior:4,0+1=5,0 Limite superior:5,0+1,5=6,5

Cuarto intervalo: Limite inferior:6,5+1=7,5 limite superior:7,5+1,5=9

quinto intervalo:


limite inferior:9+1=10 limite superior:10+1,5=11,5

sexto intervalo: limite superior:11,5+1=12,5 limite superior:12,5+1,5=14

Evaluación de estadística 1. La puntuación final de 50 estudiantes del grado séptimo, en una de matemáticas, se registra de la siguiente manera: 6,8,7,8,5,8,7,9,8,0,1,0,0,7,5,8,0,6,5,3,3,7,0,3,5,7,0,9,0,5,,6,1,5,2,8,4,7 ,7,5,4,5,7,8,2,8,8,0,8,0,8,0,4,0,7,0,5,5,3,0,8,0,9,3,9,4,3,5,4,6,5,7,7,5,9 ,5,9,2,3,8,4,9,9,6,8,8,8,8,8,9,7,9,5,5,10,0,8,5,93,8,4,95

Construye una tabla de frecuencia ordenado los datos en intervalos de amplitud 1,5 y halla la marca de clase.

puntua Marca ción de (interva clase los

Frecue ncia absolut a

Frecue ncia relativ a

Frecue ncia absolut a acumul ada

Frecue ncia relativ a acumul ada


(1,5+3) (3+4,5) (4,5+6) (6+7,5) (7,5+9, 0) (9,0+10 ,5)

1,5+ 3 2 2,25 3+ 4,5 2 3,75 4,5+6 2 5,25 6 +7,5 2 6,8 7,5+ 9,0 2 8,3 9,0+10,5 2 9,75

4

4 50

4 5 50

5

9

0,08 0,1

7 50

16

0,14

5 50

23

0,1

10

10 50

33

0,2

10

10 50

43

0,2

7 5

1. Construye una tabla de estadĂ­stica con los datos obtenidos al lanzar un dado 33 veces.

43241566411


22355514363 13263214456

puntuac iĂłn (interval os)

Mar ca de clas e

(1,2) (2,3) (3,4) (4,5) (5,6)

1+2 2 1,5 2+3 2 2,5 3+ 4 2 3,5 4+5 2 4,5 5+ 6 2 5,5

Frecuen Frecuen Frecuen cia cia cia absolut relativa absolut a a acumul ada 6 6 6 33

Frecuen cia relativa acumul ada 0,18

5

5 33

11

0,15

6

6 33

17

0,18

6

6 33

23

0,18

5

5 33

28

0,15

Salarios semanales en pesos Salario ($) (30000,39999)

NĂşmero de empleados 8

(40000,59999)

10

(60000,79999)

16

Marca de clases 30000+ 39999 2 34999 40000+59999 2 49999 60000+ 79999 2 69999


(80000,89999)

14

(90000,99999)

10

(10000,10999)

5

(11000,11999)

2

80000+ 89999 2 84999 90000+99999 2 94999 10000+10999 2 10499 11000 +11999 2 11499

Un polígono de frecuencia se forma uniendo extremos de las barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediantes segmentos. EJEMPLO: las temperaturas en un día en otoño de una ciudad han sufrido las siguientes variaciones.

Un polígono de frecuencia se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos. Ejemplo: las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Hora

Temperatura


6

9

12°

12

14°

15

11°

18

12°

21

10°

24


Polígonos de frecuencia para datos agrupados. Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo un histograma.

(50, 60) (60, 70) (70, 80) (80, 90) (90. 100) (100, 110) (110, 120)

C ¡ 55

8

8

65

10

18

75

16

34

85

14

48

95

10

58

11 0 11 5

5

63

2

65


65

Ejemplo: El peso de 65 personas adultas viene dado por la siguiente:

PolĂ­gonos de frecuencia

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polĂ­gono


1. Dada la distribución siguiente, constrúyase una tabla de estadística en la que aparezcan las frecuencias absolutas, las frecuencias relativas y las frecuencias acumuladas relativas crecientes: X 1 ¡ N 5 ¡

2

3

4

5

6

7

9

6

7

6

2. Las edades de los empleados de una determinada empresa son las que aparecen en la siguiente tabla:

Edad

N° Empleaos Menos de 22 25 menos de 70 35 Menos de 121 45 Menos de 157 55 Menos de 185 65

-sabiendo que el empleado mas joven tiene 18 años, escríbase la distribución de frecuencia acumuladas decrecientes:


3. Las temperaturas medias registradas durante el mes de mayo en Madrid, en grados centígrados, están dadas por la siguiente tabla: Temperatur a N° de días

1 2 1

1 3 1

1 4 2

1 5 3

1 6 6

1 7 8

1 8 4

1 9 3

2 0 2

2 1 1

Constrúyase la representación gráfica correspondiente. 4. Encuestados cincuenta matrimonios respecto a su numero de hijos, se obtuvieron los siguientes datos: 2,4,2,3,1,2,4,2,3,0,2,2,2,3,2,6,2,2,3,2,3,3,4,1,3,3,4,5,2,0,3,2,1,2, 3,2,2,3,1,4,2,3,3,2 ¿construye una tabla estadística que represente los datos?

5. Unos grandes almacenes disponen de un aparcamiento para sus clientes. 4551744365 3244366455 6433454324 5247362241 2137315172


4424536353

-obtener la de frecuencia para ese conjunto de datos. Interpretar la tabla.

MEDIDA ARITMETICA

Se define medida aritmética de una serie de valores como el resultado producido a la sumar por el numero total de valores. La medida. X=

f ¡ x ¡ p 2 x 2+ …+ pn xn f ¡ x ¡ = con ¡=1,2 … p¡+ …+ pn p¡

MEDIANA La media aritmética no siempre es representativa de una seri estadística. Para completarla, se utiliza un valor numérico conocido como mediana o valor centra. La mediana es única para cada grupo de valores. Cuando el numero de valores ordenaos (de mayor a menor, o de menor a mayor) de la serie es impar.


DeterminaciĂłn de la mediana de una serie de valores. MODA En una serie de valores a los que se asocia una frecuencia se define moda como el valor de la variable que posee una frecuencia mayor que los restantes la moda se simboliza normalmente por Mo. Un grupo de valores puede tener varias modas. Una serie de valores con solo una moda se denomina unimodal; si tiene dos modas, es bimodal, y asĂ­ sucesivamente.



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.