ESTADÍSTICA DESCRIPTIVA
4
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE FILOSOFIA NIVELACION 2018-2019 ASIGNATURA: MATEMATICA DOCENTE: ING.ARNALDO MALDONADO TALLER GRUPAL INTEGRANTES:
-CLARA SORIANO -JAMILEX CRUZ -LEANDRA SANCHEZ -JOEL BOHORQUEZ -JEAN-LUC VAN DEN BOSCH -DAYANA OBANDO -ODALYS CAMBA -ESTHER NAVARRETE -SHIRLEY BERRUZ -JESSICA VELASCO
PARALELO: FFC-N-04-MA-12
5
INDICE 1.ESTADISTICA……………………………………………………………………………………………………………….1 1.1 Ejemplos gráficos de estadísticas: tablas y cuadros estadísticos…….……………….1 1.2 Material de apoyo……………………………………………………………………………….………….1 2. ESTADISTICA DESCRIPTIVA…………………………………………………………………………………………3 2.1 Ejemplo…………………………………………………………………………………………………………..3 3. ESTADISTICA INFERENCIAL…………………………………………………………………………………………4 3.1 Ejemplo…………………………………………………………………………………………………………..4 3.2 Material de apoyo…………………………………………………………………………..……………..4 4. CONCEPTOS BASICOS DE LA ESTADISTICA…………………………………………………………………5 5. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS….………………………6 5.2 Ejemplo………………………………………………………………………………………………………….8 5.3 Ejemplo………………………………………………………………………………………………………….9 5.4 Ejemplo……………………………………………………………………………………………………..…10 5.5 Ejemplo………………………………………………………………………………………………………..11 5.6 Ejemplo………………………………………………………………………………………………………..12 6. MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS…………………………………….13 6.1 Ejemplo………………………………………………………………………………………………………..16 7. TABLA DE DISTRIBUCION DE FRECUENCIAS…………………………………………………..………..23 7.1 Ejemplo…………………………………………………………………………………………………..……27 8. MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS……………………………..32 8.1 Ejemplo……………………………………………………………………………………………………….33 9. MEDIDAS DE DISPERCION PARA DATOS AGRUPADOS…………………………………………...41 9.1 Ejemplo………………………………………………………………………………………………………..42 10. MEDIDAS DE POSICION PARA DATOS NO AGRUPADOS……………………………………….43 10.1 Ejemplo……………………………………………………………………………………………………..45 11. GRAFICOS DE REPRESENTACION…………………………………………………………………………..46 Ejemplo……………………………………………………………………………………………………………..47
6
1. ESTADÍSTICA Estadística es una ciencia que utiliza datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. Una estadística es un conjunto de datos obtenidos a través de un estudio estadístico. 1.1.
Ejemplos gráficos de estadísticas: tablas y cuadros estadísticos.
1.2 Material de apoyo: ● Fuente: http://ejemplosde.org/matematicas/ejemplos-deestadistica/#ixzz5PQ2C8Kda ● https://youtu.be/6y-EMFMB5XQ 1
Tipos de estadística Se pueden establecer dos tipos de estadística: - Estadísticas descriptivas. - Estadísticas inferenciales.
DESCRIPTIVA
RECOPILA y ORGANIZA datos, los preesnta de forma INFORMATIVA
ESTADISTICA INFERENCIAL
efectua ESTIMACIONES e HIPOTESIS , se basa en PROBABILIDAD ES.
Material de apoyo ● https://enciclopediaeconomica.com/estadistica-descriptiva-inferencial/
2
2. Estadística descriptiva La estadística descriptiva se puede definir como el estudio que incluye la obtención, organización, presentación y descripción de información numérica. Su objetivo es describir las características principales de los datos reunidos. Ejemplo: La directora de una escuela se propone averiguar cuál es el peso y la altura promedio de los niños de séptimo grado de la institución para analizar qué tipo de alimentos deberían servirse en el comedor. Para cumplir con su objetivo, comienza a elaborar una tabla con las columnas ALUMNO, PESO y ALTURA, completando los datos correspondientes. DATOS: Carlos Gómez – 35 kilogramos – 1,45 metros Damián Ramírez – 38 kilogramos – 1,43 metros Juan Lopresti – 46 kilogramos – 1,46 metros Marcos Elusorte – 53 kilogramos – 1,52 metros
3
3. Estadística inferencial La estadística inferencial es el estudio que utiliza técnicas a partir de las cuales se obtienen generalizaciones o se toman decisiones en base a una información obtenida mediante técnicas descriptivas. Su objetivo es extraer conclusiones de utilidad sobre el total de las observaciones posibles basándose en la información obtenida. 3.1 Ejemplo: X 3.9 4.0 3.8 3.7 4.1 3.7 3.8 4.2 X= 3.9
0 .01 .01 .04 .04 .04 .01 .09
3.2 Material de apoyo ● https://youtu.be/NAp8Wy3YfzI
4
Una empresa que se dedica a llenar bolsas de azúcar que deberán pesar en promedio 4kg. Desea verificar si el peso está dentro de la especificación para la cual se toma una muestra. DATOS:
4. CONCEPTOS BÁSICOS DE LA ESTADÍSTICA La palabra "estadística" se refiere a la colección de datos numéricos. Se denomina estadística (del alemán statistik, que significa “análisis de los datos estatales”) a la disciplina encargada de estudiar y analizar una muestra representativa de datos.
5
5. Medidas de tendencia central para datos no agrupados Las medidas de tendencia central se utilizan con bastante frecuencia para resumir un conjunto de cantidades o datos numéricos a fin de describir los datos cuantitativos que los forman. Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de los estudiantes de la universidad o el peso promedio de las bolsas de cereal que son llenadas por una determinada máquina en un proceso de producción o las ventas de un negocio. Las medidas de tendencia central son también frecuentemente usadas para comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido por un grupo de vendedores de una zona comparado con el promedio de ventas otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de una sucursal, comparado con el promedio de reclamos de otra sucursal. Otras características generales de las medidas de tendencia central son las siguientes: • Permiten apreciar qué tanto se parecen lo grupos entre sí. • Son valores que se calculan para un grupo de datos y que se utiliza para describirlos de alguna manera El cálculo de las medidas de tendencia central se hace mediante fórmulas, las cuales cambian según como se encuentren los datos del grupo con el que se va a trabajar, esto es si están como Datos no agrupados o como Datos agrupados (Distribuciones de frecuencias). Las medidas de tendencia central son: ❖ Media aritmética 6
❖ Media ponderada ❖ Media geométrica ❖ Media armónica ❖ Moda ❖ Mediana
Media Aritmética para datos no agrupados La media aritmética, o promedio aritmético, es la suma de los valores del grupo de datos dividida entre la cantidad de valores. Su fórmula se puede describir de la siguiente manera:
O simbólicamente
7
Media Ponderada para datos no agrupados Es una media aritmética en donde a cada uno de los valores le es asignada una ponderación de acuerdo con la importancia relativa en el grupo. Es obtenido como sigue: primero, multiplicar cada valor por la ponderación asignada al valor correspondiente; segundo, sumar estos productos; y tercero, dividir la suma de los productos entre la suma de las ponderaciones. Las fórmulas para la media ponderada poblacional y muestra son idénticas Ejemplo: Cálculo de Media Ponderada
8
Media geométrica para datos no agrupados La media geométrica G, de un conjunto de valores es la raíz n-ésima del producto de los valores de dicho conjunto: Si hay dos valores, la raíz cuadrada del producto de estos dos; si son tres, es la raíz cúbica del producto de los tres valores. La fórmula general es:
Usando logaritmos la fórmula queda:
9
Donde G es el antilogaritmo de este resulta Ejemplo: Cálculo de Media Geométrica
Media Armónica para datos no agrupados Para su cálculo, primero se debe determinar la media aritmética de los recíprocos de los valores individuales, para después obtener el recíproco de esa media aritmética. Lo anterior en fórmula queda:
Ejemplo: Cálculo de Media Armónica
10
Mediana para datos no agrupados Es el valor del elemento central del conjunto. Para encontrar la mediana, primero arreglar los valores del conjunto de acuerdo a su magnitud; es decir, arreglar los valores del más pequeño al más grande o del más grande al más pequeño y después localizar el valor central, es decir, el número de valores sobre la mediana es el mismo que el número de valores debajo de la mediana. Si el número de valores en un conjunto de datos no agrupados es par, no hay mediana verdadera.
El valor de la mediana se supone, por lo tanto, que es igual al valor promedio entre los dos elementos centrales en el arreglo.
La fórmula para obtenerla podría expresarse de la siguiente manera: Ejemplo: Cálculo de Mediana
11
Moda para datos no agrupados También llamada modo o promedio típico de un conjunto de valores; la moda es el valor el cual ocurre más frecuentemente en el conjunto. Si un valor es seleccionado al azar del conjunto dado, un valor modal es el valor más probable a ser seleccionado. Así, la moda es generalmente considerada como el valor más típico en una serie de datos la cual es llamada, por esa razón, UNIMODA. Un conjunto pequeño de datos en el que no se repiten valores medidos carece de moda. Cuando dos valores no adyacentes son casi iguales en cuanto a 12
frecuencias máximas asociadas con ellos, la distribución se llama BIMODAL, aquéllas con varias modas se llaman multimodales.
Ejemplo: Cálculo de Moda
❖ moodle2.unid.edu.mx/dts_cursos_mdl/lic/AE/E/AM/04/datos_no_agru pados.pdf
6. Medidas de dispersión para datos no agrupados Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.
Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística esta información puede ser errónea, pues el hecho de que 13
no influyan más de dos valores del total de la serie puede provocar una deformación de la realidad CALCULO DEL RANGO Para calcular el Rango, se requiere incluir los Limites Reales de Clase. Para lograrlo se emplean las fórmulas que se utilizaron en la sección llamada ORDENAMIENTO DE DATOS, a saber
Observe que la Unidad de Variación es igual a 5, la cual se calcula restando el LNI de la Clase 1(95) al LNS de la Clase 2(100). Para el cálculo de los Limites Reales restamos y sumamos la mitad de la unidad de variación, o sea, 2.5, respectivamente como indican las Formulas anteriores. La tabla quedaría:
⇒ El LRSMAX es igual a 177.5 y el LRIMIN es igual a 77.5, entonces el Rango es de R = 177.5 -77.5 =1 14
Desviación media La desviación respecto a la media es la diferencia entre Cada valor de la variable estadística y la media aritmética. Di = x – x La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
● La desviación media se representa por
Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18
Desviación media para datos no agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:
15
Ejemplo Calcular la desviaci贸n media de la distribuci贸n:
xi
fi
xi 路 fi
|x - x|
|x - x| 路 fi
[10, 15)
12.5
3
37.5
9.286
27.858
[15, 20)
17.5
5
87.5
4.286
21.43
[20, 25)
22.5
7
157.5
0.714
4.998
[25, 30)
27.5
4
110
5.714
22.856
[30, 35)
32.5
2
65
10.174
21.428
16
21
457.5
98.57
DESVIACIÓN TÍPICA Es sin duda la medida de dispersión más importante, ya que además sirve como medida previa al cálculo de otros valores estadísticos.
La desviación típica se define como la raíz cuadrada de la media de los cuadrados de las desviaciones con respecto a la media de la distribución. Es decir,
para datos sin agrupar, o bien:
Cálculo de la desviación típica para datos no agrupados en clases
Veamos la fórmula anterior aplicada a un caso concreto.
17
Hallar la desviación típica de la serie: 5, 8, 10, 12, 16.
x 5 8 10 12 16
2
-5,2 -2,2 -0,2 1,8 5,8
Primero hallamos
27,04 4,84 0,04 3,24 33,64
= 10,2
luego S =
Cálculo de la desviación típica para datos agrupados en clases y agrupados por frecuencias
Método largo: Se aplica la siguiente fórmula
Donde
y f es la frecuencia absoluta de cada intervalo.
Método abreviado o corto: La fórmula a utilizar es:
18
Donde: I: amplitud de la clase D: distancia en clases desde cada una en concreto a la clase que contiene a la media supuesta A.
Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen así: Clases 150 – 155 155 – 160 160 – 165 165 – 170 170 – 175 175 – 180 180 – 185 185 – 190 190 – 195 195 – 200
19
f 3 6 12 18 25 17 10 7 4 1 103
Resp: S = 9,56
Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la mediade una distribución estadística. La varianza se representa por
.
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Propiedades de la varianza 1 La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un número la varianza no varía. 3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número. 20
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamaĂąo:
Si las muestras tienen distinto tamaĂąo:
Ejemplo Calcular la varianza de la distribuciĂłn: 9, 3, 8, 8, 9, 8, 9, 18
21
Calcular la varianza de la distribución de la tabla: xi
fi
xi · f i
xi2 · fi
[10, 20)
15 1
15
225
[20, 30)
25 8
200
5000
[30,40)
35 10 350
12 250
[40, 50)
45 9
405
18 225
[50, 60
55 8
440
24 200
[60,70)
65 4
260
16 900
[70, 80)
75 2
150
11 250
42 1 820
22
88 050
7. Tabla de distribución de frecuencias La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas ordinales. La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se presentan numéricamente las características de la distribución de un conjunto de datos o muestra.
23
Construcción de la tabla de frecuencias 1. En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la variable en el conjunto de datos. 2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y las frecuencias absolutas acumuladas. 3. Las columnas cuarta y quinta contienen la las frecuencias relativas y las frecuencias relativas acumuladas. 4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.
Tipos de frecuencias Existen cuatro tipos de frecuencias:
Frecuencia absoluta La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está en el conjunto (X1, X2,…, XN). 24
La suma de las frecuencias absolutas de todos los elementos diferentes del conjunto debe ser el número total de sujetos N. Si el conjunto tiene k números (o categorías) diferentes, entonces:
Frecuencia absoluta acumulada La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN) es la suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:
Frecuencia relativa La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia absoluta dividida por el número total de elementos N:
Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de las frecuencias relativas de todos los sujetos da 1. Supongamos que en el conjunto tenemos k números (o categorías) diferentes, entonces:
Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto por cien %).
Frecuencia relativa acumulada 25
Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como la proporción de valores iguales o menores a X en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por el número total de sujetos N:
La frecuencia relativa acumulada de cada valor siempre es mayor que la frecuencia relativa. De hecho, la frecuencia relativa acumulada de un elemento es la suma de las frecuencias relativas de los elementos menores o iguales a él, es decir:
Ejemplo Un profesor tiene la lista de las notas en matemáticas de 30 alumnos de su clase. Las notas son las siguientes:
1) Frecuencia absoluta
26
Se realiza el recuento de la variable que se estudia (notas) para ver el número de veces que aparece cada nota. Una vez realizado el recuento, se representan las frecuencias absolutas de cada una de las notas (ni). Las frecuencias son: n1(3)=2, n2(4)=4, n3(5)=6, n4(6)=7, n5(7)=5, n6(8)=3, n7(9)=2 y n8(10)=1. 2) Frecuencia absoluta acumulada
Se calculan las frecuencias absolutas acumuladas (Ni) como la suma de las frecuencias absolutas de los valores menores o iguales a Xi: ▪ N1(3)=n1(3)=2 ▪ N2(4)=n1(3)+n2(4)=2+4=6 ▪ N3(5)=n1(3)+n2(4)+n3(5)=2+4+6=12 ▪ N4(6)=n1(3)+n2(4)+n3(5)+n4(6)=2+4+6+7=19 27
N5(7)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)=2+4+6+7+5=24 N6(8)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)=2+4+6+7+5+3=27 N7(9)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)=2+4+6+7+5+3+2=29 N8(10)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)+n8(10) =2+4+6+7+5+3+2+1=30
▪ ▪ ▪ ▪ ▪
3) Frecuencia relativa Se calcula la frecuencia relativa de cada elemento como la división de la frecuencia absoluta entre el total de elementos N=30. ▪ f1(3) = n1(3)/N = 2/30 = 0,07 ▪ f2(4) = n2(4)/N = 4/30 = 0,13 ▪ f3(5) = n3(5)/N = 6/30 = 0,20 ▪ f4(6) = n4(6)/N = 7/30 = 0,23 ▪ f5(7) = n5(7)/N = 5/30 = 0,17 ▪ f6(8) = n6(8)/N = 3/30 = 0,10 ▪ f7(9) = n7(9)/N = 2/30 = 0,07 ▪ f8(10) = n8(10)/N = 1/30 = 0,03
Se pueden calcular las frecuencias multiplicándolas por 100. 4) Frecuencia relativa acumulada
relativas en
porcentaje
(%)
Para obtener la frecuencia relativa acumulada se divide la frecuencia absoluta acumulada entre el número total de elementos (N=30). Esto da el tanto por uno de elementos iguales o menores al elementos que se estudia. 28
▪ ▪ ▪ ▪ ▪ ▪ ▪ ▪ ▪ ▪ ▪
Las frecuencias relativas acumuladas son las siguientes: F1(3)=f1(3)=0,07 F2(4)=f1(3)+f2(4)=0,07+0,13=0,20 F3(5)=f1(3)+f2(4)+f3(5)=0,07+0,13+0,20=0,40 F4(6)=f1(3)+f2(4)+f3(5)+f4(6)=0,07+0,13+0,20+0,23=0,63 F5(7)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)=0,07+0,13+0,20+0,23+0,17=0,80 F6(8)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8) =0,07+0,13+0,20+0,23+0,17+0,10=0,90 F7(9)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9) =0,07+0,13+0,20+0,23+0,17+0,10+0,07=0,97 F8(10)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)+f8(10) =0,07+0,13+0,20+0,23+0,17+0,10+0,07+0,03=1,00
Se pueden calcular las frecuencias relativas acumuladas en porcentaje (%) multiplicándolas por 100. 5) Tabla de frecuencias Una vez se han calculado todas las frecuencias, se construye la tabla de frecuencias. La tabla es la siguiente:
29
Adicionalmente, se pueden incluir dos columnas con los porcentajes de las frecuencias relativas y frecuencias relativas acumuladas. Se obtiene la siguiente tabla:
â—? https://www.ditutor.com/estadistica/medidas_dispersion.html
30
8. Medidas de Tendencia Central para datos agrupados
Media o Promedio La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega µ cuando se trata del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc. Si una muestra tiene cuatro observaciones: 3, 5, 2 y 2, por definición el estadígrafo será:
Estos cálculos se pueden simbolizar:
Donde Y1 es el valor de la variable en la primera observación, Y2 es el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi 31
representa el valor de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la diferencia entre el valor del dato y la media:
Ejemplo de desviaciones:
Nota: ● Una propiedad interesante de la media aritmética es que la suma de las desviaciones es cero.
32
Mediana Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana. ● La mediana se representa por Me. ● La mediana se puede hallar sólo para variables cuantitativas. Cálculo de la mediana 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 Cálculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre .
● Li es el límite inferior de la clase donde se encuentra la mediana. ● Es la semisuma de las frecuencias absolutas. ● Fi-1 es la frecuencia acumulada anterior a la clase mediana. ● ai es la amplitud de la clase. ● La mediana es independiente de las amplitudes de los intervalos. 33
9. Ejemplo 10. Calcular la mediana de una distribuciĂłn estadĂstica que viene dada por la siguiente tabla: fi
Fi
[60, 63)
5
5
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
8
100
100
100 / 2 = 50 Clase modal: [66, 69)
34
Moda La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda. ● Se representa por Mo. ● Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes: 0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Cálculo de la moda para datos agrupados
35
1º Todos los intervalos tienen la misma amplitud.
● Li es el límite inferior de la clase modal. ● fi es la frecuencia absoluta de la clase modal. ● fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal. ● fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ● ai es la amplitud de la clase. ● También se utiliza otra fórmula de la moda que da un valor aproximado de ésta: Ejemplo Calcular la moda de una viene dada por la siguiente tabla:
fi
36
[60, 63)
5
[63, 66)
18
[66, 69)
42
[69, 72)
27
distribución estadística que
[72, 75)
8 100
2ยบ Los intervalos tienen amplitudes distintas. En primer lugar tenemos que hallar las alturas.
La clase modal es la que tiene mayor altura.
La fรณrmula de la moda aproximada cuando existen distintas amplitudes es:
Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda.
37
fi
hi
[0, 5)
15
3
[5, 7)
20
10
[7, 9)
12
6
[9, 10)
3
3
50
● www.seduca2.uaemex.mx/ckfinder/uploads/files/21__medidas_de_tend.pdf ● https://www.ditutor.com/estadistica/medidas_centralizacion.html
38
9. MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS Las medidas de dispersión nos permiten conocer si los valores en general están cerca o alejados de los valores centrales, muestran la variabilidad de una distribución de datos, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la medida de tendencia central. RANGO Es la diferencia entre el valor máximo y el mínimo en nuestros datos, esta medida de dispersión aunque es la más fácil de obtener, lo general es muy poco usada.
en
Hay dos formas para determinar el rango para datos agrupados: ● punto medio de la clase más alta – punto medio de la más baja ● límite superior de la clase más alta – límite inferior de la más baja DESVIACIÓN MEDIA La desviación media o desviación promedio es abreviada por MD. Mide la desviación promedio de valores con respecto a la media del grupo, sin tomar en cuenta el signo de la desviación. DESVIACIÓN ESTÁNDAR La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de 39
distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable. VARIANZA
Es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones
EJEMPLO: Calcular la desviación media de la distribución:
xi
fi
xi · fi
|x - x|
|x - x| · fi
[10, 15)
12.5
3
37.5
9.286
27.858
[15, 20)
17.5
5
87.5
4.286
21.43
40
[20, 25)
22.5
7
157.5
0.714
4.998
[25, 30)
27.5
4
110
5.714
22.856
[30, 35)
32.5
2
65
10.174
21.428
21
457.5
MATERIAL DE APOYO: https://www.youtube.com/watch?v=Mpy9e5Rj6g8
41
98.57
10.
MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
CUARTILES Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.
Cómo calcular los cuartiles: ● Ordenamos los datos de menor a mayor. ● Buscamos el lugar que ocupa cada cuartil mediante la expresión
DECILES Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
42
D5 coincide con la mediana.
Cómo calulcar los deciles Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
Cuando n es par:
Cuando n es impar: Siendo A el número del decil.
PERCENTILES Son los valores de la variable que dividen un conjunto de datos clasificados en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El k-ésimo percentil, Pk , es un valor que a lo sumo k% de los datos son menores en valor que Pk y a lo sumo (100 - k)% de los datos son mayores.
43
Cómo calcular un percentil Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Para los percentiles, cuando n es par:
Cuando n es impar:
Siendo A, el número del percentil. Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75.
EJEMPLOS: Dadas las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: Los percentiles 32 y 85.
3, 5, 2, 7, 6, 4, 9. 7 · (32/100) = 2,2 P 3 2 = 4 7 · (85/100) = 5.9 P 8 5 = 7
3, 5, 2, 7, 6, 4, 9, 1. 8 · (2/10) = 1.6 D 2 = 2 8 · (7/10) = 5.6 D 7 = 6
MATERIAL DE APOYO: https://www.youtube.com/watch?v=chRDQyoJRBI
44
11.
GRAFICOS DE REPRESENTACIÓN
En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los análisis de forma rápida, directa y comprensible para un conjunto amplio de personas. ●
●
●
●
●
● ●
45
Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa. Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas continuas. Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un sistema de ejes cartesianos. Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones proporcionales según el valor de las frecuencias relativas. Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable. Cartogramas: expresiones gráficas a modo de mapa. Pirámides de población: para clasificaciones de grupos de población por sexo y edad.
EJEMPLO:
MATERIAL DE APOYO: https://www.youtube.com/watch?v=rJPyV7V7ssc
46