FACULTAD: FILOSOFÍA Y LETRA Y CIENCIAS DE LA EDUCACIÓN INTEGRANTES: MARÍA CRUZ XIMENA QUINTERO LISSETTE ZAVALA ANGIE IBARRA KAREN MEJÍA
Docente: Ing. Arnaldo Andrade
Curso: m. a 12 2
ÍNDICE DEFINICIÓN DE ESTADÍSTICA………………………………………4
ESTADÍSTICA DESCRIPTIVA…………………………………………5
CONCEPTO BÁSICO DE LA ESTADÍSTICA…………………………6
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS……………………7 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS…………………………………………………………11
MEDIDAS DE TENDENCIA CENTRA PARA DATOS AGRUPADOS…………………………………………………………15
GRÁFICOS DE REPRESENTACIÓN………………………………22
3
DEFINICIÓN DE ESTADÍSTICA Es la rama de las matemáticas que estudia la variabilidad, así como el proceso aleatorio que la genera siguiendo leyes de probabilidad. como parte de la matemática, la estadística es una ciencia formal deductiva, con un conocimiento propio, dinámico y en continuo desarrollo obtenido a través del método científico formal. en ocasiones, las ciencias fácticas necesitan utilizar técnicas estadísticas durante su proceso de investigación factual, con el fin de obtener nuevos conocimientos basados en la experimentación y en la observación. en estos casos, la aplicación de la estadística permite el análisis de datos provenientes de una muestra representativa, que busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. La estadística es útil para una amplia variedad de ciencias fácticas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. además, se usa en áreas de negocios o instituciones gubernamentales con el objetivo de describir el conjunto de datos obtenidos para la toma de decisiones, o bien para realizar generalizaciones sobre las características observadas. En la actualidad, la estadística aplicada a las ciencias fácticas permite estudiar una determinada población a partir de la recopilación de información, el análisis de datos y la interpretación de resultados. del mismo modo, también es una ciencia esencial para el estudio cuantitativo de los fenómenos de masa o colectivos.
CARACTERÍSTICAS DE LA ESTADÍSTICA • • • •
Su estudio, uso y aplicación es fundamental para la toma de decisiones de diferentes ámbitos. Da lugar a un proceso que estudia problemas sociales, científicos e industriales. Es un sistema que puede tomar un tiempo hasta generar resultados verídicos y con soluciones pautadas. Proporciona un resultado estimado, ya sea numérico o social, a la vez que ofrece conclusiones que conducen a una solución. 4
TIPOS DE ESTADÍSTICA La estadística se divide en dos grandes áreas:
ESTADÍSTICA DESCRIPTIVA Se dedica a la descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Su objetivo es organizar y describir las características sobre un conjunto de datos con el propósito de facilitar su aplicación, generalmente con el apoyo de gráficas, tablas o medidas numéricas.
5
• •
Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Ejemplos gráficos son: histograma, pirámide poblacional, gráfico circular, entre otros.
CONCEPTO BÁSICO DE LA ESTADÍSTICA ➢ Estudio de los datos cuantitativos de la población de los recursos, naturales industriales, o manifestaciones de las sociedades humanas. ➢ Conjunto de datos. ➢ Rama de la matemática que utiliza grandes conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de la probabilidad.
ESTADÍSTICA INFERENCIAL Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. 6
Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen análisis de varianza, series de tiempo y minería de datos. Su objetivo es obtener conclusiones útiles para lograr hacer deducciones acerca de la totalidad de todas las observaciones hechas, basándose en la información numérica.
TABLA DE DISTRIBUCIÓN DE FRECUENCIA La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución de los datos mediante sus frecuencias. Elaborar una tabla de frecuencias es muy sencillo, y en este artículo te mostraremos como hacerlo. Tenemos dos tipos de tablas de frecuencias: • •
Tablas de frecuencias con datos no agrupados. Tablas de frecuencias con datos agrupados.
TABLAS DE FRECUENCIAS CON DATOS NO AGRUPADOS Se utiliza para variables cuantitativas o cualitativas ordinales. La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se presentan numéricamente las características de la distribución de un conjunto de datos o muestra. Esta tabla está compuesta por las siguientes columnas: • •
Valores de la variable: son los diferentes valores que toma la variable en el estudio. Frecuencia absoluta: es la cantidad de veces que aparece el valor en el estudio. La sumatoria de las frecuencias absolutas es igual al número de datos. 7
•
•
•
Frecuencia acumulada: es el acumulado o suma de las frecuencias absolutas, indica cuantos datos se van contando hasta ese momento o cuántos datos se van reportando. Frecuencia relativa: es la fracción o proporción de elementos que pertenecen a una clase o categoría. Se calcula dividiendo la frecuencia absoluta entre el número de datos del estudio. Frecuencia relativa acumulada: es la proporción de datos respecto al total que se han reportado hasta ese momento. Es la suma de las frecuencias
relativas, y se puede calcular también dividiendo la frecuencia acumulada entre el número de datos del estudio. •
•
Frecuencia porcentual: es el porcentaje de elementos que pertenecen a una clase o categoría. Se puede calcular rápidamente multiplicando la frecuencia relativa por 100%. Frecuencia porcentual acumulada: es el porcentaje de datos respecto al total que se han reportado hasta ese momento. Se puede calcular rápidamente multiplicando la frecuencia relativa acumulada por 100%.
CONSTRUCCIÓN DE LA TABLA DE FRECUENCIAS CON DATOS NO AGRUPADOS 1. En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la variable en el conjunto de datos. 2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y las frecuencias absolutas acumuladas. 3. Las columnas cuarta y quinta contienen la las frecuencias relativas y las frecuencias relativas acumuladas. 4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias por cien. 8
Ejemplo 1: Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes resultados: negro
Azul
Amarrillo
Rojo
Azul
Azul
Rojo
Negro
Amarillo
Rojo
Rojo
amarillo
Amarillo
Azul
Rojo
negro
azul
rojo
negro
amarillo
Con los resultados obtenidos, elaborar una tabla de frecuencias. Solución: En la primera columna, colocamos los valores de nuestra variable, en la segunda la frecuencia absoluta, luego la frecuencia acumulada, seguida por la frecuencia relativa, y finalmente la frecuencia relativa acumulada. Por ser el primer problema, no haremos uso de las frecuencias porcentuales.
Color
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
Frecuencia relativa acumulada
Negro
4
4
0,20
0,20
ZUL
5
9
0,25
0,45
AMARILLO
5
14
0,25
0,70
ROJO
6
20
0,30
1
TOTAL
20 9
TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS Usamos las tablas de frecuencias con datos agrupados cuando la variable toma un gran número de valores o es una variable continua. Para ello, se agrupan los diferentes valores en intervalos de igual amplitud, a los cuáles llamamos clases. Aparecen además algunos parámetros importantes: • • •
LÍMITES DE CLASE: cada clase es un intervalo que va desde el límite inferior, hasta el límite superior. MARCA DE CLASE: es el punto medio de cada intervalo, y representa a la clase para el cálculo de algunos parámetros. AMPLITUD DE CLASE: es la diferencia entre el límite superior y el límite inferior.
Los pasos para elaborar una tabla de frecuencias con datos agrupados, son los siguientes: • •
• • •
Hallar el rango(R): R = Xmax– Xmin Hallar el número de intervalos (K). Si el problema no indica cuántos intervalos usar, se recomienda usar la regla de Sturgues: K = 1 + 3, 322.log(n); siendo n el número de datos. Determinar la amplitud de clase (A): A = R/K Hallar el límite inferior y superior de cada clase, así como las marcas de clase. Colocar los valores hallados en las columnas de la tabla de frecuencias, con el siguiente orden: clases (intervalos), marcas de clase, frecuencia absoluta, frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada. Además, se puede colocar la frecuencia porcentual y la frecuencia porcentual acumulada.
Recuerda que los intervalos no deben superponerse, es decir, deben ser mutuamente excluyentes.
Ejemplo 3: Las notas de 35 alumnos en el examen final de estadística, calificado del 0 al 10, son las siguientes: 10
0; 0; 0; 0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 8; 8; 8; 9; 10; 10. Con los datos obtenidos, elaborar una tabla de frecuencias con 5 intervalos o clases. Solución: ▪ Hallamos el rango: R = Xmax– Xmin = 10 – 0 = 10. ▪ El número de intervalos (k), me lo da el enunciado del problema: k = 5. ▪ Calculamos la amplitud de clase: A = R/k = 10/5 = 2. ▪ Ahora hallamos los límites inferiores y superiores de cada clase, y elaboramos la tabla de frecuencias.
intervalo
Marca Frecuencia Frecuencia Frecuencia Frec. relativa de clase absoluta acumulada relativa acumulada
[0 – 2)
1
8
8
0,229
0,229
[2 – 4)
3
7
15
0,200
0,429
[4 – 6)
5
8
23
0,229
0,658
[6 – 8)
6
6
29
0,171
0,829
[8 – 10]
9
6
35
0,171
0
total
35
1
Medidas de Tendencia Central para datos no agrupados para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos. 11
Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones. Medidas de tendencia central: Son indicadores estadísticos que muestran hacía que valor (o valores) se agrupan los datos. Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media, mediana y moda. En cada caso, se ubican alrededor del punto en donde se aglomeran los datos. Media aritmética: Medida de tendencia central usualmente llamada promedio, se define como la división de la suma de todos los valores entre el numero de datos.
MEDIANA: Del conjunto de datos obtenidos es el valor que al organizar los datos en orden ascendente o descenderte a la mitad o centro de los mismos. La posición que ocupa la mediana puede ser determinada mediante la siguiente fórmula: Mediana =X[(n/2) +1/2]
Ejemplo: Dados los siguientes 8 datos ordenados en orden ascendente: 5,8,8,11,11,11,14,16., encuentra la mediana.
12
Utilizando la fórmula para ubicar la posición del dato que representa la mediana indica que:
Mediana = (8/2) +1/2 = 4.5
Por lo que la mediana está ubicada entre el dato 4 y 5; el valor del dato 4 es “ 11” y del dato 5 es “ 11”, por lo que al sacar el promedio, da que la mediana de la muestra estudiada es 11.
MODA: Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados. Del ejemplo anterior donde los datos recopilados son: 5,8,8,11,11,11,14,16; el dato que ocurre con mayor frecuencia es el valor 1, siendo este valor la moda.
MEDIA PONDERADA: es una media aritmética, en la cual se considera a cada uno de los valores de acuerdo con su importancia en el grupo.
Mediana Ponderada
En donde: X = Observación individual Q= el peso o ponderación asignada a cada observación Medidas de Tendencia Central para datos agrupados Cuando se trabaja con datos que han sido agrupados en una distribución de frecuencias, no se sabe con certeza los valores individuales de cada dato. Por lo que se utilizan métodos alternos para aproximar los valores de las medidas descriptivas.
13
MEDIA PARA DATOS AGRUPADOS: Al calcular la media para datos agrupados, se supone que las observaciones en cada clase son iguales al punto medio de la
clase
MEDIANA: Primero se encuentra la clase mediana, la cual es la clase cuya frecuencia acumulada es mayor o igual a n/2 y puede determinarse mediante la siguiente fórmula:
LA MODA es la observación que ocurre con mayor frecuencia, por lo que es necesario identificar la clase modal, esta se localiza encontrando la clase que tenga más frecuencia.
14
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS Las medidas de tendencia central de datos agrupados se utilizan en estadística para describir ciertos comportamientos de un grupo de datos suministrados, como por ejemplo a qué valor están cercanos, cuál es el promedio de los datos recogidos, entre otros. Cuando se toma una cantidad grande de datos, es útil agruparlos para tener un mejor orden de los mismos y así poder calcular ciertas medidas de tendencia central. Entre las medidas de tendencia central más utilizadas están la media aritmética, la mediana y la moda. Estos números dicen ciertas cualidades sobre los datos recogidos en determinado experimento. Para utilizar estas medidas es necesario primero saber cómo agrupar un conjunto de datos.
DATOS AGRUPADOS Para agrupar datos primero se debe calcular el rango de los datos, el cual se obtiene restando el mayor valor menos el menor valor de los datos. Luego se escoge un número «k», el cual es el número de clases en las que se quieran agrupar los datos. Se procede a dividir el rango entre «k» para obtener la amplitud de las clases a agrupar. Este número es C=R/k.
15
Por último, se comienza la agrupación, para lo cual se escoge un número menor que el menor valor de los datos obtenidos. Este número será el límite inferior de la primera clase. A este se le suma C. El valor obtenido será el límite superior de la primera clase. Luego, a este valor se le suma C y se obtiene el límite superior de la segunda clase. De esta forma se procede hasta obtener el límite superior de la última clase. Luego de que los datos están agrupados se puede proceder a calcular la media, la mediana y la moda. Para ilustrar cómo se calcula la media aritmética, la mediana y la moda se procederá con un ejemplo.
Ejemplo
Por lo tanto, al agrupar los datos se obtendrá una tabla como la siguiente:
16
LAS 3 MEDIDAS DE TENDENCIA CENTRAL PRINCIPALES Ahora se procederá a calcular la media aritmética, la mediana y la moda. Se utilizará el ejemplo anterior para ilustrar este procedimiento.
1- Media aritmética La media aritmética consiste en multiplicar cada frecuencia por el promedio del intervalo. Luego se suman todos estos resultados, y por último se divide entre el total de datos. Utilizando el ejemplo anterior se obtendría que la media aritmética es igual a: (4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32) /18 = 5,11111 Esto indica que el valor medio de los datos de la tabla es 5,11111.
PROPIEDADES DE LA MEDIA ARITMÉTICA 1. La suma de las desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a cero.
17
La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0:
(8 − 7.6) + (3 − 7.6) + (5 − 7.6) + (12 − 7.6) + (10 − 7.6) = = 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0 2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con la media aritmética.
3. Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho número.
4. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por dicho número. EJEMPLO 1Considere los siguientes datos: incisos:
y calcule los siguientes
Calcular su media.
18
2- MEDIANA La mediana es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por La mediana se puede hallar solo para variables cuantitativas. Para calcular la mediana de un conjunto de datos primero se ordenan todos los datos de menor a mayor. Se pueden presentar dos casos: Si el número de datos es impar, entonces la mediana es el dato que está justo en el centro. – Si el número de datos es par, entonces la mediana es el promedio de los dos datos que quedan en el centro. Cuando se trata de datos agrupados, el cálculo de la mediana se hace de la siguiente forma: Se calcula N/2, donde N es el total de datos. – Se busca el primer intervalo donde la frecuencia acumulada (la suma de las frecuencias) sea mayor que N/2, y se selecciona el límite inferior de este intervalo, llamado Li. La mediana viene dada por la siguiente fórmula: Me = Li + (Ls-Li)*(N/2 – Frecuencia Acumulada antes de Li) / frecuencia de [Li,Ls) Ls es el límite superior del intervalo mencionado anteriormente. Si se utiliza la tabla de datos anterior se tiene que N/2 = 18/2 = 9. Las frecuencias acumuladas son 4, 8, 14 y 18 (una para cada fila de la tabla). 19
Por lo tanto, se debe seleccionar el tercer intervalo, dado que la frecuencia acumulada es mayor que N/2=9. De modo que Li=5 y Ls=7. Aplicando la fórmula descrita anteriormente se tiene que: Me = 5 + (7-5)*(9-8)/6 = 5+2*1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
Ejemplo 1Ordenamos los datos de menor a mayor. 2Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma
3Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
20
3- MODA La moda es el valor que tiene mayor frecuencia entre todos los datos agrupados; es decir, es el valor que se repite más veces en el conjunto de datos inicial.
Cuando se tiene una cantidad de datos muy grande, para calcular la moda de los datos agrupados se utiliza la siguiente fórmula: Mo = Li + (Ls-Li)*(frecuencia de Li – Frecuencia de L(i-1)) / ((frecuencia de Li – Frecuencia de L(i-1)) + (frecuencia de Li – Frecuencia de L(i+1)))
El intervalo [Li,Ls) es el intervalo donde se encuentra la frecuencia mayor. Para el ejemplo hecho en este artículo se tiene que la moda viene dada por:
Mo = 5 + (7-5)*(6-4)/((6-4)+(6-4)) = 5 + 2*2/4 = 5+1 = 6.
Otra fórmula que se utiliza para obtener un valor aproximado a la moda es la siguiente:
Mo = Li + (Ls-Li)*(frecuencia L(i+1))/(frecuencia L(i-1) + frecuencia L(i+1)).
Con esta fórmula, las cuentas quedan como sigue a continuación: Mo = 5 + (7-5)*4/(4+4) = 5 + 2*4/8 = 5+1 = 6.
21
ejemplo Calcular la moda de la siguiente serie de números:
. Solución: Números en la serie Repeticiones
2 2
3 2
El valor más repetido es el número
4 5
5 6
Por lo tanto, la moda
6 2
8 3 es:
GRAFICOS DE REPRESENTACIÓN En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los análisis de forma rápida, directa y comprensible para un conjunto amplio de personas.
22
Tipos de representaciones gráficas Cuando se muestran los datos estadísticos a través de representaciones gráficas, se ha de adaptar el contenido a la información visual que se pretende transmitir. Para ello, se barajan múltiples formas de representación: •
• •
•
Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa. Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas continuas. Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un sistema de ejes cartesianos.
GRÁFICOS DE SECTORES: circulares o de tarta, dividen un círculo en porciones proporcionales según el valor de las frecuencias relativas.
•
PICTOGRAMAS: o representaciones visuales figurativas. En realidad, son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable.
•
CARTOGRAMAS: expresiones gráficas a modo de mapa.
•
PIRÁMIDES DE POBLACIÓN: para clasificaciones de grupos de población por sexo y edad.
Diagramas de barras e histogramas Los diagramas de barras se usan para representar gráficamente series estadísticas de valores en un sistema de ejes cartesianos, de manera que en las abscisas se indica el valor de la variable estadística y en las ordenadas se señala su frecuencia absoluta. Para elaborarlo debemos: - Utilizar un sistema de coordenadas rectangulares y se llevan al eje de las "x" los valores que toma la variable en estudio y en el eje de las "y" se colocan las frecuencias de cada barra. - Luego se construyen los rectángulos, tomando como base al eje de las abscisas, cuya altura será igual a cada una de las diferentes frecuencias que presentan las variables en estudio. 23
- La magnitud con que viene expresada la variable se observa en la longitud de las barras (rectángulos). Es importante destacar que solamente la longitud de las barras y no su anchura es lo que denota la diferencia de magnitud entre los valores de la variable. Todas las barras tienen que tener una anchura igual, separadas entre sí, preferiblemente por una longitud igual a la mitad del ancho de estas o distancias iguales entre barras. Las barras se pueden graficar tanto verticalmente como horizontalmente. Se pueden elaborar barras compuestas y barras agrupadas. Este tipo de gráfico se clasifican por:
-BARRAS SIMPLES: Compara valores entre categorías de una variable. - BARRAS DOBLES: Compara valores entre categorías de dos variables. - BARRAS MÚLTIPLES: Compara valores entre categorías de dos o más variables.
- BARRAS VERTICALES: Las categorías de la variable deben ubicarse en el eje x.
- BARRAS HORIZONTALES: Las categorías de la variable deben ubicarse en el eje y.
- BARRAS APLICADAS: Compara entre categorías el aporte de cada valor en el total. Estos gráficos se usan en representación de caracteres cualitativos y cuantitativos discretos. En variables cuantitativas continuas, se emplea una variante de los mismos llamada histograma. 24
Diagrama de barras. 22
HISTOGRAMA DE FRECUENCIAS: El histograma es un diagrama en forma de columna, muy parecido a los gráficos de barras. Se define como un conjunto de rectángulos paralelos, en el que la base representa la clase de la distribución y su altura la magnitud que alcanza la frecuencia de la clase correspondiente. Son barras rectangulares levantadas sobre el eje de las abscisas del plano cartesiano utilizando escalas adecuadas para los valores que asume la variable en la distribución de frecuencia.
Histograma
El ancho de la base de los rectángulos es proporcional a cada clase de la distribución, de tal manera que, cuando la distribución tiene clases de igual tamaño, el tamaño de todos los rectángulos tendrá bases iguales. Los lados del rectángulo se levantan sobre los puntos del eje de las x que corresponden a los límites de cada clase y la longitud de los mismos será igual a la frecuencia que tenga esa clase, los lados por lo tanto corresponden a la frecuencia de cada clase de la distribución de frecuencia. Cuando se elaboran gráficas estadísticas en el plano cartesiano es recomendable que en el eje de las ordenadas se representen las frecuencias y el eje de abscisas las variables independientes. 25
Ejemplo Una empresa se interesa en el ancho de bloques de madera y ha tomado 100 muestras de la operación de corte. Los datos han sido agrupados en intervalos o rangos y se muestran en el siguiente cuadro:
Del cuadro se puede apreciar que de las 100 muestras de bloques de madera 5 miden de 2 a 13 centésimas de pulgada, 10 miden de 14 a 25 centésimas de pulgada, etc. El mayor número de bloques de madera (34) miden de 28 49 centésimas de pulgada. Podemos representar gráficamente esta información a través del siguiente histograma de frecuencia en el cual la altura de cada barra indica la frecuencia de las observaciones en ese intervalo.
26
Ejemplos de tipos de representaciones gráficas Histogramas: Se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase).
Se representan los intervalos de clase en el eje de abcisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).
A veces es más útil representar las frecuencias acumuladas.
O representar simultáneamente los histogramas de una variable en dos situaciones distintas.
27
Otra forma muy frecuente, de representar dos histogramas de la misma variable en dos situaciones distintas.
Otra más
En las variables cuantitativas o en las cualitativas ordinales se pueden representar polígonos de frecuencia en lugar de histogramas, cuando se representa la frecuencia acumulativa, se denomina ojiva.
POLÍGONOS DE FRECUENCIAS Para construir polígonos de frecuencias, se trazan las frecuencias absolutas o relativas de los valores de la variable en un sistema de ejes cartesianos y se unen los puntos resultantes mediante trazos rectos. Con ello se obtiene una forma de línea poligonal abierta. 28
Los polígonos de frecuencias se utilizan preferentemente en la presentación de caracteres cuantitativos, y tienen especial interés cuando se indican frecuencias acumulativas. Se usan en la expresión de fenómenos que varían con el tiempo, como la densidad de población, el precio o la temperatura. Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo de un histograma.
Pasos para elaborar un polígono de frecuencias: 1- Se dibuja un plano cartesiano. 2- Se traza sobre el eje de las abscisas, a distancias iguales, los puntos medios de las diferentes clases de la distribución de frecuencias. 3- Se levantan perpendiculares por cada una de las marcas de clase, con una longitud igual a la frecuencia de cada una de las clases que integran la distribución de frecuencia. Al final de cada perpendicular se marca un punto.
4- Los puntos resultantes se unen por medio de una línea recta obteniéndose una línea poligonal. 5- Con la finalidad de cerrar la línea poligonal se agrega una clase imaginaria con frecuencia cero a cada extremo de la distribución de frecuencia, por tales motivos ambos extremos del polígono se cortan con el eje de las abscisas. También se puede elaborar un polígono de frecuencia después de haber graficado un histograma; si se determina el punto medio de cada rectángulo de un histograma y esos puntos medios se unen por medio de segmentos de recta dan como resultado el polígono de frecuencia.
29
EJEMPLO Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:
HORA 6 9 12 15 18 21 24
TEMPERATURA 7º 12° 14° 11° 12° 10° 8°
Gráficos de sectores En los diagramas de sectores, también llamados circulares o de torta, se muestra el valor de la frecuencia de la variable señalada como un sector circular dentro de un círculo completo. Por ello, resultan útiles particularmente para mostrar comparaciones entre datos, sobre todo en forma de frecuencias relativas de las variables expresadas en forma de porcentaje.
30
ejemplo Un compañero de Marta decidió preguntar a sus compañeros por su deporte favorito y obtuvo los datos, que aparecen en la tabla siguiente: Frec.
Frec.
absoluta relativa
Grados del
%
sector
Danza Fútbol Tenis Baloncesto Atletismo
5
0,25
25%
0,25·360º=90º
8
0,4
40%
0,4·360º=144º
2
0,1
10%
0,1·360º=36º
3
0,15
15%
0,15·360º=54º
2
0,1
10%
0,1·360º=36º
SUMA
20
1
100
360º
GRÁFICO DE LÍNEAS O TENDENCIA: Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico de líneas consiste en segmentos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo.
Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un solo gráfico, el cual es el resultado de representar varias
31
variables en un mismo plano. A este tipo de gráfico se le llama gráfico de líneas compuesto.
Pictogramas y cartogramas Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a imágenes pictóricas representativas del valor de las variables. Dos formas comunes de expresión gráfica de los datos son: •
•
Los pictogramas, que muestran diagramas figurativos con figuras o motivos que aluden a la distribución estadística analizada (por ejemplo, una imagen antropomórfica para indicar tamaños, alturas u otros). Los cartogramas, basados en mapas geográficos que utilizan distintas tramas, colores o intensidades para remarcar las diferencias entre los datos.
Pirámide de población Otra forma corriente de presentación visual de datos estadísticos es la llamada pirámide de población. Las pirámides de población se utilizan en la expresión de informaciones demográficas, económicas o sociales, y en ellas se clasifican comúnmente los datos de la población del grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.
32
TIPOS DE PIRÁMIDES DE POBLACIÓN Existen tres modelos de pirámides de población, que representan diferentes dinámicas demográficas.
PIRÁMIDE ESTABLE: este modelo de pirámide corresponde a poblaciones en las que la natalidad y la mortalidad se mantienen constantes durante un largo periodo de tiempo.
33
PIRÁMIDE PROGRESIVA: en este modelo de pirámide se observa una base muy ancha y una cima muy angosta. Es típico de poblaciones en las que tanto la natalidad como la mortalidad son altas y la población crece a un ritmo rápido.
PIRÁMIDE REGRESIVA: en este modelo, la base de la pirámide es más pequeña que los escalones siguientes. La pirámide adquiere esta forma en poblaciones cuya natalidad ha descendido en los últimos años y es baja. Este fenómeno genera un envejecimiento de la población.
34
¿CUAL ES LA UTILIDAD DE ANALIZAR PIRÁMIDES? Analizando las pirámides de población de diferentes lugares podemos comparar su comportamiento demográfico. Por ejemplo, se puede conocer si la mortalidad y la natalidad han variado en los últimos años. Por otra parte, analizando varias pirámides de un mismo lugar correspondientes a diferentes momentos históricos, pueden reconstruir su historia demográfica, observando la evolución de los diferentes grupos etarios. Pueden analizar, entre otras cosas, un fenómeno de migración relacionando las pirámides que corresponden al lugar desde donde emigró un grupo de población y al lugar adonde dicha población arriba.
¿Como se construye una pirámide de población? Para construir una pirámide de población es necesario contar con los datos de la población de una jurisdicción, discriminados por edad y por sexo. Esta información puede ser obtenida a partir de los censos de población. El gráfico de una pirámide de población se estructura a partir de un eje vertical y otro horizontal. En el eje vertical de la pirámide se representan los grupos de edades. En general, para la construcción de una pirámide de población se establecen grupos con intervalos de 5 años, de manera que resultan rangos tales como los siguientes: de 0 a 4 años, de 5 a 9 años, de 10 a 14 años, etc. Las edades menores se ubican en la base del gráfico y las mayores, en la cima. Sobre el eje horizontal se representa la cantidad de población según ambos sexos: hacia la izquierda del eje se ubican los datos correspondientes a los varones y hacia la derecha, la información correspondiente a las mujeres. El eje horizontal puede contener valores absolutos o relativos. La ventaja del uso de valores relativos es que permite realizar comparaciones entre pirámides.
35
Sobre esta estructura y con los datos de población de un lugar determinado en un momento dado (clasificados según edad y sexo), se construyen las barras horizontales, dispuestas una encima de la otra para cada grupo de edad y sexo.
Las barras horizontales, entonces, indican la cantidad o porcentaje de población por grupo etario. Para construirlas es necesario establecer que cantidad de población le corresponde a cada grupo etario según el sexo al que pertenece y dibujar la barra desde el eje vertical hacia afuera según los valores del eje horizontal. De esta manera se procede con cada grupo etario, y para ambos sexos, hasta completar la serie de edades y, así, terminar la pirámide. Para construir la pirámide con valores relativos, se requiere calcular previamente el porcentaje que cada grupo etario por sexo representa sobre el total de población.
Un caso curioso es la pirámide de Qatar y otros pequeños países con alto nivel de renta que están atrayendo mucha población emigrante principalmente masculina y en edad adulta por lo que muestran una curiosa deformación.
Pirámide de población mundial en 1998
Pirámide de población mundial estimada para 2050
36
LINK ESTADISTICA https://enciclopediaeconomica.com/estadistica/ http://www.hrc.es/bioest/estadis_1.html
GRAFICOS https://www.portaleducativo.net/primero-medio/50/graficos-estadisticos http://educativa.catedu.es/44700165/aula/archivos/repositorio/500/546/html/Unidad06/pagina_18.h tml http://educativa.catedu.es/44700165/aula/archivos/repositorio/500/546/html/Unidad06/pagina_18.h tml http://www.hrc.es/bioest/Ejemplos_histo.html
MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/ejerciciosde-la-moda.html https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/mediana.h tml https://www.lifeder.com/medidas-tendencia-central-datos-agrupados/ https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/ejerciciosde-la-media-aritmetica.html https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descriptiva/mediaaritmetica.html
https://matemovil.com/tablas-de-frecuencias-ejercicios-resueltos/ https://www.portaleducativo.net/primero-medio/50/graficos-estadisticos
37
MEDIDAS DE TENDENCIA CENTRAL DE DATOS NO AGRUPADOS https://tratamientodedatos.wordpress.com/2011/03/07/medidas-de-tendencia-central-paradatos-no-agrupados-y-agrupados/ https://www.universoformulas.com/estadistica/descriptiva/
PIRAMIDES https://www.hiru.eus/es/matematicas/representacion-grafica-de-datos-estadisticos
https://cdn.educ.ar/dinamico/UnidadHtml__get__7c02fdf5-b548-45d3-9b7e4aad848491ae/91686/data/4a0dba4d-7a08-11e1-82fa-ed15e3c494af/index1.htm
38