C CLLA ASSEE 33.. UNIDAD III: INTRODUCCIÓN A LA ESTADISTICA 3.1.Conceptos básicos Estadística: Es la ciencia que trata de la recopilación, organización, análisis e interpretación de los datos ligada con los métodos científicos en la toma de decisiones razonables de acuerdo al análisis. División de la estadística: •
Descriptiva: incluye las técnicas que se relacionan con el resumen y descripción de datos numéricos. Los métodos de la estadística descriptiva implican recopilación, presentación y caracterización de un conjunto de datos, con el objeto de describir en forma apropiada las diversas características de dicho conjunto en forma tabular o gráfica.
•
Inferencial: incluye técnicas que, basadas en los resultados muestrales, permiten realizar estimaciones para la toma de decisiones acerca de las características de una población.
Es decir, la estadística es un conjunto de métodos y procedimientos que permiten obtener, describir e interpretar conjuntos de datos generando información útil para la toma de decisiones en situaciones de incertidumbre. Población o Universo: es una colección de datos que se refieren a las características de un grupo de individuos u objetos. La colección puede ser finita o infinita. Es finita cuando es posible precisar la cantidad, mientras que se considera infinita cuando se presenta dificultades para su cuantificación. Muestra: es una parte, porción o subconjunto representativa de la población seleccionada con el objeto de investigar las propiedades de la población o conjunto original, debido a la dificultad de trabajar con el universo. Unidad de análisis: constituyen los elementos (personas, familias, animales, vegetales, productos, organizaciones, etc.) que poseen las características que se desean medir y estudiar. Deducción : consiste en formular conclusiones partiendo de lo general para llegar a lo particular. Inducción: consiste en razonar partiendo de los hechos particulares para llegar a una conclusión general.
1
Parámetro : es una medida que se calcula para describir una característica de una población completa. Estadístico: es una medida que se calcula a partir de una muestra de observaciones para describir una característica.
3.2.
Datos. Clasificación. Series simples y agrupadas
Dato: es el resultado directo de la observación de la realidad, es decir, un antecedente en una unidad de análisis. Los datos son simples, concretos y descriptivos, pudiendo ser tratados posteriormente en términos estadísticos. Para su colección y tratamiento es necesario conocer la naturaleza de los mismos, así los datos pueden ser: •
Cualitativos: cuando describen una cualidad del elemento bajo estudio, no tienen un orden preestablecido y se identifican mediante nombres. Ejemplo: Género (Hombre, Mujer); Color de ojos (negro, azul, marrón, verde); Origen (nacional, extranjero) etc.
•
Cuantitativos: cuando los datos pueden ser medidos indicando cantidad o precisión, identificándose mediante un número real. Pueden ser a su vez: -
Discretos: cuando los datos toman valores enteros dentro de un intervalo. Entre dos valores contiguos, NO hay valores o subcategorías intermedios. Ejemplo: Número de hijos por familia (puede ser 0, 1, 2, ....) número de alumnos por Carrera de una Universidad, etc.
- Continuos: cuando los datos al ser medidos toman valores enteros o fraccionarios dentro de un intervalo. Ejemplo: Tiempo (1, 1,5, 2, 2,5,....); peso (0,5, 1, 1,5,....), Distancia (1 Km, 100 m...),etc. Serie de datos: Es un conjunto de datos obtenidos de la medición de una variable en un grupo, población o muestra. Si los datos son ordenados de acuerdo a algún criterio, se denominan distribución. Serie simple: Es un conjunto de datos colectados que no están organizados numéricamente. Ejemplo. Cantidad de hijos en una muestra de 20 familias de hasta siete miembros. 5
2
3
4
1
2
1
2
0
3
1
0
0
3
0
5
0
0
0
1
Serie agrupada: cuando se poseen grandes conjuntos de datos, es útil distribuirlos en clases o categorías y determinar el número de elementos que pertenecen a cada clase, lo que permite simplificar su presentación, a este proceso se los denomina Distribución de frecuencias. Ejemplo. Distribución de la cantidad de hijos en una muestra de 50 familias de hasta siete miembros.
2
Nro. de hijos Cantidad de familias 0 1 2 3 4 5 Total
15 10 13 6 3 3 50
3.3. Variables. Tipos. Escalas de medición Variable: Es toda aquella característica que posee el "individuo o elemento" bajo estudio y que puede ser cuantificada tomando diferentes valores. Es decir, si observamos una característica y vemos que toma valores distintos en diferentes personas, lugares o cosas, podemos decir que esta característica es una variable. En general las variables se designan con letras mayúsculas (X, Y, Z,...). y el valor que toma dicha variable en los individuos de la muestra (o de la población) se los designa con letra minúscula. Ejemplo: Sea X la variable peso, y el valor que toma esta variable en un paciente es x =72 Kg, dicho de otro modo x¡, es el valor que la variable X alcanza en el iésimo paciente. Tipos de variable según los datos: Las variables pueden ser: Cualitativas: Cuando sus diversas categorías no son medidas, sino nombradas. • Variables cuyas categorías no tienen un orden preestablecido entre ellas, identificándose mediante nombres. Ejemplos: Etnia: (Blanco, Negro, .....), Color de cabellos: (negro, marrón, ó rubio), etc. • Variables cuyas categorías especifican un orden o jerarquía entre ellas permitiendo establecer la posición relativa de las unidades de análisis. Ejemplos: Nivel socioeconómico (muy pobre, pobre, medio, rico, muy rico) Gravedad de una lesión (muy leve, leve, grave, muy grave) Cuantitativas: Cuando sus diversas categorías pueden ser medidas tomando valores asociados a un número pudiendo tomar valores enteros o fraccionarios. Ejemplos: Cantidad de hijos, Cantidad de bovinos vacunados, Cantidad de productos, Peso, estatura, coeficiente de inteligencia, etc.
3
Niveles de medida de variables según tipo de datos: • Escala nominal: Esta escala de medida nombra a los datos permitiendo solamente clasificarlos en categorías. Ejemplos: Afiliación política, sexo, raza, numeración de las casas de un barrio de Asunción, etc. • Escala ordinal: Esta escala ordena los datos de mayor a menor, permitiendo clasificarlos determinando magnitudes o jerarquías entre los mismos Ejemplos: datos de sondeo de opinión (5= Muy de acuerdo, 4= de acuerdo, 3= neutral, 2= en desacuerdo, 1= Muy en desacuerdo). • Escala de intervalo: Esta escala además de clasificar y ordenar los datos, incorpora el concepto de la igualdad, es decir, establece intervalos iguales en la medición. La distancia entre categorías son las mismas a lo largo de toda la escala y el cero en la misma es arbitrario. Ejemplos: temperatura y Fechas del calendario. • Escala de razón: Incluye todas las características que permiten las escalas anteriores y además incluye el concepto de cero absoluto (el cero es real, no es arbitrario) lo que implica que hay un punto en la escala donde no existe la propiedad. Ejemplo: peso, estatura y distancia que tienen cero natural y que son medibles con escalas preestablecidas; otros ejemplos son niveles de: productividad en una empresa, ventas de un producto, ingresos, etc.
Ejercicio. Indicar la variable, el tipo y la escala de medición en los siguientes casos:
1. Registros de la resistencia de los cables producidos por una máquina en el Departamento de control de calidad de una fábrica. 0,321 0,315
0,317 0,324
0,315 0,320
Respuesta.
Variable Tipo Escala de medición
2. En un establecimiento de producción ovina al nacimiento se registra el sexo de cada animal y su peso (expresados en kg) obteniéndose los siguientes resultados el mes pasado:
4
MACHOS: HEMBRAS:
2.1 3.5 4.8 5.2 6.9 3.9 4.2 5.7 6.1 4.4 5.4 6.1 4.2 5.9 4.5 6.1 5.9 4.3 3.9 2.8 2.3 3.9 4.5 5.6 3.3 4.1 3.7 4.6 4.3 4.8
Respuesta.
Variable 1 Tipo Escala de medición Variable 2 Tipo Escala de medición 3. Datos registrados por el Departamento de Genética del IAN/MAG sobre el crecimiento quincenal en centímetros de muestras de maíz: 0,4 0,9
1,9 0,7
1,5 0,9
0,9 0,7
1,6 1,5
0,4 0,5
1,5 1,5
1,2 1,7
1,2 1,7
0,8 1,8
Respuesta.
Variable Tipo Escala de medición 4.
Los datos que se indican muestran la distribución por estado civil de una muestra 20 egresados de la Carrera de Informática. S M
C F
C M
C F
M F
F M
M F
F F
M M
F F
Respuesta.
Variable Tipo Escala de medición
5
UNIDAD IV: TÉCNICAS ESTADÍSTICAS DESCRIPTIVAS Las técnicas de la estadística descriptiva se relacionan con el resumen y la descripción de datos numéricos que permiten obtener un mejor conocimiento sobre los hechos que estos representan, estableciendo comparaciones entre ellos. Las técnicas se relacionan con la:
z Organización de los datos en tablas de frecuencias para la variable (simple o z
agrupada). Representación gráfica de la serie de datos.
z Caracterización de los datos calculando las medidas de centralización y dispersión.
4.1.Distribución de frecuencias de series simples y agrupadas Tabulación de datos Colección de datos: consiste en considerar una lista numérica sin orden alguno. Ordenación: Es una colocación de los datos numéricos, en orden creciente o decreciente de magnitud. Distribución de frecuencia: resumen de grandes números de datos clasificados por agrupamiento en categoría en forma tabular clases. Número de clase: consiste en determinar el número de clase para la tabla de frecuencia y se utiliza la siguiente formula: m = 1 +3,3*log(n)
Donde
m= número de clase. n= número de datos log= logaritmo
Intervalo de clase: es un agrupamiento de una porción de los datos con una característica común y su fórmula es: IC = Máximo mas una unidad siguiente - Mínimo m Donde
IC = Intervalo de clase m = número de clase
Cada Intervalo de clase posee un Límite Inferior (Li) y un Límite superior (Ls).
6
Frecuencia: número de veces que el dato se repite. En distribuciones agrupadas es el número de datos que corresponden al intervalo de clase. La frecuencia puede ser: a) Absoluta: número de veces que los datos corresponden al intervalo de clase. b) Relativa: es la frecuencia absoluta expresada en forma porcentual respecto al total de los datos. c) Acumulada: es la frecuencia que se obtiene con la variación de las frecuencias absolutas de cada clase o categoría. Pueden ser: - Mas que: acumula el incremento de las frecuencias absolutas - Menos que: acumula la disminución de las frecuencias absolutas Marca de clase: se utiliza como valor representativo de cada clase para operacionalizar la tabla de distribución de frecuencias, y es la semisuma de los limites inferior y superior de cada intervalo de clase, su formula es: X= Li + Ls 2 Donde............ X = Media aritmética Li = Limite inferior Ls = Limite superior Tablas de Distribución: Distribución de frecuencia absoluta: presenta la frecuencia absoluta de cada categoría o clase que es el número de veces que el dato se repite o pertenecen a la clase. Distribuciones de frecuencia relativa: presenta la frecuencia relativa de una categoría o clase, que es la frecuencia absoluta dividida por el total de frecuencia de la serie y se expresa generalmente como porcentaje, la suma de las frecuencias relativas de todas las categorías o clases es 100%. Distribuciones de frecuencia acumulada: presenta la frecuencia acumulada de una categoría o clase, que es la frecuencia de cada clase junto con las anteriores si es creciente o viceversa si es decreciente. Ejemplo 1. Distribución de frecuencia de una variable discreta: suponga que en una muestra de pequeños productores del Dpto. de Cordillera, se registra el número de bovinos X que adopta los valores 1,2,3,.......,etc. X es una variable aleatoria discreta porque solo asume un número finito de valores. El objetivo final es estimar acerca del número de rebaño de un pequeño productor del Dpto. de Cordillera, para ello debemos describir, resumir y representar adecuadamente los datos de la muestra.
7
Cantidad de ganado bovino en una muestra de 50 pequeños productores del Dpto. de Cordillera. 5
2
3
4
1
2
1
2
0
3
1 2 0 4
0 0 2 3
0 5 1 2
3 1 0 2
0 2 1 4
5 0 2 1
0 2 3 0
0 1 0 2
0 2 1 3
1 0 0 2
Tabla 1.Cálculo de las frecuencia absoluta y relativa de la cantidad de ganado en una muestra de 50 pequeños agropecuarios del Dpto. de Cordillera. Nro. de ganado 0 1 2 3 4 5 Total
Cuenta
IIIII IIIII IIIII IIIII III III
IIIII IIIII IIIII IIIII III I
Frecuencia Frecuencia relativa absoluta ( fa ) fr=( fa/n* 100) 15 10 13 6 3 3 50
30 20 26 12 6 6 100
Ejemplo 2. Distribución de frecuencia de una variable continua: suponga que una muestra de 40 terneros; el peso de cada uno se registra en kilos X que es una variable aleatoria continua, dado que el peso de cada animal puede tomar cualquier valor, tal como 64,328 kg. Ya no tiene sentido entonces hablar acerca de la frecuencia de este valor especifico de X; lo mas probable es que nunca observaremos nuevamente otro animal de 64,328 kg. de peso. En cambio si podemos llevar la cuenta de la frecuencia de los pesos (por ejemplo, entre 58,5 a 64,5 kilos), entonces los pesos se organizan en tablas con intervalos de clase, determinando las frecuencias correspondientes. Peso de 40 terneras. 118 146 151 130 152 145 155 163 168 149 120 145 166 154 133 174 153 159 150 152 170 126 162 140 142 129 143 160 138 147 173 152 Construcción de una distribución de frecuencia continua:
153 175 177 135
136 151 141 154
Organizar los datos en forma ascendente identificando los valores extremos Tabular los datos:
8
1. Calcular el número de clase a utilizar m = 1 + 3,3 log(n) = 1 + 3,3 log (40) = 6 2. Calcular el intervalo de clase Minimo = 118 Maximo = 177 Rango = 177 - 118 = 59 IC = Máximo mas una unidad siguiente – Mínimo = 178 - 118 = 10 m 6 Tabla 2. Distribución de frecuencias absoluta y relativa del peso de 40 terneras. Intervalo de Cuenta Frecuencia Frecuencia Frecuencia relativa clase absoluta ( f ) acumulada ( f/n* 100) ( fac ) 118 - 127 III 3 3 8 128 - 137 IIIII 5 8 13 138 - 147 IIIII IIII 9 17 23 148 - 157 IIIII IIIII II 12 29 30 158 - 167 IIIII 5 34 13 168 - 177 IIIII I 6 40 15 Total 40 100
9
C CLLA ASSEE 44:: 4.2.
Representación gráfica
Es una forma de mostrar la información, constituyen un elemento básico en el análisis y presentación de los trabajos estadísticos; la importancia fundamental reside en que la representación grafica de un fenómeno estadístico es apta para que el investigador pueda apreciar de un golpe de vista el conjunto de datos o relaciones que constituyen el motivo del estudio, permitiendo formar juicio sobre el desarrollo y relaciones de los atributos o variables que intervienen. Un grafico proporciona una apreciación integral del fenómeno, que difícilmente se obtiene cuando solamente disponemos de cuadros estadísticos. Los datos pueden ser trazados en dos o tres dimensiones. En el plano de coordenadas cartesianas se clasifican en lineal, columna (barra), circular (sector), áreas, dispersión, combinado, pictograma y cartograma. El tipo de grafico depende de los datos analizados que pueden ser cualitativos o cuantitativos (discreto y continuo) y el objetivo del estudio. Los tipos de gráficos mas utilizados para dos o más series son: 1. Lineal: En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí, generalmente se busca mostrar la tendencia de la información generalmente en un período de tiempo. 2. Barra: son de uso general, cuando se trata de atributos que no tienen variación continua. -
Simples: Verticales (Columnas) u Horizontales Múltiples o Combinadas Apiladas (Compuestas o Proporcionales)
3. Circular o Sector: son utilizados cuando se quiere expresar la distribución de un atributo en componentes. Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. 4. Dispersión: permiten graficar en el 1er. cuadrante de un eje de coordenadas los valores asociados con dos variables, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso. 5. Combinados (Mixtos): En estos tipos de gráficos se representan dos o más series de datos, cada una con un tipo diferente de gráfico. Son gráficos más vistosos y se usan para resaltar las diferencias entre las series.
10
5. Pictograma: Los pictogramas son gráficos similares a los gráficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es común ver gráficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el único fin de hacer más vistoso el gráfico, estos tipos de gráficos no constituyen un pictograma. 6. Cartograma: utilizado en representaciones de la distribución de un atributo en el espacio. Se trata de situar geográficamente un dato estadístico, de manera expresiva. Generalmente estos tipos de gráficos se utilizan para mostrar datos sobre una base geográfica. La densidad de datos se puede marcar por círculos, sombreado, rayado o color. 8. Histograma: es un grafico de columnas unidas o serie de rectángulos que tienen sus bases sobre el eje de abscisa con centro en las marcas de clase y longitud igual al tamaño de los intervalos de clase y su altura se forma con la frecuencia de cada clase. 9. Polígono de frecuencia: es un grafico lineal trazado con las marcas de clase y la frecuencia de cada clase o se obtiene uniendo los puntos medios de los techos de los rectángulos del histograma. 10. Otros Gráficos: En esta categoría se encuentran la mayoría de los gráficos utilizados en publicidad. Se los complementa con un dibujo que esté relacionado con el origen de la información a mostrar. Son gráficos llamativos, atraen la atención del lector. Ejercicios. 1. Representar gráficamente los datos de los ejemplos anteriores de Distribución de frecuencias. Nro. de ganado 0 1 2 3 4 5 Total
Frecuencia Frecuencia relativa absoluta ( fa ) fr=( fa/n* 100) 15 10 13 6 3 3 50
30 20 26 12 6 6 100
11
Ejemplo 1. Variable discreta
18
35
15
30 25
12
20
9
15
6
10
3
5
0
Frecuencia relativa
Frecuencia absoluta
Distribucion de frecuencias absoluta y relativa de la cantidad de ganado en una muestra de pequeños productores agropecuarios del Dpto. de Cordillera.
Frec. absoluta Frec. relativa
0 0
1
2
3
4
5
Nro. de ganado
Figura 1.Distribución de las frecuencia absoluta y relativa de la cantidad de ganado en la muestra de 50 pequeños productores del Dpto. de Cordillera.
Frecuencia
Ejemplo 2. Variable continua Intervalo de Frecuencia Frecuencia Marcas de clase absoluta ( f ) relativa clase ( f/n* 100) 118 - 127 3 8 123 128 - 137 5 13 133 138 - 147 9 23 143 148 - 157 12 30 153 158 - 167 5 13 163 168 - 177 6 15 173 Total 40 100
14 12 10 8 6 4 2 0
Histograma Poligono de frecuencias
123 133 143 153 163 173 Marcas de clase
12
Figura 2. Histograma y Polígono de frecuencias de la Distribución de los pesos de los terneros. 2. A continuación se presenta la distribución del personal ocupado en la industria maquiladora de exportación en el período 1.998 – 2.002. Año 1,998 1,999 2,000 2,001 2,002
Total 199,684 211,968 249,833 305,253 369,489
Obreros 165,505 173,874 203,894 248,638 301,379
Técnicos 22,381 25,042 30,367 36,740 44,312
Empleados 11,798 13,052 15,572 19,875 23,798
Representar gráficamente la distribución de manera que pueda apreciarse la distribución entre obreros, técnicos y empleados para cada año. 3. Las ventas de combustibles en una ciudad en los cuatro primeros meses fueron los siguientes en miles de litros: Més 1er. 2do 3er. 4to.
Tipo A 2,10 1,80 3,56 4,8
Tipo B 12,20 11,60 15,90 10,12
Tipo C 1,58 2,74 6,91 5,87
Presentar los datos en un gráfico que muestre: - La participación de los tipos de combustibles en las ventas, - El comportamiento mensual de las ventas por tipo de combustible 4. La Tabla siguiente contiene la serie mensual de los ingresos de una Empresa efectuados por las Agencias de Encarnación y Ciudad del Este, durante el año 1999. Representar gráficamente los datos y comentar brevemente el comportamiento. Mes Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
Agencias Encarnación Ciudad del Este
4.882 16.444 3.271 5.277 7.750 32.513 14.039 8.817 4.686 4.383 1.973 7.372
7.601 12.448 4.874 5.161 7.300 26.188 10.969 7.716 4.150 4.854 7.550 6.989
13
5. Representar gráficamente los datos de una muestra de 100 egresados de la UNA según áreas de ocupación.
Ocupación Docente universitario Banquero Empresario Químico Médico Agente de seguro Periodista Abogado Docente de secundaria Otras
N° de egresados 5 8 22 7 10 6 2 14 9 17
14
4.3. Medidas de caracterización de los datos (Posición y Dispersión) Medidas descriptivas: Las representaciones resultantes de las distribuciones de frecuencia nos permiten discernir las tendencias y patrones de los datos pero si se necesitan medidas mas exactas de un conjunto de datos se utilizan los números individuales, llamados estadísticos resumidos, para describir ciertas características de dicho conjunto. Las principales medidas son:
5.2.1. Medidas de posición o tendencia central Indican el punto medio o típico de datos que cabe esperar. Las mas utilizadas son: la media aritmética, la mediana y la moda. Media aritmética: Pueden ser calculadas según la serie de datos. - Para series simples: Es el cociente de la suma de todos los valores entre el número de valores. donde X= ∑ x n ∑= SUMATORIA
x = valor observado n = cantidad de valores observados -
Para series agrupadas: Cuando se agrupan los datos en una distribución de frecuencias, se utiliza el punto medio de cada clase (marca de clase), como aproximación de todos los valores contenidos en ella. La fórmula utilizada es: X= ∑ fx donde n
∑= SUMATORIA
x= Marca de clase f= frecuencia absoluta de la clase n= cantidad de valores observados Mediana: Es una medida de posición. - Para series simples: es el valor del dato que ocupa el lugar del centro de un grupo de datos cuando se los agrupa a todos en orden ascendente o descendente. Para un grupo con un número par de elementos, se supone que la mediana se encuentra en la mitad, entre los dos valores adyacentes al centro. Si el grupo contiene un número impar de datos, la mediana es igual al valor que ocupa el centro de los mismos. -
Para series agrupadas: Cuando se agrupan los datos en una distribución de frecuencias, la mediana es el valor al que corresponde la frecuencia
15
acumulada n/2. La tabla de frecuencias acumuladas nos da el valor del limite inferior donde esta la mediana y se calcula utilizando la formula siguiente: Me= Lri + (n/2 – fa)c fc Donde Li= Limite real inferior de la clase que contiene la mediana n= Número total de observaciones en la distribución de frecuencias fa= Frecuencia acumulada de la clase precedente a la clase que contiene a la mediana fc= Número de observaciones en la clase que contiene la mediana c= Tamaño del intervalo de clase Moda: Es una medida de posición relacionada con la frecuencia absoluta de los datos. - Para series simples: es el valor que se presenta con mayor frecuencia en un conjunto de datos. - Para series agrupadas: Cuando se agrupan los datos en una distribución de frecuencias, para calcular la moda primero se identifica la clase con mayor número de frecuencia y se aplica la siguiente formula:
Mo= Li +
Donde
c ∆1 ∆1+∆2
Li= limite real inferior de la clase que contiene la moda ∆1= diferencia entre la frecuencia de la clase modal y la frecuencia de la clase precedente ∆2= diferencia entre la frecuencia de la clase modal y la frecuencia de la clase siguiente c= tamaño del intervalo de clase
4.2.2. Medidas de dispersión El conocimiento de la intensidad de los valores asumidos según la posición dentro de la distribución no es suficiente para su completa caracterización, es necesario además poder definir la variabilidad de los datos. Las mas utilizadas son: el rango, la varianza y la desviación típica.
Rango: En series simples, es la diferencia entre el mayor y menor valor de los datos. La formula utilizada es: R = Máximo – Mínimo
16
Varianza: Es una medida de variabilidad de los datos con respecto al valor central (desviaciones, x-X) - Para series simples se basa en el cociente del cuadrado de las diferencias de las desviaciones entre el número de observaciones. La formula utilizada es: Var= ∑ (x-X) n
2
DONDE∑= SUMATORIA
x= valor observado X= Media de los datos n= cantidad de valores observados - Para series agrupadas: la formula utilizada es Var= ∑ f(x-X) n
2
DONDE∑= SUMATORIA
x= Marca de clase X= Media de los datos f= frecuencia de la clase n= cantidad de valores observados Desviación típica o Desviación estándar: Es una medida de variabilidad, para las series simples y agrupadas, la formula utilizada es: DT= √Var Donde
DT= desviación típica Var= Varianza
Ejercicios. 1. En un determinado mes, ocho vendedores de artículos electrónicos vendieron los siguientes números de aparatos: 8, 11, 5, 14, 8, 11, 16, 11. Calcular las medidas descriptivas: - De posición: Media aritmética, mediana y moda - De variabilidad: rango y desviación típica X=
å
x = 84/8 = 10,5 unidades vendidas n
17
5, 8, 8,11, 11, 11, 14, 16
n=8 (par)
Me= (11+11)/2 = 11,5 unidades vendidas Mo= 11 unidades vendidas R= Maximo – Minimo = 16 – 5 = 11 DT= ∑ (x-X) = (5-10,5) + (8 – 10,5) + . . . + (16 – 10,5) n 8 2
2
2
= 3,23
2
2. Se dispone de la siguiente distribución de frecuencia del peso (Kg) de 64 personas. Para los datos de la serie calcular las medidas descriptivas: - De posición: Media aritmética, mediana y moda - De dispersión: rango y desviación típica Intervalo de clase Li
Ls
Frecuencia absoluta ( fa )
55
59
3
60
64
11
65
69
12
70
74
14
75
79
12
80
84
6
85
89
6
Total
64
Desarrollo Li
Intervalo de clase Frecuencia Marca de Clase Ls Frecuencia acumulada (fac) absoluta ( fa )
fx
(x - X)
f(x - X)2
55
59
3
3
57
171
-15
675
60
64
11
14
62
682
-10
1.100
65
69
12
26
67
804
-5
300
70
74
14
40
72
1.008
0
0
75
79
12
52
77
924
5
300
80
84
6
58
82
492
10
600
85
89
6
64
87
522
15
1.350
504
4.603
Total
64
4.325
X= ∑ fx = 4603 = 72 N 64 Me= Li + (n/2 – fa)c = 71,7 fc
18
Mo= Li +
∆1 ∆1+∆2
c = 72
DT= ∑ f(x-X) = 8,2 n 2
3.Una compañía de transmisiones electrónicas registró como sigue el número de recibos de servicios prestados por cada una de sus 20 tiendas: 808 446 335 229
641 642 459 347
628 545 727 309
731 909 848 575
641 568 649 757
La política de la compañía es que una tienda realmente no puede alcanzar financieramente el punto de equilibrio con menos de 450 servicios prestados mensualmente. Además la compañía otorga un bono financiero al gerente de la tienda que genera más de 700 servicios al més. Con los datos anteriores indicar cuantas tiendas no están consiguiendo el punto de equilibrio y cuántas ganan el bono. Graficar. 4. Dada las alturas de dos grupos de cinco niños cada uno, calcular la media y la desviación típica de los mismos. Comparar y comentar los resultados obtenidos. Grupo 1 Grupo 2
1,41 1,46
1,45 1,48
1,50 1,51
1,59 1,53
1,60 1,57
19