Estadística Descriptiva
WILSON ANTONIO VELASTEGUI OJEDA
ESTADÍSTICA DESCRIPTIVA
“Las cosas complejas y estadísticamente improbables, son por naturaleza más difíciles de explicar que las cosas simples y estadísticamente probables”. Richard Dawkins
1
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
WILSON ANTONIO VELASTEGUI OJEDA
LUGAR DE NACIMIENTO Riobamba –Ecuador ESTUDIOS REALIZADOS: SECUNDARIA: Bachiller en Ciencias Colegio Nacional de Comercio y Título: Administración “Juan de Velasco” Administración y Contabilidad (Riobamba)
de
SUPERIOR: Escuela Superior Politécnica de Chimborazo (ESPOCH), Riobamba – Título: Ingeniero en Empresas Ecuador
Universidad Regional Autónoma de los Título: Diplomado Superior en Investigación Andes (UNIANDES), Ambato – Ecuador de la Educación a Distancia y Abierta
Universidad Regional Autónoma de los Título: Especialista en Diseño Curricular y Andes (UNIANDES), Ambato – Ecuador Material Educativo para la Educación a Distancia Universidad Regional Autónoma de los Título: Magister en Educación a Distancia y Andes (UNIANDES), Ambato – Ecuador Abierta
PRÁCTICA DOCENTE: Catedrático universitario de la Escuela Superior Politécnica de Chimborazo Facultad de Administración de Empresas, Escuela: Ingeniería en Contabilidad y Auditoría por cinco años en las asignaturas de Contabilidad General, Contabilidad Comercial, Contabilidad de Sociedades, Paquetes Contables, Proyecto Integrador, Control de
2
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Costos y Presupuestos por ordenador, Matemáticas para los Negocios
Auditoría Interna, Informática Aplicada y
Catedrático universitario de la Escuela Superior Politécnica de Chimborazo Facultad de Administración de Empresas en la Unidad de Educación a Distancia de la FADE, por cuatro años en las asignaturas de Contabilidad General, Paquetes Contables, Presupuestos, Contabilidad Superior, Contabilidad Financiera, Contabilidad de Costos, Contabilidad del Sector Financiero y Auditoria Financiera. Docente del Instituto Tecnológico República Federal de Alemania (Riobamba – Ecuador), por cinco años en las asignaturas de Contabilidad General, Contabilidad Comercial, Contabilidad de Costos, Presupuestos, Auditoria Financiera, Auditoria Administrativa, Mónica 8.0, Tmax 2000, Planificación Estratégica, Administración General, Administración de Recursos Humanos y Matemática Financiera
DATOS DE CONTACTO: Celular: 0999775143 Teléfono: 2962018 Mail: wavo_33@yahoo.com.mx Página web: www.wavo.galeon.com Publicaciones: www.slisdeshare.net/wilsonvelas
3
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
CONTENIDOS DEL MÓDULO
PRIMERA UNIDAD: CONCEPTOS BÁSICOS Objetivos Contenidos 1. Introducción Histórica 2. Concepto de Estadística Descriptiva 3. Clasificación de la Estadística 3.1. Estadística Descriptiva (Deductiva) 3.2. Estadística Inferencial (Inductiva) 3.3. Esquema de Estadística Inductiva 4. Organización de Datos 5. Variables Estadísticas 5.1. Variables Discretas 5.2. Variables Continuas Actividad de Aprendizaje No.1 Auto evaluación No. 1
SEGUNDA UNIDAD: DESCRIPCION DE UN CONJUNTOS DE DATOS Objetivos Contenidos 1. 2. 3. 4.
Descripción de Datos Procedimiento para agrupar los datos. Distribución de Frecuencias, intervalos y marcas de clase. Representación gráficas de los datos 4.1 Histograma 4.2 Polígono de frecuencia 4.3 Diagrama de distribución u ojiva 4.4 Diagrama de pastel o ciclograma 4.5 Diagrama de barras Actividad de Aprendizaje No. 2 Auto evaluación N.2
TERCERA UNIDAD: MEDIDAS DE TENDENCIA CENTRAL Objetivos Contenidos 1. Introducción Histórica 2. Medida Aritmética o promedio para datos no agrupados 3. Mediana para datos no agrupados 4. Moda para datos agrupados 5. Media aritmética para datos agrupados 6. Mediana para datos agrupados 7. Moda para datos agrupados Actividad de Aprendizaje No. 3 Auto evaluación No.3
4
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
CUARTA UNIDAD: MEDIDAS DE DISPERSION Objetivos Contenidos 1. 2. 3. 4. 5. 6. 7.
Cuartiles, Deciles, y Percentiles para datos no agrupados. Cuartiles, Deciles, y Percentiles para datos agrupados. Medidas de dispersión para datos no agrupados y agrupados. Desviación Media para datos no agrupados y agrupados. Varianza y desviación típica para datos agrupados y no agrupados Forma de Distribución de frecuencias Curtosis Actividad de Aprendizaje No. 4 Auto evaluación No.4
5
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
PRE – TEST O PRUEBA DE DIAGNOSIS 1. 2. 3.
Escriba los diez primeros múltiplos del número 7 ¿Halle el divisor de los números: 12, 15, 30, 39? Si hay 15 mujeres en un grupo de 65 estudiantes. ¿Qué porcentaje del grupo representan las mujeres? y ¿Qué proporción de grupo representan los varones?
4.
Suponga que: X1 = 4,
X2 = 8,
X3 = 8, X4 = – 6, Halle el resultado de:
4
Xi X
1
+ X2 + X3 =
i 1
5.
Redondee los siguientes números decimales: a) b) c) d)
1,0519 a tres dígitos 125,84 a tres cifras enteras 425,45 a una cifra decimal 1 25,0126 a tres dígitos
6.
Si n1 = 7; n2 = 9; y n3 = -6. ¿Cuánto vale n = ?
7.
(3 5) (9 / 2 2/( 12 3) /(5 / 2) ?
8.
Dé los valores absolutos de 1.96 y –1.96
9.
Si X1 = 25 y X = 29, y si K = X1 – X, ¿Cuál es el valor absoluto de (K)?
10. Si x 2 y 2 ny 2 , si y 2 45000, n 10; y 20, ¿ cuántovale x 2 ?
11. Si
B1
n xy ( x )( y ) n x 2 ( x ) 2 , donde
n 10, xy 3995; x460; y 82; x 2 22420. Halle B1
12. Dado los siete valores de X y de Y aquí indicados: X = 8, 12, 10, 11, 8, 7, 6 Halle X = Y = 9, 10, 8, 9, 8, 7, 7
Halle Y =
13. Dado el siguiente conjunto de datos: 2, 1, 8, 5, -1, 3, 9. Ordene en forma ascendente y en forma descendente.
6
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
14. Si tengo los siguientes números: 48.5 y 20.2. ¿Cuál es el mayor valor y cuál es el menor valor? y cuál es su diferencia? 15. Usted como estudiante considere ser una variable Y quién financia sus estudios sea una variable X ¿Cuál es la variable dependiente y cuál la variable independiente?
16. Si
r
7
xy ( x) 2 ( y 2 )
, despeje ( ( x)2
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
PRIMERA UNIDAD: CONCEPTOS BÁSICOS “No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS: Al término de esta unidad el estudiante estará en capacidad de:
Dar el concepto de estadística. Diferenciar entre una población y muestra Distinguir entre variable continua y una variable discreta
DESARROLLO DE CONTENIDOS 1.- INTRODUCCION HISTORICA. La Estadística se estructuró como disciplina científica, en el siglo pasado pero ya se conocía y se utilizaba en la antigüedad. La misma puede catalogarse en orden cronológico en los siguientes antecedentes: a.- Las antiguas civilizaciones, como por ejemplo la de Egipto realizaban relevantamientos estadísticos (captación de datos), debido a las inundaciones del río Nilo, efectuaban censos anuales, los mismos que permitan conocer como distribuir los bienes y reparto de propiedades para que fueran restituidos. También., se sabe que los griegos levantaban censos demográficos (nacimientos, muertes, casamientos, etc.) y de propiedad. b.- En la época del Imperio Romano se aplicaba censos poblacionales y de bienes a los pueblos sometidos al imperio con objeto de aplicar el régimen de impuestos.
En la época moderna, la técnica censal adquirió un gran desarrollo llegando constituirse un eficaz auxiliar de las tareas gubernamentales. 2.- CONCEPTO DE ESTADISTICAS DESCRIPTIVA La Estadística es la ciencia de recolectar, organizar, representar, analizar e interpretar datos para ayudar en una toma de decisiones más efectiva. Dicho de otro modo la Estadística se refiere a la colección, representación y utilización de datos numéricos para realizar inferencias y alcanzar decisiones ante la incertidumbre que plantean muchas disciplinas que van desde las ciencias, la ingeniería, las leyes, la medicina, la economía, la administración y otras ciencias, sociales y físicas.
8
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
El aspecto más importante de la estadística es la obtención de conclusiones basadas en los datos experimentales.
3.- CLASIFICACIÓN DE LA ESTADÍSTICA La Estadística se subdivide en: Descriptiva e Inductiva. 3.1.- Estadística Descriptiva:- Se refiere a la recopilación y descripción de un grupo de datos. Es aquella que estudia toda la población. 3.2.- Estadística Inductiva:- Es el proceso para lograr generalizaciones acerca del todo (llamado la población) examinando una parte de ella (llamada la muestra). Para que esto sea valido, la muestra debe ser representativa de la población.
3.3.- Esquema de Estadística Inductiva
Muestra
INDUCCION
Población
Encuesta
Veamos que significa población y muestra Población:- Es la colección de toda la posible información que caracteriza a un fenómeno. La población- o Universo puede ser tan grande o pequeña. Muestra:- Es mi subconjunto representativo seleccionado de una población.
4.- ORGANIZACION DE DATOS Los datos sin organizar carecen de sentido, es decir los datos brutos no permiten interpretar nada acerca de la información obtenida. Por esta razón es necesario organizar los datos, lo cual se realiza dependiendo del tipo de variable con la que se esta trabajando. Veamos que significa variable. Variable:- Es la que asume distintos valores en un evento o proceso, y pueden ser números o cantidades/ Ejemplo: salarios, precios, edades, peso, estatura, etc.
5.- VARIABLES ESTADISTICAS Las variables estadísticas pueden ser de dos clases: discretas y continuas.
9
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
5.1.- VARIABLES DISCRETAS.- Son aquellas que asumen valores específicos o determinados, en general son números enteros y sirve para contar o enumerar. Eje: El número de trabajadores de una empresa, el número de habitantes de un país, el numero de alumnos del ISTRA, etc. La variable discreta no tiene un límite determinado. 5.2.- VARIABLES CONTINUAS Son aquellas que asumen valores determinados en un rango, pueden ser enteros o fraccionarios y sirven para medir. Ejemplo: La temperatura, el peso, la estatura, la edad, etc.
10
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
ACTIVIDAD DE APRENDIZAJE No. 1 1.- Narre de dos a cinco Historias de la humanidad, o de su país, provincia, cantón, parroquia, o comunidad, donde se haya aplicado el concepto de Estadística de forma empírica. Es decir sin que haya sido considerada como ciencia.
2.- Describa en forma general desde cuando usted conoció la ciudad de Riobamba.
3.- De los siguientes ítems compare y diga cual es población y cual es muestra
a) Número de periódicos vendidos a la semana en el mundo b) Número de periódicos vendidos a la semana en Ecuador c) Número de periódicos vendidos a la semana en la ciudad de Riobamba d) Estudiantes de todas las universidades del mundo e) Estudiantes de todas las universidades europeas f) Estudiantes de todas las universidades españolas g) Estudiantes de todas las universidades americanas h) Estudiantes de todas las universidades ecuatorianas i) Estudiantes de todas las universidades de la ciudad de Riobamba
4.- Escriba 10 ejemplos de Población y 10 de muestra
5.- ¿A que tipo de variable corresponde las siguientes expresiones?:
a) Promedio de calificación de los estudiantes b) Distancia que los estudiantes recorren para llegar a clases c) Calificaciones de estudiantes en el primer examen parcial de Estadística d) Clasificación de alumnos de acuerdo a la provincia que nacieron e) Número de horas de estudio de los estudiantes del ISTRA f) Edad de los estudiantes del Unidad Educativa Sultana de los Andes
11
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
g) Peso de todos los que integran el Instituto República de Alemania “ISTRA”
6.- Escriba 10 ejemplos de variable discreta y 10 ejemplos de variable continua
7.- Luego de haber leído cualquier periódico o revista relacionado a la economía. Haga un resumen y diga que tipo de variable o variables intervienen en la misma.
8.- Describa con sus propias palabras cómo se puede utilizar la estadística para resolver problemas en diversas disciplinas y puestos de trabajo
9.- El presidente de una asociación de estudiantes quiere tomar una muestra de las opiniones de los 150 miembros en relación con las actividades de recreación para el período académico que empezará en el mes octubre.
a) ¿Cuál es la población?
b) ¿Cuál sería la mejor manera de tomar la muestra?
10.- ¿Qué tipo de variable representan las siguientes designaciones? a) Los estudiantes califican a su profesor de estadística en una escala de: Horrible, no tan malo, bueno, magnífico. serio, estricto.
12
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
SEGUNDA UNIDAD: CONCEPTOS BÁSICOS “No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS: Al término de esta unidad el estudiante estará en capacidad de:
Diferenciar entre un conjunto de datos no agrupados y agrupados. Agrupar un conjunto de datos Determinar la marca de clase y distribuciones de frecuencias Realizar representaciones gráficas de los datos de un conjunto.
DESARROLLO DE CONTENIDOS 1. DESCRIPCION DE DATOS U OBSERVACIONES
Al número de datos u observaciones se lo representan con n. Para describir los dates puede presentar dos casos:
1er CASO:- Cuando el conjunto de observación tiene pocos datos o valores
Ejemplo. Un estudiante durante un semestre dio diez exámenes parciales calificados sobre diez (10 puntos), obteniendo los siguientes resultados:
6 – 7 – 6 – 8 – 5 – 7 – 6 – 9 – 10 y 6. En este ejemplo, n = 10 (número de datos).
Para este tipo de conjunto (o estadística) primero se hace un cuadro o una tabla, luego en la primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o descendente (creciente o decreciente) en la segunda columna se ponen el número de los valores que se repiten, al número que se repite se llama frecuencia (f). Esto lo visualizamos mediante el siguiente cuadro.
13
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Notas 5 6 7 8 9 10
Frecuencia (f) Absoluta 1 4 2 1 1 1
TOTAL
n = 10
2do. CASO. - Cuando el conjunto de observación tiene muchos valores diferentes Para este caso se emplea un procedimiento llamado “Agrupamiento de datos". Esto es posible cuando el numero do datos es mayor que 30 (n >30)
OBSERVACIÓN:- El número de clases que se emplea para agrupar los datos en un conjunto depende del número de datos.
* Si el numero de datos es pequeño, el numero de clases a emplear será cercano a cinco (5), pero generalmente nunca menos que cinco (5)
* Si existe una cantidad elevada de datos, el número de clases debe encontrarse entre ocho (8) y doce (12) clases
* En general el número de clases puede encontrarse entre 5 a 15 clases, el número de clases se puede elegir uno mismo (entre 5 a 15)
Para saber en cuantos grupos o clases agrupamos estos datos, se utiliza la formula de Sturges K= 1+3,322 Log (n), donde K. es el numero de clases y n es el número de dates u observaciones. Esto se clarifica mediante el siguiente ejemplo:
La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:
105 106
105
107
109
111
110
110
107
107
104
101 100
101 100
103
98
92
97
94
95
95
90
86
87
89
87
89
91
82
14
91
85
Ing. Wilson A. Velastegui. Ojeda. Msc
99 93
103
99
103
95
95
95
Estadística Descriptiva
El número de datos u observaciones es n = 40. Como el número de datos es mayor que 30, agrupamos los datos utilizando la fórmula de Sturges:
K = 1+3,322 log (n) K = 1+3.322 log (40) K = 1+3,322 (1.60205) K = 1+5,322 K = 6,32 = 6
Por tanto los 40 datos podernos agrupar en 6 grupos intervalos o Clases
2. - PROCEDIMIENTO PARA AGRUPAR LOS DATOS
1.- Ordenamos los datos en forma creciente o decreciente (ascendente o descendente)
2.- Encontramos el dato mayor y el dato menor, llamado también observación mayor (OM) y observación menor (om). Con estos datos encontramos el rango o recorrido, en formula es: Rango = R = OM – om 3.- Determinamos el numero de clases o grupos (K), utilizando la fórmula de Sturges, (en nuestro ejemplo anterior K=6).
4.- Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa con la letra C, en formula es: C
Rango R , Número..de..clases K
C= es la amplitud de la clase
5.- Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia, esto es
CLASE
15
LIMITE DE CLASE
Ing. Wilson A. Velastegui. Ojeda. Msc
FI
Estadística Descriptiva
6.- En la columna de límites de clase anotamos como límite inferior (Li) de la clase a la observación menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos tantos datos hasta el límite superior (Ls), así sucesivamente iremos anotando en clase, hasta llegar a la última clase en la que debe escribir incluido el dato mayor
7.- Finalmente contamos cuantos datos están incluidos en cada clase y lo ponemos en la columna de las frecuencias (f)
Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de datos
105 106
105
107
109
111
110
110
107
107
104
101 100
101 100
103
98
92
97
94
95
95
90
86
87
89
87
89
91
82
91
85
99
103
99
103
95
95
95
93
1.- Ordenamos los dates del ejemplo que estamos tratando en forma ascendente
82 85 86 87 87 89 99 107
99
100
109
100 101
110
110
89 90 91 91 92 93 94 95 101
103
103
103
104
95 105
95 105
95
95
106
111
2.- Hallamos el Rango R = OM – om R = 111 – 82 = 29
3.- Determinamos el número de clases. K = 1+3,322 log(40) = 6,
4.- Determinamos la amplitud del intervalo de la clase. C = R/K 29/6 = 4.83 C=5 5.- Preparamos una tabla con 3 columnas
16
Ing. Wilson A. Velastegui. Ojeda. Msc
(K=6)
97 107
98 107
Estadística Descriptiva
Clases 1 2 3 4 5 6 TOTAL
Límites de Clases 82 – 86 87 – 91 92 – 96 97 – 101 102 – 106 107 – 111
Frecuencia fi 3 7 8 8 7 7 n = 40
EJEMPLO.- En un centro distribuidor de electrodomésticos, la demanda diaria de televisores de 14 pulgadas durante 31 días de trabajo es:
38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49 – 78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56. Agrupe este conjunto de datos
1.- Ordenamos los datos en forma ascendente
25 47 58
28 48 59
32 48 61
33 49 63
35 51 66
35 52 67
38 53 69
42 56 72
44 57 76
2.- R = 78 - 25 = 53
3.- K = 1+ 3,3221og(30) K = 1+ 4.9 = 5.90 = 6
4.- C = R / K = 53 / 6 = 8.833 = 9
5.- Presentamos los datos en columnas CLASE 1 2 3 4 5 6 TOTAL
17
Li – Ls 25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78
Ing. Wilson A. Velastegui. Ojeda. Msc
F 4 4 7 7 5 3 n = 30
44 58 78
Estadística Descriptiva
NOTA:- Para ordenar los datos es conveniente saber si los datos se trata de atributos o variables
Atributo:- Son los que expresan cualidades. Eje: bueno, malo, masculino femenino
Variable:- Es la que asume distintos valores en un evento, generalmente son números. Para ordenar datos que son atributos es conveniente clasificar de acuerdo con las categorías, el atributo puede dividirse. Por Ejemplo: si queremos ordenar datos correspondientes a calificaciones de exámenes serán, sobresaliente, muy buena, buena, regular, insuficiente.
Pero, si queremos ordenar datos correspondientes a variables, hay que ordenar los valores en forma creciente o decreciente (ascendente o descender, (e)
3.- DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE. Para hacer la descripción gráfica de los datos es necesario conocer algunos elementos de la estadística
3.1.- LIMITES DE INTERVALOS DE CLASE Todo grupo, intervalo o clases tiene dos límites: Límite inferior (Li) y límite superior (Ls)
3.2.- PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc)
Cuando estamos trabajando con datos agrupados es conveniente buscar para cada intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que se representa con Xc, en formula es: Xc
Li Ls 2
25 33, Li 25, Ls 33 Por ejemplo: en el intervalo Xc 252 33 58 / 2 Xc 29
Xc = 29 es el punto medio o marca de clase
18
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
3.3.- FRECUENCIA ABSOLUTA Es el número de veces que se repite un dato, o el número de datos que sc encuentre dentro de un intervalo o clase, se lo representa con la letra "F minúscula, es decir a este tipo de frecuencia se llama Frecuencia Absoluta.
3.4.-FRECUENCIA RELATIVA Se obtiene dividiendo el número de datos u observaciones de la clase o grupo para el número total de datos u observaciones:
se representa con la letra (fr), en fórmula es:
fr
Número..de..datos..de..clase f Número..total..de..datos n
3.5. FRECUENCIA ACUMULADA ( Fa ) Se obtiene de la siguiente forma: En la primera clase se pone la frecuencia absoluta del mismo, en la segunda clase se pone la suma de la frecuencia de la primera clase con la segunda clase, y así sucesivamente hasta la suma con la frecuencia de la última clase.
3.6.- FRECUENCIA RELATIVA ACUMULADA Se obtiene de forma similar que la frecuencia acumulada, pero sumando las frecuencias relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en formula es:
K
f r f1 f 2 ..... f k 1
I 1
3.7.- PORCENTAJE El porcentaje se obtiene multiplicando la frecuencia relativa por 100, en formula es:
P = (%) f r
19
f N
Ing. Wilson A. Velastegui. Ojeda. Msc
x100
Estadística Descriptiva
Aplicando esta formula se obtiene el porcentaje, cuyo resultado debe expresarse con % (tanto por ciento). La suma de todos los porcentajes es igual a 100%
Ejemplo: Dada la siguiente tabla hallar: a) El punto medio, b) Frecuencia acumulada, c) frecuencia relativa, d) frecuencia relativa acumulada y e) el porcentaje.
Clase Límite de clase Frecuencia Punto Medio f Xc Li –– Ls 1 25 33 4 29 2 34 – 42 4 38 3 43 – 51 8 47 4 52 – 60 7 56 5 61- 69 5 65 6 70 – 78 3 74 TOTAL n = 31
Fa
fr
fra
Porcentaje %
4 8 16 23 28 31
0.13 0.13 0.26 0.23 0.16 0.09 1.00
0.13 0.26 '0.52 0.75 0.91 1.00
P 0.13X100=13 0.13X100=13 0.26X100=26 0.23X100=23 0.16X100=16 0.09X100=9 100%
4.- REPRESENTACION GRAFICA DE LOS DATOS La representación gráfica de los datos es un medio eficaz para el análisis de las estadísticas, que nos permiten ver el comportamiento de los datos en mi conjunto del cual se este investigando. Para luego sacar sus conclusiones. La representación gráfica de los datos constituye mi medio auxiliar de la investigación estadística pues esta se fluidamente en la descripción.
SISTEMAS DE REPRESENTACION.- El sistema de representación mas usual es el PLANO CARTESIANO, en el eje X se ponen los valores distintos de la variable para dates no agrupados y los límites de clases para los datos agrupados, en el eje Y se ponen las frecuencias absolutas (o frecuencias relativas), Veamos las representaciones gráficas mas usuales en la estadística
4.1.- HISTOGRAMA.- El histograma es un gráfico que tiene un conjunto de rectángulos de igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas. Para construir un histograma se traza primero en el primer cuadrando positivo del plano cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases, procurando que haya una continuidad o coincidencia, Esto es que, el límite superior de una clase se constituye en límite inferior do In siguiente clase NOTA:- Para esto es necesario hallar los limites reales (L-R) de la clase. En el eje Y que corresponden a sus alturas se ponen sus respectivas (frecuencias.
20
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Ejemplo: dado los siguientes datos de la siguiente tabla grafique el histograma Clase 1 2 3 4 5 6 Total
Límites de clase 25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78
L–R 24,5 – 33,5 33,5 – 42,5 42,5 – 51,5 51,5 – 60,5 60,5 – 69,5 69,5 – 78,5
f 4 4 8 7 5 3 N = 31
Histograma: de la demanda diaria de la venta de televisores
8
7
6 5 4 3 2 1 0 24.5
33.5
42.5
51.5
60.5
69.5
78.5
4.2.- POLÍGONO DE FRECUENCIA.- Es un gráfico lineal, su construcción es similar al histograma; para su construcción se unen los puntos medios de cada clase, con sus respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman un polígono
Ejemplo: dado los siguientes datos de la tabla construya el polígono de frecuencia
Clase Limites de Clase 1 25 – 33 2 34 – 42 3 43 – 51 4 52 – 60 5 61 – 69 6 70 – 78
f 4 4 8 7 5 3
L.R 24.5 - 33.5 33.5 – 42.5 42.5 - 51.5 42.5 51.5 - 60.5 60.5 - 69.5 69.5 - 78.5
Xc 29 38 47 56 65 74
Polígono de Frecuencia: de la demanda diaria
21
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
29
4.3.- DIAGRAMA DE ACUMULADAS)
38 47 56
65 74
DISTRIBUCIÓN U OJIVA (CURVAS
DE
FRECUENCIAS
El gráfico de una distribución de frecuencias acumuladas (se llaman OJIVA) o curva de distribución de frecuencias acumuladas
Para su construcción se procede de la siguiente manera. Se considera el plano cartesiano, en el eje X se anotan los limites reales (L – R) de la clase, en el eje Y se anotan las frecuencias acumuladas (desde la menor hasta la mayor)
Ejemplo: dado los siguientes datos de la tabla construya la curva de distribución u (OJIVA)
Clase 1 2 3 4 5 6
22
Li – Ls 25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78
f 4 4 8 7 5 3
Ing. Wilson A. Velastegui. Ojeda. Msc
Fa 4 8 16 23 28 31
L – R 24,5 – 33,5 33,5 – 42,5 42,5 – 51,5 51,5 – 60,5 60,5 – 69,5 69,5 – 78,5
Estadística Descriptiva
Gráfico de la curva de distribución (OJIVA)
35 30 25 20 15 10 5 0
Serie1
24.5
33.5
42.5
51.5
60.5
78.5
4.4.- DIAGRAMA DE PASTEL O CICLOGRAMAS Los gráficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo conjunto forman un todo. Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son círculos que representan al número total de datos (n) divididos en tantos sectores circulares como categorías tiene el grupo. Cada sector circular es proporcional a la frecuencia de su clase o categoría. Para encontrar el número de grados de cada clase o categoría se utiliza la siguiente formula. GRADO = (fx360)/n Donde f es la frecuencia de la clase y n el número total de dates
Ejemplo: dado los siguientes datos de la tabla construya el diagrama de pastel
CLASE O serie
LIMITE DE CLASE
FRECUENCIA F
GRADOS (fx360)/n
PORCENTAJE Fr x 100
Serie 1 Serie 2 Serie 3 Serie 4 Serie 5 Serie 6 TOTAL
25 – 33 34 – 42 43 – 51 52 – 60 61 – 69 70 – 78
4 4 8 7 5 3 n = 31
46.5° 46.5° 93° 81° 58° 35° 360°
0.13x100=13 0.13x100=13 0.26x100=26 0.23x100=23 0.16 x100=16 0.09X100=9 100%
23
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
1 2 3 4 5 6
4.5.- DIAGRAMA DE BARRAS O GRÁFICO DE BARRAS. El diagrama de barras es un gráfico que se representa por medio de rectángulos que se levantan desde el eje X, hasta una altura que corresponde aI eje Y y que es igual a las frecuencias de las diferentes categorías de los datos.
La diferencia entre el diagrama de barras y el histograma esta en que el histograma se refiere a una distribución de frecuencias y los diagramas de barras se utilizan para cualquier tipo de atributos cualidades o categorías.
Ejemplo: Los siguientes datos corresponden a los campos petroleros existentes en el Oriente Ecuatoriano. Campos Petroleros Yana yacu Coca Durano Guanto Yana Yacu sur Lago Agrio Shushufindy Yana yacu norte Sachas 1 Sachas 2
1 2 3 4 5 6 7 8 9 total
f 20 57 100 8 16 14 12 28 56 n= 311
DIAGRAMA DE BARRAS DE CAMPOS PETROLEROS
120 100 80 Series1
60 40 20 0 1
24
2
3
4
5
Ing. Wilson A. Velastegui. Ojeda. Msc
6
7
8
Estadística Descriptiva
ACTIVIDAD DE APRENDIZAJE No. 2 1.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesías por las Islas Galápagos a ciudadanos de la tercera edad. El presidente de la agencia quiere información adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes que hicieron la travesía el año pasado dio a conocer las siguientes edades.
77 41 60
18 58 60
a) b) c) d)
63 58 45
84 53 66
38 51 83
54 62 71
50 43 63
59 52 58
54 53 61
56 63 71
36 62
26 62
50 65
34 61
44 52
Organice los datos en una distribución de frecuencias ¿En cuántas clases, grupos o intervalos se puede agrupar este conjunto de datos? ¿Cuál es límite inferior que usted recomendaría para la primera clase? Comente sobre la distribución de frecuencias
2.- De Ia tabla siguiente: Construya el Histograma, el polígono de frecuencia y la curva de distribución u ojiva Li – Ls 19,2 – 19,4 19,5 – 19,7 19,8 – 20,0 20,1 – 20,3 20,4 – 20,6 20,7 – 20,9 TOTAL
f 1 2 8 4 3 2 n = 20
3) Dada la siguiente tabla que representa el número de carros vendidos en una feria internacional. Grafique el diagrama de barras MARCA DE CARROS Datsun Ford Toyota Vitara Montero San Remo
f 40 45 32 44 38 46
TOTAL
n = 204
4.- El director del programa de investigaciones científicas de la Universidad Estatal tiene 16 solicitudes para su admisión en el próximo año. Las calificaciones de la prueba de los solicitantes es:
25
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
27 26
27 28
27 26
28 28
27 31
25 30
25 26
28 26
Tales calificaciones deben organizarse en una distribución de frecuencias.
a) ¿Cuántas clases grupos o intervalos recomendaría? b) ¿Qué intervalo de clase sugeriría? c) ¿Cuál es el límite inferior que recomendaría para la primera clase?
5.- En la siguiente serie estadística de intervalos: Determine: x
F
120 – 125
5
114 – 119
6
108 – 113
10
102 – 107
9
96 – 101
15
90 – 95
2
Total
N=47
a) La marca de clase.
e) El histograma
b) La frecuencia relativa
f) El polígono de frecuencia
c) La frecuencia acumulada
g) La curva de distribución (OJIVA)
d) El porcentaje de la frecuencia relativa
h) El diagrama de pastel
26
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
AUTO EVALUACIÓN
No.1 y 2
PARTE A: APLICACIÓN DE LOS CONCEPTOS Y DEFINICIONES Señale con una (X) la alternativa o alternativas verdaderas que corresponda a cada pregunta.
1.- En el siguiente redondeo de datos señale las aproximaciones que son correctas de acuerdo al Sistema Internacional
a) 125,85 aproximado a tres cifras enteras es 126 b) 235,135 aproximado a dos cifras decimales es 235,14 c) 425,45 aproximado a una cifra decimal es 425,5 d) 1 250,1245 aproximado a una cifra decimal es 1250,2.
2.- Señale con una (x) las variables continuas. a) Provincias del Ecuador
b) Habitantes del Ecuador
c) La estatura de los alumnos de un colegio.
d) La edad de los alumnos de la Modalidad Abierta y a distancia
3.- La variable familias del Ecuador es: a)
Continua
b)
Discreta
c)
Cualitativa
d)
Ninguna de las anteriores
4.- Señale con una (x) las proposiciones que son correctas. a)
C = Ls – Li +1
d)
La marca de clase es el valor medio de cada intervalo.
b)
xc = Ls+Li/2
c)
xc = (Ls+Li)/2
5.- determine los límites reales que le corresponden al siguiente intervalo: 46 – 50 a) 46,5 - 50,5
b) 45,5 - 49,5
c) 45,5 - 50,5
d) Ninguna de las soluciones anteriores.
27
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
6.- Un colegio tiene 3 200 estudiantes. Si los alumnos matriculados en el primer curso son 400, el porcentaje que le corresponde a este curso es de: a)
8,5%
b)
12,5%
c)
d)
Ninguna de las soluciones anteriores
80%
7.- El ancho del intervalo 51 – 57 es: a) C = 5
b) C = 6
c) C = 7
d) Ninguna de las anteriores
8.- La marca de clase del intervalo 30 – 35 es: a) 4
b) 5
c) 32
d) Ninguna de las soluciones anteriores
9.- Para el cálculo de la frecuencia relativa debemos utilizar la fórmula a) r
fx100 n
b) f r f .n
c) f r
f n
d) Ninguna de las soluciones anteriores
10) La fórmula para calcular el porcentaje de la frecuencia es: a) p
f .100 N
b) p
f .,N 100
c) p
f n
d) Ninguna de las anteriores
11.- ¿Cuál de las siguientes es una gráfica de superficie? a) Curva de magnitud
b) Polígono de frecuencia
c) Barras compuestas
d) Pictograma
12.- En un polígono de frecuencias, los valores representados en el eje vertical corresponden a) Los intervalos de clase
b) Las frecuencias acumuladas
c) Los puntos medios
d) las frecuencias
28
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
13.- En un histograma, las frecuencias se ubican en el eje vertical y en el eje horizontal
a) Los limites reales de clase
b) La variable
c) Los porcentajes de las frecuencias
d) las frecuencias relativas
14.- Cuando en el polígono de frecuencia los puntajes se distribuyen en forma uniforme, la prueba aplicada ha sido: a) Con un alto grado de dificultad
b) Con cierto grado de dificultad.
c) Normal
d) Ninguna de las soluciones anteriores
15.- El gráfico que se obtiene al representar la variable y la frecuencia acumulada a) Pictograma
b) Ojiva o curva de magnitud
c) Polígono de Frecuencia
d) Diagrama de frecuencias
16.- El polígono de frecuencia es un gráfico
a) De superficie
b) Lineal
c) Libre
d) Ninguno de los anteriores
17.- Para trazar un diagrama de barras horizontales en el eje de las abscisas se localizan las frecuencias y en el eje de las ordenadas. a) la amplitud de la variable
b) Los limites reales de clase
c) Los datos de la variable
d) Las frecuencias acumuladas
18.- En un diagrama de sectores los 360 grados del ángulo central de un círculo se distribuyen utilizando la fórmula a) A° =
f .100 N
b) A° =
f .360 f
c)
A° =
19.- El diagrama espiral se utiliza para representar:
29
Ing. Wilson A. Velastegui. Ojeda. Msc
N .100 f
d) A° =
f .360 N
Estadística Descriptiva
a) Solo series con datos geográficos
b) Dos series de datos
c) Una variación expansiva de un fenómeno
d) Los porcentajes de la variable
20.- Diga si es variable cuantitativa o variable cualitativa los siguientes ítems a) Numero de libros que ha leído usted en este año b) Peso del contenido en kilogramos de varias cajas de cereales c) Número de pases de semestres otorgados a los estudiantes del ISTRA d) Número de asignaturas en que los estudiantes del ISTRA se han matriculado este semestre
30
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
TERCERA UNIDAD: MEDIDAS DE TENDENCIA CENTRAL “No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS: Al término de esta unidad el estudiante estará en capacidad de:
Definir los conceptos de las medidas de tendencia central como: promedio, mediana, moda, media geométrica y media armónica. Determinar la media aritmética, mediana y moda de datos no agrupados y agrupados
DESARROLLO DE CONTENIDOS 1.- INTRODUCCION.- En las unidades anteriores se plantearon los conceptos y las técnicas gráficas para describir las distribuciones ocultas en un conjunto de datos. En esta unidad se definen algunas “medidas numéricas” que se emplean para describir un conjunto de datos. Estas medidas son: Medidas de tendencia central o de centralización
Estudiaremos tanto para datos no agrupados y agrupados. Las medidas de tendencia central se refieren a la localización de una distribución. La más importantes medidas de tendencia central son: la media ( X ), la mediana (Mdn), la moda (Mo), media geométrica (MG) y la mediana armónica(MA)
2.- MEDIA ARITMETICA O PROMEDIO PARA DATOS NO AGRUPADOS DEFINICION.- La media se define como la suma de los valores de un conjunto de datos dividido para el número total de datos. Existen dos tipos de medias aritméticas: La media poblacional que se representa por u (miu) y la media muestral que se representa por ( X ) (equis barra).
La media para datos no agrupados está dada por la siguiente fórmula:
n
Xi
X i 1 n
31
x x 2 x3 ..... x n 1 n
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Donde
n
X i a la suma de cada uno de los valores del conjunto de datos y (n) es el
i 1
número total de elementos del conjunto.
Ejemplo: Dado el siguiente conjunto de datos hallas su media.
38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49 78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56 – 45
Aquí es este conjunto n = 30
n
Xi
X i 1 n
38 35 76 58 48 ..... 44 44 56 45 1590 51,29 31 31
3. MEDIANA PARA DATOS NO AGRUPADOS DEFINICIÓN.- La mediana es una colección de datos debidamente ordenados en forma ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmética de los dos valores medios.
La mediana está justamente en el 50% de los datos (en la mitad). Para hallar la mediana, puede presentar dos casos.
1er. CASO.- Cuando el número de datos es impar.- En este caso la mediana se encuentra en la mitad de la “serie ordenada” de los datos, se puede encontrar utilizando la siguiente fórmula Mdn
n 1 2
El resultado de esta operación nos indica la posición o el lugar donde está la mediana (este valor no es la respuesta).
32
DATOS SIN ORDENAR
DATOS ORDENADOS
38 35 76 58 45
28 32 33 35 36
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
67 63 33 69 53 59
42 44 44 45 47 48 48
28 25 36 32 61 51
51 52 53 56 57 58 58
49 78 48 42 72 57
59 61 63 66 67 69 72 76 78
47 66 58 44 44 52 56
n = 31 (NÚMERO DE DATOS IMPAR) Mdn
n 1 31 1 16 2 2
El 16 no es la mediana, el 16 nos indica la posición o el lugar donde se encuentra ubicado la mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 16 ocupa el número 51. Por lo tanto la mediana es: Mdn = 51 2do. CASO.- Cuando el número de datos es par.- En este caso se utiliza el mismo procedimiento que el 1er. Caso, y se obtiene un número entero con decimales, en este caso la median se encuentra hallando la media aritmética de los dos valores medios
DATOS SIN ORDENAR
DATOS ORDENADOS
38 35 76 58 45
28 32 33 35 36
67 63 33 69 53 59
42 44 44 45 47 48 48
28 25 36 32 61 51
51 52 53 56 57 58 58
49 78 48 42 72 57
59 61 63 66 67 69 72 76 78
47 66 58 44 44 52 56
Posición Mdn
n 1 30 1 31 15,5 2 2 2
El número 15, 5 no es la mediana, este valor nos dice que la mediana está entre el elemento 15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 está ocupado por el número 51 y el puesto 16 por el número 52.
Por lo tanto la mediana es: Mdn
33
Ing. Wilson A. Velastegui. Ojeda. Msc
51 52 103 51,5 2 2
Estadística Descriptiva
4.- MODA PARA DATOS NO AGRUPADOS
DEFINICIÓN.- La moda en un conjunto de datos u observaciones es el valor que se repite con mayor frecuencia. A la moda o modo se lo representa con Mo.
NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama UNIMODAL
Ejemplo 1: Hallar la moda del siguiente conjunto de datos.
19
1
3
4
2
5
7
6
6
6
6
6
20
17
8
18
9
10
En este conjunto el número que se repite es el 6, por tanto la moda es Mo = 6
Ejemplo 2: Hallar la moda del siguiente conjunto de datos.
1
2
3
3
3
3
4
5
6
7
8
9
10
11
11
11
11
12
En este conjunto los números que se repiten son el 3 y el 11, por tanto la moda es Mo = 3 Mo = 11 por lo tanto es bimodal (tiene dos modas)
Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.
Si existen más de dos valores que se repiten, se dice que el conjunto tiene varias modas, en este caso se llama MULTIMODAL
34
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
5.- MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
La media para datos agrupados se calcula por la siguiente fórmula:
k
fi X C
X i 1
n
f X f X ..... f k X Ck 1 C1 2 C 2 n
k
Donde f i Xc = a la suma del producto de las frecuencias por el punto medio o marca de i 1
clase. n = número total de datos u observaciones K = número de intervalos grupos o clases
Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma Finalmente sumamos la columna de los productos y su resultado dividimos para el número total de datos.
Ejemplo: Dado la siguiente tabla de frecuencias halle la media aritmética.
Li – Ls
f
Xc
f. Xc
25 – 33
4
29
4x29=116
34 – 42
4
38
4x38=152
43 – 51
8
47
8x47=376
52 – 60
7
56
7x56=392
61 – 69
5
65
5x65=325
70 – 78
3
74
3x74=222
n = 31
6
f . X C 1583
i 1
6
X
35
F.X C
I 1
n
Ing. Wilson A. Velastegui. Ojeda. Msc
1583 51,06 31
Estadística Descriptiva
6.- MEDIANA PARA DATOS AGRUPADOS PROCEDIMIENTO 1.- De la tabla hallamos las frecuencias acumuladas
límites de clases
2.- Dividimos el número total de datos para dos utilizando la expresión
n 2
3.- El resultado encontrado en 2) localizamos en la columna de frecuencias acumuladas 4.- Aplicamos la fórmula de la mediana para datos agrupados que esta dado por:
Mdn Li
n 2 ( f a ) i fm
C , o también Mdn Ls
n 2 ( f a ) s fm
C
donde;
.Li = significa límite real inferior de la calase mediana. n = es el número de datos del conjunto dividido para dos. 2
f a i = suma de las frecuencias acumuladas inferiores a la clase mediana C
= amplitud del intervalo o ancho del intervalo
f m = frecuencia de la clase mediana
Ejemplo: Dado la siguiente tabla de frecuencias halle la mediana
Li – Ls
f
Fa
25 – 33
4
4
34 – 42
4
8
43 – 51
8
16
52 – 60
7
23
61 – 69
5
28
70 – 78
3
31
n = 31
NOTA: La clave primero esta en dividir el número total de datos para dos, esto es:
36
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
n 31 = 15,5 2 2 .Li = 42,5
este valor se encuentra en la clase 3 o el intervalo 43 – 51
f a i = 8
C = 43 – 34 = 9
fm = 8
Reemplazando estos valores en la fórmula de la mediana tenemos su resultado Mdn 42,5
15,58 (9) 42,5 7,5 (9) 42,5 67,5 42,5 8,4375 = 50,9375 8 8
8
7.- MODA PARA DATOS AGRUPADOS
Para hallar la moda para datos agrupados, primeramente se observa en columna da las frecuencias, el valor más alto (clase con la mayor frecuencia.) Luego se halla la moda utilizando la siguiente fórmula d1 1 d2
Mo Li d
C
donde;
Li = Límite inferior de la calase modal (clase con la mayor frecuencia). d1 = Frecuencia de la clase modal menos la frecuencia de la clase anterior d 2 = Frecuencia de la clase modal menos la frecuencia de la siguiente clase.
C = Amplitud o longitud del intervalo de clase
Ejemplo: Dado la siguiente tabla de frecuencias halle la moda
Li – Ls
f
25 – 33
4
34 – 42
4
43 – 51
8
52 – 60
7
61 – 69
5
70 – 78
3 n = 31
NOTA: La frecuencia mas alta 8 y esta en el intervalo 43 – 51 o tercera clase, donde:
37
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
f = 8 frecuencia más alta Li = 42,5 = Límite inferior de la calase modal (clase con la mayor frecuencia) d1 = 8 – 4 = 4 = frecuencia de la clase modal menos la frecuencia de la clase anterior d 2 = 8 – 7 = 1 = frecuencia de la clase modal menos la frecuencia de la siguiente
clase. C = 70 – 61 = 9 = Amplitud o longitud del intervalo de clase
Estos valores reemplazamos en la fórmula de la moda y su valor es: d1 1 d2
Mo Li d
C = 42,5 4 4 5 (9) 42,5
36 42,5 4 = 46,5 9
EJEMPLO DE RECAPITULACIÓN:
Dado la siguiente tabla de datos agrupados halle la media aritmética, mediana y la moda
Clase 1 2 3 4 5 6 Total
Li – Ls 1.00 – 1.04 1.05 – 1.09 1.10 – 1.14 1.15 – 1.19 1.20 – 1.24 1.25 – 1.29
fi 4 6 10 15 8 5 n = 48
Xc 1.02 1.07 1.12 1.17 1.22 1.27
f. Xc 4.08 6.42 11.20 17.55 9.76 6.35
Fa 4 10 20 35 43 48
6
f .X C 55,36
i 1
k
f .X C
X i 1
n
55,36 = 1.1533333 = 1.15 48
Para la mediana primero dividimos el número total de datos para dos, esto es: n 48 = 24 este valor se encuentra en la 4º clase o el intervalo 1.15 – 1.19 2 2 f a i = 20 C = 1.15 – 1.10 = 0.05 .Li = 1.15 f m = 15
Reemplazando estos valores en la fórmula de la mediana tenemos su resultado
38
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Mdn Li Mdn 1.15
n 2 ( f a ) i fm
C
2420 (0.05) 1.15 4 / 15(0.05) 1.15 0.0133 = 1.1633 = 1.163 15
Para hallar la moda observamos cual es la frecuencia más alta, en este caso es 15 y está en la cuarta clase, donde se tiene: d1 = 15 – 10 = 5
Li = 1.15
d 2 = 15 – 8 = 7
C = 1.20 – 1.15 = 0,05 Estos valores reemplazamos en la fórmula de la moda y su valor es:
Mo Li d
d1
1 d2
d1 1 d2
Mo Li d
C = 1.15 55 7 (0.05) 1.15 Mo= 1.170 1.2
39
Ing. Wilson A. Velastegui. Ojeda. Msc
C
0.25 1.15 0.020833333 = 1.17083 12
Estadística Descriptiva
ACTIVIDAD DE APRENDIZAJE No. 3 1.- Los siguientes datos representan las latas de frutas de una muestra de 20 unidades que contienen pesos netos que oscilan entre 19.3 onzas y 20.9 onzas.
19.7 - 19.9 - 20.2 - 19.9 - 20.0 - 20.6 - 19.3 - 20.4 - 19.9 - 20.3 - 20.1 - 19.5 - 20.9 - 20.3 20.8 - 19.9 - 20.0 - 20.6 - 19.9 - 19.8 Hallar: el peso promedio, la mediana y la moda, para este conjunto de datos no agrupados
2.- La agencia de viajes Ecuador, ofrece tarifas especiales en ciertas travesías por las Islas Galápagos a ciudadanos de la tercera edad. El presidente de la agencia quiere información adicional sobre las edades de las personas que viajan, una muestra aleatoria de 40 clientes que hicieron la travesía el año pasado dio a conocer las siguientes edades.
77 41 60
18 58 60
63 58 45
84 53 66
38 51 83
54 62 71
50 43 63
59 52 58
54 53 61
56 63 71
36 62
26 62
50 65
34 61
44 52
Hallar: la edad promedio, la mediana y la moda, para este conjunto de datos no agrupados
4.- El director del programa de investigaciones científicas de la Universidad Estatal tiene 16 solicitudes para su admisión en el próximo año. Las calificaciones de la prueba de los solicitantes es:
27 26
27 28
27 26
28 28
27 31
25 30
25 26
28 26
Halle: la calificación promedio, la mediana y la moda, para este conjunto de datos no agrupados
5.- Los siguientes datos representan las calificaciones obtenidas en un examen de estadística en una clase de 40 estudiantes. Halle: la calificación promedio, la mediana y la moda, para este conjunto de datos no agrupados
2 5
3 5
40
3 6
3 6
3 6
3 6
4 6
4 6
Ing. Wilson A. Velastegui. Ojeda. Msc
4 6
4 6
4 7
5 7
5 7
5 7
Estadística Descriptiva
7
7
8
8
8
8
9
9
9
9
10
10
6.- a) Determine la media aritmética de los siguientes valores muestrales 5, 9, 4, 10 4
b) Demuestre que ( x x) 0 i 1
7.- Determine el salario medio por hora pagado a carpinteros que obtuvieron los siguientes pagos por hora: $ 15.40, $ 20.10, $ 18.75, $ 22.76, $ 30.67, $ 18.00
8.- Cual sería el valor modal que reportaría para un conjunto de observaciones si hay un total de: a) 10 observaciones y no hay dos valores iguales b) 6 observaciones y todos son iguales c) 6 observaciones y los valores son 1, 2, 3, 3, 4 y 4
Para los ejercicios 9 al 11,
a) determine la mediana, y b) la moda
9.- Los siguientes datos representa el número de cambios de aceite para los últimos siete días en el taller denominado Auto – car, localizado en la esquina de la calle Alvarado y Luz E. Borja
41
15
39
54
31
15
33
10.- Los siguientes datos muestrales representan el cambio en porcentaje para el ingreso neto del 2002 al 2003, en el caso de 12 compañías de construcción
5
1
- 10
-6
5
12
7
8
2
5
-1
11
11.- A continuación se presentan la edad de 10 personas en la tienda de videos en el centro de la ciudad de Riobamba
12
41
8
17
6
11
14
Ing. Wilson A. Velastegui. Ojeda. Msc
8
17
10
8
Estadística Descriptiva
CUARTA UNIDAD: MEDIDAS DE DISPERSIÓN “No dejes que lo que no puedes hacer, interfiera con lo que puedes hacer” (Autor Desconocido)
OBJETIVOS: Al término de esta unidad el estudiante estará en capacidad de:
Determinar la varianza, la desviación típica o estándar, la desviación media y la desviación mediana de datos no agrupados y agrupados. Determinar la asimetría, el sesgo de la curva de distribución “curtosis”.
DESARROLLO DE CONTENIDOS 1.- MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Y AGRUPADOS La dispersión se refiere a la variabilidad o amplitud los datos dentro de un conjunto del cual se este investigando.
Las medidas de dispersión o variabilidad se refieren a la dispersión o distanciamiento de los datos con respecto a su media. Las más importantes son: varianza (S2), la desviación típica o estándar (S), La desviación media (Dm), la desviación mediana (DMdn), los cuartiles, deciles y percentiles
2.- VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS 2.1.- VARIANZA PARA DATOS NO AGRUPADOS La varianza para datos no agrupados está dada por la siguiente fórmula:
2 2 2 2 x1 x x 2 x ..... x n x 2 i 1 S n
xx n 1
n
S2
42
2 x nx
i 1
n 1
n 1
2
(Método abreviado)
Ing. Wilson A. Velastegui. Ojeda. Msc
n
xx
2
i 1
Estadística Descriptiva
= Suma de la diferencia de cada valor del conjunto de datos menos la media aritmética elevado al cuadrado.
n – 1 = número de datos de la observación menos uno. Ejemplo: Dado el siguiente conjunto de datos no agrupados halle la varianza
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100
100
101
101
103
103
103
104
105
105
106
107
107
107
109
110
110
111
La media aritmética es:
x 97.9
donde
40
2 2 2 2 ( x x) (82 97.9) (86 97.9) ......... (111 97.9) = 2379, 61
i 1
Por lo tanto la varianza es 40
S 2
( x x)
i 1
401
2
2370,61 = 61. 015 39
2.2.- DESVIACIÓN ESTÁNDAR PARA DATOS NO AGRUPADOS DEFINICIÓN.- La raíz cuadrada más la varianza recibe el nombre de Desviación estándar
Del ejemplo anterior tenemos que la varianza es: S2 = 61.015
Desviación Estándar: S =
61.015 7.81 = 7.81
3.- VARIANZA Y DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS
3.1.- VARIANZA PARA DATOS AGRUPADOS.- en fórmula esta dado por:
43
Ing. Wilson A. Velastegui. Ojeda. Msc
k
f xc x
i 1
S2
Estadística Descriptiva
2
=
n 1
f1 x c x
2 f 2 xc x2 ..... f k xc x2 n 1
Ejemplo: Dado el siguiente conjunto de datos agrupados halle la varianza
Li – Ls
Punto Medio
fi X c
xc x
f i xc x
2
xc
f
82 – 86
84
3
252
13.75
567.1875
87 – 91
89
7
623
8,75
535.9375
92 – 96
94
8
752
3.75
112.5000
97 – 101
99
8
792
1.25
12.5000
102 – 106
104
7
728
6.25
273.4375
107 – 111
109
7
763
11.25
885.9375
n = 40
3910
TOTAL
6
f i xc x
i 1
2 2387.5
K
x
f i Xc
i 1
n 6
S
2
3910 97.75 luego la varianza es: 40
fi x x
i 1
n1
2
2387 .5 39
= 61.2179
3.2.- DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS.- La raíz cuadrada de la varianza recibe el nombre de Desviación estándar, en fórmula esta dado por:
k
S=
fi ( Xc X )
i 1
n1
2
f1 x c x
2 f 2 xc x2 ... f k xc x2 n 1
Del ejemplo anterior la varianza es: S2 = 61.2179 por consiguiente la desviación estándar es
S 61.2179 S = 7.824
44
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
4.- DESVIACIÓN MEDIA PARA DATOS NO AGRUPADOS
La desviación media para datos no agrupados está dada por:
n
xi x
Dm = i 1
n
Dm = Desviación media x i x = valor absoluto de la diferencia entre cada dato de la muestra y la media.
n
= Número de datos.
Ejemplo: Del siguiente conjunto da datos: Hallar la desviación media (D.m)
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100
100
101
101
103
103
103
104
105
105
106
107
107
107
109
110
110
111
x
82 85 86 ..... 110 111 97.9 40
n
xi x 82 97.9 85 97.9 86 97.9 ..... 110 97.9 111 97.9
i 1 n
xi x 15.9 12.9 11.9 ..... 12.1 13.1
i 1 n
xi x = 15.9 + 12.9 + 11.9 + …..+ 12.1 + 13.1 = 264.2
i 1
Por lo tanto: la desviación media es: n
xi x
Dm=
i 1
n
=
264.2 40
= 6. 605 = 6.61
5.- DESVIACIÓN MEDIANA PARA DATOS NO AGRUPADOS
45
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
La fórmula de la desviación mediana para datos no agrupados en fórmula esta dado por n
xi Mdn
i 1
D Mdn=
n
x1 Mdn x 2 Mdn ..... x n Mdn n
Ejemplo: Del mismo conjunto anterior hallamos la desviación mediana, Donde n 1 40 1 41 = = 20,5 esta entre el elemento 20 y 21 2 2 2
La posición: Mdn =
El elemento 20 es 98 y el elemento 21 es 99, el verdadero valor de la mediana es:
98 99 = 98.5 2
D Mdn =
n
xi Mdn
D Mdn=
i 1
n
hallamos el valor de la desviación mediana
82 98.5 85 98.5 .... 110 98.5 111 98.5 40
= 5.92
6.- DESVIACION MEDIA PARA DATOS AGRUPADOS
La desviación media para datos agrupados esta dado por la siguiente fórmula:
f i xc x
Dm=
n
f1 x c x ..... f k x c x n
Donde fi = es la frecuencia de cada clase
xc x = es la diferencia entre la marca de clase (punto medio) y la media. Ejemplo: De la siguiente tabla de datos agrupados calcular la desviación media.
Li – Ls
Punto Medio xc
82 – 86 87 – 91 92 – 96 97 – 101 102 – 106 107 – 111 TOTAL
84 89 94 99 104 109
fi X c
f 3 7 8 8 7 7 n = 40
252 623 752 792 728 763 3910
xc x
f i xc x
13.75 8.75 3.75 1.25 6.25 11.25
3(13.75) = 41.25 7(8.75) = 61.25 8 ( 3.75) = 30.00 8 (1.25) = 10.00 7 ( 6.25) = 43.75 7 (11.25) = 78.75
6
Ing. Wilson A. Velastegui. Ojeda. Msc
f i xc x 265
i 1
46
Fa * 3 10 18 26 33 40
Estadística Descriptiva
f i xc x
K
x
f i Xc
i 1
N
3910 40
97.75
la desviación media es D m =
n
=
265 = 6.625 40
6.- DESVIACIÓN MEDIANA PARA DATOS AGRUPADOS
La fórmula de la desviación mediana para datos no agrupados en fórmula esta dado por k
f i x c Mdn
D Mdn =
i 1
n
f ( x Mdn) f 2 ( x c Mdn) ..... f k ( x c Mdn) 1 c n
Ejemplo: De la tabla anterior de datos agrupados calcular la desviación mediana.
NOTA: La clave primero esta en dividir el número total de datos para dos, esto es: n 40 = 20 2 2 .Li = 96,5
este valor se encuentra en la clase 3 o el intervalo 97 – 101
f a i = 18
C = 106 – 101 = 5
fm = 8
Con estos datos hallamos la mediana Mdn 96,5
2018 (5) 96,5 2 (5) 96,5 10 96,5 1,25 = 97.75 8 8
8
Aquí la mediana es igual a la media aritmética por lo que la desviación media es también igual a la desviación mediana esto es: k
f i xc Mdn
D Mdn =
i 1
n
=
265 = 6.625 40
OSERVACIÓN: No siempre va a ser igual la desviación media con mediana en los demás problemas.
47
Ing. Wilson A. Velastegui. Ojeda. Msc
la desviación
Estadística Descriptiva
ACTIVIDAD DE APRENDIZAJE No. 4 Para los problemas del 1 al 5 calcule: a) la varianza, b) la desviación típica o estándar, c) la desviación media y la desviación mediana, todos representan datos muestrales.
1.- Una muestra de archivos personales de 10 empleadas del Hospital General indicó que, durante un período de de seis meses, no asistieron el siguiente número de días por enfermedad: 6, 3, 0, 2 10, 2, 1, 4, 12, 7
2.- Cinco representantes de servicio al cliente de la empresa Electro Sony, que trabajaron el último viernes, vendieron respectivamente 10, 8, 4, 3, 5, 6, 8 y 2 videograbadoras (VCR)
3.- El departamento de Estadística del INEC de la ciudad de Riobamba ofrece ocho cursos de Estadística Básica. Los siguientes datos son el número de estudiantes inscritos en tales cursos: 46, 52, 34, 28, 29, 41, 38 y 36
4.- Los siguientes datos representan las calificaciones obtenidas en la clase de Estadística 80, 83, 87, 85, 90, 86, 84, 82, 88
5.- El número de horas trabajadas por Angélica en los últimos meses fueron 52, 48, 37, 54, 48, 15, 42, 12
Para los problemas del 1 al 2 que representan datos agrupados calcule: a) la varianza, b) la desviación típica o estándar, c) la desviación media, y la desviación mediana, todos representan datos muestrales.
1.- La siguiente tabla representa el número de días al año en que los empleados de una empresa manufacturera estuvieron ausentes del trabajo debido a una enfermedad. Además responda a las siguientes preguntas: a) ¿Cuántos empleados estuvieron ausentes menos de tres días al año? b) ¿Cuántos lo estuvieron ausentes menos de seis días debido a la enfermedad?
48
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Número de inasistentes 0 a 3 3 a 6 6 a 9 9 a 12 12 a 15 Total
f 5 12 23 8 8 n = 50
2.- El contador en jefe de la empresa XX quiere preparar un informe acerca de las cuentas por cobrar de la compañía. A continuación se presenta una distribución de frecuencias que muestra la cantidad sobresaliente.
Cantidad 0 a 2 000 2 000 a 4 000 4 000 a 6 000 6 000 a 8 000 8 000 a 10000 10 000 a 12 000 Total
f 4 15 18 10 4 3 n = 54
5.- CUARTILES, DECILES Y PERCENTILES, PARA DATOS NO AGRUPADOS Los cuartiles, deciles y percentiles se asemejan mucho a la mediana porque también subdividen una distribución de mediciones de acuerdo con la proporción de frecuencias observadas.
Mientras la mediana divide un conjunto de datos en dos mitades, los cuartiles la dividen en 4 partes, los deciles la dividen en 10 partes y los percentiles la dividen en 100 partes. Para los datos no agrupados, las fórmulas que se emplean son las siguientes:
CUARTILES: Primero: Q1 = (N/4) + (1/2)
Segundo: Q2 = (2N/4) +(172)
Tercer: Q3 = (3N/4) + (1/2).
DECILES
Primero: (N/10) + (1/2) = D1
Segundo: (2N/10) + (1/2) = D2
Tercero: (3N/10) + (1/2) = D3
Cuarto: (4N/10) + (1/2) = D4
Quinto: (5N/10) + (1/2) = D5
Sexto: (6N/10) + (1/2) = D6
49
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Séptima: (7N/10) + (1/2) = D7
Octavo: (8N/10) + (1/2) = D8
Noveno: (9N/10) + (1/2) = D9 PERCENTILES Primero: P1 = (N/100) + (1/2)
Segundo: P2 = ( 2N/100) +(1/2)
……………………………………………………………………………………………… Diez P10 = ( 10N/100) +(1/2)
Setenta = P70 = ( 70N/100) +(1/2)
Ochenta = P80 = ( 80N/100) +(1/2)
Noventa = P90 = ( 90N/100) +(1/2)
Ejemplo: Del siguiente conjunto de datos hallar, los cuartiles, el decil segundo y decil noveno, además hallar los percentiles décimo, veinticinco avo, setenta y cinco avo (75) y noventa avo.
82
85
86
87
87
89
89
90
91
91
92
93
94
95
95
95
95
95
97
98
99
99
100
100
101
101
103
103
103
104
105
105
106
107
107
107
109
110
110
111
En este problema el número de datos es n = 40 CUARTILES Q1 =
Q1 = (n/4) +(1/2) = (40/4) + (1/2) = 10 +0.5;
91 92 183 = 91.5 2 2
Q2= (2(40)/4) +(1/2) = 20+ 0.5 = 20.5
Q2 =
98 99 197 = 98.5 2 2
Q3 = (3(40)/4) +(1/2) = 30+0.5 = 30.5
Q3 =
104 105 209 = 104.5 2 2
DECILES D1 = (2(40)/10) +(1/2) = 8+0.5 = 8.5
D1 =
D9 = (9(40)/10) +(1/2) = 36+0.5 = 36.5
D9 =
90 91 181 = 90.5 2 2 107 109 206 = 108.5 2 2
PERCENTILES P10= (10(40)/100) +(1/2) = 4+0.5 = 4.5
50
P10 =
Ing. Wilson A. Velastegui. Ojeda. Msc
87 87 174 = 74 2 2
P25 = (25(40)/100) +(1/2) = 10+0.5 = 10.5
P25
Estadística Descriptiva 91 92 183 = = 91.5 2 2
P75 = (75(40)/100) +(1/2) = 30 + 0.5 = 30.5 P75 = P90 = (90(40)/100) +(1/2) = 36+0.5 = 36.5 P90 =
104 105 209 = 104.5 2 2
107 109 216 = 108 2 2
De todas estas medidas los más utilizados son los Percentiles:
DEFINICIÓN: Se llama recorrido intercuantil a la diferencia entre los percentiles 75 avo. Y 25 avo. En formula es: Recorrido intercuantil = P75 – P25
Del ejemplo anterior tenemos:
Recorrido intercuantil = P75 – P25 = 104.5 – 91.5 = 13
DEFINCIÓN: Se llama recorrido interdecil a la diferencia entre los percentiles 90avo. Y 10 avo. En fórmula es: Recorrido interdecil = P90 – P10.
Del ejemplo anterior tenemos:
Recorrido interdecil = P90 - P10 = 108 – 87 = 21
6.- CUARTILES, DECILES Y PERCENTILES PARA DATOS AGRUPADOS
Para hallar los cuartiles, deciles y percentiles de datos agrupados, basta recordar la fórmula de la mediana para datos agrupados.
Mdn Li [ N / 2f(m f )i ] C
Esto Es:
Por lo tanto las formulas para los Cuartiles, deciles y percentiles son:
CUARTILES:
( f ) i Q1 Li N / 4f cuartil .C
( f ) i Q2 Li 2 N /f4cuartil .C
( f ) i Q3 Li 3 N /f4cuartil .C
DECILES ( f ) i D1 Li N / 10f decil .C
51
( f ) i D5 Li 5 N / 10f decil .C
Ing. Wilson A. Velastegui. Ojeda. Msc
( f ) i D8 Li 8 N / 10f decil .C
D9 Li
9 N / 10( f ) i f decil
Estadística Descriptiva
.C PERCENTILES
Dentro de los percentiles los más utilizados son:
( f ) i P10 Li N / 10 .C f percentil
10( f ) i P25 Li 25N f/percentil .C
10( f ) i P75 Li 75N f/percentil .C
10( f ) i P90 Li 90N f/percentil .C
Así tenemos lo siguiente:
Recorrido intercuantil = P75 – P25 Recorrido interdecil = P90 – P10.
Ejemplo: De la siguiente tabla determinar, el recorrido intercuantil y el recorrido interdecil
clase
LIMITE DE CLASE
FRECDUENCIA fi
1
82 – 86
3
3
2
87 – 91
7
110
3
92 – 96
8
18
4
97 – 101
8
26
5
102 – 106
7
33
6
107 – 111
7
40
Total
( f ) i P10 Li 10N F/ 100 .C percentil
52
FRECUENCIA ACUMULADA
n =40
( f ) i P25 Li 25N F/ 100 .C percentil
Ing. Wilson A. Velastegui. Ojeda. Msc
10n 10(40) 400 4 (2da clase) 100 100 100
Estadística Descriptiva 25n 25(40) 1000 10 (2da clase) 100 100 100
Li= 87; ( f)i = 3; f= 7; C=5
Li= 87; ( f)i = 3; f= 7; C=5
P 10 = 87 + (4-3/7) 5
P 25 = 87 + (10-3/7) 5
P10 = 87 + (1/7) 5= 87+0.71
P25 = 87 + (7/7) 5 = 87+5
P10 = 87.71
P25 = 92
( f ) i P90 Li 90N F/ 100 .C percentil
( f ) i P10 Li 10N F/ 100 .C percentil
90N = 3600=36 (6ta clase).
75N = 3000=30 (5ta clase).
100
100
Li= 107; ( f)i = 33; f= 7.
Li= 102; ( f)i = 26; f= 7.
P 90 = 107+
P 75 = 102+ (30-26/7) 5
(36-33/7) 5
P90 = 107 + (3/7) 5= 107+2.14
P75 = 102+ (4/7) 5= 102+2.85
P90 = 109.14
P75 = 104.86
Recorrido intercuantil = P75 – P25 = 104.86 – 92 = 12.86 13 Recorrido interdecil = P90 – P10 = 109.14 – 87.71 = 21.43
EJERCICIO1: Dado el siguiente conjunto de datos no agrupados (20 datos)
Datos no ordenados
Datos ordenados
40.2
29.3
35.6
88.2
42.9
25.1
29.3
35.6
40.2
50.6
26.9
28.7
99.8
35.6
37.8
25.4
31.7
36.8
42.9
55.2
44.2
32.3
55.2
50.6
25.4
26.9
32.3
37.8
44.2
88.2
31.7
36.8
45.2
25.1
39.7
28.7
35.6
39.7
45.2
99.8
53
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Calcular: el recorrido intercuantil y recorrido interdecil
P10= [10(20)/100 + 0.5 = 2 + 0.5 = 2.5;
está entre el elemento 2 y 5 de los datos ordenados
P10= (25.4 + 26.9)/2 = 52.3/2 = 26.15
P25 = (29.3 + 31.7)/ 2 = 61/ 2 = 30.5
P75 = [75(20)/100) + 0.5 = 15 + 0.5 = 15.5;
está entre el elemento 15 y 16
P75 = (44.2 + 45.2 / 2 = 89.4 /2 = 44.7
P90 = [90(20)/100) + 0.5 = 18+0.5 = 18.5;
está entre el elemento 18 y 19
P90 = (88.2 + 55.2)/ 2 = 134.4/2 = 71.7
Recorrido intercuantil = P75 – P25 = 44.7 – 30.5 = 14.2
= P90 – P10 = 71.7 – 26.15 = 45.55
Recorrido interdecil
EJERCICIO 2: Los siguientes datos agrupados representan los pagos por almacenamiento para los 50 más grandes detallistas durante el año 2003. Hallar, la media, mediana, moda, la varianza y la desviación típica f
Xc
fA
Fi Xc
Li – Ls 1.10 - 1.86 1.87 - 2.63 2.64 - 3.40 3.41 - 4.17 4.18 - 4.94 4.95 - 5.71 5.72 - 6.48 6.49 - 7.25
4 14 11 9 7 1 2 2
1.48 2.25 3.02 3.79 4.56 5.33 6.10 6.87
4 18 29 38 45 46 48 50
5.92 31.5 33.22 34.11 31.92 5.33 12.20 13.74
Total
n=50
Xc - X F1(Xc- X) (Xc- X)2 F1(Xc - X)2 1.88 1.11 0.34 0.43 1.20 1.79 2.76 3.51
167.94
7.52 15.54 3.74 3.87 8.40 1.97 5.48 7.02
3.176 1.024 0.059 0.276 1.684 4.277 8.139 13.017
12.704 14.336 .649 2.511 11.788 4.277 16.278 26.034
53.54
88.577
8
X
FI Xc
I 1
n
16750.99 3.36
n/2 = 50/2= 25
está en la tercera clase 8
Li = 2.635
(
f )i 18; i 1
54
Ing. Wilson A. Velastegui. Ojeda. Msc
fm=11
Estadística Descriptiva
C= 5.72 – 4.95 = 0.77
Mdn Li
8 f ) y N / 2i 1 fm
Mdn= = 2.635 + (25 –18)/11 (0.77) = 2.635 + (0.636)(0.77) = 2.635 + 0.49 = 3.125
Mo Li d1d1d 2 C
La moda
d1 = 14 – 4 = 10 Mdn 1.865
d2 = 14 – 11 = 3
Li = 1.865
10 7.7 (0.77) 1.865 1.865 0.5923 = 2.4573 = 2.46 10 3 13
la desviación media 8
Dm
*
f1 ( Xc x)
i 1
n
La varianza 8
S 2
*
5350.54 = 1.0708
f1 ( Xc x )
i 1
2
.577 = 1, 80769 = 1.81 8849
n 1
La desviación típica o estándar
8
S
fi ( Xc X )
i 1
n1
2
1.808 = 1.344 = 1.34
OBSERVACIÓN: Otros autores al límite inferior pueden tomar el mismo valor es decir Li = 2.64 y no restar 0.001, en nuestro caso: Li = 2.64 – 0.001 =2.635
7.- FORMA DE DISTRIBUCION DE FRECUENCIA La forma de la distribución sobre conjuntos que tienen una sola moda (unimodales) se refiere a: Su simetría o falta de ella (asimetría)
55
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
La curtosis (la agudeza de su punta).
SIMETRIA.- Una distribución se dice que es simétrica cuando la media, mediana y la moda son iguales, es decir X = Mdn = Mo
Donde su asimetría es igual a cero. Se dice que una distribución esta sesgada positivamente, si la cola derecha es más larga que la cola izquierda X > Mdn > Mo
Se dice que una distribución esta sesgada negativamente si la cola izquierda es más larga que la cola derecha Mo > Mdn > X
Esto se puede visualizar mediante el siguiente gráfico
La asimetría (Sk) puede medirse por el coeficiente de simetría de Pearson
Sk = 3(u – med)
56
para poblaciones
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Sk = 3(X – med)
para muestras.
SP La asimetría puede medirse también por el tercer momento respecto a la media y se puede hallar también mediante las siguientes fórmulas: k
Sk
ni ( x )3 i 1
3
para poblaciones
k
Sk
fii ( x x )3 i 1 s3
para muestras.
Donde, u3 es el tercer momento central; Si u3 < 0, se dice que la distribución es asimétrica negativamente Si u3 > 0, se dice que la distribución es asimétrica positivamente Si u3 = 0, se dice que la distribución es simétrica.
CURTOSIUS.- La curtosis estudia la puntiagudez de la curva Una curva de punta aguda se llama leptocúrtica. Una curva de punta atachada se llama platircúrtica
Una curva que se encuentra entre la leptocúrtica y platicúrtica se llama mesocúrita (ver fig.)
La curtosis puede medirse por el cuarto momento respecto a la media dividido por la desviación estándar elevada a la cuarta potencia. Es fórmula es: k
ni ( x )4 i 1
Sk
4
para poblaciones
k
Sk
fii ( x x )4 i 1 s4
para muestras.
Donde, u2 es el cuarto momento central La curtosis para una curva leptocúrtica >3 La curtosis para una curva mesocúrtica = 3 La curtosis para una curva platicúrtica < 3
57
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Coeficiente de Pearson: P
3( x Mdn) 5
Si P < 0, los datos están sugados a la izquierda Si P > 0, los datos están sugados a la derecha Si P = 0, los datos están distribuidos normalmente.
TEOREMA DE CHEBYSHEY: Afirma que al menos un dato (observaciones) de un conjunto se encuentra en 1 k12 , k 1yK desviación típica de la media.
Coeficiente de variación: Mide el grado de dispersión de un conjunto de datos en relación con su media.
CV 5x (100)
58
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
POS - TEST
INSTRUCCIÓN: Señale con una (x) la(s) alternativa(s) verdadera(s) que correspondan a cada pregunta.
1.- Las medidas de tendencia central son valores: a) Que ocupan el centro de una serie ordenada b) Con los cuales se separan los datos con respecto a su media. c) Hacia los cuales tienden a acercase o alejarse los demás valores de la serie. d) Que resultan de multiplicar las desviaciones para el número de casos.
2.- La media aritmética es el valor promedio que resulta de: a) Multiplicar la sumatoria de valores por el número total de casos. b) Dividir la suma de las desviaciones para el número de casos. c) Dividir un conjunto de valores para el número total de los mismos. d) Ninguna de las proposiciones anteriores.
3.- La fórmula X
fX c N
se la utiliza para hallar la media aritmética de:
a) Una serie estadística
b) Una serie estadística de intervalo
c) Una serie estadística de frecuencia
d) Datos agrupados
4.- La mediana de la siguiente serie de datos: 19, 15, 18, 16, 17 es: a) 18
b) 17
c) 16
d) Ninguno de los valores anteriores.
5.- La fórmula Mdn
N 2
se la utiliza para:
a) Determinar el valor de la mediana
59
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
b) Encontrar el valor que más se repite en la serie c) Determinar la posición de la mediana d) Encontrar el valor de la mediana de una serie estadística
6.- Señale cual de las siguiente medidas individuales es equivalente a la mediana. a) El percentil 25
b) El segundo cuartil
c) El cuarto decil
d) Ninguna de las anteriores
7.- El modo de la siguiente serie estadística es:
X 145 144 143 142 141 Total a) 14.5
f 12 10 15 14 9 n = 46
b) 15
c) 143
d) Ninguna de las anteriores
8.- Señale cuál de las siguientes proposiciones es verdadera a) La media geométrica es la raíz cuadrada del producto de los valores de la variable b) La media geométrica es el valor recíproco de la media aritmética. c) El modo es el valor que se presenta con más frecuencia en el conjunto d) Ninguna de las anteriores
9.- La media geométrica se la puede aplicar para: a) Hallar en economía el costo promedio b) Obtener un promedio exacto de una progresión geométrica c) Para calcular la desviación típica d) Hallar promedios de velocidades
10.- Identifique cuál de las siguientes medidas son de dispersión
60
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
a) Modo
b) Varianza
c) Mediana
d) Desviación típica
PRUEBA DE ENSAYO
INSTRUCCIONES: Esta prueba consta de seis problemas en las cuales es preciso que escriba todo el procedimiento 1.- Determine la media aritmética y desviación media de la siguiente serie estadística X 66 – 70 61 – 65 56 – 60 51 – 55 46 – 50 Total
f 16 20 12 22 10 n = 80
2.- Si la edad de los profesores de un colegio es la que está en la siguiente tabla: Calcular la mediana: X 26 – 30 31 – 35 36 – 40 41 – 45 46 – 50 51 – 55 Total
f 25 32 24 15 10 9 n = 115
3.- Determine la desviación media de la siguiente tabla ordenada pero no agrupada
Peso en KG. 60 61 62 63 64 65 Total
61
Ing. Wilson A. Velastegui. Ojeda. Msc
f 5 8 12 25 16 4 n = 70
Estadística Descriptiva
4.- Determine la desviación típica de la serie estadística que se encuentra registrada en el siguiente cuadro estadístico Descendente
Ascendente
EDADES f EDADES f 51 – 57 12 16 – 22 10 44 – 50 21 23 – 29 14 37 – 43 35 30 – 36 26 30 – 36 26 37 – 43 35 23 – 29 14 44 – 50 21 16 – 25 10 51 – 57 12 Total n=118 Total n = 118 5.- En la siguiente serie estadística de intervalos: Determine. El promedio, la mediana y la moda, para este conjunto de datos agrupados
x 120 – 125 114 – 119 108 – 113 102 – 107 96 – 101 90 – 95 Total
F 5 7 10 9 15 4 n = 50
6.- De Ia tabla siguiente: Determine. El promedio, la mediana y la moda, para este conjunto de datos agrupados. Li – Ls 19,2 – 19,4 19,5 – 19,7 19,8 – 20,0 20,1 – 20,3 20,4 – 20,6 20,7 – 20,9 TOTAL
f 1 2 8 4 3 2 n = 20
7.- Si la media aritmética es 7 y la varianza es 20, de los datos, X1, X2, X3,…..,Xn. Calcular la media aritmética de las X 12 , X 22 , X 32 ,..........., X n2 .
Rpta. 69
SUGERENCIA: Utilice las siguientes expresiones. n
Xi
X i 1 n
2 2 2 2 x1 x x 2 x ..... x n x 2 i 1 S n
x x 2 x3 ..... x n 1 n
xx n
n
8.- Dos marcas competidoras de calzado para corredores se sometieron a una prueba para comprobar el desgaste del calzado. Cada una de ellas indicó el siguiente número de horas de uso necesarios para que se detecte un desgaste significativo.
62
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
Marca A 97 83 75 82 98 65 75 n=7
Marca B 78 56 87 54 89 65 n=6
a) ¿Qué calzado parece presentar menor desgaste? b) ¿Qué calzado parece tener el programa de control de calidad que produce u8n desgaste más uniforme?
63
Ing. Wilson A. Velastegui. Ojeda. Msc
Estadística Descriptiva
BIBLIOGRAFIA ALLEN L. WEBSTER: Estadística Aplicada para la Administración y Economía, IRWIN, 1999. ALLISON, D. E. 1970: “Test anxiety, stress y intelligence perfomance” Sxiencia, 2 CONOVER, W. J y otros 1974: “Some reasons for not using the ytes”. DIXON, W. J. Y F. J. MASSER, 1980: Introduction to statical Analysis (4ta. Ed.) Nueva York: McGrawHill. FRENCH, J. W. 1946: “Efects of anxiety on verbl and mathematical examination scores”, Educational and Bychological Mea surement, 22, 553 – 564. BURSTEIN, H. 1971: Ttribute Sampling: Tables and Ex Planations o Tubles for Determinig confidence limits and smple sizes based on close aproximations of the binomial distribution. KENNETH D. HOPKINS y B.R. HOPKINS: Estadística Básica. México 1997 Ingramex. GEORGE CANAYOS: Probabilidades y Estadística. México 1992. McGrawHill MASON/LIND/MARCHAL: 10ª Edición: Estadística para Administración y Economía 2003
64
Ing. Wilson A. Velastegui. Ojeda. Msc