ESTADÍSTICA DESCRIPTIVA
CONTENIDO
1.
Pág. RECOLECCIÓN Y PRESENTACIÓN DE DATOS Y MEDIDAS ESTADÍSTICAS 1
1.1.
DEFINICIÓN DE ESTADÍSTICA
1
1.2.
CLASIFICACIÓN DE LA ESTADÍSTICA
1
1.3.
TÉRMINOS DE ESTADÍSTICA
1
1.4.
RECOLECCIÓN DE DATOS
4
1.5.
DISTRIBUCIÓN DE FRECUENCIAS: DEFINICIÓN Y CLASIFICACIÓN
7
1.6.
GRÁFICOS ESTADÍSTICOS
23
2.1.
MEDIDAS ESTADÍSTICAS
41
2.2.
MEDIDAS DE TENDENCIA CENTRAL
42
3.1.
MEDIDAS DE DISPERSIÓN
56
3.2.
MEDIDAS DE FORMA
74
4.1.
EXPERIMENTO
86
4.2.
ESPACIO MUESTRAL
86
4.3.
EVENTOS
87
4.4.
OPERACIONES CON EVENTOS
90
4.5.
EVENTOS MUTUAMENTE EXCLUYENTES Y COLECTIVAMENTE
92
EXHAUSTIVOS 4.6.
PROPIEDADES DE LAS OPERACIONES CON EVENTOS
92
4.7.
PROBABILIDAD Y ENFOQUES DE PROBABILIDAD
94
4.8.
REGLAS DE PROBABILIDAD
98
4.9.
PROBABILIDAD CONDICIONAL
100
4.10. TABLAS DE PROBABILIDAD
112
ESTADÍSTICA DESCRIPTIVA descriptiva
CAPITULO I RECOLECCIÓN Y PRESENTACIÓN DE DATOS 1.1.
DEFINICIÓN DE ESTADÍSTICA
La estadística es una ciencia que proporciona un conjunto métodos y técnicas que se utilizan para recolectar, organizar, presentar, analizar e interpretar el comportamiento de los datos con respecto a una característica materia de estudio e investigación con la finalidad de obtener conclusiones válidas y tomar decisiones razonables de acuerdo a tales análisis. 1.2.
CLASIFICACIÓN DE LA ESTADÍSTICA
La Estadística se clasifica en dos grandes áreas: Estadística Descriptiva y Estadística Inferencial. a) Estadística descriptiva: Parte de la estadística que analiza y describe un conjunto de datos de una muestra o de una población sin sacar conclusiones de tipo general.
Recolección
Organización
Cuadros
Análisis Descriptivo
Presentación Gráficos
b) Estadística inferencial: Parte de la Estadística que infiere o induce leyes de comportamiento para una población a través de una muestra aleatoria seleccionada de dicha población.
Población (N)
Muestreo
Muestra (n)
Estadística Inferencial
1
ESTADÍSTICA DESCRIPTIVA descriptiva
1.3. TÉRMINOS DE ESTADÍSTICA Considerando que existe un conjunto de términos que se usan frecuentemente en estadística conviene precisar el significado de algunos de ellos. 1.3.1. POBLACIÓN (N) Es el conjunto de todos los individuos objetos u observaciones que poseen alguna característica observable común. Ejemplo 1: La población de estudiantes de la Escuela de Contabilidad de la Universidad Los Ángeles de Chimbote Una población puede clasificarse como finita o infinita.
●
Población finita: Es aquella que tiene un número limitado de elementos.
Ejemplo 2: Las edades de todos los estudiantes de la Universidad Los Ángeles de Chimbote.
●
Población infinita: Es aquella que tiene un número ilimitado de elementos.
Ejemplo 3: El número de unidades producidas en un proceso de producción continúo. 1.3.2. MUESTRA (n) Es una parte o un subconjunto representativo de la población y al proceso de obtener la muestra se llama muestreo. La selección y el estudio de la muestra, tiene por objeto la extracción de conclusiones que sean válidas para la población de la cual se obtuvo dicha muestra. Ejemplo 4: Estudio de una muestra aleatoria de 200 estudiantes de la Escuela de Contabilidad de la ULADECH según su nivel socio económico 1.3.3. VARIABLES Es una característica de la población que se va investigar y puede tomar diferentes valores. 2
ESTADÍSTICA DESCRIPTIVA descriptiva
Las variables se clasifican en: cuantitativas y cualitativas: Variables cuantitativas: Cuando el valor de la variable es de carácter numérico. Las variables cuantitativas pueden ser discretas y continúas. a.1)
Variable cuantitativa discreta: Cuando el valor de la variable está
representado solo por números enteros (positivos). Ejemplo 5: X: número de hijos a.2)
Variable cuantitativa continua: cuando el valor de la variable puede
tomar cualquier valor dentro de un rango dado, por tanto se expresa por cualquier número real. Ejemplo 6: X: Precio en soles b)
Variable cualitativa: Cuando expresan una cualidad, o atributo, tienen
carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico. La variable cualitativa puede ser: nominal u ordinal. b.1)
Variable cualitativa nominal: Son aquellas que establecen la distinción de
los elementos en las categorías sin implicar orden entre ellas. Ejemplo 7: X: Sexo: Masculino, Femenino. b.2)
Variable cualitativa ordinal: Son aquellas que agrupan a los objetos,
individuos, en categorías ordenadas, para establecer relaciones comparativas. Ejemplo 8: Y: Nivel de pobreza: No pobre, pobre, muy pobre, extremadamente pobre.
3
ESTADÍSTICA DESCRIPTIVA descriptiva
1.3.4. UNIDAD DE OBSERVACIÓN: También se le conoce como unidad estadística o unidad de análisis. Es el elemento u objeto indivisible de la población que será analizado y sobre los cuales se obtendrán los datos. Ejemplo 9: Si se quiere estudiar el rendimiento académico de los alumnos de la Universidad Los Ángeles de Chimbote, la unidad de observación serán los alumnos. 1.3.5. OBSERVACIONES:
A
los
datos
también
se
le
conoce
como
observaciones. Son los valores recopilados como resultado de las observaciones de una variable. 1.3.6. PARÁMETRO: Es un valor obtenido para describir en forma resumida las características pertinentes o más importantes de una población. Ejemplo 10: El sueldo promedio de todos los trabajadores de la Empresa Sider Perú de Chimbote. 1.3.7. ESTADÍGRAFO: También se le conoce como estadístico(a). Es una medida descriptiva de una muestra. El estadígrafo sirve como estimación del parámetro. Ejemplo 11: El sueldo promedio del 25% de los empleados de la Empresa Sider Perú de Chimbote. 1.4. RECOLECCIÓN DE DATOS La recolección o recopilación de datos es el momento en el cual el investigador se pone en contacto con los sujetos, objetos o elementos sometidos a estudio con el propósito de obtener los datos o respuestas de las variables consideradas; a partir de estos datos se prepara la información estadística, se calculará las medidas de resumen e indicadores para el análisis estadístico. 4
ESTADÍSTICA DESCRIPTIVA descriptiva
Para recoger la información se toma en cuenta las siguientes modalidades: Las fuentes de información, los sistemas de recolección y las técnicas de recolección. 1.4.1. Modalidades de Recolección de Datos: 1.4.1.1. Fuentes de información: Es el lugar, la institución o persona donde están los datos que se necesitan para cada una de las variables o aspectos de la investigación. Las fuentes de información pueden ser: a)
Fuentes primarias: Cuando los datos se obtienen directamente de la misma
persona o entidad utilizando ciertas técnicas. Ejemplo 12: Llevar a cabo una encuesta para conocer el grado de satisfacción laboral en los trabajadores de una empresa “X”. b) Fuentes secundarias: Cuando los datos ya han sido elaborados y procesados por otras personas o instituciones. Ejemplo 13: La información estadística que publica el INEI de los diferentes ministerios del Perú. 1.4.1.2. Sistemas de recolección: Son procedimientos que se utilizan para recoger información. Pueden ser: a) Los registros: Son libros, padrones, etc. en donde se anotan en forma regular permanente y obligatoria los hechos ocurridos. Ejemplo 14: Registros Civiles, RENIEC, Registros Públicos, Registros Electrónicos, etc. b) Las encuestas: Son procedimientos de obtención de información estructurada según criterios previos de sistematización que se efectúa con un propósito específico en toda la población o en un sector de ella. 5
ESTADÍSTICA DESCRIPTIVA descriptiva
Pueden ser: b.1) Encuesta censal: Cuando abarca toda la población en estudio. Ejemplo 15: Censos de población y vivienda de una localidad o país. b.2) Encuesta muestral: Cuando abarca una parte de la población en estudio. Ejemplo 16: Llevar a cabo una Encuesta de preferencia electoral. 1.4.1.3. Técnicas de recoleccion Son procedimientos que se utilizan para recolectar información según la observación, naturaleza del trabajo de investigación. Pueden ser: La observación, el cuestionario, la entrevista, test, etc. a) La observación: Es la acción de mirar con rigor, en forma sistemática y profunda, con el interés de descubrir la importancia de aquello que se observa. b) El cuestionario: Es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas, que se formulan al encuestado o entrevistado, con el propósito de obtener datos de las variables consideradas en estudio. c) La entrevista: Es un diálogo entre personas, es una técnica donde una persona llamada
entrevistador,
encuestador o empadronador solicita
al
entrevistado, le proporcione algunos datos e información. d) El test : Pruebas o exámenes con ayuda de un cuestionario o escala que mide determinadas funciones, generalmente cognitivas.
6
CURSO ESTADÍSTICA
1.5. DISTRIBUCIONES DE FRECUENCIAS: DEFINICIÓN Y CLASIFICACIÓN Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y categorías y determinar las frecuencias de las clases, o sea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribución de frecuencias. 1.5.1. DEFINICIÓN: Es un arreglo tabular en donde se presentan a los datos de una muestra o de una población bajo un ordenamiento convencional predeterminado de acuerdo a la característica en estudio. 1.5.1.1.
Partes de una distribución de frecuencias: CÓDIGO TITULO: Deber ser completo y conciso
c o l u m n a m a t r i z
Yi Y1 Y2 Y . . Total Fuente:
fi f1 f2 f3 . . n
Fi F1 F2 F3 . . -
hi h1 h2 h3 . . 1.00
Hi H1 H2 H3 . . -
hi% h1% h2% h3% . . 100
Hi% H1% H2% H3% . . -
Encabezado
Cuerpo del Cuadro
a) Código: Número de identificación. b) Título: Expresa en forma resumida la información que contiene, se coloca en la parte superior de la tabla. El título de un cuadro estadístico debe ser completo y conciso. Se refiere a completo en que debe tener los cuatro elementos fundamentales: población, variable, lugar y tiempo. Se refiere a conciso en que debe ser breve. 7
CURSO ESTADÍSTICA
c) Encabezado: Primera fila del cuadro, explica las categorías y el objeto de cada una de las columnas. d) Columna principal o matriz: Formada por la primera columna y nos indica también las características. e) Cuerpo: Su formación se presenta en filas y columnas. f) Fuente: Se coloca en la parte inferior del cuadro y nos indica el lugar en donde se obtuvieron los datos contenidos en la tabla. 1.2.
Términos elementales para construir una distribución de frecuencias:
a) Clase o intervalo de clase: Son los grupos que se forman con los valores de la variable cuando la variable es cuantitativa discreta (clase) o continua (intervalo de clase). Cuando la variable es cualitativa nominal u ordinal toma el nombre de categoría. b) Frecuencia absoluta: Es el número de veces que se repite un determinado valor de la variable; en el caso de intervalos es el número de observaciones comprendidas en dicho intervalo. Se representa por f i con (i=1,2... m); donde “m” representa el número de valores distintos que toma la variable Y i o el número de intervalos considerados (mn). Asimismo, la suma de las frecuencias absolutas simples es igual al número total de observaciones y se expresa del siguiente modo: m
f 1 f 2 ..... f m f i n i 1
c) Frecuencia relativa: Es el cociente de la frecuencia absoluta de cada clase entre el número total de observaciones. Esta frecuencia se denota por hi con (i=1,2,...m). entonces:
hi
frecuencia absoluta de cada clase f i número total de observaciones n
La frecuencia relativa simple toma valores comprendidos entre 0 y 1, es decir: O hi 1 8
CURSO ESTADÍSTICA
Asi mismo, la suma de las frecuencias relativas simples es igual 1, es decir: m
h1 h2 ... hm hi 1 i 1
d) Frecuencia relativa porcentual: Es la frecuencia relativa multiplicada por 100. Se representa por hi %
y se considera como el porcentaje de observaciones
correspondientes a cada clase. La frecuencia porcentual está comprendida entre 0 y 100. e)
Frecuencia
absoluta
acumulada:
Resulta
de
acumular
o
sumar
sucesivamente las frecuencias absolutas, se representa por Fi . Donde: F 1 = f1 F 2 = f1 + f2 F 3 = f1 + f2 + f3 . . .
Fm = f1 + f2 +… fm=n f) Frecuencia relativa acumulada: Resulta de acumular o sumar sucesivamente las frecuencias relativas se representa por H i . Donde : H1 = h1 H2 = h1 + h2 H3 = h1 + h2 + h3 . . .
Hm = h1 + h2 + h3 +… hm = 1 La frecuencia relativa acumulada toma valores comprendidos entre 0 y 1 es decir:
0 Hi 1
9
CURSO ESTADÍSTICA
g) Frecuencia relativa acumulada aorcentual: Es la frecuencia relativa acumulada multiplicada por 100%. Se representa por H i % y se considera como el porcentaje de observaciones acumuladas hasta cierta clase.
1.5.2. CLASIFICACIÓN DE DISTRIBUCION DE FRECUENCIAS: Las distribuciones de frecuencias se construyen de acuerdo a la variable y su clasificación está dada por: distribuciones de frecuencias en puntos aislados, distribuciones de frecuencias en intervalos de clase y distribuciones de frecuencias por atributos o categorías, tal como se muestra en el siguiente mapa conceptual.
10
CURSO ESTADÍSTICA
1.5.2.1. DISTRIBUCIÓN DE FRECUENCIAS EN PUNTOS AISLADOS Se utiliza cuando la variable es cuantitativa discreta ya que generalmente los valores de la variable son pocos, por lo que puede considerarse cada uno de ellos como una clase.
La distribución de frecuencias absolutas toma la siguiente forma: TABLA N° 1 Distribución de frecuencias absolutas en puntos aislados Valores de la variables Frecuencias absolutas
Yi
fi
Y1 Y2
f1 f2
.
.
.
.
.
.
Ym Total
fm n
La distribución de frecuencias ampliada toma la siguiente forma: TABLA N° 2 Distribución de frecuencias ampliada
Yi
fi
fi
hi
Hi
hi
Hi
Y1 Y2 Y3
f1 f2 f3
F1 F2 F3
h1 h2 h3
H1 H2 H3
.
.
.
.
.
.
.
.
.
.
h1% h2% h3% . . . hm% 100
H1% H2% H3% . . . Hm% -
.
.
.
.
.
Ym Total
fm n
Fm -
hm 1.00
Hm -
Ejemplo 17: Los siguientes datos hipotéticos corresponden a una muestra aleatoria de 30 empresas de la ciudad de Lima según su número de accidentes de trabajo durante el año 2007: 0 3 3 3 4 4 0 2 3 1 2 2 3 1 3 4 1 2 2 2 3 3 2 2 2 3 1 2 2 4
11
CURSO ESTADÍSTICA
La información fue obtenida mediante una encuesta realizada por la Empresa Datum S.A. Se pide: a) Identificar la unidad de observación y la variable en estudio. b) Construir la tabla de conteo. c) Construir una distribución de frecuencias ampliada. d) f3, F3, h3% y H3%. d) Determinar cuantas empresas no han tenido accidentes de trabajo. e) Determinar que porcentaje de empresas han tenido por lo menos 3 accidentes de trabajo. f) Determinar que porcentaje de empresas han tenido a lo más 2 accidentes de trabajo. Solución: a) Unidad de observación: Variable:
Las empresas N° de accidentes de trabajo
b) A continuación le mostraremos como construír la tabla de conteo:
En primer lugar se observa que el número de observaciones es de tamaño 30 (n=30).
En segundo lugar identificamos el número de observación diferentes, m=5. Estos valores son y1=0, y2=1, y3=2, y4=3 y y5=4. Los cuales se ubican (en ese orden) en la primera columna de la tabla N° 3.
Seguidamente contamos el número de empresas con 0, 1, 2, 3 y 4 accidentes de trabajo. Esto se hace utilizando la segunda columna de la tabla N° 3 llamada “conteo”, usando el método de los palotes que consiste en colocar una raya vertical o tarja (/) cada vez que se aparece el valor en cuestión, destacando cada cinco unidades con el fin de facilitar el cómputo final. Finalmente se cuenta el número de palotes, obteniéndose las frecuencias absolutas (fi). En este caso: f1= 2, f2= 4, f3= 11, f4= 9, y f5= 4
12
CURSO ESTADÍSTICA
De esta manera se ha construido tabla de conteo de las 30 empresas segun su número de accidentes de trabajo , tal como se observa en el tabla N° 3: Tabla N° 3 Distribución de empresas según su número de accidentes de trabajo N° de accidentes de N° de trabajo empresas CONTEO Yi fi 0 1 2 3 4 Total
II IIII IIII IIII I IIII IIII IIII
2 4 11 9 4 30
Asi mismo el Cuadro N° 1 muestra una distribución de frecuencias ampliada.
Las frecuencias absolutas (f) se obtienen en el proceso de conteo, que vienen a ser las unidades correspondientes a cada clase.
Las frecuencias acumuladas (F) se obtienen sumando en forma acumulativa las frecuencias absolutas. Así: F 1 = f1 = 2 F 2 = f1 + f2 = 2 + 4 = 6 F3 = f1 + f2 + f3 = 2 + 4 + 11 = 17 F4 = f1 + f2 + f3 + f4 = 2 + 4 + 11 + 9 = 26 F5 = f1 + f2 + f3 + f4 + f5 = 2 + 4 + 11+ 9 + 4 = 30
Las frecuencias relativas se obtienen dividiendo las frecuencias absolutas entre el tamaño de la muestra.
13
CURSO ESTADÍSTICA
h1
f1 2 0.07 n 30
h2
f2 4 0.13 n 30
h3
f3 11 0.37 n 30
h4
f4 9 0.30 n 30
h5
f5 4 0.13 n 30
La suma de las frecuencias relativas es igual a 1: 5
h
i
h1 h 2 h3 h 4 h 5
i
0.07 0.13 0.37 0.30 0.13 1.00
i1
5
h i1
Las frecuencias relativas acumuladas se obtienen sumando en forma acumulativa las frecuencias relativas. Así: H1 h1 0.07 H 2 h1 h 2 0.07 0.13 0.20 H 3 h1 h 2 h 3 0.07 0.13 0.37 0.57 H 4 h1 h 2 h 3 h 4 0.07 0.13 0.37 0.30 0.87 H 5 h1 h 2 h 3 h 4 h 5 0.07 0.13 0.37 0.30 0.13 1.00
Las frecuencias relativas porcentuales se obtienen multiplicando por 100 las frecuencias relativas. Así: h1 % h1 100 0.07 100 7 h 2 % h 2 100 0.13 100 13 h 3 % h 3 100 0.37 100 37 h 4 % h 4 100 0.30 100 30 h 5 % h 5 100 0.13 100 13
Las frecuencias relativas porcentuales acumuladas se obtienen por 100 las frecuencias relativas acumuladas. Así:
14
CURSO ESTADÍSTICA
H1 % H1 100 0.07 100 7 H 2 % H 2 100 0.20 100 20 H 3 % H 3 100 0.57 100 57 H 4 % H 4 100 0.87 100 87 H 5 % H5 100 1.00 100 100 c) CUADRO N° 1 Distribución de empresas según su número de accidentes de trabajo Lima : Año - 2007 N° de accid. N° de Frec. Frec. Frec. Frec. Frec. de trabajo empresas acumulada relativa relativa porcentual porcentual acumulada acumulada Y i
fi
Fi
hi
0 2 2 0.07 1 4 6 0.13 2 11 17 0.37 3 9 26 0.30 4 4 30 0.13 Total 30 1.00 Fuente: Encuesta realizada por la Empresa Datum S.A.
Hi
hi %
Hi%
0.07 0.20 0.57 0.87 1.00 -
7 13 37 30 13 100
7 20 57 87 100 -
b) Interpretación: f3 : 11 empresas han tenido 2 accidentes de trabajo. F3 : 17 empresas han tenido 2 accidentes de trabajo o menos. h3% : El 37 % de las empresas han tenido 2 accidentes de trabajo. H3% : El 57% de las empresas han tenido 2 accidentes de trabajo o menos.
15
CURSO ESTADÍSTICA
1.5.2.2. DISTRIBUCIÓN DE FRECUENCIAS EN INTERVALOS DE CLASE Se utiliza generalmente cuando la variable es cuantitativa continua, aquí los valores de las variables son números por lo que no puede considerarse cada uno de ellos como una clase, lo cual es necesario agruparlos en intervalo de clase. Se siguen los siguientes pasos para su construcción: a)
Determinar el rango (R): Se obtiene restando el valor máximo y el mínimo. Así R = Valor Máximo – Valor Mínimo
b) Determinar el número de intervalos (m): El criterio a seguir para determinar el número de intervalos generalmente del mismo tamaño es que el mismo sea suficientemente pequeño para lograr la simplificación deseada, pero lo suficientemente grande para minimizar los posibles errores de clasificación. Naturalmente, no es conveniente utilizar muchos intervalos de pequeña amplitud ya que en un caso extremo, equivaldría a trabajar con los datos originales. Por otra parte, un número muy reducido de intervalos, significa cierta concentración y la pérdida de información consiguientemente, como ocurriría en otro caso, si se considerase un solo intervalo. Se recomienda: b.1) considerar el número de intervalos entre 5 y 20. 5 m 20 b.2) Utilizar la regla de Sturges para determinar el número de intervalos: m = 1 + 3.33 log n Donde: n es el número de observaciones. a) Determinar la amplitud interválica (C): También se le conoce como ancho del intervalo y se obtiene dividiendo el rango entre el número de intervalos. C= R m b) Determinar los límites de clase, de manera que cada observación se clasifique sin ambigüedades en una sola clase.
16
CURSO ESTADÍSTICA
LI(i) – LS(i) [y´0 - y´1 ) [y´1 - y´2 ) : : [y´m-1 - y´m)
c) Determinar las marcas de clases, la marca de clase o punto medio de cada intervalo se halla mediante la semisuma del límite inferior y del límite superior. Así: LI LS (i ) Yi (i ) 2 Los cuales presentamos a continuación: Intervalos LI(i) – LS(i)
Marca de clase
[y´0 - y´1 ) [y´1 - y´2 ) : : [y´m-1 - y´m)
Y1 Y2 : : Ym
Yi
d) Finalmente se halla frecuencia absoluta de cada clase. Así: TABLA N° 4 Distribución de frecuencias absolutas en intervalos de clase Intervalos Marca de clase Frecuencia absoluta simple
LI (i ) LS (i )
yi
[y´0 - y´1 ) [y´1 - y´2 ) . : [y´m-1 - y´m) Total
y1 y2 : : ym -
fi f1 f2 : : fm n
17
CURSO ESTADÍSTICA
Ejemplo 18: Los siguientes datos corresponden a una muestra aleatoria de 20 jubilados de la AFP Integra de la ciudad de Chimbote según su monto de pensión mensual en soles correspondiente al mes de Enero del 2007: 500 650 650 800 600 670 1000 850
700 720
730 760 790 750 780 840
520 400
870 860
La información fue obtenida de los Registros de Atención al Usuario de la AFP Integra. a) b) c) d) e)
Determinar la unidad de observación y la variable en estudio. Construir la tabla de conteo. Utilice la regla de Sturges. Construir una distribución de frecuencias ampliadas. Interpretar f2, F2, h2% y H2%. Determinar cuantos jubilados han tenido un monto de pensión de 640 soles o más pero menos de 880 soles. f) Determinar que porcentaje de jubilados han tenido un monto de pensión mensual comprendido entre 760 y 1000 soles. Solución: a) Unidad de observación: Los jubilados. Variable en estudio: monto de pensión en soles. b) Siguiendo los pasos establecidos:
Hallando el Rango (R): R = Valor Máximo – Valor Mínimo R = 1000 – 400 = 600
Hallando el Número de Intervalos (m): m = 1 + 3.33 log n n = 20 log 20 = 1.30 m = 1 + 3.33 x 1.30 = 5.33 m = 5 intervalos
18
CURSO ESTADÍSTICA
Hallando la Amplitud Interválica (C): C = R = 600 = 120 m 5
Determinando los límites de clases y sus respectivas marcas de clase. Monto de pensión en soles
Marca de clase
LI (i ) LS (i )
Yi
[400 [520 [640 [760 [880
– 520) – 640) – 760) – 880) – 1000]
460 580 700 820 940
c) Determinando la distribución de frecuencias absolutas: Tabla N° 5 Distribución de jubilados según su monto de pensión en soles AFP INTEGRA - Chimbote: Enero - 2007 Monto de pensión en soles Marca de N° de jubilados Clase Conteo LI LS f (i )
[400 – [520 – [640 –
(i )
i
yi
520) 640) 760)
460 580 700
II II IIII II
2 2 7
[760 – 880) [880 – 1000]
820 940
IIII III I
8 1
Total
-
20
d) A continuación le mostramos la distribución de frecuencias ampliada para las diferentes frecuencias dadas:
19
CURSO ESTADÍSTICA
CUADRO N° 2 Distribución de jubilados según su monto de pensión en soles AFP INTEGRA - Chimbote: Enero - 2007 Monto de pensión en Marca de N° de jub. soles clase f
LI (i ) LS (i )
i
yi
[400 [520 [640 [760 [880
– 520) 460 2 – 640) 580 2 – 760) 700 7 – 880) 820 8 – 1000] 940 1 Total 20 Fuente: Registros de Atención al Usuario.
FI
hi
Hi
hi %
Hi%
2 4 11 19 20 -
0.10 0.10 0.35 0.40 0.05 1.00
0.10 0.20 0.55 0.95 1.00 -
10 10 35 40 5 100
10 20 55 95 5 -
e) Interpretando: f2 : 2 jubilados han tenido un monto de pensión de 520 soles o más pero menos de 640 soles.. F2
:
4 jubilados han tenido un monto de pensión de 400 soles o m;as pero menos de 640 soles.
h2% :
El 10% de los jubilados han tenido un monto de pensión de 520 soles o más pero menos 640 soles.
H2% :
El 20% de los jubilados han tenido un monto de pensión de 400 soles o más pero menos de 640 soles.
f) Sumanos las frecuencias absolutas simples de los intervalos 3 y 4 obteniendo: ( 7 + 8 ) =15 trabajadores. g)
Sumamos las frecuencias porcentuales simples de los intervalos 4 y 5
obteniendo : (40% +5%) = 45% 1.5.2.3.
DISTRIBUCIÓN
DE
FRECUENCIAS
POR
ATRIBUTOS
O
CATEGORÍAS Este tipo de distribución
se utiliza para clasificar los datos de una variable
cualitativa nominal u ordinal.
20
CURSO ESTADÍSTICA
TABLA N° 6 Distribución de frecuencias para variables cualitativas Frecuencia Frecuencia Frecuencia relativa Variable absoluta relativa porcentual
Xi
fi
hi
hi %
x1 x2 . , , xm Total
f1 f2 . . . fm n
h1 h2 . . . hm 1.00
h1% h2% . . . hm% 100%
Ejemplo 19: Los siguientes datos obtenidos mediante una encuesta realizada por la Empresa AMC en el mes de Febrero del 2007 corresponden a una muestra aleatoria de 40 empresas de la ciudad de Chimbote según motivo del uso de Internet: P O P RP
O P P P
F F P F
F F RP RP
F F O P
P O P P
F P P P
RP RP F F
P P O P
Donde: P: “PUBLICIDAD”
F: “FACTURACION”
RP: “RECEPCION DE PAGOS”
O: “OTROS”
Se pide: a) Identificar la unidad de observación y la variable en estudio. b) Construir una distribución de frecuencias (absolutas y porcentuales). c) Interpretar f2 y h2%. Solución: a) Como resultado de la clasificación y tabulación se tiene:
21
F P RP F
CURSO ESTADÍSTICA
CUADRO N° 3 Distribución de empresas según su motivo de uso de Internet Cabina Alfa Net - Chimbote Mayo - 2005 Motivo de uso de Internet
N° de empresas
Frecuencia relativa
Xi
fi
hi
Publicidad
17
0.425
42.50
Facturación
12
0.300
30.00
Recepción de Pagos
6
0.150
15.00
Otros
5
0.125
12.50
1.000
100.00
TOTAL 40 FUENTE: Encuesta realizada por la Empresa AMC
Frecuencia relativa porcentual
hi %
b) Interpretando: f2 : 12 empresas manifiestan que el motivo de uso de Internet es por facturación. h2% : El 30% de las empresas manifiestan que el motivo de uso de Internet es por facturación.
22
CURSO ESTADÍSTICA
1.6. GRÁFICOS ESTADÍSTICOS 1.6.1. DEFINICIÓN: Un gráfico es la representación de un fenómeno estadístico por medio de figuras geométricas (puntos, líneas, rectángulos, paralelepípedos, etc.) cuyas dimensiones son proporcionales a la magnitud de los datos representados. Su objetivo principal es la representación de los datos en forma gráfica, que permita a simple vista darse cuenta del conjunto de elementos presentados y de evidenciar sus variaciones y características. El gráfico es un auxiliar del cuadro estadístico no lo sustituye, sino lo complementa.
1.6.1.1. Partes de un gráfico: Al igual que un cuadro estadístico en el gráfico se consideran las siguientes partes:
CÓDIGO
(FRECUENCIA)
TÍTULO
CUERPO
FUENTE
VARIABLE
1.6.1.2. Escalas usadas en el trazado de un gráfico: La mayoría de los gráficos se representan en las llamadas “Sistema de Coordenadas Cartesianas” donde hay dos ejes, X (Eje horizontal) e Y (eje vertical). En el eje X se colocan las diferentes clases de la variable y en el eje Y se colocan las frecuencias (absolutas o porcentuales). La escala de medida que se usan deben ser de la misma longitud o algo mayor la horizontal que la vertical. En general, las 2 escalas deben guardar una proporción 1 a 1 y 1 a 2, es decir, que si el eje vertical mide 10cm. el eje
23
CURSO ESTADÍSTICA
horizontal debe medir entre 10 y 20. Esta exigencia se hace con el fin de no distorsionar el fenómeno que se estudia. 1.6.2. CLASIFICACIÓN DE GRÁFICOS Entre los gráficos más usuales tenemos: gráfico de bastones, histograma de frecuencias, polígono de frecuencias, gráfico de barras simples, gráfico de sectores circulares y gráfico Lineal, tal como se muestra en el siguiente mapa conceptual.
24
CURSO ESTADÍSTICA
1.6.2.1. GRÁFICOS DE BASTONES También se le conoce como diagrama de frecuencias, se utiliza generalmente para describir datos cuando la variable es cuantitativa discreta y su construcción se hace levantando segmentos perpendiculares al eje de la variable y con una altura proporcional a su frecuencia absoluta o relativa porcentual. Ejemplo 20: Los Gráficos N° 1 y N° 2 muestra el gráfico de bastones para frecuencias absolutas y relativas porcentuales del Cuadro N° 1 de la pag. 15: GRÁFICO N° 1 Empresas según s u número de accidentes de trabajo Lima : 2007
Nº de empresas
12 9 6 3 Nº de accidentes de trabajo
0
1
2
3
4
Fuente: Encuesta realizada por la Empresa Datum S.A.
Comentario: En el Grafico N° 1 observamos que el menor número de empresas (2) no han tenido accidentes de trabajo y el mayor (11) ha tenido 9 accidentes de trabajo.
25
CURSO ESTADÍSTICA
GRÁFICO N° 2 Porcentaje de empresas según s u número de accidentes de trabajo Lima : 2007
40
Porcentaje
30 20 10 Nº de accidentes de trabajo
0
1
2
3
4
Fuente: Encuesta realizada por la Empresa Datum S.A.
Comentario: En el Grafico N° 2 observamos que el menor porcentaje de empresas (7%) no han tenido accidente de trabajo y el mayor porcentaje de empresas (37%) han tenido 2 accidentes de trabajo.
1.6.2.2. HISTOGRAMA DE FRECUENCIAS Este gráfico se utiliza para describir datos cuando la variable es cuantitativa continua. Su construcción se hace levantando sobre el eje de la variable rectangular que tengan por base la amplitud del intervalo de clase y una altura proporcional a su frecuencia absoluta o relativa porcentual. Ejemplo 21: Los Gráficos N° 3 y N° 4 muestran el histograma de frecuencias para frecuencias absolutas y relativas porcentuales del Cuadro N° 2 de la pag. 19.
26
CURSO ESTADÍSTICA
GRÁFICO N° 3 Número de jubilados según su monto de pensión en soles AFP INTEGRA - Chimbote: Enero - 2007
Nº de jubilados
8 6 4 2 Monto de pensión en soles
0
400
520
640
760
880
1000
Fuente: Registros de Atención al Usuario.
Comentario: En el Grafico N° 3 observamos que el menor número de jubilados (1) han tenido un monto de pensión que varia entre 880 soles y 1000 soles y el mayor número de jubilados (8) han tenido un monto de pensión en soles de 760 soles o más pero menos de 880 soles.
27
CURSO ESTADÍSTICA
GRÁFICO N° 4 Porcentaje de jubilados según su monto de pensión en soles AFP INTEGRA - Chimbote: Enero - 2007
40
Porcentaje
30 20 10
0 400 1000
520
640
760
880
Monto de pensión en soles
Fuente: Registros de Atención al Usuario.
Comentario: En el Grafico N° 4 observamos que el menor porcentaje de jubilados (5%) han tenido un monto de pensión que varia entre 880 soles y 1000 soles y el mayor porcentaje de jubilados (40%) han tenido un monto de pensión en soles de 760 soles o más pero menos de 880 soles.
28
CURSO ESTADÍSTICA
1.6.2.3. POLÍGONO DE FRECUENCIAS Este se utiliza también para describir datos cuando la variable es cuantitativa continua. Su construcción se hace uniendo los puntos medios superiores de los rectángulos en el histograma. Ejemplo 22: Los Gráficos N° 5 y N° 6 muestran el polígono de frecuencias para frecuencias absolutas y frecuencias relativas porcentuales del Cuadro N° 2 de la pág. 19.
GRÁFICO N° 5 Número de jubilados según su monto de pensión en soles AFP INTEGRA - Chimbote: Enero - 2007
Nº de jubilados
8 6 4 2 Monto de pensión en soles
0
340
460
580
700
820
940
1060
Fuente: Registros de Atención al Usuario.
En el Grafico N° 5 observamos que el menor número de jubilados (2) han tenido un monto de pensión de 940 soles y el mayor número de hogares (8) han tenido un consumo mensual de 820 soles.
29
CURSO ESTADÍSTICA
GRÁFICO N° 6 Porcentaje de jubilados según su monto de pensión en soles AFP INTEGRA - Chimbote: Enero - 2007
Porcentaje
40 30 20 10 Monto de pensión en soles
0
340
460
580
700
820
940
1060
Fuente: Encuesta realizada por la Empresa Data S.A.
En el Grafico N° 6 observamos que el menor porcentaje de jubilados (5%) han tenido un monto de pensión de 940 soles y el mayor porcentaje de jubilados (40%) han tenido un monto de pensión de 820 soles.
30
CURSO ESTADÍSTICA
1.6.2.3. GRÁFICO DE BARRAS SIMPLES Este gráfico se utiliza para describir datos cuando la variable es cualitativa nominal u ordinal presentados en cuadro de entrada simple. Su construcción se hace levantando barras proporcionales a la frecuencia absoluta o relativa porcentual de la cualidad que representan. -
Recomendaciones para su construcción: Todas las barras deben tener el mismo grosor. El espacio entre barras debe ser de la misma magnitud y constituye la mitad del ancho de la barra. El ancho de la barra debe ser el doble del espacio que se deja entre barra y barra. La escala de frecuencia debe empezar por cero. Las barras por estética deben ordenarse de mayor a menor cuando se pueda. No se debe recargar las barras tratando de expresar muchos productos en cada uno de ellas. Si el gráfico tiene muchas barras es mejor expresarlo con un gráfico lineal.
Ejemplo 24: Los Gráficos N° 7 y N° 8 muestran el gráfico de barras simples para frecuencias absolutas y frecuencias relativas porcentuales del Cuadro N° 3 de la pag. 21.
31
GRAFICO N° 7 Empresas según su motivo de uso de Internet Cabina Alfa Net: Chimbote - Mayo 2005 20
N° de Em pres as
17
15 12
10 6
5
5
0 FUENTE: Encuesta realizada por la Empresa Consultora OMEGANET. Publicidad Facturación Recepción de Otros Pagos
Motivo de Uso de Internet Fuente: Encuesta realizada por la Empresa Data S.A.
Comentario: En el Grafico N° 7 observamos que el menor número de empresas (5) manifiestan que usan internet por otros motivos y el mayor número de empresas (17) manifestan que el motivo de uso de internet es por publicidad.
32
GRAFICO N° 8 Porcentaje de empresas según su motivo de uso de Internet Cabina Alfa Net : Chimbote - Mayo 2005 45
%
42.5
Porcentaje
36 30
%
27 18
15
%
12.5
%
9 0 Publicidad
Facturación
Recepción de Pagos
Otros
Motivo de Uso de Internet Fuente: Encuesta realizada por la Empresa Data S.A.
Comentario: En el Gr% afico N° 8 observamos que el menor porcentaje de empresas (12.5%) manifiestan que usan internet por otros motivos y el mayor porcentaje de empresas (42.5%) manifestan que el motivo de uso de internet es por publicidad. 1.6.2.4. GRÁFICO DE SECTORES CIRCULARES O PASTEL Al igual que el gráfico de barras este gráfico se utiliza generalmente para representar variables cualitativas (nominal u ordinal). Se usa frecuentemente cuando se desea comparar cada categoría de la variable con respecto al total. Para su elaboración se utiliza una circunferencia, siendo necesario que los valores absolutos y/o porcentuales sean traducidos en grados. A cada categoría le corresponde un sector de la circunferencia.
Hallando los ángulos para cada sector: 33
Tipos de Caso
Angulos(o i)
Publicidad
o 1
17 360 153 40 12 360 108 40
Facturación
o 2
Recepcción de Pagos
o 3
Otros
o 4
6 360 54 40
5 360 45 40
Total
360°
Se puede comprobar que la suma de los cuatro sectores da 360°. Ejemplo 25: Los Gráficos N° 9 y N° 10 muestran el gráfico de barras simples para frecuencias absolutas y frecuencias relativas porcentuales del Cuadro N° 3 de la pag. 21. GRAFICO N° 9 Empresas según su motivo de uso de Internet Cabina Alfa Net : Chimbote - Mayo 2005 Otros 5
Publicidad 17
Recepción de Pagos 6
Facturación 12
Fuente: Encuesta realizada por la Empresa Data S.A.
34
Comentario: En el Grafico N° 9 observamos que el menor número de empresas (5) manifiestan que usan internet por otros motivos y el mayor número de empresas (17) manifestan que el motivo de uso de internet es por publicidad.
GRAFICO N° 10 Porcentaje de empresas según su motivo de uso de Internet Cabina Alfa Net : Chimbote - Mayo 2005 Otros 12.5
% Publicidad 42.5
%
% Recepción de Pagos 15
% Facturación 30 Fuente: Encuesta realizada por la Empresa Data S.A.
Comentario: En el Grafico N° 10 observamos que el menor porcentaje de empresas (12.5%) manifiestan que usan internet por otros motivos y el mayor porcentaje de empresas (42.5%) manifestan que el motivo de uso de internet es por publicidad.
1.6.2.5. GRÁFICO LINEAL Estos gráficos se utilizan para representar series cronológicas o sea distribuciones que se desarrollan a través del tiempo. Se representan en los ejes de coordenadas cartesianas mediante líneas rectas o quebradas. En el eje horizontal se ubica el tiempo (años, meses, días, etc.) y en el eje vertical el valor de los datos. Puede incluir más de un hecho o situación.
35
Ejemplo 26: El Gráfico N° 11 le muestra el gráfico de líneas utilizando los datos del Cuadro N° 4.
CUADRO N° 4 Numero de usuarios mensuales de la Cabina Alfa Net Chimbote: Año - 2005 EN FE M A M J J A S O 150 210 350 400 600 450 800 650 700 350
Años N° de usuarios Fuente: Encuesta realizada por la Empresa Consultora OMEGANET.
N 200
D 500
GRAFICO N° 11 Num e ro de usua rios de la Ca bina Alfa Ne t Chim bote : Año - 2005
N° de usuarios
800
800
600
600
400
350
210
200 0
500
450
400
350
700
650
200
150
E
F
M
A
M
J
J
A
S
O
N
D
MESES
Fuente: Encuesta realizada por la Empresa Consultora OMEGANET.
Comentario: En el Grafico N° 11 observamos que el número de usuarios de la Cabina Alfanet presentan un crecimiento ascendente en los meses de enero a mayo, de junio a julio el número de usuarios que llegan a dicha cabina presentan un comportamiento irregular.
36
AUTOEVALUACIÓN 01
1. Los siguientes datos corresponden a una muestra aleatoria de 30 unidades operativas de la ULADECH CATÓLICA según su número de supervisiones realizadas en el año 2012: 2 2 3 3 2 4 1 2 2 3 3 3 3 4 5 3 2 4 1 5 4 4 3 4 5 3 2 3 3 4 La información fue proporciona por la Oficina de Gerencia de Calidad ULADECH CATÓLICA Se pide: a) Identificar la unidad de observación y la variable en estudio. b) Construir una tabla de distribución de frecuencias absolutas. (Tabla de Conteo) c) Construir una de distribución de frecuencias ampliada. d) Interpretar f4, F4, h4% y H4%. e) Determinar cuántos trabajadores han tenido más de 3 supervisiones. f) Determinar qué porcentaje de trabajadores han tenido a lo más 3 supervisiones. 2. Los siguientes datos corresponden a una muestra aleatoria de 20 trabajadores de la Empresa “Sol y Sombra” de la ciudad de Chimbote según monto de CTS en soles Julio del 2012: 200 250
400 450
410 500
350 590
420 600
550 330
480 650
380 460
470 580
700 430
Los datos fueron obtenidos de la Oficina de Personal de dicha entidad. Se pide: a) Identificar la unidad de observación y la variable en estudio. b) Construir una distribución de frecuencias ampliada. Utilice m=5 de intervalos. c) Interpretar f2, F2, h2% y H2%. d) Determinar que porcentaje de trabajadores tienen un monto de CTS de 200 soles o más pero menos de 500 soles. (1punto) 3. Los siguientes datos corresponden a una muestra aleatoria de 40 administradores de hoteles de la ciudad de Chimbote según opinión acerca del problema que afecta la actividad turística en Marzo del 2012: F I O I Donde:
S F O I
S I O I
I I I I
O I I S
I I S S
I O S S
I O I I
F F I I
37
I I I I
F: Falta de promoción O : Otros
I: Insuficiente Infraestructura
S: Inseguridad
Los datos fueron obtenidos mediante una encuesta realizada por la Empresa Apoyo S.A. a) Identificar la unidad de observación y la variable en estudio. b) Construir una distribución de frecuencias absolutas y porcentuales. c) Interpretar f2 y h2%. d) Construir un gráfico adecuado para frecuencias porcentuales. 4. Dado del siguiente cuadro: CUADRO N° 1 POBLACIÓN ECONOMICAMENTE ACTIVA OCUPADA DE 14 A 29 AÑOS POR SEXO PERU: AÑO 2005 - 2008 AÑO
2005
2006
2007
2008
2582 2700 2800 HOMBRE 2440 S 2500 2300 2200 MUJERE 3000 S Fuente: Encuesta de hogares. INEI Construir un gráfico lineal y comentar. (3 puntos) 5. Identificar cada una de las siguientes variables según su clasificación: • • • •
N° de caidas del sistema ……………………………………… Marcas de impresoras ……………………………………… Velocidad en mg. …………………………….............. Nivel socio económico ...……………………………………
6. Identifique la unidad de observación y la variable de estudio en el siguiente enunciado: Población de usuarios de Internet según modalidad speedy de su preferencia: Unidad de observación:……………………………………………………………… Variable:……………………………………………………………… 7. Determine si es una Población “N” o muestra “n” en las siguientes afirmaciones: a) Estudio del nivel socio – económico de todos los estudiantes de la ULADECH. ( b) Estudio del 5% de trabajadores de una empresa “X” según su sexo. ( ) 38
)
c)
Distribución del 30% de clientes del Banco de Crédito de una población de 1000 según sus ahorros mensuales en soles. ( ) d) Encuesta a 100 trabajadores de la Empresa TASA S.A según su sueldo en soles. ( )
8. De dos ejemplos de población relacionados a su campo porfesional. 9. De 4 ejemplos de variables según su clasificación a)
Variable Cuantitativa discreta:
............................................................
b)
Variable cuantitiativa continua:
............................................................
c)
Variable cualitativa nominal:
...........................................................
d)
Variable cualitativa ordinal:
...........................................................
10. Identifique el tipo de fuente de información en las siguientes proposiciones: a) La información estadística que tiene el registro de contribuyentes de la SUNAT. ………………………………………………………………. b) El número de arribos extranjeros registrados por el Ministerio de Comercio y Turismo. ……………………………………………………………….
11. De 1 ejemplos relacionados respectivamente.
de fuente de información primaria y secundaria
...................................................................................................................... ...................................................................................................................... 12. De 1 ejemplo de encuesta muestral realizadas en su campo profesional. ......................................................................................................................
39
CAPITULO II MEDIDAS DE TENDENCIA CENTRAL 2.1. MEDIDAS ESTADISTICAS 2.1.1. DEFINICION: Las medidas estadísticas son medidas de resumen que se calculan a partir de una muestra y que describen ciertos aspectos de una serie o distribución de datos para poder tener un mejor conocimiento de la población. 2.1.2. CLASIFICACIÓN: A continuación presentamos un mapa conceptual de la clasificación de las medidas estadísticas más usadas.
41
2.2. MEDIDAS DE TENDENCIA CENTRAL 2.2.1. DEFINICIÓN Son estadígrafos que se ubican en la parte central de un conjunto de datos o de una distribución. Los estadígrafos de tendencia central más importantes y más usuales son: la media aritmética, mediana y moda. 2.2.2. LA MEDIA ARITMÉTICA: También se le conoce como media o promedio. Se obtiene sumando todos los valores de los datos observados y se divide entre el número total de ellos.
Media Aritmética = Suma de losvalores delavariable Número total de datos
Se denota por: x o
M[x
2.2.2.1. Formas de cálculo de la media aritmética: a) Para datos no agrupados: La media aritmética para datos no agrupados está dado por la siguiente fórmula: n
x
x i 1
i
n
Ejemplo 26: Los siguientes datos corresponden a los sueldos mensuales en soles de 10 familias: Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000 Calcular la media aritmética e interpretar. Solución: Sustituyendo los datos en la fórmula se tiene:
42
10
x
x
i 1
10
i
x x 2 ... x10 650 + 750 + 850 + 1000 + 750 + 820 + 850 + 1200 + 1000 + 1000 10 10
1
x 887 soles mensuales. Interpretación: Los trabajadores tienen un sueldo mensual promedio de 887 soles. b) Para datos agrupados: La media aritmética para datos agrupados está dada por la siguiente fórmula: m
y
y f i 1
i
i
n
Donde " yi " es la clase o marca de clase de cada grupo o intervalo. La media aritmética se obtiene sumando el producto de las clases o marcas de clase por la frecuencia correspondiente y dividiendo la suma entre el número total de datos. b.1.) Media aritmética cuando la variable es cuantitativa discreta. A continuación presentamos un ejemplo para calcular la media aritmética cuando la variable es cuantitativa discreta. Ejemplo 27: Los siguientes datos de la Tabla N° 07 corresponde a una muestra aleatoria de 100 cabinas de Internet según su número de cibernautas que acudieron el mes anterior: Tabla N° 07 N° de cibernautas N° de cabinas
yi
fi
40 45 50 55 60 65 Total
10 20 40 15 10 5 100
Calcular la media aritmética e interpretar.
43
Solución: En la siguiente tabla de trabajo le mostraremos como calcular la media aritmética cuando la variable es discreta, debemos multiplicar los valores de cada clase con sus respectivas frecuencias finalmente se suma esos resultados y se divide entre el número de observaciones, tal como se muestra en la siguiente Tabla N° 8:
N° de cibernautas
Tabla N° 08 N° de cabinas
yi
f i 44
yi f i
40 45 50
10 20 40
400 900 2000
55
15
825
60 65
10 5
600 325
TOTAL
100
5050
Luego: 6
y
y i 1
i
fi
100
40 10 45 20 50 40 55 15 60 10 65 5 5050 100 100
y 50.5 51 cibernautas Interpretación: A las cabinas de Internet acuden en promedio 51 cibernautas durante el mes anterior. b.2.) Media aritmética cuando la variable es cuantitativa continua: A continuación le mostraremos cono calcular la media aritmética cuando la variable es cuantitativa continua: Ejemplo 28: La siguientes datos de la Tabla N° 09 corresponde a una muestra aleatoria de 300 trabajadores según su edad en años:
44
Tabla N° 09 Edad en en años LS 30) 35) 40) 45) 50) TOTAL
LI [25 [30 [35 [40 [45
N° de trabajadores fi 40 60 100 92 8 300
Se pide: Calcular la media aritmética e interpretar Solución: Para calcular la media aritmética para datos agrupados cuando la variable es continua debemos hallar la marca de clase o punto medio de cada intervalo y luego ese valor hallado multiplicarlo por su respectiva frecuencia, finalmente debemos sumar los resultados hallados y dividir entre el número total de observaciones, tal como se muestra en la siguiente tabla N° 10: TABLA N° 10
i 1 2 3 4 5
Edad en años
Marca de Clase
LI (i ) LS(i )
yi
[25 [30 [35 [40 [45
Total
30) 35) 40) 45) 50)
27.5 32.5 37.5 42.5 47.5 -
N° trabaj.
fi 40 60 100 92 8 300
de
yi f i 1100 1950 3750 3910 380 11090
Luego:
27.5 40 32.5 60 37.5 100 42.5 92 47.5 8 y i1 1300 300 6
y f i
y
i
11090 36.97 años. 300
Interpretación: Los trabajadores tienen en promedio 36.97 años.
45
2.2.2.2. Características: • Es la más conocida y más usada en el análisis estadístico. • Para su cálculo intervienen todas las observaciones. • Es una medida única, es decir un conjunto de datos tiene una sola media. • Es sensible a los valores extremos demasiados altos o demasiados bajos. • No se puede calcular cuando presenta clases abiertas en los extremos.
2.2.3. LA MEDIANA: Es una medida de tendencia central que divide al total de n observaciones debidamente ordenadas o tabuladas en dos partes de igual tamaño, cada una con el 50% de los datos observados. Notación: Me. 2.2.3.1. Formas de cálculo a) Para datos no agrupados: Para calcular la mediana, los n datos originales se ordenan en forma ascendente o descendente, luego se halla el lugar en donde se encuentra la mediana (lugar = (n + 1)/2) y finalmente se determina su valor. Se presenta dos casos: a.1.) Para un número par de datos: La mediana será el promedio de los dos valores centrales.. Ejemplo 29: Calcular e interpretar la mediana del Ejemplo 26 de la pag. 38.: Xi : 650, 750, 850, 1000, 750, 820, 850, 1200, 1000, 1000 Solución:
Ordenando en forma ascendente 650 750 750 820 850 850 1000
1000
1000
12000
Lugar 5.5
Ubicando el lugar en donde se encuentra la Me n 1 10 1 Lugar 5.5 2 2
46
Cuando se tiene un número par de datos la mediana será el valor será el promedio de los dos valores centrales: Me
850 850 2
Me 850 soles.
Interpretación: El 50% de los trabajadores tienen un ingreso máximo de 850 soles , no más del 50% supera dicho ingreso.
a.2.) Para un número impar de datos: La mediana será el valor que está ocupando la posición central. Ejemplo 30: Los siguientes datos corresponden a los tiempos de acceso en minutos a 11 Páginas Web cargadas por la tarde en el horario de 14 a 15 horas desde un ordenador domestico: Xi: 2.9, 1.4, 1.2, 3.4, 1.3, 2.5, 1.6, 1.8, 2.3, 1.5, 1.0 Solución:
Ordenando los datos en forma ascendente 1.0 1.2 1.3 1.4 1.5 1.6 1.8 2.3
2.5
2.9 3.4
Lugar 6
Hallando el lugar en donde se encuentra la mediana:
Lugar
n 1 11 1 6 2 2
Cuando se tiene un número impar de datos la mediana será el valor que está ocupando la posición central.
47
●
Interpretación: El 50% de las páginas Web son cargadas en un tiempo de acceso máximo de 1.6 minutos., el otro 50% supera dicho tiempo.
b) Para datos agrupados b.1) La mediana cuando la variable es cuantitativa discreta: Cuando la variable es cuantitativa discreta y los datos se encuentra agrupados la mediana será el valor de la variable cuya frecuencia acumulada sea la primera en exceder a n/2, así: Me = Xi
tal que:
Fi n/2 “i” determina clase en donde se encuentra la Me.
Ejemplo 31: Calcular e interpretar la mediana de los datos de la tabla N° 07 de la página 39.
i 1 2 3 4 5 6
N° de cabinas
Tabla N° 11 N° de cibernautas
yi
fi
Fi
40 45 50 55 60 65 Total
10 20 40 15 10 5 100
10 30 70 85 95 100 -
Aquí vemos que n = 100, luego n/2 = 50 Entonces la primera frecuencia acumulada que excede a
n = 50 es 70, esto es: 2
70 50 F3 10 “i = 3”, la mediana se encuentra en la 3ra. clase. Me = 50 cibernautas Interpretación: Al 50% de las cabinas acuden como máximo 50 cibernautas durante el mes anterior, el otro 50% de las cabinas supera dicho número. 48
b.2.) La mediana cuando la variable es cuantitativa continua: Para calcular la mediana cuando la variable es cuantitativa continua se utilizará la siguiente fórmula: n / 2 Fi 1 Me LI(i ) Ci fi Se debe cumplir la siguiente relación: n Fi 1 Fi 2
“i” determina el intervalo en donde se encuentra la Me.
Cuando: n Fi 1 2 La mediana está dado por: Me = LI (i ) Además: LI (i )
:
Límite inferior del intervalo en donde se encuentra la Me.
Ci
:
Amplitud o ancho del intervalo en donde se encuentra la Me.
n
:
Número de observaciones de la muestra.
Fi 1
:
Frecuencia acumulada inmediata anterior al intervalo en donde se encuentra la Me.
fi
:
Frecuencia absoluta del intervalo en donde se encuentra la Me
49
Ejemplo 32: Calcular e interpretar la mediana de los datos de la Tabla N° 09 de la página 41: Solución:
i 1 2 3 4 5
LI [25 [30 [35 [40 [45
Edad en en años LS 30) 35) 40) 45) 50) TOTAL
Vemos que n = 300
Tabla N° 12 N° de trabajadores fi 40 60 100 92 8 300
Fi 40 100 200 292 300 -
n 150 2
y de acuerdo a la relación dada tenemos: 100 150 200 F2 150 F3 “i = 3”, la mediana se encuentra en el 3er. intervalo. Reemplazando el subíndice i=3 en la fórmula y los valores correspondientes tenemos: Me LI(3) C3
n / 2 F2 f3
150 100
Me 35 5
100
Me 37.5 años.
Interpretación: El 50% de los trabajadores tienen una edad máxima de 37.5 años, el otro 50% supera dicha edad.
50
2.2.3.2. Características: La mediana es un estadígrafo que no está afectada por valores extremos muy altos o muy bajos y por lo tanto es más representativa que la media aritmética, o cuando las distribuciones son poco simétricas. Es útil cuando los datos agrupados tienen clases abiertas en los extremos. Es una medida única; esto es, una distribución tiene solamente una mediana. 2.2.4. LA MODA: Es una medida de tendencia central que corresponde al valor de la variable que tiene frecuencia máxima. Notación: Md. Una distribución puede ser amodal sino tiene ninguna moda, unimodal si tiene una moda, bimodal si tiene dos modas y multimodal si tiene tres o más modas. En consecuencia es necesario considerar modas absolutas y modas relativas. 2.2.4.1. Formas de cálculo a) Para datos no agrupados La moda será el valor que se repite el mayor número de veces. Ejemplo 33: Calcular e interpretar la moda del Ejemplo 26 de la pag. 38. Solución: Observamos que el valor que se repite frecuentemente es 850 y 1000. Entonces: Md = 850 y 1000 soles. Interpretación: El mayor número de trabajadores tiene un sueldo mensual de 850 y 1000 soles.
Ejemplo 34: Calcular e interpretar la moda del coeficiente intelectual expresado en puntaje del siguiente grupo de alumnos. Xi: 95, 100, 105, 110, 95, 100, 110, 110, 95 51
Solución: Md = 95 y 110 Interpretación: El mayor número de alumnos tiene un coeficiente intelectual de 95 y 110 puntos. En este caso la serie es bimodal. b) Para datos agrupados b.1.) La moda cuando la variable es cuantitativa discreta La moda será clase cuya frecuencia es máxima. Así: Md = yi Tal que: fi-1 fi fi + 1 “i” determina la clase en donde se encuentra la Moda Ejemplo 35: Calcular e interpretar la moda de los datos de la tabla N° 07 de la pag. 39. Solución: Tabla N° 13 N° de N° de cabinas cibernautas f i
yi
1
40 45 50 55 60 65 Total
2 3 4 5 6
i
10 20 40 15 10 5 100
Observamos que la mayor frecuencia es 40 y se cumple que: 20 40 15 f2 f3 f4 “i” = 3 la moda se encuentra en la 3ra. clase. Por lo tanto: Md = 50 cibernautas
52
Interpretación: Al mayor número de cabinas acudieron 50 cibernautas durante el mes anterior. b.2.) La moda cuando la variable es cuantitativa continua: Para calcular la moda cuando la variable es continua se utilizará la siguiente fórmula:
Md LI(i ) Ci
d1 d1 d 2
Se debe cumplir la siguiente relación: fi 1 fi fi 1 ' i ” determina el intervalo en donde se encuentra la Moda. Además: d1 = fi – fi-1 d2 = fi – fi+1 Ejemplo 36: Calcular e interpretar la moda de los datos dados en la tabla N°09 de la página 41. Solución:
i 1 2 3 4 5
LI [25 [30 [35 [40 [45
Tabla N° 14 Edad en en años LS 30) 35) 40) 45) TOTAL
N° de trabajadores fi
50)
40 60 100 92 8 300
Observamos en la tabla N° 14 que la mayor frecuencia es 100 y se cumple que: 60 100 92 f2 f3 f4 i=3, la Md. se encuentra en el 3er. intervalo. d1= f3 – f2 = 100 – 60 = 40 d2= f3 – f4 = 100 – 92 = 8
53
Reemplazando el subíndice i=3 tenemos: d Md LI(3) C3 1 d1 d 2
en la fórmula y los valores correspondientes
40 Md 35 5 48 Md 39.17 años. Interpretación: El mayor número de trabajadores tiene 39.17 años.
2.2.4.2. Características: • No se encuentra afectada por valores extremos. • Puede usarse cuando los datos presentan clases abiertas en los extremos. • No es significativa a menos que la distribución contenga un gran número de datos y exista significativa repetición de alguno de ellos. • Muchas veces la serie no tiene moda porque ningún valor se repite. • Cuando la serie tiene dos, tres, o más modas, se hace difícil su interpretación y comparación. AUTOEVALUACIÓN 02 1. Para lanzar un nuevo producto al mercado, una empresa estudia el tiempo publicidad, en segundos, empleados en los medios audiovisuales por otra empresa que produce un producto similar, los datos se muestran en la siguiente tabla: Tiempo de publicidad en segundos LI LS
N° de anuncios fi
[00
-
20)
10
[20
-
25)
30
[25
-
30)
50
[30
-
35)
40
[35
-
40)
20
Total
Se pide calcular e interpretar: a) La media. b) La mediana. c) La moda
150 54
2. La siguiente tabla corresponde a una muestra aleatoria de 30 pequeñas empresas de la ciudad de Chimbote según el número de empleados: N° de empleados Yi
N° de empresas fi
2 3 4 5 6 TOTAL Calcular e interpretar: a) La moda
3 7 10 7 3 30 b) La mediana.
c) La media aritmética
3. Los siguientes datos corresponden al importe de las facturas en dólares por gastos consumo en un hotel 3 estrellas de la ciudad de Chimbote de 11 turistas: Xi: 500, 700, 600, 910, 510, 700, 700, 700, 650, 700, 800 a) Calcular el importe de las facturas por gastos de consumo del mayor número de turistas. b) Calcular el importe promedio de las facturas por consumo de los turistas. c) Calcular el importe de las facturas por gastos de consumo de la mitad de turistas. 4. Los siguientes datos corresponden a 11 clientes del de la Caja Municipal del Santa según sus préstamos en dólares: Xi: 4000, 3200, 4500, 3100, 4200, 3500, 4100, 4900, 5100, 3000, 3450 Que medida de tendencia central se ajusta al conjunto de datos dato. ¿Cuál es su valor?
55
CAPITULO III MEDIDAS DE DISPERSIÓN Y MEDIDAS DE FORMA
3.1. MEDIDAS DE DISPERSIÓN 3.1.1. DEFINICIÓN Las medidas de dispersión son aquellas que cuantifican el grado de concentración o de dispersión de los valores de la variable en torno de un valor central, generalmente la media aritmética. Las medidas de dispersión se utilizan para dos propósitos básicos: a) Para verificar la confiabilidad de los promedios y b) Para que sirva como base para el control de la variación misma. Las medidas de dispersión que se utilizan con mayor frecuencia son:
Varianza.
Desviación estándar.
Coeficiente de variación.
3.1.2. LA VARIANZA Es una medida que cuantifica el grado de dispersión o de variación de los valores de una variable cuantitativa con respecto a su media aritmética. Si los valores tienden a concentrarse alrededor de su media, la varianza será pequeña. Si los valores tienen a distribuirse lejos de la media, la varianza será grande. La varianza calculada a partir de una muestra se denota por s 2 y referida a la población se denota por 2 o V [x. La varianza se define como la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media aritmética. La varianza es una medida de dispersión con unidades de medición al cuadrado: S/. 2, $2, km2, etc. La varianza siempre es positiva. a) La varianza para datos no agrupados: Se utiliza la siguiente fórmula:
Para n 30
56
n
s2
(x
x) 2
i
i 1
n
Para n 30 [varianza de Cochran] n
s2
(x
i 1
i
x) 2
n 1
Ejemplo 36: Los siguientes datos corresponden a una muestra al azar de 8 clientes según su tiempo en minutos que han visitado la página de Internet Google: Xi : 2.3, 4.5, 4.2, 3.2, 4.4, 2.1, 1.6, 4.3 Calcular e interpretar la varianza: Solución: a) Para hallar la varianza primero debemos hallar el tiempo promedio de visita de los clientes: 8
x
x i 1
8
i
26.6 3.3 min utos 8
A continuación construiremos una tabla de trabajo para calcular la varianza: Tabla N° 15 i
1 2 3 4 5 6 7 8 Total
xi 2.3 4.5 4.2 3.2 4.4 2.1 1.6 4.3 26.6
(x i x) -1.0 1.2 0.9 -0.1 1.1 -1.2 -1.7 1.0 -
(x i x) 2 1.00 1.44 0.81 0.01 1.21 1.44 2.89 1.00 9.80
57
Donde: 8
(x
i
x) 2 9.80
i 1
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=8 < 30. 8
(x x)
s 2 i 1
i
8 1
2
9.80 1.4 min utos 2 7
Interpretación: La variabilidad de los tiempos de visita de los clientes a la pagina Web Google respecto de su valor central es de 1.4 minutos 2 . b) La varianza para datos agrupados: Se utiliza la siguiente formula: m
s2
(y
i
i 1
n m
s2
y) 2 f i
(y
i
;
para
n 30
;
para
n 30 (Varianza
y) 2 f i
i 1
n 1
de Cochran)
Ejemplo 37 : Los siguientes datos de la tabla que se da a continuación corresponden a 240 trabajadores de una Empresa “X” según su número de inasistencias: Tabla N° 16 N° de inasistencias yi 3 5 7 9 11 Total
N° de trabajadores fi 10 30 100 80 20 240
Calcular e interpretar la varianza.
58
Solución: a) Hallando en primer lugar el número promedio de inasistencias: 5
y
y f i
i
i1
240
1820 7.58 inasistencias 240
b) A continuación construiremos una tabla de trabajo para varianza: Tabla N° 17 yi
fi
3 5 7 9 11 Total
(yi y)
(yi y) 2
-4.58 - 2.58 - 0.58 1.42 3.42 -
20.98 6.66 0.34 2.02 11.70 -
10 30 100 80 20 240
calcular la
(yi y) 2 fi 209.8 199.8 34.0 161.6 234.0 839.2
Donde: 5
(y y) i
2
fi 839.2
i1
Reemplazando dicho valor en la formula de la varianza para n=240 > 30. 5
s 2
(y
i
i1
240 5
s2
(y
i
240
(y
i
s
240
(y
i
y)2 fi
i1
240 5
s2
y) 2 fi
i1
5
2
y) 2 fi
i1 5
s2
y) 2 fi
(y
i
y) 2 f i
i1
240
2 2 3 4 5 (y 1 y) f1 (y 2 y) f 2 ( y3 y) f 3 (y 4 y) f 4 ( y 5 y) f5 240
20.98 10 6.66 30 0.34 100 2.02 80 11.70 20 240
209.8 199.8 34 161.6 234 240
839.2 240
3.5 4 inasistencias 2 .
59
Interpetración: La variabilidad de las inasistenicas es de 4 inasistencias 2 respecto de su valor central. Ejemplo 38: La siguiente tabla corresponde a 280 trabajadores de una Empresa “X” según su edad en años: Tabla N° 18 LI [25 [30 [35 [40 [45
Edad en en años LS 30) 35) 40) 45) 50) TOTAL
N° de trabajadores fi 40 50 100 50 40 280
Calcular e interpretar la varianza. Solución: Hallando en primer lugar el promedio: 5
y
y f i
i1
280
i
10500 37.5 años 280
A continuación construiremos una tabla de trabajo para calcular la varianza: Tabla N° 19 Li - Ls [25 [30 [35 [40 [45
-
30) 35) 40) 45) 50)
Total
y
fi
27.5 32.5 37.5 42.5 47.5 -
40 50 100 50 40 280
(yi y) -10 -5 0 5 10 -
(yi y) 2
(yi y)2 fi
100 25 0 25 100 -
4000 1250 0 1250 4000 10500
Donde: 5
2
(yi y) fi 10 500 i1
60
Reemplazando dicho valor en la formula de la varianza para n=240 > 30. 5
(y y) f
s 2 i1
2
i
i
280
5
(y y) f
s 2 i1
2
i
i
280
5
s 2
(y y) f
s
i
i1
280
(y y)
s
2
i
fi
i1
280 5
2
2 2 3 4 5 (y 1 y) f1 (y2 y) f2 (y3 y) f3 (y4 y) f4 (y5 y) f5 280
100 40 25 50 0 100 25 50 100 40 280
2
i
5
2
(y y) i
i1
280
2
fi
4000 1250 0 1250 4000 280
10500 280
37.5 años 2
Interpetración: La variabilidad de las edades de los trabajadores es de 37.5 años 2 respecto de su valor central. 3.1.3. La desviación estándar o típica Se define como la raíz cuadrada positiva de la varianza: s var ianza Es uno de los estadígrafos de dispersión de mayor uso, la cual se expresa en unidades reales de la variable, es decir ya no están elevadas al cuadrado. La desviación estándar, al igual que la varianza, es no negativa (s 0), puesto que es la raíz positiva de la varianza. A mayor dispersión le corresponderá una mayor desviación estándar.
61
Ejemplo 39: Calcular e interpretar la desviación estándar de los datos del Ejemplo 36 de la pag. 54.. Solución:
s 1.4 1.2 min utos Interpretación: Los tiempos de visita de los clientes se alejan en promedio de su valor central en 1.95 puntos. Ejemplo 40 : Calcular e interpretar la desviación del Ejemplo 37 de la pag. 55: Solución: s 3.5 1.87 2 inasistencias. Interpretación: Las asistencias de los trabajadores se dispersan o se alejan en promedio de su valor central en 2 inasistencias. Ejemplo 41 : Calcular e interpretar la desviación del Ejemplo 38 de la pag. 57: Solución: s 37.5 6.12 años.
Interpretación: Las edades de los trabajadores se dispersan o se alejan en promedio de su valor central en 6.12 años. 3.1.4. El coeficiente de variación Es una medida de dispersión relativa exenta de unidades y expresada en porcentaje, se utilizan para comparar la variación de dos distribuciones siempre que las variables se expresen en las mismas unidades de medida y sean aproximadamente del mismo tamaño promedio. Sin embargo, a veces es necesario comparar dos conjuntos de datos expresados en unidades diferentes (tales como soles y
62
kilogramos). En estos casos las medidas de dispersión absoluta no son comparables y deben utilizarse medidas de dispersión relativa. El coeficiente de variación de un conjunto de datos se denota por c.v. y se expresa como: c.v.
s 100 y
Donde: s Desviación estándar y Media aritmética
Si c.v. 15%, los datos son homogéneos, es decir tienen una baja variabilidad. Si c.v. > 15%, los datos son heterogéneos, es decir tienen una alta variabilidad.
Ejemplo 42: Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 36 de la pag. 54. Solución: c.v.
1.2 100 36.4% 15% 3.3
Interpretación: Las dispersiónes de los tiempos utilizados por los clientes en visitar la página Google respecto de su valor central son heterogéneos. Ejemplo 43: Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 37 de la pag. 55: Solución: c.v.
1.87 100 24.67% 15% 7.58 63
Interpretación: Las dispersiones de las inasistencias de los trabajadores respecto de su valor central son heterogéneos. Ejemplo 44: Calcular e interpretar el coeficiente de variación de los datos del Ejemplo 38 de la pag. 57: Solución: c.v.
6.12 100 16.32% 15% 37.5
Interpretación: Las dispersiones de las edades de los trabajadores respecto de su valor central son heterogéneos. Ejemplo 45: Los siguientes datos corresponden a una muestra aleatoria de los gastos mensuales en soles de 7 estudiantes de administración: Xi : 200, 250, 250, 400, 270, 300, 420 a) ¿Cuánto es la dispersión de los gastos mensuales respecto central? b) ¿Son los gastos mensuales homogéneos?
de su valor
Solución: a) Hallando en primer lugar el promedio: 7
x
x i 1 7
i
2090 298.57 soles. 7
b) A continuación construiremos una tabla de trabajo para varianza: Tabla N ° 20 i
xi
1 2 3 4 5
200 250 250 400 270
(x i x) -98.57 -48.57 -48.57 101.43 -28.57
(x i x) 2 9716.04 2359.04 2359.04 10288.04 816.24 64
calcular la
6 7 Total
300 420 2090
1.43 121.43 -
2.04 14745.24 40285.68
Donde: 7
(x
i
x) 2 40285.68
i1
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=7 < 30. 7
(x
s 2 i 1
c)
i
x) 2
7 1
40285.68 6714.28 soles 2 . 6
Hallando la desviación estándar :
s 6714.28 81.94 soles. d) Hallando el coeficiente de variación: De acuerdo a las operaciones realizadas tenemos: x 298.57 soles. s 81.94 soles. entonces: s 6.12 c.v. 100 100 16.32% 15% 37.5 x Los gastos mensuales de los estudiantes no son homogéneos. Ejemplo 46: Los siguientes datos corresponden a una muestra aleatoria de los ahorros mensuales en dólares de 5 clientes del Banco de Crédito del Perú: Xi: 500, 550, 220, 340, 180
65
El gerente del Banco piensa hacer un aumento en la tasa de interés solo si los ahorros mensuales son regulares. ¿Qué decisión tomará el gerente del Banco. (Hallar coeficiente de variación). Solución: a) Hallando en primer lugar el ahorro mensual promedio: 5
x
x
i1
5
i
1790 358 dólares. 5
b) A continuación construiremos una tabla de trabajo para varianza: Tabla N° 21 xi i (x i x) (x i x) 2 1 500 142 20164 2 550 192 36864 3 220 -138 19044 4 340 - 18 324 5 180 -178 31684 Total 1790 108080
calcular la
Donde: 5
(x
i
x) 2 108080
i1
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=5 < 30. 5
(x
s 2 i1
c)
i
x) 2
5 1
108080 27020 dólares 2 . 4
Hallando la desviación estándar :
s 27020 164.38 dólares. d) Hallando el coeficiente de variación: De acuerdo a las operaciones realizadas tenemos:
66
x 358 dólares. s 164.38 dólares. entonces:
s 164.38 100 45.92% 15% c.v. 358 x Los ahorros mensuales de los clientes son heterogéneos; es decir no son regulares. Por lo tanto el gerente del banco no subirá la tasa de interés. El gerente no subirá la tasa de interés ya que los ahorros mensuales no son regulares. Ejemplo 47: Los siguientes datos corresponden a una muestra aleatoria de los ahorros mensuales en dólares de dos grupos de clientes del Banco Continental : Tabla N° 22 GRUPO
1
2
3
4
5
6
1
500
550
540
530
520
550
2
400
450
500
460
450
470
¿En que grupo los ahorros son más estables? (Hallar coeficiente de variación) Solución: Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados: ●
a)
Para el Grupo 1 Hallando el ahorro mensual promedio para el Grupo 1: 6
x1
x i1
6
i
3190 531.67 soles. 6
b) Hallando la varianza:
67
Tabla N° 23 xi
(x i x )
(x i x ) 2
500 550 540 530 520 550 3190
-31.67 18.33 8.33 -1.67 -11.67 18.33 -
1002.99 335.99 69.39 2.79 136.19 335.99 1883.34
i
1 2 3 4 5 6 Total Donde: 6
(x
x) 2 1883.34
i
i1
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=6 < 30. 6
(x
s12 i1 c)
i
x) 2
6 1
1883.34 376.67 soles 2 . 5
Luego hallamos la desviación estándar :
s1 376.67 19.41 soles. d)
Finalmente hallamos el coeficiente de variación:
c.v1
●
a)
s1 19.41 100 3.65% 15% x1 531.67
Para el Grupo 2 Hallando el ahorro mensual promedio para el Grupo 2: 6
x2
b)
x i1
6
i
2730 455soles 6
Hallando la varianza:
68
Tabla N° 24 xi
(x i x )
(x i x ) 2
400 450 500 450 460 470 2730
-55 -5 45 -5 5 15 -
3025 25 2025 25 25 225 5350
i
1 2 3 4 5 6 Total Donde: 6
(x
x) 2 5350
i
i1
Reemplazando dicho valor en la formula de la varianza de Cochran ya que n=6 < 30. 6
(x
s 22 i1 c)
i
x) 2
6 1
5350 1070 soles 2 . 5
Luego hallamos la desviación estándar :
s 2 1070 32.71 soles. d)
Finalmente hallamos el coeficiente de variación:
c.v1
s2 32.71 100 7.19% 15% 455 x2
La siguiente tabla muestra los resultados obtenidos en forma resumida:
GRUPO
x
1 2
531.67 455
Tabla N° 25 s 19.41 32.71
c.v. 3.65% 7.19%
< 15% <15%
Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos, se observa que en el Grupo 1 los ahorros son más estables.
69
Ejemplo 48:
Los siguientes datos corresponden a dos muestras aleatorias de dos grupos de trabajdores según su sueldo mensual en soles: Tabla N° 26 - GRUPO 1 Sueldo mensual en soles N° de trabajadores LI LS fi [550 [650 [750 [850 [950
Total
650) 750) 850) 950) 1050)
40 60 100 40 20 260
Tabla N° 27 - GRUPO 1 Sueldo mensual en soles LI LS [750 [850 [950 [1050 [1150 TOTAL
850) 950) 1050) 1150) 1250)
N° de trabajadores fi 30 50 80 40 10 210
¿Qué grupo tiene sueldos mensuales más homogéneos?
Solución: Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados:
●
a)
Para el Grupo 1 Hallando en primer lugar el promedio: 5
y1
y f i
i1
260
i
202000 776.92 soles 260
b) A continuación construiremos una tabla de trabajo para calcular la varianza: 70
Tabla N° 28 Li
-
Ls
[550 [650 [750 [850 [950
650) 750) 850) 950) 1050) Total
yi
fi
600 700 800 900 1000
40 60 100 40 20 260
(yi y)
( yi y) 2
-176.92 -76.92 23.08 123.08 223.08 -
31300.69 5916.69 532.69 15148.69 49764.69 -
(yi y)2 fi 1252027.6 355001.4 53269.0 605947.6 995293.8 3261539.4
Donde: 5
(y y) i
2
fi 3261539.4
i1
Reemplazando dicho valor en la formula de la varianza para n=260 > 30. 5
(y y) f 2
s12 i1
i
260
5
s 2 1
i
(y y) f 2
i
i
i1
260 5
(y y) f
(y y) 2 f1 (y2 y) 2 f2 (y3 y) 3 f3 (y4 y) 4 f4 (y5 y) 5 f5 1 260
31300.69 40 5916.69 60 53269.0 100 15148.69 40 49764.69 20 260
2
s12 i1
i
i
260
5
(yi y) 2 fi
s12 i1
260
5
(y y) f
1252027.6 355001.4 53269.0 605947.6 995293.8 280
3261539.4 260
2
s12 i1 c)
i
260
i
12544.38soles 2
Hallando la desviación estándar:
s1 12544.48 112.00 soles.
71
d)
Hallando el coeficiente de variación:
c.v1
s1 112.00 100 14.42% 15% y1 776.92
Para el Grupo 2 Hallando en primer lugar el promedio:
●
a)
5
y2
y f i
i1
210
i
205000 976.19 soles 210
b) A continuación construiremos una tabla de trabajo para varianza: Tabla N° 29 Li
-
[ 750 [ 850 [ 950 [1050 [1150
Ls
850) 950) - 1050) - 1150) - 1250) Total
yi
fi
800 900 1000 1100 1200 -
30 50 80 40 10 210
calcular la
(yi y)
( yi y) 2
(yi y)2 fi
-176.19 - 76.19 23.81 123.81 223.81 -
31042.92 5804.92 566.92 15328.92 50090.92 -
931287.60 290246.00 45353.60 613156.80 500909.16 2380953.16
Donde: 5
(y y) i
2
fi 2380953.16
i1
Reemplazando dicho valor en la formula de la varianza para n=210 > 30.
72
5
s 2 2
(y y) f 2
i
i
(y y)2 f1 (y2 y) 2 f2 (y3 y)3 f3 (y4 y) 4 f4 (y5 y) 5 f5 1 210
i
31042.92 30 5916.69 60 566.92 80 15328.92 40 50090.9210 210
i1
210 5
(y y) f 2
s12 i1
i
210
5
(y y) f 2
s12 i1
i
i
210
5
(yi y) 2 fi
s12 i1
210
5
(y y) f
2380953.16 210
2
s12 i1 c)
931287.60 290246.00 45353.60 613156.80 500909.16 210
i
210
i
11337.87 soles 2
Hallando la desviación estándar:
s1 11337.87 106.48 soles. d)
Hallando el coeficiente de variación:
c.v1
s1 106.48 100 10.91% 15% y1 976.19
Llevando acabo todo el proceso de cálculo del coeficiente de variación para cada uno de los grupos se obtiene los siguientes resultados: Tabla N° 30 s c.v. GRUPO x 1 2
776.92 976.19
112 106.47
14.42% 10.91%
< 15% <15%
Haciendo las comparaciones respectivas de los coeficientes de variación obtenidos, se observa que en el Grupo 2 los sueldos mensuales son más homogéneos.
73
3.2. MEDIDAS DE FORMA 3.2.1. DEFINICIÓN Miden la forma de distribución de los valores de la serie y se clasifican en simétricas o asimétricas y en puntiagudas o no. Por sus características requieren que los datos sean cuantitativos y por lo general continuos. 3.2.1. MEDIDAS DE ASIMETRIA Son medidas que miden el grado de deformación horizontal de una serie de datos o de distribución de frecuencias. Se dice que una distribución de frecuencias es simétrica, si los intervalos equidistantes del intervalo central tienen iguales frecuencias. También se dice que una distribución es simétrica si su curva de frecuencias es simétrica con respecto al centro de los datos. Dos distribuciones pueden tener la misma media y la misma desviación estándar, pero pueden diferir en el grado de asimetría. Si la distribución es simétrica, entonces la media, la mediana y la moda coinciden. En contraposición, si estos 3 promedios no coinciden la distribución es asimétrica. Entre las medidas de asimetría más usuales tenemos: - El Coeficiente de asimetría de Pearson Se expresa como:
As
3(x Me) s
Si:
AS = 0 AS > 0
La serie de datos o la distribución es simétrica. Ver fig. 1.
AS < 0
La serie de datos o la distribución es asimétrica negativa (sesgada a la izquierda). Ver fig. 3.
La serie de datos o la distribución es asimétrica positiva (sesgada a la derecha). Ver fig. 2.
74
Distribución Asimétrica Positiva
Md Me x fig. 1
Distribución Simétrica
x Me Md fig. 2
Distribución Asimétrica Negativa
x Me Md fig. 3
NOTA: Si As 0, entonces se dice que la distribución es aproximadamente simétrica o ligeramente sesgada. Será tanto más sesgada cuanto más As se aleje de cero.
Ejemplo 49: Calcular e interpretar el coeficiente de asimetría de los datos del Ejemplo 36 de la página 54. Solución: Utilizando el coeficiente de asimetría de Pearson : As
3(x Me) s
De los datos dados se ha obtenido:
x 3.3 min utos Me 3.7 min utos s
1.2 min utos
Reemplazando en la fórmula obtenemos:
75
As
3(3.3 3.7) 1 1.2
Interpretación: Este valor indica que la serie de tiempos de los clientes que visitan la página Google es asimétrica negativa. Ejemplo 50: Hallar el coeficiente de asimetría de Pearson del Ejemplo 37 de la página 55. Solución: Utilizando el coeficiente de asimetría de Pearson : As
3(y Me) s
De los datos dados se ha obtenido:
y 7.58inasistencias Me 7 inasistencias s 1.87 inasistencias Reemplazando en la fórmula obtenemos: As
3(7.58 7) 0.93 1.87
Interpretación: La distribución de trabajadores según su número de inasistencias es asimétrica positiva. En el siguiente gráfico podemos observar que que hay mayor concentración de datos a la derecha:
76
Nº de trabajadores
100 80 60 40 20 0 11
3
5
7
9
N° de inasistencias
Ejemplo 51: Hallar el coeficiente de asimetría de Pearson del Ejemplo 38 de la página 57. Solución: Utilizando el coeficiente de asimetría de Pearson : De los datos dados se ha obtenido:
y 37.5 años. Me 37.5 años. s 6.12 años. Reemplazando en la fórmula obtenemos: As
3(37.5 37.5) 0 6.12
Interpretación: La distribución de trabajadores según su edad en años es simétrica.
77
En el gráfico se observa que en hay igual concentración de datos a la izquierda y derecha.
100
Nº de trabajadores
80 60 40 20 0
Edad en años
0
25
30
35
40
45
50
37.5 y Me Md
3.2.2. MEDIDAS DE CÚRTOSIS La Kúrtosis es el grado de apuntamiento de una distribución. La cúrtosis se analiza amparando la distribución con la forma de una curva normal o simétrica, con igual media aritmética y desviación estándar de la distribución que se estudia. Si una distribución tiene relativamente un elevado pico o apuntamiento, se llama leptocúrtica, mientras si es achatada se denomina platicúrtica. La distribución normal constituye una distribución mesocúrtica, tal como se puede ver en las siguientes figuras: 78
Leptocúrtica
Mesocúrtica
fig. 4
Platicúrtica
fig. 5
fig. 6
El estadígrafo para analizar el apuntamiento es el coeficiente de kúrtosis y se expresa como: k
M4 s4
Donde: s 4 (s 2 ) 2 s 2 Varianza m
M 4
(y y) i
4
fi
i1
n
M 4 se llama: “cuarto momento respecto a la media” Si: K 3 , la distribución es normal o mesocúrtica. K 3 , la distribución es platicúrtica.
K 3 , la distribución es leptocúrtica.
79
Ejemplo 52: Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 37 de la pag. 55. Solución: a) Hallando en primer lugar el promedio de los datos dados: 5
y f
y i 1
i
240
i
1820 7.58 inasistencias 240
b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los valores hallados en la última columna, tal como se muestra en la siguiente tabla: Tabla N° 31 yi
fi
3 5 7 9 11 Total
(yi y)
10 30 100 80 20 ** Expresión errónea **
-4.58 - 2.58 - 0.58 1.42 3.42 -
(yi y) 4 440.01 44.31 0.11 4.07 136.81 -
(yi y) 4 fi 4400.01 1329.30 11.00 325.60 2736.20 ** Expresión errónea **
Donde: 4
5
(y y)
fi 8802.11
i
i1
c) Luego hallamos los momentos de orden 4 (M4 ) : 5
M 4
(y
i
240 5
M 4
(y
i
i 1
y) 4 fi 240
5
M4
y) 4 fi
i 1
(y
i
y) 4 fi
i 1
240 5
(y
i
y) 4 fi
440.0110 44.31 30 0.11100 4.07 80 136.81 20 240
4400.1 1329.30 11 325.60 2736.20 240
8802.11 240
_M 4 ci__1 36_._6_8 ina_s_i_s_te_ncias Elaborado por 24 : 0 Mg. Carmen Barreto R. Fecha : Julio 2013 Versión :3
4
80
Además: s 2 3.5 inasistencias 2 Entonces : s 4 12.25 inasistencias 4
Por lo tanto el coeficiente de cúrtosis está dado por: M4 s4 36.68 k 12.25 k 2.99 3 k
Interpretación: La distribución de trabajadores según su número de inasistencias es platicúrtica. Ejemplo 53: Calcular e interpretar el coeficiente de cúrtosis del Ejemplo 38 de la pag. 57 a) Hallando en primer lugar el promedio de los datos dados: 5
y f
y i 1
i
i
280
10500 37.5 años 280
b) Luego se deben hallar las marcas de clases de cada intervalo, luego elevar a la cuarta, seguidamente multiplicar por su respectiva frecuencia y finalmente sumar los valores hallados en la última columna, tal como se muestra en la siguiente tabla: Tabla N° 32 Li [25 [30 [35 [40 [45
-
Total
Ls
y
fi
30) 35) 40) 45) 50)
27.5 32.5 37.5 42.5 47.5 -
40 50 100 50 40 280
(yi y) -10 -5 0 5 10 -
(yi y) 4 10000 625 0 625 10000 -
(yi y)4 fi 400000 31250 0 31250 400000 ** Expresión errónea **
81
Donde: 4
5
(yi y) fi 862500 i1
c) Luego hallamos los momentos de orden 4 (M4 ) : 5
(y y)
M 4 i 1
5
i
4
fi
280
5
M
fi
280
5
4
4
i
(y y)
M 4 i 1
fi
280
(y y)
M 4 i 1
4
i
(y
y) 4 fi
i
i 1
280
10000 40 625 50 0 100 625 50 10000 40 280
400000 31250 0 31250 400000 280
862500 280
3080.36 años 4
Además: s 2 37.5 años 2 Entonces : s 4 1406.25 años 4
Por lo tanto el coeficiente de cúrtosis está dado por:
k
k
M4 s4
3080.36 1406.25
k 2.19 3
La distribución de trabajadores según su edad de años es platicúrtica.
82
AUTOEVALUACIÓN 03
1. La siguiente tabla corresponde a consumo de teléfono en soles de dos locutorios durante 7 meses: Locutorio 1
300
250
280
Locutorio 2
500
800
400
a) b) c) d) e) f) g)
27 0 30 0
320
290
200
700
Calcular la varianza para el locutorio 1. Calcular la varianza para el locutorio 2. Calcular la desviación estándar para el locutorio 1. Calcular la desviación estándar para el locutorio 2. Calcular el coeficiente de variación para el locutorio 1. Calcular el coeficiente de variación para el locutorio 2. ¿En que locutorio el consumo es más regular?
2. Los siguientes datos corresponden al índice de precios al consumidor en % (IPC) de la ciudad de Chimbote del año 2005: AÑO IPC
E
F
M
A
M
J
J
A
S
105.3 105.24 105.5 105.3 105.89 105.26 105.2 104.93 109.0 0 9 1 8
O
N
D
104.75 105.2 105.6 4 4
a) b) c) d)
Calcular la varianza e interpretar. Calcular la desviación estándar e interpretar. Calcular el coeficiente de variación e interpretar. ¿Se han mantenido estable el IPC en la ciudad de Chimbote para el año 2005? e) Calcular el coeficiente de asimetría e interpretar 3. Dos Empresas “X” e “Y” que pertenecen al rubro financiero ha considerado evaluar a sus trabajadores obteniéndose los siguientes resultados respecto a sus calificaciones Calificación media Desviación estándar
Empresa X 60 20
Empresa Y 60 15
¿Qué empresa tiene calificaciones más estables?
83
4. El gerente de una empresa analiza las ventas mensuales en dólares de sus promotores en los últimos 6 meses y considera que si la desviación estándar es menor de 747 dólares considera que sus ventas son regulares y decidirá contratarlos para los próximos 6 meses siguientes: Xi : 5000, 4500, 4800, 4600, 6000 ¿Qué decisión tomara el gerente? 5. Los siguiente tabla corresponde a las ventas mensuales en dólares de 32 empresas de productos agroinustriales: Ventas mensuales en $ LI LS [250 300) [300 350) [350 400) [400 450) [450 500) Total a) b) c) d) e)
Nº de empresas fi 6 8 12 4 2 32
Calcular la varianza e interpretar. Calcular la desviación estándar e interpretar. Calcular el coeficiente de variación e interpretar. Calcular el coeficiente de asimetría e interpretar. Calcular el coeficiente de cúrtosis e interpretar.
6. Las siguientes tablas corresponden a 2 hoteles turísticos categoría 3 estrellas de una misma cadena de hoteles según su consumo mensual en soles de los turistas hospedados: Hotel A Consumo mensual en N° de turistas $ fi Li - Ls [550 - 600) 10 [600 - 650) 20 [650 - 7 00) 40 [700 - 750) 20 [750 - 800) 10 Total 100
84
Hotel B Consumo mensual N ° de turistas en $ fi Li Ls [600 700) 5 [700 800) 10 [800 900) 15 [900 - 1000) 8 [1000 - 1100) 4 Total 42 a) Calcular la varianza para el Hotel A. b) Calcular la varianza para el Hotel B. c) Calcular la desviación estándar para el Hotel A. d) Calcular la desviación estándar para el Hotel B. e) Calcular el coeficiente de variación para el Hotel A. f) Calcular el coeficiente de variación para el Hotel B. ¿Qué hotel es más regular respecto al consumo mensual de los turistas hospedados? g) Cacular el coeficiente de asimetría para ambas distribuciones, además graficar y comentar. h) Calcular el coeficiente de cúrtosis para ambs distribuciones, además graficar y comentar.
85
CAPÍTULO IV NOCIONES DE PROBABILIDAD
4.1. EXPERIMENTO Un experimento es un proceso mediante el cual se obtiene el resultado de una observación. Un experimento puede ser determinístico o aleatorio. 4.1.1. Experimento determinístico: Cuando el resultado de la observación es determinado en forma precisa por las condiciones bajo las cuales se realiza el experimento. Ejemplo 54: - Lanzar una pelota en un tanque de agua y ver si flota o se hunde. - Soltar una piedra en el aire. - Observar la suma de dos números naturales pares. 4.1.2. Experimento aleatorio: Un experimento es aleatorio o no determinístico, cuando los resultados de la observación no se puede predecir con exactitud, antes de realizar el experimento. Ejemplo 55: - Observar el tiempo de vida de una computadora. - Elegir un presidente de un grupo de 50 personas. - Lanzar un dado y ver el número que aparece en la cara superior. 4.2. ESPACIO MUESTRAL Es el conjunto de resultados posibles de un experimento aleatorio. = {w/w es un resultado particular simple de la realización de un exp. aleat.} Los resultados posibles de un experimento se llaman puntos de muestra. Ejemplo 56: E1: Lanzar un dado y el observar el número que aparece en la cara superior. 1 = {1, 2, 3, 4, 5,6} E2: Observar los resultados de un partido de fútbol. 86
2 = {gana, pierde, empata} E3= Preguntar a una ciudadano en particular su edad en años. 3= {w R+/ w≥18} Los espacios muestrales se clasifican en: a) Espacio muestral discreto: Si se tiene un número finito o infinito numerable de elementos. b) Espacio muestral continuo: Cuando sus elementos son todos los puntos de un intervalo. 4.3. EVENTOS Son subconjuntos de un espacio muestral (). En particular el espacio muestral () y el conjunto vacío () son eventos. Al espacio muestral () se le llama evento seguro y al conjunto () se le llama evento imposible. Los eventos se denotan por las letras mayúsculas del abecedario: A, B, C, etc. 4.3.1. Tipos de eventos: a) Evento simple: Cuando contiene solamente un punto del espacio muestral. b) Evento Compuesto: Cuando puede expresarse como la unión de dos o más eventos simples. Ejemplo 57: Sea el experimento: lanzar una moneda dos veces y observar la cara superior. a) Liste los elementos del espacio muestral. b) Determinar los siguientes eventos: A1: Ocurre cara en el primer lanzamiento. A2: Ocurre sello en el segundo lanzamiento. A3: Ocurre por lo menos una cara. A4: Ocurre lo mismo en ambos lanzamiento.
87
CURSO ESTADÍSTICA
Solución:
Diagrama del árbol C C
S C
S S
a)
= {(c,c), (c,s), (s,c), (s,s)
b)
A1 = {(c,c), (c,s)} A2 = {(c,s); (s,s)} A3 = {(c,s), (s,c), (c,c)} A4 = {(c,c), (s,s)}
Ejemplo 58: Dado el siguiente experimento: E: Preguntar a dos empresas que venden por Internet su fuente principal de ingreso de comercio electrónico. Teniendo en cuenta que fuente principal de comercio electrónico es: P: Publicidad C: Comisiones y V: Venta de productos/Servicios a) b)
Liste los elementos del espacio muestral. Determine los elementos de los siguientes eventos: A: Que en ambas empresas la fuente principal de ingreso de comercio electrónico sea por venta productos / servicios. B:
Que solamente en la segunda empresa la fuente principal de ingreso de comercio electrónico sea por comisiones.
C:
Que en ninguna empresa la fuente principal de ingreso de comercio electrónico sea por publicidad.
D:
Que la fuente principal de ingreso de comercio electrónico sea por publicad o comisiones. 88
Solución: DIAGRAMA DEL ARBOL P C
P
V P C
C
V P V
C
V
a) PP, PC, PV, CP, CC, CV, VP, VC, VV
b) A VV B PC, VC
C CC, CV, VC, VV D PP, PC, CP, CC
89
4.4. OPERACIONES CON EVENTOS Usando las operaciones con conjuntos podemos formar nuevos eventos. Estos nuevos eventos serán nuevamente subconjunto del mismo espacio muestral de los eventos dados. a) Unión de eventos: A B Sean A y B dos eventos cualesquiera de un espacio muestral Ω. La unión de eventos es el evento que ocurre si A ocurre o B ocurre o ambos ocurren. Simbólicamente: A B = {w /wA v w B}
A
B
AB
A B
A B
AB
AB
b) Intersección de eventos: A B Sean A y B dos eventos cualesquiera de un espacio muestral Ω, la intersección de estos eventos, es el evento que ocurre si A y B ocurren simultáneamente. Simbólicamente: A B = {w / w A w B} A B
AB c) Complemento de un evento: A Si A es un evento del espacio muestral , se llama complemento del evento A, al evento que ocurre si A no ocurre.
90
Simbólicamente: A = {w / w A}
AC
A
d) Diferencia de Eventos: A – B Sean A y B dos eventos de un espacio muestral Ω, se llama diferencia de los eventos A y B, al evento formado por los elementos que son favorables a A pero que no son favorables a B. Simbólicamente: A – B = {w / w A w B} A B
AB AB e) Inclusión de eventos: A B Dado dos eventos A y B de un espacio muestral Ω, se dice que el evento A está contenido B, si siempre que ocurre A ocurre B. Simbólicamente: A B, si W a W B
Ω B A
A B
91
4.5. EVENTOS MUTUAMENTE COLECTIVAMENTE EXHAUSTIVOS
EXCLUYENTES
Y
EVENTOS
a) Una colección de eventos A1, A2,..., Ak definidos sobre un mismo espacio muestral. Se dice que son mutuamente excluyentes, si la ocurrencia de uno de ellos excluye la ocurrencia de los otros, es decir: Ai Aj
i j ; i 1, 2, ......., k
b) Se dice que una colección de eventos A 1, A2,...., Ak, definidos sobre el mismo espacio muestral son colectivamente exhaustivos, si la unión de ellos de ello es igual al espacio muestral. k
A1 A2 ....Ak Ai i 1
; i
1, 2, ......., k
4.6. PROPIEDADES DE LAS OPERACIONES CON EVENTOS Dado los eventos A, B y C de un espacio muestral Ω, se verifican las siguientes propiedades básicas de unión e intersección de eventos. a)
Ley conmutativa. AB=BA AB=BA
b)
Ley asociativa (AB) C = A (BC) (AB) C = A (BC)
c)
Ley Distributiva A (B C) = (A B) (A C) A (B C) = (A B) (A C)
d) Complemento del complemento c C (A ) = A 92
e)
A = A =AA AC = A A =A
f)
A =A A= A AC = AA=A
g)
Leyes de Morgan
A B A B Ω A
B
A B A B A B
i) A ( A B) ( A B)
AB
AB 93
j) Si A B, entonces
B
AB=ByAB=A
A
4.7. PROBABILIDAD Y ENFOQUES DE PROBABILIDAD Frecuentemente se usa el término probabilidad para sugerir que existe duda o incertidumbre sobre lo que ocurrió, lo que ocurre ocurrirá. La experiencia humana demuestra que existe una serie de hechos, acontecimientos, experimentos cuyos resultados no se pueden determinar anticipadamente; sin embargo si es posible definir, estimar o predecir el probable resultado. Podemos conocer el pasado, pero nunca el futuro, pero existe un permanente interés por despejar las incertidumbres. Las situaciones que implican incertidumbre varían desde simples juegos al azar, como la ruleta, los dados, los naipes, la lotería, los tragamonedas, etc. A otros experimentos y acontecimientos tan variados, complejos e importantes dentro de las ciencias médicas, ciencias sociales, la economía, las industrias, los negocios, los seguros, las inversiones, etc. Permanente interesa predecir o estimar lo que sucederá en ciertas circunstancias. Un empresario decide comercializar un producto si sabe que la probabilidad de aceptación es alta. El aficionado de fútbol, puede apostar contra su equipo favorito si sabe que la probabilidad de que gane es muy pequeña. Los inversionistas no deciden invertir en un país políticamente y económicamente inestable si saben que porque la probabilidad de obtener rendimientos futuros es baja. Es posible que ninguno de ellos sepa definir o medir la probabilidad, pero si encontrará útil la idea de estimarla intuitivamente. El propósito de esta sesión es ilustrar las formas en las que pueden medirse la posibilidad o probabilidad de ocurrencia de eventos futuros. Al mejorar la habilidad para juzgar la ocurrencia de eventos futuros, se puede minimizar el riesgo y la especulación arriesgada relacionada con el proceso de toma de decisiones. 4.7.1. PROBABILIDAD Es la posibilidad numérica de la ocurrencia de un evento casual. 94
4.7.2. AXIOMAS DE PROBABILIDAD a) La probabilidad de un evento cualquiera, es siempre positiva. P( A) 0 b) La probabilidad de un evento cierto o seguro, es la probabilidad del espacio muestral, que equivale a la unidad. P() 1 c) La probabilidad de la unión de una familia de eventos mutuamente excluyentes es igual a la suma de las probabilidades de dichos eventos. P( A1 A2 ..... Ak ) P( A1 ) P( A2 ) ....P( Ak ) k P Ai P( Ai ) i 1 i 1 k
4.7.3. TEOREMAS DE LOS AXIOMAS DE PROBABILIDAD De los axiomas de probabilidad resultan los siguientes teoremas: a) La probabilidad de un evento toma valores entre cero y uno. Es decir: 0 P( A) 1 b) La probabilidad de un evento nulo o imposible, es cero. Es decir: P( ) 0 c) La probabilidad del complemento de un evento está dada por: P( A) 1 P( A) d) Si el evento A es un subconjunto del evento B, entonces: P( A) P(B)
4.7.4. ENFOQUES O TIPOS DE PROBABILIDAD Existen tres enfoques para el estudio de la probabilidad. a) Enfoque clásico Llamada también probabilidad a priori debido a que es posible conocer el resultado con anterioridad, es decir, sin llevar a cabo el experimento y sólo basado en el razonamiento lógico. Se basa en el supuesto en que cada elemento del espacio muestral tiene la misma posibilidad de ser elegido. 95
Para un evento A cualquiera, entonces: P( A)
Casos favorables de ocurrencia del evento A Total de casos posibles
P( A)
n( A) n()
Ejemplo 59: Hallar la probabilidad de obtener cara en el lanzamiento de una moneda. Solución: El espacio muestral será: {c, s} Sea el evento A: obtener cara. Luego: P( A)
n( A) n()
P( A)
1 0.5 2
Ejemplo 60: Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado. Solución: El espacio muestral será: {1,2,3,4,5,6} Sea el evento B: Obtener el número 2. Luego:
96
P(B)
n(B) n()
P(B)
1 0.17 6
Las probabilidades clásica, se utiliza para experimentos simples, como los mencionados anteriormente. En la vida real se presentan situaciones más complejas que requieren el cálculo de probabilidad desde otro enfoque. b) Enfoque relativo El cálculo de este tipo de probabilidad se basa en la repetición de la ocurrencia de un evento, al realizar una gran cantidad de pruebas o experimentos. Para un evento A cualquiera, entonces: P( A)
P( A)
Número de veces que ocurrió el evento A Número total de observaciones f n
La probabilidad de frecuencia relativa, es llamada también empírica o a posteriori, debido a que se obtiene el resultado después de llevar a cabo el experimento. Ejemplo 61: En una encuesta realizada a 1500 pequeñas empresas de la ciudad de Lima, sobre el número de medidas de seguridad se encontró los siguientes resultados:
97
N° de medidas de seguridad
TABLA N° 33 N° de Empresas
Ai
fi
0 1 2 3 4 Total
100 800 300 250 50 1500
P( Ai ) 0.07 0.53 0.20 0.17 0.03 1.00
a)
¿Cuál es la probabilidad de que las pequeñas empresas tengan 2 medidas de seguridad? P(A2)=0.20 El 20% de las empresas tienen 2 medidas de seguridad.
b)
¿Cuál es la probabilidad de que las pequeñas empresas tengan más de 2 medidas de seguridad? P(Ai > 2) = P(A4) + P(A5) = 0.17 + 0.03 = 0.20 El 20% de las pequeñas empresas tienen más de 2 medidas de seguridad.
c) Enfoque subjetivo Es la probabilidad asignada bajo un criterio personal, basado en cualquier tipo de evidencia disponible. Las probabilidades subjetivas se asignan a eventos que pueden suceder solo una vez o muy pocas veces. Ejemplo 62: a) La probabilidad que una mujer llegue a ser presidenta de los EE.UU. b) La probabilidad que el hombre viva eternamente. c) La probabilidad que quiebre la bolsa de valores de New York.
4.8. REGLAS DE PROBABILIDAD Estudiaremos la probabilidad del producto y de la suma.
98
4.8.1. PROBABILIDAD DEL PRODUCTO: P(AB) Se utiliza para calcular la probabilidad conjunta o simultánea de dos o más eventos. A
B
Ω
P(A B) Se toman en cuenta dos aspectos: a) Que los eventos A y B sean dependientes, Entonces la ocurrencia conjunta de los eventos es: P( A B) P( A) P(B / A) b)
Que los eventos A y B sean independientes, se debe cumplir: P( A / B) P( A) Entonces la ocurrencia simultánea de los eventos independientes A y B es: P( A B) P( A) P(B)
4.8.2. PROBABILIDAD DE LA SUMA: P(AB) Se usa cuando se desea averiguar la probabilidad de ocurra al menos un evento. Se toma en cuenta dos aspectos: a) Que los eventos sean traslapados o unidos: P( A B) P( A) P(B) P( A B) A
B P(A B) 0
99
Si A y B son independientes, entonces:
P( A B) P( A) P(B) P( A) P(B) b) Que los eventos A y B sean mutuamente excluyentes, la probabilidad de que ocurra A ó B es: P( A B) P( A) P(B) A
B
P(A B) 0
4.9. PROBABILIDAD CONDICIONAL Es utilizada cuando se desea conocer la probabilidad de ocurrencia de un evento condicionado a la ocurrencia previa de otro evento. Se calcula mediante la fórmula: P( A / B)
P( A B) con P(B) 0 P( B)
El símbolo / se lee: DADO, SI y expresa condición. Donde: P(A/B) se lee: Probabilidad deque ocurra el evento A, dado que el evento B ya ha ocurrido. Ejemplo 63: Se ha determinado que la probabilidad de televidentes que ven los programas A y B son respectivamente 0.40 y 0.5. Cada televidente ve los programas independientes uno del otro. Si se elige al azar uno de tales televidentes ¿Qué probabilidad hay de que vea ambos programas?
100
Solución: A: Televidentes que ven el programa A.
P(A) = 0.4
B: Televidentes que ven el programa B.
P(B) = 0.5
AB: Televidentes que ven el programa ambos programas. A y B son independientes
P(BA) = P(A) x P(B) = 0.2
Gráficamente observamos: P(A) 0.4
P(B) 0.5 0.2
P(A B)
La probabilidad de que los televidentes vean ambos programas es 0.2. Ejemplo 64: Los alumnos del II ciclo de Ingeniería de Sistemas tienen que realizar dos pruebas, una teórica y otra practica en la signatura de estadística. La probabilidad de que un estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebe la práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. 1. 2. 3.
¿Cuál es la probabilidad de que el alumno no apruebe ninguno de los exámenes? ¿Cuál es la probabilidad de que el alumno apruebe solamente la parte teórica? ¿Cuál es la probabilidad de que el alumno apruebe al menos uno de los cursos?
101
Solución: Sean los eventos: T : El alumno aprueba la parte teórica. P(T) = 0.6 C : El alumno aprueba la parte práctica. P(C) = 0.8 TC : El alumno apruebe la parte teórica y la parte práctica. P(TC) = 0.5
P(A) 0.60
P(B) 0.80 P(A B) 0.90
P(A B)
0.10
0.5
0.30
P(B A)
P(A B) P(A B) 0.1
a)
P(A B) P(A B) 0.1
b)
P(A B) P(A) P(A B) P(A B) 0.10
c)
P(A B) P(A) P(B) P(A B) P(A B) 0.6 0.8 0.5 P(A B) 0.9
102
Ejemplo 65: Si P(A)= 3/5,
P(B) = 3/6
y P(A∩B) = 1/4
Calcular: a) P(B)
b) P(A B)
d) P(B A)
e) P(A / B)
c) P(A B)
Solución:
P(A) 0.6
P(B) 0.5 P(A B) 0.85
P(A B)
0.25
0.35
0.25
P(B A) P(A B)
P(A B) 0.15
a)
P(B) 1 P(B) P(B) 1 0.5 P(B) 0.5
b)
P(A B) P(A) P(A B) P(A B) 0.6 0.25 P(A B) 0.35 103
c)
P(A B) P(A) P(B) P(A B) P(A B) 0.6 0.5 0.25 P(A B) 0.85
d)
P(B A) P(A B) P(A B) 1 P(A B) P(A B) 1 0.85 P(A B) 0.15
e)
P(A / B)
P(A B) P(B)
P(A / B)
0.25 0.5
P(A / B) 0.50
Ejemplo 66: Si P(A) = 1/5 y P(B) = 1/4 y los eventos A y B son independientes, hallar: a) P(A B)
b) P(A B)
P(B A)
e) P(A B)
d)
c) P(A / B)
104
Solución:
P(A) 0.2
P(B) 0.25 P(A B) 0.45
P(A B)
0.05
0.15
0.20
P(B A)
P(A B)
P(A B) 0.55
a)
P(A B) P(A) P(B) P(A B) 0.2 0.25 P(A B) 0.05
b)
P(A B) 1 P(A B) P(A B) 1 0.45 P(A B) 0.55
c)
P(A / B)
P(A B) P(B)
P(A / B)
0.05 0.25
P(A / B) 0.20
105
d) P(B A) P(B) P(A B) P(B A) 0.25 0.05 P(B A) 0.20 e) P(A B) P(A B) 1 P(A B) P(A B) 1 0.45 P(A B) 0.55 Ejemplo 67: En la Escuela de Administración de Empresas, 3 de 4 estudiantes saben informática, el 50% saben manejar Windows y el 30% saben manejar Linux. a) ¿Que porcentaje saben manejar los dos sistemas? b) ¿Que porcentaje sabe manejar solamente Windows? c) ¿Que porcentaje sabe manejar solamente Linux? d) ¿Que porcentaje no saben informática? Solución: Análisis: i) Se sabe que 3 de 4 estudiantes saben informatica, lo que quiere decir que: P(A B) 0.75
ii) Entonces 1 de 4 estudiantes no saben informática, lo que quiere decir: P(A B) 0.25 iii) El 50% saben manejar windows, lo que quiere decir: P(A) 0.5
iii) El 30% saben manejar linux, lo que quiere decir: P(B) 0.3
106
iv) ¿Cuántos manejan ambos programas? P(A B) ? Sabemos que: P(A B) P(A) P(B) P(A B) P(A B) 0.5 0.3 0.75 P(A B) 0.05 P(A) 0.5
P(B) 0.3 P(A B) 0.75
P(A B)
0.05
0.45
0.25
P(B A)
P(A B)
P(A B) 0.25 a)
P(A B) P(A) P(B) P(A B) P(A B) 0.5 0.3 0.75 P(A B) 0.05 El 5% de los estudiantes saben manejar los dos sistemas.
b)
P(A B) P(A) P(A B) P(A B) 0.5 0.05 P(A B) 0.45 El 45% de los estudiantes saben manejar solamente windows.
c) P(B A) P(B) P(A B) P(B A) 0.3 0.05 P(B A) 0.25 107
El 25% de los estudiantes saben manejar solamente linux. d)
P(A B) 0.25 El 25% de los estudiantes no saben informática.
Ejemplo 68: El 40% de las empresas de una ciudad realizan su publicidad a través de la TV. el 20% a través de Internet y el 15% en ambos medios de comunicación. a) ¿Cuál es la probabilidad que una empresa realice su publicidad en al menos uno de los medios de comunicación? b) ¿Cuál es la probabililidad de que una empresa haga su publicidad solamente en la TV.? c) ¿Cuál es la probabilidad de que una empresa no realice publicidad en ninguno de los medios de comunicación? d) ¿Son los dos eventos mutuamente excluyentes? e) ¿Son los dos eventos independientes estadísticamente? f) ¿Son los eventos colectivamente exhaustivos? Solución: Sean los eventos: A : La empresas realizan su publicidad en la TV. P(A) = 0.4 B : La empresas realizan su publicidad por Internet. P(B) = 0.2 AB : La empresas realizan su publicidad en ambos medios de comunicación. P(A) = 0.15
108
P(A) 0.4
P(B) 0.2 P(A B) 0.45
P(A B)
0.15
0.25
0.05
P(B A)
P(A B)
P(A B) 0.55
a)
P(A B) P(A) P(B) P(A B) P(A B) 0.4 0.2 0.15 P(A B) 0.45
b)
P(A B) P(A) P(A B) P(A B) 0.4 0.15 P(A B) 0.25
c)
P(A B) 1 P(A B) P(A B) 1 0.45 P(A B) 0.55
d) Para que los eventos sean mutuamente excluyentes se debe cumplir lo siguiente: P(A B) 0 pero P(A B) 0.15 0
109
e) Para que los eventos sean independientes estadísticamente se debe cumplir lo siguiente: P(A B) P(A) P(B) P(A B) 0.4 0.2 P(A B) 0.08 pero P(A B) 0.15 0.08 P(A B) 0.05 Por lo tanto los eventos no son independientes estadísticamente. f) Para que los eventos sean colectivamente exhautivos: A B pero A B (A B) por lo tan to :
A B Los eventos A y B no son colectivamente exhautivos.
Ejemplo 69: Se sabe que la probabilidad de que una persona viaje al Perú en la linea aérea TACA es de 0.7 y de que viaje en la linea aérea STARPERU de 0.5. (Eventos Independientes). a) ¿Cuál es la probabilidad de que una persona viaje al Perú en ambas líneas aéreas. b) ¿Cuál es la probabilidad de que una persona viaje solo en la linea aérea TACA. c) ¿Cuál es la probabilidad de una persona viaje en al menos una de las líneas aéreas? Solución:
110
Sean los eventos: A : Las personas viajan al Perú en la linea aérea TACA. P(A) = 0.7 B : Las personas viajan al Perú en la linea aérea STARPERU. P(B) = 0.5 AB :
Las personas viajan al Perú en ambas lineas aéreas. P(A) = 0.35
P(A) 0.7
P(B) 0.5 P(A B) 0.85
P(A B)
0.35
0.35
0.05
P(B A)
P(A B)
P(A B) 0.15
a)
P(A B) P(A) P(B) P(A B) 0.7 0.5 P(A B) 0.35
b)
P(A B) P(A) P(A B) P(A B) 0.7 0.35 P(A B) 0.35
c)
P(A B) P(A) P(B) P(A B) P(A B) 0.7 0.5 0.35 P(A B) 0.85
111
4.10. TABLAS DE PROBABILIDAD 4.10.1. DEFINICIÓN.- Son aquellas que se obtienen a través de las tablas de contingencia aplicando los criterios dados. La siguiente Tabla N° 34 de probabilidades muestra las probabilidades conjuntas y marginales para una Tabla de Contingencia de manera general: Tabla N° 34 P(Bj)
P(B1)
P(B2)
P(Ai) P(A1) P(A2) . . .
P(A1B1) P(A2B1) . . .
P(A1B1) P(A2B2) . . .
P(Ar) Total
P(ArB1) P(B1)
P(ArB2) P(B2)
......
P(BK)
Total
...... ...... . . . ...... ......
P(A1BK) P(A2BK) . . .
P(A1) P(A2) . . .
P(ArBK) P(BK)
P(Ar) 1
Ejemplo 70: Se llevó acabo una encuesta con respecto a la preferencia del consumidor respecto a tres marcas competitivas de computadoras (A, B y C) y la modalidad de Speedy para el uso del Internet en su hogar, los resultados se muestran en la siguiente tabla: Tabla N° 35 MODALIDAD SPEEDY MARCA DE COMPUTADORA A B C TOTAL
SPEEDY 200
SPEEDY 400
SPEEDY 600
100 300 200 600
200 250 300 750
300 400 450 1150
Si se elige un consumidor al azar, calcular la probabilidad de que a) Prefieran la modalidad Speedy 400. b) Prefiere la computadora de marca A. c) Prefiera computadora de marca B y la modalidad Speedy 600.
112
TOTAL 600 950 950 2500
d) Prefiera la computadora de marca C, si la modalidad Speedy 200 e) Prefieran la modalidad Speedy 200, si la computadora es de marca A. f) Prefiera la computadora de la marca A o B. Solución: Tabla N° 36 MARCA DE COMPUT. P(A) P(B) P(C) TOTAL
P(200) 100/2500=0.04 300/2500=0.24 200/2500=0.08 600/2500=0.24
MODALIDAD SPEEDY P(400) 200/2500=0.08 250/2500=0.12 300/2500=012 750/2500=0.30
TOTAL
P(600)
300/2500=0.12 600/2500=0.24 400/2500=0.16 950/2500=038 450/2500=0.18 950/2500=0.38 1150/2500=0.46 1.00
a) P(400)=0.30 El 30% de los consumidores prefieren la modalidad Speedy 400. b) P(A)=0.24 El 24% de los consumidores prefieren la computadora de la marca A. c) P(B600)=0.16 El 16% de los consumidores prefieren la computadora de la marca B y la modalidad Speedy 600. d) P(C / 200)
P(C 200) 0.08 0.33 P(200) 0.24
El 33% de los consumidores que prefieren la modalidad Speedy 200, prefieren la computadora la computadora de la marca C. e) P(200 / A)
P(200 A) 0.04 0.17 P(A) 0.24
El 17% de los consumidores que prefieren la computadora de la marca A prefieren la modalidad Speedy 200. f) P(A B) P(A) P(B) 0.24 0.38 0.62 El 62% de los consumidores prefieren la computadora de la marca A o marca B.
113
Ejemplo 71: Una empresa que fabrica cámaras de video produce un modelo básico y un modelo de lujo. El año pasado, 40% de las cámaras vendidas han sido del modelo básico. De los compradores del modelo básico, 35% compran una garantía ampliada, mientras que 50% de los compradores de lujo también lo hacen así. Se pide: 11. Construir la tabla de probabilidad. 12. Si elige un comprador al azar, calcular la probabilidad de que: b.1) Tenga una cámara de video de un modelo de lujo. b.2) Tenga una cámara de video de un modelo de lujo, si tiene una garantía ampliada. b.3) Tenga una cámara de video de un modelo de básico y compre una garantía ampliada. b.4) Compre una garantía ampliada, si la cámara de video es de modelo de lujo. Solución: a) Construyendo la tabla de probabilidad: B: El comprador compra una cámara de video de modelo básico. P(B)=0.40 L: El comprador compra una cámara de video de modelo de lujo. P(L)=0.60 A: El comprador compra una garantía ampliada. A : El comprador no compra una garantía ampliada. Además i) P(A / B) 0.35 P(A / B)
P(A B) P(B)
Entonces : P(A B) P(B) P(A / B) P(A B) 0.40 0.35 P(A B) 0.14
114
ii)
P(A / L) 0.50
P(A / L)
P(A L) P(L)
Entonces : P(A L) P(L) P(A / L) P(A L) 0.60 0.50 P(A L) 0.30 A través de las operaciones realizadas se obtiene la siguiente tabla de probabildad: Tabla N° 37 Modelo P(B) P(L) Garantía Total P(A) 0.14 0.30 0.44 P( A )
0.26
0.30
0.56
Total
0.40
0.60
1.00
b) Hallando las probabilidades de los eventos dados: b.1.)
P(L) 0.60 El 60% de los compradores tienen una cámara de lujo.
b.2.)
P(L / A)
P(L / A)
P(L A) P(A) 0.30 0.68 0.44 115
El 68% de los compradores que compran una garantía ampliada tiene una cámara de video de lujo. b.3.)
P(L A) 0.30
El 30% de los compradores compran una garantía ampliada y tienen una cámara de video de lujo. b.4.)
P(A / L)
P(A / L)
P(A L) P(L) 0.30 0.50 0.60
El 50% de los compradores que tienen una cámara de video de lujo, han comprado una garantía ampliada. Ejemplo 72: La siguiente tabla corresponde a 1000 turistas peruanos según que acostumbran en sus viajes de vacaciones y el tipo de ciudad pasar sus vacaciones: Tabla N ° 38 Forma de Pago Ciudad Cuzco Huaraz Efectivo 200 150 Tarjeta crédito 300 200 Cheques de viajero 100 50 Total 600 400
a) b) b.1) b.2) b.3) b.4) b.5)
la forma de pago que eligieron para
Total 350 500 150 1000
Construya la tabla de probabilidad. Si se elige un turista al azar calcular la probabilidad de que : Pague en efectivo y elija la ciudad del Cuzco para viajar. Elija viajar al Cuzco. Pague con tarjeta de crédito. Pague con tarjeta de crédito, si elige viajar a Huaraz. No viaje al Cuzco, ni pague en efectivo.
116
Solución: a) Construyendo la tabla de probabilidad: Tabla N° 39 Forma de Pago Ciudad P(B1) P(A1) 0.20 P(A2) 0.30 P(A3) 0.10 Total 0.60
P(B2) 0.15 0.20 0.05 0.40
Total 0.35 0.50 0.15 1.00
b) b.1)
P(A1 B1 ) 0.20
El 20% de los turistas pagan en efectivo y eligen la ciudad del Cuzco para viajar. b.2)
P(B1 ) 0.60
El 60% de los turistas eligen la ciudad del Cuzco para viajar.
b.3)
P(A2 ) 0.50
El 50% de los turistas pagan con tarjeta de crédito. b.4) P(A 2 / B2 )
P(A 2 B2 ) P(B2 )
P(A 2 / B2 )
0.20 0.40
P(A 2 / B2 ) 0.50 El 50% de los turistas que eligen viajar a Huaraz, pagan con tarjeta de crédito.
117
b.5) P(B1 A1 ) P(A 2 B 2 ) P(A 3 B 2 ) P(B1 A1 ) 0.20 0.05 P(B1 A1 ) 0.25
El 25% de los turistas no viajan al Cuzco, ni pagan en efectivo. Ejemplo 73: El 35% de los créditos de un banco es para vivienda, el 50% para industrias y el 15% para consumo diverso. Resultan fallidos el 20% de los créditos para vivienda, el 15% de los créditos para industrias y el 70% para créditos para consumo. a) Construir la tabla de probabilidad. b) Si se elige un crédito al azar, calcular la probabilidad de que: b.1) resulte exitoso y sea para vivienda. b.2) resulte exitoso, si es para industria. b.3) resultoso exitoso. b.4) sea para vivienda o industria Solución: Determinado los eventos: V: Los crédito son para vivienda.
P(V) = 0.50
I: Los créditos son para industria.
P(I) = 0.35
C: Los créditos son para consumo diverso.
P(C) = 0.15
E: Los créditos son éxitosos.
P(E) = ?
F : Los créditos son fallidos.
P(F) = ?
Además: 118
i) Resultan fallidos el 20% de los créditos para vivienda:
P(F / V) 0.2 Entonces :
P(F / V)
0.2
P(F V) P(V)
P(F V) 0.35
P(F V) 0.07 ii) Resultan fallidos el 15% de los créditos para industria: P(F / I) 0.15 Entonces : P(F / I)
0.15
P(F I) P(I)
P(F I) 0.5
P(F I) 0.075
iii) Resultan fallidos el 70% de los créditos para consumo diverso:
119
P(F / C) 0.7 Entonces : P(F / C)
0.7
P(F C) P(C)
P(F C) 0.15
P(F V) 0.105 a) Construyendo la tabla de probabilidad: Tabla N° 39 Resultado de crédito
b) b.1)
b.2)
Tipo de crédito P(I)
P(C)
P(E)
P(E∩V)=0.28
P(E∩I)=0.425
P(E∩C)=0.045
0.75
P(F)
P(F∩V)=0.07
P(F∩I)=0.075
P(F∩C)=0.105
0.25
Total
0.35
0.50
0.15
1.00
P(E V) 0.28
P(E / V)
P(E / V)
P(E V) P(V) 0.28 0.35
P(E / V) 0.8
b.3)
Total
P(V)
P(E) 0.75
120
b.4)
P(V I) P(V) P(I) P(V I) 0.35 0.50 P(V I) 0.85 AUTOEVALUACIÓN 04
1. Si P(A)= 0.3, P(B) = 074 ; Sabiendo que A y B son independientes. Calcular: a) P( A B )
b) P( A B )
c) P( B )
d) P( B / A )
2. La clase de estadística tiene 35 estudiantes. 20 cursan la clase de matemáticas, 18 cursan la clase de economía y 10 cursan ambas materias. Encuentre la probabilidad de que, al seleccionar un estudiante al azar, el estudiante: a) Curse economía o matemáticas. b) Ni curse matemáticas ni curse economía. c) Curse economía pero no matemáticas. d) Curse economía o matemáticas pero no ambas. 3. Hay 1000 trabajadores en la empresa Kiddie Carts International, de esos 770 son de pro ducción, 20 son supervisores, 100 son secretarias y el resto son administrativos Suponga que se selecciona un trabajador de ese grupo, calcular la probabilidad de: a) b) c) d)
Sea de producción. No sea secretaria. Sea secretaria o administrativo. No sea de producción, ni supervisor.
4. Una bolsa tiene 20 fichas numeradas del 1 al 20. Si se saca una al azar ¿Cuál es la pro babilidad de que la ficha extraída tenga un número que sea múltiplo de 4. 5. Se realizó una encuesta a 1200 personas según sexo en la ciudad de Chimbote para conocer el uso del vehículo a favor de mejorar el medio ambiente USO DE VEHICULO
SEXO
Total
MASCULINO
FEMENINO
Renunciar
200
100
300
Reducir
300
400
700
No haría caso
150
50
200
Total
650
550
1200
121
Se pide: a) Construir la tabla de probabilidad. b) Si se elige una persona al azar calcular la probabilidad de que : b.1) Sea de sexo femenino y reducir el uso del vehículo. b.2) Renuncie al uso del vehículo, si es de sexo femenino. b.3) Que no haga caso al uso del vehículo. b.4) Que no renuncien al uso del vehículo, ni sean de sexo femenino. 6) El 20% de los empleados de una empresa son ingenieros y el otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras los que no son ingenieros ni economistas solamente el 20% ocupan un puesto directivo. Se pide: a) Construir la tabla de probabilidad. b) Si se elige un empleado al azar calcular la probabilidad de que: b.1) No sea directivo. b.2) No sea economista, ni directivo. b.3) Sea directivo, si es ingeniero. b.4) que no sea ingeniero. 7. Determine el enfoque de probabilidad en los siguientes enunciados: a) La probabilidad de obtener un número par en 10 fichas numeradas del 1 al 10 es 0.5. ………………………………………… b) La probabilidad de que ocurrencia de femicidio en nuestro país va en aumento. ………………………………………… 5.
REFERENCIAS BIBLIOGRÁFICAS · Barreto, C.R, (2007). Estadística Básica – Aplicaciones (2da. Ed.), Edit. SUA Uladech. Chimbote – Perú. · Córdova, M. (2002). Estadística Inferencial (4ta. Ed.). Edit. Moshera. Lima – Perú. · Behar, R. (2006). 55 respuestas a dudas típicas de estadística. Obtenido de http://site.ebrary.com/lib/bibliocauladechsp/docDetail.action? docID=10135772&p00=estadistica · De la Puente, V. (2009). Estadística descriptiva e inferencial y una introducción al método científico. Obtenido de http://site.ebrary.com/lib/bibliocauladechsp/docDetail.action? docID=10378624&p00=estadistica. • Ruiz, D. (s.f). Manual de Estadística. Recuperado de http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm.
122