Cuadernos
administració
íslica ll
Vníversidad lnca Qarcilaso de la Vega fuucrroJ Tlcrnpos. Nt¡c{ras ldces
FONDO
EDITORIAL
-
Estadística ll Walter
Céspedes
Ramírez
Serยกe.' Cuadernos de Ciencยกas Admยกnistrativas
y Ciencias Econรณmicas
Vniversidad
lnca Qarcilaso de la Vega [utvoa Tleñpor. Nuavat ldarr ¡.ONDO EDITORIAL
Estadística
WnrrrR CÉspeors RavÍnrz
Il
FrcHA Título: Autores: Categoría:
rÉcNlcn
Estadísttca ll
Walter Céspedes Ramírez Cuadernos / Ciencias Administrativas y Ciencias Económicas
Código: Edicrón: Formato: lmpresión: Soporte: lnteriores: Publicado:
CU/786-701
I
Fondo Editorial de la UIGV 170 mm x 245 mm )92 pp. Offsett y encuadernación en Cubierta: folcote calibre 12. Bond alisado de 80 g Lima, Perú. Junio del 20 I
rúlica
I
Universidad lnca Garcilaso de la Vega Rector: Luis Cervantes Liñán
Vicerrector: Jorge Lazo Manrique Decano de la Facultad de Ciencias Administrativas y Ciencias Económicas: Raúl González Herrera Jefe del Fondo Editorial: Lucas Lavado
Secretario Técnico de Conselo Ejecutivo de Educación a Distancia: José Ochoa Pachas
O
Universidad lnca Garcilaso de la Vega Av Arequipa l84l - Lince leléf.: 47 l -19 19 Página web: www, uigv.edu. pe Fondo Editorial Editor: Lucas Lavado
Correo electrónico: llavadom@hotmail.com Jr. Luis N. Sáenz 557 - Jesús María TeléÍ.: 461-2745 Anexo: 3712 Correo electrónico: fondo_editorial@uigv.edu.pe Blog: fondouigv, blogspot.com Secretaría Técnica del Consejo Ejecutivo de Educación a Distancia Av, Petit Thouars 421 - Lima
Teléf:433-5755
/433-0ll
I Anexos: 1330,
l33ly
1337
Coordinación académica: Carmen Zevallos Choy Diagramación: Nérida Curazzi Gutiérrez
Estos textos de educación a distancia están en proceso de revisión y adecuación a los estándares internacionales de notación y referencia, El contenido del libro es responsabilidad de la Facultad de origen.
Hecho el Depósito Legal en la Biblioteca Nacional del Perú N" )01 l-07175
INDICE Presentación
11
Introducción
13 77
-Or¡entac¡ones metodológ¡cas PRIMERA UNIDAD VARIABLE ALEATORIA Y PROBABILIDADES
Lecc¡ón
1.1
25
1
TEORÍA DE CON]UNTOS......
1.1.1 7.7.2 1.1.3
operación d" u";;:::::..... ...... Operación de Intercepción.,, Operac¡ón de Complemento
27
.........,:::.... . ...... ....... .
27 29 29
Lección 2
t.2
COM8INATORIA................... 7.2.7 Factoriarde ...::........:.....::.:.::.::.::::................ "" ^i;;;; 7.2.2 Permutac¡ones....
TEORÍA
31 32 33 1.2.2.1 Permutaciones sin elementos repet¡dos y s¡n reemplazo 33 1.2,2,2 Permutac¡ones sin elementos repet¡dos y con reemplazo 33
1.2.2.3 Permutac¡ones sin elementos repet¡dos, sin reemplazo, tomando todos .............. 1.2.2.4 Permutac¡ones sin elementos repetidos, sin reemplazo, tomando todos para ser ub¡cados en círculo ........... 1.2.2.5 Permutac¡ones con elementos repetidos sin reemplazo tomando todos ................ ... 1.2.2.6 Permutaciones con restr¡cc¡ones
1.2.3 Comb¡nac¡ones
34 34 34 35
37
5
ESTADíSTICA II
Lección 3
1.3 PROBABILIDADES 1.3.1 Teorema del conjunto vacío................. 7.3.2 Teorema del complemento 1.3.3 Teorema de la adición....... 1.3.3.1 Eventos excluyentes 1.3.3.2 Eventos no excluyentes o regla adit¡va 1.3.4 Teorema de la multiplicac¡ón ... . .............. 1.3.4.1 Sucesos independientes 1.3.4.2 Sucesos depend¡entes ..... 1.3.4.3 Probabilldad condic¡onal
47 42
42 43
43 43 43 43
43 44
Lección 4
7.4
VARIABLE ALEATORIA
1.4.f 7.4.2 7.4.3
........
Esperanza matemática o med¡a aritmét¡ca...
.................
..
Var¡anza............ Desviación estándar
47 47
48 48
Autoevaluación No 1 Exploración on line
52
Glosa rio
54
54
SEGUNDA UNIDAD
MODELOS DE DISTRIBUCIÓN DE PROBABILIDADES ........ ...,,,..
Lecc¡ón
2.7
57
1
MODELO 8INON4I4L....................
2.1.7 Característ¡cas 2.7.2 Definición 2.7.3 Prop¡edades.......
59 59 59
60
Lecc¡ón 2
2,2
N4ODELO
2.2.1 2.2.2 2.2.3
DE
Ca
POISSON
racterísticas.
.....
63
.
63
..
Defi n¡ción
64
Propiedades
64
Lección 3
2.3
MODELO NORM41............
2.3.7 Ca 2.3.2 Defi nic¡ón 2.3.3 Propiedades 2.3.4 Teorema del Límite central ............. 2.3.5 Como util¡zar la Tabla Área bajo la curva normal ................ racterísticas.
.. .
67 68 68 69
69 70
Lección 4
2,4
MODELO T- STUDENT,.....
2.4.1
Características....
76
WALTER CÉSPEDES RAM ÍREZ
76 77 77
2.4.2 2.4.3 2.4.4
Lecc¡ón 5
2.5
MODELO JI
-
81
CUADRADO
2.5.7
B2
) \)
82 82 83
2.5.3 2.5.4
Lección 6
2.6
MODELO F DE FISHER......
87
Características.... Defi nición
BB BB
Propiedades Como util¡zar la Tabla F de F¡sher...........
89 89
2.6.7 2.6.2 2.6.3 2.6.4
Autoevaluación No 2 Exploración on line
91 93
Glosario
93
TERCERA UNIDAD 95
TEORÍA DEL MUESTREO Y ESTIMACIóN ESTADÍSTICA
Lección 1
3.1 MUESTREO 3.1.1 T¡pos de muestreos.....................
3.t.2 3.1.3
97 97
3.1.1.1 El número de muestras tomadas de una población dada para un estudio ............ 3.1.1.2 Muestreo de juicio de una persona ... 3.1.1.3 Muestreo de selecc¡ón aleator¡a Error muestral o error de muestreo ....,...... Error
estándar
Lecc¡ón 2
3,2
DISTRIBUCIONES MUESTRALES Distr¡buc¡ón muestral de medias Distr¡buc¡ón muestral de proporc¡ones D¡stribuciones muestrales de diferencias de med¡as y
3.2.7 3.2.2 3.2.3
..
98 98
98 100 100
101 105 108
de ....
ProPorc¡ones...... 3.2.4 D¡stribuc¡ones muestrales de varianzas y de desviac¡ones estándares
111
774
Lecc¡ón 3
3.3
TEORÍA DE LA ESTIMACIÓN ESTADÍSTICA ..,,...
115 115
ESTADíSTICA II
3.3.4 3.3. s
3.3.1.1 Estimación puntual 3.3.1.2 Estimación por intervalos.. Intervalo de confianza para la media Intervalo de confianza para las proporciones ..................... Intervalo de confianza para las dlferenc¡as ........................ Intervalo de confianza para la varianza y para la
116
desviación estándar
130
Lección 4
3,4
TAMAÑO DE LA
3.4.7 3.4.2 3.4.3
3.4.4
MUESTRA.
777 118
723 L26
133
Cuando se conoce la varianza poblacional ........................ cuando se conoce la proporción poblacional Cuando se mide la d¡ferencia entre la desv¡ac¡ón típ¡ca o estándar muestral con la poblac¡onal ............................. Cuando solo se conoce el tamaño de la población según F¡sher
734 734 135 135
Autoevaluación No 3 Exploración on line
138
Glosa r¡o
74t
747
CUARTA UNIDAD 743
TEoRÍA DE LA DECISIóN ESTADÍSTICA
Lecc¡ón
4.7
1
HIPÓTESIS 4.1.1 Formulación de las h¡pótes¡s,..
4.L.2 4.1.3
t46 t46
T¡pos de errores 4.1.3.1 Error de Tipo 4.1.3.2 EÍror de Tipo
748
I IL............
146 146 747 747
..
HIPóTESIS media.....
PROCEDIMIENTO PARA UNA PRUEBA DE
4.2.7 4.2.2 4.2.3 4.2.4 4.2.5
Prueba Prueba Prueba Prueba Prueba
de de de de de
Lección 3
4,3
146
4.1.1.1 H ipótesis nula (H0) 4.1.1.2 Hipótes¡s alternativa (H1) ................ Tipos de ensayos o pruebas.......... 4.1.2.1 Ensayo bilateral............. 4. 1.2.2 Ensayo unilateral derecha ............. 4.1.2.3 Ensayo un¡lateral izquierda
Lecc¡ón 2
4.2
145
PRUEBA DE
ANÁLISIS DE LA
4.3.1
hipótes¡s hipótes¡s hipótes¡s hipótes¡s hipótes¡s
para para para para para
la
148 148
749 150
las proporciones . . .. . . . . . . . . .. . . . . . . .. . .. 156 las diferencias............................ 161 las var¡anzas 767
variables
VARIANZA
Anál¡s¡s de la var¡anza a una sola
cua1itativas...................
vía...................
767
777
77A
WALIER CÉSPEDES
4.3.2
RAM íREZ
4.3.1.1 Análisis de dos varianzas poblacionales.................. 4.3.1.2 Anál¡s¡s de dos var¡anzas muestrales 4.3.1.3 Anál¡s¡s de una var¡anza muestral y otra poblacional Análisis de la varianza a doble vía
186
195 195
Glosario
QUINTA UNIDAD,
REGRESION Y CORRELACION
5,1
181 183
t92
Autoevaluación No 4 Exploración on line
Lección
778
197
1
DIAGRAIV]A DE DlSPERSIÓN
199
Lección 2
5.2
REGRESIÓN
5.2.1 Ajuste en una func¡ón de regres¡ón s¡mp|e......................... 5.2.2 El Método de Los mínimos cuadrados.......... 5.2.3 Regresión lineal s¡mp|e...... 5.2.4 Regres¡ón de la parábola....
203 204 205 2O5
210
Lecc¡ón 3
5.3 CORRELACIÓN 5.3.1 Esquema de una correlac¡ón 5.3.2 5.3.3
215 216 de Pearson...... 5.3.1.1 Coeficiente de determ¡nación (r'z) .........,............... 216 217 5.3.1.2 Coeficiente de correlación ( r) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Correlac¡ón s¡mple ............. 5.3.2.1 Correlac¡ón l¡neal s¡mple.... 5.3.2.2 Correlac¡ón de la parábola Correlación de Spearman (p)............
217 277
.
220 222
Lección 4
5.4
ANALISIS DE SERIES CRONOLóGICAS 5.4.7 Componentes de una serie de tiempo...-...... 5.4.1.1 Var¡ac¡ones cíclicas (C).-................. 5.4.1.2 Variaciones estac¡onales (S).................... 5.4.1.3 Variac¡ones irregulares (I) ....... . 5.4.1.4 Tendencia (T).................... 5.4.2 Promedios móv¡les en una serie de t¡empo (P¡4)................. 5.4.3 Índice estacional en una serie de tiempo.......... 5.4.4 Ecuación de la recta por mín¡mos cuadrados cuando 2X = 0 5.4.5 Proyección de los datos con aplicaclón del índice estac¡onal .
225 225 225 226
226 226 226 22A
233 236
238 247 247
Autoevaluación No 5 Exploración on line Glosario
,
SEXTA UNIDAD 243
NúN4ERos Íruorces
Lecc¡ón1 6.
1
rrrúN4eno
.............
6.1.1 Nociones sobre números índices .............. 6.L.2 Clasificación de los números índices por su contenldo ......... 6.1.2.1 Índice simp|e.............. 6.1.2.2 Índice compuesto
Lecc¡ón 2
6.2
Í¡¡oIce
245 245
246 246 249
257 COMPUESTOS 251 Índices de agregados no ponderados... Índices de promedlos relativos no ponderados................... 254 257 Índices de agregados ponderados 6.2.3.1 Índice de agregados ponderados por el método de .
MÉTODOS PARA CALCULAR ÍITIOICTS
6.2.f 6.2.2 6.2.3
Laspeyres..
.......
.
258
6.2.3.2 Índice de agregados ponderados por el método de Paasche
260
Lecc¡ón 3
6,3
Lección 4
6,4
265
CAMBIO DE BASE DEL ÍruOICC.......,,.....
ÍNDICE
VARIACIONES DEL Var¡ac¡ones con relación a un periodo de
6.4.7 6.4.2
269
referencia........,...
Varlac¡ones con relación al per¡odo anterior
......................
27O
277 275
Autoevaluación No 6 Explorac¡ón on line
279 279
Glosario
Bibliografía complementaria
280 281
Anexos
283
B¡bliografía básica
0
PRESENTACION Esta serie, cuadernoseúne los trabajos que los docentes han elaborado como parte de un proyecto mayor. Son textos breves con
orientaciones y contenidos precisos para el desarrollo de una materia, que, a manera de apuntes de clase, están dirigidos al programa de ed ucación a distancia. El diseño, elaboración y edición de textos para educación a distancia son tareas apasionantes. Son labores que comprometen a profesionales de diversas áreas empeñados en buscar medios y procedimientos para que la transmisión de contenidos sea eficiente. En esta perspectiva se plantea la utilización de estos materiales con un sentido práctico, no solo para atender los requerimientos inmediatos de la educación a distancia, sino para iniciar un proceso de seguimiento y control que permita, luego de una rigurosa revisión y actualización, convertirlos en libros concluidos y abiertos a todos los lectores.
La educación a distancia es una experiencia, en la galaxia lnternet, de un proyecto universitario globalizado cada vez más competitivo. La universidad que enfrente esta tarea con visión multidisciplinar y con enfoque sistémico tendrá éxito. En este sentido va esta propuesta: interacción permanente e investigación para la docencia y el aprendizaje en un complejo mundo de cambios vertiginosos y retos permanentes. Jefe del Fondo Editoria
INTRCDUCCNON
de brindar a todos los estudiantes de Administración y a los de Economía, los conocimientos necesarios para tomar decisiones de calidad con rapidez y precisión El
objetivo principal de este manual,
es el
mediante el uso de herramientas estadísticas, tomando como base el muestreo (Parte de los datos) para realizar proyecciones o inferencias. Para lograr tal objetivo; es conveniente enseñar a los alumnos de esta asignatura, que las probabilidades ayudan a conocer que tan
quetan lejos están nuestras metas, no solo sirve para saber icuál es la probabilidad de obtener bola roja o bola blanca en un
cerca o
número determinado de extracciones?, o Zcuál es la probabilidad de determinar que un trabajador llegue tarde a su centro de labores?; sino; que son muy útiles y cuando las probabilidades son asociadas a una variable determinada, se puede conocer, medidas estadística muy importantes, como son: La media aritmética, la varianza, la desviación estándar etc.; la importancia de asociar una variable con su probabilidad respectiva, radica en que con ella, no es necesario conocer cada uno de los datos que participan en una muestra o en una población para poder interpretarla, como lo hace la Estadística Descriptiva.
a l 3§
La probabilidades tienen un campo de acción muy amplio por que son aplicaciones que se dan en diferentes áreas y en diferentes situaciones, que ha hecho de que se desarrollen modelos que coadyu-
ven a la toma de decisiones a través de estimaciones estadísticas; existen modelos de probabilidad aplicables a: variables discretas (Modelos: binomial, Poissón, etc.), Variables continuas (Modelos: normal, T-Student, .Ji-cuadrado, Fisher, etc.). Estos modelos mayormente son relacionados con variables numéricas (Paramétricas), pero
también son asociados con variables no numéricas (No paramétricas), sobresaliendo principalmente el modelo Chi-cuadrado que ayuda en el análisis de las variables investigadas. Como ya se ha mencionado, con la variable aleatona podemos saber como están distribuidos los datos, pero los alumnos además deben conocer cual es el tamaño suficiente de datos, para medir
el margen de error que pueden cometer en la estimación; con la Teoría del Muestreo, se puede definir la manera de lograr este objetivo para estar consciente en que medida podemos equivocarlos al hacer nuestras aseveraciones (estimaciones), para ello se debe contar con la ayuda de datos como son: promedios, proporciones, varianzas, diferencias de medias, diferencias de proporciones, etc.; tales estimaciones pueden ser puntuales (un solo valor), o pueden ser por intervalos (dentro de dos valores extremos), para definir el verdadero valor poblacional (Parámetro). Se ha hablado de la toma de decisiones como instrumento
importante en el desempeño de una función administrativa, pues esta asignatura le brinda al alumno la oportunidad de saber tomar tal decisión a través un procedimiento estadistico muy sencillo sobre: promedios conocidos, proporciones aceptables, varianzas, sumas o diferencias de medias, sumas o diferencias de proporciones, etc.; tales decisiones se pueden tomar dando los siguientes pasos: 1o Definir las hipótesis: Nula y Alternativa de decisión. 2o Determinar el tipo de ensayo, unilateral o bilateral. 3o Con el nivel de significación. determinar el punto crítico de
4o
decisión. Determinar el estadístico muestral de decisión que corresponda
al caso.
5o
Diseñar el esquema incluyendo el o los puntos críticos de decisión.
6" 7o
Efectuar los cálculos con los datos del caso utilizando el estadístico. Con los resultados obtenidos, tomar la decisión correspondiente.
§
t4§
Con los pasos señalados anteriormente, la toma de decislones en Estadística es sencilla, por que se tiene un esquema con una o dos áreas sombreadas, en donde se fljan los puntos críticos de decisión
(valores) que son las regiones de rechazo; si el valor calculado a través del estadístico cae dentro de la región sombreada, entonces se rechaza la hipótesis nula a analizar, en caso contrario se acepta; es deci¡ que si usted plantea correctamente las hipótesis, puede tomar con facilidad su decisión. Otra herramienta muy impodante para la formación profesional del alumno, es la Teoría de la regresión y correlación de datos. Con la Regresión, usted puede asociar dos variables una dependiente de la otra (Y = F(X)), con la ayuda de funciones maternáticas (recta o parábola entre otras). Con la Correlación, usted puede saber que tan cerca o tan lejos está el valor calculado por la función (regresión) del valor utilizado (real); también puede sabe¡ que función matemática define mejor la regresión. Cuando la variable rndependiente (x) en la regresión es el tiempo, el alumno puede proyectar la variable dependiente (y) con las mismas características de la información utilizada, aplicando la influencia estacional a través del Análisis de series cronológicas.
Finalmente, mediante los números índlces usted podrá conocer indicadores de carácter sociales y económicos que también tienen gran influencia en decisiones administrativas. Tales lndicadores son valores relativos que se obtienen dividiendo dos cantidades con las mismas características en el tiempo, una 1l¿mada base y la otra llamada dada, que al ser comparadas nos permite determinar como han variado las mismas en el tiempo. Los indicadores mayormente usados en la actividad económico empresarial son los de: Precios, Cantidad y Valor; au nque ta mbién existen los ratios en la actividades Contables y Financiera, además de los indicadores soclales.
Al término del estudio de este Manual Autoinstructivo, el alumno debe entender que los conocimientos que ha adquirido a través del mismo, no es la culminación de todos los elementos cuantitativos y que ya está en condiciones de tomar decisiones de índole empresarial, en cualquier nlvel de la misma; sino, que ha empezado a entender la actividad empresaria en términos cuanti tativos, y debe comprender que la estadística, es solo parte de esta compleja actividad. El autor
,t5!i
orient ac io nes METODOLOGICAS
Z
El Manual Auto¡nstructivo, que está al alcance de usted, esta
compuesto por 6 unidades temáticas y se ha elaborado con
la
intención de que al haberse matriculado en esta asignatura pueda autoinstru irse.. 1. Estructura
el MAI de Estadísttcbodas las unique esta facultad ha considerado como dades temát¡cas del sílabo para la enseñanza de esta asignatura en todas las de necesidad, modalidades de estudio incluyendo la modalidad a distancia. Las Se está incluyendo en
unidades temáticas que se incluyen, son: Primera Unidad Sequnda Unidad Cuarta
Unidad Unidad
Quinta
U
Tercera
: Variable aleatoria y las probabilidades
:
Modelos de distribución de probabilidades
:
Teoría del muestreo y estimación estadÍstica
: Teoríadeladecisiónestadísticayanálisisde la varianza
Sexta
nidad : Regresión,
Unidad :
correlación y análisis de series cronológicas Números índices
I
2. Sumilla Primera Unidad En esta unidad el alumno conocerá la importancia del uso de una variable aleatoria en las investigaciones de naturaleza estadística, usted puede observar que no es necesario conocer en forma descriptiva toda la información que se va ha analizar, aún tratándose de una muestra ya que el binomio probabilidad y vanable, permiten obtener conclusiones valederas sobre el comportamiento de dicha variable. Si las medidas más importantes en toda investigación estadística entre otras, están por ejemplo la media aritmética (promedio) y la Varianza (grado de variabilidad); inmediatamente nos preguntamos ¿Cómo conseguir información para obtener tales medidas estadística? si queremos hacer una investigación.
Pues la respuesta no está en conseguir una buena muestra de datos necesariamente para conocer el promedio y la variabilidad entre ellos, sino en identificar la variable de estudio y con las probabilidades respectivas dentro de su estructura, se puede obtener el promedio y la variabilidad utilizando un procedimiento sencillo que conocerá usted en la presente unidad
Segunda Unidad En esta unidad el alumno ampliará sus conocimientos sobre probabilidades, tomando como base modelos probabilísticos que son de diferentes características y servirán para reforzar la importancia de la Variable Aleatoria, en lo que respecta a la Media Aritmética y a la Varianza. Iambién nos proporcionan las bases para las inferencias (estimaciones) estadísticas, determinando los puntos críticos que se utilizan en las estimaciones por intervalos y en la toma de decisiones estadísticas.
Distribuir probabilidades, consiste en presentar los datos probabilísticos en forma ordenada, mediante el uso de tablas y gráficos con la finalidad de interpretarlos en forma sencilla y práctica. Los modelos que se verán en esta unidad, son modelos de probabilidad de variable discreta y de probabilidad de variable continua. Los modelos de probabilidad que a continuación se mencionan, son los que se verán en esta unidad: - El Modelos Binomial. - El Modelos de Poisson. - El Modelo Normal. - El Modelo T-Estudent. - El Modelo li-Cuadrado o Chi-Cuadrado. - El Modelo F de Fisher
lr8I
WALTER CÉSPEDES RAM ÍREZ
Tercera Unidad
En esta unidad El alumno conocerá parte de la Estadística lnferencial, con la Teoría del Muestreo aprenderá que a partir de muestras podrá estimar cantidades a nivel poblacional. El muestro es la actividad por la cual con ciertos criterios de decisión, se toma cierto número de muestras de una población, y es importante porque a través de él se pueden hacer análisis de situaciones sobre una empresa o sobre algún campo de la sociedad que se investigue.
Una vez recogida la o las muestras, con o sin reemplazo,
se
procede ha calcular los estadígrafos y con ellos habrá de realizar un nuevo proceso estimación o inferencia estadística. que se describe
como el proceso de estimar un parámetro a partir del estimador correspondiente, llamado estimación estadística que el alumno conocerá al término de esta unidad. En el proceso inferencial, se pueden utilizar determinados nÚmeros de muestras y de ellas, un número determinado de estadígrafos; luego con la información recogida, se construye una tabla de distri-
bución de frecuencias. Si los estadígrafos son Medias Aritméticas, entonces la distribución de los datos será una Distribución Muestral de Medias; si los estadígrafos son Varianzas, entonces la distribución de los datos será una Distribución Muestral de Varianzas; también existen Distribuciones Muestrales de Proporciones si la característica recogida de la muestra es una proporción que nos pueda interesar como: la proporción de hombres, la proporción de aprobados, etc. Las distribuciones muestrales de cualquier estadÍgrafo son procesos inferenciales; es decir, son procedimientos por medio de los cuales al conocer las características muestrales se estiman los respectivos parámetros, dependiendo del tipo de estimador utilizado. Finalmente al término de la unidad temática, usted aprenderá determinar cual es el tamaño de la muestra más apropiado para a una investigación, dependiendo de la información que tenga sobre lo que pretende analizar. Si usted no tiene ninguna información sobre lo que va a investigar, ello no es impedimento para elegir el tamaño de su muestra, por también existen procedimientos para estas ocasiones
Cuarta Unidad En esta unidad el alumno ampliará sus conocimientos sobre Estadística lnferencial a través de la Prueba de Hipótesis, por que muchas veces se desea conocer por ejemplo, si el número mensual de llamadas por teléfono en Lima es de 100 o si un determinado
§ t9ffi
ESTAD ÍST
ICA
II
analgésico tiene un 90% de efectividad de curar un resfrío; estas afirmaciones se pueden someter a pruebas y determinar si es verdad o no es verdad lo afirmado. Todo comienza con la formulación de las hipótesis. Las hipótesis conceptuales del estudio deben traducirse en hipótesis estadísticas o logísticas; un ejemplo de hipótesis conceptual sería: ¿Esta relacionado el parámetro bioquímico con la aparición más frecuente de la enfermedad B?; estas hipótesis conceptuales se formulan de manera natural y suelen ser fácilmente comprensibles, al contrario de la hipótesis estadística. Las hipótesis estadÍsticas se establecen mediante características de las poblaciones de origen. Las poblaciones de origen están
definidas por parámetros, que son valores de la distribución fijos pero desconocidos; estos parámetros poblacionales se asemejan a los estadísticos muéstrales y se estiman a partir de estos últimos. lvlediante los datos muestrales podremos aceptar o rechazar, con cierto grado de confianza determinado valor numérico de una hipótesis hecha sobre una población determinada; tal proceso se conoce como contraste de hipótesis estadísticas o aplicación de una prueba estadística y está íntimarnente ligado con esta metodología la estimación de parámetros poblacionales a través de los intervalos de confianza. Cuando se toma la decisión de rechazar o aceptar la h¡pótesis Nula, se corre el riesgo de equivocarse como en cualquier decisión que el investigador tome, la diferencia de este tipo de decisión está en que se puede medir el margen o porcentale de cometer error. Qu inta u nidad En esta unidad el alumno conocerá otra pafte de la Estadística lnferencial; con la Regresión se estudiará un método matemático para estimar el valor de una variable, basándose en el valor de otra variable; con la Correlación, se determinará el grado de relación entre dos o mas variables y si se comparan varias funciones mate
máticas, la correlación nos dirá cual de ellas es de mejor ajuste a los
datos observados; con el diagrama de dispersión, se representará a manera de dibujo o esquema, como se distribuye la información actualy la información proyectada; finalmente con el análisis de series cronológicas a través de la regresión y de la correlación, se harán proyecciones en el tiempo por utiliza como variable independiente solo el tiempo.
)t)
WALTER CÉSPEDES RAMíREZ
Entiéndase por Análisis de regresión como una técnica empleada
para desarrollar la ecuación o función matemática basada en una variable dependiente de otra u otras variables independientes, el método que se utilizará en la determinación de la regresión, será el método de Mínimos Cuadrados para dar las estimaciones basadas en dicha fu nción. Sobre el análisis de correlación que se tocará en esta unidad temát¡ca, se determinará por el método por Mínimos Cuadrados, la intensidad de asociación o grado de relación entre las variables que componen la ecuación que se correlacionan; también, se puede utilizar este tipo de análisis para comparar entre si, varias funciones matemáticas aplicadas a un mismo caso, producto de la comparación el grado más alto de correlación deierminará cual función es mejor para el caso que se investiga. Para representar la relación entre dos variables en forma gráfica, se confecciona el Diagrama de Dispersión, mediante el cual se visualiza de manera objetiva como se relacionan ambas variables; dicho gráfico puede hacerse con la información existente o real y también con la información calculada o proyectada. Una vez que el alumno ha conocido las bondades de la Regresión y de la Conelación, entonces estará en condiciones de darle una aplicación más real a la proyección de los datos utilizando la técnica Análisis de Series Cronológicas, que consiste en separar de una serie de datos en el tiempo, la influencia estacional que es la más fuerte. Este tipo de análisis tiene dos restricciones: una es que utiliza una sola variable independiente y la otra es que la variable independiente necesariamente es el tiempo. Sexta
U
nidad
En esta unidad el alumno completará sus conocimientos estadísticos para los negocios ya que ha aprendido el uso de: las Probabilidades y de cómo reemplazar a la Estadística Descriptiva a través de la Variable Aleatoria; la TeorÍa del lvluestreo y como se estima el parámetro poblacional con las estimaciones por intervalos de confianza, la Toma de Decisiones sobre la lnferencia Estadística y a encontrarle mayor aplicación a las Varianzas, a hacer predicciones en eltiempo con gran aceptación mediante elAnálisis de Series Cronológicas, para finalmente analizar a través de los Números Índices, como varían las cifras en el tiempo al compararlas con otra cifra de referencia llamada base.
¡21§
ESTADíSTICA II
Al paso de los años los Numeros indices han llegado a
ser
cada vez más importantes para cualquier actividad incluyendo a la de administración, como indicadores de la cambiante actividad económica o de negocios; de hecho, su uso se ha convertido en el procedimiento de más amplia aceptación. Los Números indices, constituyen un sencillo artificio para comparar los términos de una o varias series cronológicas; considerando ésta última como una sucesión de observaciones de una variable tomada en instantes sucesivos. También sirven para analizar valores agregados o valores ponderados que forman una necesidad de estudio, entre los más importantes está:el costo v¡da que no depende de un solo producto, el crecimiento de una nación mediante el Producto Bruto lnterno (PBl), etc.
3. Estrategias de aprendizale 1' Para facilitar el entendimiento de esta asignatura, se recomienda tener claro lo aprendido en la asignatura de EstadÍstica.
2'Debe tener siempre a la mano: cuaderno, lápiz o Iapicero, borrador y una calculadora que tenga más funciones de aquellas que solo manejan las 4 operaciones aritméticas. 3" Leer con detenimiento cada ítem de una unidad temática y una vez entendido lo que se dice allí, resolver los ejercicios propuestos, por cada ítems.
4'Culminada la primera unldad, resolver la prueba auto evaluativa que está al final de la misma, luego comparar las respuestas obtenidas con las claves de respuestas que se dan. 5" Si ha respondido correctamente al menos 9 de los 15 ejer cicios, usted está en condiciones de seguir con la siguiente unidad, en caso contrario, se recomienda hacer un repaso.
Nota importa nte: 5i por alguna razón no logra entender con facilidad cualquier
tema de los mencionados, probablemente por haber olvidado algunos conceptos básicos matemáticos que son necesari05 tener presente; se recomienda revisar los conceptos olvidados o solicitar asesoría que le sirva de orientación en el aprendizaje de Estadística ll..
WALTER CÉSPEDES RAMÍREZ
4. Evaluación Para aprobar la asignatura habrán 2 exámenes obligatorios y uno opcional que son:
.Examen parcial, que incluye las tres primeras unidades temáticas. 1
2.Examen final, que incluye las tres últimas unidades temáticas.
3. Examen sustitutorio, es opcional e incluye todas las unidades del curso; este examen solo lo pueden rendir los alumnos desaprobados en promedio de los exámenes: parcial y final.
Se desea a usted mucha suerte y se le felicita por cada unidad
aprendida.
123
I
primera
UNIDAD r--...._.....---...-"........-.....--
..,
..
,
-
Variable aleatoria y
probabilidades
Sumario Teoría de conjuntos.
Ieoría combinatoria: factorial, permutaciones, combinaciones. Probabilidades: teoremas Variable aleatoria: esperanza matemática, varianza, desviación estándar
oBJErvo(s) GENEML:
.
Al término de esta unidad el alumno ha encontrado la razón
de existencia de las probabilidades, por que al ser aplicadas a una determinada variable, va a poder hallar estadísticos o parámetros, tan igual como lo hace la eladística descriptiva. También ha aprendido que a través de las técnicas para contar, va ha hallar el número de repeticiones posibles, apoyándose en
las permutaciones
y en las combinaciones, que son utilizadas las veces que se repite un
por las probabilidades para conocer experimento al azar. ESPECíFICOS:
Conocer mediante los con.luntos
las
tres operaciones base, que
son aplicadas directamente a las probabilidades. Saber que con las técnicas para contar, se puede encontrar el número de variaciones posibles de "n" datos tomados en grupos definidos.
Puede definir el espacio muestral
y
calcular las probabilidades
respectivas del suceso de una variable, a través de sus teoremas.
Conocer cuales son las bondades de la variable aleatoria, como se utiliza en la inferencia estadística, y lo más importante, con esta herramienta se pueden determinar estadílicos sin necesidad de conocer toda la información como lo hace la estadística descriptiva.
a76a
Lecció
l.l
n
I
Teoría de conjuntos
La teoría de Conjuntos es una herramienta importante para entender el comporta-
miento de las operaciones probabilísticas; por ejemplo el alumno muchas veces tiene diñcultad para entender cuando se tienen que sumar, restar o multiplicar; las probabilidades, cuando se asocian dos o más sucesos. Entre los conjuntos existen tres operaciones básicas relacionadas estrictamente con las probabilidades, tales operaciones son;
1,1.1 )peración de Unión (U)
AUB={x/xeAveB} Se lee, "A" unido a "B". Está conformado por un elemento "x", tal que "x" pertenece a "A" ó pertenece a "B".
e27a
rsrRoísrrcn
l
1,1,2 )peración de lntercepción (lt):
A0B={x/xeAneB}
lee: "A" interceptado a Está conformado por un
Se
*8".
elemento "x", tal que "x" pertenece a "A" y pertenece
*8"
a
1.1.3 )peración de Complemento (A):
u = {x/xÉA}
lee: El complemento de A Está conformado por un elemento
Se
"x", tal que "x" no pertenece a "A".
Ahora bien, considerando que las operaciones de conjuntos, son operaciones "o" (unión), operaciones "y" (intersección) y operaciones "no" (complemento). En probabilidades, también se consideran esas mismas opciones, que son:
a) Probabilidad de A unión B: P,ou, Se lee como la probabilidad de A ó B, y por lo tanto la operación a realizar será, la suma de la probabilidad de A más la probabilidad de B, menos la probabilidad de la intercepción de ambos sucesos (véase más adelante, 1,3,3. Teorema de la adición).
b) Probabilidad de A intersección B: P1on.¡
Se lee como la probabilidad de A y B, y por lo tanto la operación a realizar será la multiplicar la probabilidad de A porla probabilidad de B (véase más adelante,7,3,4. Teorema de la multiplicación).
c) Probabilidad del complemento de A: P,u,
Se lee como la probabilidad de no A, y por lo tanto la operación a realizar será I menos la probabilidad de A (véase más adelante,l,3,2. Teorema del complemento).
§28#
WALTER CÉSPEDES RAM fREZ
El alumno debe haber notado que las tres operaciones base de conjuntos, se apl¡can d¡rectamente a las probabilidades ya que en estas últimas solo caben las preguntas: ¿cuál es la probabilidad de A ó B?, ¿cuál es la probab¡l¡dad de A y B?, y también la pregunta icuál es la probabil¡dad de no A?
Cons¡derando la relación que ex¡ste entre Teoría de Conjuntos con Probabilidades, el alumno sabrá que operaciones de aritmética realizar en el cálculo de probabil¡dades; ante las interrogantes ya expuestas, tal relación se resume de la s¡guiente manera:
Relación entre la Teoría de Conjuntos con las Probabilidades Operación de Teoría de Conjuntos
n¡ón Intersección Complemento U
Lectura
Operación de Proba bilidad
(U)
o
Suma
(O)
v
Multiplicación
(")
no
Resta de
1
Le
C
o
C
n
2
1.2 Teoría combinatoria Son procedimientos que se ut¡lizan para determinar las veces que se puede presentar un grupo de elementos al ser seleccionados entre otros con determinadas características. Es un método práctico que se util¡za para conocer el número de resultados posibles de un experimento que puede ser aleatorio o al azar; es decir que esta teoría, es tamb¡én aplicable a las probabilidades ya que con la teoría combinatoria se puede determinar las veces que se pude presentar un suceso que al relacionarlo con su un¡verso.
Por ejemplo una gran empresa desea codificar a sus trabajadores para darles una identificación propia de acuerdo a la fecha de ingreso, para ello desea ut¡l¡zar 2 letras y 2 dígitos.
l
ESTADfSTICA II
¿Cuántos trabajadores pueden ser contratados, con reemplazo de Ia letra o del dígito ya seleccionado?
EEil EET
=
26'zx 10'z= 67 600
el primer y segundo casillero pueden entrar desde la letra A hasta la Z (26); En el tercer y cuarto casillero pueden entrar desde el número 0 hasta el 9 (10). En caso de que la empresa no desee contar con el primer código En
AAOO, entonces restaremos 1 a 67 600 y nos quedan 67 599 códigos posibles.
Tamb¡én si las comb¡naciones de las dos letras, no deben estar acompañadas por dos ceros, entonces habrá que restar 676 (26'?) al total 67 600 y nos quedan 66 924 cód¡gos disponibles.
¿cuántos trabajadores pueden ser contratados, sin reemplazo de la letra o del dígito ya seleccionado?
rTEtr En el En el En el En el
=
26x25
x10x9 =
58500
pr¡mer casillero pueden entrar desde la letra A hasta la Z (26). segundo cas¡llero pueden entrar solo las letras que quedan (25). tercer casillero pueden entrar los números desde el 0 hasta el 9 (10). cuarto cas¡llero pueden entrar solo los números que quedan (9).
Tal como se ha observado, esta técnica para contar es bastante práctica, además de los procedim¡entos formales que pueden ser ut¡l¡zados para contar; tales procedimientos son los que se expl¡can a continuación.
1,2,1 Factorial de un número (l) Es el producto de todos los números consecut¡vos que com¡enzan desde la un¡dad hasta el m¡smo número inclusive o viceversa, como por ejemplo:
(n (5 (1 (0
!) !) !) !)
Se Se Se Se
lee factor¡al den lee factorial de5 lee factorial de 1 lee factorial de 0
! = n (n- 1) (n- 2) (n - 3)...2x 5!= 5x4x3x2x1 = 120 1! = 1 0! = 1 n
1
Por excepción, el factor¡al de cero (0) es igual a 1, porque en caso contrario todo el producto seria 0. Sepa que no existe factorial de un número negat¡vo.
3)
WALTE R CÉSPEDES RAfYÍREZ
Resolver los s¡9u¡entes ejerc¡c¡os propuestos sobre Factorial:
1) 2) 3) 4) 5) 6) 7) 8) 9)
10)
5! + 4! - 1! 10! - [9! + (7! X 3l)] (3! + 5! + 6!) - (5! x 0!) 4(2! + 8!) 3(0! + 1!) - 3! 10(8! + 4! - 6l) 10[(8! - 5!) - (2! x 3! x 4! x 7! - (61 + 5l) 8l / I x7 12!
Resp: Resp: Resp: Resp: Resp: Resp: Resp: Resp: Resp: Resp:
5!)]
/ 10!
143
3 235 680 726 161 288 0
396 240 56 400
4 200 6! = 720 12 x 11 = 132
1.2.2 Permutaciones (.Pk) Es una técnica de conteo que se caracteriza por cons¡derar s¡empre el orden en que se presentan los elementos o datos. Existe variedad de permutac¡ones y entre las más importantes se pueden considerar: I
.2.2.1 Permutociones sin elemenlos repetidos y sin reemplozo: ("Pu)
= n!/(n-k)l
Eierc¡cios resueltos:
1)
¿Cuántas permutaciones se pueden lograr si se desea premiar con: pr¡mer, segundo y tercer puesto a elecc¡ón entre 10 vendedores?
Solución: (,"P.) =
2)
101
/
(70
- 3)t
= 720
¿Cuántas permutaciones se pueden lograr con los dígitos: 7, toman 4 dígitos con exclus¡ón o sin reemplazo?
Solución:
(uPo)
=
6l
/
(6 -
2, 3, 4, 5 y 6 si
se
4)! = 360
1.2.2.2 Permutociones sin elemenl,os repetidos y con reemplozo: ("Pu)
=
nk
Ejerc¡cios resueltos:
1)
¿Cuántas permutaciones se pueden lograr con los dígitos: toman 4 díg¡tos con reemplazo?
Solución:
(uP")
=
6a = 1296
l,
2, 3, 4, 5 y 6 si
se
ESTAD íSTICA iI
2)
ZCuántas permutac¡ones se pueden lograrcon las letras: a, b, c, d, e, f, g, h, i; s¡ se toman 3 letras con reemplazo?
Solución:
("Pr)
=
9' = 729
1.2.2.3 Permutociones sin elemenlos repetidos, sin reemplozo, lromondo todos o lo vez poro ser ubicodos en líneo:
(,P")
=
nl
Ejercicios resueltos:
1)
¿Cuántas permutac¡ones se pueden lograr con los díg¡tos: 7,
2, 3, 4, 5 y 6
s¡n
reemplazo?
= 6!
Soluc¡ón: ("P.)
2)
= 720
¿Cuántas permutac¡ones se pueden lograr con las letras: a, b, c, d, e, f, 9, h, ¡; sin reem plazo?
Soluc¡ón:
=
(nPn)
9! = 362 880
1.2.2.4 Permutociones sin elemenlos repetidos, sin reemplozo, tromondo todos o lo vez poro ubicorlos en círculo: ("P")
= (n-1)!
Eiercicios resueltos:
1)
¿Cuántas permutaciones se pueden lograr con los dígitos: reemplazo para ubicarlos en clrculo?
Soluc¡ón: ("Pu) = (6
2)
f,
2, 3, 4, 5 y 6
- 1)! = 120
¿Cuántas permutaciones se pueden lograr con las letras: a, b, c, d, e, f, g, h, reemplazo para ubicarlas en círculo?
Solución: (,P,) I.2.2.5
=
(9
sin
-
i;
sin
1)! = 40 320
Permutrociones con elementros repetidos sin reemplozo üomondo iodos o
lo vez:
(P*) = n! / (n1! n,l
n3! ...)
lt4¡
WALTER CESPEDES RAM fREZ
Ejercic¡os resueltos:
1)
¿cuántas permutac¡ones se pueden lograr con la palabra
PAPA?
solución:
P: n, = 2 (Pq) = 4l / (2t x2t) - 6 n =4 2) Hallar las permutaciones que se pueden lograr con la palabra ESfADISTICAS Soluc¡ón:
: nr = 1 : n. = 3 T: n, = 2 A: na = 2 D : nt = 1 l'. nu =2 C : n, = 1 E
S
n
3)
(Pn)
=
121
/(1lx3l x2lx2lx
1!
x2! x1!) -- 99792oo
=72
Hallar las permutaciones que se pueden lograr con el número 515 517
Solución: r
tt) -
7: n, = n=6
(Pn)
r
=
6!
/ (2tx3t x1!)=
60
7
I.2.2.ó Permutqciones con restricciones: Estas permutaciones pueden ser aplicadas a cualquiera de los casos v¡stos en la presente unidad; pero en esta ocas¡ón, solo se tratarán los casos de mayor uso, que son:
a) Permutac¡ones con restr¡cc¡ón sin elementos repetidos y sin reemplazo: En estos casos no se puede apl¡car fórmulas determinadas, por que la solución depende de la restr¡cc¡ón.
Ejerc¡c¡os resueltos:
1) ¿Cuántas permutaciones se pueden lograr s¡ se desea premiar con: primer, segundo y tercer puesto a elección entre 4 vendedores mujeres y 6 hombres, si el primer prem¡o le corresponde a una mujer?
sorución:
f;l lll-ll-l
- T;_-]
, ftl = 288
E
STAD iST
ICA
II
Observe que la restricción está en el primer casillero y solo pueden part¡c¡par cualquiera de las 4 vendedoras, pero se el¡ge a una; para el segundo prem¡o o casillero ya no hay restr¡cc¡ón, por lo tanto pueden part¡c¡par todos los que quedan entre hombres y mujeres (9); para la tercera y últ¡ma elección, solo quedan 8 vendedores.
2)
¿Cuántos números pares de tres cifras se pueden lograr con los dígitos: y 7 s¡ se toma cada dígito s¡n reemplazo?
sorución:
f;lxf;lx lll"tt'l
a2l=
7,2,3,4,5
40
Observe que la restr¡cción está en el últ¡mo casillero, por que para que el conjunto sea par, solo basta que term¡ne en c¡fra par, que son dos opc¡ones (2 ó 4); luego para la segunda elección ya no hay restricción y pueden participar cualquiera de los 5 dígitos restantes, finalmente el tercer díglto se elegirá entre los 4 que quedan.
b) Permutac¡ones con restricc¡ón s¡n elementos repetidos y con reemplazo: Eierc¡c¡os resueltos:
1)
¿Cuántos números pares de tres cifras se pueden lograr con los dígitos: 7 si se toma cada dí9ito con reemplazo?
y
'
Solución:
'a1=
1,2,3,4,5
72
Observe que la restr¡cc¡ón está en el últ¡mo casillero,
y hay 2 opciones o 2 dí9¡tos
pares.
2)
ZCuántos números de tres c¡fras menores de 500 se pueden lograr con los díg¡tos: l,2,3,4,5 y 7 si se toma cada dígito con reemplazo?
Solución:
E'E'E=
744
Observe que la restr¡cción está ahora en el pr¡mer casillero, y hay 4 opciones o 4 dí9itos menores de 5 (1, 2, 3, 4); en las s¡guientes elecc¡ones al no haber restricción y no se excluyen los díg¡tos eleg¡dos, participan todos nuevamente (6).
Resolver los s¡guientes ejerc¡c¡os propuestos sobre permutac¡ones:
1)
Hallar el número de permutaciones que se pueden logra con las letras a, b, c, d; se toma 2 s¡n reemplazo.
Resp: 12
tó
s¡
WALTER CÉSPEDES RAMíREZ
2)
Determine el número de formas en las cuales se pueden asignar 9 as¡stentes de docenc¡a, a 9 secciones de un curso. Resp: 362 880
3)
Determine el número de formas en que se pueden clasificar 7 diseños de paquetes d¡st¡ntos de un nuevo producto, en orden de preferenc¡a. Resp: 5 040
4)
¿De cuántas formas pueden 5 hombres
y 4 mujeres pueden sentarse alrededor de una mesa circular, si no se ¡mpone ninguna restr¡cc¡ón? Resp: 40 320
5)
Desarrollar: 6P, x
?Pi
Resp: 6 300
6)
¿De cuántas formas pueden sentarse 6 personas en un sofá, si tiene solamente tres
as¡entos? Resp: 120
7)
¿De cuántas formas pueden ordenarse un estante 8 libros? s¡:
(a)
Es pos¡ble cualqu¡er ordenación.
Resp: 40 320
(b) 3 libros determ¡nados deben estar juntos. (c) 2 libros determinados deben ocupar los
Resp: 4 320
extremos.
Resp: 720
8)
¿Cuántos números diferentes se pueden lograr con: 3 veces 4, 4 veces 2 y 2 veces 3? Resp: 1 260
9)
¿Cuántos números de 3 c¡fras pueden formarse con los díg¡tos t, 2, 3, reemplazo? Resp: 125
4 y 5 con
10) ¿De cuántas maneras pueden 8 personas sentarse en una mesa?:
a) Si sabemos que solo alcanzan 5 personas en b) S¡ sabemos que solo alcanzan 5 personas en
(*)
línea.
círculox
Resp: 6 720 Resp: 1 344
Este ejercic¡o sobre permutac¡ones, requiere de la ayuda de las comb¡naciones.
1.2,3 Combinaoones (,Ck) Es una técn¡ca para contar, que se caracteriza por no interesarse por el orden en que aparezcan lo objetos, demás en el proceso de elección debe hacerse sin reemplazo y los datos o elementos no deben estar repet¡dos.
l
l7,
Las comb¡naciones se definen de la s¡guiente manera:
("C*)
=
n!
/[(n-k)!
k! ]
Ejercicios resueltos:
1)
Supóngase que un comité compuesto por I personas debe ser seleccionado entre un grupo de 20. ¿Por cuántos grupos distintos de personas puede const¡tuirse el com¡té?
Solución:
2)
,oC"
=
201
/lQj-
B)! xB!
I =
725970
I
En una real¡zac¡ón de una conocida casa comercial, se ofertan productos al mismo prec¡o. A una persona le agradan todos los productos ofertados por igual y solo tiene dinero para 4 productos, ¿de cuántas maneras puede selecc¡onarlos?
Solución:
uCo
= 8l llG-4)l
x4ll =
70
Resolver los sigu¡entes ejerc¡cios Propuestos sobre comb¡nac¡ones: 1) cCuál de los números siguientes es mayor?: á) r.Cro
b) n.CI
Resp: b
2) ¿De cuántas formas pueden seleccionarse 6 preguntas de un total de 10 para una
evaluación?
3)
Resp: 210
Con 5 economistas y 6 adm¡nistradores se qu¡ere formar un d¡rectorio compuesto por 2 econom¡stas y 3 admin¡stradores ¿Cuántos d¡rectorios diferentes pueden formarse si:
Resp: 200 a) No se impone ninguna restricción. b) 2 administradores determinados deben estar en el directorio. Resp: 40 Resp. 100 c) Uno de los admin¡stradores no debe estar en el directorio.
4)
En cuántas formas se puede elegir un decano, si previamente se elijen de 2 de los 10
cand¡datos de la facultad de Administración de la UIGV
Resp: 90
5) ¿En cuántas formas pueden escogerse 4 interruptores buenos y 2 defectuosos de un lote que contiene 20 ¡nterruptores buenos y 5 defectuosos, si se sabe que todos los ¡nterruptores están cod¡fi cados?
Resp: 48 450
6)
Una profesora debe nombrar un comité compuesto por 4 alumnos. Debe escogerlo entre un grupo de B hombres y 6 mujeres. ¿Cuántos com¡tés d¡ferentes se pueden nombrar? Resp: 1 001
7)
Un estud¡ante t¡ene que contestar 8 de 10 preguntas. Si las 2 primeras son obl¡gatorias
¿de cuántas maneras podrá contestar?
Resp: 28
8)
D¡ez invitados a una cena se han div¡d¡do en 2 grupos de 5 por que hay 2 mesas con capacidad para 5. ¿De cuántas maneras d¡ferentes se pueden agrupar los
inv¡tados?
9)
Resp: 252
¿De cuántas formas puede un grupo de 10 personas d¡v¡dirse en 2 grupos de 7 Resp: 120
personas?
10) ¿De cuántas formas puede un grupo de 10 personas d¡vid¡rse en 3 grupos de 2 personas? Resp: 12 600
í19!
y
3
4,3 y
Lección
3
1.3 Prohabilidades Toda probabilidad es el valor relativo que resulta de div¡d¡r el número de sucesos favorables de un experimento aleator¡o o al aza[ entre el espacio muestral (E) o número
total de sucesos pos¡bles.
P(A) = n(A)/n(D Ejercicios resueltos 1) ¿Cuál es la probabilidad de obtener 5 en el lanzamiento de un dado equilibrado?
¡ = {1, 2,3,4,5,6} I / 6=o,L667 (Porque hay un 5entre 6 sucesos)
Solución: Prrr=
2) ¿Cuál es la probabil¡dad de obtener un número menor de 3 en el lanzamiento de un dado equilibrado?
Soluc¡ón: P1.3¡
=2
/6
A
= {1,2,3,4,5,6> = 0,3333 (Porque hay 2 números menores de 3 entre 6 sucesos)
3) De un lote que cont¡ene ¡nterruptores codificados, hay 20 buenos y 5 defectuosos ¿cuál es la probabilidad de que al elegir 6 ¡nterruptores, 4 sean buenos?
¡4¡
E
STAD IST
ICA
I
k=6 E =rrCu = l77l0O 48450 L77 LOO = Ot2736 / / uC, ,tC" =
Solución: n=2O+5=25 P(r
tuenos
y:
= zoC¡ x
aereauoso")
4) Al ordenar sobre un estante 8 libros
¿cuál
es la probab¡lidad de que 3
l¡bros
determinados estén juntos?
Solución: n=B
tr =8! = 40 320 6!x3! lgl =a32Ol40 32O = O,1O71 =
Pr¡ r¡¡rcs¡unto¡r
En la solución los tres libros juntos, pueden permutar como un l¡bro más entre los restantes 5 libros; es dec¡r hacen un total de 6 l¡bros (6!), y los tres libros pueden
permutar entre si
(3
!).
En el cálculo de las probabilidades, además de la defin¡ción dada que solo sirve para hallar la probab¡l¡dad de un solo suceso, existen otras definiciones o teoremas que perm¡ten resolver probabil¡dades en forma conjunta con 2 ó más sucesos; tales teoremas se dan a cont¡nuación: 1.3.1 Teorema del conjunto vacío Cuando no ex¡sten sucesos favorables, la probabilidad de ocurrenc¡a de dicho suceso es cero,
Prr;
=
o
Ejemplo: Calcular la probabilidad de obtener 7 en el lanzam¡ento de un dado equilibrado.
Sotución: P,r, = o
tr
= {1, 2,3,4,5,6}
¡5=g
(por que un dado no tiene 7)
1.3.2 Teorena del complenento La probab¡l¡dad de ocurrencia del complemento de un suceso cualquiera es igual a menos la probabilidad de ocurrencia del propio suceso. p1r1
1
=1-p1¡;
Ejemplo. ¿Cuál es la probabilidad de no obtener 5 en el lanzam¡ento de un dado equ¡librado?
tr = {1, 2,3,4,5,6} = 1- P1s¡ = L - 0'1667 =
Sofución: Prnorr
0,8333
447§
WALTER CÉSPEDES RAMíREZ
1.i.3 Teorena de la adición Este teorema cons¡dera dos t¡pos de sucesos, que son:
1.3.3.
I
Evenios excluyenies P
(ou")
=
Ptol
*
Pt",
Ejemplo ¿Cuál es la probab¡lidad de obtener 2
ó 5 en el lanzam¡ento de un
dado
equilibrado?
Soluc¡ón: tr = {1, 2,3,4,5,6} P(.u,) = L/6+L/6 = 2/6 I.3.3.2
=
0,3333
Eventos no excluyenles o reglo oditivo: P ro, u) = Pror * Ptul - Pto n
"l
Ejemplo: Calcular la probab¡l¡dad de obtener As ó corazón en una baraja de 52 cartas.
Solución: Pr¡¡¿co.a¿¿^r
tr = {52cartas} = 4/52+13/52 -1/52 = L6/52 =
O,3O77
1.3.4 Teorema de la multiplicación Este teorema cons¡dera lo siguiente:
I.3.4.
I
Sucesos independientes
Son aquellos por el cual la ocurrenc¡a de uno de ocurrencia de los demás sucesos. P(on")
=
los
sucesos, no va a afectar la
P(o) X Pr"r
Ejemplo: Calcular la probab¡lidad de obtener bola roja y luego bola blanca con reemplazo de una urna que cont¡ene 4 bolas rojas y 6 bolas blancas.
tr = {R, R, R, R, q B, B, B, B, B} 10 bolas (RnB) = 4l ,.ox6 / to = 24 / LOO = o,24
Solución: I.3.4.2
Sucesos dependientes
Son aquellos por el cual la ocurrencia de uno de los sucesos, va a afectar la ocurrenc¡a
de los demás sucesos.
D :9 '(a) vP "'(B/a) '(anB)
t43x
ESTADíSIICA
II
Ejemplo: Calcular la probab¡l¡dad de obtener bola roja
y
luego bola blanca
s¡n
reemplazo de una urna que contiene 4 bolas rojas y 6 bolas blancas.
Solución: D = {R, R, R, R, q B, B, B, B, B} 10 bolas P(*n") = 4lLOx6/9 = 24/90 = 0,2667 (Con relación al espacio muestral las probabilidades de los sucesos dependientes s¡ cambian, observe que la probab¡lidad de obtener bola blanca en segundo suceso ha cambiado)
1.3.4.3 Probobilidod condicionol Es cuando se espera la ocurrenc¡a de un suceso conoc¡endo suceso que viene a ser e¡ nuevo espac¡o muestral.
P,"ro, =
el resultado de otro
Ptonu¡ /P,o,
Ejemplo: Calcular Ia probab¡l¡dad de obtener 3 en el lanzamiento de un dado equ¡l¡brado, s¡ se sabe que el resultado fue impar.
Solución: tr = lo, = {1, 3, 5}
Prrr=ll3=0,3333
pronur
= {3}
(por que la condic¡ón impar es ahora el nuevo espac¡o muestral) Los teoremas de la probab¡l¡dad total y el teorema de Bayes no se util¡zan en este
texto.
Resolver los s¡gu¡entes ejerc¡c¡os propuéstos sobre probab¡l¡dades:
1)
S¡ se lanza una moneda 3 veces. Calcular la probab¡l¡dad de: a) Obtener un solo sello. Resp: 0,3750 b) No obtener sello. Resp: 0,1250
2)
Una caja tiene 8 bolas rojas, 3 blancas y 9 azules. Hallar la probab¡lidad de que se extra¡ga una de cada color, en un proceso: a) Con reemplazo. Resp: 0,1620 b) S¡n reemplazo. Resp: 0,1895
3)
Un lote de 12 artículos t¡ene 4 defectuosos. S¡ se toman 3 artículos al azar uno tras otro. ¿Cuál es Ia probab¡lidad de que los 3 estén buenos? Resp:0,2545
4)
S¡ se lanza un par de dados, ¿cuál es la probabilidad de obtener 2 números que sean
consecutivos y ascendentes? Resp: 0,1389
5)
Para obtener una licenc¡a de conduc¡r es necesario aprobar el examen teór¡co como el práctico. Se sabe que la probabilidad de aprobar la teoría es 0.86, la parte práctica
WALTER CÉSPEDES RAM íREZ
O.72 y que se apruebe las 2 partes es de 0.78. Si se elige un alumno al azar. ¿Cuál es la probab¡lidad de que haya aprobado cualquiera de los exámenes para obtener li cenc¡a?
Resp:0,8
6)
7)
Un aula está compuesta por 15 alumnos jóvenes y por 20 adultos, si solo van aprobar 18 alumnos, ¿cuál es la probabilidad de que entre los aprobados hayan jóvenes y 10 adultos? Resp: 0,2620
a B
Con 7 consonantes y 4 vocales d¡ferentes, ¿cuál es la probab¡lidad de formar palabras de 5letras que contengan cada una 3 consonantes y dos vocales?, en un proceso de
elección:
a) S¡n reemplazo. b) Con reemplazo.
Resp: 0,0455 Resp: 0,0341
8)
En una competenc¡a de tiro dos competidores t¡ene las probabil¡dades de dar en el blanco de O,8 y O,75; si cada uno hace un solo d¡sparo, ¿cuál es la probabilidad de que ambos d¡sparos den en el blanco? Resp: 0,6
9)
En una competencia de tiro dos compet¡dores t¡ene las probab¡lidades de dar en el blanco de 0,A y 0,75; si cada uno hace un solo disparo, ¿cuál es la probabilidad de que uno solo de los competidores de en el blanco? Resp: 0,35
10) En una competenc¡a de tiro dos competidores ttene las probab¡l¡dades de dar en el blanco de 0,8 y 0,75; s¡ cada uno hace un solo disparo y solo uno de ellos da en el blanco, ¿cuál es la probabilidad de que haya sido el primero? Resp: 0,5714
aa
Le
C
o
C
n
4
1.4 Uariahle aleatoria Se conoce con este nombre a la relación existente entre una variable estructurada en valores numéricos con las probabilidades respectivas de obtener d¡chos valores numéricos. Es aquella que asume d¡ferentes valores a consecuenc¡a de los resultados pos¡bles de un experimento aleator¡o. En otras palabras la var¡able aleatoria obedece la función que se le as¡gne para poder determ¡nar la ocurrencia de un suceso,
Esta relac¡ón de un valor nom¡nal con su respect¡va probab¡lidad, es ¡mportante para la investigac¡ón estadística ya que a través de dicha relac¡ón se puede conocer la media ar¡tmét¡ca o esperanza matemática, la varianza, la desviación estándar, etc.; sin la neces¡dad de conocer en forma descr¡ptiva todos los datos de la variable.
1.4.1 Esperanza matemát¡ca o media aritmética (E,r,) Es la sumator¡a del producto de la var¡able definida por su respectiva probabilidad de ocurrencia, a la esperanza también se conoce con el nombre de promed¡o.
La Esperanza Matemática se define de la siguiente manera:
E,*,
=I
a47 a
X P,r,
ESTADísrtcn ll
1,4,2 Varianza (Vm) Es la dispersión que existe con respecto a la media aritmética, es la sumatoria del producto de la variable aleatoria al cuadrado por la probabilidad menos la media aritmética al cuadrado. La Varianza se define de la siguiente manera:
V(*) = ¡X2P1x¡ -[:xP(x)]2
1.4,3 Desviación estándar (D.Em) Se obtiene de la raíz cuadrada de la varianza. La Desviación Estándar se define de la siguiente manera: D.E 1x¡
=
JVo'
Se ha hablado al iniciar esta unidad, de que la Variable Aleatoria reemplaza de alguna manera a la Estadístlca Descriptiva; entonces con unos datos descrlptivos de una distribución de frecuencias, se va a calcular: la Media Aritmética, la Varianza y la Desviación Estándar, luego estos mismos datos van ser transformados en Variable Aleatoria, para calcularles: la Media Aritmética o Esperanza Matemática, la Varianza y la Desviación Estándar. El alumno al comparar los resultados de los datos descriptivos con los de la Variable
Aleatoria, y se dará cuenta que los resultados son los mismos.
por ejemplo, Hallar: la Media Aritmética, Varianza y Desviación Estándar de sigulente distribuclón de frecuencias de datos descriptivos: Sueldos
800 1200 1600 2000 2400 2800
X 32
fi
hi
Xi
fixl
24
1000
24 000
765
74 045 400
1400
365
435
5 062 550 61 2s0 5 676 750
(xi
-
t)
fi (xi
- x),
1600
38
0,1500 o,2375
2000
50
0,3L25
1800
2400
30
0,1 875
2200
s3 200 90 000 66 000
2800
72
0,0750
2600
31 200
835
8 366 700
3200
6
o,0375
3000
18 000
7235
160
1,0000
9 151 350 42 364 000
1200
= 282 400/ t60 = 1765 = 42 364 000 / 760 = 264 775
s= J264115 =
282 400
u2
514,56
§48§
35
la
WALTER CÉSPEDES RAMíREZ
Ahora para demostrar la relación directa de estos datos descriptivos con la Variable Aleatoria, se convertirá esta distribución de frecuencias o distribución de datos en Variable Aleatoria; tomando la Marca de clase (Xi) como variable y la Frecuencia Relativa Absoluta (hi = P1x¡ = fi / N) como probabilidad de ocurrencia que realmente lo es.
P
X
X2P
150
332,5
= ¡XP1xl = 7765
V(*)
=
D.E1x,
¡X2P1x¡
1 012 s00
=
t\2,5
507 000
337 s00
7 765 3 380 000
907 500
3380000-t7652 = 264775u2
-t:XP,r¡J'=
=6
195
412,5
o,2375
E(*)
1
562,5
0,1500
465 500
0,0375
0,3125
1800
150 000
:
2600 0,0750
1400
P,r,
3000
2200 o,1875
1000
X
J264775 = 5!4,56
Al ver los resultados obtenidos por los datos descriptivos y los obtenidos por la Variable
Aleatoria, ha podido observar usted que se obtienen los mismos resultados.
Ejercicios resueltos
1)
Hallar: la Esperanza, la Varianza y la Desviación Estándar; si se lanza un dado legal y se designa como X la variable aleatoria como el doble del número que aparece.
X = 2,4,6,8, lO,L2
Solución: tr = { 7,2,3,4,5,6 } DADO X P
X P,r, X2
tr-(x) Vtrl D. E
2)
P1x¡
1x¡
¡
X2P1x¡
3
4
5
6
72
: 616=7 42/6 = 7
2
4
6
8
10
r/6
7/6
tl6
1/6
7/6
7/6
2/6 4/6
416
6/6 36/6
B/6
LO/6
6416
100/6
L2/6 744/6
lXp,*, = =
2
1
1.6/6
364/6 = 60,67
7
- [ > X P,*¡1' =
= ^F; =
.Ft,et
=
60,67
-72 = tl ,67 u2
3,42
Un contratista consulta a tres operadores para construir una obra: el primero estima que la realizará en 20 días con el 40olo de probabilidad, el segundo estima 30 días con el 35% de probabilidad y el tercero estima 14 días con el 25o/o de probabilidad. aEn cuántos días se espera que concluya la obra?
*49
E
ESTADÍSTICA II
Solución: X
74
20
30
P,"'
0,25
0,4
0,35
1
X P,",
3,5
8
10,5
22
E(r)=2XPr*r=22 Se espera que se concluya la obra en 22 días.
3) Si solo se reconocen
los valores pares al lanzar dos dados equil¡brados, Zcuál es: la Esperanza, la Varianza y la Desviación Estándar de la suma de ambos dados? Resultados observados
Dados
2
1
4
3
Suma de los valores reconocidos 5
6
Dados
0
2
0
4
0
6
115
1,6
0
0
2
0
4
0
6
1
1,
1
L,2
2
2,
1
2,2 2,3 2,4
2,5 2,6
2
2
4
2
6
2
B
3
3,L 3,2 3,3 3,4
3,5 3,6
0
0
2
0
4
0
6
4
4,7 4,2 4,3 4,4
4,5 4,6
4
4
6
4
8
4
10
5
5,
1
5,2 5,3 5,4
5,5 5,6
0
0
2
0
4
0
6
6
6,t
6,2 6,3 6,4
6,5 6,6
6
6
B
6
10
6
72
1,3 1,4
Solución: tr = { 9(0),6(2),7(4),8(6),3(8),2(10), X
0
4
6
8
10
72
7/36 28/36 772/36
B/36 48/36 288/36
3/36 24/36 792/36
2/36 20/36
r/36
2
9/36 6/36 X P,r' 0/36 72/36 X'P. 0/36 24/36 P
E(*)
= IX P,r, = 4
V(*)
= lX2P1x1 - [:X
D.E 1x¡
1(12)
P(x)]2
= 26,67 - 42 =
= il',*t = .,,'tO.o7 = 3,27
§5 0B
L2/36 144/36
2OO/36
70,67
u2
}
n =36 36/36 = 7 744/36 = 4 960/36 = 26,67
WALTE R CÉSPEDES RA]YíREZ
Resolver los s¡gu¡entes eiercic¡os propuestos sobre variable aleator¡a:
1) Un invers¡onista se da cuenta que t¡ene la probabilidad del 600/o de obtener una ut¡lidad de $ 5 0OO y una probabilidad del 25 o/o de perder $ 5 000 y un 15olo de no ganar n¡ de perder. ¿Cuál es la esperanza del ¡nversionista? Resp:
+
1 750
2) ¿Cuál es nuestra esperanza matemát¡ca, s¡ compramos uno de los 1000 boletos de una rifa, cuyo primer premio es una televisión de color, que vale $ 480; el segundo premio es un min¡componente, que vale $ 120; y el tercer prem¡o es un DVD de $ 40? Resp: $ 0,64
3) Hallar la desviación estándar de la tabla:
4)
x
0
5
B
9
P,,,
0,10
0,3 5
0,2s
0,3 0
Resp: 2,73
En una competencia de tiro dos compet¡dores tiene las probabil¡dades de dar en el blanco de O,8 y O,75; si cada uno hace un solo disparo, ¿cuál es la esperanza de dar en el blanco?
Resp:1,55 5) Hallar la Esperanza de obtener cara en el lanzam¡ento de 3 monedas. Resp: 1,5
6) Hallar la Varianza de obtener cara en el lanzam¡ento de 3 monedas. Resp: 0,75
7) Se va elegir un com¡té de 4 personas y en la elección part¡cipan 5 hombres y
7
mujeres. Hallar la Esperanza de que en el comité hayan mujeres Resp: 2,33 B) Se va elegir un comité de 4 personas y en la elección part¡cipan 5 hombres y 7 mujeres- Hallar la Desv¡ac¡ón Estándar de que en el com¡té hayan mujeres. Resp: 0,84
9) Hallar la Var¡anza de la sigu¡ente
tabla:
Resp: 541
X
-10
-20
30
P,,,
7/s
3lto
U2
10) Si la probabil¡dad de que un hombre viva 25 años es 0,8 y la probabil¡dad de que una mujer viva 25 años es de 0,85. ¿Cuál es la Esperanza de sobrev¡vencia a los 25 a ños de edad? Resp: 1,65
ESTADISTICA II
ACIflN NO I 1) Hallar las permutaciones que se pueden lograr con el número 1515517.
A) s
040
c)
B) 210
D) 180
140
E) 1800
2) Resolveri ,rPu X ,Pr. A) 139 708
800
B) 210 1s2
000
c) 66s 280
D) 180
7sO
E) 2s 180
3) eDe cuántas maneras pueden 10 personas sentarse alrededor de una mesa con capacidad para 8 personas. A) s
040
B) 1 814
400
C)
120
D)
180
E) 226 800
4) Un estudiante tiene que contestar 6 de 10 preguntas. Si la última pregunta
es
obligatoria, Zde cuántas maneras podrá contestar?
A) 210
B) 126
c) 151 200
D) 180
E) 800
5) Doce invitados a una cena va a ocupar 2 mesas, una con capacidad para 5 y la otra con capacidad para 7. áCuántas maneras diferentes podrán agruparse en las mesas?
A) 5 040
B) 792
c) 120
D) 180
E) 226
6) Un lote de 12 artículos tiene 3 defectuosos. Si se toman 3 artículos al azar uno tras otro. iCuál es la probabilidad de que 2 estén buenos? A) 0,3818
B) 0,1406
c) 0,1846
D)
0,4909
E) 0,2524
7) Si se lanza un par de dados, ácuál es la probabilidad de obtener 2 números que sean iguales o sean consecutivos ascendentes? A) 0,1666
c) 0,1846
B) 0,3333
D)
0,3056
E) 0,1388
8) Un áula está compuesta por 20 jóvenes y por 72 adultos, si solo van a aprobar 18 alumnos, Zcuál es la probabilidad de que entre los aprobados hayan 8 jóvenes y 10 adultos?
A) 0,0176
B) 0,1006
c) 0,0816
D) 0,0009
E) 0,0522
9) Con 8 consonantes y 4 vocales diferentes, Zcuál es la probabilidad formar palabras de 5 letras que contengan cada una 3 consonantes y 2 vocales en un proceso sin reemplazo?
A)
0,0818
B) 0,0146
c)
0,7144 #52§
D)
0,0909
E) 0,0424
wALTER
10)
cÉsprors RRvfRrz
En una competencia de tiro dos competidores tienen la probabilidad de dar en el blanco de 0,68 y O,75; si cada uno hace un solo disparo, Zcuál es la probabilidad de que ambos disparos no den en el blanco?
A)
0,51
B)
0,17
C)
0,08
D)
0,07
E) 0,02
11) Hallar la Desviación Estándar de obtener cara en el lanzamiento de 3 monedas. A)
0,75
B)
0,866
C)
1,02
D)
1,5
E) 0,268
12) Se va elegir un comité de 4 personas y en la elección participan 5 hombres y
7
mujeres. Hallar la Esperanza de que en el comité haya hombres.
A)
0,8815
B)
2,3126
C)
t,2409
D)
1,6665
E)
2,002t
13) Se va elegir un comité de 4 personas y en la elección participan 5 hombres y
7
mujeres. Hallar la Varianza de que en el comité haya mujeres.
A)
0,8411
B)
2,26L8
C)
O,7O75
D)
5,4151
E) 2,0026
14) Hallar la Desviación Estándar de la siguiente tabla:
A)
40,15
B)
X
-10
-20
30
P,_,
7/s
3170
7/2
23,26
C)
12,09
D)
541,5
E) 2,26
15) Si la probabilidad de que un hombre viva 50 años es 0,68 y la probabilidad de que una mujer viva 50 años es de 0,75. ZCuál es la Esperanza de sobrevivencia a los 50 años de edad?
A)
4,15
B)
2,26
C)
1,29
D)
1,59
E) 7,43
Respuestas de control 1.c,2.A,
3, E, 4. B, 5. B, 6. D, 7. D, 8. A, 9. E, r0. C, I l. B, 12. D, 13. C, 14. B, 15. E
15
3I
ESTADiSTICA
EXPTORACIúN
II
AN UNE
http://es.wi kipedia.orglwiki/Estado/oC3 o/"ADstica_descriptiva http://www.aulafacil.com/CursoEstadisticaAecc- I 6-est. htm http://www.aulafacil.com/CursoEstadistica/Lecc- | 8-est, htm http://wwwaulafacil.com/CursoEstadistica/Lecc-22-est,htm http ://www.aulafaci l. com/CursoEstad istica/Lecc-25-est. htm http ://www.aulafacil.com/Cu rsoEstad istica/Lecc-26-est. htm
fiLflsAnl0 con reemplazo.
La acción de devolver el elemento o dato elegido dentro de un todo, con el objeto de que vuelva a participar en la siguiente elección
Se -utiliza en los casos de que se requiera de
la
participación de un mismo dato varias veces. elementos repetidos.
Existencia de datos u objetos dos o más veces con las mismas características,
Se utiliza en la permutación o ubicación de objetos en donde sobresalen aquellos que no están repetidos,
ya que la variación de estos objetos repetidos no
se
aprecia. espacio muestral.
Conjunto de todas las posibles ocurrencias contempladas
en un Experimento Aleatorio. Se utiliza como divisoren el cálculo de las probabilidades. experi mento aleatorio.
Proceso o acción que se encuentra sujeto al azar o a la
suerte.
Se utiliza para conocer cuales son las ocurrencias o sucesos posibles de alcanzar. probab¡l¡dad.
La división de un conjunto de observaciones llamadas favorables para una determinada acción, entre el número total de observaciones posibles para la misma acción. Se relaciona generalmente con procesos
aleatorios de algún experimento. Se utiliza para saber que tan cerca o tan lejos se está de alcanzar lo que se busca ante una determinada acción, que puede estructurarse de la siguiente manera:
i'q¿S
WALTER CÉSPEDES RAIliREZ
:
- 0,000
Suceso imposible de alcanzar - 0,001-0,100: Incertidumbre sobre lo que se desea alcanzar - 0,101-0,500: Valor probable poco cierto
- 0,501-0,900: Valor probable c¡erto - 0,901-0,999: Certeza sobre lo que se desea alcanzar : Certeza absoluta
1,000
restr¡cc¡ón.
Llmitaclones para una acción o proceso.
Se utiliza para ún¡camente
las
seleccionar objetos que tienen característ¡cas señaladas como
restricción. reemplazo.
La acc¡ón de no devolver el objeto elegido dentro de un todo, con el objeto de que no vuelva a partlcipar en la
s¡guiente elecc¡ón.
Se utiliza solo en los casos de que se requiera de la participac¡ón de los datos que se tienen unas sola vez. suceso.
Cualquiera de las posibles ocurrencias en un experimento aleatorio, se le conoce también como evento.
Se ut¡liza como referenc¡a para nombrar la ocurrencia
determ¡nada probabilidad que
de una a
se
espera
lca nza r.
sumatoria.
La suma de un conjunto de valores constantes y/o variables. Su símbolo es la letra griega mayúscula llamada sigma (>). Se util¡za para agregar datos con el propósito de obtener cifras acumuladas, así como para establecer promedios al dividir lo acumulado entre el número de datos u observac¡ones,
valor aleatorio,
El producto del valor nom¡nal de una variable por su respect¡va probab¡l¡dad de ocurrencia. Se ut¡liza en la Estadística Analítica o Inferenc¡al, para
calcular algunas medidas estadísticas, se diferencia de la Estadística Descriptiva, por que se obtiene lo m¡smo con solo conocer la variable y su probabilidad respectiva.
valor nom¡nal.
El valor original de todo dato numérico constante
o
variable.
Se util¡za en la Estadíst¡ca Descr¡pt¡va; por que, al multiplicar el valor nom¡nal por su respectiva frecuencia o veces que se repite el valor, permite calcular algunas medidas estadíst¡cas. t
55
..,
segund
a
UNIDAD -_.t
Modelos de distribuciรณn de
probabilidades
Sumario l',lodelo binomial l,,lodelo de Poisson
l'lodelo l{ormal J.,lodelo
I-Student
I'lodelo .l i-Cuadrado
lfodelo I de [isher
oBJErvc(s) GENERAL:
.
Al término de esta unidad, el alumno habrá ampliado sus conocimientos sobre las probabilidades, que como ya se ha mencionado, tienen aplicación efectiva en la lnferencia Estadística, que las diferentes manifestaciones de las probabilidades
y o
modelos, efablecen una diferencia marcada sobre las probabrlidades de variables discretas de las probabilidades de variables continuas. También ha aprendido que tales modelos probabilísticos son aplicables a diferentes tipos de análisis estadísticos. ESPECÍFICOS:
.
Conocer las características de este modelo que es aplicable: a 2 sucesos independientes, a variables discretas y a un número reducido de repeticiones.
.
Saber que sus característrcas son aplicables:
a
sucesos
independientes, a variables discretas y a un número ilimitado de repeticiones.
.
Conocer las bondades del modelo aplicable a: variable continua, peftenece una sola familia por trabajar con variable estándar, es simétrica y el tamaño de la muestra debe ser grande (n
. . .
>
30).
Conocer el uso de este modelo similar al modelo normal, pero que se aplica a pequeñas muestra (n < 30) y sus grados de libertad hacen del modelo, todo un grupo de familias. Conocer el uso de este modelo con caracterífica asimétrica, es aplicable a variable continua, en el análisis de la varianza y en Estadística no Paramétrica, utiliza grados de libertad. Conocer el uso de este modelo con característica asimétrica, es aplicable a variable continua, en el análisis de la varianza y en Estadística no Paramétrica, utiliza grados de libertad.
r58I
Lección
I
2.1 Modelo binomial Es un Modelo de probabilidad d¡screta más utilizado en estadística, por que compara solo dos sucesos: éx¡to con fracaso, Verdadero con falso, ganar con perder, aprobar con desaprobar, aceptar con rechaza[ etc.; de a¡lí el nombre de probab¡lidad B¡nom¡al. Este modelo fue descubierto en el siglo XVII por el matemátlco su¡zo Jacob Bernoulli.
2,1,1 Características Cuenta con las s¡gu¡entes
ca
racteríst¡ca s:
10 Se refiere a dos sucesos ún¡camente en donde suceso y "q" es la no ocurTenc¡a.
"p" es la ocurrencia del
20 El número de repeticiones es pequeño. 30 Las probabil¡dades de ocurrenc¡as de ambos sucesos deben ser ¡guales o lo mas cercano posible. 40 La variable t¡ene que ser discreta. 50 Los sucesos deben ser ¡ndependientes.
2.1.2 Definición Si "p" es la probabil¡dad de ocurrenc¡a del suceso esperado, "q" es la probab¡lidad de que no ocurra el suceso en un solo ensayo y si "n" veces se repite el experlmento aleator¡o; entonces, la probab¡lidad de que ocurran exactamente "k" veces los sucesos; esta dado por ¡a s¡guiente definición: P(*¡n,p)
= nc". pk. q(n-rl a59E
E
STAD íST
ICA
II
Donde: p = probab¡lidad de ocurrenc¡a del suceso esperado. n = numero de veces que se repite el exper¡mento. k = número de sucesos favorables a la probab¡lidad sol¡citada o esperada. q = probabil¡dad de no ocurra io esperado (S = 1 - p).
2.1.3 Propiedades El modelo de probabilidad B¡nomial t¡ene las siguientes propiedades: 10 La Med¡a Ar¡tmét¡ca np npq 2o La Var¡anza
es:
es:
30 La Desviación Estándar
es:
,trpq
Ejercicios resueltos 1) De 6lanzam¡entos de una moneda equ¡l¡brada. i.Cuál es la probab¡lidad de obtener 2 caras?
Solución:
n=6
P(r,.,o,t)
2) .Cr x 0,5'?x 0,5(6
=
A=l/2=0,5 =
k=2
9=ll2=O,5 15 x 0.25 x
0,0625
=
0,2344
2) La probabil¡dad de éxlto de una determ¡nada vacuna es 0,72. Calcular la probabilidad de que una vez adm¡n¡strada a 15 pacientes:
a) N¡nguno sufra la enfermedad. b) Todos sufran la enfermedad. c) Dos de ellos sufran la enfermedad.
Solución: p :
q :
a)k=0, P(orrr,o.r")
probabil¡dad de sufrir la enfermedad (cont¡nuar enfermo). probabilidad de no sufrir la enfermedad (sanar).
n=15, =
b)k=15,
,rCo X 0,280
P= 7- O,72=O,28, x
n=15,
P,rrrrr,o,.", = rrC* X O,28rs
q=0,72
0,72\1s - o)
= 1x Lx0,0072 = p = 0,24, q=0,72
0,0072
x
1=
0,72115
's)
=
1(5,098x 10
'g)
0
(5,098 x 10 - e es tan pequeño que práct¡camente se puede decir que la probabil¡dad es 0).
c)k=2, P(r
r r',o,r".)
n=15, =
.rC, X 0,282
p=
x
O,24,
O,7ztts
'z)
6C
=
q=
0,72
105x0,0784x0,0140
=
0,1152
WALTER CÉSPEDES RAM íREZ
portratarse del éxito de la vacuna, debería considerarse la probabilidad de 0,72 como "p"; sin embargo en este modelo de probabilidad, se denomina "p" lo que se desea encontrar y en este caso lo que se desea encontrar es personas que sufran la enfermedad; es dec¡r que la vacuna no halla tenido éxito, por ello: p = 1-0,72=O,28. El alumno habrá observado que
3) En una prueba auto evaluativa, se formulan 1O preguntas, de las cuales cada pregunta tiene 4 alternativas de respuestas y solo una alternativa es correcta. Si un alumno responde la prueba totalmente al azar. ¿Cuál es la probab¡lidad de que acierte 6 preguntas?
Solución: P1"7 ro, o,rr¡
(1,620/o).
n
=
=
10
oC.
9=3/4=0,75
P=7/4=O,2s
x 0,256 x 0,75(ro
"'
= 210 x 0.000244 x 0,3164
k=6
=
O,0762
Si todas las preguntas tienen el mismo valor de 2 puntos, con 6 preguntas el alumno
aprobaría con 12; por consiguiente, el alumno puede observar que si no estud¡a y responde al azar, la probab¡l¡dad de aprobar una asignatura es mínimai 1,62V0.
Resolver los sigu¡entes ejercic¡os propuestos sobre el modelo binomial: 1) S¡ de c¡nco a se¡s de la tarde se admite que un número de teléfono de cada cinco estén comunicados, ¿cuál es la probab¡lidad de que, cuando se marquen 10 números de teléfono elegidos al azar, sólo dos puedan comun¡carse? Resp: 0,3020
2) La probabilidad de que un hombre ac¡erte en el blanco es 1/4. S¡ dispara 10 veces icuál es la probabilidad de que acierte exactamente en tres ocasiones? Resp: 0,2503
3) La últ¡ma novela de un autor ha ten¡do un gran éxito, hasta el punto de que el
80o/o
de los lectores ya la han leído. ¿Cuál es la probabilidad de que de 4 personas elegidas al azar aficionadas a la lectura, 2 hayan leído la novela? Resp: 0,1536
4) Un agente de
seguros vende pólizas a c¡nco personas de la misma edad y que disfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es 2/5. Há llese la probabilidad de que, transcurridos 30 años, vivan las cinco personas. Resp: 0,010 2
5) cCuál es la probabil¡dad de obtener 6 caras al lanzar una moneda 10 veces? Resp: 0,2051
6
ESTADíSTICA II
6) éCuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado
8
veces?
Resp:0,0260 7) Supongamos que la probabilidad de que una pareja tenga un hijo o una hija es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. Resp: 0,2344
8) La probabilidad de que un hombre acierte en el blanco es 5/8. Si dispara 8 veces ZCuál es la probabilidad de que acierte por lo menos en una ocasión?
Resp:0,9996
9) La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 7oo/o de los lectores ya la han leído. ¿Cuál es la probabilidad de que al seleccionar a 5 aficionados a la lectura, como máximo 2 personas hayan leído la novela? Resp:0,1631 10) Un agente de ventas de cada 10 entrevistas con sus clientes, logra realizar 4 ventas mayores de 5 000 soles. Si un día cualquiera este agente se entrev¡sta con 5 clientes, Zcuál es la probabilidad que al menos tres clientes compren más de 5 000 soles?
Resp:0,3174.
§62t
Lecció
n
2
2.3 Mrdelo de Fm§rrwn Expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo, si estos eventos ocurren con una tasa media conocida, y son independientes en el tiempo desde el último evento. Es un Modelo de probabilidad discreta descubierta por Simeón - Denis Poisson en 1838, que se interesa únicamente por el éxito, aunque en algunos casos el promedio se obtiene al multiplicar "n" sucesos favorables por la probabilidad de éxito; y como usted recordará, al existir probabilidad de éxito también existe la probabilidad de fracaso que es su complemento.
Esta distribución es generalmente aplicada cuando la población es grande como constante a épsilon (e = 2.718281828.....,.)
y utiliza
2,2,1 Características Cuenta con las siguientes características: 10 Se refiere únicamente al suceso éxito. 20 El número de repeticiones es grande o infinito. 3o Las probabilidades de ocurrencias del suceso éxito con la del suceso fracaso son muy diferentes o son lo mas lejano posible. 40 La variable tiene que ser discreta. 50 Los sucesos deben ser independientes. t63§
ESlADíJTICA iI
2.2.2 Definición Si "4" (Lambda) es la probabilidad promed¡o de ocurrencia del suceso esperado y "e" (éps¡lon) es la constante para que ocurra en un solo ensayo; entonces, la probabilidad de que ocurra exactamente "k" veces, esta dado por la siguiente deñn¡ción:
P r*r^l
= "-t" ¡r /
k!
Donde:
k = número de sucesos favorables a la probab¡l¡dad solicitada o esperada. = probabilidad promed¡o de lograr lo esperado. e= Base del logaritmo Neperiano (e = 2.77e287828.......)
[
2.2.3 Propiedades El modelo de probab¡l¡dad de Poisson t¡ene las s¡guientes propiedades: A 10 La l.4ed¡a Ar¡tmét¡ca A Varianza 20 La
es:
es:
30 La Desv¡ación Estándar
'Jl-
es:
Ejercicios resueltos de los libros encuadernados en cierto taller tiene encuadernación defectuosa. ZCuál es la probabilidad de que 5 de 400 libros encuadernados en este taller, tengan
1) Si
2olo
e n
cuadern ac¡o nes defectuosas?
Solución:
p=
n=400
Prr¡"r = € 3.85/5! =
O,O2
(2o/o) A= np=400x0,02=8 k=5
0,0916
2) Si el 1.5olo de los trabajadores de una empresa llegan tarde por día. ZCuál es la probabil¡dad de que 6 de los 650 trabajadores de esta empresa lleguen tarde?
Solución: P
n=650 p=
(u,",rr)= e-s,,s x9,7586
0,015(1,5olo)
l6l =
A=
n p = 650 x 0,015 =
9,75 k=6
0,0696
3) En la panamericana sur, mensualmente ocurren 20 accidente en promedio; ¿cuál es la probabil¡dad de que en un mes cualquiera del año ocurran 12 accidentes?
Solución: A= P
(rr/ro,,= e-20 x
20 k=12 2012
/ 72 =
0,0776
4) ¿Cuál es la probabilidad de que una persona que espera 1 colectivo en uno de sus paraderos, tenga que esperar 6 minutos al vehículo que c¡rcula cada 10 minutos?
61
WALTER CESPEDES RAI.l IREZ
Solución: A= P r,ro,ur
=e
0,6
6/10=0,6 k=1
x 0,6r
I ll =
0,3293
Resolver los sigu¡entes ejercicios propuestos sobre el Modelo Po¡sson: 1) La probabilidad de que un afic¡onado al t¡ro ac¡erte en el blancc es 0,02. S¡ dispara 10 veces ¿cuál es la probabilidad de que acierte exactamente en 1 ocas¡ón? Resp: 0,1637
2) La última
creación de una empresa, es un producto que
a penas 5 artículos en
promed¡o se venden mensualmente en el mercado de Lima. ¿Cuál es la probabilidad de encontrar en el mercado l¡meño una persona que haya adqu¡rido el producto? Resp: 0,0337
3)
S¡ el 3% de las bomb¡llas fabricadas por una compañía son defectuosas, hallar la probab¡lidad de que en una muestra de 100 bomb¡llas como máx¡mo l sea defectuosa. Resp: 0,1991
4) Si un banco recibe en promed¡o 6 cheques sin fondo por día, ¿cuál es la probabilidad de que reciba cuatro cheques sin fondo durante dos días consecutivos? Resp: 0,0053
5) Supongamos que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es de 0.05. S¡ el conjunto de unidades terminadas son ¡ndependientes, ¿cuá¡ es la probab¡l¡dad de que por lo menos se encuentre una un¡dad defectuosa de 15 ensam bles?
Resp: 0,5276
6) El gerente de un restaurante que sólo da
serv¡c¡o mediante reservas, sabe por experiencia, Que el 5olo de las personas que reservan una mesa no as¡stirán. Si el restaurante acepta hasta 75 reservas, écuál es la probabilidad de que no asistan los cl¡entes a 2 reservas? Resp: 0,1654
7) En una prueba de res¡stenc¡a a la rotura de los cables producidos por una empresa, 4 cables se rompen en promed¡o. Si se selecciona un cable de cualquier producc¡ón, écuál es la probab¡lidad de que éste se rompa? Resp: 0,0733 8) Se sabe que en promedio un alumno no se presenta a 3 exámenes durante un semestre académico, ¿cuál es la probabilidad de que en la próxima evaluac¡ón semestral no falte a ninguno de sus exámenes? Resp: 0,0498
ESTADÍSTICA II
8o/o de posibilidades de contener una molécula rara particular. Suponga que las muestras son independ¡entes con respecto a la presencia de la molécula rara. Encuentre la probabilidad de que en las slgu¡entes 18 muestras, exactamente 2 contengan la molécula rara. ResP:0,2456
9) Cada muestra de aire tiene
1o) Supongamos que el número de ¡mperfecc¡ones en un alambre delgado de cobre sigue una distribución Poisson con una med¡a de 0,23 ¡mperfecciones por metro. Determine la probab¡lidad de encontrar menos de 2 imperfecciones en 10 metros de alambre. Resp: 0,3309
t66!
Lección
3
2.3 Modelo Normal
\
'--+---'
T
:\l
\
\: \
Es una distribución de variable continua que tiene la forma de una campana, en este modelo una variable puede tomar un número infinito de posibles valores dentro de un intervalo. Fue Johann Carl Friedrich Gauss Físico Matemático alemán quién utilizó de una manera más amplia este modelo y descubridor de la campana gaussiana que define la función de densidad [V = f(z)].
r§67É
ESTADíSTlCA
II
Al convert¡r cualquier var¡able en términos estándar (Z), se conv¡erte en un modelo único, es decir tiene una sola famil¡a con valores que van desde menos infinito a más infinito; además el modelo es simétr¡co, porque resulta de una función de densidad elevada al cuadrado y por ser su exponente negativo, la función que deñne a este modelo nunca es cero.
2,3.1 Características Cuenta con las siguientes ca racte ríst¡cas: 1o Es s¡métrica por tiene una función de densidad con exponente al cuadrado; además, por ser esta función negat¡va/ los valores de "Y" nunca son iguales a ceTo. 20 El valor máx¡mo de densidad esta en la med¡a p por que crece hasta el valor de la media y a partir de ella decrece.
3o La curva normal es asintótica al eje de absc¡sas; por ello, cualquier valor entre - oo y + @ es teór¡camente posible. Por esta razón el área total bajo la curva es ¡gual a 1 y además por ser simétr¡ca a part¡r del punto central (p) el área de la izquierda es 0,5 y la derecha es 0,5. 40 Los puntos de inflexión en donde la curva de cóncava se vuelve convexa o v¡ceversa, se dan en: (p - o) y también en (p + o). 50 Tiene una ún¡ca moda, que coincide con su media y su mediana; todas ellas
en este modelo están s¡empre en el centro. 60 La variable es continua. 70 El modelo Binomial se asocia perfectamente al modelo Normal cuando "n" es un valor grande (> 30) y "p" es igual a 0,5.
2.3,2 Definición S¡ "p" (Mu) es la probabil¡dad promedio y "o" (S¡gma) la desviación estándar de ocurrencia del suceso esperado, el ¡4odelo Normal se define con la sigu¡ente función de densidad:
ftxt= !e'' oJln
reE
El área que encierra la función de densidad, está dada por:
| -rQ)a(z-)=t S¡ el alumno no recuerda el cálculo integral, el área que necesite sobre ella, puede encontrarlo en la tabla "Área bajo la curva Normal" que se encuentra en los anexos; previa conversión, de la var¡able "X" en variable "2" de la siguiente manera:
z=(x-p)/o '6BI
WALTER CÉSPEDES RAMÍREZ
X = Variable de referencia que va a ser convertida en Z. U = Media Aritmética.
Donde:
o = Desviación Estándar. 2,3.3 Propiedades El modelo de probabilidad Normal tiene las siguientes propiedades: p 10 La Media Aritmética 02 20 La Varianza o. Estándar 30 La Desviación
es:
es:
es:
Otra de las propiedades del Modelo Normal es: P(p P(p
- 1o < X < ¡r + 1o) = 0,6826. Contiene el 68,260/o de la información. - 2o < X < ¡.r * 2o) = 0,9544. Contiene e|95,44o/o de la información.
P(p-3o< X< p + 3o) = 0,9974.
Contiene e|99,74o/o delainformación'
2,3,4 Teorema del Límite central Se conoce también como Teorema Central del Límite y en condiciones generalizadas, la suma de la Variable Aleatoria tiende a convertirse en una Distribución Normal o curva o campana de Gauss, cuando la cantidad de datos que encierra dicha variable es muy grande'
X, X, ....Xni una muestra aleatoria de una distribución con media - p y con varianza = 02; entonces, si "n" es suficientemente grande y si se consideran varias Sea
muestras, las Medias Aritméticas muestrales tienen aproximadamente una Distribución Normal con: I
lt"= p
y
o'*=o'ln
En conclusión, el Teorema del Límite Central perteneciente a la Teoría de la Probabilidad
garantiza que una variable tiene el comportamiento de una Distribución Normal cuando "n" es lo suficientemente grande. Existen diferentes versiones del teorema, en función de las condiciones utilizadas para asegurar la convergencia. Una de las más simples establece que es suficiente que las variables que se suman sean independientes, idénticamente distribuidas, con valor esperado y varianza ñnitas.
§69t*
ESTADíSTIC,E II
2,3,5
Como utilizar
la Tabta Área bajo la curva normal
La tabla que se adjunta bajo anexos, da los valores entre 0 y Z, tal como está en el siguiente gráfico:
Por ejemplo si Z P
= 1,47; la probabilidad para este valor
(0 < Z < 7.47)
=
es:
0.4292 (El valor de Z, está en la línea 1,4 interceptado con
la
columna 7)
Ejercicios resueltos 1) El promedio de los pesos de 500 estudiantes de un colegio, es 70 Kg. con una desviación típica de 3 Kg. Suponiendo que los pesos se distribuyen normalmente, écuántos alumnos pesan entre 68 Kg. y 74 Kg.?
Solución:
N=500 Xr=68 Xz=74 V=70 o=3 Zr=(Xr-ü/o =(68 -70)/3 = -0,67, Zr= (Xr-p) /o =(74 -70)13=
P
(- 0,67 < Z < 1,33) = 0,2486 + 0,4082 =
0,6568
Una vez hallada la probabilidad para saber cuantos son, basta multiplicar N.p
N.P=500x0,6568=328,4
Resp: 328 alumnos
§70§
1,33
WALTER CÉSPEDES RAMÍREZ
Nota importante: a) Cuando los dos valores de z, son de diferentes signos y se relacionan por menor igual; entonces, los valores encontrados en la tabla se suman para hallar la probabilidad respectiva. b) Cuando los dos valores de z, son del mismo signo y se relacionan por menor igual; entonces, los valores encontrados en la tabla se restan para hallar la probabilidad respectiva.
c) Cuando los dos valores de z, son de diferentes signos y se relacionan por mayor igual; la probabilidad respectiva es, l menos la suma de los dos valores encontrados en la tabla.
d) Cuando los dos valores de z, son del mismo signo y se relacionan por mayor igual; la probabilidad respectiva es, 1 menos la resta de los dos valores encontrados en la tabla. e) Cuando hay un solo valor de z positivo que se relaciona por mayor o cuando hay un solo valor de negatlvo de z que se relaciona por menor, la probabilidad respectiva se obtiene de 0,5 menos el valor de la tabla.
f) Cuando hay un solo valor dez; para determinarel valorde la probabilidad respectiva, es necesario conocer el gráfico para ver la posición de Z, luego se resuelve tomando en cuenta siempre que la tabla da valores de
O
a Z.
2) Un estudio ha mostrado que en cierto barrio el 600/o de los hogares tiene al menos 2 televisores; si se eligen al azar una muestra de 50 hogares ZCuál es la probabilidad de que entre 35 y 40 hogares tengan cuando menos 2 televisores?
Solución: Este caso es Binomial, que por aproximación se resolverá utilizando el Modelo Normal.
q- 1-0,6 = p=0,6 n =50 50x0,6 nP =30 = U= Zr=(Xr-lt)/o Zr= (Xr- tt) / o
(35 -30)/3,46 (40 -30)/3,46 pG
P
<Z
<b)= p(Z
!b)-
(1,45 < Z < 2,89) = 0,4981
0,4
Xr=35
Xz=40
= L,45 = 2,89
p(,2 s d)
Z 1,45 2,91 - 0,4265 = O,O7t6
a7
lt
Resp: 7,16
o/o
ESTADíSTI'A
II
3) El promedio de un examen final de Estadíst¡ca fue de 65 puntos con una desv¡ación estándar de 5 puntos, se sabe que el 1oo/o superior rec¡ben calificación "A". Determine la calificación mínima de un alumno clase "A". PIZ
>
a)=l-
PIZ <¿)
I
r,28 Para hallar el área de 0 a Z que da la tabla, se resta de la mitad del área el 10yo. P
(> 100/o) = 0,5 - 0,1
=
0,4
Al buscar en la tabla Za qué valor de Z le corresponde el área 0,4 o observa que el valor que más se aproxima para Z es f,2B (O,3997). Al reemplazar lo valores conocidos en la
fórmula:
Z! = (Xt
-
u)
/
O,4OOO?; se
o
r,28 = (x, -6s)/s 1,28(s) = (X, - 6s)
x1 = 1'28(s) +65
=
71'4
Resp: El puntaje mínimo requer¡do es 71,4
Resolver los siguientes ejercicios propuestos sobre el Modelo Normal:
1) Supongamos que Z es una variable aleator¡a N (p, o), que se distr¡buye normalmente según N (0, 1); calcular: a) P (Z < - 1,31) Resp: 0,0951 b)P(Z>-1,31) Resp: 0,9049 c)P(-1,16<Z<7,22) Resp: 0,7658 d) P(- 2,s6 <Z<-7,37) Resp: 0,0801 e) P (1,94 Resp: 0,0241 =232,87) 2) S¡guiendo la ley normal en un test de inteligencia la puntuación med¡a fue de 1OO con una desviación estándar de 5. ¿eué porcentaje de evaluados obtuv¡eron puntajes entre 85 y 110 puntos? Resp: 97,59olo
3) Dos de cada
c¡nco famil¡as de una ciudad t¡enen teléfono, de una muestra de gO familias, ¿cuál es la probab¡lidad de encontrar entre 30 y 40 fam¡lias con teléfono? Resp: 0,6436
4) En Lima la temperatura media en Febrero, es de 23o con una desviación estándar de 30, ¿en cuántos días de Febrero se espera que la temperatura sea mayor a 260? Resp: 4 dÍas
t)
WALTE R CÉSPEDES RAM íREZ
s) La vida útil promedio de cierta marca de llantas es 38 000 kilómetros con una desviac¡ón estándar de 3 ooo kilómetros. Si se el¡ge al azar una llanta, ¿cuál es la probab¡lidad de que tenga durac¡ón entre 35 000 y 38 000 kilómetros? Resp: 0,3413 6) Siguiendo la ley normal en un test de ¡nteligenc¡a, la puntuac¡ón media fue de 100 con una desviación estándar de 5. Si se aprueba el test con 110 puntos, ¿cuál es la probabil¡dad de aprobar el test? ResP: 0,0228
7) La garantía de producc¡ón de una cierta marca de llantas es de 35 000 kilómetros,
si
se selecc¡ona al azar una llanta de esta marca, ¿cuál es la probabilidad de que supere la garantía, si se conoce que el promedio de durac¡ón es 38 000 kilómetros con una desviación estándar de 3 000 k¡lómetros? ResP: 0,8413
8) Un saco que cont¡ene 4OO monedas es vac¡ado sobre una mesa, si se observan las pos¡c¡ones en que han quedado las mismas, écuál es la probab¡l¡dad de encontrar más de 210 caras? ResP: 0,1587
9) Las bolsas de plástico utilizadas para empacar productos alimentic¡os, se fabr¡can de
modo que la resistencia a la rotura tenga d¡stribuc¡ón normal con media de 5lib/pulg'? con desviac¡ón típica de 1 lib/pulg'?. S¡ se selecc¡ona al azar una de estas bosas, ¿cuál es la probabilidad de que resista entre 3.5 y 5.5 lib/pulg'?a la rotura? ResP: 0,6247
10) Las bolsas de plástico util¡zadas para empacar productos alimentic¡os, se fabrican de modo que Ia resistencia a la rotura tenga d¡stribución normal con med¡a de 5 lib/pulg'z con desviación típica de l lib/pulg'?. Si se aceptan como mínimo una res¡stencia a la rotura de 2.8 lib/pulg'? para pasar el control de calidad, en una producción de 10 000 bolsas, ¿cuántas bolsa no superarán el control de calidad? Resp: 139,
7l
Le cción
2.4 Modelo
t-
4
Student
Es una distribución de variable continua que tiene la forma de una campana similar al modelo Normal, y la variable puede tomar un número infinito de posibles valores dentro de un intervalo. Fue William Sealy Gosset, estadístico inglés quién utilizó este modelo en 1008 en la publicación del estudio sobre prueba y error en la producción de cebada, bajo el seudónimo de t-studenU el modelo descubiefto por Gosset, posterior mente fue ampliado por Fisher.
t7 5a
E
STAD ÍST
ICA
I]
Al convertir cualquier variable en términos estándar (t) y por ut¡lizar "n - 1" grados de l¡bertad (7), se conv¡erte en un modelo que tiene var¡as famil¡as, una por cada qrado de libertad, con valores que van desde menos infinito a más inñn¡to; además el modelo es s¡métrico porque resulta de una función de dens¡dad con valores al cuadrado y por ser su exponente negativo¡ la función que define este modelo nunca es cero. Es una distr¡bución de probabilidad de pequeñas muestras que se utiliza mayormente para probar la hipótesis acerca de parámetros o para estimar parámetros por ¡ntervalos.
2,4.1 Características Cuenta con las sigu¡entes característ¡cas:
t tiene forma de campana con centro en 0. t, está más dispersa que la curva normal estándar z. 3" Este modelo utiliza grados de llbertad (7 = n - 1), por lo que pertenece 1o Cada curva 2ó Cada curva
a
varias familias. Una familla para cada qrado de l¡bertad. 40 A medida que aumentan los grados de libertad, la dlspersión de la curva t correspondiente disminuye y se aproxima a una d¡stribución normal. 5o Es una probab¡l¡dad de variable continua. 60 Es aplicable solo a pequeñas muestras cuando n < 30; en caso contrar¡o, se vuelve Normal. 7o Tiene una única moda, que co¡ncide con su media y su mediana; todas ellas en este modelo están s¡empre en el centro.
2.4.2 Definición Si "p" (Mu) es la probabilidad promedio y "o" la desv¡ac¡ón estándar de ocurrenc¡a del suceso esperado, el Modelo t- student se define con la s¡guiente func¡ón de dens¡dad: r1t¡ =
Pt!/211 .l vtr f (r /2)
+
t'lv),',,
.
El área que enc¡erra la función de densidad, está dada por:
[,r@a<,):t Si el alumno no recuerda el cálculo integral, el área que neces¡te sobre ella, puede encontrarlo en la tabla de la Distribución T-Student que se encuentra en los anexos; previa convers¡ón, de la var¡able "X" en variable "t" de Ia s¡guiente manera:
t=(x_p)/o Donde:
X = Var¡able de referenc¡a que va a ser convertida en t. p = Med¡a Ar¡tmética. o = Desviación Estándar.
l6
WALTER CÉSPEDES RRI"I íRTZ
2,4,3 Propiedades El modelo de probabilidad t-student tiene las siguientes propiedades: 10 La Media Aritmética es:
0
paray > 1, en caso contrario es indefinida' V
20 La Varianza es:
v-2 paray > 2, en caso contrario es indefinida. 3o La Desviación Estándar es:
,tr
2,4,4 Cómo utilizar la Tabla T-Student La tabla que se adjunta bajo anexos, da los valores entre t y el infinito (o), tales valores pueden encontrarse en una cola o repartidos por partes iguales en dos colas, tal como se muestran en los gráficos.
*tott
Ot, Ejemplo 1) si o = 0,05 y T
= t3;
a
Íoll
la probabilidad para este valor a dos colas es:
el valor de t se encuentra en la intercepción de la columna 0,05 a dos colas con la línea 13 grados de libertad; ResP: t = +2,t60 P
(-t, > t > tr) = 0,05;
- 2,16
2,16
t77a
ESTADíSTICA II
Ejemplo 2) si cr derecha, es:
= 0,05 y T = 10; la probabilidad para este valor a una cola a la
P (t > tr) = 0,05; el valor de t se encuentra en la intercepción de la columna 0,05 una cola con la línea 10 grados de libertad;
Resp: t
1,812 Ejemplo 3) Si o izquierda, es:
=
a
7,8L2
t
= 0,05 y n = 10; la probabilidad para este valor a una cola a la
P (-t, 2 t) = 0,05; el valor de t se encuentra en la intercepción de la columna 0,05 a una cola con la línea 9 (10 - 1) grados de libertad;
Resp:
-
t=-1,833
1,833
Ejercicios resueltos:
1'
Usando la distribución de t-student determinar los puntos críticos de una distribución bilateral a una significación del2Oo/o de:2;3;4;5;7.
P(-tr>t>t2)=0,20
a=0,20
!=5_7
=4
Resp:
*
1,533
2) Usando la distribución de t-student determinar el punto crítico de una distribución unilateral derecha a una significación del 5% para n = 21. P
(t > tr) =
0,05
o=0,05 12= 2l _1=20
Resp: 1,725
3) Graficar y determinar los puntos críticos para una distribución de t-student bilateral con significación de 0,01 y 15 grados de libertad.
P(-tr>t>tr)=0,01
o=0,01
T=75
§78 §
Respi + 2,947
WALTER CÉSPEDES RAMíREZ
- 2,947 2,947
t
y determinar los puntos críticos para una prueba bilateral con un nivel de significación del 5olo y con 27 grados de libertad.
4) Graficar
cr=0,05 T
P(-tr2t>tr)=0,05
-2,052
=27
Resp:
+ 2,052
2,052
5) Graficar y determinar los puntos críticos para una prueba bilateral con un nivel de confianza del 95olo
y
con 27 grados de libertad.
P(-t, <t<tr) = 0,95
cr=
0,05
T =27
Resp:
+ 2,052
El alumno habrá observado que al nivel de confianza del 95olo le corresponden los mismos puntos críticos que al nivel de significación de 5o/o; solo difieren en
el gráfico, por que el nivel de signiñcación se refiere a la parte sombreada y el nivel de confianza a la parte en blanco.
6) Graficar y determinar el punto crítico para una prueba unilateral izquierda con nivel de confianza de 99olo pard n = 22. P
(-t, < t) = 0,99
-
cr=0,01 T=22-1=21
2,518
l79t
Resp:
- 2,518
un
E
STAD fST
ICA
]I
Resolver los sigu¡entes ejerc¡c¡os propuestos sobre el Modelo T_student:
1) sea x el salario por hora de cualqu¡er minero sereccionado al azar considerando que se distr¡buye normalmente, s¡ el punto crítico t = 2,624) con una s¡gnificac¡ón de 0,01, hallar n para un ensayo de una cola. Resp: 15
2) El área a la derecha de t más el área a la izquierda de t sea libertad, hallar los puntos crÍticos t
O,O1 con 5 grados de
Resp: + 4,032
3) Hallar el punto crítico para una prueba un¡lateral izquierda con 25 grados de l¡bertad al 9590 de confianza. Resp:
-
1,708
4) Hallar los puntos crít¡cos para: p (-t1 < t < tr) = 0,95,
cr=0,05yy=78.
Resp: + 2,101
5) Hallar los puntos críticos para: p (-t1 > t > tr) = 0,01,
s=O,Olyl =7.
Resp:
+ 3,499
6) sea x el salario por hora de cuarquier m¡nero sereccionado ar azar cons¡derando que se d¡str¡buye normalmente, s¡ el punto crítico t = 1,311; con una sign¡ficación de O,f, hallar n para un ensayo de una co¡a. Resp: 30
7) El área a la derecha de t más el área a la izqu¡erda de t sea 0,98 con 25 grados de libertad, hallar los puntos críticos t. Resp: + 2,485 8) Hallar el punto crítico para una prueba uniraterar izquierda con 16 grados de r¡bertad al 997o de confianza.
Resp:
-
2,583
9) Hallar los puntos crít¡cos para: p (- t1 < t < tr) = 0,90,
«=0,1
y =fI
Resp: a 1,796 10) Hallar los puntos críticos para: p
o=0,01 y=24
(-tr > t > tr) = 0,01, ResP:
BO
+ 2,797
ón
Lecci
2.5 Modelo Ji
5
- Guadrado
Función de densidad de probabilidad
Es una distribución de variable continua conocido como Chi-Cuadrado, que tiene la forma asimétrica y la variable toma un número pequeño de posibles valores dentro de un intervalo. Fue Karl Pearson, estadístico inglés quién utilizó este modelo entre 1883 y 1-972, al publicar "Contribuciones matemáticas a la teoría de la evolución", lo que es actualmente el modelo li-Cuadrado.
&8
l§
ESTAD iST
ICA
II
Al convert¡r cualquier var¡able en térm¡nos /'z y por ut¡lizar "n
-
1" grados de libertad
(17), se convierte en un modelo que tiene varias fam¡l¡as con valoTes que van desde cero a 100o/o; es una distr¡bución de probabil¡dad de pequeñas muestras que se utiliza
mayormente: para probar la hipótesis sobre el análisis de la var¡anza a una sola vía, para est¡mar parámetros por intervalos sobre Ia var¡anza, para anal¡zar variables no paramétricas (cual¡tativas o no numér¡cas), etc.
2.5.1 Características Cuenta con las siguientes
ca
racteríst¡cas:
1o Cada curva x2 tiene forma asimétr¡ca y es sesgada hac¡a la derecha. 20 Este modelo ut¡l¡za grados de l¡bertad (y = n - 1), por lo que pertenece varias famil¡as. Una fam¡l¡a para cada grado de l¡bertad. 3o Es una probabilidad de variable continua. 40 Es aplicable solo a pequeñas muestras (n < 30). 50 Su curvatura depende de su grado de libertad. 60 puede ser aplicada para un ensayo un¡lateral o b¡lateral.
a
2.5,2 Definición El N4odelo.li-Cuadrado se define con la sigu¡ente función de dens¡dad:
^ :a"e: 'xo t:. f(r) r(p)
'
r
>0.
dondefrpr=
Je
'xe
dx
El área que encierra la función de densidad, está dada por:
l.
'^,
r
'a1*¡=
Para x > o
Si el alumno no recuerda el cálculo integral, el área que necesite sobre ella, puede encontrarlo en la tabla de la Distribuc¡ón J¡-Cuadrado que se encuentra en los anexos.
2.5,3 Propiedades El modelo de probabil¡dad Ji-Cuadrado tiene las s¡guientes prop¡edades: 10 La Media Aritmética
es:
20 La Varianza es: 30 La Desviación Estándar
L
y
2v
.t, .!2,
8)
.
WATTER CÉSPEDES RAMIREZ
2.5,4 Como utilizar la Tabla li-Cuadrado La tabla que se adjunta bajo anexos, da los valores entre 0 y 100o/o, tales valores pueden encontrarse en una cola o repart¡dos por partes iguales en dos colas, los grados de libertad están representados por (y = n - 1). 10 Caso: Cuando la prueba
7'?
es a una cola a la ¡zquierda, con c¡ = 0,05 y T
= 27.
El punto crít¡co Ji-Cuadrado lo hallará en la intercepción de /,oos con la línea 27. Resp : 16,2
x2o
o,
= \6,2
20 Caso: Cuando la pruebaa'? es a una cola a la derecha, con c = 0,05 y
y = 27.
En este caso debe restar 1 - 0,05 = 0,95 para pasar el valor hacia la derecha. punto crít¡co J¡-cuadrado lo hallará en la intercepción de ¡20$ con la línea 27.
El
Resp: 40,1
x2oss
30 Casor Cuando la prueba
Í':es
= 40't
dos colas, con o = 0,05 Y
y=
77
2 = 0,O25 y restar 1 - 0,025 = 0,975. El primer punto crítico Ji-Cuadrado, el de la ¡zqu¡erda, lo hallará en la ¡ntercepción de /20 o2s con la línea 17. El s¡guiente punto crítico Ji-Cuadrado, de Ia derecha, lo hallará en la ¡ntercepción de x'o"r, con la línea 17. Resp: 7,56 y 30,2 En este caso primero debe d¡vidir
N2 o.a2s
= 7 ,56
X2o
rr, =
cr
/
2 = 0,05
3o,2 §B3t
/
ESTADISTICA II
Ejercicios resueltos
1) Usando la distribución Ji-Cuadrado determinar bilateral a una significación del2Oo/o
los puntos críticos de una distribución
de:2;3;4;5;7.
Solución:
a=
0,20
/
2 = o,7o T = 5
- L=4
P
(x'o.ro2
x'
z x'o."o) = o,2o Resp: 1,06 y 7,78
2) Usando la distribución Ji-Cuadrado determinar el punto crítico de una distribución unilateral derecha a una significación del 5olo párd n = 21. Solución:
cr=1-0,05=0,95
T= 2l-!
=20
(x' 2 x'o'r) = 0,05
P
Resp: 31,4
3) Graficar y determinar los puntos críticos para una distribución li-Cuadrado bilateral con significación de 0,01
Solución:
o=
0,01
/2=O,OO5
y
15 grados de libertad.
T=15 P(f 'o.oor>X2>)('o.nnr) = 0,01
Resp: 4,6 y 32,8
= 4,6 X'o.nnu = 32,8 4) Graficar y determinar los puntos críticos para una prueba bilateral con un nivel de significación del 5olo y con 27 grados de libertad. )(2o.oo,
Solución:
s=0,05/2=0,025 T=27
x'o.or,
= 14,6
P (X'o.orr
X'o,nr, = 43,2
lB,+t
2
x'
2 )('o.n,r) = 0,05 Resp: 74,6 y 43,2
WALTE R CÉSPEDES RAM fREZ
5) Graficar y determinar los puntos críticos para una prueba bilateral con un nive¡ de confianza del 95o/o y con 27 grados de libertad. Solución: ct'=0,05 /2=0,025
)(20a25
= 74,6
V=27
l2o
P (zro.o,5 S X2
e7s
3
=O,95 Resp: 14,6 y 43,2
X2o.nrr)
= 43,2
El alumno habrá observado que el nivel de s¡gnificación del 57o es igual al nivel de confianza del 95%; en cuanto a los puntos críticos ¡ 2, son los mismos, pero diñeren en la interpretac¡ón del gráñco ya que ahora el nivel de confianza es el área en blanco.
6) Graficar y determ¡nar el punto crítico para una prueba un¡lateral izquierda con un nivel de confianza de 99o/o parc n = 22. Soluc¡ón:
o=0,01 v=22-1=21
x2o o,
P (x'o.or
s
x'z) = 0,99 Resp: 8,9
= 8,9
Resolver los s¡guicntes ejerc¡c¡os propucstos sobre el Modelo J¡-Cuadrado: 1) Sea X el salario por hora de cualqu¡er obrero seleccionado al azar cons¡derando que se distribuye según J¡-Cuadrado y el punto crítico es x 2o o, = 4,66, hallar n. ResP: 15
2) Si P(¡'z,",, x'< x'o.",r) = = Hallar los puntos críticos 2,.
0,95yv=5. Resp: 0,831
y 12,8
3) Hallar el punto crít¡co para una prueba unilateral izquierda J¡-Cuadrado con 25 grados de libertad al 95olo de confianza. ResP: 14,6
§85§
ESTADÍSIICA
4)
II
¿Cuáles son los puntos críticos para una prueba Ji-Cuadrado bilateral
al 90yo
de
confianza y 18 grados de l¡bertad? Resp: 9,39 y 28,9
5)Si
P (7'zooor
2
x'2
x'o.""r)
= O,07YY=7.
Hallar los puntos críticos 1'?.
Resp: 0,989 y 20,3
6) Sea X el salario por hora de cualqu¡er obrero seleccionado al azar cons¡derando que se d¡str¡buye según Ji-Cuadrado y el punto crítico es x2ats = 27,7, hallar n. Resp: 24
7) Si P (¡'?00, 3 x'3 X'onn) = 0,98Y7=15. Hallar los puntos crítlcos 2 '?.
Resp: 5,23 y 30,6
8) Hallar el punto crít¡co para una prueba unilateral derecha li-Cuadrado con 25 grados de l¡bertad al 95o/o de confianza.
Resp:37,7
9)
éCuáles son los puntos críticos para una prueba Ji-Cuadrado b¡lateral conñanza y 8 grados de libertad? Resp: 3,49 y 13,4
10) Si P (7'?00, 2 x'2 X2orr) = 0,7O Y Y = 22. Hallar los puntos crít¡cos /'?.
¡86'
Resp: 12,3 y 33,9
al
80o/o de
Lección
2.6 Modelo F de Fisher Función de densidad de Ia distribución F de Fisher-Snedecor
q
&¡ rQ
dl:1 . dÉ*I dl:2. d2:ll
q
dI -5, d2-2 d!*'tOO, d8*l dl*1OO. d8*1OO
{.f?
€
q'
§
t87t
ESTAD íST
ICA
II
Es una distr¡bución de variable cont¡nua conoc¡da como Distr¡buc¡ón Fisher-Snedecor.
Rec¡bió este nombre en honor al estadíst¡co matemático Sir Ronald Aylmer F¡sher, uno
de los fundadores de la estadística moderna y por el estadístico matemát¡co amer¡cano George Waddel Snedocor. Esta d¡stribución de probabil¡dad se usa como prueba estadíst¡ca en var¡as situac¡ones: se emplea para probar si dos muestras prov¡enen de poblaciones que poseen varianzas
iguales, tamb¡én es út¡l para determ¡nar si una población normal tiene una mayor var¡ac¡ón que la otra, se apl¡ca cuando se trata de comparar s¡multáneamente varias med¡as poblac¡onales, etc. La comparac¡ón simultánea de varias med¡as poblac¡onales, se conoce como anális¡s de varianza (ANOvA). En cualqu¡era de las s¡tuac¡ones menc¡onadas, las poblaciones deben ser normales y los datos deben tener al menos una escala de intervalos.
Este modelo por utilizar dos grados de libertad se const¡tuye en una familia muy numerosa, por que a un solo grado de libertad del numerador (N) le corresponde un conjunto de familias por los grados de l¡betad del denom¡nador (D) y v¡ceversa.
2.6.1 Gracterísticas Cuenta con las siguientes características: 1o Cada curva F t¡ene forma asimétrica y es sesgada hac¡a la derecha; es decir que su sesgo es pos¡t¡vo. 20 El modelo F utiliza doble (n 1) grados de libertad que para el numerador se
-
llamará N y para el denominador se llamará D. 30 Cont¡ene el modelo F una familia para cada doble grado de libertad por ello pertenece a múltiples fam¡lias. 40 Es una probabil¡dad de variable cont¡nua. 50 Su curvatura depende de su grado de l¡bertad. 60 Se util¡za únicamente en ensayos o pruebas un¡laterales a la derecha 70 A med¡da que aumentan los valores, la curva se aproxima al eje "X", pero nunca lo toca, por que la ordenada "Y" nunca es cero.
2.6.2 Definición El Modelo F de Fisher, se define con la siguiente función de densidad:
tGÉ
¡¡N.pD.¡!!? 2 2 2 .{.D 22
x!-r(o+Nx\Y
Donde: T = la función gamma de Euler. N = Grados de libertad del numerador. D = Grados de libertad del den¡m¡nador.
88
WALTER CÉSPEDES RAMÍREZ
El área que encierra la función de densidad, está dada por:
l"
**o
'a1*¡=t
Para x > 0
Si el alumno no recuerda el cálculo integral, el área que necesite sobre ella, puede encontrarlo en la tabla de la Distribución F que se encuentra en los anexos.
2,6,3 Propiedades El modelo de probabilidad F de Fisher tiene las siguientes propiedades: 10 La Media Aritmética es:
D/(D-2) Para D > 2, en caso contrario es indefinida.
zo'?(N+o+z)
20 La Varianza es:
N(D - 2)'z (D - 4) Para D > 4, en caso contrario es indefinida. 30 La Desviación Estándar es: Para D > 4, en caso contrario es indefinida.
2,6,4 Cómo utilizar la Tabla F de Fisher La tabla que se adjunta bajo anexos, da los valores tomando en cuenta una tabla para cada nivel de significación siendo los más usados: Lo/o,5o/o y tOo/o
En cada tabla las columnas señalan los grados de libertad del numerador (N) y en las filas se encuentran los del denominador (D). El cruce de filas y columnas indican el punto crítico Fisher, de la siguiente manera: F (cr, N, D)
Donde: a : Nivel de signlficación N: Grados de libertad del numerador (n - 1) D: Grados de libertad del denominador (n - 1) Ejemplo: F (0,05, 8, 25) Primero hay que buscar la tabla Fisher del 0,05, luego ubicamos en la tabla la columna
8 y después la fila 25.
Resp:2,34
2,34
F
Los puntos crít¡cos de este modelo de distribución continua siempre están al lado derecho. *89*
ESTADíSTICA Ii
Ejercicios resueltos
1)
Usando la distribución F de F¡sher determinar punto críticos para la var¡anza del numerador de i 2i 8l l4i 75 y Z7l y para la varianza del denom¡nador dei Z, 4, S, 7,9, lO y 11, el nivel de significación del 5olo
solución:
N=5-1=4
D=7-7=6
F
(0,0s, 4, 6) Resp:4,53
2) Usando la distribución F de F¡sher determinar punto crít¡cos para la varianza del numerador con n = 16 y para la varianza del denominador con n = 11, al nivel de significac¡ón del 10olo
Solución: N = 16 - 1 =
15
D =11
-
1 = 10
F
(0,10, 1s,
10)
Resp:2,24 Resolver los s¡gu¡entes ejercic¡os propuestos sobre el Modelo F: 7) F (O,70, 40, 24)
Resp: 1,64
2)F(O,Os,7,74)
Resp: 2,76
3)
F
(0,10, 2, 30)
Resp: 2,49
4)
F
(0,0s, 40, 40)
Resp: 1,69
s)
F
(0,10, s, 40)
Resp: 2,00
6)
F
(0,0s, 1s, 15)
Resp: 2,40
7)
F
(0,10, 10, 4)
Resp: 3,92
8)
F
(0,0s, 120, 3)
Resp: 8,55
9)
F (O,tO
, 24, 24)
Resp:1,70
10) F (0,0s, 1, 3)
Resp: 10,13
i90!
WALTE R CÉSPEDES RAMíREZ
AUTIIIUALUACIÍIN NO 2 1) Si a una hora determ¡nada se admite que un número de teléfono de cada cinco estén comunicados¡ ¿cuál es la probab¡l¡dad de que de cada 8 números de teléfono elegidos al azar, solo tres puedan comun¡carse?
A)
0,2464
B)
0,1468
C)
0,2722
D)
0,2644
2) La probabilidad de que un hombre gane una partida de ajedrez es 2/5. veces ¿cuál es la probab¡lidad de que gane en tres ocas¡ones?
A)
0,2649
B) 0,046s
c) 0,22ts
D) 0,s614
E) O,s377 S¡
juega 10
E) 0,2150
seguros vende pólizas a cinco personas de la m¡sma edad y que d¡sfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas cond¡c¡ones viva 30 años o más es 2/5. Hállese la probabilidad de que, transcurridos 30 años, vivan dos personas,
3) Un agente de
A) 4)
0,34s6
B) O,3462
c) 0,37s8
D) O,2647
E) 0,7377
¿Cuál es la probabil¡dad de obtener 4 veces un número mayor de 4 al lanzar un dado 10 veces?
A)
0,3461
B) 0,1168
c) 0,2922
o)
o
,227 6
E) 0,037s
5) Si el 3,50/o de las bombillas fabricadas por una compañía son defectuosas, hallar la probabil¡dad de que en una muestra de 50 bombillas como máximo 1 sea defectuosa.
A)
0,3404
B) 0,1068
c) o,1729
D) O,4779
E) 0,1381
6) Si un banco recibe en promedio I clientes clase A por día, icuál es la probabilidad de que reciba 15 clientes clase A durante 3 días consecutivos?
A)
0,2464
B) 0,1468
c) 0,0146
o) 0,2644
E) 0 ,s37 7
7) Supongamos que la probab¡lidad de tener una unidad defectuosa en una línea de ensamblaje es de 0,055. S¡ el conjunto de unidades terminadas son independientes, ¿cuál es la probabilidad de que por lo menos se encuentre una un¡dad defectuosa de 20 ensambles?
A) 8)
0,6848
B) 0,6671
c)
o
,s7 25
D) 0,7644
E) 0,5372
E¡ gerente de un restaurante que sólo da servic¡o med¡ante reservas, sabe por exper¡encia, que el 49o de las personas que reservan una mesa no asistirán. Si en el restaurante aceptan hasta 40 reservas, ¿cuál es la probabilidad de que al menos a 1 reserva no asistan clientes?
A)
0,s460
B) 0,4818
c) o,7724 !91¡
D) 0,6644
E) 0,7981
E
SIAD í5T ICA II
9) Dos de cada c¡nco famillas de una ciudad, tienen horno microondas; de una muestra de 80 familias, ¿cuál es la probabil¡dad de encontrar entre 30 y 40 familias con horno m¡croondas?
A)
B) 0 ,7 468
0,8488
c) 0,6436
D) O,6944
E) O,5227
10) En la ciudad de L¡ma en Julio la temperatura media es de 170 con una desviación estándar de 3o, ¿cuál es la probabilidad de que un día cualqu¡era de Jul¡o la temperatura sea inferior a 160?
A)
0,2464
B) 0,3707
c)
0
D) 0,2644
,27 22
E) 0,s377
11) La vida útil promed¡o de cierta marca de llantas es 30 000 k¡lómetros con una desviación estándar de 2 500 k¡lómetros. Si se elige al azar una llanta, ¿cuál es la probabil¡dad de que tenga duración superior 35 000?
A) 0,t246
B) 0,0148
c) o,1222
D) 0,0126
E) 0,0228
12) Siguiendo la ley normal en un test de inteligencia la puntuac¡ón media fue de 100 con una desv¡ac¡ón estándar de 5. S¡ se aprueba el test con 112 puntos, ¿cuál es la probabilidad de no aprobar el test?
A)
0,9499
c) o,9722
B) 0,9918
13) Hallarlos puntos críticos para: P (-t1
A) + 2,101
B) +
2,048
D) 0,9644
E) 0,9377
<t<tr)=0,95,o=0,05yt)=28. D) + 2,307
C) +1,701
E) +3,365
14) Hallar el punto crítico para una prueba unilateral derecha Ji-Cuadrado con 20 grados de libertad al 90olo de confianza.
A)
28,4
B) 31,4
c)
D) 26,0
27 ,2
E) 37 ,7
15) Usando la distrlbución F de F¡sher determ¡nar punto críticos para la varianza del numerador con n = I y para la varianza del denominador con n = 5, al nivel de s¡gn¡ficación del
A)
6,94
5olo.
B) 2,73
c) 4,82
D) 6,09
E) 3,98
Respuestas de control r
. B, 2. E , 3. A, 4. D, 5. D, 6. C, 7. B, 8. E, 9.
r92q
C,
0.
B,
t. E, t2. B, 3.8, t4.A, t5. D
WALTER CÉSPEDES RAMIREZ
TXPLORACIIIN ON LINE http://es.wikipedia.orglwiki/Estado/oC3o/oADstica#M.C3.A%odos_estad.C3.ADsticos http://www.aulafaci l. com/Cu rsoEstad
ist
icallecc-27-est. htm
§r0sABr0 El punto "Y" de una func¡ón matemática línea curva que
Asintótica:
cuando crece "X", se hace infinitamente pequeño pero nunca es cero (no cruza la abscisa "X"). Se utiliza en todos los modelos con tales características. Campana Gaussiana:
Línea curva simétrica en forma de campana, es una parábola en donde sus parámetros: "a" es la altura de es el ancho la campana, centrada en el punto de la misma. Se utiliza en el modelo de probabilidad normal.
Función de densidad:
Magnitud referida a una cantidad de masa contenida en un determinado volumen. Es la cantidad total de datos encerrados por la curva de un modelo de probabilidad.
Se utiliza en todos los modelos de
probabilidad
continua, A partir de la posición central, lo que tiene a la derecha,
Modelo simétrico:
se repite exactamente en la izquierda. Se utiliza en el modelo normal y en el modelo t-Student. Moneda confeccionada sin recargar su peso a alguno de sus lados, de tal manera que se pueda afirmar que cada lado tiene la misma probabllidad de ocurrencia. Se utiliza en juegos de azar.
Moneda equilibrada:
Probabilidad discreta
:
La probabilidad de ocurrencia de una variable discreta
(el valor numérico por "contar" las veces que se presenta la variable). Se utiliza en los modelos de probabilidad: Binomial y Poisson, vistos en esta unidad entre otros,
*Q?ñ
E
Probab¡l¡dad
continua:
STAD fST
ICA
II
La probab¡lidad de ocurrenc¡a de una var¡able continua
(el valor numér¡co por "med¡r" la ¡ntensidad de
una
característ¡ca de ¡nterés de una variable). Se ut¡l¡za en los modelos de probab¡l¡dad: Normal, t-Student, J¡-cuadrado y Fisher, vistos en esta unidad entre otros. Punto de
inflexión:
El punto en que una curva cambia de cóncava a convexa
o vtceversa, Se ut¡l¡za en todos los modelos con tales características.
194a
Ie r ce ra
UNIDAD Teoría del muestreo y esti
mación estad ística
§umario l'luestreo: tipos de muestreos, error de muestreo Distribuciones normales: de medias, de proporciones, de diferencias Teoría de la estimación rstadí¡tica:
efimación puntual, estimación por intervalos
Tamaño de la muestra
oBJEr¡vo(s) GENERAL:
.
Al término de esta unidad el alumno estará en capacidad de diferenciar las formas de obtener muestras y cuál es el tamaño apropiado de la misma a un determinado nivel de confanza. También conocerá los procedimientos para la estimación de parámetros de la Estadística lnferencial mediante el uso de estadísticos propuestos para esta unidad.
ESPECíFICOS:
.
Conocer cómo realizar un muestreo, como se diferencian, cuál es el más apropiado en una investigación para poder medir el margen de error en el muestreo.
.
Saber mediante las distribuciones muestrales que existe una diferencia entre la desviación estándar poblacional y la desviación estándar muestral, de tal manera que se pueda conocer el error de las distrrbuciones muestrales.
.
Conocer el procedimiento para estimar el valor del parámetro través de un valor (puntual) o
a
a
través de un intervalo de confianza
para: la Media, las Proporciones, Diferencias y Varianzas.
.
Conocer cuál es el tamaño de la muestra suficiente en
una
investigación y que dicho tamaño depende Io que se conoce sobre los datos.
t*96*
Le
CC
o
n
3.1 Muestreo Es un proceso por el cual se obtiene parte de los datos ex¡stentes para una investigación; el resultado de este proceso, es una muestra que los ¡nvestigadores la utilizan a pesar de estar incompleta la ¡nvestigación respecto a un censo; porque: es mas dinámica, es de menor costo, los resultados se obtienen mas rápidamente, si se controlan debidamente los errores, se puede lograr c¡erta prec¡sión y en el estud¡o previo para obtener la muestra, se conoce un poco más de la poblac¡ón perm¡tiendo mejores concentraciones de datos. Para obtener parte de la poblac¡ón o muestra, se han diseñado una ser¡e de técn¡cas o t¡pos que se presentan a continuación, así como las formas de medir el error en el muestreo. 3. 1,
1 Tipos de muestreos
Una muestra debe ser representat¡va si va a ser usada para estimar las características de la población. Los métodos para seleccionaruna muestra representat¡va son numerosos,
depend¡endo del tiempo, dinero y habilidad disponibles para tomar una muestra y la naturaleza de los elementos ind¡v¡duales de la población. Los métodos de selección de muestTas pueden ser clasificados de acuerdo a:
9l
ESTAD IST
3.1
.l.l
El número de mueshos
ICA
II
lomodos de uno pobloción dodo poro un estudio
Bajo esta clasificac¡ón, hay tres t¡pos comunes de métodos de muestreo que son: muestreo ún¡co, muestreo doble y muestreo múltiple.
a) Muestreo ún¡co Este t¡po de muestreo toma solamente una muestra de una poblac¡ón dada para el propósito de ¡nferencia estadística. Puesto que solamente una muestra es tomada, el tamaño de muestra debe ser lo suñc¡entemente grande para extraer una conclus¡ón. Una muestra grande muchas veces cuesta demas¡ado dinero y tiempo.
b) Muestreo doble Bajo este tipo de muestreo, cuando el resultado del estudio de la pr¡mera muestra no es dec¡s¡vo, una segunda muestra es extraída de la m¡sma poblac¡ón. Las dos muestras son combinadas para analizar los resultados. Este método perm¡te a una persona pr¡ncip¡ar con una muestra relativamente pequeña para ahorrar costos y t¡empo. S¡ la primera muestra arroja una resultado defin¡tivo, la segunda muestra puede no necesitarse.
c) Muestreo múlt¡ple Con este método se extraen muestras sucesivas similares al expuesto en el muestreo doble, excepto que el número de muestras suces¡vas requerido para llegar a una decisión es mayor de dos muestras. Este tipo de muestreo es util¡zado por las distr¡buc¡ones m
uestra les. 3.1
.l .2 Muestreo de iuicio de uno persono
Se denom¡na así, cuando sus elementos son selecclonados med¡ante ju¡c¡o personal. La persona que selecc¡ona los elementos de la muestra, usualmente es un experto en la medida dada. Una muestra de juicio es llamada una muestra no probabilística, puesto que este método está basado en los puntos de v¡sta subjetivos de una persona y la teoría de la probab¡lidad no puede ser empleada para medir el error de muestreo. Las princ¡pales ventajas de una muestra de ju¡c¡o son la fac¡l¡dad para obtenerla y que el costo usualmente es bajo. Entre los métodos de muestreos basados en ju¡c¡os de personas, se pueden cons¡derar: el muestreo por cuotas, el muestreo por teléfono, etc. 3.1
.l .3 Muestreo de selección oleolorio
Se dice que una muestra es extraída al azar, cuando la manera de selecc¡ón es tal que cada elemento de la poblac¡ón tiene ¡gual oportunidad de ser selecc¡onado. Una muestra aleatoria es también llamada una muestra probabilística que son generalmente preferidas por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser med¡do en térm¡nos de probabilidad bajo la curva normal. Los t¡pos comunes de muestreo aleator¡o son: el muestreo aleatorio s¡mple, muestreo sistemático, muestreo estrat¡ficado y muestreo de conglomerados. i,98t
WALTER CÉSPEDES RAMf REZ
a) Muéstreo aleatorio simple Una muestra aleator¡a s¡mple es seleccionada de tal manera que cada muestra pos¡ble del mismo tamaño tiene igual probabilidad de ser seleccionada de la poblac¡ón. Para obtener una muestra aleator¡a simp¡e y cada elemento en la población tenga la m¡sma
probabilidad de ser selecc¡onado, el plan de muestreo puede no conducir a una muestra aleator¡a s¡mple. Por conven¡encia, este método pude ser reemplazado por una tabla de números aleatorios y el ejemplo más s¡mple de este t¡po de muestro es una rifa.
b) Muestreo sistemático Una muestra sistemát¡ca es obtenida cuando los elementos son selecc¡onados en una manera ordenada. La manera de la selección depende del número de elementos ¡ncluidos en la poblac¡ón y el tamaño de la muestra. El número de elementos en la población es,
primero, d¡vidido por el número deseado en la muestra. El cociente indicará si cada déc¡mo, cada onceavo, o cada centésimo elemento en la población van a ser seleccionado. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra s¡stemát¡ca puede dar la m¡sma precisión de est¡mación acerca de la poblac¡ón, que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar. Por ejemplo; se tiene una l¡sta de 120 datos que pertenecen a una población y se desea tomar una muestra de 15 datos. Luego se d¡vide 120 / 75 = 8; esto quiere decir que Ia población ha s¡do estructurada en 15 partes de tamaño 8 y de cada parte se obtendrá un dato; para seleccionarlo se el¡ge al azar un número entre 1 y 8, supongamos que se elige el 3, la muestra estará formada por todos los datos de la pos¡ción 3 de cada grupo.
c)
Muestreo estrat¡ficado
Para obtener una muestra aleator¡a estrat¡ficada, primero se divide la población en grandes grupos llamados estratos, que son más homogéneos que la poblac¡ón como un todo. Los elementos de la muestra son entonces seleccionados al azar o por un método s¡stemát¡co de cada estrato. Las estimaciones de la población, basadas en la muestra
estratificada, usualmente tienen mayor precis¡ón (o menor error muestral) que s¡
la
población entera muestreada med¡ante muestreo aleatorio s¡mple. El número de elementos seleccionado de cada estrato puede ser proporcional o desproporc¡onal al tamaño del estrato en relación con la población, solo depende de la var¡abil¡dad del estrato.
d) Muestreo de conglomerados Para obtener una muestra de conglomerados, primero dividir la población en pequeños grupos o áreas convenientes para el muestreo. Luego se toman todos los elementos de cada grupo que gener¿¡lmente t¡enden a ser ¡guales. Por ejemplo la gente rica puede v¡v¡r en el m¡smo barr¡o, mientras que la gente pobre puede v¡vir en otro barrio y no todo el barrio es muestreado en un muestreo por conglomerados. La variac¡ón entre los elementos obten¡dos de las áreas selecc¡onadas es, por lo tanto, frecuentemente mayor que la obtenida si la poblac¡ón entera es muestreada med¡ante muestreo aleatorio simple. Esta debilidad puede ser reducida, cuando se aumenta con más áreas el tamaño de la muestra.
a99a
ESTADiSTICA
II
3,1,2 Error muestral o error de muestreo La diferencia entre el resultado obtenido de una muestra (un estimador) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente), se llama el error muestral o error de muestreo. Un error de muestreo usualmente no ocurre cuando se lleva a cabo la encuesta completa de la población, sino cuando se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mlentras más pequeño el error muestral, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población'
3,1,3 Error estándar
La desviación estándar de una distribución en el muestreo de un estimador, es frecuentemente llamada el error estándar del estadígrafo. Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la misma manera/ la desviación estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la proporción. La diferencia entre los términos "desviación estándar" y "error estándar" es que la primera se refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra. Este punto se ampliará en las distribuciones muestrales.
¡t00,
Lecció
n
2
3.2 Bistribuciones muestrales Es un proceso por el cual después de haber extraído varias muestras bajo cualquier procedim¡ento aleator¡o ya expuesto, con o s¡n reemplazo, se procede a extraeT de cada una de ellas el estimador a ¡nvestigar; que puede ser: Media, Varianza, Proporciones, etc. Tales medidas estadísticas se ordenan en tablas y por tratarse de datos muestrales toman el nombre de Tablas de D¡stribuc¡ón Muestral.
En adelante se denominará Estadíst¡co, a cualqu¡er medida estadíst¡ca calculada partir de una d¡stribución muestral.
Ejemplo
a
1
Consideremos una pequeña población de 6 números: {4,7,8, 10, 15, 16} Con los datos se p¡de: 10 Extraer todas las posibles muestras con reemplazo de tamaño 2 (n = 2). 20 Sacar de cada una de las muestras la Med¡a Aritmética. 30 Distr¡buir en una tabla las ¡4ed¡as Ar¡tmét¡cas Muestrales. 4" Obtener la Media Aritmét¡ca y la Desv¡ación Estándar de la tabla (Estadíst¡cos). 5o Obtener la lvledia Aritmética y la Desv¡ac¡ón Estándar de la Población (Parámetros). 6o Comparar ambos estadísticos con los parámetros correspondientes.
ar0rI
ESTAD IST
ICA
II
Solución: 10 Extracc¡ón de las muestras
(n = 2):
4,4) ( 4,7) ( 4,8) ( 4, 10) ( 4,ts) ( 4,76) 7,4) ( 7,7) ( 7,8) ( 7, 10) ( 7,7s) ( 7, L6) 8,4) ( 8, 7) ( 8, 8) ( 8, 10) ( 8, 1s) ( 8, 16) (10, 4) (10, 7) (10, 8) (10, 10) (10, 1s) (10, 16) (1s, 4) (15, 7) (1s, 8) (1s, 10) (15, 15) (15, 16) (16, 4) (16, 7) (16, 8) (16, 10) (16, 1s) (16, 16)
2o Medias Aritméticas de cada una de las muestras:
4 5,5 6 7 9,5 10
7 6 5,5 7 7,5 8,5 7,5 I 9 10 9 8,5 11 11,5 t2,5 13 11,5 72
9,5 11 11,5 L2,5 15 15,5
10
11,5
t2 13
15,5 16
30 construir la tabla de d¡stribución de frecuencias con las medias muestrales:
fi
x¡
fixi
(x¡
-r)
fi (xi
-r),
-
6,0
3 6,0 40,5
-
4,0
32,O
3,0
27 ,O
2,5
72,5
2,O
4,O
t7 ,0
1,5
4,5
2
18,0
2,O
2
19,0
- 1,0 - 0,5
10,0
3
3
0,0
0,0
0,5 0,0
1
1,0
2
22,O
1,0
2,O
1
4,O
4,O
1
1,0
2
1
6,0
2
12,0
7,O
3
27,O
7,5
2
15,0
8,0
7
8,0
8,5 9,0
2
-
1,5
4
46,0
1,5
9,0
12,0
2
24,O
2,O
B,O
t2,5
2
25,0
,q
12,5
13,0
2
26,0
3,0
18,0
5,0
15,0
1
15,0
15,5
2
31,0
1
16,0 360
16,0
36
4o Estadíst¡cos:
x =
360
/ 36 = Lo (Pi)
25,0
60,s 6,0
36,0 JJU,U
S
=
¡ r02l
<lzzu
n =
3,028
(Or)
WALTER CÉSPEDES RAI' iREZ
5o Parámetros:
p=(4+7+8+10+15+16)/6 = 60/6 = L0 o'?={36+9+4+0+2s+36}/6 = 110 / 60 =
o, = {(4-10)'+ (7-10)' + (8-10)' + (10-10)' + (15-10)' + (16-10)'}
o=
Jl8-333333X
=
/
6
18,33333333
4,2A2
Como en adelante se trabajarán con estadísticos y con parámetros; entonces, es conven¡ente d¡ferenc¡arlos con símbolos diferentes. 60 Comparación de los estadísticos con los parámetros:
ida Estadíst¡ca l.4edia Aritmética lvled
Desviación Estándar
Estad ístico
F¡ o¡
=to = z,ozs
Parámetro P
=
10
o = 4,282
El alumno habrá observado que al hacer las comparac¡ones, las medias son ¡guales, pero las desviaciones estándares no. Para que las desviac¡ones estándares sean iguales se corrige mult¡plicándolo por la raíz de n (tamaño de las muestras).
el
estadíst¡co
oi Gl;) = 3,028 x Jl = a,282 O tamb¡én, se puede correg¡r el parámetro d¡v¡d¡éndolo entre la raíz de n.
o/Gl;) = 4,2a2/ Jz = z,oze En una ¡nvestigación, se corrige lo segundo para hallar el error muestral; es
dec¡[ que ya no sería necesario extraer todas las pos¡bles muestras para conocer el error muestral.
Ejemplo 2 Consideremos nuevamente la pequeña población de 6 números: Con los datos se pide:
{4,7,8,10,75,76}.
10 Extraer todas las pos¡bles muestras sin reemplazo de tamaño 2 (n = 2). 20 Sacar de cada una de las muestras la lvled¡a Ar¡tmética. 3o Distr¡bu¡r en una tabla las l,led¡as Aritmét¡cas lvluestrales. 40 Obtener la Media Ar¡tmét¡ca y la Desv¡ac¡ón Estándar de la tabla (Estadísticos). 5o Comparar estos estadíst¡cos con los parámetros correspondientes hallados en
el ejemplo anterior (ejemplol).
*103r
E
STA D íST
iCA
II
solución: 10 Extracc¡ón de las muestras sin reemplazo
4,7) ( 7,4) ( 8,4) (
4,8) 7,8) 8,7) 70,4) (tO,7) ls,4) (7s,7) 16, 4) (76,7)
4, 7, 8, (
10, 1s,
(
16,
(
(n = 2):
10) ( 4, 1s) ( 4, 16) 10) ( 7,1s) ( 7, 16) 10) ( B, 1s) ( 8, 16) B) (10, 1s) (10, 16) 8) (1s, 10) (1s, 16) B) (16, 10) (16, 1s)
Cuando no hay reemplazo, usted puede observar que han desaparecido todos los pares de datos iguales, tales como: (4, 4) (7,7) ... efc. 20 Medias Aritméticas de cada una de las muestras:
5,s67 5,5 6 7A,59 9,5 10
7,5 7,5 1
10
11
77,5
1,5 72,5
72 13
11,5
t2,5
12
't.)
15,5 15,5
8,5 9
11 1,5
1
3" Construir la tabla de distr¡bución de frecuenc¡as con las med¡as muestrales:
xi
fi
fixi
5,5
2
1
6,0
2
t2,o
7,O
2
74,0
7,5
2
15,0
8,5
2
17
9,0
2
18,0
AE
2
19,0
10,0
2
1
1,0
1
1,0
(xi -x) - 4,5
- 4,O - 3,0
fi (xi
-t),
40,5 32,0 18,0 72,5
7,5
A\
1,0
2,0
0,5
0,5
20,0
0,0
0,0
2
22,0
1,0
2,O
1,5
4
46,O
1,5
9,0
72,0
2
24,O
2,0
8,0
1,2,5
2
25,O
2,s
12,5
13,0
2
26,0
3,0
18,0
15,5
2
31,0
5,5
60,5
N
30
,0
-
220,O
300
¡
t04,
WALTE R CÉSPEDES RA¡4 ÍR EZ
4o Estadísticos:
7=
¡oo
/30
=
to
(pi)
s = <lzzu n
=
2,708
(Ol)
50 comparac¡ón de los nuevos estadíst¡cos con los parámetros: Med¡da estadística
Estadíst¡co
Med¡a Aritmética
ll¡
Desviación Estándar
Oi
Pará
= to = z,toe
metro P
=
10
o = 4,282
En este caso, las medias ar¡tmét¡cas siguen s¡endo iguales, en camb¡o las desviaciones estándares son diferentes.
como en el caso anterior, se puede correg¡r el parámetro (desv¡ación estándar) para hacerlo igual al estadíst¡co de la distribución muestral:
N-n N-l
oi= o
7;
:rlyl"E-l:,,,0, .,/2 L\/6-r l
n = tamaño de la muestra N = tamaño de la población.
Donde:
3.2.1 Distribución muestral de nedias Se denomina Distribución Muestral de Medias, cuando los datos d¡stribu¡dos en una tabla de d¡stribución frecuencias, son medias ar¡tmét¡cas muestrales que tienen un
comportam¡ento normal.
El promed¡o de la distribución conoc¡do como Media Aritmét¡ca de la Distr¡bución Muestral de Medias es igual a la lvledia Aritmética Poblacional = p), esto se ha comprobado en el ejemplo anterior que precisamente util¡zó medias aritméticas muestrales. La Desviación Estándar de la Distribución Muestral de Medias, se conoce como error de med¡as y se define de la sigu¡ente manera:
Error de medias s¡n reemplazo
con reemplazo
- lt¡t fN -"1
o
,.,trftr
.^r
t
-]
Ambas fórmulas fueron comprobadas con los ejemplos 1 y 2 de esta lección. h 05!
ESTADí5TICA II
Para que el alumno pueda diferenclar con que nombre se conoce y cual es la procedencia de algunas medidas estadística, a continuac¡ón se hace un resumen de símbolos d¡ferentes, que ind¡can por s¡ mismo: que medida estadística es, de donde proviene y cuál es el tipo de medida:
Medida estadística
Estimador
Parámetro
Estadístico Distribuc¡ón l''luestral
Muestra Media aritmética
Va ria
nza
Desviac¡ón estándar
Pob
de Med¡as
lación
x
p
s2
o2
S
o
F¡ 2
Ox O x ¡Error de Media)
Ejercicios resueltos 1) Hallar el error de la distribución muestral de medias, de una muestra de tamaño 25 extraída de una población de c¡erto producto vend¡do por una gran d¡stribuidora, con una desviación estándar 200.
Solución:
Oi=
o
/ 1.[n';
=
zoo
I
nB=
co
2) Hallar el error de med¡as, de una muestra de tamaño 60 extraída de una poblac¡ón de 5000 productos vendido por un supermercado/ con una desviación estándar 3,84 9r.
soluc¡ón:
. [ /,-" l=,.* [ rugq__jqll =o
ELtt
r-, 1-El
!L
sooo
4e2a J I l-""^
3) S¡ la media aritmét¡ca de las tabletas producidas por un laborator¡o es de 67,54 mg, con una desv¡ac¡ón estándar de 5,68 mg; calcular el error de la media para una muestra de 84.
Solución:
6¡= o/tJil=
5,68/^,J@= o,6te7
r
06t
WALTER CÉSPEDES RAMf REZ
4) Hallar el error de medias, de una muestra de tamaño 45 extraída de una población de 8000 productos vend¡do por un supermercado, con una desviac¡ón estándar 23,8 gr y media de 184,16 gr. Solución:
I E-,.l=z:.8[@ -osl:r.* " ELXr-r l- J4s L! t* -, l-''" 5) Se sabe que la vida út¡l med¡a de operación de un tubo de televis¡ón de una marca determinada es de 9000 horas con una desv¡ación estándar de 500 horas. Determ¡nar el valor esperado y el error estándar de la d¡stribuc¡ón de muestreo para la med¡a si el tamaño de la muestra es de 25. Interprete el sign¡ficado de los valores calculados.
soluc¡ón:
E(x)=P=9000horas
O¡= o/(^l;)=
soo
6tB =
1oo horas
Estos cálculos ¡nd¡can que a largo plazo, la media de un grupo grande de medias
de muestreo, basadas en muestras de tamaño 25, será ¡gual a 9000 hrs; la var¡ab¡l¡dad de estas medias demuestra respecto del valor esperado de 9000 horas, se expresa en 100 horas. Resolver los s¡gu¡entes eiercic¡os propuestos sobre Error de medias: 1) Hallar el error de medias, de una muestra de tamaño 15 extraída de una población de 8OO productos vendido por una cadena de tiendas, con una desviación estándar 4,89r.
Resp:1,23 2) Suponga que los 3000 estud¡antes de una universidad están normalmente distr¡buidos con med¡a de 1,68 metros con una desviac¡ón estándar de 11 centímetros. Hallar el error de la muestra para una muestra de 90 con reemplazo. Resp: 1,16 cm.
3) Una empresa de alimentos t¡ene 800 cl¡entes con un consumo promedio de 1584 soles mensuates y una desv¡ac¡ón estándar de 148 soles. Hallar el error de la D¡stribución Muestral de ¡4ed¡as, si se toma una muestra de 45 cl¡entes. Resp: 21,45
4) Supóngase que una poblac¡ón está conformada 9or: 2,7, 15, 18, 19, 22, 25, 43, 44 Y 45; si se extraen 25 muestras con reemplazo de tamaño 16, hallar el error estándar de la med¡a. Resp: 3,64
¡ t07l
ESTADíSIICA
II
5) Hallar el error de medias, de una muestra con reemplazo de tamaño 115 extraída de una población de 80000 productos vend¡do por una distr¡bu¡dora, con una desviación estándar 14¡5 gr. Resp: 1,35
6) Supóngase que una poblac¡ón está conformada por: 3, 4, 6, 8,9; si se extraen 12 muestras sin reemplazo de tamaño 2, hallar el error estándar de la media. Resp: 1,40
7) Si la media ar¡tmética de los productos de una fábrica es de 67,54 gr, con una desviación estándar de 5,68 9r.; calcular el error de la media para una muestra de tamaño 184. Resp: 0,42 8) Suponga que los 5500 estudiantes de una un¡vers¡dad están normalmente distr¡buidos con media de 1,62 metros con una desv¡ac¡ón estándar de 0,12 metros. Hallar el error de la media para una muestra de 30 s¡n reemplazo. Resp: 2,19 cm.
9) Hallar el error de la distribución muestral de medias, de una muestra de tamaño 49 extraída de una población de 250 estudiantes con peso promed¡o de 53 kg y con una desviación estándar 5 kg.
Resp:0,64k9. 10) Supóngase que una poblac¡ón está conformada por: 3, 4, 6,8,9., s¡ se extraen 16 muestras con reemplazo de tamaño 2, hallar el error estándar de la med¡a. Resp: 1,61
3.2.2 Distribución nuestral de proporciones Se denomina D¡stribución Muestral de proporc¡ones, cuando los datos distribuidos en una tabla de frecuencias, son las proporc¡ones de las característ¡cas más impodantes de cada muestra señaladas por el investigador, las cuales tienen un comportamiento normal.
El promed¡o de la distr¡bución conoc¡do como lvledia Ar¡tmética de la D¡stribuc¡ón Muestral de proporc¡ones es igual a "p" (p,= p). La Desv¡ac¡ón Estándar de la D¡stribución lvluestral de Proporc¡ones, se conoce como error de proporciones y se define de la sigu¡ente manera:
§ 08t
WALTER CÉSPEDES RAMiREZ
Error de proporciones sin reemplazo
con reemplazo
6o=
6nl ñ-,1 o,=tri Lf ,r, ]
6n
tr;
En adelante se trabajarán también con los estadísticos de las proporciones, por lo que es conveniente relacionarlos con los estadísticos ya conocidos que son:
Medida
Parámetro
Estadístico
Estadístico
Estadística
Población
Distribución Muestral
Distribución Muestral
de Medias
de Proporciones
Media
u
F*
tp
o,
op
u
aritmética Varianza
02
Desviación
o
2
¿
Oi
estándar
(Error de Media)
O,
(Error de Proporciones)
Ejercicios resueltos 1) De una muestra de tamaño 56 extraída de una población de cierto producto vendido por una gran distribuidora, con una proporción de artículos defectuosos de 4,5o/o. Hallar el error de la distribución muestral de proporciones.
Solución:
or=
6q=
l;
0,045 ¡0,955
= 0,0277
56
2) Hallar el error de proporciones, de una muestra de tamaño 45, extraída de población de 600 estudiantes, para la elección de un candidato a delegado probabilidad de 0,46.
Solución:
Enl o,,:x; I
N-"1
N-r
I
l
0,46x0,54 45
t /Goo - 4s l= 0,0715 ftt ooo-r
lt09¡
¡
una con
ESTADíSTICA II
3) Cons¡derando un muestreo aleator¡o simple de 75 empleados se descubr¡ó que el 40Vo de ellos quieren encargarse de su propia jubilación. Determ¡nar el error proporción.
soluc¡ón:
o,=
p.q
/0.+,0.0 = o,otuu = !75
personas, formado por 2 hombres y 3 mujeres, se toma una muestra de 3. Determ¡nar el error de proporción s¡n reemplazo.
4) De un grupo de 5 soluc¡ón:
N=5
n=3
p=2/5=O,4 q=3/5=0,6
Observe que se ha tomado como "p" al número de hombres, como tamb¡én "p" puede ser el número de mujeres; si se cons¡dera este segundo caso, la respuesta es la m¡sma.
lpq I lN-,-1 = reJ,0,6 [ /s ¡l =n, o,=v; LV N-r V : [Vs-r Resolver los sigu¡entes eiercic¡os propuestos sobre Error de proporciones: 1) Hallar el error de la distr¡buc¡ón muestral de proporc¡ones, de una muestra de tamaño 25 extraída de una poblac¡ón de c¡edo producto vend¡do por una gran d¡stribu¡dora, con una proporción de artículos defectuosos de 6010. Resp: 0.0475 2) El 350/0 de los miembros de una población de 15000, mayores de 50 años. Hallar el error de proporciones si se selecc¡ona una muestTa con reemplazo de 250 miembros.
Resp:0,0302
3) S¡ el 90% de los estud¡antes de una Universidad compuesta por 12500 estud¡antes tienen correo electrónico. Hallar el error de proporciones si se selecciona una muestra sin reemplazo de 125 estudiantes. Resp: 0,0267
4) El 54o/o de los estudiantes de
Administración son mujeres. Hallar el error de
proporciones s¡ se toma una muestra 25. Resp: 0,0997
5) La intención de voto para un determinado candidato es del 35, de una población de Hallar el error de proporciones s¡ se selecc¡ona una muestra sin reemplazo de 140.
Resp: 0,0401
lr0§
15OOO.
WALTER CÉSPEDES
RA IY íR EZ
6) En el Distrito de Los Olivos, el 480/0 de la población es económicamente act¡va y 20 de cada 100, están desempleado. S¡ la poblac¡ón Ia componen 280 000 hab¡tantes, hallar el error de proporción de desempleados con relación a la poblac¡ón económ¡camente act¡va en una muestra de 580 de estos hab¡tante s¡n reemplazo. Resp: 0,0166
7) En el D¡str¡to de Los Ol¡vos, el 4870 de la población es económicamente act¡va y 20 de cada 100, están desempleado. Si la poblac¡ón la componen 280 000 habitantes, hallar el error de la proporción económ¡camente activa en una muestra con reemplazo de 420 habitante. Resp: 0,0244
8) El 14% de los embarques de una compañía nav¡era, llegan a t¡empo. Hallar el error de proporc¡ones si se selecciona una muestra de 78 embarques. Resp: 0,0393
9) El 360/o de las v¡v¡endas de una comun¡dad, están deter¡oradas, en una selección
al
azar de 20 v¡v¡endas de un total de 2000, hallar el error de proporciones. Resp: 0,1068
10) El 45olo de los estudiantes del Perú, son adultos. Si se selecciona una muestra 205 estud¡antes hallar el error de proporciones. Resp: 0,0347
3.2.3 Distribuciones muestra/es de diferencias de medias y de proporciones
Se denom¡na D¡str¡bución Muestral de D¡ferenc¡as, cuando se comparan dos estadíst¡cos para saber en que grado son distintos. Las comparaciones que mayormente se ut¡lizan son las diferenc¡as entre med¡as y d¡ferenc¡as entre proporc¡ones, las cuales también t¡enen un comportam¡ento normal.
El promedio de la d¡stribuc¡ón muestral conoc¡do como Media Aritmética de
la
D¡stribuc¡ón Muestral de d¡ferencias de med¡as, está dado por:
lO,
^'OU
rl,
cuando se trata de d¡ferenc¡as entre med¡as.
El promedio de la distr¡buc¡ón muestral conoc¡do como Med¡a Ar¡tmética Distr¡bución Muestral de diferencias de proporc¡ones, está dado por:
it
1! , u-
! , rl, cuando
de
la
se trata de d¡ferencias entre proporciones.
Las desviaciones estándares de la d¡stribuc¡ones muestrales de d¡ferenc¡as de medias y de proporc¡ones, se definen de la siguiente manera:
] |¡
E
STA
D
iST
]CA
I
Error de diferencia de medias y de proporciones Diferencia de Proporciones
D¡ferencia de lvledia
io', o', oi. oi,=\i-;
o," -o,"
=,1!,Q.*P'q fia \ n'
'
Los nuevos estadísticos que se trabajarán en adelante, se presentan a cont¡nuac¡ón:
Estadíst¡co
Estadíst¡co
Distr¡bución lvluestral de Diferencias de ¡4edias
D¡stribución Muestral de
Parámetro
Medida Estadíst¡ca
Pob
lación
D¡ferencia de Proporc¡ones ¡4
ed ia
u
lo,, -Pr rl
Aritmética Va ria nza
lo ou
t, -
o2
l"tr, "r,\ Desviación
o
loi ox
Estándar
\r.
(Error de D¡ferencia de Proporc¡ones)
25
28
29
33
35
10
72
1B
22
23
soluc¡ón:
It¡.=
(25 + 28 + 29
"0,
Med¡a)
1) Hallar la d¡ferencia de med¡as entre las siguientes poblaciones:
Población B
6'0,
(Error de Diferencia de
Ejercicios resueltos
Pobiación A
-p rrl
+33+35)/5
=L5O/
5
=30
lt¡,= (to + 12+ 18 +22+23)/s = 8s/s P*o-Prrl= l30-t7 l = 73
=17
:
I
2í
WALTER CÉSPEDES RAMíREZ
2) Hallar el error de la diferencia de medias entre las siguientes poblaciones, si de cada población se toma una muestra de tamaño 2: Población A
25
28
29
33
35
Población
10
72
1B
22
23
B
Solución:
+28+29+33 +35)/5 =150/5 ,ll-:=(25 x, )
O
X,=
ll¡,= )
07^=
[(25
-
30)'z
+ (28
- 30), + (29 - 30), + (33 - 30), + (35 - 30)'z] / 5 =
(7o + 72 + 78 + 22 + 23) [(10 - 77)2 + (72
=30
-
l7)2 + (18
/5= -
85
64
/ 5 = 72,8
/ 5 = L7
77)2 + (22
-
l7)2 + (23 - L7)'] / 5
=
L36
/5=
27,2
+ 2 ox,-o x"=\ n-s z -:+.+t 27
3) Hallar
el error de la diferencia del costo promedio entre las siguientes marcas de
cigarrillos: Marca de Cigarrillo
Promedio
Varianza
Tamaño
Negro
1.80
0,01
25
Rubio
2.30
0,0225
30
o x"-o x,,:
0.01
0.o22s
25* 30 =0,0339
4) Dos máquinas producen el 8% y el 110/o de sus artículos con defecto, si de cada máquina se toman 20 artículos de muestra; hallar el error de la diferencia de proporciones.
Solución:
5) Dos métodos de enseñanza producen el 25o/o y el 31olo de alumnos desaprobados, si se seleccionan dos muestras al azar de tamaño: 45 del primer método y 32 del segundo método; hallar el error de la diferencia de proporciones.
Solución: 0,25x0,75
0,3 1-10,69
:
O,1042
¡ r r3I
E
STAD IST
ICA
I]
Resolver los siguientes ejercicios proPuestos sobre Error de D¡ferenc¡a de Medias y Error de Proporciones: 1) Hallar el error de la diferencia del costo promedio entre las sigu¡entes dos modalidades de enseñanza: Moda lidad de enseñanza
Prom ed io
Tama ño
Desviac¡ón Estándar
Alfa
18
00
725
25
Gamma
2300
215
30
Resp: 46,54
2) Hallar el error de la d¡ferencia de sueldos entre las siguientes empresas: Empresa
Tamaño
Varia nza
Promedio
Ivlilagros S.A.C
1110
121
15
Gacela S.R.L
800
185
t2 ResP:4,85
3) Hallar el error de la diferenc¡a del costo promed¡o entre las s¡guientes dos modalldades de enseñanza: Modalidad de enseña nza
Varianza
Prom ed io
Tamaño
Alfa
1800
t25
25
Gamma
2300
275
30
Resp: 3,49 65olo de sus artículos para exportación, si de cada máqu¡na se toman 20 artículos de muestra; hallar el error de la diferencia de
4) Dos máquinas producen el 4go/o Y el proporc¡ones de exportación.
ResP:0,1545 5) Dos compañías que ofrecen sus productos al mercado, vende el 670lo y el 72Vo de sus productos al contado, s¡ de cada una se el¡gen al azar a 30 cl¡entes, hallar el error de la d¡ferencia de proporciones' Resp: 0,1187
3.2,4 Distribuciones muestrales de vananzas y de desviac¡ones estándares Se denomina Distribución Muestral de Var¡anza cuando el estadístico muestral es una var¡anza. En esta distr¡buc¡ón se aplica el modelo de Fisher y en algunos casos el modelo Ji- Cuadrado; por ser una d¡stribución muestral muy particular, se tratará este punto en la siguiente un¡dad bajo el nombre de Análisis de la Varianza (ANOVA*)
* Analysis of variance É
L
4§
Le
CC
I
o
n
3
3.3leoría de la estimación estadística Es un proceso por el cual se aprenderá a est¡mar las características de una población, observando una muestra representativa. Generalmente qu¡én conduce una organizac¡ón, debe realizar est¡maciones rápidas con relac¡ón a: su personal, sus clientes, sus asociados, las finanzas, las compras, las ventas, etc.; porque necesita tomar dec¡s¡ones basadas en información valedera; una herramienta s¡gn¡ficativa para este propós¡to el alumno lo encontrará en este acáp¡te.
Los conceptos estadíst¡cos ya conoc¡dos, nos perm¡ten hacer de este procedim¡ento una labor más c¡entifica, ya que con la ¡nferencia (Proyección) estadística que se basa en la estimac¡ón y también con la prueba de hipótesis que se tratará en la sigu¡ente un¡dad, el
alumno podrá conocer las característica de una población a part¡r de ¡nformaciones muestrales.
3.3.1 Tipos de estimación Para encontrar un parámetro que es el propósito del ¡nvestigador, estadísticamente ex¡sten dos tipos de estimaciones que son: estimación puntual y estimac¡ón por intervalos.
t5
ESTADISTICA II
3.3.1.1 Estimoción puntuol Es la estimación de un parámetro mediante un valor determinado; el medio por el cual la estadística se vale para hacer la estimación se denomina: estimador si procede de una muestra, estadístico si procede de una distribución muestral.
Entre las estimaciones más conocidas por que tienen mayor uso, se pueden señalar:
Fr= | (Esta estimación es eficiente ya que realmente son iguales). b) X - p (Esta estimación es poco usado sobre todo si la media muestral fue tomada
a)
totalmente al azar de un extremo que no es precisamente el promedio). c) o2
= n52I (n
- 1)
(Esta estimación es insesgada y eficiente; es decirconfiable).
¡n(xi-i)'
o también
(n-r)
(r-t)
Ejercicios resueltos
1) Estimar la Media y la Varianza 72,15,16, 18, y
poblacional a partirde la siguiente muestra:
19.
Solución:
X=U=(12+ 15+16+18+ Lg)/5 =BO/ 5 =16
o,
= I(X¡*p)' = 02-t6), !(!f -16),+(16-16),+(18-16),+(19-16), = (,¡
2)
-
30
= J,g
(s-1)
1)
Estimar la desviación estándar poblacional a partir de una varianza muestra igual 245, si la muestra extraída es de tamaño 46.
a
Solución:
02 = n S'?l (n - 1) = 46x245 /45 = 250,44
ó: -
uzx.++ -rs.825
Resolver los siguientes ejercicios propuestos sobre estimación puntual: 1) Si los gastos diarios en alimentos de un hogar son: 19,50; 22,4O; 2t,5O; 27,3O; 25,2O; 22,LO; 24,4O. Estimar la media poblacional. Resp:23,20
lr6l
WALTER CÉSPEDES RAI'4íREZ
2) Con los gastos diar¡os en alimentos de un hogar que son: 79,50) ZZ,4O| 21,50; 27,30i 25,20;22,70t 24,40. Est¡mar la var¡anza poblacionuln"rp, O,ze
3) Estimar la varianza poblacional a partir de una desviación estándar muestra ¡gual 24,5; si la muestra extraída fue de tamaño 24.
a
Resp: 626,35
4) Un anal¡sta financiero toma una muestra aleator¡a del 10 por ciento de 3OO cuentas, si la varianza es 357,50. Estimar la desviación estándar poblacional. Resp:19,23
5) Un investigador estadístico toma una muestra aleator¡a del 15 por c¡ento de
420
datos, si la var¡anza es 56,57. Est¡mar la desv¡ac¡ón estándar poblacional. Resp: 7,58
6) éCon qué tamaño de muestra una var¡anza muestral de 75 es igual a una varianza poblac¡onal igual a 80? Resp: 16
7) ¿Con qué tamaño de muestra una desv¡ac¡ón estándar muestral de 40 es ¡gual a una desv¡ación estándar poblacional ¡gual a 41? Resp: 21
3.3.1 .2 Estimoción por inbrvolos Es la est¡mación de un parámetro mediante un rango de va¡ores o ¡ntervalo; es decii que el verdadero valor del parámetro se encontrará dentro de dicho ¡ntervalo definido por dos valores extremos.
Entre las estimac¡ones más conocidas por intervalos se t¡ene: la media, la var¡anza, las proporciones, la diferencia de medias y la diferenc¡a de proporciones. Cada una de estas estimaciones, se verán con el nombre de Intervalo de Confianza ya que utilizan un n¡vel de confianza a un porcentaje defin¡do; como por ejemplo , al 95o/o ó al 990/0 a partir del estadíst¡co de una d¡str¡bución muestral. Para estimar los intervalos de confianza, es necesario conocer: 10 El estadístico correspondiente (Med¡a, proporciones, etc.). 20 El n¡vel de confianza (al 95olo, al 900/0, etc.).
30 El error del estadístico a est¡mar (desviación estándar de la distr¡buc¡ón muestral de: medias, proporciones, etc.). A cont¡nuación se detallarán los intervalos de confianza mayormente util¡zados por los ¡nvest¡gadores.
ESTADíSTICA II
3,3.2 lntervalo de confranza para la media Es un procedimiento que permite estimar a través de intervalos, la Media Aritmética
Poblacional, conociendo
:
1o La med¡a aritmética muestral. 20 El n¡vel de confianza (al 95o/o, al 90o/o, etc.). 3" El error de la d¡str¡buc¡ón muestral de medias. El
intervalo de Confianza para estimar la Med¡a, se deñne de la s¡guiente manera:
xxz Sin reemplazo
Con reemplazo Donde:
i
Est¡mador Media Aritmética. Nivel de confianza (ver tabla para los valores de Z)' Error de D¡stribuc¡ón Muestral de Media ( 6; ). Tamaño de la población. Tamaño de la muestra.
oz --J^ n
Tabla para los valores de Z Nivel de confianza
z
90o/o
95o/o
960/o
7,645
1,96
2,O5
98o/o
990/o
2,58
99,73o/o
3,00
Cálculo del intervalo: para hallar el intervalo de confianza para la estimación del parámetro Med¡a Aritmét¡ca, desarrolle los s¡guientes Pasos:
(z) porel error de la distribución muestml (Or). muestral menos el error de est¡mación. Aritmét¡ca N4ed¡a ¡ntervalo infer¡or del 20 Límlte = muestral mas el error de estimac¡ón. Aritmética Media del ¡ntervalo 3o Lím¡te super¡or = 1o Error de est¡mac¡ón = Nivel de confianza
-ZO,
<+ X
<>
¡t
8t
+zOx
WALTER CÉSPEDES RAM íREZ
Ejerc¡cios resueltos 1) Una empresa de alimentos al selecc¡onar una muestra de 45 cl¡entes encontró un consumo promedio de 1584 soles mensuales, si se sabe que la desviac¡ón estándar es de 148 soles. Hallar el intervalo de confianza al 95olo pará la Media Poblacional de clientes.
Solución:
o/o : Z= +7,96 o Oi:--\t n = l,E = )) ¡\6 J45 Error de est¡mación = Z Oi = 7,96 (22,06) = 43,24 Límite ¡nferior = i - z 6i= fieq-43,24 = 7540,76
Al 95
Límite superior
=X +
Z
6x=
Intervalo de confianza para la
f584 + 43,24
Media:
L54O,76
=
1627,24
= lt 3
L627,24,
Ent¡éndase que estos resultados son estimac¡ones al 95o/o de confianza, que qu¡ere decir que de cada 100 est¡maciones a este n¡vel (95olo), cabe esperar que 5 estimaciones se encuentren fuera de los lím¡tes hallados. 2) Suponga que los 3000 estudiantes de una universidad, sus tallas están normalmente distr¡bu¡das con una desviación estándar de 32 centímetros. Hallar el intervalo de confianza al 980/o para est¡mar la Med¡a Poblacional, si se toma una muestra de 90 estud¡antes y el promedio muestral fue de 1,68 metros.
Solución: Al 98
o/o
ol
O¡=.J-l/¡
I
= Z Oi = 2,33 (0,0332266A2 ) = 0,08 Lím¡te inferior = X - Z 6^=L,6a - 0,08 = 1,60 Error de estimac¡án
= X *
= 1,76 Intervalo de confianza para la Media: 1,60 s F 3 Límite super¡or
Z
O¡=
t,Oe + 0,08
1,76,
Estos resultados son estimaciones al 9890 de confianza, que quiere decir que de cada 100 estimac¡ones a este n¡vel, cabe esperar que 2 est¡mac¡ones se encuentren fuera de
9
ESTAD í5T
ICA
II
estos lím¡tes. Muchas veces uno puede pensar que s¡ se amplían los límites de confianza, coTremos menos r¡esgos de que el intervalo defin¡do no contenga el parámetro est¡mado; esto es verdad, pero para ello existe la desventaja de que el ¡ntervalo puede hacerse demas¡ado amplio y por cons¡guiente la estimac¡ón no t¡ene efect¡vidad.
3) Los trabajadores m¡neros de una empresa están normalmente d¡stribu¡dos respecto a sus pesos, con una desviación estándar de 11k9. Hallar el intervalo de confianza al 9O7o para la Media Poblac¡onal, si se toma una muestra de 35 trabajadores y el peso promed¡o muestral fue de 68k9.
Solución:
o/o: Z= +7,645 = ll = 1.85934 ui-
Al 90
J;
.rs
= z Oi= 1,6a5 (1,8593a) = 3,06 Límite inferior = X - Z Or= 68 - 3,06 = 64,94 Límitesuperior = V * z Or= 68+3,06 = 71,06
Error de est¡maciín
Intervalo de confianza para la
Med¡a: 64,94 = F < 71,06.
Recuerde que estos resultados son est¡mac¡ones al 90Vo de confianza¡ que qu¡ere dec¡r que de cada 100 estimaciones a este nivel¡ cabe esperar que 10 estlmac¡ones se encuentren fuera de los límites hallados.
por Hallar el intervalo estándar de 200 dólares. distr¡bu¡dor al detalle, tienen desv¡ación de confianza al 95o/o para est¡mar las ventas por distr¡buidor al detalle del presente año, si se ha tomado una muestra de 25 distribuidores y el promedio muestral de ventas fue de 3400 dólares.
4) Se sabe que los montos de venta en dólares de un producto determinado
soluc¡ón: Al 95
o/o
Z=+1,96
:
d 200 tu or=' --n = ,-= ¿J Errorde estimación = Z O¡= 1,96 (40) = 7a,4O Límite ¡nferior = X - ZO,= 34OO - 78,40 = 3321,60 .,1
Lím¡te superior
-,1
=i * z o =
lntervalo de confianza para la
=
347a,4o
Med¡a: 3321,60
< = ¡t
34oo+78,40
¡
t20l
3478,40,
WALTER CÉSPEDES RAM ÍREZ
NOTA IMPORTANTE: En la un¡dad
II, al hacer
referencia
a los modelos de probab¡l¡dad, se dijo que
el
modelo t-student se apl¡caba a pequeñas muestras (n < 30) y el modelo Normal (Z), se aplicaba a grandes muestras (n > 30). Sin embargo en esta unidad para determ¡nar el ¡ntervalo de confianza, se ha ut¡lizado "2", aunque las muestras sean menores de 30; lo que ocurre es que para poder utilizar "t", además del tamaño de la muestra, deben darse las siguientes situac¡ones: 10 El tamaño de la muestra debe ser menor de 30.
20 La desv¡ación estándar poblacional es desconoc¡da y es reemplazada por
la
desviación estánda r muestral. 3o La población debe tener un comportamiento normal. Como puede observar, se ha ut¡lizado "z", por que la desviación estándar es conocida
en los ejerciclos propuestos.
5) Se sabe que las compras mensuales en dólares de un producto determinado por
una
compañía, t¡enen desviac¡ón estándar de 380 dólares. Hallar el intervalo de confianza al 95olo para estimar las compras de la compañía del presente mes, si se ha tomado una muestra de 45 distr¡buidores y el promedlo muestral de compras es de 6400 dólares.
Solución:
o/o .
Z=+!,96 o=i80=56,65 ()x r 1n J45 Errordeest¡mac¡ón = Zo = 1,96(56,65) = 111,03 X - ZO, = 6400 - 111,03 = 6288,97 Lím¡te ¡nfer¡or = =
Al 95
Límite super¡or
=i
*Zo=6qoo+111,03=6511,03
Intervalo de confianza para la
lled¡a:
62a8t97 É
p<
6511,03.
Resolver los s¡gu¡entes ejercic¡os propuestos sobre Intervalo de Confianza para la Media: 1) Hallar el intervalo de confianza al 95Vo para est¡mar el promed¡o de ventas al detalle de una cadena de tiendas, con una desviación estándar 35 soles; s¡ se ha tomado una muestra de 25 cl¡entes, de una poblac¡ón de 900 clientes y el promed¡o de ventas por cliente fue de 145 soles. ResP: 131,46 Y 158,54
rl2l¡
E
STA D ÍST
ICA
II
2) Suponga que la
poblac¡ón escolar del Perú está normalmente distribu¡dos con desv¡ac¡ón estándar de 32 centímetros por talla. Hallar el intervalo de confianza al 99o/o para est¡mar las tallas promedio escolar, si se ha tomado una muestra de 125 escolares y el promedio muestral fue de 152 centímetros. Resp: 144,62 y 159,38
3) Una empresa de al¡mentos t¡ene 800 clientes con una desviac¡ón estándar de consumo de 148 soles. Hallar el Intervalo de confianza al 98o/o para la Media si se toma una muestra de 45 cl¡entes y el promedio muestral fue de 1584 soles. Resp: 1534,03 y L633,97
4) Hallar el intervalo de confianza al90o/o para est¡mar el promed¡o de ventas distribu¡das normalmente de una distribuidora, con desv¡ac¡ón estándar de 1250 soles, si se toma una muestra de 115 ventas extraídas de una población de 80000 y se encontró un promed¡o de ventas de 12400. Resp: 12208,39 y L2591,67
5) S¡ una muestra de 190 productos elegidos al azar de una fábrica d¡o un promedio de 67,45 k9. Hallar el Intervalo de confianza al 95o/o para la media poblac¡onal, si se sabe que la desv¡ac¡ón estándar es de 5,68 Kgr. Resp: 66,64 y 68,26 6) Suponga que los 5500 estud¡antes de una univers¡dad están norma¡mente distribuidos con una desv¡ac¡ón estándar de 0,32 metros. Hallar el Intervalo de confianza al 98o/o para la Media, si se toma una muestra de 30 y el promedio de talla fue 1,62 metros. Resp: 1,48 y 1,76
7) Hallar el Intervalo de confianza a¡ 90o/o para la Med¡a, de una muestra de tamaño 49 extraída de una poblac¡ón de 250 estud¡antes con peso promedio muestral de 53 kg. Se sabe que la desviación estándar es de 5 kg. Resp: 51,94 y 54,06
8) Hallar el Intervalo de confianza al
95olo para la Media, de una muestra de tamaño 76 extraída de una población de 2500 Profesores con sueldo promed¡o muestral de 12OO soles. Se sabe que la desv¡ac¡ón estándar es de 95 soles. Resp: 1178,96 y 722L,O4
9) Hallar el Intervalo de conñanza al 99olo para la Med¡a, de una muestra de tamaño 50 obreros con jornal promedio muestral de 38 soles. Se sabe que la desviación estándar es de 9,5 soles diarios. Respi 34,53 y 41,47
10) Hallar el Intervalo de confianza al 95olo para la Med¡a del libro caja, de una muestra de 30 libros hecha por un analista contable en Lima, que encontró un promed¡o muestral de 38000 soles. Se sabe que la desviación estándar es de 9500 soles. Resp: 34600,47 y 4t399,53
WALTER CÉSPEDES RAM ÍREZ
3.3.3 lntervalo de confianza para las proporcrones Es un proced¡m¡ento que permite estimar a través de ¡ntervalos, las Proporc¡ones Poblacionales, conociendo: 1o La proporc¡ón muestral. 20 El nivel de confianza (al 95o/o, al 90o/o, etc.)' 3" El error de la d¡stribución muestral de proporciones. Et
Intervalo de Confianza para est¡mar las proporciones, se define de la sigu¡ente manera: S¡n reemplazo
Con reemplazo
,-6ntfr',-,; p=,\l;
_6n
,DfL-t- \n
Donde:
L!,^,_D
Estimador Proporclón muestral. Nivel de confianza (ver tabla para los valores de Z). Error de D¡stribuc¡ón Muestral de proporciones (O.).
p
z
tr;
Tamaño de la poblac¡ón. Tamaño de la muestra.
N
n
Cálculo del ¡ntervalol Para hallar el intervalo de confianza para la est¡mación del parámetro de Proporciones,
desarrolle los siguientes pasos: 1o Error de estimac¡ón = Nivel de confianza (z) por el error de la distr¡bución muestral ( Op )'
20 Lím¡te inferior del ¡ntervalo = Proporción muestral menos el error de estimación' 30 Límite super¡or del intervalo = Proporción muestral mas el error de est¡mac¡ón'
-ZOp
<->
P <) *ZOo
Ejerc¡c¡os resueltos
1) Una empresa de alimentos al selecc¡onar una muestra de 45 clientes encontró que el 45olo no compraban el artículo "A". Hallar el ¡ntervalo de confianza al 95olo para determinar la proporción verdadera de clientes que no adqu¡eren el artículo "A"'
Solución: Al 95
o/o
:
Z=+!,96
p.q o.45xOS = O,074162 o,=r/;=Í 4s Errorde estimac¡ín
= Zo,=
r,96
(0
,074162)
¡r23!
=
0
,14s4
ESTADfSTTCA
=pLím¡te super¡or = p + Límite
infer¡or
ZOp=O,45-O,I4S4
I
=
Z Op= 0,45 + 0,7454
0,3046
=
0,5954
Intervalo de confianza para las proporc¡ones: 0,3046
S
Fe
S
0,5954,
2) Al exam¡nar una muestra de 40 pac¡entes de un hosp¡tal con 420 pac¡entes,
se
encontró que el 34olo tenía fiebre. Constru¡r el ¡ntervalo de confianza al gBVo para est¡mar la Proporción Poblacional con pacientes con fiebre.
Solución:
o/o
Al 98
:
p.,t I uv - I o.i+,o.oo I r+zo - aor'l = o,o7 t329 o,-\'¿ llov "rr, l-\ -¿o [1 ,+zo -r, I
Error de estimaciín
Límiteinfer¡or Límite superior
= ZO, =
2,33
(O,O7
7329)
=
0,1662
= p - ZOr= 0,34- 0,7662 = O,ú3a = e + Zn = 0,34 + 0,1662 = 0,5062
Intervalo de confianza para la
Media: 0,1738 < Fe S 0,5062.
3) En una encuesta a una comunidad, se toma una muestra de BO hab¡tantes y el 42o/o señaló que la necesidad más urgente para dicha comun¡dad es contar los servicios de agua. Hallar el ¡ntervalo de conñanza al 90yo para determ¡nar la proporción verdadera que necesita de los servicios de agua.
Solución: Al 90
o/o
:
Z = + 1,645
o',,: Error de est¡mac¡ón Límite
inferior
Lím¡te superior
= 26,=
1,645(0,05518)
=
O,O9O8
= p - ZOo = O,42- 0,0908 = 0,3292 = p + ZO,= 0,42 + O,O9OB = 0,5108
Intervalo de conñanza para las proporciones: 0,3292
*
244
S
pe
s
O,51Og,
WALTER CÉSPEDES RAMíREZ
4) Al examinar una muestra de 400 artículos de una producción de 5000, se encontró que el 4o/o Erdn defectuosos. Construir el intervalo de confianza al 99olo para estimar la Proporción Poblacional de artículos defectuosos.
Solución: Al
99olo :
Z=*2,58
I lo.o+*o.oo | ,ttsooo-¿ootl= 0,0093988 o,':\;p.s Ilf i(N_ «,t,-rr]:\ .". LÍ (5ooo-ril n)
Errordeestimación Límite
inferior
= ZOo = 2,58 (0,0093988) = 0,0242
=p-
Límitesuperior=
p+
o = O,O4 - 0,0242 = 0,0158 UOr= 0,04+0,0242 = 0,0642
ZO
Intervalo de confianza para la
Media:
OrO158
. H, S
0,0642.
Resolver los siguientes ejercicios propuestos sobre Intervalo de confianza Para las proporciones: 1) Al examinar una muestra de 220 estudiantes universitarios, se encontró que el 18o/o tenía dificultad en el aprendizaje. Construir el intervalo de confianza al 90%o para estimar la proporción poblacional con dificultad para el aprendizaje. Resp: 0,1374 y 0,2226 2) Si en una muestra de 300 repuestos de un embarque de 4000 repuestos, se encontró que el 8o/o es defectuoso. Construir el intervalo de confianza al 95olo para estimar la proporción poblacional defectuosa. Resp: 0,0505 y 0,1095
3) En una muestra de 120 mujeres, se encontró que el 22o/o habian tenido su primer bebé antes de los 17 años de edad. Construir el intervalo de confianza al 907o para estimar la proporción poblacional con su primer bebé antes de los 17 años' Resp: 0,1578 y 0,2822
4) Si en una muestra de 60 personas próximo a jubilarse de un total de 4000, se encontró que el 27o/o deseaba realizar su propio trámite de jubilación. Construir el intervalo de confianza al 960/o para estimar la proporclón poblacional que desea realizar su propio trámite de jubilación. Resp: 0,1534 y 0,3866
5) Al seleccionar una muestra de 125 estudlantes universitarios, se encontró que el 88o/o estaba conforme con la metodología de enseñanza. Construir el intervalo de conñanza al 960/o para estimar la proporción poblacional conforme con la metodología de enseñanza. Resp: 0,8204 Y O,9396
lt25I
ESTADíSTICA II
6) Si en una muestra de 30 trabajadores de una empresa de 450 trabajadores, se encontró que el 38olo estaban conforme con su sueldo. Construir el intervalo de confianza al 99o/o para estimar la proporción poblacional conforme con su sueldo. Resp: 0,1589 y 0,6011 7) Al investigar una muestra de 235 escolares, se encontró que el 15Yo tenía deseos de estudiar Administración. Construir el intervalo de confianza al gBYo para estimar la Proporción Poblacional que desea estudiar Administración. Resp: 0,0957 y 0,2043
8) Si en una muestra de 158 personas pertenecientes a la población económicamente activa de un total de 40000, se encontró que el 21olo estaba desempleado. Construir el intervalo de confianza al 95o/o para estimar la proporción poblacional desempleada. Resp: 0,1466 y O,2734
9) Al examinar una muestra de 27o pequeñas empresas de Lima, se encontró que el 360/o, no tributa a la Sunat por carecer de utilidades. Construir el intervalo de confianza al 99o/o para estimar la proporción poblacional que no tributa. Resp: 0,2846 y O,4354 10) Si en una muestra a 126 jóvenes de un total de 65000 jóvenes de una localidad, se encontró que el 41olo está de acuerdo con la actual política económica. Construir el intervalo de confianza al 98%o para estimar la proporción poblacional de acuerdo con la actual política económica. Resp: 0,3080 y 0,5120
3,3,4lntervalo de confianza para las diferencias Es un procedimiento que permite estimar a través de intervalos, las diferencias entre
Medias o entre Proporciones Poblacionales, conociendo: 1o La diferencia muestral.
2" El nivel de confianza (al 950/o, al 900/o, etc.). 30 El error de la distribución muestral de diferencias. Los intervalos de confianza para estimar las diferencias de medias, se definen de siguiente manera:
Diferencia de medias
louu-ru,l"E.* _,'oxA-oxa
lor^-rurl lt26a
.,
* zoiu-ois
la
WALTER CÉSPEDES RAMiREZ
Los Intervalos de Confianza para estimar las diferencias de proporciones, se definen de la siguiente manera:
Diferencia de Proporciones
p,q" , ln,- n rl -lp^q,. lls \ n, T U,-l-
-z opt'oPs
<+
lp
^-
p,l .,
L7
' 'oPt-oPa
Ejercicios resueltos
1)
Hallar el intervalo de confianza al 980/o para estimar la diferencia poblacional de sueldos promedios entre las siguientes empresas: Promedio
Empresa
Varianza
Tamaño
Feliz Año S.A.C
1110
127
35
Comercial S.A.A
1800
38s
42
Solución: At
980ó:
Z=t2,33 l-
n21 oi,t -ois = /o.,,6, -\3s\*- *
38s
= 3,553
42
= Z (oi,t -ois) = 2,33 (3,553) = 8,28 Límite inferior = lroo-o*ul - z(oiu-oiu) = 690 - 8,28 = 681,72 *, (oin -oiu) = 690 + 8,28 = 698,28 Límite superior = luo u-oorl
Error de estimación
IntervalodeconfianzaparalaMedia:68L,72=lFo-u"|< 2) Hallar intervalo de confianza al 95olo para estimar la diferencia del costo promedio entre las siguientes dos modalidades de enseñanza: Modalidad de enseñanza
Promedio
Varianza
Premier
3800
725
Excelente
2300
2L5
§127*
Tamaño 35 30
ESTADÍSTICA II
Solución: Al 95
Z = +7,96
o/o
3,277
oxl -oxs Error de estimación
Límite
inferior
= z (oi,s -ois
)
= 1,96
(3,277)
= 6,42
= lru u- oo ul - , , o; o -oxn) =1500-6,42 =
Límitesuperior=
lOUr-Orrl*
Intervalo de confianza para la
,to;,-oir)
= 1500
Media: 1493,58 S
IHo
-
1493,58
*6,42 = t506,42
prl S
t5O6,42.
3) Dos compañías destinan parte de su producción para exportación, si de cada compañía se toma una muestra de 30 artículos y se observa que cubren el 48o/o y el 650/o del mercado; hallar el intervalo de confianza al 960lo para estimar la diferencia de proporciones poblacionales de exportación.
Solución:
Z=t2,05 opt-ops = lp,q,_pogo = 0,48¡0,52 0,65¡0.35 = 0,1267 30 30 nu \i' Errordeestimación = Z(opt-opn) = 2,05(0,1261) = 0,2585
Al 96
o/o
Límite
:
inferior
=
Límite superior =
-+-
lP, -p,l-z@p,t-opr)=0,!7
-0,0885
lp, -p,l+Z@p,q-opn)=0,17 + 0,2585 = 0,4285
Intervalo de confianza para la Media: - O,O885
4)
- 0,2585 =
= l[e^- le, s
O,42gS.
Dos compañías venden parte de su producción al contado, si de cada compañía se toma una muestra de 30 clientes y se observa que el 670/oy el 72o/o de de sus ventas son al contado; hallar el intervalo de confianza al 90% para estimar de la diferencia de proporciones poblacionales de ventas al contado.
Solución: Al 90
o/o
:
oPt-oPn
Z = + 7,645 =
P,.Q,*PuQu llt
0,67x0,33 +
fls
il
2Bt
0.72.r0,28
= O,tt87
WALf E R CÉSPEDES
Errorde estimación
=
z (o po
-o pB) =
RAM íREZ
1,645 (0,1L87)
Límite ¡nfer¡or
= p, p, - z(op,q opB)
Lím¡te superior
=
p^-p"l
= 0,05
+ Z(opA-ops)=
-
=
0,1953
0,1953
=
- 0,1453
= 0,2453 S W., W, < 0,2453.
0,05 + 0,1953
Intervalo de confianza para la Med¡a: - 0,1453
Resolver los s¡gu¡entes ejercicios propuestos sobre Intervalo de confianza para la d¡ferencia:
1)
Hallar el intervalo de confianza al 95o/o para estimar la diferencia poblac¡onal de sueldos promedios entre dos ciudades: Em
presa
San Antonio San Vicente
Promed¡o
Va
rianza
Tamaño
20
727
13s
1340
235
142
10
Resp: 316,87 Y 323,73
2) Hallar ¡ntervalo de confianza al 90o/o para estimar la diferencia del costo promedio de producción un¡tario entre las s¡gu¡entes máqu¡nas: Máq
u
ina
Varianza
Promed io
Tama ño
A
380
125
35
B
230
215
30
Resp: 143,58 Y 156,42
3) Dos compañías
comerc¡al¡zan sus productos en un m¡smo mercado,
si de
cada
compañía se toma una muestra de 30 artículos y se observa que cubren el 48olo y el 650/0 del mercado; hallar el intervalo de confianza al 95olo para estimar la d¡ferenc¡a de proporc¡ones poblacionales de ventas en el m¡smo mercado. Resp: - O,O772Y O,4t72
4) Al obtener una muestra de 20 personas la poblac¡ón económicamente act¡va de una c¡udad y 35 personas de otra ciudad, el t6o/o y el 25olo respect¡vamente están desempleados; hallar el ¡ntervalo de confianza al 95o/o pára est¡mar la d¡ferencia de proporciones poblacionales de desempleados. Resp: - 0,1254 y 0,3054
)9
E
STAD IST
CA
II
3.3.5 lntervalo de confianza para la varianza y para la desviación estándar Es un procedimiento que perm¡te estimar a través de intervalos, las Varianzas y tamb¡én Desviac¡ones Estándares Poblacionales, con el uso del modelo de d¡stribución Ji-Cuadrado:
Los lím¡tes para construir el Intervalo de Confianza para est¡mar la definen de la s¡guiente manera:
varianza,
se
Lím¡te infer¡or = (n - 1) 52 / 't2 de la derecha Límite super¡or = (n - 1) 52 / 12 de la ¡zquierda LÍmite ¡nfer¡or <-) 02 <+ Lím¡te superior S¡ a cada uno de los lím¡tes de la Varianza se le saca la raíz cuadrada, entonces tendremos el intervalo de confianza para estimar la Desv¡ación Estándar Poblacional: Lím¡te
inferior = 1it, r)5.r7,
.t.) tu ¿erccha
= \'" l'S 1 't''ia'""t' Límite ¡nfer¡or e o <-r Lím¡te super¡or Límite super¡or
Ejercicios resueltos
1)
Hallar el ¡ntervalo de confianza al 98o/o para est¡mar la var¡anza poblac¡onal de sueldos, si de una muestra de 25 trabajadores se encontró una var¡anza de 382 soles.
Solución: Al
98o/o:o=0,02 / 2= 0,O1,
x'zde la ¡zquierda: x2oo,
=
t.=25-l =24
10,9
P(x'oo,
I
x'?<
x.'zde la derecha: x2onn
x'?o.r")
=
= 0,98
43,0
= (25- 1) x3A2 143,O = 213,2f = (25 - 1) x382 /70,9 = 841,10 Intervalo de confianza para la Varianza: 2L3,2O < s2 < 841,10. Límite
Infer¡or =(n-1)52 lx2 de
Límite super¡or = (n
-
1)
52
la
derecha
/r.2 de la ¡zqu¡erda
2) Hallarel
¡ntervalo de confianza al 95o/o para estimarla Desv¡ación Estándarpoblacional de evaluaciones, s¡ de una muestra de 15 escolares se encontró una Desviación Estándar de 12 puntos.
Solución: Al
95o/o:o=0,05 / 2= 0,025 d.=15-1=14
P (x,o o,5 S
x,
I
x,o nrr)
= 0,95 = 5¡63
I'zde la derecha: xzo"r,
i('?de la izquierda: x2oo2s
.10
=
26,1
WALIER CÉSPEDES
Límite
Inferior = (n -
Lím¡te superior = (n
-
RAM IREZ
1) 52 /x2de la derecha = (15- 1) x722 / 26,1 =77,24 1) s2 /x2 de la ¡zqu¡erda = (15 - 1) x 72'z / 5,63 = -a53.08
,"".iI=o<\tn Intervalo de confianza para Ia Desv¡ac¡ón Estándar: 8,79 3 o 3 t8,92, Intervalo de confianza para la Desviaclón Estándar:
3)
'
Hallar el intervalo de conñanza al 90o/o para estimar la var¡anza poblac¡onal del costo de las reparac¡ones de motores, si de una muestra de 22 motores se encontró una var¡anza de 3 782 soles.
Solución:
90%: a=O,lo/ 2=0,05 n=22-7 =2r P(X'oos I x2 I x2or.) = 0,90 x,'?de la derecha: xzon, = 32,7 l'zde la ¡zquierda: x2oo, = 11,6 Al
Lím¡te Inferior = (n - 1) 52 /x2 de la derecha Lím¡te super¡or = (n - 1) 52 lx2 de la ¡zqu¡erda
= (22 - l) x 37A2 / 32,7 = 242A,Al = (22 - 7) x 3782 I 77'6 = 6846,72
Intervalo de confianza para la Var¡anza: 2428,8L
4)
S o2 3
6846,72'
Hallar el ¡ntervalo de confianza al 99yo para estlmar la Desv¡ac¡ón Estándar poblacional de del número de soc¡os de las Sociedades Anónimas Abiertas de Lima, si de una muestra de 28 Soc¡edades Anón¡mas se encontró una Desviac¡ón Estándar de 57,2 puntos.
Soluc¡ón: Al 99
o/o: q=0,01 /2=
l'?de la ¡zquierda: x2o.oo, = Lím¡te lnferior = (n Límite super¡or = (n
o,OO5
ñ.=28-l =27
11,8
12
P (X'ooo,
I
x'2<
de la derecha: x2asss
x'?oees)
=
= 0,99
49,6
- 1) 52 lx2 de la derecha = (28 - 1) x 57,22 I 49,6 = 1781,04 - 1) 52 lx2 de la izquierda = (28 - 1) x57,22 /ll'a = 7446,47
Intervalo de confianza para la Desv¡ación Estándar: /rzsr.o'r Intervalo de confianza para la Desviación Estándar:
<o<
.748641
42'20 3 o < 86,52
Resolver los siguientes eiercic¡os Propuestos sobre Intervalo de confianza Para la var¡anza y Desviación Estándar:
1) Hallar el intervalo de confianza al 95vo para estimar la var¡anza poblac¡onal de pesos en gramos, de una muestra de 41 artículos con una var¡anza de 5,86 9r' Resp:
¡l3r¡
3,95 Y 9,61
ESTADfSTICA II
2)
Hallar el intervalo de confi¿rnza al g8yo para est¡mar la Varianza poblacional del ingreso familiar, de una muestra de 16 familias con una varianza de 495,25 soles. Resp: 237,87
y
7397,73
3)
Hallar el ¡ntervalo de conñanza al 9oo/o para est¡mar la Desviación Estándar poblac¡onal del número de ventas anuales, de una muestra de 1g vendedores con una varianza de 85 ventas. Respi 7,24 y 72,91
4)
Hallar el intervalo de confianza al 95yo para est¡mar Ia Varianza poblac¡onal de tallas, de una muestra de 13 trabajadores con una var¡anza de 3g,17centímetros. Resp: 19,66 y 104,1
5)
Hallar el ¡ntervalo de confianza al 9oolo para estimar la Desv¡ación Esténdar poblac¡onal de sueldos, de una muestra de 51 empleados con una desv¡ación estándar de 35 soles.
Resp: 30,12 y 41,95.
§t328
Lecci
o n
4
3.4Iamaño de la muestra Es la cantidad de datos sufic¡entes para poder estimar los parámetros de una manera
efic¡ente; es decii al nivel de conñanza deseado. Entiéndase que el tamaño de la muestra es la cantidad de datos que cont¡ene dicha muestra. Con una muestra representativa de datos o de datos sufic¡entes, podemos detectar s¡ ex¡ste o no diferencia entre los grupos de estudio con un mínimo de garantía, también permite trabajar con rapidez y reducir los costos de ¡nvestigación Para eleg¡r el tamaño de una muestra adecuado, hay que tener en cuenta: el n¡vel de confianza y el error que se puede aceptar; es por esta razón de que a pesar de que en toda la unidad se ha hablado de tamaño de muestra, recién nos preocupamos por saber como se calcula el tamaño; simplemente por que ahora el alumno conoce, que es un error de estimación y que es un nivel de confianza. Si es verdad que a mayor tamaño de muestra exlste la menor probab¡l¡dad de cometer error en la investigación estadíst¡ca, debemos tamb¡én saber que si exageramos en el tamaño, se corre el riesgo de que la muestTa sea de mayor costo que el necesarlo y se reduzca la rapidez de operatividad.
Dependiendo de la información con que se cuenta de la población, para calcular el tamaño de la muestra, podemos apoyarnos con los siguientes casos:
33a
ESTAD iST
ICA
II
3.4.1 Cuando se conoce la varianza poblacional n
Z'o) - e-,
Con factor de corrección en la selección sin reemplazo I?,
=
n
_ l+
n
N
Ejercic¡os resueltos 1) Hallar el tamaño de la muestra, s¡ se conoce que la desviaclón típica de los sueldos de un d¡strito es de 162 soles y se desea est¡mar al 95o/o de confianza, el promed¡o de sueldos con más menos 50 soles de error de la med¡a.
Solución: 1.96')
xl62:
:
¿¡
50'
2) La desv¡ac¡ón estándar de los puntajes obtenidos en una evaluación de 3500 docentes, es de 43 puntos y se desea estimar al 96010 de conñanza, el promed¡o de puntos obtenidos con un error de media de más menos 8. Hallar el tamaño de la muestra.
soluc¡ón:
= tzt n:?'oÍl!]' ' g2
nc=l+ ,*
=
fl7
rr*
3.4,2 Cuando se conoce la proporción poblac¡onal 72n , = t ! ' Con factor de corrección en la selección sin reemplazo
e-
ltr= 1+
n
N
Ejerc¡c¡os resueltos 1) cCuál deberá ser el tamaño de la muestra al 95olo de confianza de una población de 150000 personas para una proporción favorable de 0,40 y el error estándar de la proporción es 0,04?
Solución: n-
I,q6 (0,4) (0,ó) _ r¡¿
o.o4,
fi
s-6
57,.' = ,. ,rroou
I t34¡
574
WALIE R CÉSPEDES RAM íREZ
2) éCuál deberá ser el tamaño de la muestra al 9oo/o de confianza de una población para una proporción representat¡va y el error estándar de la proporción de más menos 0,03?
Solución: .,
lejr
_r.91{ tEr 0
0lr
=
zsz
3,4.3 Cuando se mide la diferencia entre la desv¡ación ttpica o estándar muestral con la poblacional Z2
'' ^ZE ) Ejercicios resueltos 1) ¿Cuál deberá ser el tamaño de la muestra al 95olo de confianza de una población y que la desviación estándar poblacional no difiera de la desviación estándar muestral en más menos 0,05?
solución: 1.96': n= ----
2 (0,0s)'
=
768
de una población y que la desv¡ación estándar poblac¡onal no difiera de la desviación estándar muestral en más menos 0,06?
2) ¿Cuál deberá ser el tamaño de la muestra al
90o/o de confianza
Soluc¡ón:
t.645' =
376
2 (0,06)'
3,4.4 Cuando
solo
se conoce el tamaño de la población según F¡sher
,.1 n= \ P4'n .
K'pq+Ne'
Donde: al 95olo de confianza K =
2 y
p=0,5
1) tCuál deberá ser el tamaño de la muestra al 95vo de confianza de una población de 5O5OO docentes según Fisher con un margen de error de 0,04?
Solución: 2'z(0,5) (0,5) (s05oo) 2 (0,s) (0,s) + 50500(0,04):
=
617
1135r
ESTADIST CA II
2) cCuál deberá ser el tamaño de la muestra al 95olo de confianza de una población de 145500 Obreros según Fisher con un margen de error del 5olo?
Solución: 2'(0,5) (0,5) (14s500) 2 (0,5) (0,s)+ 145s00(0,0s)r
=
399
Resolver los siguientes ejercic¡os propuestos sobre el tamaño de la muestra:
1) Hallar el tamaño de la muestra, s¡ se conoce que la desviación típ¡ca de las ventas anuales de un vendedor que es de 16200 soles y se desea estimar al 950/0 de confianza, el promedio de ventas con más menos 1250 soles de error de la med¡a. Resp:645 2) Hallar el tamaño de la muestra, s¡ se conoce que la desviación típica de los pesos 12gr y se desea estimar al 980/o de confianza, el peso promed¡o de ventas con más menos 4gr de error de la media para una población de 1250 artículos. Resp: 47
3) Hallar el tamaño de la muestra, s¡ se conoce que la desv¡ac¡ón típica de las compras diarias de una fam¡l¡a que es de 76,50 soles y se desea est¡mar al 90o/o de confianza, el promed¡o de ventas con más menos 10 soles de error de la med¡a. Resp: 158
4)
¿Cuál deberá ser el tamaño de la muestra al 96010 de confianza de una población de 13000 personas para una proporc¡ón favorable de 0,45 y el error estándar de la proporción es 0,07? Resp: 209
5) ¿Cuál deberá ser el tamaño de la muestra al 90% de confianza de una poblac¡ón para una proporción representativa y el error estándar de la proporción de más menos O,02? Resp: 1691
6) ¿Cuál deberá ser el tamaño de la muestra al 95olo de confianza de una población para una proporc¡ón representativa y el error estándar de la proporc¡ón de más menos O,08? Resp: 150
7) ZCuál deberá ser el tamaño de la muestra al
99olo de confianza de una población y que la desviación estándar poblac¡onal no difiera de la desv¡ación estándar muestral en más menos 0,064?
Resp: 813
B) ¿Cuál deberá ser el tamaño de la muestra al 960lo de confianza de una población y que la desviación estándar pob¡ac¡onal no d¡fiera de la desv¡ac¡ón estándar muestral en más menos 0,048? Resp: 912 tó
WALTER CÉSPEDES RAMiREZ
9) ZCuál deberá ser el tamaño de la muestra al
950/o de confianza de una población de 4200 docentes según Fisher con un margen de error de 0,034?
Resp: 717
10) cCuál deberá ser el tamaño de la muestra al 95olo de confianza de una población de 1200000 trabajadores según Fisher con un margen de error de 0,058?
Resp:297
ll
37¡
ESTADíSTICA II
1) Supóngase que una población está conformada por: 4,5,7,9, 10; si se extraen 16 muestras con reemplazo de tamaño 2, hallar el error estándar de la media.
A)
1,48
c)
B) 1,61
2,16
2,08
D)
E) 1,22
Z)El460/o de los estudiantes de Economía son hombres. Hallarel errorde proporción de hombres si se selecciona una muestra 30.
A)
0,1487
B)
0,0613
C)
O,O77O
D)
0,0910
E) 0,1053
3) Hallar el error de la diferencia del costo promedio entre las siguientes dos métodos de aprendizaje: Método de aprendizaje Promedio 1800 Alfa
46,54
B)
Tamaño
725
25
2t5
30
2300
Gamma
A)
Desviación Estándar
35,77
4) Dos máquinas producen el
52o/o
E) 51,23
D) 24,00
C) 82,64
y el 75o/o de sus artículos para exportación, si de
cada máquina se toman 20 artículos de muestra; hallar el error de la diferencia de proporciones.
A) 0,0408
B)
0,1601
C)
0,2016
D)
0,0829
E) 0,L478
5) Estimar la media y desviación típica poblacional con: 13, L6,77, L9,y 20.
A) t7 y
3,47
B) t6 y
2,74
C) 77 y
2,74
D) t8 y
2,45
E) 77 v 2,45
6) Hallar el Intervalo de confianza al 959o para la Media, de una muestra de tamaño 50 obreros con jornal promedio muestral de 36 soles. Se sabe que la desviación estándar es de 10,5 soles diarios.
A) 27,47 y 26,47 E) 30,25 y 39,26
B) 16,56 Y 24,52
C) 33,09 y
38,91
D) 35,44 Y 45,18
7) Si en una muestra de 258 personas pertenecientes a la población económicamente activa de un total de 40000, se encontró que el 160lo estaba desempleado. Construir el intervalo de confianza al 90o/o para estimar la Proporción Poblacional desempleada.
A) 0,1226 y 0,L974 D) 0,1662 y O,2854
B) 0,1456 y
0,2636
E) O,L725 y O,2995
¡r38I
C) 0,1584 y 0,1882
WALTER CÉSPEDES RAMíREZ
8) Hallar intervalo de confianza al 9070 para est¡mar la diferencia del costo promedio de producción unitario entre las siguientes máquinas: Máquina
Promed io
Va
rianza 72,5
9B
35
40
62
B
A) 34,73 y 40,27 B) 36,56 y E) 30,73 y 37 ,27
9) Dos compañías
Tamaño
44,52
C) 33,09 y
38,91
D) 34,73 y 37,27
comerc¡al¡zan sus productos en un mismo mercado,
si de
cada
compañía se toma una muestra de 60 artículos y se observa que cubren el 48yo y el 65010 del mercado; hallar el intervalo de confianza al 90yo para estimar la diferencia de proporciones poblacionales de ventas en el m¡smo mercado.
A) 0,0 226 y 0,3974 D) 0,0066 y 0,38s2
B) 0,01s4 y 0,2636 E) 0,0233 y 0,3767
C) 0,0525 y 0,3422
10) Hallar el intervalo de confianza al 95olo para est¡mar la Varianza poblacional de tallas, de una muestra de 17 trabajadores con una varianza de 54,21centímetros. A) 76,7 y 90,7 E) 37 ,3 y 730,7
B) 2s,9 y
98,s
C) 17,1 y
133,9
D) 30,1 y 12s,5
11) Hallar el intervalo de confianza al 90o/o para est¡mar la Desv¡ación Estándar poblacional de sueldos, de una muestra de 21 empleados con una desviación estándar de 39 soles.
A) 31,1 y s2,8 E) 37 ,3 y 80,7
B) 15,5 y
68,5
C) Lz,t y
33,9
D) 20,1 y 59,5
12) Hallar el tamaño de la muestra, si se conoce que la var¡anza de las compras de una empresa que es de 272 459 776 soles y se desea est¡mar al 90o/o de confianza, el promedio de ventas con más menos 1540 soles de error de la media.
A)
s28
B)
242
C)
121
D)
201
E) 807
13) ¿Cuál deberá ser el tamaño de la muestra al 98o/o de confianza de una población de 18000 para una proporción favorable de 0,55 y el error estándar de la proporclón es 0,09?
A)
164
B)
157
C)
136
D)
!
39§
231
E) 2O7
ESTADÍSTICA II
14) cCuál deberá ser el tamaño de la muestra al 95o/o de confianza de una población y que la desviaclón estándar poblacional no difiera de la desviación estándar muestral en más menos 0,O34?
A)
7s24
B)
1662
C)
21s6
D)
2ss1
E) 1802
15) éCuál deberá ser el tamaño de la muestra al 95% de confianza de una población de 47200 escolares según Fisher con un margen de error de 0,O74?
A)
3s2
B)
1s9
C)
3s6
D)
211
E) 182
Respuestas de control t. B, 2. D, 3. A, 4. E, 5. C, 6. C, 7. A,B,D, 9. E,
Ir40t
10,
D, I l. A,
12.
B,
13.
A,
14.
B, 15. E
WALTER CÉSPEDES RAMÍREZ
Cualquier medida estadística de posición o de dispersión que si proviene de una muestra, se
estadígrafo.
denomina estimador; si proviene de una población, se denomina parámetro, y es estadístico, si proviene de una distribución muestral.
Medida usada para describir alguna característica de una distribución muestral, tal como: una media
estadístico.
aritmética, una desviación estándar o una proporción. Se utiliza en las dlstribuciones muestrales y en prueba de hipótesis para estandarizar el modelo: Z, t, y2, etc. Medida usada para describir alguna característica de una muestra, tal como: una media aritmética, una
estimador.
mediana, una desviación estándar o una proporción. Se utiliza únicamente en muestro parámetro.
Medida usada para describir alguna característlca de una población, tal como: una media aritmética, una mediana, una desviación estándar o una proporción. La utiliza la Estadística Descriptiva como resultado de un censo y también la Estadística Inferencial como resultado de una estimación.
m u estra re p rese n
tat¡va.
Tamaño de la muestra útil para est¡mar un parámetro,
que ha sido tomada considerando los
criterios estándares en la elección del tamaño de una muestra. nivel de confianza.
Margen de seguridad con probabilidad de que
el
intervalo para la estimación estadística de un parámetro determinado/ cont¡ene dicho parámetro.
Se utiliza para la estimación de parámetros ocasiones en pruebas de hipótesis.
TXPTORAGIfIN ON LINE http://es.wi ki ped ia. orglwiki/Estimacio/oC3o/oB3 n estadToC3 o/oADstica http://www.aulamatematica.comES2/02_SD_inferencial/lnferencia indexO2.htm http://www.fca. unl.edu.arllnferEst/EstimParam, htm
¡l4l¡
y
en
c u ar t
a
UNIDAD l-...
-----r
Teoría de la decisión estadística
Sumario Prueba de hipótesis: formulación de hipótesis, tipos de enores de decisión Procedimiento para una prueba de hipótesis: Prueba de hipótesis para las medias, prueba de hipótesis para las proporciones, prueba de hipótesis para las diferencias, prueba de hipótesis para variable continua Análisis de la varianza: Análisis a una vía, análisis a doble vía
oBJETTVO(S) GENEML:
.
Al término de esta unidad el alumno elará en capacidad de darle mayor aplicación a la teoría de la Estimación Estadística del
Muestreo, por que habrá utilizado los estadísticos respectivos de la Distribuciones Muestrales incluyendo el error estándar de estrmación en la toma de decisión. También con la ayuda
del análisis de la varianza habrá determinado en cuanto a
su
variabilidad si los datos tienen la misma procedencia o si tienen el
mismo comportamiento. ESPECíFICOS:
.
Conocer: cómo se formulan las hipótesis de decisión, el tipo de error que se puede cometer al tomar una decisión, cuál es la forma de realizar los ensayos y el margen aceptable medido por el nivel de confianza.
.
Saber que procedimiento debe seguir en una decisión donde se
contemplan todos los aspectos; que van desde eltipo de ensayo, pasan por el estadístico que determinará si se acepta o rechaza la hipótesis planteada, hasta la toma de decisión.
.
Conocer si dos muestras o poblaciones tienen la misma variabilidad, saber mediante el análisis de la varianza si una muestra proviene de cierta población o que si existe diferencia al comparar diferentes métodos operativos en un determinado proceso.
at 444
Le
CC
I
o
n
4.1 Prueba de hipótesis A La Prueba de Hipótesis, se le llama también ensayo de h¡pótes¡s o docimasia de hipótes¡s, que son procedimientos que se usan para determ¡nar si es razonable o correcto, aceptar el estadístico obtenido de la muestra. Como resultado de una prueba de hipótes¡s, se acepta o se rechaza lo planteado como H¡pótes¡s Nula (Ho); si se acepta, convenimos en que el error de muestreo (azar) por si solo puede dar lugar al valor al estadístico que origina la diferencia entre este y el parámetro; si se rechaza, convenlmos que la diferencia es tan grande, que no es fruto del error de muestreo (el azar) y se concluye que el estadístico de la muestra no prov¡ene de una población que tenga el parámetro estud¡ado. Es importante recordar que las hipótesis son siempre enunc¡ados relat¡vos
a
la
población o distribuc¡ón bajo estudio, que a menudo involucran una o más características de la distribuc¡ón, no son enunc¡ados en torno a la muestra. El valor del parámetro de la poblac¡ón especificado en la hipótesis suele determ¡narse de una de tres maneras;
.r5
ESTADÍSTICA I]
1o Puede resultar de la experiencia o conoc¡m¡entos pasados del proceso, o incluso de experimentación previa. El objet¡vo entonces de la prueba de h¡pótesis suele ser entonces determ¡nar sl la s¡tuac¡ón exper¡mental ha cambiado. 20 Este valor puede determinarse a partir de alguna teoría o modelo con respecto al objeto que se estudia. Aquí el objetivo de la prueba de hipótesis es ver¡ficar la teoría o modelo.
3o Surge cuando el valor del parámetro de la poblac¡ón es resultado de cons¡deraciones exper¡mentales, tales como especificac¡ones de d¡seño o ingeniería, o de obligaciones contractuales. En esta s¡tuación, el objetivo de la prueba de h¡pótesis es la prueba de conformidad.
4.1.1 Formulación de las hipótesis En la práctica es necesar¡a la formulación de dos hipótesis estadísticas, una afirmat¡va sobre una característ¡ca determinada, llamada Hipótesis Nula y Ia otra complementaria llamada H¡pótesis Alternativa.
4.l.l.l
Hipótesis nulo
(Ho)
Es un planteamiento que se formula respecto a una característica poblacional y que se desea probar si es verdadera o es falsa, respecto a una población determinada; por lo tanto en adelante esta h¡pótesis será aceptada o rechazada y siempre se formula por "igual a", aunque algunos investigadores prefieren: "igual a", "mayor igual a" y "menor igual a", dependiendo de la h¡pótesis Alternativa que es el complemento. En la práct¡ca existe Ia ¡ntención de rechazar esta hipótesis
4.1 . | .2 Hipotesis olternotivo (H,)
Expresa lo que realmente se cree que es lo fact¡ble porque se constituye como la hipótes¡s de invest¡gac¡ón a contrastar (probar). Es un planteam¡ento complementario a la H¡pótesis Nula, porque toda prueba estadíst¡ca solo acepta dos hipótesis y se formula con el objeto de determinar el tipo de ensayo o prueba.
4.1,2 Tipos de ensayos o pruebas En la investigación estadística, la prueba a realizar, puede estar orientada a cualquiera de los extremos de la distribuc¡ón muestral de datos o a ambos; por esta razón ex¡sten tres tipos de ensayos estadísticos, que son:
4.1 .2.1 Ensoyo biloterol Una prueba estadíst¡ca es bilateral si se realiza a dos colas, es dec¡r, que el resultado de la muestra puede ir al extremo de la derecha o al extremo de la izquierda, que son las regiones de rechazo y se encuentr¿n medidas por el nivel de s¡gnificac¡ón (o), en este tipo de ensayo la Hipótesis Nula se formula por igual y la Hipótes¡s Alternativa se formula por no igual.
wALTER cÉsproEs RR¡rínrz
Porejemplo: Ho H1
: U=
640
:¡t+640
4.1.2.2 Ensoyo uniloterol derecho Una prueba estadística es unilateral derecha cuando el ensayo está orientado hacia la derecha; es decir, que el resultado de la muestra va hacia la cola de la derecha. En este tipo de ensayo la Hipótesis Alternativa se formula por mayor y como es complementaria a la Hipótesis Nula, esta última debe formularse en términos literales por menor igual; sin embargo es suficiente con plantear la Hipótesis nula por igual ya que si se acepta, se dice que el estadístico si es igual pero no se dirá que el estadístico es menor igual. En caso de que la hipótesls nula sea rechazada, en lugar de decir que el estadístico no es igual, se dirá que el estadístico es mayor.
Porejemplo: Ho : H =
640
Hr:U>640
/\
¡s4.1 .2.3 Ensoyo uniloterol izquierdo Una prueba estadística es unilateral izquierda cuando el resultado de la muestra va hacia la cola de la izquierda. En este tipo de ensayo la Hipótesis Alternativa se formula por menor y como es complementaria a la Hipótesis Nula, esta última debe for-
mularse en términos literales por mayor igual; sin embargo, es suficiente con plantear la Hipótesis nula por igual. En caso de que la hipótesis nula sea rechazada, en lugar de no es igual, se dice que el estadístico es menor.
decir que el estadístico
Porejemplo: Ho : F = 640
Hr:U<640
)t
471
ESTADíSTICA II
4,1,3 Tipos de errores Al tomar una decisión ya sea de aceptación o de rechazo, es posible cometer algún tipo de error, en estadística los tipos de errores de decisión son los siguientes:
4.1.3.1 Error de Tipo I Es un error que se comete cuando el investigador rechaza la Hipótesis Nula, siendo esta verdadera en la población; en este caso, se llega a la conclusión de que hay una diferencia que no existe, entre el estadístico a probar y el parámetro respectivo. Este error conocido como "Error Tipo Alfa" por que es alfa la probabilidad de que se cometa este tipo de error. Por ejemplo, si o es igual a 0,05; entonces existe una probabilidad del 5olo de cometer error de tipo L
4.1.3.2 Error de Tipo ll Es un error que se comete cuando el investigador acepta la Hipótesis Nula, siendo esta falsa en la población; en este caso, se llega a la conclusión de que no hay una diferencia que si existe, entre el estadístico a probar y el parámetro respectivo.
Este error conocido como "Error Tipo Beta" por que es beta la probabilidad de que se cometa este tipo de error. Por ejemplo, si p es igual a 0,05; entonces existe una probabilidad del 5olo de cometer error de tipo II.
Decisión
Verdadera
ACEPTAR
decisión correcta
error de tipo
RECHAZAR
Falsa
I
error de tipo
II
decisión correcta
Distribución muestral
/\
B.
Distribución poblacional
A
Al realizar el contraste de la prueba de hipótesis, se nota que si la línea perpendicular se mueve hacia un lado alfa aumenta y beta disminuye o viceversa.
§t48§
Lección
7
4.2 Procedimiento para uila prueba de hipétesis Este procedimiento incluye los siguientes pasos: 10 Formulación de las hipótesis. 20 Determinar el tipo de ensayo. 3" Asumir la significación de la prueba.
4" Definir el estadístico de la distribución muestral correspondiente. 50 Diseñar el esquema de la prueba. 60 Calcular el estadístico. 70 Tomar la decisión acorde con los resultados de la prueba.
En la unidad anterioq se ha visto que existen diferentes tipos de distribuciones muestrales dependiendo del estadístico que se ha extraído de cada una de las muestras. A continuación se tomarán decisiones sobre cada uno de estos t¡pos de distribuciones, tales como: Media, Proporciones, Diferencias, Varianzas, etc.
tt
49a
ESTADíSTICA II
4.2.1 Prueba de hipótesis para la medta consiste en realizar la prueba bajo el procedimiento arriba ¡nd¡cado para anal¡zar el estadístico Media Aritmética. Para determ¡nar los puntos críticos según el n¡vel de s¡9n¡ficac¡ón "cr"; primero se tiene que conocer si la desviac¡ón estándar es poblacional para darle dará tratamiento conforme al modelo de Probab¡lidad Normal (z), en caso de que la desviación estándar es muestral y s¡ el tamaño es 30 o más, tamb¡én se le dará tratam¡ento conforme al modelo de Probab¡lidad Normal (Z), en caso contrar¡o, se le dará tratamiento conforme a al modelo de probabilidad T-Studen (t).
Valores críticos de z Nivel de Sig. (cr) Z para una cola
0, 10
0,0 5
0,o2
0,0
7,24
7,645
2,Os
2,33
Z para dos colas
1,645
1,96
Los valores crít¡cos de
1
2,58
t-student, el alumno los puede encontrar en tabla anexa
al
Auto Instructlvo.
Man ua I
Las fórmulas estadísticas que se dan a continuación, pueden ser ut¡l¡zadas en la prueba
de h¡pótesis para la media, corresponden al modelo
"z"
o al modelo
"t", depend¡endo del
tamaño de la muestra: Uso de
"z"
,=i
p
Uso de
t=
Error de la Med¡a con
reemplazo
o
Oi
O¡- T,
"t"
Error de la lvledla con reemplazo
X¡t
o,
Error de la Med¡a s¡n reemplazo
oi=
s
Error de la ¡4edia sin reemplazo ,s
6
Ox= G
N-rl N_I
I
]
En los casos con muestras grandes (n > 30), si no se conoce la Desviac¡ón Estándar Poblac¡onal (o), se puede est¡mar la varianza de la muestra y después sacarle la raíz cuadrada a la siguiente fórmula:
»
(xi-x)')
(r-l) ¡t50¡
WALTER CÉSPEDES RAMfREZ
Ejercicios resueltos
1) Una marca de azúcar es embolsada en bolsas de papel con una capacidad de 5kg c/u y desviación típica de 3 kg; se toma una muestra de 100 bolsas para verificar el peso correcto y se determina que el promedio muestral difiere significativamente de 5 kg: además se considera que el proceso de empaque está funcionando en forma inadecuada. Si la muestra dio un promedio de 4.5 kg; se desea determinar si el proceso de empaque está funcionando adecuadamente a una significación del 5olo.
Solución: 1o Formulación de las Hipótesis:
Ho
:
tr =
tr*+
H1
5kg 5kg
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será bilateral 30 Asumir la significación de !a prueba:
o = 0,05 : por lo tanto su punto crítico esZ = +1,96 (sabiendo que n = 100) 40 Definir el estadístico de !a distribución muestral correspondiente: a_ L_
i-¡,
o
Oi= \l -n
oi 50 Diseñar e! esquema de !a prueba:
1-,96
60 Calcular el estadístico: J
oi - Jtoo = 0r3
7=(4,5-5)/0,3 =
-1,67
70 Tomar la decisión acorde con los resultados de la prueba: Z = - 1,67, es mayor que el punto crítico de la izquierda (Z = - 1,96), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho); es deciri no es verdad que el funcionamiento de empaque sea inadecuado.
Ir5[
ESIADí5IICA
I]
2) De una muestra de tamaño 25 extraída de una población de 5000 productos vendido por un supermercado, se encontró un promedio de 478 gr. si se afirma que el producto pesa en promedio 500 9r, con una desv¡ac¡ón estándar muestral de 30,84 gr, probar la hipótesis al 99Vo de confianza de que el promed¡o es menor.
Solución:
1" Formulación de las Hipótes¡s:
Ho
:
tr =
Hi
:
!+<
500 gr 500 gr
20 Determinar el tipo de ensayo: Observando la hipótes¡s alternativa, la prueba será un¡lateral izquierda
30 Asumir la significación de la prueba:
o = 0,01 : por lo tanto su punto crítico es t = - 2,492 (sab¡endo que n < 30) Y = 25 - 7 = 24 grcdos de libertad 40 Defin¡r el estadístico de la distr¡buc¡ón muestral correspond¡ente:
.§
t = i-p
[
F-,
o'=ELIN-r
Ox 50 D¡señar el esquema de la prueba:
- 2,492
t
60 Calcular el estadístico:
30.s4[ Eooo-x] - --t * - ,D, I[XI sooo-r ]t= b,t55
¡=
(478
-
s00)
/ 6,1s3 = -
3,58
70 Tomar la dec¡s¡ón acorde con los resultados de la prueba: "t" = - 3,58, es menor que el punto crít¡co de la ¡zquierda (t = - 2,492), pot lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótes¡s Nula (Ho); es decir, es verdad que el promedio es menoT de 500 gr.
§t52t
WALTER CÉSPEDES RAMíREZ
3) El ingreso promedio familiar de un pueblo joven es de 865 soles al mes con una varianza 1482,25 soles, Al seleccionar una muestra de 45 familias, el promedio muestral fue de 875 soles; probar al familiar es mayor.
5o/o
de significación, que el ingreso promedio
Solución: 10 Formulación de las Hipótesis:
tr=865
Ho: H1
:
tr
> *965
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral derecha 30 Asumir la significación de !a prueba:
a = 0,05 : por lo tanto su punto crítico es Z = 1,645 (sabiendo que n > 30) 40 Definir el estadístico de la distribución muestral correspondiente: 7-
i-¡,
o
Ox= G
oi 50 Diseñar el esquema de la prueba:
1,645
60 Calcular el estadístico:
o
.r,= rftqgz,x t,[45 = 5,739
7=(875 -865)/5,739
=
7,74
70 Tomar la decisión acorde con los resultados de !a prueba: Z = 1,74, es mayor que el punto crítico de la izquierda (Z = 7,645), por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis Nula (Hn); es decir, que el promedio familiar del pueblo joven es mayor a 865 soles.
4)
Generalmente en una prueba evaluativa a los escolares de una región, el promedio es de 65 puntos de un total de 100 puntos. Al seleccionar una muestrade22 estudiantes de
il
531
ESTADíSTICA II
dicha región, se detectó un promedio de 58 puntos y una desviación estándar muestral de 36 puntos; probar al 90% de confianza, que el promedio de la región es menor.
Solución: 1o Formulación de las Hipótesis:
Ho: Hl
:
tr=65 tr <+65
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral izquierda 30 Asumir la significación de la prueba:
o = 0,10 : por lo tanto su punto crítico €s t = - L,323 (sablendo que n < 30) T = 22 - 7 = 2l grados de libertad 40 Definir el estadístico de !a distribución muestra! correspondiente:
t-
T-p Ox
s
or= G
50 Diseñar el esquema de !a prueba:
60 Calcular el estadístico:
6*:tot^iñ =7,675
Z=(58-65)/7,675 = -0,91
70 Tomar la decisión acorde con los resultados de la prueba: - 0,91, es mayor que el punto crítico de la izquierda (t = - L,323), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho); es decir, que el promedio de evaluación de la región es 65 puntos.
¡r54¡
WALTE R CÉSPEDES RAMíREZ
Resolver los s¡gu¡entes eierc¡c¡os proPuestos sobre prueba de Hipótes¡s para la Med¡a. 1) EI promedio de ventas de una gran tienda es de 65000 soles d¡arios. Al selecc¡onar una muestra de 22 días, se detectó un promedio de 64000 y una desv¡ación estándar muestral de 3600 soles; probar al 950/o de confianza, que el promedio es menor. Resp: t - 1,30; se acepta Ho
2) Se afirma que la talla promedio estud¡antil en el Perú es 155 centímetros con desviación estándar de 32 centímetros por talla. Al selecc¡onar una muestra de 45 estudiantes, la med¡a muestral fue de 168 centímetros; probar al 2olo de significación, que la talla es mayor. Resp: Z =
2,73;
se rechaza
Ho.
3) De la empresa Al¡mentos S.A., se extrae una muestra de 49 de 5000 y se encontró un consumo promed¡o de 498 soles. S¡ se afirma que el consumo promedio es de 505 soles con una desviac¡ón estándar de 30,80 soles, probar la h¡pótesis al 99olo de confianza de que el consumo promed¡o difiere de 505 soles. Resp: Z = - 1.60; se acepta Ho.
4) El promed¡o de ventas de una distr¡buldora es 12500 d¡arios, con desviac¡ón estándar de 1250 soles, s¡ se toma una muestra de 115 ventas extraídas de una poblaclón de SOOOO y se encontró un promed¡o de ventas de 72343. Probar la hipótes¡s al 90o/o de confianza que el promedio de ventas es menor. Resp: z = - 1,35; se rechaza Ho
5) Si una muestra de 19 productos elegidos al azar de una fábrica d¡o un promedio de 67,45kg y una desviac¡ón estándar de 5,68 kg. Probar la h¡pótesis al 95olo de confianza de que la media poblac¡onal difiere de la med¡a muestral ya que la fábr¡ca asegura que sus productos pesan en promed¡o 70 kg.
Resp: t = - 1,96; se acePta
Ho
6) Suponga que los 5500 estudiantes de una un¡versidad están normalmente distribu¡dos
con una med¡a de 1,70 metros. Si se toma una muestra de 24 estudiantes y el promed¡o de talla fue 1,62 metros y la desviación estándar fue 0,32 metros, ¿se puede afirmar al 99o/o de confianza que la talla es infer¡or? Resp: t = - 1,23; se acePta Ho
7) De una muestra de tamaño 49 extraída de una poblac¡ón de 250 estudiantes
se
observó que el peso promed¡o de la muestra fue de 54,5 kg. Se sabe que la media poblacional es de 56 kg con una desviación estándar es de 5 kg. ¿Se puede afirmar al 90olo de confianza que el peso promedio muestral d¡fiere del peso poblac¡onal?
Resp: Z = - 2,34; se rechaza
Ho
8) Una muestra de 16 maestros extraída de una poblac¡ón de 2500, se detectó un sueldo promedio de 985 soles y una desv¡ac¡ón estándar de 45 soles. Si se afirma que los
tl55:
ESTADISTICA II
maestros ganan en promedio 1000 soles, ¿al 95olo de confianza se arriesga usted decir que la paga promedio es inferior? Resp: t = -L,34; (No es inferior)
a
profesores es 50 años. Se conoce que la edad media poblacional es de 45 años con una desviación estándar de 19,5 años. Determine al 98o/o de confianza si la edad promedio muestral es mayor que la poblacional.
9) La edad promedio de 50
Resp: Z = 1,81; se rechaza
Ho
10) Una muestra de 30 libros contables hecha por un analista en Lima, encontró un promedio muestral de activos de 38000 soles. Si se sabe que el promedio es de 36500 con una desviación estándar de 7500 soles. Determine al 90olo de confianza si el valor promedio de los activos de la muestra es mayor al valor poblacional. Resp: Z = 7,10i se acepta Ho,
4.2.2.- Prueba de Hipótesis para las Proporciones: Cuando se utillza el estadístico relacionado con las proporciones, se dice que el ensayo es una prueba de hipótesis para proporciones; además, dicha prueba puede ser empleada por el modelo "t" o por el modelo "z", dependiendo del tamaño de la muestra. Los puntos críticos que se utilizan en este tipo de ensayo, son los mismos que los de la Media dependiendo del nivel de significación "a"
Las fórmulas estadísticas que se dan a continuación, pueden ser utilizadas en la prueba de hipótesis para las proporciones, corresponden al modelo "2" o al modelo "t", dependiendo del tamaño de la muestra:
b-p
a_ L-
t-
oP
o,, Donde: el error de las proporciones ( con reemplazo
o o=
pq n
b-p
6,
),
es:
sin reemplazo
rl
6il k oo=X; Lf,r-u1
§t56'
WALTER CÉSPEDES RAMíREZ
Ejercicios resueltos
1) Un laboratorio afirma que sus productos tienen 90% de efectividad para curar una enfermedad, se tomó una muestra de 200 pacientes y solo se aliviaron 160. Determinar que la afirmación no sea clerta: es decir que la medicina cura menos del 90o/o a una significación de 5Yo.
Solución: 10 Formulación de las Hipótesis:
Ho
:
P=0.90
H1
:
p<0.90
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral izquierda 30 Asumir la significación de la prueba: cr
= 0,05 : por lo tanto su punto crítico esZ = - 7,645 (sabiendo que n = 200)
40 Definir el estadístico de !a distribución muestral correspondiente:
-
L=
i-
6i Or=X;
p
op
50 Diseñar el esquema de la prueba:
-
z
1,645
60 Calcular el estadístico:
b
= 160/200
= 0.80
oo:Jo,9-o,u2oo =0,0212
7 = (o,8-0,9) /o,o:.z =
-4,72
70 Tomar la decisión acorde con los resultados de Ia prueba:
Z = - 4,72, es menor que el punto crítico de la izquierda (Z = - t,645), por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis ltlula (Ho); es decir, no es verdad que la medicina es efectiva para curar el 90% de casos.
rl57§
ESTADísrrcn
n
2) En una encuesta a una comunidad de 80 familias, el 42o/o señaló que la necesidad más urgente para dicha comunidad son los servicios de agua. Si se afirma queTOo/o de las familias ya cuentan con el servlcio de agua. Al 90% de confianza determinar hay diferencia en la carencia del servicio de agua en la proporción muestral y la proporción verdadera que necesita el servicio de agua.
Solución: 10 Formulación de las Hipótesis:
Ho: H1
P
= 0.30
p + 0.30
:
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será bilateral 30 Asumir la significación de !a prueba: cr
= 0,10 : por lo tanto su punto crítico esZ = + t,645 (sabiendo que n = B0)
muestral correspondiente:
Definir el estadístico
b-n
a_f
6n tl;
o o=
oP
50 Diseñar el esquema de la prueba:
- 1,645
1,64s
60 Calcular el estadístico:
(tp
=
^lwroJ
/ Bo
=
0,o5t234753
Z_ (0,42- 0,3)/0,051234753 =
2,34
7o Tomar la decisión acorde con los resultados de la prueba: Z = 2,34, es mayor que el punto crítico de la derecha (Z = !,645), por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis Nula (Ho); es decir, si hay diferencia por lo que se puede afirmar que una proporción mayor al 30Yo necesita de los servicios de agua.
§r5B&
WALTER CESPEDES RAMIREZ
3)El 4o/o de las partes de fabricadas por una compañía son defectuosas. En una muestra aleatoria de 25 paftes, 2 estaban defectuosas, probar la hipótesis a un nivel de significación del 2,5o/o de que la producción de partes defectuosas es mayor al 4o/o. Solución: 10 Formulación de las Hipótesis:
Ho: H1
P :
=
O,O4
P > 0,04
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral derecha 30 Asumir la significación de !a prueba:
o = 0,025 : por lo tanto su punto crítico es t = 2,064 (sabiendo que n = 25) T = 25
-
L = 24 grados de libertad
40 Definir el estadístico de !a distribución muestral correspondiente:
i,- p
t-
oP 50 Diseñar el esquema de la prueba:
2,064 2,064
t
60 Calcular e! estadístico:
b =Z/25=0,08 o,:
Jo,M-o,%/%= 0,039191835 ¡ = (0,08-0,04)/0,039191835 =
1,02
70 Tomar la decisión acorde con los resultados de la prueba: t = 1,O2, es menor que el punto crítico de la derecha (t = 2,064), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho)i es decir, que no se puede afirmar de que la producción de partes defectuosa sea mayor del 4o/o.
§r59§
ESTADISTICA
JI
Resolver los s¡guientes ejercic¡os propuestos sobre prueba de H¡pótes¡s para las Proporciones. 1) Al examinar una muestra de 220 estudiantes un¡vers¡tarios, se encontró Que el 18o/o tenía dificultad en el aprendizaje. Si se afirma que el 159o de la población tienen esa d¡ficultad. Al 10olo de s¡gniñcación determinar si hay diferencia sobre lo afirmado con el aprend¡zaje. Resp: Z = 1,25 se acepta la Ho, no hay d¡ferenc¡a. 2) Si en una muestra de 300 repuestos de un embarque de 4000 repuestos, se encontró que el 7olo es defectuoso. Si se sabe que la producción defectuosa alcanza 4,5o/o, ¿hay razón suficiente para afirmar que la proporción poblacional defectuosa ha aumentado al 5olo se sign¡ficac¡ón? Resp: Z = 2,77 se rechaza la Ho, si ha aumentado.
3) En una muestra de 120 mujeres, se encontró que el 22o/o habían tenido su pr¡mer bebé antes de los 17 años de edad. S¡ se sabe que la proporción de mujeres con bebe antes de cumpl¡r 17 años de edad es del 260/o, Lhay razón sufic¡ente para afirmar que la proporción poblac¡onal de mujeres con bebé ha disminuido al 1olo de s¡gnificación? Resp: Z = - 1,00 se acepta la Ho, no ha d¡sm¡nuido.
4)
S¡ en una muestra de 28 personas próximo a jubilarse de un total de 3000, se encontró que el 27o/o deseaba realizar su propio trám¡te de jubilación. Si el Estado pone el personal sufic¡ente para cubr¡r el trámite del 7Oo/o de personas que van a jub¡larse, ¿a un nivel del 95yo es correcta la dec¡sión del Estado al considerar que el 30o/o realiza su propio trám¡te? Resp: t = - 0,35 se acepta la Ho, si es correcta.
5) Al seleccionar una muestra de 125 estudiantes un¡vers¡tarios, se encontró que el 88o/o estaba conforme con la metodología de enseñanza. Si la escuela dice que el 95o/o de los estud¡antes están conformes con la metodología de enseñanza, al 98o/o probar la hipótes¡s de que ha disminuido la proporción de alumnos conformes con metodología de enseñanza. Resp: Z = - 3,59 se rechaza la Ho, si ha d¡sm¡nu¡do.
6) S¡ en una muestra de 22 trabajadores de una empresa de 450 trabajadores,
la
se
encontró que el 40Vo no estaban conforme con su sueldo. Si la empresa dice que el 35olo de los trabajadores no están conformes con su sueldo, al 900/0 probar la hipótesis de que ha aumentado la proporción de d¡sconformidad respecto al sueldo. Resp: t = 0,50 se acepta la Ho, no ha aumentado.
7) Al investigar una muestTa de 235 escolares, se encontró que el 150/o tenía deseos de estud¡ar Administrac¡ón. Si se afirma que el 20olo de los escolares quieren ser administradores, probar la h¡pótesis de que la proporción ha dism¡nuido con una s¡9nificación de 0,01.
Resp: Z = - 1,92 se acepta la Ho, no ha disminuido.
;t60t
WALTER CÉSPEDES RAMíRTZ
B) Si en una muestra de 358 personas pertenecientes a la población económicamente activa de un total de 40000, se encontró que el 21olo estaba desempleado. Si según informes oficiales se sabe que solo el 18o/o está desempleado, probar la hipótesis de que la proporción ha aumentado con una significación de 0,1. Resp: Z = 7,48 se rechaza la Ho, si ha aumentado.
9) Al examinar una muestra de 27O pequeñas empresas de Lima, se encontró que el 36Yo, no tr¡buta a la Sunat por carecer de utilidades. Si según informes oficiales de la Sunat se sabe que solo el 32o/o no tributa, probar la hipótesis de que la proporción ha aumentado con una significación de 0,02.
Resp: Z = 7,4! se acepta la Ho, no ha aumentado.
10) Si en una muestra a 26 jóvenes de una localidad, se encontró que el 47o/o está de acuerdo con la actual política económica. Si el Gobierno afirma que el 45olo esta conforme, probar la hipótesis de que la proporción ha disminuido con una significación de 0,01.
Resp: t = - 0,47 se acepta la Ho, no ha disminuido. 4,2,3 Prueba de hipótests para las diferencias Son pruebas o ensayos donde intervienen: la Diferencia de Medias y la Diferencia de Proporciones y las fórmulas estadísticas que se dan a continuación, pueden ser utilizadas
también para"Z" ó para "t", dependiendo del tamaño de la muestra; igualmente, los puntos críticos serán los mismos según el nivel de significación "o". Las fórmulas estadísticas que se dan a continuación, pueden ser utilizadas en la prueba de hipótesis para la Diferencia, corresponden al modelo "2" ó al modelo "t", dependiendo del tamaño de la muestra: Diferencia de Medla
7= iu-iu
oV.q-ois
Diferencia de Proporciones
,= Xo-i,
1_ L-
6irt-oia
PIPa 6 P,t-o
[= Pa
Po'Pn
o Pt-o
Error de Diferencia de Medias y de Proporciones Diferencia de Proporciones
Diferencia de Media
f_'z o, -lo-on"-u oi¿-oVs=\ U tts
pAqA
opl-op g
&t6t§
=
*pBqlB
Pn
ESTADíSTICA II
Ejercicios resueltos 1) En un estudio de mercado sobre el gasto diario que realizan las amas de casa se realizo encuestas y se obtuvo los siguientes datos. Realizar la prueba de hipótesis a una significación del 5olo pora verificar si el gasto de Breña es mayor al de San luan.
729 111
| ,
S/. S/.
17,93 1 t4,79
S/. t,OS S/. 8,00
Solución: 10 Formulación de las Hipótesis:
Ho:
XB,"ñu
H1
:
=
Xsun:uuni
no hay diferencia en el gasto
> X"-^, X-,^.-^; Breña gasta más que San Juan 6ren¿ 5an Juan,
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral derecha 30 Asumir la significación de la prueba: c¿
= 0,05 : por lo tanto su punto crítico esZ = 1,645 (sabiendo que n > 30)
40 Definir el estadístico de la distribución muestral correspondiente: l^-z 02 IUAB z- XA Xe
oil
-
oie
ox¿ oia=\-.
n,
50 Diseñar el esquema de !a prueba:
1,645
z
60 Calcular el estadístico: to.o+l 0.42 (0.58) = 1,015 op,q*opa:ll_ /0.¡ozzs -* 230
§t621
7= 0.42-0.36 =?6g L
_
'
0,04564r323
_
J,
WALTER CÉSPEDES RAMf REZ
70 Tomar !a decisión acorde con los resultados de la prueba: Z = 3,68, es mayor que el punto crítico de la derecha (Z = 7,645), por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis Nula (Ho); es decir, es verdad los gastos de Breña son mayores a los de San Juan.
2) Realizar la prueba de hipótesis a una significación del 2o/o para verificar si la academia Beta es mejor que la Academia Alfa con el test evaluativo que se realizó para determinar el nivel de preparación en ambas academias:
I{U§STRA
Academias
22s 230
Academia Alfa
Academia Beta
APROBADOS
0,36 0,42
I
Solución: 10 Formulación de las Hipótesis:
Ho: H1
:
Xr.ro
=
Xorro; no hay diferencia en el aprendizaje
Xu.ro
)
Xorro; Beta es mejor que Alfa.
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral derecha 30 Asumir la significación de la prueba:
a = O,O2: por lo tanto su punto crítico esZ = 2,05 (sabiendo que n > 30) 40 Definir e! estadístico de Ia distribución muestral correspondiente:
7=
Pt-Pn
oP't-6Ps
o P,t-o pa
PtQ.t PaQs -+-
50 Diseñar e! esquema de !a prueba:
/
=
\o
L-
2,O5 60 Calcular e! estadístico:
u pA u
pB= \reJ6,0ó!-qrr,05$ 23o =0,045641323 zzs rl63¡
7-0.42-0.36 = 0.045641323
1,31
ESTADísrrcn lt
70 Tomar la decisión acorde con los resultados de la prueba: Z = 7,3t, es menor que el punto crítico de la derecha (z = 2,05), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho); es decir, Beta no es mejor que Alfa al 980/o de confianza.
3) En un estudio sobre las remuneraciones que se pagan en las regiones, se realizo una encuesta y se obtuvo los siguientes datos:
Región
MUESTR/I PROITTEDIO DESVIACIóN Sl.27O s/. 1198 | 2so s/.
250
Truiii,to
1306 i
s/.480
Realizar la prueba de hipótesis a una significación del 5olo para verificar si el sueldo promedio de Arequipa es menor que el de Trujillo.
Solución: 10 Formulación de las Hipótesis:
Ho: H1
:
no hay diferencia en el sueldo
XAr"qrip"
=
Xr,u¡irrqi
Xa,"q,ip"
(
Xr.u,,,,oi El sueldo de Arequipa es menor
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral izquierda 30 Asumir Ia significación de la prueba: cr
= 0,05 : por lo tanto su punto crítico esZ = - 7,645 (sabiendo que n > 30)
40 Definir el estadístico de la distribución muestral correspondiente:
,,, oxt-oxa-l E,no ' ,,
,
z- xn-iu oil
-
oia
50 Diseñar el esquema de la prueba:
1,645
60 Calcular el estadístico:
lzto'
480':
oV,q ois*!zso*zso
=
34,831
7=1198-1306=-3,10 34.83
lt64l
r
WALTER CÉSPEDES RAMíREZ
70 Tomar la decisión acorde con los resultados de !a prueba: Z = - 3,10, es menor que el punto crítico de la derecha (Z = - !,645), por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis Nula (Ho); es decir, el sueldo de Arequipa es menor.
4)
Para conocer el nivel de consumo de un determinado combustible por el parque automotor de 2 ciudades, se realizó un muestreo y se encontró el siguiente resultado:
Realizar la prueba de hipótesis a una significación del diferencia entre las dos ciudades.
2o/o para
verificar exlste
Solución: 10 Formulación de las Hipótesis: Ho
i
Xrun,a
H1
:
Asanta María + ABellavista /
V
María
=
XB"llur,rtui
¿ V
.
no hay diferencia en el consumo
si
hay diferencia en el consumo.
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será bilateral 30 Asumir la significación de Ia prueba:
a = 0,02: por lo tanto y = | (22- 1) + (20 -
Su punto crítico es
1)
I
t = + 2,423 (sabiendo que n < 30)
= 40 grados de libertad
40 Definir el estadístico de la distribución muestral correspondiente:
[=
Pt-Pa
o Pt-o Pt
opl-opa
50 Diseñar e! esquema de la prueba:
- 2,423
§t65§
P,qQ,q Po4n =
-+-
ESTADISTICA II
6o Calcular el estadístico:
o p¿'6 ps :
0,44 (0,56)
22
+
0,48 (0,52) 20
= 0,153gg3
¡=0,44-0.48=-0,26 0,153 883
70 Tomar la decisión acorde con los resultados de !a prueba: t = - O,26,es mayor que el punto crítico de la izquierda (t = - 2,423), por lo tanto al no estareste valoren la región de rechazo, se acepta la Hipótesis Nula (Ho); es decir, no hay diferencia en los consumos.
Resolver los siguientes ejercicios propuestos sobre prueba de Hipótesis para !a Diferencia:
1)
Realizar la prueba de hipótesis a una significación del 5olo para verificar la diferencia de sueldos que existe en los dos poblados. Promedio
Varianza
Tamaño
Salina Alta
1008
35
Salina Baja
996
827 93s
Empresa
42
Resp: Z = 7,77 se acepta Ho, no hay diferencia. 2) Al 9Oo/o de confianza verificar si el costo promedio de producción unitaria del primer turno es menor que el del segundo. Turno de producción Primer turno Segundo turno
Promedio
Varianza
Tamaño
230
L25
15
242
2t5
77
Resp: t = - 2,62 se rechaza Ho, el costo si es menor.
3) Realizar
la prueba de hipótesls a una significación del 2o/o para verificar entre dos muestras, la diferencia de promedios de ingresos de personas con deseo de estudiar fuera del país. Muestra
Promedio
Varianza
Primera
1820
Segunda
1809
627 735
Tamaño 34
40
Resp: Z = t,82 se acepta Ho, no hay diferencia.
4) Dos compañías
comercializan sus productos
en un mismo mercado, si de
cada
compañía se toma una muestra de 20 artículos y se observa que cubren el 48olo y el 650lo del mercado; probar al 99o/o de confianza para determinar si hay diferencia de ventas en el mismo mercado. Resp: t = 1,10 se acepta Ho, no hay diferencia.
at 66t
WALTER CÉSPEDES RAM íREZ
5) Al obtener una muestra de 45 personas la población económ¡camente activa de la c¡udad Luz y 35 personas de la ciudad Buenaventura, el !60/o y el 25o/o respect¡va mente están desempleados; probar al 5olo de significación de que la proporción de desempleados de la c¡udad Luz es menor a la proporción de la c¡udad Buenaventura. Resp: Z = 0,99 se acepta Ho, no es menor.
4,2.4 Prueba de hipótesis para las varianzas
Son pruebas
o
ensayos donde intervienen las varianzas. Este estadístico es
ampliamente util¡zado en la Inferencia Estadística y como t¡ene múlt¡ples apl¡caciones, se verá más adelante con el nombre Análisis de la Varianza.
4.2,5 Prueba de hipótesis para variables cual¡tat¡vas Es un t¡po de ensayo cons¡derado como una prueba no paramétrica que mide la discrepancia entre una distribuc¡ón observada y otra teórica (bondad de ajuste), indicando en qué med¡da ex¡ste d¡ferencia entre ambas. El contraste de h¡pótes¡s o prueba de h¡pótesis determ¡nará si existe o no ex¡ste d¡ferenc¡a entre ambos t¡pos de valores, uno real y otro totalmente al azar. Tamb¡én se ut¡l¡za para probar la independencia de dos variables entre sí, mediante la presentación de los datos en tablas de continqencia. Este ensayo ut¡liza el modelo de probab¡lidad li-Cuadrado y cuanto mayor sea el valor de 12, menos verosímil es que la h¡pótes¡s sea correcta; de Ia m¡sma forma, cuanto más se aproxima a cero el valor de ji-cuadrado, más ajustadas están ambas distribuc¡ones. Los grados de libertad
(7) vienen dados por:
10 S¡ los datos están en una sola
fila:
= n -1
20 Si los datos están contenidos en tablas de contingenc¡as o tablas de doble entradas: y = (n -1) (k -1). Donde "n" es el número de filas y "k" el de columnas. La fórmula que se ut¡liza en este t¡po de ensayos es la sigu¡ente:
, -. x-= L
(o-e)2 e
Donde: O = Valor observado o valor real e = Valor esperado (al azar) o valor probable. Los valores críticos de ¡i-cuadrado, el alumno los puede encontrar en tabla anexa al Manual Auto Instructivo.
,
614
EST,ADisrrc,q
rr
Criterio de decisión para variables cualitativas: Si el valor calculado a2 es menor al punto crítico, se acepta la Hipótesis Nula Hn, en caso contrario se rechaza ya que este tipo de prueba solo utiliza un ensayo unilateral derecho. Ejercicios resueltos 1) Para conocer el equillbrio de confección de dos monedas, se realizo el experimento de lanzarlas 200 veces. Con el siguiente resultado, probar la hipótesis al 97.5o/o de confianza de que ambas monedas son sesgadas (no equilibradas):
Monedas
cc
cs
sc
Resultados
62
71
30
ss 37
Tota! 200
Solución: 1o Formulación de las Hipótesis: Ho : Las dos monedas están equilibradas Las dos monedas no están equilibradas.
H1
20 Determinar e! tipo de ensayo: Este tipo de ensayo siempre es unilateral derecha (pese que la hipótesis alternativa se exprese por no igual o no equilibrada) 30 Asumir la significación de la prueba: Para cr x2o,nr,
= O,O25; el lado derecho de72 es 1 - cr(1
= 9,35
-
0,025 = 0,975)
(T = 4 - 1 = 3 grados de libertad)
40 Definir el estadístico de la distribución muestral corespondiente: -2 = ^Le
§
@_ e)'
50 Diseñar e! esquema de la prueba:
2
Xo,nru = 9,35
il
68t
WALTE R CÉSPEDES RAMÍREZ
6o Calcular el estadístico: Valores Esperados (e)
Valores Observados (o)
Monedas Resu ltados
cc cs sc ss Total 62 7t 30 37 200
El cálculo del valor esperado es 0,5 x 05 x
Valores l'? =
:
Monedas
cc cs sc ss Total
Resultados
50
50
50
50
200
200 = 50 (como se sabe la P(.) = 0,5)
(o - e)'z/ e
Monedas
cc
cs
sc
ss
Resultados
2,88
8,8 2
8,0 0
3,38
: 2
3,08
70 Tomar la dec¡sión acorde con los resultados de la prueba: x2 = 23,08, es mayor que el punto crít¡co (x'?o,e,s = 9,35), por lo tanto a¡ estar este valor en la región de rechazo, se rechaza la Hipótes¡s Nula (Ho)i es decir, las monedas no están equilibradas.
2) Para conocer si el género (sexo) de una persona es un factor preponderante para que ésta fume, se real¡zó una encuesta a 150 personas. Con el siguiente resultado, probar la hipótesis al 950/o de confianza de que s¡ es determ¡nante:
Si Fuma No fuma total
Hombre
Mujer
Total
46
44
90
34
26
60
80
70
150
Solución:
1" Formulación de las H¡pótes¡s:
Ho
:
El sexo no determina que una persona fume
H1
:
El sexo si determina que una persona fume.
20 Determ¡nar el
tipo de ensayo:
Este tipo de ensayo siempre es un¡lateral derecha
30 Asum¡r la sign¡ficac¡ón de la prueba:
;'?es 1 - o (1 (n (k -1) -1) 7= = (2 - 1) (2 -
Para cr = 0,05; el lado derecho de x2o.es
= 3,84
¡t69:
- 0,05 = 0,95) 1) = 1(Srado de l¡bertad)
ESTADÍSTiCA
II
40 Definir el estadístico de Ia distribución muestral correspondiente: (o - r)'
x'=
Z
50 Diseñar el esquema de la prueba:
xl,* =:,s+
60 Calcular el estadístico: Valores observados (o)
Valores esperados (e)
Hombre
Mujer
Total
Sifuma
46
44
90
No fuma
34
26
Total
80
70
Hombre
Mujer
Total
Sifuma
48
42
90
60
No fuma
32
28
60
150
Total
80
70
r50
El valor esperado de cada celda se obtiene multiplicando el total de la fila por el total de la columna de la misma celda, luego se divide entre el total de datos. Ejemplo: para la primera celda 80 x90 / 150 = 48, igualmente para las demás
celdas. Valores
X2=2 (o-e)2/e
Si Fuma No fuma
:
Hombre
Mujer
:
0,083
0,095
o,L25 0,208
0,L43 0,238
0,L78 0,268
o,446
70 Tomar la decisión acorde con los resultados de la prueba: x2 = 0,446, es menor que el punto crítico (X'o,r, = 3,84), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis ttlula (Ho); es decir, el sexo no determina que una persona fume.
fl
70§
WALTER CÉSPEDES RAMíREZ
3) Para conocer si el turno de trabajo es un factor preponderante para que una persona llegue tarde a sus labores, se observó la asistencia a sus labores de 100 personas. Con el siguiente resultado, probar la hipótesis al 99o/o de confianza de que si es determinante: 10 T.
20 T.
30 T.
Total
Con tardanza
7
8
10
25
Sin tardanza
33
22
20
75
30
100
tota
40
I
30
Solución: 10 Formulación de las Hipótesis:
H0
:
El turno no determina que una persona llegue tarde El
H1
turno si determina que una persona llegue tarde.
20 Determinar el tipo de ensayo: Este tipo de ensayo siempre es unilateral derecha 30 Asumir Ia significación de la prueba: Para cr = 0,01; el lado derecho de72 es 1 X2s,e
= 9,27 y = (n-1)
(k -t) =
(2-
- cr (1 1) (3
-
0,01 = 0,99)
- 1) = 2 (gradode
libertad)
40 Definir el estadístico de la distribución muestral correspondiente:
x'=Z
(o
- ")'
50 Diseñar el esquema de la Prueba:
ufi.n
¡l7l!
=9,21
E
STAD íST
ICA
I!
6o Calcular el estadístico: Valores esperados (e)
Valores observados (o)
Con tard. S¡n tard. total
f
20
10 T.
10
8
7
33
22
40
30
Valores /'z =
10 T.
30 T. Total
.
:
Con Tard.
25 75
Sin tard.
30
30
Total
40
0,03
0,8 3
1,76
0,30
0,01
o,28
0,59
7,20
0,04
l,ll
2t35
Con ta rdanza
0,90
Sin tardanza 2
f
,
30 T. Total 7,5
25
30
100
E
30
75
e
:
20
7,5 ],
100
30 T.
10 T.
10
20
(o - e)'z/
20 T.
70 Tomar la decisión acorde con los resultados de la prueba: x' = 2,35, es menor que el punto crít¡co (x2o,ee = 9,27), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho); es dec¡r, el turno de trabajo no determina que una persona llegue tarde. 4) Para conocer si las respuestas de opinión tipo LIKERT fueron respond¡das de una manera diferenciada, se reaiizó una encuesta a 300 alumnos. Con el siguiente resultado, probar la h¡pótesis al 97.5o/o de confianza de que las respuestas son diferentes (Hay una op¡n¡ón clara):
OPINION ¿cree Ud. que el método de
CF
c
NO
D
DF
70
100
3B
32
60
Total 300
enseñanza es eñciente?
Donde:
CF = Concuerda fuertemente C = Concuerda NO = No opina DF= D¡screpa fuertemente D = D¡screpa.
solución: 1o Formulación de las H¡pótesis: No hay diferencia entre las respuestas Ho :
Hr 20 Determinar el
:
Si hay d¡ferencias por que ex¡ste una opin¡ón clara.
tipo de ensayo:
Este tipo de ensayo siempre es unilateral derecha at72a
WALTER CÉSPEDES RAMíREZ
30 Asumir la significación de la prueba: Para s,
= 0,025; el lado derecho de f es 1 - cr (1
x'o,nr,
= 11,1 (12=5-7=4
-
0,025 = 0,975)
gradosdelibertad),
40 Definir el estadístico de la distribución muestral correspondiente:
x'= Z
(o
- ")' e
50 Diseñar el esquema de !a prueba:
1i.rr, =
1 1,1
6o Calcular el estadístico: Valores Observados (o)
OPINIóN
CF
c
NO
D
DF
ZCree Ud. que el método de enseñanza es eficiente?
70
100
38
32
60
Total 300
Valores Esperados (e)
OPINIóN
CF
c
NO
D
DF
ZCree Ud. que el método de enseñanza es eficiente?
60
60
60
60
60
El cálculo del valor esperado es 1
OPINIóN
/
5 x 300 = 60 (como se sabe la P,", = 0,2)
ValoresX2=Z(o-e)'?/e NO c CF
ZCree Ud, que el método de e. es eficiente?
Total 300
26,67
1,67
il
73I
8,O7
D
DF
t3,o7
0
49,48
ESTADíSTICA
II
70 Tomar la decisión acorde con los resultados de la prueba: x2 = 49,48, es mayor que el punto crítico (Xro,rr, = 11,1), por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis ruula (Ho); es decir, existe una opinión clara respecto al método de enseñanza.
5)
Pam conocer si las respuestas de opinión tipo LIKERT de dos preguntas diferentes, son de la misma opinión, realizó una encuesta a 100 alumnos. Con el siguiente resultado, probar la hipótesis al 90olo de confianza de que la opinión de ambas preguntas, es diferente:
OPINIóN
CF
c
NO
D
DF
ZCree Ud. que el método de enseñanza es eficiente?
23
34
13
t2
1B
ZCree
OPINIóN Ud. que eljoven obtiene
Total 100
CF
c
NO
D
DF
16
20
10
25
29
Tota! 100
mejores califi caciones?
Solución: 10 Formulación de las Hipótesis: Ho : No hay diferencia entre las preguntas
H1
Si hay diferencia entre las preguntas.
:
20 Determinar el tipo de ensayo: Este tipo de ensayo siempre es unilateral derecha 30 Asumir la significación de la prueba: Para
= 0,10; el lado derecho de12 es 1 - cr (1 - 0,10 = 0,90) = 7,78 (T=5-t=4 gradosdel¡bertad)
cr.
X26,s¡
40 Definir el estadístico de la distribución muestral correspondiente:
x'=
Z
(o
- ")'
50 Diseñar e! esquema de !a prueba:
Xi.,r. =
tt74l
1 1,1
WALTER CÉSPEDES RAIÍ f REZ
6o Calcular el estadístico:
En estos casos como el ensayo Ji-Cuadrado compara valores observados contra valores esperado, hay que dec¡d¡r cuál de las preguntas es "o" (observada) y cual es "e" (esperada); ent¡éndase que la respuesta al contraste de hipótesis es en base a la pregunta cons¡derada como esperada. La solución que se dará a cont¡nuac¡ón será en base al método de enseñanza.
Valores observados (o)
OPINION ¿Cree Ud. que el joven obt¡ene mejores cal¡fi caciones?
CF
c
NO
D
DF
16
20
10
25
29
Total 100
Valores esperados (e)
OPINION ¿Cree Ud. que el método de
CF
c
NO
D
DF
23
34
13
72
1B
Total 100
enseña nza es eficiente?
Valores z2 = E (o - e)'z/ e
OPINION Contraste mejores cal¡f./ Método
CF
c
NO
D
DF
2,73
5,76
0,69
14,08
6,72
29,38
de enseñanza
70 Tomar la dec¡s¡ón acorde con los resultados de la prueba: x2 = 29,38, es mayor que el punto crít¡co (x2 o.sa = 7,78), por lo tanto al estar este valor en la región de rechazo, se rechaza la H¡pótesis Nula (H,)i es dec¡r, que los resultados de las cal¡ficac¡ones s¡ son diferentes por ello no dependen de las califi caciones del joven.
Resolver los sigu¡entes ejerc¡cios propuestos sobre prueba de Hipótes¡s Para la
variable cualitativa: 1) Para conocer si el método de enseñanza es un factor preponderante para aprobar una asignatura, se observó las cal¡ficac¡ones de 100 alumnos. Con el sigu¡ente resultado, probar la hipótesis al 99o/o de confianza de que s¡ es determ¡nante:
Método A Método B Método c
Aprobados Desaprobados total
Total 35
74
11
10
26
19
20
65
30
100
40
30
Resp: x''? = 0,073; se acepta Ho, es decir que el método no determ¡na la aprobac¡ón.
§
t75t
ESTADÍSIICA
II
2) Para conocer si las respuestas de op¡nión t¡po LIKERT de dos preguntas diferentes, son de la misma opin¡ón, realizó una encuesta a 100 trabajadores. Con el siguiente resultado, probar la h¡pótes¡s al 9090 de confianza de que la op¡n¡ón de ambas preguntas, es diferente (re¡ac¡ón: trabajo/eficienc¡a):
OPINIóN
CF
¿Cree Ud. que su sueldo concuerda
25
c
NO
D
DF
30
10
20
15
c
NO
D
DF
28
10
2t
l2
Total 100
con Su trabajo?
OPINIóN
CF
¿Cree Ud. que su sueldo depende de su efic¡encia? Resp: u2 eficiencia.
3)
=
29
Total 100
7,4931 se acepta Ho, es dec¡r que si hay relación entre el trabajo
y
la
Para conocer s¡ un dado ha sido confeccionado en forma equil¡brada, se realizó el experimento de lanzarlo 60 veces. Con el siguiente resultado, probar la hipótes¡s al 97 .5o/o de que el dado es sesgado (no equilibrado):
Resp:
¡z = 2,6;
Dado
1
2
3
4
5
6
Total
Resultados
11
72
6
9
10
72
60
se acepta H0 es decir, no hay d¡ferenc¡a el dado está equ¡l¡brado.
4) Para conocer si el género (sexo) de una persona es un factor preponderante para que acepte a determ¡nado cand¡dato polít¡co, se realizo una encuesta a 80 personas. Con el sigu¡ente resultado, probar la hipótesis al 95olo de confianza de que si es determinante:
Hombre
Mujer
Total
Si acepta No acepta
2a
13
4t
25
74
39
total
53
27
80
Cand idato
Resp:
¡z
= 0,223i se acepta
Ho/ es decir que el sexo no es determ¡nante.
5) Para conocer
s¡ el método de enseñanza es un factor preponderante para su aceptación, se realizó una encuesta a 200 alumnos con d¡ferentes métodos de enseñanza. Con el siguiente resultado, probar la h¡pótes¡s al 9990 de confianza de que s¡ es determinante:
Método A Si acepta No acepta total Resp:
7z = 15,629;
Método
B
Método c
Total
16
82
30
728
24
40
B
72
40
722
3B
200
se rechaza Ho, es decir que el método si determina su aceptación. 16
Le
CC
o
n
3
4.3 Análisis de Ia varianza Es una colección de modelos estadísticos y sus procedim¡entos asociados, en el cual la
varianza esta particionada en ciertos componentes deb¡dos a diferentes variables explicativas. Las técnicas iniciales del análisis de varianza fueron desarrolladas por el estadístico y genet¡sta R. A. F¡sher en los años 1920 y 1930s y es algunas veces conoc¡do como Anova de F¡sher o anális¡s de varianza de Fisher, debido al uso de la distribución F de Fisher como parte del contraste de hipótesis(1). El análisis de varianza s¡rve para comparar s¡ los valores de un conjunto de datos numéricos son sign¡ficativamente distintos a los valores de otro o más conjuntos de datos. El procedimiento para comparar estos valores está basado en Ia varianza global observada en los grupos de datos numéricos a comparar. Típicamente, el análisis de varianza se ut¡liza para asoc¡ar una probab¡l¡dad a la conclusión de que la med¡a de un grupo de puntuac¡ones es d¡st¡nta de la media de otro grupo de puntuaciones. Es un procedim¡ento estadÍstico por el cual a través de las varianzas se puede determinar si ex¡sten d¡ferenc¡as entre las muestras, diferencia entre dos poblaciones o si una var¡anza muestral pertenece o no a determinada población. En el análisis de la varianza se contrastará el análisis a una sola vía y a doble vía.
at77a
ICA
ESTAD íST
4.3.1
Análisis de la varianza
II
a una sola vía
Es cuando se comparan las varianzas entre muestras o entre poblaciones, para estos casos se ut¡liza el estadístico F de Fisher y el ensayo es solamente unilateral derecha. El análisis a una vía también permite comparar las var¡anzas de una muestra y de una poblac¡ón, en este último caso el estadíst¡co a ut¡l¡zar es el estadístico Ji-Cuadrado y el ensayo puede ser un¡lateral o b¡lateral.
4.3.1
.l
Anólisis de dos vorionzos poblocionoles
Es cuando se comparan las varianzas de dos poblaciones, y el contraste o prueba de h¡pótesis determina si ambas poblaciones tienen la m¡sma var¡abil¡dad o son iguales.
¡ = Ot
Donde:
2
22
O-,>O,
Os (1) http://es.wikiped¡a.orglw¡ki/Ano/oC3yoA1l¡s¡s-de-la-varianza,
pp 1.
Ejerc¡c¡os resueltos 1) Al 90% de confianza probar la población "A" de 121 datos con varianza de 98,36, no es ¡gual a la población "B" de 61 datos con var¡anza de 45,18
Solución: 1o Formulac¡ón de las hipótes¡s:
Ho
:
No hay d¡ferenc¡a entre las Varianzas
H1
:
S¡ hay d¡ferenc¡a entre las Varianzas.
20 Determinar el
tipo de ensayo:
Este tipo de ensayos s¡empre es unilateral derecha
30 Asumir la significación de la prueba:
F(ct, N, F
D)
cr
=
0,10;
N=121
-l
=
L2O D=61 -1=60
(0,10, 120, 60) = 1,35 (Punto crít¡co)
40 Defin¡r el estadístico de la d¡str¡buc¡ón muestral correspondiente:
,=4 Oa
78
WALTER CÉSPEDES RAMíREZ
50 Diseñar el esquema de !a prueba
1,35
F
60 Calcular el estadístico:
F= 98,36/45,L8=2,78 70 Tomar la decisión acorde con los resultados de !a prueba: F = 2,18, es mayor que el punto crítico I F(0,10, 120, 60) = 1,35 ], por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis Nula (Hn); es decir, que las varianzas son diferentes. 2) Al
95o/o de
confianza probar la población "A" de 25 datos con una desviación estándar
de 125,56, no es igual a la población "8" de 41 datos con una desviación estándar de 116,78. Solución: 10 Formulación de las Hipótesis: Ho : No hay diferencia entre las Desviaciones estándares
H1
:
Si hay diferencia entre las Desviaclones estándares.
20 Determinar e! t¡po de ensayo: Este tipo de ensayos siempre es unilateral derecha 30 Asumir !a significación de la prueba:
F(cr,N,D) cr=0,05; N=25-l = 24 D=47-7=40 F
(0,05, 24, 40) = L,79 (Punto crítico)
40 Definir el estadístico de Ia distribución muestral correspondiente: 2
_
O.q 2
Oa
at79z
ESTADiSIICA
I]
50 Diseñar el esquema de la prueba:
1,79
F
6o Calcular el estadíst¡co:
F=
125,562
/
176,78?
=
L,16
70 Tomar la decis¡ón acorde con los resultados de la pruebar
es menor que el punto crít¡co [F(0,05, 24, 40) = 1,791, por lo tanto al no estar este valor en la región de rechazo, se acepta la H¡pótesis Nula (Ho); es dec¡r, que las desv¡ac¡ones estándares son iguales. F
= L,!6,
Resolver los sigu¡entes ejercic¡os propuestos sobre prueba de hipótesis para el anál¡s¡s de dos varianzas poblac¡onales: 1) Al 95olo de confianza probar la poblac¡ón "A" de 25 datos con varianza de 198, no es ¡gual a la poblac¡ón "8" de 28 datos con var¡anza de 85. Resp: 2,33, se rechaza
Ho.
2) Al 90o/o de confianza probar la población "A" de 31 datos con desv¡ación estándar de 45, no es ¡gual a la población "B" de 16 datos con desviación estándar de 112. Resp: 6,19, se rechaza
Ho.
3) Al 99% de confianza probar la poblac¡ón "A" de 16 datos con varianza de 182, no es igual a la población "B" de 21 datos con var¡anza de 225 Resp: 1,24, se acepta Ho. 4) Al 90o/o de confianza probar la población "A" de 121 datos con desv¡ac¡ón estándar de 9836, no es igual a la población "B" de 61 datos con desv¡ac¡ón estándar de 4518 . Respi 4,74, se rechaza Ho. 5) Al 95olo de confianza probar la población "A" de 11 datos con var¡anza de 749, no es lgual a la población "B" de ll datos con varianza de 418. Resp: 1,79, se acepta Ho.
ti80§
WALTER CÉSPEDES RAMíREZ
4.3.1.2 Anólisis de dos vorionzos muestroles Es cuando se comparan las varianzas de dos muestras, y el contraste o prueba de hipótesis determina si ambas muestras tienen la misma variabilidad o si pertenecen a la misma población.
f=
s .S;
Ejercicios resueltos 1) Al 99olo de confianza probar la muestra "A" de 13 datos con varianza de 123,68, no es igual a la muestra "B" de 16 datos con varianza de 36,12.
Solución: 10 Formulación de las Hipótesis: H0 : No hay diferencia entre las varianzas Si hay diferencia entre las varianzas.
H1
20 Determinar el tipo de ensayo: Este tipo de ensayos siempre es unilateral derecha. 30 Asumir la significación de !a prueba:
F(cr,N,D) F
cr=0,01;
N=13-l
=72
D=16-1=15
(0,01, 72, t5) = 3,67 (punto crítico)
40 Definir el estadístico de !a distribución muestra! correspondiente:
¡=
'S,
^l J,
50 Diseñar el esquema de la prueba:
60 Calcular el estadístico:
F- t23,68/36,t2=3,42 il8lr
ESTADÍSTICA II
70 Tomar la decisión acorde con los resultados de la prueba: F = 3,42, es menor que el punto crítico IF(0,01, 12, 15) = 3,671, por lo tanto al no estar este valor en la reg¡ón de rechazo, se acepta la Hipótesis Nula (Ho); es dec¡r,
que las varianzas pueden pertenecer a la misma población o no son d¡ferentes.
2) Al 95o/o de confianza probar las varianzas de las sigu¡entes muestras:
Muestra A Muestra B
4
8
B
11
16
16
19
22
22
74
15
18
22
22
25
28
30
33
Solución: 10 Formulación de las Hipótes¡s:
Ho
:
No hay diferencia entre las Var¡anzas
H1
:
5¡ hay diferencia entre las Varianzas.
20 Determinar el t¡po de ensayo: Este t¡po de ensayos s¡empre es unilateral derecha 30 Asum¡r la s¡gn¡ficación de la prueba:
F(o,N,D) o=0,05; N=9-1=8 F (0,05, 8,
D=9-1=8
8) = 3,aa (punto crítico)
40 Definir el estadíst¡co de la d¡stribución muestral correspondiente:
§
si
50 D¡señar el esquema de la prueba:
3,44
60 Calcular el estadíst¡co:
X = (4 + 8 + I + 11 + 16 + 16 + 79 + 22 + 22) / 9 = 126 / 9 = 74 S, = (+14),+(8-14),+(8-L4),+(71-L4y+ (16-14),+(16-14),+(79-74y+ (22-74), +(22-74),y9 52=342/9=38
¡
82¡
WALTER CESPEDES RAMíREZ
X = (14 + 15 + 18 + 22 + 22 + 25 + 28 + 30 + 33) / 9 = 207 I 9 = 23 sP
= [(1+23]+(1s-23)'+(7*23Y+(22-23)'+(22-23)'+(25-23y+(28-23)'+(30-23)'+(33-23yy9
S'7= 350/9 = 38,89 F = 38,89 I 38 = l,O2 (la
§,
por ser mayor que la S;, va como numerador)
70 Tomar la decisión acorde con los resultados de la prueba: F = 7,02, es menor que el punto crít¡co [F(0,05, 8, 8) = 3,aa1, por lo tanto ai no estar este valor en la reg¡ón de rechazo, se acepta la Hipótesis Nula (Ho); es dec¡[ que las var¡anzas pueden pertenecer a la m¡sma población o no son d¡ferentes.
Resolver los siguientes ejerc¡c¡os propuestos sobre prueba de hipótes¡s para el análisis de dos varianzas muestrales. 1) Al 95olo de confianza probar la muestra "A" de 21 datos con var¡anza de 128, no es ¡gual a la muestra "B" de 16 datos con varianza de 382.
Resp:2,98, se rechaza
Ho.
2) Al99o/o de confianza probar las desviaciones estándares de las sigu¡entes muestras: Muestra A M uestra B
4
B
B
11
16
76
74
15
18
22
22
25
19
Resp: 1,01, se acepta
22
22
30
33
Ho.
3) Al 95olo de confianza probar la muestra "A" de 11 datos con varianza de 426, no es igual a la muestra "B" de 16 datos con var¡anza de 145. Resp: 2,94, se rechaza Ho. 4) Al 9Oo/o de confianza probar la muestra "A" de 31 datos con var¡anza de 1028, no es igual a la muestra "B" de 13 datos con varianza de 1382. Resp: 1,34, se acepta Ho. 5) Al 95olo de confianza probar la muestra "A" de 10 datos con desv¡ac¡ón estándar de 924, no es ¡gual a la muestra "B" de 10 datos con desv¡ac¡ón estándar de 1256 Resp: 1,85, se rechaza Ho. 4.3.1 .3 Anólisis de uno vorionzo muestrol y otro poblocionol Es cuando se comparan una varianza muestral contra otra varianza poblac¡onal, y el contraste o prueba de h¡pótesis que determina si la muestra pertenece a la población de referenc¡a, puede ser de t¡po b¡lateral o un¡lateral.
(r - l)S']
o' l83t
ESTADíSTICA II
Ejercicios resueltos 1) Una compañía que envasa alimentos dice que sus productos tienen una varianza de llenado de 14,5 gr. Al extraer una muestra de de 10 artículos, se encontró una varianza de 76,44. Probar al 97.5o/o de confianza que la varianza ha aumentado.
Solución: 1o Formulación de las Hipótesis:
Ho
i
02 =\4,5 o2 > 14,5
H1
20 Determinar el tipo de ensayo: Observando la hipótesis alternativa, la prueba será unilateral derecha. 30 Asumir la significación de la prueba: Para cr
= 0,025; el lado derecho de 72 es 1 - o(1
x'o,rr,
= 19,0
-
0,025 = 0,975)
(7 = 10 - 1 = 9 grados de libertad)
40 Definir el estadístico de la distribución muestral correspondiente: (n - l)s'
" ,-=
o,
50 Diseñar el esquema de la Prueba:
2
z10,975 o,gl5
=
19,0
60 Calcular el estadístico: 12 =(to
-t)
rc,qq
= !0,2
14,5
70 Tomar la decisión acorde con los resultados de Ia prueba: x' = 70,2, es menor que el punto crítico (z'o,nr, = 19,0), por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho); es decir, que la varianza no ha aumentado.
2) Una compañía que produce alambres galvanizados asegura que la desviación estándar a la resistencia a la rotura es de 5240 lb, al tomar una muestra de 12 alambres &t84!
WALTER CÉSPEDES RAMíREZ
se encontró una desv¡ac¡ón estándar de 4105 lb. Probar al 90o/o de confianza que la res¡stencia a la rotura es menoT.
Solución¡ 1o Formulación de las H¡pótes¡s: o = 5 2401b Ho:
H1
o<
:
5 24olb.
20 Determinar el t¡po de ensayo: observando la hipótesis alternat¡va, la prueba será unilateral ¡zquierda. 30 Asum¡r la s¡gn¡ñcación de la prueba: Para cr = 0,10
x2o.,o
= 5,58
(y = 72
-
1
=
11 grados de libertad)
40 Defin¡r el estadístico de la distribución muestral correspond¡ente: X,, =
, ,. ñ) (r-llJ o2
50 Diseñar el esquema de la prueba:
72
o,o5
=
s,s8
60 Calcular el estadíst¡co:
,z
=(12
- l)
41052
= 6,75
5240'.
70 Tomar la decisión acorde con los resultados de la pruebal x2 = 6,75, es mayor que el punto crítico (f'zo..o = 5,58), por lo tanto al no estar este valor en la región de rechazo, se acepta la H¡pótes¡s ruula (Ho)i es decir, que la res¡stencia a la rotura no es menor'
r
85'
E
STA
D
IST]CA
II
Resolver los s¡guientes ejerc¡cios propuestos sobre prueba de Hipótesis para el Análisis de una varianza Muestral y otra Poblacional.
1) Las bomb¡llas eléctricas de una compañía tienen una desviación estándar de 1640 horas de durac¡ón, al tomar una muestra de 14 bombillas se encontró una desviación estándar de 1574horas. Probar al 97,5o/o de confianza que la desviación estándar ha disminuido. Resp: 11,97, se acepta
Ho.
2) Una compañía que produce beb¡das gaseosas afirma que la var¡anza de sus ventas mensuales alcanza los 148 254 soles, al tomar una muestra de un año se detectó una var¡anza mensual de 168 221 soles. Probar al 90o/o de confianza que no es verdad lo que afirma la compañía. Resp: 12,48, se acepta Ho.
3) Una compañía que produce bolsas plásticas asegura que la desv¡ación estándar a la resistenc¡a a la rotura es de 651b, al tomar una muestra de 22 bolsas se encontró una desviación estándar de 401b. Probar al 95olo de confianza que la desviación estándar es menor. Resp: 7,95, se rechaza
Ho.
4) Una refinería afirma que la var¡anza de kilometrajes de recorrido de un nuevo combust¡ble alcanza los 1857 kilómetros, al tomar una muestra para de 1B vehículos se encontró una var¡anza de 2570 kilómetros. Probar al 99yo de confianza que es verdad lo que afirma la refinería. Resp: 23,53, se acepta Ho. 5) Una empresa postal real¡za sus entregas con una varianza de 582 horas. Al tomar una muestra de 15 entregas, la varianza fue de 756 horas. Probar al 95olo de confianza que es verdad lo que afirma la empresa postal. Resp: 18,19, se acepta Ho.
4.3,2 Análisis de la varianza a doble
vía
Este anál¡s¡s se conoce como cuadrado lat¡no y permite comparar dentro de una muestra, la variab¡lidad existente, entre cada proced¡m¡ento o métodos inclu¡dos en la muestra que se encuentran dentro de cada columna. En la prueba de hipótesis o contraste de h¡pótesis para el análisis de la varianza a doble vía, se ut¡l¡za el estadístico de F de Fisher y el ensayo s¡empre es unilateral derecha como son todos los ensayos del modelo Fisher.
8ó
WALTER CÉSPEDES RAMíR,EZ
El estadístico a utilizar es el siguiente:
F
Varianza eltrg
-
!!!
IuIglta!
Varianza dentro de lqs columnas
Varianza entre tas Medias
-
Ln tx
-il'
k-l
Varianza dentro de las columnas
= L(x¡-i)'+26¡-x.)'+...... nt-k
El número de sumatorias de esta varianza, depende de k)
Donde:
nt = número total de datos. n = tamaño de la muestra. Xi= variable (representa cada uno de los datos). k = número de columnas. X = media ar¡tmética de la muestra. Í = media aritmética del total de datos (gran media).
Ejercicios resueltos 1) Una cadena de tienda seleccionó 4 de sus tiendas para comparar el número de quejas anuales de sus clientes, probar la hipótesis al 95o/o de confianza que hay diferencia entre las tiendas. A cont¡nuación se dan los datos:
1: 2: Tienda3: Tienda 4:
Tienda Tienda
74, 78, 73, 73, 72 84,77,79, 8L,79
83,85,86,87,89 70, 68,7L,74,72
Solución: 10 Formulación de las HiPótesis: Ho : No hay diferencia entre las tiendas con relación a las quejas
H1
: Si hay diferencia entre las tiendas con relación a las quejas.
20 Determinar el tipo de ensayo: Los ensayos de Fisher siempre son unilateral derecha. 30 Asumir !a significación de la prueba:
c¿=0,05; N:(k-1) F (cr, N,
D)
F
(0,05,
=(4-1)=3;
3, 16) =
3,24
§r87§
p:(nt-k) = (2O-q)=tO
ESTADíSTICA II
40 Definir el estadístico de la distribución muestral correspondiente:
-
Varianza enlre las Medias Varianza dentro de las columnas
50 Diseñar el esquema de la prueba:
60 Calcular el estadístico: Varianza dentro de las columnas
Medias muestrales
TIENDAS
z
X
(x,-X)'
T.1
T,2
T.3
T.4
T.1
74
B4
83
70
0
16
78
77
85
68
16
73
79
86
7t
73
81
87
72
79
B9
37fJ 400
74
80
Varianza entre las medias
T.4
TIENDAS
9
1
T.1
70,3t25
9
1
9
T.2
25,3125
1
1
0
0
T.3
340,3725
74
1
1
1
9
T.4
227,8725
72
4
1
9
1
z
663,7500
22
2A
20
20
430 355
T.2 T.3
(X - rt'¡'
90
7t
86
X = (370+400+430+355) /(5x4) Varianza entre las Medias Varianza dentro de las
F =221,25
n
/
5,625
= 663,75 I G
columnas
=
- t)
1555/ 20
88t
= 77,75
= 22L,25
= 90 / (20 - 4) =
39,33
il
=
5,625
WALTER CÉSPEDES RAMíREZ
70 Tomar Ia decisión acorde con los resultados de !a prueba: F = 39,33, es mayor que el punto crítico F(0,05 3 16) = 3,24; por lo tanto al estar este valor en la región de rechazo, se rechaza la Hipótesis Nula (Ho); es decir, si hay diferencia entre las tiendas con relación a las quejas. 2) Probar la hipótesis al95o/o de confianza que hay diferencia entre 4 métodos de enseñanza en la capacitación de 32 maestros distribuidos en grupos del mismo tamaño, los que fueron evaluados sobre 100 puntos y obtuvieron los siguientes calificativos:
Método Método Método Método
1: 2: 3: 4:
75, 63, 65,72, 82, 73, 72, 66 64, 57,79,7L, 69, 64,72, 68 73,75,73,77,69, 68, 70,7L 70, 68, 71, 74, 72, 72, 71, 70
Solución: 1o Formulación de las Hipótesis:
Ho:
No hay diferencia entre los métodos de enseñanza
H1 20 Determinar el
:
Si
hay diferencia entre los métodos de enseñanza.
tipo de ensayo:
Los ensayos de Fisher siempre son unilateral derecha
30 Asumir la significación de la prueba:
o=0,05; F (a, N,
D)
N F
P=(nt-k) = (32-+¡=29
=(k-1) =(4-t¡=3'
(0,05, 3, 28) =
2,95
40 Definir el estadístico de la distribución muestral correspondiente:
V=
Varianza entre las Medias
Varianza dentro de las columnqs
50 Diseñar el esquema de la prueba:
3,24
il
89t
ESTADíSTICA II
60 Calcular el estadístico: Medias
Muestrates
TIENDAS
:
-t
(x,
),
TIENDAS
n(X-fr),
T.1
T.2
T.3
T.4
T.1
T.2
75
64
73
70
16
16
1
1
T.1
2
63
57
75
6B
64
127
9
9
50
65
79
73
7t
36
t27
1
U
72
71.
77
74
1
9
25
9
T.2 T.3 T.4
82
69
69
72
t27
1
9
1
73
64
68
72
4
16
16
1
72
72
70
77
1
16
4
0
66
68
77
70
25
0
1
1
66
22
544 576 s68
77
f =
68
72
264 300
T.4
ras Medias
T.3
s68
X
o" ,"J:;i::.iltentro Varianza entre
1B
2
72
=
656
77
lsos +544+576 + 568)
Varianza entre las Medias = 72 Varianza dentro de las
/@x4 = /
(4
columnas
- t¡
2256
= 32 =
70,5
= 24
= 656 / (32 - 4) = 23,43
F=24/23,43=7,02 70 Tomar la decisión acorde con los resultados de la prueba: F = !,o2, es menor que el punto crítico F(0,05 3 28) = 2,95i por lo tanto al no estar este valor en la región de rechazo, se acepta la Hipótesis Nula (Ho); es decir, no hay diferencia entre los métodos de enseñanza.
lr90¡
WALTE R CÉSPEDES RAM fRFZ
Resolver los s¡guientes ejerc¡c¡os propuestos sobre prueba de H¡pótesis para el Anális¡s de la Varianza a doble vía:
1)
Probar la hipótesis al 90olo de confianza que hay diferenc¡a entre 3 métodos de con-
trol para ev¡tar robos en un supermercado. Durante 4 días se probaron los métodos y se evitaron los siguientes robos:
1: 7, 5, 3, 7 2: 6, 7, 9, 6 Método3: 7,5,3,5 ¡4étodo ¡4étodo
2)
Resp: F = 2,47i se acepta la
Ho.
Durante los meses de Enero, Febrero y Marzo, se ¡nvest¡ga el número de contratos que realizaron 5 vendedores. Probar la h¡pótes¡s al 95olo de confianza que hay d¡ferencia según los meses de ventas, si el número de contratos que realizaron fueron:
Enero: Febrero:
5, 6, 3, 8, 8 6, 8, 9, 9, I Marzo'. 7, 3, 3, 2, 1 3)
Ho.
Probar la hipótesis al 90olo de confianza que hay d¡ferenc¡a respecto a la durac¡ón en horas de uso de 4 marcas de baterías. S¡ se muestrearon 4 baterías de cada marca y las durac¡ones fueron como sigue:
MarcaA: Marca B: Marca C: Marca D: 4)
Resp: F = 22,0; se rechaza la
17, t5, 76, 17, 75, 15, 15, 17,
74, tO 74, t7 72, l0 79, t7
Resp: F = 3,78; se rechaza la
Ho.
Durante los meses de: Abril, lvlayo y Junio, se ¡nvestiga el número de trabajadores que llegaron tarde a laborar en una compañía; s¡ se muestrearon 5 dÍas, probar la h¡pótesis al 9590 de confianza que hay diferencia entre los meses, respecto al número tardanzas que se dan a continuación:
Abril: ¡4ayo: lun¡o:
f,4,3, O,2
6, 7, 7, 8, 7 7, 2, 3, 2, 7
Resp:
F
= 72,35; se
rechaza la
Ho.
5) Probar la hipótesis al 95olo de confianza que hay diferenc¡a entre los tipos de promoción
de una d¡stribuidora. Si durante 3 meses se apl¡caron 4 Promoc¡ones distintas, respecto at número de cl¡entes nuevos conseguidos que se dan a cont¡nuac¡ón: Promoción Promoc¡ón Promoción Promoción
R: S: fi U:
12,75,7A 10, ll, 12 76, 25, 37 25, t5,20
Resp: F = 4,22) se rechaza la
t9§
Ho.
ESTAD ISTICA II
AUTOEUAI.UACIflN NO 4
1) De una población de 5000 se extrajo una muestra de 49 fumadores, se encontró un consumo promedio de 498 soles en cigarros. Si se afirma que el consumo promed¡o es de 505 soles con una desviación estándar de 30,80 soles. Hallar el estadístico. A)
-1,48
B)
-1,60
C)
-2,t6
-2,08
D)
E) -7,22
2) El promedio de ventas de una d¡stribu¡dora es 12500 diar¡os, con desviación estándar de 1250 soles, s¡ se toma una muestra de 115 ventas extraídas de una poblac¡ón de 80000 y se encontró un promed¡o de ventas de 12343. Hallar el estadístico.
A)
-1,96
B)
-7,44
C)
-2,0s
-2,44
D)
E) -1,3s
3) S¡ en una muestra de 22 secretarias, se encontró que el 40Vo no estaban conforme con su trabajo. S¡ la empresa dice que el 35olo de las secretar¡as no están conformes con su trabajo, hallar el estadístico.
A)
0,49
B)
1,06
C)
0,9s
D)
0,72
E) t,22
4) Al investigar una muestTa de 235 escolares, se encontró que el 15olo no tenía deseos de cont¡nuar sus estudios escolares. S¡ se afirma que el 20olo de los escolares no quieren estudiar, hallar el estadíst¡co. A)
5)
-7,27
B)
-2,01
-7,92
D)
-0,08
E) -1,37
Hallar el estadístico de la diferencia de las dos muestras. M
A)
6)
C)
2,42
B)
uestra
Promed¡o 18
1809 C)
Tamaño
627 735
20
I
II
1,82
Varia nza
2,67
34
40
D) 3,16
E) 1,40
Dos compañías comerc¡alizan sus productos en un m¡smo mercado, si de cada compañía se toma una muestra de 20 artículos y se observa que cubren el 48o/o y el 650/o del mercado; hallar el estadístico de la diferencia.
A)
1,48
B)
1,61
C)
1,10
t
92§
D)
2,08
E) 7,22
WALTE R CÉSPEDES RAT-JíREZ
7) Hallar el estadístico x'] de la s¡guiente muestra:
A)
Nuevo Producto Si compra No compra
Hombre
Mujer
Tota
28
13
4t
25
74
39
total
53
27
80
0,348
B)
8) Hallar el estadíst¡co
0,161 f,
C)
0,451
D)
I
0,224
E) 0,122
de la s¡guiente muestra:
Método A
Método B
Método
C
Total
Mejora su rendimiento No mejora su rend¡miento
16
82
30
t28
24
40
8
72
total
40
722
A)
15,6
B)
t2,9
C)
35,6
D)
19,4
200 E) 10,5
9) Hallar el estadístico F¡sher de: la población "A" compuesta de 121 datos con desviación estándar de 9836, y la poblac¡ón "8" de 61 datos con desviación estándar de 4518.
A)
3,47
B)
4,74
2,ss
C)
D)
4,08
E) 2,27
10) Hallar el estadístico Fisher de dos poblaciones; la poblac¡ón "A" de 11 datos con varianza de 749, y la población "B" de 11 datos con varianza de 418. A)
2,77
B)
2,72
1,16
C)
D)
7,79
E) 2,Ls
11) Hallar el estadístico F¡sher de dos muestras; la muestra "A" de 11 datos con var¡anza de 426, no es igual a la muestra "8" de 16 datos con var¡anza de 145. A)
2,94
B)
2,67
C)
2,3s
D)
2,27
E) 3,28
12) Hallar el estadístico Fisher de dos muestras; la muestra "A" de 31 datos con var¡anza de 1028, no es igual a la muestra "B" de 13 datos con var¡anza de 1382.
A)
1,8s
B)
t,67
C)
t,46
D)
2,O4
E) 7,34
13) Una compañía que produce cervezas afirma que la var¡anza de sus ventas mensuales alcanza los 148 254 soles, al tomar una muestra de un año se detectó una var¡anza mensual de 168 221 soles. Hallar el estadístico /,.
A)
12,48
B)
14,5
C)
tO,7 Ér93,
D)
8,19
E) s,1B
ESTADíSTICA II
14) Una compañía que produce fibras sintéticas asegura que la desviación estándar a la resistencia a la rotura es de 651b, al tomar una muestra de 22 fibras se encontró una desviación estándar de 401b. Hallar el estadístico ¡2' A)
4,40
B) 10,1
7,95
c)
E) 4,18
D) 5,02
15) Hallar el estadístico Fisher de 4 marcas diferentes de pila, si se muestrean 5 pilas de cada marca y la duración en horas fueron: Marca Marca
A)
5,24
R1: R3:
Marca Marca
3, 5, 6, 8, 8
6,7,7,7,8
B) 2,59
c)
3,56
D)
R2: 6,8,8,9,9 R4: 6, 8, 7, 7, 7
1,90
E) 1,08
Respuestas de control l.
B, 2.
E, 3, A, 4. C, 5. B, 6, C,7.D, 8, A, 9. B, 10, D, I l. A, 12. E,
at94z
13.
A,
14.
C,
15. D
WALTER CÉSPEDES RAMfREZ
EXPI.ORAEIIIIU AN UNE
http ://es.wi ki pedia. orglwiki/Contrafe_de_hip7oC3ol"B3tesis http://www.fca. unl.edu.arlnferEst/lelHipot I .htm http ://www.fca. unl.edu. arl nferEst/IestH ipot2. htm http:/lwww.e-biometria.com/conceptos_basicos/conceptos_basicos_sobre_pe.htm
ELIISARIfI
I
aceptar la hipótesis.
Considera que lo expresado en la hipótesis nula
es verdad, por conslguiente lo que se quiere probar como hipótesis alternativa, es negado. Se utiliza exclusivamente en prueba de hipótesis de la teoría de la decisión estadística. cola.
Lado extremo de una función de densidad, que se denomina así/ por ser más estrecha.
Se utiliza para determinar el tipo de prueba o ensayo. hipótesis.
Una proposición cuya veracidad se asume solo provisionalmente, como solución tentativa para un problema dado con algún propósito para el investigador.
Se utiliza en la teoría de la decisión estadística en las pruebas de hipótesis. nivel de significación.
Margen de seguridad con probabilidad de que
el intervalo para la estimación estadística
un
de
parámetro determinado, contiene dicho
parámetro. Se utiliza para la estimación de parámetros y en ocasiones en pruebas de hipótesis. rechazar la hipótesis.
Considera que lo expresado en la hipótesis nula es falso, por consiguiente lo que se quiere probar como hipótesis alternativa, es válido. Se utiliza exclusivamente en prueba de hipótesis de la teoría de la decisión estadística.
il
95t
q u int
a
UNIDAD Regresión y correlación
§umario Diagrama de dispersión. Regresión: recta por mínimos cuadrados, parábola por mínimos cuadrados. Conelación: coeficiente de d*erminación, coeficiente de correlación, conelación de Spearman. [omponentes de toda serie cronológica: variaciones cÍclicas, variaciones estacionales, variaciones irregulares, tendencia. Análisis de la serie cronológica: promedio móvil, cálculo de la tendencia, cálculo del índice efacional, proyección de la
información en el tiempo.
oBJErvo(s) GENERAL:
.
Al término de esta unidad el alumno estará en capacidad de realizar lnferencias estadílicas utilizando funciones matemáticas que le servirá de regresión, para luego comprobar su eficiencia a través de la correlación, También estará en capacidad de proyeciar
de manera más real una información en el tiempo, mediante el análisis de Series Cronológicas incluyendo la infuencia estacional que es muy fuerte a corto plazo, ESPECíFICOS:
Conocer mediante esquemas el comPodamiento de los datos en su conjunto.
Determinar en qué medida es posible asociar una variable con otra a través de funciones matemáticas. lYedir el grado de relación entre las variables que se asocian y determinar cual es la func¡ón matemática de meior aluste. Saber utilizar con la correlación de Spearman la relación cualitativa
o no paramétricas de dos variables. Conocer cuáles son los componentes de toda variable en eltiempo y cómo determinar la influencia de los mismos en la proyección de la información relacionada con fracciones de años.
Hacer proyecciones para fracciones de años (trimelres, meses, semanas, etc.) con la influencia estacional que a corto plazo es la muy fuerte.
& 9B¡
Lección
5.1 lliagrama de dispersión La representac¡ón gráfica más útil para describir el comportamiento conjunto de dos variables es el d¡agrama de dispersión o nube de puntos, donde cada caso aparece representado como un punto en el plano definido por la variable "X", que es generalmente independ¡ente y por la var¡able "Y" que es depend¡ente de X.
Cuando el diagrama recoge un gran número de observaciones, algunos puntos representan a más de un caso ya que estos se superponen. La representac¡ón gráfica mediante el Diagrama de Dispersión, permite comprobar la existencia de relación lineal entre las dos variables; y la med¡da analítica adecuada, la da el coeficiente de correlación lineal.
Ejemplo 1: Si en la ordenada o eje "Y", se grañca la var¡able peso y en la absc¡sa o
eje "X",
se grafica la variable Est (Estatura), se obtiene:
¡ t99¡
ESTADíSTICA II
r10 o
f00 f!
s
§
G§
oü vañ ^ae
80
m 60
o a o E o
f0
ot"
o
ooBHmo - oBoo "olo ' Bo o orü a_ § oo o§ o^ o" rÉ --o 'ok og ¡sofl^É
pu§.--H" oEElg '"o -f¡
§o §
o d,
r¡J ü..
30l ?m
1¡10
E§T
Como se observa en el gráfico ambas variables presentan una relación lineal positiva; es decir, a medida que aumenta el valor de la variable Est aumenta también el valor de
la variable Peso.
Ejemplo 2: Si en la ordenada o eje "Y", se grafica la variable Tiempo de Servicios y en la abscisa o eje "X', se grafica la variable Edad, se obtiene:
DIAGRAMA DE ESPARCIMIENTO DE LA EDAD Y TIEMPO DE SERVICIOS DE 15 TRABAJADORES 30
o
-o
tÉ. t¡l tt,
25 20
aa
u15 o
810 l=¡J
tr
5
o
t
aa -a
a
0
§200r
-a
a
wALTER cÉspEoes
RR¡,1
íRrz
Se aprecia que la nube de puntos resultante tiene una forma alargada, con una relación positiva en donde es posible ajustar o representar por una línea recta. Los Diagramas de Dispersión además de describirelcomportamiento de la información; con la nube de datos, usted puede tener una idea sobre cual será la función matemática que describa mejor dicho comportamiento.
Figura: Diferentes nubes de puntos y modelos de regresión para ellas. tr¡fodelo Lins.al
l¡fodelo no Lineal
Mal ajurte
Buen ajuste
t
Cu¡¡dn xcrtrÉ,
ytrÉffi
Variahle¡ no rl aoo nadas Ninguna curva de ngesron
esadEcuad¿ a
)a
I a
Cuando
x.
a o
crcce,'
Cuando interviene una determinada función matemática sobre una dispersión de datos, el diagrama se transforma en algún modelo de Regresión.
120
ll
Lección
7
§.2 Regresiún Las técnicas de regresión es un proceso que permite hacer predicciones sobre los valores de cierta variable Y (dependiente), a partir de los de otra X (independiente), entre las que se intuye que existe una relación. Para ilustrar mejor al lector por ejemplo si se compara la estatura media en centímetros en el eje X y la estatura media en metros en el eje Y al obseruar a un grupo de personas, no es necesario hacer grandes esfuezos para saber que la relación que hay entre ambas es:
Y=X/100 En cambio esta relación sencilla puede ser más compleja, si por ejemplo se comparan
estas mismas personas colocando en el eje X a la estatura media en centímetros y en el eje Y el peso en kilogramos. Esta relación requiere de un análisis y solo después del mismo se puede concluir:
Y=X-110+error La razón es que no es cierto que conocida la altura de un individuo, no puede determinar su peso exacto, si dos personas que miden 170 cm pueden tener pesos de 60 y 65 kilos. Sin embargo, alguna relación entre ellas debe existir, pues parece mucho más §203 §
E
5TA D íST
ICA
II
probable que un ¡nd¡v¡duo de 200 cm pese más que otro que m¡da 120 cm. Es más, de acuerdo a lo mencionado, la conclusión Y = X - 110 + error, parece acertada. A la relación entre dos o más variable a partir de una serie de datos, se le denom¡na Regresión. Cuando la relac¡ón esta dada por:
i
= t'1x.¡
Funcional y el criterio para construir i, es que la diferenc¡a sea pequeña; es dec¡r, que el error de estimac¡ón sea pequeño.
Se le denom¡na Relac¡ón
entre
y ei
i=r1*.¡,
Y-i=e¡ror
La Relación Funcional puede tamb¡én ser a la inversa, es dec¡r que X están en función de Y; pero este tipo de relación no se verá en este I4anual Auto Instruct¡vo.
Cuando se util¡zan solamente dos variables, la Regresión es denominada SIMPLE; en cambio, cuando se utilizan más de dos variables, la Regres¡ón es MULTIPLE.
5.2,1 Ajuste en una función de regresión simple Sign¡fica buscar o definir la función que exprese con mayor precisión la relación entre var¡ables. Gráficamente será aquella func¡ón que mejor se adecué a la nube de puntos. En este sentido, es recomendable como primer paso construir el "diagrama o nube de puntos", luego analizar su forma y dec¡dir el tipo de función matemática para la línea de regres¡ón.
Analít¡camente, la relación i = r1x¡. permite obtener valores est¡mados i a partir de los valores reales de X, entonces el problema del ajuste de una func¡ón es que la diferenc¡a o sesgo (e,) entre los valores reales de y y los estimados i sea mínimo, para cada valor se tendría: e = Y - y. Entonces se trata de un problema de m¡n¡mizac¡ón, el mismo que se resuelve con el Método de los Mínimos Cuadrados, El ajuste de funciones de regresión simple, se pueden utilizar d¡versas funciones matemát¡cas conoc¡das, tales como:
. . . . . . .
Y=a+bX
La LÍnea Recta La Pará bola
i=a+bX+cX2
La Curva Potencia La Curva Exponenc¡al I
La Hipérbola
Eq
u¡látera
La Curva Logíst¡ca La Curva Gompertz
i=bx' i= ab, i = a/)(
1/?=a+bcx ?=abo
Cada una de estas funciones tiene una forma part¡cular para un conjunto determ¡nado de valores (X, Y), y defin¡do por el valor de ¡os parámetros o coeficientes de la respect¡_ va ecuación. Por una nube de puntos pueden pesar uná infinidad de líneas o funciones, de esta familia habrá una que es la función que mejor se ajusta a la nube de puntos.
WALTE R CÉSPEDES RA I"1íR E Z
La operación para determ¡nar la función de regresión óptima, se conoce como "Ajuste de una función de regresión". En este Manual se tratará solamente de Regresión s¡mple para la recta y para la parábola, que son las más usadas por tener mayor aplica-
c¡ón estadística en los negoc¡os. El problema de ajuste de una función de regresión a un conjunto de n valores (X, Y), comprende tres pasos: 10 Graficar el diagrama de esparc¡m¡ento o una nube de puntos (X, Y).
20 Deñnir la forma de la func¡ón de regresión (recta, parábola, exponenc¡al, etc.).
30 Determinar el valor numér¡co de los parámetros de la función eleg¡da. Los parámetros de la func¡ón de regresión se obtienen a partir de las Ecuac¡ones Normales obtenidas por el Método de los Mín¡mos Cuadrados. 5.2.2 El nétodo de Los minimos cuadrados Establece que la mejor recta o curva posible es aquella que m¡nimiza la suma de los cuadrados de las desviaciones entre los puntos dados Y¡ y los correspond¡entes a d¡cha curva i. E e,2
=¡
(Y,
-i¡u -
Error Mínimo
Donde i = f(X), es la ecuación eleg¡da para la función de regresión; s¡n embargo, no es sufic¡ente con elegir la func¡ón de regresión, por que en la nube de datos se pueden trazar en diferentes formas la misma función con el mismo error de cálculo. Por esta razón se busca a aquel trazo de la función que al ser elevado el error al cuadrado, dé el mínimo error. Con el método de Mínimos cuadrados se logra calcular los parámetros de Ia ecuación eleg¡da (Recta, Parábola, etc.). Tamb¡én con los mismos parámetros, se pueden hallar los coefic¡entes de correlac¡ón respectivos.
5.2.3 Regresión lineal simple A la regres¡ón l¡neal se le conoce como Regresión de la Recta, la que se define de la sigu¡ente manera:
Y=a+b(x)+e A partir de esta deñnic¡ón; se puede estimar el valor de "Y", no considerando ei
error:
Y=a+b(x)
2C5
ESTADíSTICA II
En la ecuación, los parámetros son:
a = Origen (Es el valor de ?, cuando X = 0)
b = Pend¡ente (Es la variaclón constante posit¡va o negat¡va de ? , por cada valor que camb¡e
x)
Tales parámetros¡ como ya se ha menc¡onado en el ítem anter¡or, se calcularán ut¡l¡zando el método por Mínimos cuadrados, que se deñne basado en la ecuac¡ón de la recta, de la siguiente manera:
EY
=
a(n) + bEx
:XY=aEX+ b:x'z Para hallar los parámetros respectivos (a y b), basados en el método de cálculo por Mín¡mos Cuadrados, el alumno puede util¡zar cualquiera de las s¡gu¡entes soluc¡ones:
a) Solución por el¡m¡nac¡ón de uno de los parámetros para encontrar el otro: Para este caso util¡zan las ecuaciones simultaneas, en donde con un valor artificial negat¡vo se ¡guala el coeficiente de una de las ¡ncógn¡tas de la ecuación para el¡minarlo. Operación que se rep¡te hasta quedarse con una incógn¡ta, que es fác¡l de despejar en una ecuación.
b) Solución
a
través de matrices y determ¡nantes, que concluyen en:
a
,r2x2 ->-wz-x n»x2
->*2x
b
-2 2Y n»x - »xLY
= n»XY2
c) solución a través de las medias, que concluye en:
a = Y-b X
b=[(:xY- n x i)l(>x,- nx,)]
q2061
WALTER CÉSPEDES RAMf REZ
Ejercic¡os resueltos
1) Hallar la ecuac¡ón de la recta con las variables: (valor de ventas realizadas al mes en miles).
x (número de vendedores) e Y
La información que se t¡ene es la sigu¡ente:
Número de vendedores (X) Ventas en m¡les (Y)
4
2
6,4
72
10
8,s
76,4
9,3
18,6
15
16
20,2
25,2
soluc¡ón: Con el método por N4ín¡mos cuadrados, se primero se calculan las sumatorias correspond¡entes a la ecuación de la recta:
x
:
XY
Y
x2 4
2
6,4
72,8
4
8,5
34,O
1tt
9,3
46,5
25
10
16,4
!64,0
100
72
18,6
15
20,2
t44
16
25,2
403,2
225 256
64
1O4,6
LLA6,7
770
303,0
con estos datos para hallar los parámetros "a" y "b", el alumno puede escoqer cualquiera de las soluciones planteadas por el método por Mínimos cuadrados:
a) soluc¡ón por el¡minac¡ón:
10 Se reemplazan las sumator¡as halladas en las ecuac¡ones simultáneas deñnidas por el método Mín¡mos Cuadrados:
tY
=
a(n) + b:X
:XY=atX+
b EX2
= (7786,7 = 104,6
Entonces:
7a + 64b) - 64 64a + 770b) 7
(1)
77ob
(2)
=
7a
17a6
=
64a +
(1)
2o Se elimina "a" multipl¡cando la ecuac¡ón
(
+ 64b
104,6
por
-
64 y la ecuación (2) por 7
- 6694,4 = \¿Su 8306,9
=
t672,5
=
b = 1612,5 / t294 =
L,25 t207
E
- 4096b (3) 448x+ s390b (4)
\
1294b
ESTADÍSTICA II
30 Hallado "b" se reemplaza este valor en la ecuación (1):
tO4,6
=
7a + 64
(1,25)
104,6
Entonces: a =24,6 /7 = 3,5 40 La ecuación de la recta
será: I
=
7a +
80
704,6
- 80 = 7a
= 3,5 + 1,25x
b) Soluc¡ón por determinantes: Aquí se reemplazan las sumatorias en las fórmulas s¡guientes halladas formando matr¡ces con las ecuaciones por mínimos cuadrados y resueltas por determ¡nantes:
a=
Zy»y2 ¡x2y,
_>r72.X -2a2y -
104,6(770') '7(7'70)
n>Xy - »X>Y nZX2 -»rZX
6
La ecuac¡ón de la recta
será:
b=
=
- 1186 ,7 (64) 4593,2 - 64(64) 1294,0 - 3,5
7(I 186,7)
- 6a(1oa,6)
1(170)-(4(64)
1612,5_
t294,o
=
L,Zs
? = 3,5 + 1,25X
c) Solución por promed¡os:
V = zx / n =
b=[(:XY-
n
64
y =zy/n=104,6/7=74,94
/ 7 = 9,t4
i v)l(>x,-
nX¿))
b=[(1186,7-(7x9,L4xt4,94)) / (770 -
b=
[(1186,7
a=i-bV
-
9ss,86)
=
lOTo - s84,7e)]
7a,94
La ecuac¡ón de la recta
(7 x9,!42))]
- 7,2s(9,t4) =
será: i
b = Í230,84
74,94 -77,43
/
=
1a5,22)
=
a,25
3,5
= 3,5 + 1,25x
El alumno puede ver que por cualquiera de los métodos de solución expuestos/ la respuesta es la misma; pues puede escoger el método que sea más fác¡l para usted o el que más le agrade.
2) Hallar la ecuación de la recta con las var¡ables: X (número de gastos por inversión) e Y (util¡dades anuales en m¡les).
La información que se t¡ene es la siqu¡ente:
Número de gastos por invers¡ón (X) Utilidades anuales en miles (Y)
5
11
4
5
3
2
31
40
30
34
25
20
WALTER CÉSPEDES RAMf REZ
Solución: Con el método por Mínimos cuadrados, se primero se calculan las sumatorias correspondientes a la ecuación de la recta:
x
XY
Y
x2
5
31
155
25
11
40
440
727
4
30
t20
16
5
34
770
25
3
25
75
9
2
20
40
4
30
180
1000
200
Para hallar los parámetros "a" y "b", se ha escogido la solución por determinantes.
a= !=
»Y>X2 ->XY>.X nZ.X2 ->X>,-X
¿ =180(200)-1000(30) _ 6000
uZXY
b=
6(200)
->X>Y
nZ-X'->x>-X
La ecuación de la recta
6(1000) 6(200)
será:
?
= 2O + 2X
1209a
-
30(30) 30(180)
300
600_Z .
-30(30) 300
=
2O
E
STAD
íSIICA
II
Resolver los s¡9u¡entes ejerc¡c¡os propuestos sobre Regres¡ón L¡neal SimPle: 1) Hallar la ecuación de la recta con las variables: X (número de desaprobados) e Y (número de matriculados). La informac¡ón que se tiene es la s¡gu¡ente: Número de desaprobados (X) Número de matriculados (Y)
4
6
6
5
7
10
_Lb
20
25
26
30
32
Resp:
i =
I
7
33
8,94 + 2,7f-:(
2) Hallar la ecuación de la recta con las variables: X (número de gastos por inversión) e Y (utilidades anuales en miles). La información que se t¡ene es la sigu¡ente: Número de gastos por invers¡ón (X)
2
5
48,5
Ut¡lidades anuales en m¡les (Y)
9s,2
Resp:
5
B
88,3
770,4
10 1
15,6
I = 43,33 + a,O4X
5,2.4 Regresión de la parábola Se conoce a la regresión de la parábola como Regresión Paraból¡ca, la que se define
de la siguiente manera:
Y=a+b(x)+c(X,)+e A partir de esta defin¡ción; se puede estimar el valor de "Y", no considerando el error:
?=a+b(x)+c(x':) En la ecuación, los parámetros son:
a = Or¡gen (Es el valor de ?, cuando X = 0)
b = Pendiente (Es la var¡ación constante posit¡va (hacia arrlba) o negativa (hacia abajo) de ?, por cada valor que cambie x) c = Curvatura (es el arco que determina la curva; y s¡ es positivo, la curva es cóncava.
s¡ es
negativo, la curva es convexa,
Tales parámetros, se calcularán util¡zando el método por Mín¡mos cuadrados, que se define basado en la ecuación de la parábola, de la siguiente manera:
:Y = a(n) + bfx + c>x2 EXY = a:X + bEX2 + cEX3 :X2Y=a:X2+ b:X3 + c:X4 20
WALTER CÉSPEDES RAMÍREZ
Para hallar los parámetros respect¡vos (a, b y c)), basados en el método de cálculo por Mín¡mos Cuadrados, el alumno puede encontrar la solución por el¡m¡nac¡ón de los parámetros en las ecuac¡ones s¡multaneas.
Ejercicios resueltos
x (número
1) Hallar la ecuación de la parábola con las variables: (valor de ventas realizadas al mes en miles).
de vendedores) e Y
La ¡nformac¡ón que se tiene es la sigu¡ente:
Número de vendedores (X)
4
2
Valor de ventas realizadas al mes en miles (Y)
6,4
5
10
72
15
16
o?
76,4
18,6
20,2
25,2
soluc¡ón: Con el método por Mín¡mos cuadrados, se primero se calculan las sumator¡as correspondientes a la ecuac¡ón de la recta, de la sigu¡ente manera:
x
XY
xrY
x3
2
6,4
12,8
4
B
16
25,6
4
8,5
34,O
t6
64
2s6
136,0
5
9,3
46,5
25
725
62s
232,5
10
t6,4
764,O
100
1000
10000
1640,0
72
18,6
223,2
t44
7728
207 36
2678,4
15
20,2
303,0
22s
3375
s062 5
4545,O
16
25,2
403,2
2s6
4096
65536
6457,2
64
LO4t6
rt86,7
770
10396
L47794 L5708,7
con estos datos para hallar los parámetros "a", "b" y "c", por el método por Mín¡mos Cuadrados, se reemplazan las sumator¡as respectiva en las fórmulas:
:Y =a(n)+b>X+c:X'1 :XY =aUX +bEX2+c:X3 :x,Y = aEX2+ bEX3+ c:Xa
L
104,6= 7a+ 64b+ 77Oc (7) L186,7 = 64a+ 77Ob+ 7O396c (2) 5708,7 = 770a + 10396b+ 147794c (3)
¡2t
ESTADfSTICA II
1o Se elim¡na "a" de las ecuaciones (1)
104,6 =7a + 64b + 770c (- 64) 7786,7 = 64a + 77Ob + 10396c (7)
y (2)
-
6694,4 = -448a - 4096b -49280c 8306,9 = 448a + 5390b + 72772c 76L2,5 = 1294b + 23492c (4)
20 Se elimina "a" de Ias ecuaciones (1) y (3)
to4,6 =7a + 64b
+
1186,7 = 64a + 770b
770c
(- 64) - 6694,4 =:<ea -4096b -49280c (7) 8306,9 = 448\+ 5390b + 72772c
+ 10396c
6t2,5
7294b + 23492c (4)
=
30 Se elimina "b" de las ecuaciones (4) y (5)
= L294b + 23492c (-3356) 4202,7 = 3356b + 63094c ( 7294) 7672,5
c = 26743,8
40
/
-5411550,0 = 543A293,8 =
-)x<o¿o - 78B3e1s2c
267 43,8 =
28O4484c
2AO44A4 = O,O095
Se reemplaza "c" en la ecuac¡ón (4)
7672,5 = 7294b + 23492 (0,0095) L294b = t612,5 - 223,774
b = 13a9,326 / 50 Se reemplaza
76t2,5 = 7294b + 223,774 L294b = 1389,326
L294 = l,O7 en la ecuación (1)
704,6 = 7a + 64(7,O7) + 770(0,0095) 7a = 704,6 - 68,48 - 7,315 = 28,80s
a=
28,805
/
104,6=7a+38,48+7,315
7 = 4,L15
La ecuación de la parábola
la:
4342664Q + 81643636c
será:
i
=
4,tt'
+ L,OZr +
O,OOgSX2
Resolver los sigu¡entes ejercic¡os propuestos sobre Regresión de la parábo-
1) Hallar la ecuación de la parábola con las variables: X (número de desaprobados) e Y (número de matr¡culados). La información que se tiene es la sigu¡ente:
Número de desa probados (X)
4
6
¡2t2§
6
5
7
10
I
7
WALTER CÉSPEDES RAMfREZ
Número de matriculados
= - L7 t29 + 1O,7L)( - O,57X2
2) Hallar la ecuación de la parábola con las variables: X (número de gastos por inversión) e Y (utilidades anuales en miles). La información que se tiene es la siguiente:
Número de gastos por inversión (X) Utilidades anuales en miles (Y)
2
5
5
8
10
48,5
95,2
88,3
770,4
115,6
Resp:
?
t2r3§
= 9,28 + 22,LSX- 1,16X2
Lecció
n
3
5.3 Correlación Es la relación existente entre las var¡ables que se investigan. Cuando se util¡zan so-
lamente dos var¡ables, la Correlac¡ón de Pearson es denominada SIN4PLE; en cambio, cuando se util¡zan más de dos var¡ables, la Correlac¡ón es MULTIPLE. El valor del índ¡ce de correlac¡ón varía en el ¡ntervalo
[-1, +1]:
r = 0, no ex¡ste relac¡ón entre las variables. Pero esto no necesariamente lmpl¡ca total entre las dos variables, es decir, que la variac¡ón de una de ellas independencia una puede influir en el valor que Pueda tomar la otra. 10 Si
1, existe una correlac¡ón pos¡tiva perfecta. El índ¡ce indica una dependencia total entre las dos variables denom¡nada relac¡ón directa; cuando una de ellas aumenta, la otra también lo hace en idént¡ca proporc¡ón. s¡ o < r < 1, existe una correlación 2o Si r
=
positiva.
si r = -1, existe una correlación negativa perfecta. El índice indica una dependenc¡a total entre las dos variables llamada relac¡ón inversa; cuando una de ellas aumenta, la otra disminuye en ¡déntica proporción. Si -1 < r < O, existe una correlac¡ón negativa' 30
;2 r 5i¡
ESTADISTICA II
El signo de la correlación depende del signo de la pendiente "b"; es decir, si la pendiente es positiva, la correlación es positiva; y si la pendiente es negativa, la correlación es
negativa. Suponiendo que se esta investigando dos variables mediante la ecuación de la recta, pero no se esta conforme con los resultados, entonces decide utilizar la función de la parábola. Para determinar cual de las dos funciones matemática se ajusta mejor a los datos que se investiga, se calcula el índice de correlación para ambas ecuaciones y el valor más cercano a 1, determina cual de las dos ecuaciones se ajusta mejor a los datos,
5,3,1 Esquema de una correlación de Pearson
z(-f¡z = :1y-?;z +:(?
-1¡z
Donde:
> (Y
-l1z
:(Y-Q¡z : (? -r;z
: Variación total : Variación no explicada : Variación explicada
Al correlacionar dos o más variable, se generan dos tipos de coeficientes que son:
5.3.1.1 Coeficiente de determinoción
12 -
Variación Explicada Variación Total
_»tt
(r2)
-V_l'
»(Y -Y)')
O también:
¡2 = 1
Variación No Explicada Variación Total
, »q _ ff ,(Y -Y)'1
42t 6,
WALTER CESPEDES RA¡'íREZ
El coeficiente de determ¡nación es un ¡ndicador que nos señala en que proporc¡ón la var¡ación de la var¡able dependiente (Y), puede expl¡carse por la variación de la variable
¡ndepend¡ente (X). Por
ejemplo:
Y=
Ventas
X
=
Publicidad
12
= 82,L6o/oi
S¡gnifica que el 82,160/o de las ventas se deben a la publ¡c¡dad
5.3.1 .2 Coeficienh de correloción (r)
c^ono,lo ,:{ ¡- f )' To¡al ! E(Y Y l' \ Variación No ExDlicada »,lY ii ' -' \ t/ar¡a.ión TotLrl \:rr-rr'
i'=-
Yorar*n
Vqriat ión
como habrá observado, el coeficiente de correlación es la raíz cuadrada del coeficiente de determ¡nac¡ón y es un ¡ndicador que nos señala: 10 En que proporc¡ón se asemejan los valores reales que se ¡nvest¡gan con los valores
calculados por la func¡ón matemát¡ca empleando la m¡sma variable ¡ndepend¡ente.
20 cuando se ut¡l¡zan las func¡ones de la recta y de Ia parábola a la vez, nos dice que func¡ón tiene mejor ajuste a los datos. Por
ejemplo:
Y=
Ventas
X=
Publicidad r = 94,640/o''
S¡gnifica que existe una relac¡ón directa del 94,640/o entre las ventas y la publ¡cidad
5.j,2
Correlación srmple
se refiere a la correlac¡ón existente solamente entre dos variables. En esta un¡dad, únicamente se verá la correlación lineal y la correlación de la parábola tal como se hiciera con la regresión. 5.3.2.1 Correloción lineol simple Los coefic¡entes de la correlación l¡neal simple con el método por Mínimos cuadrados,
se definen en forma abrev¡ada de Ia siguiente manera:
a)
coeficientes de determinación de la recta 12 =
aZY +bLYY
-ttYz
--r' -;r'
\2171
ESTADíSTICA II
Coeficientes de correlación de la recta
b)
r = laZY+bDXY-ni'z 2Y2 -nY2
Ejercicios resueltos
1) Hallar los coeficientes de determinación y de correlación de la recta, con las variables: X (número de vendedores) e Y (valor de ventas realizadas al mes en miles). La información que se tiene es Ia siguiente:
Número de vendedores (X) Valor de venta en miles (Y)
2
6,4
4
5
10
t2
15
16
8,5
9,3
76,4
18,6
20,2
25,2
Solución: Con
el método por Mínimos cuadrados, se primero se calculan las sumatorias
correspondientes a la ecuación de la recta:
x
x2
Y2
12,8
4
4l,o
4
6,4 8,5
34,0
16
72,3
5
9,3
46,5
25
86,5
10
76,4
164,0
100
269,0
t2
18,6
223,2
t44
346,0
15
20,2
303,0
225
408,0
16
25,2
403,2
256
635,0
64
LO4,6
L186,7
770
L857,8
2
z
XY
Y
con las sumatorias se hallan los parámetros "a" y "b" (solución por determinantes).
a = »y2x2 -».xyzx nzX2 -»xzx
¿ = lM,6(770)-1186,1(64)
b = ryZXY-ZXZY
!=
N2X2 _»X»X
7(770)
7(1186,7)
- «(e)
- 64(104,6) 7(710)-«(@)
§2r8t
_ 4593,2= !,J De4,o
1612,5 1294,0
= !r25
WALTER CÉSPEDES RAMíREZ
a)
Cálculo del coeficiente de determinación:
12
= aZy +bzXy -ni, - 3,st1o4,6)+1,25(r186,7)-7(104,6/7)2 -291,68 = Or9898
b)
r=
-- >yr-"y-,
1857,8-7(104,6/7)2
294,68
Cátculo del coeficiente de correlac¡ón:
Jo,r8r8 =0,9949
2) Hallar los coeficientes de determinación y de correlación de la recta, con las variables: X (número de gastos por inversión) e Y (utilidades anuales en miles)' La información que se tiene es la siguiente:
Número de gastos por inversión (X) Utilidades anuales en miles (Y)
5
11
4
5
3
2
31
40
30
34
25
20
Solución: Con el método por Mínimos cuadrados, se primero se calculan las sumatorias correspondientes a la ecuación de la recta:
x
XY
Y
x2
5
31
155
25
961
11
40
440
L2L
1600
4
30
120
16
900
5
34
t70
25
1156
3
25
75
9
625 400
2
20
40
4
30
180
1000
200
Con las sumatorias se hallan los parámetros "a" determinantes).
d-
>Yzxz -L,'{Y>X nzx2 ->xzx
S= nZXY ->XZY nzX2 ->x>x
Y2
5642
y "b" (se utilizará la solución por
a = 180(2oo)-looo(30) _ 6000 = 29 6(200)
b-
6(1000)
-
-
30(30)
30(180)
300
:600= 6(200)-30(30) 300
t2l9l
2
ESTADíSTICA II
a) Cálculo del coeficiente de determinación 12
b)
r=
_aZY +bZXy
_20(180)+2(1000)-6(ts0/6), _ 200 _ o,Ez64
-nVz
zY2-ny2
@=%2
Cálculo del coeficiente de correlación "16,1264
=or9o9l
Resolver los siguientes ejercicios propuestos sobre correlación lineal simple:
1) Hallar los coeficientes de determinación y de correlación de la recta, con las variables: X (número de desaprobados) e y (número de matriculados). La información que se tiene es la siguiente:
Número de desaprobados (X) Número de matriculados (y)
4
6
6
5
7
10
8
7
16
20
25
26
30
32
33
33
Resp: r2 =
0,5849, r = 0,7648
2) Hallar los coeficientes de determinación y de correlación de la recta, con las variables: X (número de gastos por inversión) e y (utilidades anuales en miles). La información que se tiene es la siguiente:
Número de gastos por inversión (X) Utilidades anuales en miles (y)
2
5
5
B
10
48,5
95,2
88,3
710,4
115,6
Resp: 12=0,8695,
r=
0,9325
5.3.2.2 Correloción de lo poróbolo Los coeficientes de la correlación de la parábola con el método por Mínimos Cuadrados, se definen en forma abreviada de la siguiente manera:
a) Coeficientes de determinación de la parábola 12
= a>Y + b»XY + c-X2Y - ny2 ZY2
-
nV2
b) Coeficientes de correlación de la parábota f=
aZY+b»XY+cX2y-nV'
§220§
WALTER CÉSPEDES RAMfREZ
Ejercicio resuelto Hallar la ecuación de la parábola con las variables: X (número de vendedores) e (valor de ventas realizadas al mes en miles). Número de vendedores (X) Valor de ventas en miles (Y)
2
4
5
10
72
15
16
6,4
815
9,3
76,4
18,6
20,2
25,2
Y
Solución: Con el método por Mínimos cuadrados, se primero se calculan las sumatorias correspondientes a la ecuación de la recta:
x
Y
XY
x2
x2Y
x4
x3
Y2
25,6
4l,o
2
6,4
12,8
4
8
16
4
8,5
34,0
16
64
256
136,0
72,3
5
9,3
46,5
25
1.25
625
232,5
86,5
10
16,4
t64,0
100
1000
10000
1640,0
269,0
L2
18,6
20736
2678,4
346,0
20,2
744 225
t728
15
223,2 303,0
3375
50625
4545,0
408,0
16
25,2
403,2
256
4096
65536
645L,2
635,0
64
LO4,6
LL86,7
770 10396 L47794 L5708,7
1857,8
Los parámetros "a", "b" y "c'1 fueron hallados en el ejercicio 1 del ítem 5.2.4 correspondiente a la regresión de la parábola y estos son: a = 4,175i b = 7,O7 y c = 0,0095.
a) Coeficientes de determinación (r'?):
12=a»Y+|ZXY+cX2Y-nY2 ZY2 - nY' ,z =4,115(104,6)
b)
r=
+ t,o7(1186,7) + o,oo95(t57o8) 1857,8 - 7(104,6 / 7)2
Cálculo del coeficiente de correlación:
Jo,ril, =or9858
t27ta
-
7(1o4,6 / 7)2 = ??94.1= O,971¡9 294,68
ESTADÍSTICA I]
Resolver los siguientes ejerc¡cios propuestos sobre correlac¡ón de la parábola: 1) Hallar los coeficientes de determinación y de correlación de la parábola, con las variables: X (número de desaprobados) e Y (número de matr¡culados). Número de desa probados (X)
4
6
6
Número de matriculados (Y)
16
20
25
Resp:
7
26 12
10
30
8
7
33
33
=0,7462, r = 0,8638
2) Hallar los coeficientes de determ¡nación y de correlación de la parábola, con las variables: X (número de gastos por invers¡ón) e Y (utilidades anuales en miles). Número de gastos por ¡nversión (X) Utilidades anuales en m¡les (Y)
2
5
48,5
5
B
88,3
770,4
10 1
15,6
Resp: r, =O,99O4, r = 0,9952 5.3.3 Correlación de Spearman (p) Este modelo de correlación asoc¡a dos var¡ables, es un modelo No paramétr¡co que no trabaja con la informac¡ón directa, sino que la trasforma en orden crec¡ente a partir del 1
En estadística, el coeficiente de correlac¡ón de Spearman, p (rho), es una medida de la correlac¡ón (la asoc¡ac¡ón o interdependenc¡a) entre dos variables aleator¡as continuas. La ¡nterpretación de coeficiente de Spearman es igual que la del coefic¡ente de correlac¡ón de Pearson. Osc¡la entre -1 y +1, ¡ndicándonos asociac¡ones negat¡vas o positivas respectivamente. 0 (cero), s¡gn¡fica que no hay correlación pero no necesar¡amente que no hay ¡ndependencia. Para calcular p, los datos son ordenados y reemplazados por su respect¡vo orden. El estadíst¡co p viene dado por la expresión:
6»d1
[__--. Donde:
n (n' -1)
d: es la d¡ferenc¡a de comparar el ordenen que quedaron ambas variables n: es el número de parejas entre las dos var¡ables. En caso de ex¡stencia de datos ¡guales, se les da el orden que les corresponde ignorando que son iguales; es decir, como si fueran datos d¡ferentes. luego se saca el promed¡o del orden asignado a todos los datos iguales y se les reasigna este promedio a todos ellos.
,222a
WALTER CÉSPEDES RAM ÍREZ
Ejerc¡cio resuelto Se tiene el Coeficiente de Inteligencia (C.I.) de 10 niños y el número de horas que ven televisión a la semana (Tv.), mediante la correlación de Spearman, determine s¡ hay influenc¡a de la telev¡sión en la intel¡genc¡a de los niños: Coeficiente de
106
86
100
100
99
103
97
113
113
110
7
0
28
50
28
28
20
72
7
17
Inteligencia Número de horas de Tv.
Solución: 10 Se ordenan los datos de la primera columna generalmente en forma creciente. Se crean dos columnas más donde se camb¡a el valor respectivo por el número de orden que les tocó.
20
se d¡ferencia el orden de ambas columnas dando lugar a "d", la misma que es elevada al cuadrado. Nótese que al C.I. = 100 le toca el orden 4 y también el 5;
30 F¡nalmente
como este dato está repetido, se le reas¡gna el promedio de ambos (4
c.r.
orden C.I Orden Tv.
Tv.
+ 5) / 2 = 4,5.
d
B6
0
1
1
0
0
97
20
2
6
4
16
99
28
3
B
5
25
100
28
4,5
50
l\
10
6
B
2
100 103
72,25
B
30,25 4
20,25
1Ut)
7
7
2,5
4,5
110
t7
B
5
3
9
113
7
oq
2,5
1
49
113
72
4
5,5
30,2 5
t
ut!' "' = l- n \n' -1) - l-
196,OO
(196) = L-r,t87e l0 (100 - l) 6
,223&
= -0,1879
TSTADíSTICA
II
Interpretación de los resultados: Existe una correlación no significativa inversa (-78,79o/o) entre el coeficiente de
inteligencia de los niños y las horas que le dedican a la televisión; es decir que más horas de televisión puede afectar la Inteliqencia de los niños.
Resolver los siguientes ejercicios propuestos sobre Correlación de Spearman:
1)
Hallar el coeficiente de de Spearman comparando las edades con evaluación: Edades
25
16
30
33
45
1B
Evaluación
45
82
56
62
80
65
Resp: -
0,2
2) Hallar el coeficiente de de Spearman comparando el número de vendedores con el volumen de ventas, que se da a continuación: Número de vendedores Volumen de ventas (miles)
5
6
3
3
4
1B
10
45
B2
16
26
20
650
240
Resp: 0,9375.
3)
Hallar el coeficiente de de Spearman comparando las tallas con pesos:
Tallas (cm)
725
145
198
180
774
t52
166
L82 180
773
162 777
Peso (kg)
38
52
77
89
B8
45
58
74
B6
70
70
Resp: 0,7850
&224§
70
Lección
4
5.4 Análisis de series cronológicas El anál¡s¡s de las ser¡es cronológicas o ser¡es de tiempo, se ut¡l¡za para descubrir los patrones de cambio en la información estadíst¡ca durante intervalos regulares de tiempo. Estos patrones se proyectan para llegar a una est¡mación del futuro. Así pues, el análisis de series de t¡empo nos ayuda a sortear la ¡ncertidumbre ante el porvenir. Es característica en este t¡po de anál¡s¡s que la variable independiente (x) es
necesariamente
el tiempo y la información a analizar necesariamente debe estar
en
términos: mensuales, tr¡mestrales, etc.; es decir antes del año, por que la ¡nformac¡ón
anual cont¡ene en promed¡o la ¡nfluenc¡a de los componentes de la variable dependiente (Y)'
5,4.1 Componentes de una serie de tiempo Existen cuatro componentes en la var¡able dependiente de una ser¡e de t¡empo o ser¡e cronológica, que son:
5.4.1
.l
Voriociones cíclicos
(C)
Son aqueltos mov¡mientos repet¡tivos a largo plazo (más de un año). La variación cíclica es el componente de una ser¡e de tiempo que tiende a oscilar por enc¡ma y por
2)5
ESTADÍ5TICA
II
debajo de la línea de tendencias secular durante periodos mayores que un año. Cuando se analiza series de tiempo con pocos años, esta varlac¡ón cas¡ no se percibe. 5.4. 1.2 Voriociones esbcionoles (5) Son aquellos mov¡mientos o cambios repet¡tivos a corto plazo (dentro de un año). A fin de detectar la variación estacional, hay que med¡r los intervalos de t¡empo en unidades pequeñas, d¡gamos en días, semanas, meses, o trimestres. En una ser¡e de tiempo la influencia estac¡onal es muy fuerte en el corto plazo, de allí la preocupación del ¡nvestigador hallar el índice estac¡onal de cada: día, mes, tr¡mestre, etc., para proyectar los datos con mayor exact¡tud, al ¡ncluir en Ia est¡mación el valor
estac¡onal.
5.4.1 .3 Voriociones irregulores (l| Son aquellos camb¡os intempestivos y están relac¡onados generalmente con: paros, catástrofes naturales, guerras, etc. este t¡po de var¡aciones no obedecen patrones y se pueden presentar en cualqu¡er momento afectando d¡rectamente a la influencia estac¡onal en el corto plazo.
5.4.1 .4 Tendencio
[]
Representa una or¡entación de los datos que en una función matemática, se encuentra medida por la pendiente. Si Y = f(X), donde "X" es el t¡empo "Y" esi
Y =
(T, C, S, r)
5.4.2 Promedios nóviles en una ser¡e de tiempo (PM) El promed¡o móv¡l cons¡ste en tomar un grupo definido de datos y obtener el promedio de los mismos; luego se deja el primer dato del grupo y se completa con el dato siguiente,
de tal manera que el tamaño del grupo siempre sea el m¡smo, luego se deja el primer dato de este ú¡timo grupo y se completa con el dato siguiente; así sucesivamente, hasta tomar el último dato de toda la serie de tiempo. El nombre de promed¡os móv¡les obedece a que el grupo se mueve dato por dato que se van agregando al grupo. En una serie de tiempo el promed¡o móv¡l tiene la part¡cularidad de conservar en cada promed¡o la tendencia y las variaciones cíclicas.
Si usted d¡vide el valor de la variable depend¡ente (y) con sus cuatro componente, entre el promed¡o móv¡l correspond¡ente en el tiempo, el cociente resultante contiene las var¡acionesestacionales y las variaciones irregulares.
v _rcs1_s1
PM
TC
,226t
WALTER CÉSPEDES RAMíREZ
Como en una ser¡e de tiempo estos datos se rep¡ten para un m¡smo per¡odo que puede ser: día, mes, trimestre, etc., se puede separar la Variación Estacional de la Var¡ac¡ón
Irregular escogiendo el valor MEDIANA entre todos los valores del m¡smo per¡odo.
Ejerci€ios resueltos 1) Hallar los promedios móviles de cinco en cinco de la s¡guiente ser¡e: Ta
llas (cm)
tz5
145
198
\42 180 773 t62 771
t74 152 166
180
soluc¡ón: (125 + 145 + 198 + (145 + 198 + 180 + (198 + 180 + t74 + oa0 + 774 + 152 + (174 + 152 + 166 + (152 + 166 + 182 + (166 + 182 + 180 + (182 + 180 + L73 +
Pr¡mer grupo: Segundo grupo: Tercer grupo:
Cuarto grupo: Quinto grupo: Sexto grupo: Sépt¡mo grupo: Octavo gru po: Ta
125
llas
180 + t74) 174 + 7s2) 752 + t66)
/5
/s
/s
= a22/5 = a49/ 5 = 870/5 = 854 15 = a54/5
= = = = = 853/s = a63/5 = 868/ 5 =
166 + 782) / s 182 + 180)/s 180 + t73) = 173 + t62) = 762 + t7t) =
ls /s /s
198
180
174
152
166
182
180
113
164,4
169,8
154,0
170,8
170,8
170,6
172,6
173,6
145
164,4 169,a 754,0 770,8 770,4 770,6 172,6
t73,6 762
\11
(cm) Prom. Móvil
El alumno debe observar que
el Promedio Móvil cae s¡empre en el centro del grupo
2) Hallar los promedios móv¡les de tres en tres de la sigu¡ente serie: Peso
52
3B
77
B9
45
88
74
58
70
B6
70
70
(ks)
Solución: Peso
38
77
52
B9
8B
45
5B
84,67
14
63,67
59
74
70
70
B6
(kq) Prom. Móvil
55,67
7
2,67
a227
a
67
,33
76,67
7
5,33
?
5,33
10
E
ICA
STA D fST
II
Resolver los s¡guientes eiercicios propuestos sobre promed¡os móv¡les.
1)
Hallar los promedios móv¡les de tres en tres de la sigu¡ente serie: Edades
25
Respuesta:
16
30
45
33
Edades
18
25
Prom. ¡4óvil
2)
16
30
23,67
26,33
Respuesta:
45 82
62
56
32
Eva luación
65
BO
45
Prom. Móvil
a2
56
62
BO
61
66,67
66
69
65
Hallar los promedios móviles de c¡nco en c¡nco de la siguiente ser¡e: Número de vendedores
Respuesta:
4)
36
18
Hallar los promed¡os móviles de tres en tres de la siguiente serie: Evaluación
3)
45
5
6
3
3
Número de vendedores Promedio 1.4óv¡l
5
4
10
1B
6
3
4)
3
4
6,8
7,6
1B
10
Hallar los promed¡os móviles de cinco en c¡nco de la siguiente ser¡e: Volumen de ventas (miles)
Respuesta:
Volumen de ventas
(miles)
45
45
82
82
Promedio Móvil
16
16 37 ,B
26
20
26 15
8,8
6s0
20
240
6s0
240
790,4
5.4.3 Indice estac¡onal en una ser¡e de tiempo Para hallar el índice estacionar por medio de ros promedios móvires, se debe anarizar toda la ¡nformación de ra serie de tiempo y cuando más datos se t¡enen es mejor. En ra elección de los grupos para el promed¡o móvil, depende a que n¡vel se va a obtener el lndice Estac¡onal; por ejemplo: s¡ el índ¡ce es mensual, el grupo será por doce meses, s¡ el índice es trimestral, el grupo se tomará por cuatro trimestres, etc. El grupo de datos que conforme el promedio móvil utilizado en una serie de t¡empo debe ser anual, para obtener el índ¡ce estacional que esta dentro del año.
tl1Aa
WALTER CÉSPEDES RAMíREZ
Ejercicio resuelto Hallar el índice estacional de la s¡guiente serie de tiempo con la producción mensual en miles que a cont¡nuación se da:
Producc¡ón en m¡les de soles
Mes/ Años
2005
2006
2007
2008
2009
Enero
4,4
5,0
8,3
5,4
Febrero
8,3
6,8
7,L
4Q
3,9
7,5
7,8
5,3
5,2
6,2
2,7
7,0
3,6
3,5
3,6
¡4a
rzo
Abril Mayo
7,4
5,5
3,2
2,3
Junio
0,8
4,t
2,2
1,,4
1,8
lulio
1,8
4,3
7,4
7,7
1,8
Agosto
15,0
72,0
9,5
7,O
Sept¡embre
33,1
23,3
25,6
2
Octubre
77 ,O
73,4
19,3
15,5
Nov¡embre
8,s
7,7
7,3
9,6
7,2
q?
6,s
6,7 7,4
Diciembre
7,7
15,
1
9,0 8,8
Solución: Para hallar el índice estac¡onal, se deben real¡zar var¡os pasos que para ordenarlos mejor, se definen las s¡guientes columnas que se dan a continuación:
Columna
(1):
Contiene los años dados en el ejercicio.
columna
(2):
Cont¡ene los meses dados en el ejerc¡cio.
columna
(3):
Cont¡ene la producción mensual del ejerc¡c¡o.
Columna
(4):
Cont¡ene las sumas móvil de 12 en 72, (nótese que la suma esta al centro de los doce datos y por ser grupo par, esta descentrado).
Columna
(5):
cont¡ene la suma móvil de dos en dos datos descentrados (columna 4) con el objeto de centrarlos a un determinado per¡odo (mes).
Columna
(6):
Contiene el valor de la columna contiene doble grupo de 12.
Columna (7)
:
(5) entre 24 por que dicha
columna
contiene S. I.; es decir, las variaciones estacionales junto a las var¡aciones irregulares.
4729 *
E
Anos
STA D IST
MCSCS
Produccron
Suma de
(2)
(en m¡les) (3)
12 meses (4)
(1)
ICA
II
Dos grupos de 12 De ¡a col,
anterior (s)
Prom. 5.I -¡4óv¡l /
24
(6)
Producción (3) Ptonedio Móvil (6)
(7) neTo
200 5
rero rzo qbril
Fe b lvla
8,3
/,5 2,
ayo
t,4
unro
U,U
lto
r,a
\4
loa,2 u
a-/,t)
9,0
0,2000
216tl
9,0
1,6661
274,9
9,tJ
3t6 /
219,5
9,1
1,8681
¿¿/ t9
9,5
o,8947
¿35t3
9,4
u,
24). tL
1U/U
U,5UUU
241) 16
1U/
108,8 Cgosto
15/0 7rJ
Septiembre
/ ,3
JJ, t
/6
LO/tb Sctubre
t/tt)
III,9 Novrembre
8,5 11b,U
Diciembre
/,
/ó5
1
)-)-9,3 2
006
E
nero
5,0
t2l FeDrero lvla Tzo
Abril
ta
6,8 1
14,4
1
18,
0
¿35,1
7,O
O
U
rJ,7At9
¿3/t3
7,4
U,6E
9,U
o, / L43
116,6 l{
u,5b/u
231,6
ayo 115,2
,unio
lulio Agosto
Sept¡embre
,l l.
14,
1
15,6
1
15,9
4,3 72,O
9,b
o,42 /
23U,3
9,b
uÉ4/9
3)-,5
9,b
1,2
¿¿9,3
9,6
3,4167
2¿3,4
9,3
l,623
2l/ l
9,
2
32,4
I
2¿9,9
5 UU
tt3 fi Octubre
15,1 1
Nov¡embre
t
10,0
/,1
tu/, ?230t
f
u,
/óo¿
WALTER CÉSPEDES RAMf REZ
Diciembre
1,2
Enero
5,9
8,9
0,8090
¿oa,
8,
o
203,3
E,5
0,8353
191, J
8,0
u, bbz 5
180,
,/
,5
0,480u
5,4
1U
2007
213,5
,614 2
702,9 =ebrero
/,1 1UU,4
¡4 a
rzo
90,9 Abril
3,6
1
89,2 \4
o,4324
1/U,b
ayo a9 ,4
unro
180,9
¿,2 9
)ulio
t,4
Agosto
9,5
,/
,5
o,2933
1,5
IE5,J
0,1818
5,6
l,¿3 3A
18
91, Sept¡embre
¿3,3
183,3
7,6
3,0
143,1
/ ,l)
t, /632
782,t
/,6
0,9 6U 5
180,4
7,5
1,z+tJl)
779,3
/,5
1,1Ub,
I /6,5
/,4
o,662¿
6
58
91, b
3ctubre
13,4
97, Noviembre
/,3 9
)ic¡embre
0,6
9,J 89,8
200 8
Lnero
B,
u9,5 Febrero
,9 a7 ,t)
\4 a
rzo
5,2
77
tJ,
6,3
/ult
49, J
qbr¡l
o,454
144,5
3,
95,¿ N4
ayo
19 ¿,
8,0
o,247 s
792,2
a,u
o,7 / 5t)
18b,5
7,8
0, 1410
IE2,6
/,6
o,9271
t42,6
7,6
3,3684
18
3,
7,6
2,5395
18
3,8
97 ,5
unto
7,4
94, u
lro
1,1 91, A
Agosto
/ ,l) 9
SeptremDre
¿5
0,8
t6 91,8
Cctubre
79,3
91,9 Noviembre
9,b
¡23
[
7,2464
ESTAD ISTICA II
9
Diciembre
r,9
b,5
la+,2
u,4442
5,3
o,7t)13
92,3 2009
neTo
5,4
1a 9
l-e
bre ro
3,0
3,9
taa,u
/,4
U,5UUU
193,2
U,U
ut//5u
192,6
E,U
0,45U0
5,9
/,4
ut2949
95,U
ylarzo
6,2 94,2
Ab
riÍ
Mayo
J,b 2,3
18
91,5
,unio
1,8
lulio
1,8
A9osto
9,0
Septiembre
2B,B
Jctu bre
15,5
Noviembre
6,
D¡c¡embre
/,4
1UJ,9
ot233A
En la serie de datos, cada vez que se agrupen una cantidad par de datos¡ éstos siempre quedan descentrados. Para hallar los Índices Estacionales tal como se observa en la s¡guiente tabla, se toman los valores S.I. (columna 7 de la serie anter¡or) y después de ordenarlos en forma correlat¡va, se procede a sacar la mediana por mes; finalmente se determ¡na el índice estac¡onal a part¡r de las med¡anas, con la cond¡ción de la suma de todos lo índices sea ¡gual a 12 (12 meses). Si exactamente no es doce, entonces hay que hacer los ajustes respectivos ¡gualando los totales, con la regla de tres s¡mples.
)3)
WALf ER CÉSPEDES RAIÍ f REZ
Mes/ Años
2006
2005
2008
2007
2009
lvlediana
Índice Estacional
Enero
0, s000
0,6742
7,7067
o,7073
0,689 8
o,7 L42
Febrero
0,6800
0,8353
o,6622
0,5000
o,6777
o,6949
Marzo
0,7a79
0,6625
o,7027
o,7750
0,7349
o.765O
Abril
o,7 743
0,4800
o,4545
0,4500
o,4673
o,4838
Mayo
0,5 67 0
0,4324
o,287 5
0,2949
0,3637
o,3764
Junio
o,427L
0,2933
0,1750
0,2338
o,2636
o,27 2A
Julio
0,2000
o,4479
0, 1818
0,1410
0,19 09
o,L977
Agosto
t,6667
1,2500
1,2338
o,92tl
7,2419
1,2859
Septiembre
3,6774
3,4767
3,06 s8
3,3684
3,3926
3,5L27
868
1
t,6237
1,7
632
2,s395
1,815 7
1,a8OO
Noviembre
o,8947
o,7 802
0,960 s
1,2464
o,927 6
o,9604
Diciembre
o,7 857
0,8090
7,24OO
0,8442
0, B2
66
o,a558
77,5897
12,OOOO
Octubre
1,
TOTAL
Si se supone ausenc¡a de estacionalidad entre los datos, valor real sería igual al promedio móvil, por lo tanto al div¡dirse ambos valores, el índice estacional para cada mes ser¡a 1, por lo tanto Ia suma de los 12 meses, tiene que ser igual a 12; como las med¡anas suman 11,5897, se hace necesar¡o hacer el ajuste correspond¡ente mediante la regla de tres simples a las medianas, para convertirlos en Indices Estac¡onales, con suma ¡gual a 12.
Ejemplo, para ajustar Enero = 0,6898 x
fz
I
77,5897 = 0,7142.
El proced¡m¡ento de ajuste es necesar¡o hacerlo hasta el último mes y necesar¡amente
la suma debe dar exactamente 12 cuando se trabaja con meses.
5,4,4 Ecuación de la recta por minimos cuadrados cuando Zx = 0 En la serie de tiempo, como la variable ¡ndepend¡ente es el tiempo (X) y éste siempre es correlativo, entonces se puede simular valores correlativos positivos y negativos, de
tal manera que la suma de X sea cero (EX = O).
!231t
ESTADíSTICA II
Si se toma como referencia las ecuaciones por mínimos cuadrados:
:Y =a(n) + b:X IXY=aZX+ bIX'z
(1) (2)
Al reemplazar la suma de X por cero en la ecuación (1) desaparece "b":
:Y =a(n)+b(0)
Entonces:
a=2Yln
En la ecuac¡ón (2) desaparece "a":
ZXY
=a(0) + bZX'z
Entonces:
b =IXYlzx'
Como habrá observado usted, es muy fácil despejar "a" y "b", cuando la suma de X es cero; pero esto no siempre es posible, sobre todo si X no tiene un valor correlativo como lo tiene una serie de tiempo.
Ejercicios resueltos 1) Hallar la ecuación de la recta por Mínimos cuadrados con la Z X = 0 Meses del 2009
Ene
Feb
Mar
Abr
May
lun lul
Ago
sep
Oct
Nov
Dic
Ventas
5,4
3,9
6,2
3,6
2,3
1,8
3,0
28,B
15,5
6,7
7,4
1,8
(millones)
Solución: Y
x
XY
x2
ENERO
5.4 3.9
-29.70 -L7.55
30.25
FEBRERO
MARZO
6.2
-5.5 -4.5 -3.5
-2t.70
72.25
ABRIL
3.6
6.2s
2.3 1.8
-3.45 -0.90
2.25
JUNIO JULIO
-2.s -1.5 -0.5
-9.00
MAYO
1.8
0.5
0.90
0.25
AGOSTO
2.25
Meses del 2OO9
20.25
0.2s
3.0
1.5
13.50
SETIEMBRE
28.8
2.5
72.00
6.25
OCTUBRE
15,5
3.5
54,25
72.25
NOVIEMBRE DICIEMBRE
6.7 7.4
4.5
30,15
20.25
5.5
40.70
30.25
92.4
0
729.20
143.0
E
42344
WALTER CÉSPEDES RAMíREZ
Cuando:
92,4/12=7,7
?=ZY/n=
IX=0
b =ZXY/ZX'= 729,2/t43 = O,9 ? = 7.7 +
O.9 (X).
2) Hallar la ecuación de la recta por Mínimos cuadrados con la Z X = Días
0
domingo
lunes
martes
miércoles
jueves
vrernes
sábado
L5,7
8,3
5,7
5r1
8,6
10,3
t6,3
Ventas (miles)
Solución: Días
Y
x
XY
x2
domingo lunes martes miércoles jueves vternes sábado
75,7
-3
9
8,3
-2
- 47,7 -t6,6
5,7
-1
-5,7
1
5,1
0
0
0
8,6
1
8,6
1
10,3
2
20,6
4
3
48,9
9
817
28
t6,3 7O,O
Cuando:
4
IX =0
o
á = ZY/n = 7O/7 =
tO
b =IXY/ZXz = 8,7/28 ? = 10 + O.31 (x).
=
Resolver los siguientes ejercicios propuestos sobre !a ecuación de la recta
conEX=O: 1)
Hallar la ecuación de la recta por Mínimos cuadrados con la
Días
Producción
I
X=0
lunes
martes
miércoles
jueves
V¡ETNCS
sábado
15
t7
t2
15
16
10
(Unid.)
Resp: V = !4,!7 -0,71
¡235t
(X)
ESTADÍ5TICA
2)
II
Hallar la ecuación de la recta por mín¡mos cuadrados con la > X = Añ
os
2005
Producción (Unid.)
1500
2006
2007
2008
2009
1700
2000
5000
60 00
Resp: 3)
i =
32aO
+ 1230 (X)
Hallar la ecuac¡ón de la recta por mínimos cuadrados con la > X = Trimestres
II
III
IV
770
770
200
I
Producción (Un¡d.)
O
150
Resp: ! =
772,5
O
+15(X)
5.4,5 Proyección de los datos con apl¡cac¡ón del índice estacional En esta parte del anális¡s, se util¡za la ecuación de la recta defin¡da anteriormente y se hace la proyección para los periodos sigu¡entes tomando como base la cont¡nuac¡ón del últ¡mo valor de X.
Ejemplo: Proyectar esta ser¡e de datos para er año s¡gu¡ente apricando er índ¡ce estacional obtenido anter¡ormente: Meses del
Ene
Fe
2009 Ventas (millones)
5,4
'1 0
x
-
5,5
b.
-4,5
Mar
Abr
6,2
3,6
May
-
1,5
lun
Jul
Ago
sep
Oct
Nov
Dic
1,8
1,8
3,0
28,8
15,5
6,7
7,4
-0,s 0,s
1,5
3,s
4,5
5,5
Solución: Este ejercicio fue resuerto en párrafo anter¡or y se dieron varores a x que representan a los meses, desde Enero (-5,5) hasta Diciembre (5,5), para hacer que la t X O, con = ello se obtuvo la siguiente ecuación:
Y=7,7+O,9X Para proyectar Enero, el valor de X es 6,5; por que el últ¡mo fue 5,5 (Diciembre). Valor que se reemplazará a X en Ia ecuación y = 7,7 + O,gX, luego el resultado de t será multipl¡cado por el Índice Estacional, de la s¡9u¡ente manera;
Enero: 7,7 + (0,9 x 6,5) Febrero: 7,7 + (0,9 x 7,5)
Proyección de
= =
13,55 x e,7142 14,45 x 0,6949
Todos los cálculos están conten¡dos en la siguiente tabla.
ii2 3 6i:
= =
9,6A 10,04
WALTER CÉSPEDES RAMíREZ
MESES
para el 2o1o
x
? =a + bX +Or9X
ESTACIONAL
Y'=7r7
Írorce PROYECCIóN
ENERO
6,5
13,55
0,7!42
9,68
FEBRERO
7,5
14,45
0,6949
L0,04
MARZO
8,5
15,35
71,74
ABRIL
9,5
16,25
MAYO
10,5
L7,t5
JUNIO JULIO
1
1,5
18,05
72,89
12,5
18,95
AGOSTO
13,5
19,85
SETIEMBRE
14,5
20,75
0,7650 0,4838 o,3768 o,2728 o,t977 7,2859 3,5727
OCTUBRE
15,5
27,65
1,BBOO
40,70
NOVIEMBRE DICIEMBRE
16,5
22,55
77,5
23,45
0,9604 0,8558
20,O7
7,86 6,46 4,92 3,75 25,53
27,66
El alumno habrá observado que a pesar de utilizar la ecuación de la recta, la proyección no es una recta, por la fuerte influencia estacional. En los datos del año anterior, se ve que los valores más altos corresponden a Septiembre y a Octubre, y usted puede ver que eso mismo ocurre con la proyección.
1237a
ESTADíSTICA II
AUTÍIEUAI.UACIfIN NO 5
Tabla Años (X) Ventas en miles
1
1
2
3
4
5
13
24
39
65
106
(Y)
1) Hallar\\a" y \\b" de la Regresión Lineal Simple con los datos de la tabla A) -18,7 y
24,9
B) 18,7 y
-22,7
C) -18,7 y
22,7
D) 22,7 y
L8,7
1.
E) -18,7 y -22,7
2) Hallar "o', "b" y "c" de la Regresión de la Parábola con los datos de la tabla A) 21,83 -L2,04 y
5,79
B) 18,76 -10,36 y
D) 24,37 -12,04 y 1,87 E) -t,57 -27,16
y
-2,17
1.
C) 21,83 -18,7 y O,27
5,79
3) HallarelCoeficiente de Determinación de la Regresión Linealcon los datos de la tabla A) 0,8352
c) 0,8956
B) 0,8159
D)
0,9211
E) 0,9326
4) Hallarel Coeficiente de Correlación de la Regresión Lineal con los datos de la tabla A) 0,9814
c)
B) 0,9657
0,8989
D)
0,9216
0,8952
B)
0,8152
C)
0,8959
D)
0,9831
0,94t4
B)
0,9650
C) 0,8984
D)
0,9915
1.
E) 0,9344
6) Hallarel Coeficiente de Correlación de la Parábola con los datos de la tabla A)
1.
E) 0,9513
5) Hallarel Coeficiente de Determinación de la Parábola con los datos de la tabla A)
1.
1.
E) 0,9597
7) Hallar el coeficiente de de Spearman comparando el jornal con producción de siguientes datos:
A) - 0,2000
lornal diario
125
116
130
133
745
118
Producción
45
82
56
62
BO
65
B) - 0,1650
c) 0,0028
&238§
D) -0,3991
E) 0,2000
los
WALTE R CÉSPEDES RAIY iREZ
8)
Hallar el coefic¡ente de de Spearman comparando los días trabajados con el volumen de ventas, que se da a continuac¡ón:
Número de d ías trabajados Volumen de ventas (miles) A)
9)
0,19s7
15
1r)
13
13
74
28
20
745
182
116
126
120
650
240
0,8s21
B)
0,937s
C)
D)
0,8833
E) O,s672
Hallar los promedios móviles de tres en tres de la siguiente serie: 745
Serie
742
t62
156
180
165
A) 762,26 166,67 166,33
166,00
D)
t62,26 166,67 767,67
161,00 166,67 166,00
169,00
E)
162,26 t66,67 766,67 769,00
B)
c) 161,00 166,00 167,33 10) Hallar los
168,00
promed¡os móv¡les de c¡nco en cinco con los siguientes datos: Datos
A) 45,2 7O,A B)
76A,76
57
77,6
68
40
33
C) 46,9 7O,2
46,2 7O,B 78,6
t07
180
7A,6
E) 46,2 7O,4
7A,O
D) 44,7 7O,8 74,2
11) Hallar la ecuación de la Regresión Lineal S¡mple con
:X=
0 de los s¡gu¡entes
datos:
Años Producc¡ón
200 s
2006
13
24
A) 9= 50,4 +27,7
(x) c) i=
$ t
(x)
= a3,4 + 22,7
D)
i
48,4
2007
2009
2008
106
65
+2t,7 (x)
É.)
! = 49,4 + 22,7 (x)
= 47,4 + 22,9 (x)
12) Con la ecuación de la pregunta 11, proyecte la producción después de 2 años.
A)
t4O,2
B)
1s9,7
C)
777
,s
D) 2tL
,2
E) 186,2
13) con la ecuación de la pregunta 11, proyecte la producción después de 10 años.
A)
276,4
B)
321,8
C)
344,8
t2
3 9.1
D) 298
,7
E) 482,4
ESTADÍSTICA II
14) Dado: Índice Estacional = 0,6852 y la Recta proyección paraX = 2?
A)
19,70
B)
77,26
C)
13,50
=
D)
23,5
-
1,9X. ZCuál deberá ser
18,71
E) 11,38
15) Dado: Índice Estacional = 0,8527 y la Recta = - 3,5 + 3,86X. ZCuál deberá ser
proyecciónparaX=4? A)
16,15
B)
10,99
C)
13,56
D)
10,18
E) t8,22
Respuestas de control t.
c,z.A,
3. E, 4. B, 5. D, 6. D, 7. A,B.C, 9. B, r0. B, I l. E, 12. A, 13. B, 14. C, 15. D
42401
la
la
WALf ER CÉSPEDES RAMf REZ
EXPTORACIÍIN ON LINE
http //es.wi :
ki ped ia. orgÁ,rii ki/Re gr
esio/oC3o/oB3n_l neal i
http:/lvwweumed. neVcursecon/mediréstima. htm http://apuntes. rincondelvago.com/regresion-y-correlacion. html
http://www.monografias,com ltrabqos}T /regresion-simple/regresion-simple.shtml
r0r0sARr0 ecuac¡ones
si m
u
ltá neas.
función matemát¡ca.
Ecuaciones que tienen incógnitas con el mismo valor en todas ellas. El término simultánea obedece a que para hallar tales incógnitas, se resuelve en forma simultánea, entre otros métodos de solución. Se utiliza en la regresión y correlación. Ecuación con dos o más variables, donde una de ellas llamada generalmente "Y", es dependiente de la o las otras variables independientes, llamadas generalmente
ttX" o ttXi". Se utiliza en la regresión y correlación,
Función matemática que representa mejor los datos estimados (regresión), con relación a sus
mejor ajuste.
correspondientes datos reales tomando como base la variable independiente "X". Se utiliza en la regresión y correlación.
no paramétrico.
va ria
ble i ndepe
nd i ente.
Término utilizado estadísticamente en una investigación, cuando se analiza una variable no numérica. La utiliza la Estadística Descriptiva como resultado de un censo y también la Estadística Inferencial como resultado de una estimación.
Término utilizado en una función matemática, en donde esta variable puede asumir cualquier valor, y como consecuencia, la otra variable que la acompaña en la misma función queda representada dependiendo de dicho valor. Se utiliza en la regresión.
l24l)
Se
xt
a
UNIDAD Números índices
Sumario l'|ociones sobre números índices Clasificación de los números índices según su contenido: índices simples, índices compuestos l',1étodo de
cálculos de índice¡ compuestos: índices de agregados no ponderados, índices de promedios relativos no ponderados, índices de agregados ponderados' Cambio de base Variaciones del índice: con relación al periodo anterior
oBJETTVO(S) GENEML:
.
Al término de esta unidad el alumno estará en capacidad ver la variación proporcional de una variable en el tiempo con relación a un periodo determinado. Con los Números índices es posible saber cuánto ha aumentado o disminuido en el tiempo
una variable, también es posible conocer cuál es la relación proporcional de una variable respecto a otra variable. El alumno ha aprendido a conocer que con una misma serie de
datos se pueden producir índices diferentes, dependiendo de la base; y conocer qué son índices iguales, porque a pesar de tener magnitudes diferentes, tienen la misma variación, ESPECíFICOS:
. . .
Conocer la nomenclatura de la fórmula aplicable a los números índices y los tipos de índices de mayor uso. Calcular los índices en forma individual, para determinar el comportamiento de cada unidad de información; y también, en forma conjunta, para ver la influencia a manera de conjuntos.
Medir el grado de relación en el tiempo entre las variables
a
través de diferentes metodologías de cálculo.
Al comparar estos resultados, el alumno aprenderá a darle un melor uso a los números índices.
. .
Conocer que no es necesario volver a calcular los números índices, si se empleó una base no representativa.
Medir en que proporción se diferencia una serie de números índices, al ser comparado con otro de la misma serie.
12441
Le
CC
o
n
6.1 Número índice El número índice es una medida estadística d¡señada para poner de relieve cambios en una variable o en un grupo de var¡ables relacionadas con respecto a: el tiempo. la situac¡ón geográfica, el ingreso o cualqu¡er otra característ¡ca. Este tipo de número puede definirse también como un valor relat¡vo en tanto porciento, que permite med¡r en que proporción una variable ha camb¡ado con el tiempo. El Número Índice es el cociente del valor actual entre un valor base, luego se mult¡plica
el número resultante por 100 para expresar el índ¡ce como un porcentaje. El
índ¡ce
correspondiente al periodo base s¡empre es lOOo/o, no ¡nteresando el t¡po de ¡nformación o el método de cálculo. Tamb¡én se puede decir que un Número Índ¡ce es una medida estadística que tiene como final¡dad med¡r el tamaño o magn¡tud de una var¡able de interés en un determinado momento con relac¡ón a otro momento pasado, para comparar su variación en el tiempo.
6,1,1 Nociones sobre números indices Los Índices son aplicable a cualqu¡er activ¡dad, ya sea: económ¡ca, admin¡strativa, soc¡al, cultural, médica, financ¡era, etc. Pero en esta un¡dad solo se tocará la activ¡dad económ¡ca por tener múlt¡ples apl¡cac¡ones.
a145t
E
STAD ÍSTICA II
tratar en la un¡dad son:
Los tipos de índices a
10 Índices de precios (P) 2o Índices de cantidad o de Quantum (Q) 3o Índice de Valor (v)
Tales ¡nd¡cadores ut¡l¡zan
:
Precio de un bien en el periodo base Precio de un bien en el periodo dado ( i = 7,2,3,.....) Cantidad de un bien en el per¡odo base : Cant¡dad de un bien en el per¡odo dado ( ¡ = 7,2,3,.....)
po
p qo
q
6,1.2 Clasificación de los Números indices por su conten¡do Según su contenido los números índ¡ces son de dos naturalezas: índ¡ces simples
e
índices compuestos. ó.1
.2.1 indice simple
Son ¡ndicadores que contienen una un¡dad de información; es decir, un solo dato o un solo artículo llamado dado, entre otro dato o artículo llamado base, por 100. Este tipo de índice nos perm¡te analizar la variación de los datos en forma individual.
p = P, ,too,
e=
Po
4, ,,00, qo
y= Piq,
1rool
PoQ o
Ejerc¡cio resuelto: 1) Tomando como año base el 2006, hallar los Índices Simples de: Prec¡o, Cant¡dad y de Valor; con los s¡gu¡entes datos:
Cant¡dad
Prec¡o Años
200 6
2007
2008
2009
200 6
2007
2008
2009
Artículo A
2,50
2,8 0
3,20
2,90
5
I
7
6
)46
WALTER CÉSPEDES RAMíREZ
Solución:
a) Cálculo de Ios Índices de Precio:
p
P' = po
,roo,
'(zooo) = p.----.
Pzo06 pzooe
2,50
D = -"", - Pzool .1zooz¡
P p(roor)
P = rlzoos¡
-
ltoo)
-
(l
-
2'80 (loo)
=
Ll2'oo/o
(loo)=
728'oo/o
2'90 (loo)=
!16'00/o
2,50
3'20 2,50
zooe
Pzoos -"" '
P
(r oo)
zooo
= Pzoog P
- 2J0 (loo¡= 1oo'oo/o
11oo)
OO)
2,50
zooe
b) Cálculo de los Índices de Cantidad:
Q' e= ,,roo,
qo
elroou¡
=
Qzooo
(loo)
=
Qzoot {l zooa
Q(roou) =
100,0olo
5
Qzooe
Qlroor; =
I (100) =
(1oo) =
q 5
(100)
=
{lzoos (1oo) = 7 (100) =5
16o,ovo
14o,oo/o
Q zooo
Qlroor¡
= Qzoog (loo) = 95 Q zooe
17472
(100)
=
t21,oo/o
ESIADíSTICA
II
c) Cálculo de los Índices de valor:
v
p'oouq 2006 P¡Qi y ,, ttoot 1roo) = = ^^.. = z')x5 PzoooQ zooo PoQo
v.,,o,,= P2ooTQzoot ,roo, = +- (r00\ 2'5x5
=
ttg,zoto
(00r ,,r0, = *4 2'5x5
=
17e,2o¡o
P
zooo
zoooQ
v.,oo,,= P2oo.Qzoos
Pzoool ,,,o0",=
zooo
p2oorq2.oe 1roo.¡
=
PzoooQzooo
(100)
=
1e6,so7o
,,00, = !3e,2o/o ]']"f 2'5x5
Como debe haber observado el alumno, todas las operaciones hechas son iguales; es decir, divid¡r una c¡fra dada entre otra c¡fra base, por c¡en. El índice del año base generalmente no se calcula por que siempre la cifra dada es ¡gual a la c¡fra base, por 100. En adelante como las operac¡ones son senc¡llas, con Ia ayuda de la calculadora, se realizarán tales operaciones en la misma calculadora, y solo se escribirá la respuesta final ampl¡ando la tabla de datos, donde se ¡ncluirá el índice ya calculado, tal como se observa en las sigu¡entes tablas:
Precio Años
2006
2007
2008
2009
Artículo A
2,50
2,
B0
3,20 128,O
2,90
Índice de Precios
1OO,O
L,-2,O
116,O
Cant¡dad Años
2006
2007
2008
2009
Artículo A
5
8
7
6
1OO,O
16O,O
t4o,o
L2O,O
200 8
200 9
22,4
77
Índice de Cant¡dad
Valor = Años
Artículo A
Índice de Valor
Precio x Cant¡dad 2006 2007 72,5 22,4 lOO,O L79,2
L79,2
,4
139,2
De esta manera se ahorra tiempo y esfuerzo en el cálculo de los Números Índices. a24BZ
WALTER CÉSPEDEs RAMíREZ
Resolver los siguientes eierc¡cios proPuestos sobre Índices simples:
1) Hallar el índice
del día martes con relac¡ón al lunes: Días
lu
nes
Ma
r7
15
Producción ( Un¡d. )
rtes
Resp:
773,3o/o
2) Hallar el índice del día viernes con relac¡ón al sábado: Días
vternes
sábado
Producción (Un¡d.)
-Lb
10
Resp: 3) Hallar el índ¡ce
160,00lo
del 2009 con relación al 2007: Años
2007
2008
2009
Arroz
2,AO
3,20
2,90
Resp:
103,60lo
4) Hallar el índice del 2008 con relación al 2009: os
2007
2008
2009
Arroz
2,80
3,20
2,90
Añ
ResP:
110,3olo
ó.1 .2.2 índice compuesio
Son indicadores que cont¡enen un conjunto de datos; para calcular estos índices, es conveniente primero dar un tratamiento a los datos, depend¡endo de la modalidad de cálculo. Este t¡po de índ¡ce nos perm¡te analizar la variación de los datos en forma conjunta y por sus características muy marcadas, estos índices se verán en la siguiente lección.
8249§
Lec c¡ón
7
6.2 Métodos para calcular índices Gompue§to§ Existen diferentes manera de cómo calcular un índice compuesto, en esta unidad se verán los más importantes
6,2,1Índices de agregados no ponderados Son indicadores que contienen la suma de una determinada variable; es decil, cuando se tienen varios datos de una misma variable, se juntan los datos correspondientes al periodo dado, luego se dividen entre la suma de los datos del periodo señalado como base, por 100.
Este tipo de índice nos permite analizar la variación de los datos en su conjunto, donde la variación individual no t¡ene importancia; por lo tanto, es út¡l para conocer: el consumo familiar, el consumo en materias primas, el gasto diario o mensual de una persona, etc. pero tiene la desventaja de que una variación en los aftículos de costos bajos no afectan tanto al índice como lo hace una variación de los artículos de costos altos. Otra desventaja de este índice es que, cuando las cantidades tienen unidades diferentes, no se puede calcular el índice de cantidad; por ejemplo, Zcómo sumar 4 litros de leche con 6 kilos de arroz y 20 panes?
p - tr,
Zpo
,,00.,
e=
'n,
Zeo
,roo,
t25lt
u
=
zP,q, zpoqo
,rro,
E
STAD íSI
ICA
II
Ejerc¡c¡o resuelto 1) Tomando como año base el 2006, hallar los Índices de Agregados no ponderados de: Prec¡o, Cant¡dad y de Valor; con las siguientes marcas de un mismo artículo adquirido en el t¡empo:
Precio
\
Artícu los
Cantidad
2006
2007
2008
2009
lvl a
rca Alfa
12,20
12,80
1,9,20
20,90
5
Ma
rca Noly
74 t70
74,40
15,80
76,40
3
77,20
1
1,30
11,5 0
13,20
4
Años
Marca T¡to
2
006
2007
2008
2009
I
6
6
2
7
9
10
11
Solución:
a) Cálculo de los Índices de Precios: Precio Artícu
los \
Años
2006
2007
2
008
2009
Marca Alfa
72,20
12,80
t9,20
20,90
Marca Noly
74,70
14,40
15,80
16,40
Marca Tito
77,20
11,30
11,50
t3,20
37
38,50 LO2,7
46,50
s0,50
t24,O
L34,7
t Índice de Precios
,50
lOO,O
El índ¡ce de precios se ha hallado, div¡diendo las sumas como si fueran índices simples de cada uno de los años dados entre la suma del año base (37,50), por c¡en
b) Cálculo de los Índices de Cantidad: Cant¡dad Artícu
los \
Años
2
¡4arca Alfa
006 5
2007
2008
2009
B
6
6 7
Marca Loly
3
5
2
Marca Tito
4
9
10
11
72
22
18
24
1OO,O
183,3
15O,O
2OO,O
: Índice de Cant¡dad
t252¡
WALTER CÉSPEDES RAM íREZ
c) Cálculo de los Índices de Valor:
valor
Artículos \
Prec¡o x cant¡dad
702,40
2008 775,20
725,40
72,OO
31,6 0
114,80
2006
2007
Marca Alfa
61,0 0
Marca Loly
42,30 44,80
7O7,7O
1
148,10
27 6,70
261,80
1OO,0
LA6t4
t76,4
lvl a
Años
=
rca Tlto E
Índice de valor
2009
145,20
15,0 0
3 B
5,40
260,2
Para el cálculo del índice de valor, primero se debe multiplicar cada precio por su respectiva cantidad (del mismo periodo o año), luego sumar todos valores de cada año; finalmente, el índice se obtiene d¡vid¡endo las sumas de los productos de cada año entre la suma de los productos del año base (148,10), como s¡ fueran índices simples, por c¡en.
Resolver los ejercic¡os propuestos sobre Índices de agregados No Ponderados:
1) Hallar el índice Gastos
de agregados no ponderados tomando como base el 2007: al¡mentos
Vestidos
161,00 742,30
2007 2008
salud
to2,40
ed
ucación
12s,40
45,20
163,80
L22,OO
31,60
ResP: 105,9olo
2) Hallar el índ¡ce de agregados Gastos
a
l¡m
entos
2007
161,00
2008
742,30
no ponderados tomando como base el 2008: Vestidos
702,40 722,00
sa
educación
lud
45,20
16
31,60 Resp
t253t
125,40
.
94,4o/o
3,80
ESTADÍSTICA II
3) Hallar el índice de agregados I
no ponderados tomando como base el 2006: Botones
nsu mos
telas
2006
2161,00
10
2009
3742,30
129,0 0
h
ilos
25,20
3,80
27
,60
ResP: 144,1olo
4) Hallar el índ¡ce Compras
de agregados no ponderados tomando como base el 2007: cuadernos
la p ice
ros
fold
e
r
papel
2007
10
5,00
32,4O
45,20
745,40
2009
140,80
22,OO
61,60
157,80
Resp:116,5vo
6.2.2 Índices de pronedros relat¡vos no ponderados Son ¡nd¡cadores que contienen la suma de los índices simples de una determinada var¡able per¡odo tras periodo; es decir, cuando se tienen varios datos de una misma variable en distintos per¡odos, se calculan los índices ¡ndividuales tal como se calculan los índices simples mult¡plicados por 1OO, luego se suman estos índ¡ces simples y se d¡viden entre el número datos de la variable de cada periodo, para obtener así el p
ro med ¡o.
Este tipo de índice nos permite analizar la var¡ación de los datos en forma indiv¡dual
y a la vez, nos indica como han var¡ado en conjunto. Aquí todos los artÍculos tienen
la
misma ¡mportancia, es decir que no interesa si ha variado un artículo de menor costo o un artículo de mayor costo, simplemente anal¡za la variabilidad entre los artículos. D
I' ' -po
(rool
t
q
1(roo)
_-qo
y!'q' u=-PoQo
i254'
qroot
WALTER CÉSPEDES RAMÍREZ
Ejercicio resuelto 1) Tomando como año base el 2006, hallar los Índices de Promedios Relativos No Ponde-
rados de: Precio, Cantidad
y
de Valor; con las siguientes marcas de ropa:
Cantidad
Precio
\
Artículos
2006
2007
2008
2009
2006
2007
2008
2009
Marca Alfa
12,2O
12,BO
79,2O
20,9O
5
B
6
6
Marca Noly
!4,10
14,4O
15,80
L6,40
3
5
2
7
Marca Tito
71,20
1
1,30
11,50
73,2O
4
9
10
11
Años
Solución:
a) Cálculo de los Índices de Precios: Índices Simples
Precio
Aftículos
\
Años
2006
2007
2009
2008
2006
2007
2008
2009
L57,4
171,3 116,3
Marca Alfa
12,20
12,80
19,20
20,90
100,0
104,9
Marca Noly
L4,70
74,4O
15,80
L6,40
100,0
7O2,7
772,7
Marca Tito
77,2O
11,30
1
1,50
13,2O
100,0
100,9
702,7
777,9
3O7,9
372,2
40515
3OO,O
D.
I -' P = -Po
(roo)
=
P,roou) \zuvu/33
n
p..^^-.
'(2008)=
372'2 3
l24,to/o = --',''-
300 100,0Yo =
P(roor)
=
p,.^^", '(200e)=
405'5 3
¡255¡
-
135,2o/o ---'
307.9
= :
=
LO2,6o/o
ESTADÍSTICA II
b) Cálcuto de los Índices de Cantidad: Índices Simples
Cantidad Artículos
\
Años
2006
2007
2008
2009
2006
2007
2008
2009
Marca Alfa
5
8
6
6
100,0
160,0
120,0
720,O
Marca Noly
3
5
2
7
100,0
166,7
66,7
233,3
Marca Tito
4
9
10
11
100,0
225,0
250,0
275,O
:
3OO,O
55t,7
436,7
628,3
e=
a. (roo) >'t 'Lqo \'"")
e(roo.) -\¿vvvl
.
Q(roor)
300 100,0olo elroor¡ =
= += 3 =
551.7
..-",,
-
436.7 t45,6o/o J5
=
Q(roor)
=
=
3
628.3
=
"
rg3,9o/o
209,4o/o
c) Cálculo de los Índices de Valor: Índices Simples
Valor = Precio x Cantidad 2006
2007
2008
2009
2006
2007
2008
2009
lo2,4o
115,20
725,40
100,0
767,9
188,9
Marca Noly
61,00 42,30
72,00
31,60
114,80
100,0
1.70,2
74,7
205,6 277,4
Marca Tito
44,8O
7O7,7O
115,00
L45,2O
100,0
227,O
256,7
324,1
:
3OO,O
565,1
52O,3
801,1
Articulos \ Años Marca Alfa
>:'1'
(1oo) -
(2006)
3oo
s65.1 3
n
\/"(2oos) -
s20.3 -= L'r,atv 773,4o/o V(roor) = "1zoos¡
3
§256§
-
801.1
^ 3
-
267,00/o --',-
WALTER CÉSPEDES RAMIREZ
Resolver los ejerc¡c¡os propuestos sobre Índices de promedios relat¡vos No Ponderados:
1) Hallar
el índ¡ce de promed¡os relat¡vos no ponderados tomando como base el 2006:
Insumos 2006
2161,00
10
2009
3142,30
telas
Botones
h¡los
3,80
2s,20
129,00
27 ,60
Resp: 126,4olo
2) Hallar el índ¡ce de promed¡os
relat¡vos no ponderados tomando como base el 2007: panta lones
vestidos
ca
2007
1964,00
4B 9,0 0
693,0 0
2009
2245,OO
5
88,00
7B4,OO
Ventas
m¡sas
Resp:115,970
3)
Hallar el índ¡ce de promed¡os relat¡vos no ponderados tomando como base el 2008 Recreación 2
008
2
009
ctne
d
108,00 126,00
iscoteca
co
ncierto
496,00
215,00
2BB,OO
198,00
Resp: 89,00/o
4) Hallar el índ¡ce
de promedios relativos no ponderados tomando como base el 2009
Compras
co rtin
a
s
2008
1108,00
2009
1026,0 0
art. decorativos 4096,00 2988,00
pintu
ra s
1215,0 0
2198,00
Resp: 100,1olo
6.23
Índices de agregados ponderados
Son indicadores de t¡po compuesto porque cont¡enen un valor producto de la multipl¡cac¡ón de prec¡o por cant¡dad. Estos índices a pesar de contener valores no son índices de valor, por que uno de los componentes es una ponderac¡ón o factor del otro; es dec¡r,
que mult¡pl¡ca por igual al numerador que está en el periodo dado y al denominador que está en el per¡odo base, s¡n variar.
,257ñ
E
STAD fST
ICA
II
como los índ¡ces trabajan con dos periodos¡ uno llamado dado y el otro llamado base; los Índices de Agregados Ponderados tienen también dos tipos de ponderaciones, que son:
ó.2.3.1 indice de ogregodos ponderodos por el método de lospeyres Este índice utiliza como ponderac¡ón al periodo base, nos permite analizar la variac¡ón
de los datos en su conjunto, suponiendo que el elemento utilizado como ponderaclón se mantlene constante con relación al periodo base. En el Perú se utiliza el Índice de precios por este método, para calcular el Índice de Precios del consum¡dor conocido como "Costo de Vida".
p, = zP¡qo ' Zpnq
q,
trco\
=
n
rPoq,,,nn, Zpnq
n
El alumno habrá observado en la fórmula, que el índice de prec¡os t¡ene como ponde-
ración a la cantidad en el periodo base, por que son iguales arr¡ba y abajo; y, el índice de cant¡dad tiene como ponderac¡ón al prec¡o, por la misma razón.
Ejerc¡cio resuelto Tomando como año base el 2006, hallar los Índices de Agreqados ponderados por el método de Laspeyres de Precio y de Cantidad; con las s¡guientes marcas de ropa:
Cant¡dad
Prec¡o
los \
2006
2007
2008
2009
Marca Alfa
t2,20
12,80
79,20
20,90
Marca Noly
14,10
74,40
15, B0
t6,40
Marca T¡to
77,20
11,30
1,50
73,20
Artícu
Años
1
2007
2008
2009
8
6
6
3
2
7
4
9
10
11
2006
Solución: Datos del ejercicio con el indicador, que son necesarios para hallar el índice de precio.
Cantidad
Precio 2006
2007
2008
20 09
200 6
2007
2008
2009
p"
p,
p)
p.
qo
q,
q,
q1
Marca Alfa
1,2,20
72,4O
19,20
20,90
5
B
6
6
Marca Noly
74,70
74,40
15,80
76,40
3
5
2
7
lt,20
11,30
11,50
13,20
4
9
10
11
Años
Artículos
Marca
\
fito
Ind icador
75 8
WALTER CÉSPEDES RAM ÍREZ
a) Cálculo de los Índices de Préc¡os: Precio variable por Añ os
Artícu
los
\
Indicador
Marca Alfa Marca Noly Marca T¡to
zp,qn ' -
, _ Lpoqo ,,,"^.
Peoo.,
qo
200 6
2007
2008
2009
p^ q.
p, q"
p, q"
p. qo
61,00 42,30 44,80
64,OO
96,00
104,50
43,20
47
,40 46,00
49,20
45,2O
148,10
752,40
189,40
206,50
r
2,80
0' 00)
t.t.''! (100¡= lse,soro , ,^ , = = !i!l 148,1 148,1
=
s
89.4
ffi11001=727,9o¡o
P,,*n,=
(r00)
=
206.5
ffi(100)=
1o2,eolo
139,ao7o
Datos del ejercicio con el indicador, que son necesar¡os para hallar el índice de cant¡dad.
Cantidad
Precio 2006
2007
2008
2009
2006
2007
2008
2009
po
p,
p,
p3
q.
q,
q,
qr
Marca Alfa
12,20
12, B0
79,20
20,90
5
B
6
6
¡4arca Noly
74,70
74,40
15,80
76,40
3
5
2
l
73,20
4
9
10
11
Años Artícu
los
Marca Tito
\
Ind¡cador
77,2O
11,30
11,50
§259t
ESTADfSTICA II
b) cálculo de los Índices de Cantidad: Cantidad variable por Años
Artículos
\
Marca Alfa Marca Noly ¡4a
rca Tlto
:
^ = :zpnq, q. LPoQo e'oour=
Q,:o*,
2009
p" q,
2008 p" q,
61,00 42,30
97 ,60
73,20
70,50
28,20
73,20 98,70
44,80
100, B0
Lt2,0
723,20
148,10
268,90
273,40
295,10
200 6
p"
Indicador
po
qn
2007
Po
9.
000)
ffi,too,
= 100,0olo o,,"-,=
(100) = 144,1olo = 213.4 l4gi
ffi(100¡= 295.1
Q,,oo,,
1s1,6or"
= ,0r,, (100) = 199,3% _
ó.2.3.2 índice de ogregodos ponderodos por el método de Poosche Este índ¡ce ut¡l¡za como ponderación al periodo dado, nos permite analizar la var¡ación
de los datos en su conjunto, suponiendo que el elemento util¡zado como ponderación varía según el periodo dado (consumo real).
-PD = Lp,q, '"' rtoor Lpoe ¡
-
Qe
Zp,q,
= --j--r-j-- (100) Lp ¡4 o
fórmula, que el ind¡ce de precios tiene como ponderac¡ón a la cant¡dad en el per¡odo dado, por que son iguales arriba y abajo; y, el índice de cant¡dad t¡ene como ponderación al prec¡o, por la misma razón. El alumno habrá observado en la
Ejercicios resueltos Tomando como año base el 2006, hallar los Índices de Agregados ponderados por el método de Paasche de Prec¡o y de Cantidad; con las s¡gu¡entes marcas de ropa:
.l260t
WALTER CÉSPEDES RAMíREZ
Prec¡o
los \
Artícu 1.4
Años
rca Alfa
a
¡4arca Noly rca Tito
lvla
Cant¡dad
2006
2007
2008
2009
2006
2007
2008
12,20
12,80
19,20
20,90
5
B
6
6
t4,t0 tt,20
74,40
15,80
76,40
3
5
2
7
1,50
73,20
4
9
10
11
1,30
1
1
2
009
Solución: Datos del ejercicio con el ¡nd¡cador, que son necesarios para hallar el índice de precio.
Precio
Cant¡dad
2006
2007
2008
2007
p,
p,
2009 pl
200 6
po
qo
q,
2008 q,
2009 q.
Marca Alfa
72,20
12,80
19,20
20,90
5
I
6
6
Marca Noly
14,70
t4,40
15,80
76,40
3
5
2
7
17,2O
11,30
11,50
13,2O
4
9
10
11
Años Artícu
lvla
los \
Indicador
rca Tito
a) Cálculo de los Índices de Precios: Precio variable por Cantidad var. Añ
os
\
Artíc. Ind icad.
Marca Alfa Marca Noly Marca Tito E
P,
2006
2007
2008
009
P.9.
Po 9o
P, Q.
61,00 42,30 44,80
702,40
tol,70
31,60 114,80 1 15,00 745,20
148,10
27 6,70
2
72,00
P, Q,
2
1
15,20
Cantidad var¡able por 2007 p" q,
2008
61,00 42,30
97 ,60
73,20
70,50
28,20
44,8O
10 0, B0
772,O
148,10
268,90
213,40
2
006
Po
725,40
61,80 385,40
po
qo
Po
9,
= Zp¡e, ,too, Zpnq,
Przooer
=
,o*, =
148-l (100)
,4g¡
H
= 10o,oo/o
(r00)
= 122,7"¡. ¡26 L¡
,,,"^,,
= lry 26g,9
oo*, =
#
(too¡
=
(100)
=
1s2,7o/o
13s,6"/"
ESTADf STICA II
Datos del ejerc¡cio con el ind¡cador, que son necesarios para hallar el índice de cant¡dad.
Precio
Cantidad
2006
2007
2008
2009
2006
2007
po
p,
p,
p.
qo
Marca Alfa
72,20
12,80
79,20
20,90
Marca Noly
74,70
74,40
15,80
76,40
Marca Tito
tl,20
11,30
1
1,50
t3,20
4
Añ os
Artículos
\
Indicador
q,
2008 q,
2009 q.
5
8
6
6
3
5
2
7
9
10
11
b) cálculo de los Índices de cantidadr Prec¡o var¡able por Cant¡dad var. Años
Prec¡o var¡able por
qo
2006
2007
2008
2009
2006
2007
2008
2009
Po Qo
p, q,
P, Q,
P, Q,
Po 9o
P,
P, 9o
P:90
lYarca Alfa
61,00
ñ2,44
115,20
125,40
61,00
64,00
96,00
104,50
llarca Noly
42,30
72,00
31,60
114,80
42,30
43,20
47
,40
49,20
44,80
101,70
115,00
145,20
44,80
45,20
46,00
52,80
148,10
276,10
261,80
385,40
148,10
152,40
189,40
206,50
2P,q, Zp,qo
aloo)
Artíc.\ Indicad.
14a
rca Tito
:
^' = \1"
148.1 ftOOi = 100,0olo ffi
QO
276.1
= 15;
(100)
Q,¿ooo,
=
a,.,""^,
(100) = 138,2ou" a,""" = 385.4 (100) = 1s6,6"7" = 261.8 _.. -^_'_ 189,4 206,5
a,.,,,
=
181,2olo
Nota importante: El hecho de haber util¡zado el mismo ejemplo para cas¡ todos los métodos de cálculo de los índ¡ces, obedece ún¡camente a que solo de esta manera, el alumno puede sacar sus propias conclus¡ones sobre las características de cada método.
v2623
WALTER CÉSPEDES RAMíREZ
Resolver los sigu¡entes eiercic¡os propuestos sobre Ind¡ces de Agregados Ponderados:
1) Hallar el índice
de precios de Laspeyres con los sigu¡entes datos:
Precio Artícu los
Cantidad actual
base
actual
base
50
5,20
8, B0
B
74,70
12,40
30
50
c
89,20
91,3 0
40
90
BO
Resp: 105,0
2)
Hallar el índ¡ce de cantidad de Laspeyres con los s¡gu¡entes datos: Cant¡dad
Prec¡o Artículos
base
actu
a
I
base
actua
5,20
B,BO
50
BO
B
74,70
t2,4O
30
50
C
89,2 0
91,3 0
40
90
I
Resp:215,2
3) Hallar el índ¡ce
de precios de Paasche con los siguientes datos:
cantidad
Prec¡o
base
actual
5,20
B,BO
50
BO
B
14,10
t2,40
30
50
C
89,20
91,3 0
40
90
Artícu los
actua
base
I
ResP:104,3
4) Hallar el índice
de cant¡dad de Paasche con los s¡gu¡entes datos:
Cantidad
Prec¡o Artícu los
c
base
actual
5,20
8,80
50
BO
74,rO
72,40
30
50
89,20
91,30
40
90
base
actu
a
I
Resp: 213,7
t26lt
Lección
3
6.3 Camhio de hase del índice Suponiendo que se han elaborados los índices por cualquier método de cálculo y se nos dice que el periodo base utilizado no es el más representativo y se tiene que cambiar de base; cuando se presenta este tipo de situación, no es necesario volver a calcular el índice utilizando otra base, por que se puede utilizar el índice calculado como dato y luego se le da el mismo tratamiento como si fuera un índice simple.
P
- P, ,roq po
e = Q' ,roo, qo
I265
I
u
= V, vo
,roo.,
ESTADÍ5TICA
II
Ejerc¡c¡os resueltos 1) Camb¡ar la base del Índice de Precio para el 2OO8: Prec¡o Años
2006
2007
2008
Índice
1OO,O
to2,7
L24,O
2009 L34,7
solucíónr Todos los índices serán div¡didos entre 124,0 que es la nueva base.
r,"^",
(100¡ ss,6o7o ,,..,, = = ry99 124,0 =
P,,o*,
=
124.0 (100) = 199,so7o ffi
P,,oo,,
= l9?'7 (100) ' 124,0 134.7
=
;24p
(100)
=
s2,so7.
108,6'l"
2) camb¡ar la base del Índice de Cant¡dad para el 2OO8: Cant¡dad Añ
os
indice
2006
2007
200 8
2009
1OO,O
183,3
15O,O
2OO,O
100.0 (l 00) = 66,70/o
Q,,ooo,
= --:---
Q,zoo",
= l50i
Q,^-,
=
1s0.0 (100) = 1ss,so7o Q,.*,, =
183-3
ffi 200.0
l50i
(100)
(100)
3) cambiar la base del Índice de Valor para el 2008.
Valor=
Prec¡o x Cant¡dad
Añ os
200 6
zooT
2008
2009
Índice
1OO,O
146,4
,.76t8
260,2
a)664
= =
722,2'/"
133,3o7o
WALIER CÉSPEDEs RAMíREZ
186.4 v -, = loo.o rtool = 56,60/o vo*r=ffi(100)=10s,4"/" . 176.8
,-,-- = la'8 11ss¡ = 100,0olo 176,8
v,,oo",
260'2
=
iá
000)
=
147,2"/"
Resolver los s¡gu¡entes eiercic¡os Propuestos sobre Camb¡o de Base. 1) ¿Cuál es el índice del 2007 con base al 2008?
Cantidad Añ
os
Índice
200 6
2007
2008
2009
1OO,O
183.3
15O,O
2OOtO
Resp: 122,2 2) ¿Cuál es el índ¡ce del 2009 con base al 2007? Cantidad Años
20 06
2007
2008
2009
Índice
1OO,O
183,3
15O,O
20o,o ResP: 109,1
3) cambiar la base del índ¡ce del martes con relación al jueves:
Valor U IAS
lunes
ma rtes
miércoles
jueves
Índice
100,o
L46,4
176,8
260,2 ResP:71,6
4) camb¡ar la base del Índice del lunes con relación al miércoles:
Valor Días
lunes
Índice
1O0,0
m a
rtes
t86,4
miércoles
jueves
176,4
260,2 Resp: 56,6
&267!
Lección
4
6.4 Uariaeiones del lndice Cuando no se conoce sobre la composición de los Números Índices, es muy fácil engañar al lector. Por ejemplo si se quiere mostrar indicadores o índices con magnitud alta, se utiliza como periodo base, el periodo de menor cuantía; en caso contrario, se utiliza como periodo base el de mayor cuantía; por un lado el lector ve índices bastantes altos y por el otro lado ve índices bajos, sin saber que han sido calculados con la misma información.
La única manera de saber que dos índices de magnitudes diferentes, realmente son iguales por que fueron calculados con la misma información, es mostrando las variaciones que han tenido en el tiempo. Por consiguiente dos índices distintos por su magnitud, son iguales; si tienen las mismas variaciones.
1269a
ESTADíSTICA II
Tales variac¡ones pueden ser de dos t¡pos:
6,4,1Variaciones con relación a un periodo de referencia Este tipo de variac¡ón, se calcula ¡gual como si fuera un cambio de base con la diferenc¡a de que el d¡visor es el índice que corresponde al periodo de referenc¡a, menos 100yo. Al
restar 100 al índice calculado, nos queda la variac¡ón con relación a un periodo de referencia.
Var.
p = P, po
,roo,
,oo
Var.
Q
a
= i|
o¡lt
lroo¡
vatv=h(roo)-roo
loo
Ejerc¡c¡os resueltos 1) Hallar las variac¡ones del índice con relación al 2006.
Precio Añ
os
Indice
2006
2007
2008
lOO,O
1.O2,7
L24,O
2
009
L34,7
soluc¡ón: Todos los índices serán divididos entre 100,0 (índice del 2006) multiplicado por 100, para luego restarle 100.
var,,".^,
= ]!9'o trool-roo= 100,0
var,,nn",
= 100,0 lrool- roo= 2a,o.n
Vts.,,00,)
o,o"/o
12§
var(,oon)
y el resultado
ffi
,roor-,oo=
ffi a cada
,,oor-roo =
=
será
2,7o/o
34,7o/o
Obsérvese que s¡ usted solo hubiera restando 1OO uno de los índices, los resultados serían los mismos; recuerde que esto solo sucede cuando se toma como referencia el año base, en caso contrario es necesario hacer todo el proceso completo.
2) Hallar las variaciones del índice con relación al 2006. Precio Añ
os
Índice
2006
2007
2008
ao,6
42,8
1OO,O
t270,
2
009
104,6
WALTER CESPEDES
RA
íREZ
Solución:
y el resultado
Todos los índices serán d iv¡didos entre 80,6 (índice del 2006) mult¡plicado por 100, para luego restarle 100.
Var.,^^..
lroor roo= o,o% = !!'680.6
Vár12ooe)
=
tá0ólf
oool-ro0
=
Vorl2ooz)
=
Várlzooe) =
24,oo/o
ffi
será
,,oor-to, = r,ro"
198'9 ltoo¡,
to 0
=
34,7o/o
Si usted compara estas var¡aciones con las obten¡das en el ejerc¡cio anterior, inmediatamente se da cuenta de que se tratan de los m¡smos índices, pese a que nominalmente son distintos. 6.4.2 Variaciones con relac¡ón al periodo anterior Este t¡po de variación, se calcula igual como s¡ fuera un cambio de base con la diferencia de que el div¡sor es el índ¡ce que corresponde al periodo anterior, menos 100o/o. Al restar 100 al índice calculado, nos queda la variación con relación al periodo anterior.
Var.
p
=
P, po
,,00,-,oo
var.Q
=
ftrroo,
var.v =
,oo
(Ioo)
,L
roo
El alumno habrá notado que el cálculo de las variac¡ones con el año anter¡or, es la misma
fórmula que se utilizó para ver las variac¡ones con relación a un per¡odo de referencia; es decit que Ia fórmula no ha cambiado, con la salvedad de que ya no se divide entre el índice de un mismo periodo, sino que se divide entre el índice del periodo anter¡or'
Ejercicios resueltos: 1) Hallar las variac¡ones del índice con relación al año anterior.
cant¡dad Añ
os
Índice
var Q
2006
2007
2008
2009
lOO,O
183,3
15O,O
2OO,O
1,oo¡ ,oo = 91 qo
var -^^..
¡271¡
=
.,l
t3'1
100-0
t
rool
-
|
oo
=
83,3%
ESTAD ÍSTICA II
V.rl2ooa)
=
=
t,ool-,oo=-78,2o/o
ff
Var,,nno, t¿ooe)
2i9Q 150,0
1169¡-loo=
33,3o7o
Las var¡aciones con relación al 2006 no se puede determ¡nar, por que se desconoce el índ¡ce del per¡odo anterior.
La variac¡ón del 2008 es negativa, lo que s¡9niñca que el índ¡ce ha disminu¡do en 18,2o/o con relac¡ón al 2007.
2) Hallar las var¡ac¡ones del índ¡ce con relac¡ón al año anter¡or.
Valor
zi vo VáT12oos)
=
Precio x Cant¡dad
Años
2006
2007
2008
2009
Ind¡ce
10o,o
L86,4
t76,A
260,2
186.4
(100)-100
1'6'8,,00, r
=
86,4
-to
loo; o=
-
s.2ok
260.2 VtsT12oos)
=
t7ñ
(loo)-loo=
a6'4ok
(100)-100=
47'2o/o
3) Hallar las var¡aciones del índice con relación al año anter¡or. Precio Años
2006
2007
2008
2009
Índice
lOO,O
to2,7
t24,O
L34,7
Solución: Var.
P
'L po
¡
oo)
-,oo
,,00,-,oo *3 t02,7
= 2o,7eo
Várrroor) =
'02'',loo,-roo= 100,0
var(,00,) =
t\L1 ji-lrl00)-t00 '
t24.0
t)7 2'
2,7o/o
= 8,60/o
WALTER CÉSPEDES RAMíREZ
Resolver los siguientes ejercicios propuestos sobre var¡ac¡ones de los Índices: 1) Hallar la variación del índice del 2009 con relac¡ón al 2007.
Cantidad Añ
2006
2007
200 B
2009
1OO,O
Ll4,?
128,O
243,O
os
Índice
Resp: 112,6
o/o
2) Hallar la variación del índice del 2009 con relación al 2008. Cantidad Años
2006
2007
Índice
1OO.O
L52,4
008
2009
14O,O
156,O
2
Resp: 11,4
o/o
3) Hallar la var¡ación del índ¡ce del miércoles con relación al martes.
valor Días
Índice
nes
ma rtes
1O0,O
L35,4
lu
rn
iércoles
j
t26,4
ueves
L67,2
-
ResP:
6,4Yo
4) Hallar la variación del índice del jueves con relación al miércoles. Valor Días
Índice
lu
nes
1OO,O
m a
rtes
LO6,2
m
iércoles 11,7
JUeVeS
,26,O
,t
o/o.
Resp: 7,6 5) Hallar la variación del índice de octubre con relación a agosto.
valor Meses
Índice
julio 1OO,O
agosto
septiembre
octu bre
134,2
145,5
L61,4
Resp: 20,3
)/:
o/0.
ESTADísr¡ca
l
6) Hallar la variación del índice de agosto con relación a septiembre. Valor Meses
julio
agosto
septiembre
octubre
Índice
1OO,O
134,2
L45,5
16L,4
Resp:
§274§
-
7,8
o/o.
WALTE R CÉSPEDES RAM fREZ
AUIflEVA¡.UAC¡lIN NO$
1)
Hallar el índice simple del café. Año
base
actua
Café
28 00
3250
A) 766,10/o B) 109,90lo
2)
C)
113,5olo
I
116,10/o
D)
E) Ll8,2o/o
Hallar el índ¡ce del azúcar del 2009 con relación al 2007. Añ
os
Azúcar
A) 164,60/o
B)
779,4o/o
3) Hallar el índice de agregados
2008
2
7,40
2,40
2,50
183,5%
C)
D)
186,50/o
E) 178,60/o
no ponderados. transporte
Gastos
al¡mentos
recTeacron
bebidas
Actua
145,50
48,40
74,60
2
140,10
66,7
22,50
22,70
113,50/o
D)
I
Base
A) 707,60/o
4)
009
2007
B)
92,9o/o
C)
116,8%
5,50
E) 118,10lo
Hallar el índ¡ce de agregados no ponderados. Ventas
verduras
frutas
legu mbres
hortalizas
141,00
131,40
55,20
25,40
148,60
722,00
Actual
A)
117,8o/o
5) Hallar
!99,4o/o
C)
7l3,2o/o
D)
84,9o/o
E) tll,4o/o
el índ¡ce de promedios relat¡vos no ponderados tomando como base el 2007'
Gastos
A)
B)
63,80
81,60
a
l¡mentos
recreacton
tra nspo rte
bebidas
2007
14 5,5 0
48,40
74,60
20 0B
140,10
66,70
22,5O
96,60/o
B)
137,8o/o
C)
119,3olo
a)75r
D)
116,10lo
25,50 22,70 E) lO7,4Yo
ESTADíSIICA
6) Hallar
el índ¡ce de promedios relativos no ponderados tomando como base el 2007. Ventas
verduras
frutas
2007
141,0 0
13 1,40
200 8
t48,60
122,OO
A) t22,9o/o
7) Hallar
II
c)
B) 205,4o/o
leg
hortalizas
bres
u m
55,20 B
25,40
1,60
3,80
784,7o/o
D)
749 ,3o/o
6
E) t54,3o/o
el índice de prec¡os por el método de Laspeyres, tomando como base el Precios (promedio) Años
Al¡mentos Tra Ed
2009
2008
2009
15, B0
76,40
3
4
porte
3,50
3,
B0
4
6
ucación
6,10
5,5 0
7
4
16,30
16,80
2
2
103,3%
D)
ns
Otros
A) t02,2o/o
c)
B) 99,9o/o
8) Hallar el índ¡ce de cant¡dad por el método
Años
008
20 09
15,8 0
76,40
3,50
2
Al¡mentos
nsporte
Educación
Otros
A) 103,3%
714,2o/o
Cantidades (prom. ) 2008
2009 4
3,8 0
4
6
6,10
5,5 0
7
4
16,30
16,8 0
2
2
c)
B) 104,7o/o
D)
109,5olo
Precios (promed io)
Otros
A) 105,5olo
como base el
16,40
3
2009 4
2
008
3,50
3,80
4
6
6, 10
5,5 0
7
4
16,3 0
16,8 0
2
2
B) 99,4o/o
c)
t07
427 6a
,7o/o
2OOg.
Cantidades (prom.)
008 15,80 2
Alimentos Tra nsporte Educación
2009
E) 112,7o/o
77111o/o
9) Hallar el índice de precios por el método de paasche, tomando
Añ os
E) 88,7o/o
de Laspeyres, tomando como base el 2OOB.
Precios ( promed io)
Tra
Cantidades (prom, )
008
2
2OOB.
D) 7O4,29o
E) 102,0o/o
WALTE R CÉSPEDES RAMíREZ
10) Hallar el índ¡ce de cant¡dad por el método de paasche, tomando como Cantidades (prom.)
Precios ( promed io) Años
2008
200 9
2008
2009
Alimentos
15,80
t6,40
3
4
3,5 0
3,80
4
6
6,10
5,50
7
4
16,3 0
16, B0
2
2
Tra nspo
rte
Educación
Otros
A)
7O2,Oo/o
B)
105,5olo
101,3%
C)
11) ZCuál es el índ¡ce del 2009 con base al
base el 2008.
D)
174,3o/o
E)
777,Oo/o
2OO7?
Cant¡dad
A)
100,0olo
Años
2006
2007
2008
2009
fndice
1OO,O
113,O
L22,7
L45,3
B)
777,8o/o
C)
729,3o/o
12) cCuál es el índice del 2006 con base al
D)
128,60lo
E) 727,4o/o
2OO8?
Cantidad
A)
100,0%
Años
2006
2007
2008
200 9
Indice
1OO,O
113,O
L22,7
t45,3
B)
97,60/o
C)
81,5olo
D)
108,60lo
E) !22,7o/o
13) Hallar la variac¡ón del índice del 2009 con relación al 2006.
A)
32,2o/o
Añ os
2006
2007
2008
Índice
108,4
LL4,3
128,O
B)
29,7o/o
C)
19,3%
D)
28,60/o
2
009
L4O,6 E) 72,9o/o
14) Hallar la variación del índ¡ce del 2009 con relación al año anterior. Añ
os
Índice A)
72,60/o
B)
2006
2007
2008
108,4
LL4,3
124,O
t0,7o/o
C)
77,7o/o
e717
§
D)
8,5olo
2009 L4Ot6 E) 9,8olo
ESTADíSTICA II
'
15) cEn qué se asemejan los índices de Laspeyres con los índices de Paasche?
A) No hay semejanza entre ambos índices. B) Ambos métodos utilizan la misma ponderación. C) Ambos son índices compuestos no ponderados. D) Ambos utilizan el mismo periodo base en la ponderación. E) Ambos son índices ponderados compuestos.
Respuestas de control l. D, 2. E, 3. B, 4. A,
5. C, 6. C, 7. B, B. A, 9. E, 10. B, I
12784
l. D,
12.
C,
13,
B, 14. E, 15. E
WALTER CÉSPEDES RAMÍREZ
EXP[0nfi§t
AN E§NE
http://es.wikipedia.orglwiki,4\o/oC3o/oBAmero_o/oC3oloADndice
http://www,eumed. neVcursecon/libreria/drm/
I i.
htm
http:/,/buscador. rincondelvago.com/numeros + indices
http://www.monografias.comltrabajos
I | /numind/numind.shtml
üLOSARIfI
r
indicador.
Es una medida de resumen de preferencia estadística, referente a: la cantidad, magnitud o símbolo de un conjunto de parámetros o atributos. Elemento o dato que es utilizado corno referencia para conocer el estado de las unidades de análisis (personas, naciones, sociedades, bienes, etc.). Se utiliza mayormente el los números índices..
periodo base.
Unidad de tiempo en: horas, días, meses, trimestres, años, etc., que se utiliza en el cálculo del número índice como divisor de otro periodo, generando un valor relativo con relación al periodo dlvisor. Se utiliza en el cálculo del número índice.
periodo dado.
Unidad de tiempo en: horas, días, meses, trimestres,
años, etc., que el número índice lo utiliza como dividendo entre otro periodo llamado base. Se utiliza en el cálculo del número índice. ponderac¡ón.
Término utilizado estadíst¡camente para agregar valores adicionales en magnitudes diferentes a una m¡sma variable, de tal manera que exista diferencia dentro de ella. La utiliza la Estadística cada vez que asigne mayor o menor importancia o peso a un dato con relación a otros.
1279a
ESTADíSTICA II
BIBU0§RAF§A BI§ICA
Berenson, Mark l. y David M, Levine (2000) Estadística básica en administración.Madrid, Prentice Hall Ispanoamérica S. A.
Freund, E. John y otros
(1993) Estadística para la administración con
enfoque
moderno. Madrid, Prentice Hall Hispanoamérica S. A. García Pérez, Alfonso
(2008)
Estadística aplicada: conceptos básicos. Madrid, Universidad Nacionalde Educación a Distancia (UNED).
Gómez, Antonio y José M. Sarabia (2006) Estadística actuarial. Teoría y Apticaciones.
Madrid, Pearson Educación. Kasmier, Leonard
J.
(2006) Estadística aplicada a la administración Economía. México, Mc Graw-Hill
/
y
a
Interamericana.
Levine, Richard
I.
(2004) Estadística para Administración y Economía. 7a. Ed. México, Prentice Hall Ispanoamérica S. A.
Lind, Douglas y
otros
(2008) Estadística aplicada a los negocios y a la economía. 13a. Ed. Buenos Aires, Mc Graw-Hill / México D.F., Interamericana.
pMartín Pliego, Francisco Javier
y otros (2006)
Problemas de probabitidad.2a. Ed.
Madrid, Thomson Paraninfo S. A.
Newbold, Paul y William Carlson L. (2008) Estadística para administración y economía. Madrid, Prentice Hall Ispanoamérica S. A, Ropero Morriones, Eva
(2008)
Manual
de
estadística empresarial
(con
Ejercicios
resueltos). Madrid, Delta Publicaciones Universitaria S.
Ruiz-Maya Pérez, losé M.
y otros (2005) Probtemas de inferencra.
L.
Madrid, Thomson
Paraninfo S. A.
Tijero García, Ignacio.
(2009)
Tijero García, Ignacio.
(2009)
Tijero García, Ignacio.
(2009)
Estadística práctica apticada a la calidad: Análisis de varianza y diseño de experimentos. Madrid, CYAN. Estadística práctica aplicada a la catidad: Controt estadístico de los procesos, análisis y mejora. Madrid, CyAN.
Estadística práctica apticada a la catidad: Fundamentos
de la calidad. Madrid, CYAN.
I280¡
WALTER CÉSPEDES RAMíREZ
BIBTItlüRATIA (2007) 100 Problemas resueltos multivariante. Madrid, Delta.
Baíllo Moreno, Amparo
Black,
Ken
Bonet )erez, losé
de
(2005) Estadística en los negocios para decisiones. México, Continente S. A.
Luis
estadística
la toma de
(2004) Lecciones de estadística: estadística descriptiva y probabilidad. Alicante, Club Universitario.
Casas Sánchez, José Miguel
y Julián Santos Peña (2002) Introducción a la estadística par administración y dirección de empresas 2a Ed' Madrid, Universitaria Ramón Areces.
Casas Sánchez, José
Miguel
(1999) Estadística empresarial. Madrid, Universitaria Ramón Areces.
Casas Sánchez, José Miguel
(1997) Inferencia estadística 2a Ed.
Madrid,
Universitaria Ramón Areces.
(1994) Estadística para Ciencias Administrativas.
Chao, Lincoln l.
Santa Fe de Bogotá, Mc Graw Hill. Cristóbal Cristóbal, losé A.
(2003) Lección de inferencia estadística. Zaragoza, Prensas Universitarias de Zaragoza.
Delgado de la Torre, Rosario
(2007) Probabilidad
y
rstadística Para ciencias e
ingeniería. Madrid, Delta. Fernández Fernández, Santiago
y otros (2002) Estadística descriptiva 2a Ed. Madrid, ESIC Editorial.
García Ramos González, Carmen y Gabriel Ruiz Garzón (2006) Estadística administrativa. Cádiz, Universidad de Cádiz' Hernández Bautista,
Agustín
Hoel, l?aul G. y Raymond J.
(2OO7) Curso elemental Madrid, Pirámide.
de estadística descriptiva.
lensen ( 1986) Estadística básica para los negocios y para economía, México D.
F
Compañía Editorial
Continental S. A. Llorente Galera, Francisco
y otros (2001) Inferencia estadística aplicada a la empresa. Madrid, Universitaria Ramón Areces. 128
lr
E
Mateos Apar¡c¡o, Gregoria
Mason, Robert D. y
ICA
II
y Miguel ¡4artín Dávila (2002)
Anál¡s¡s de la var¡anza en la investigac¡ón comercial. Madrid, Pearson Educación.
otros
Mendenhall, William y
STAD ÍST
(2OOO) Estadíst¡ca Alfaomega S. A.
otros
para adm¡n¡stradores.
Madrid,
(2006) Elementos de muestreo. Madr¡d, Thompson Paraninfo S. A.
W¡lliam
Mendenhall,
(7990) Estadística para administradores. Madrid, Grupo Editor¡al Iberoamer¡cana.
Mode, Elmer
B.
(
2ooo) Elementos de probabílidad
y
estadíst¡ca.
México D. F., Reverte Mexicana S. A. Palacios González, Federico
Revuelta, Javier
y Rafael Herrerías Peleguezuelo (2oo7) curso de inferenc¡a estadíst¡ca y del modelo lineal simple.lvladrid, Delta.
y V¡cente Ponsoda (2003)
S¡mulac¡ón de modelos estadísticos en
ciencias soc¡ales. Madr¡d, La Muralla. R¡cardo
cao,
Abad y
Serrano Angulo,
otros
(2001) Introducc¡ón a la estadíst¡ca y sus apl¡cac¡ones. Madrid, P¡rám¡de.
José
(2003) In¡ciación a la estadística bayes¡ana. Maüid, La lYuralla.
Vélez lbarrola,
V¡lela D¡ez,
Ricardo
(2004) Cálculo de probab¡l¡dades 2. Madrid, Ediciones Académ¡cas.
El¡zabeth
Webste, Allen
(2001) Estadíst¡ca básica para univers¡tar¡os. Barañaín, Un¡versidad de Navarra S. A.
L.
(2000) Estadística apl¡cada
a los negoc¡os y
la
economía. Santa Fe de Bogotá, Mc Graw H¡ll.
Zamora Sanz, Ana Isabel
y
otros (2006) Ejercic¡os de estadíst¡ca descript¡va y probab¡l¡dad para la economía y adm¡nistración de empresas. 14adrid, Pirám¡de.
Zamora Sanz, Ana Isabel y otros (2006) Ejercic¡os de inferencia estadística y muestreo
para la economía Madrid, Pirámide.
1282'
y
adm¡n¡stración de empresas.
ANEXOS Tabla 1: Tabla 2: Tabla 3: Tabla 4:
Tabla Tabla Tabla Tabla
รกrea bajo la curva normal
t-student ji-cuadrado de dยกstribuciรณn de Fisher
WALTER CÉSPEDES RAMÍREZ
A
Z
0
0.0000 0,1 0.0398 0,2 0,0793 0,3 0.1179 0,4 0,1554 0,5 0.1915 0,6 0,2257 0,7 0.2580 0,8 0.2881 0,9 0.3159 1,0 0.3413 t,t 0.3643 1,2 0.3849 1,3 0.4032 t,4 0.4192 1,5 0.4332 1,6 0,4452 1,7 0.4554
1
Valores de probabilidad según el área sombreada
De0 aZ 2
0.0080
3
4 0.0160
0.0438 0.0478 0.0517
0,0s57
0.0832
0.0871
0.0910
0,0948
0.1255 0,1628 0.1985 0.2324 0.2642 0.2939
1,8
0.1217 0,1591 0.1950 0.2291 0.2611 0.2910 0.3186 0,3438 0,3665 0,3869 0,4049 0.4207 0.4345 0.4463 0.4564 0.464t 0.4649
1,9
0.47t3 0.47t9
0.1293 0.1331 0,1664 0,1700 0.2019 0.2054 0,2357 0,2389 0.2673 0.2704 0.2967 0,299s 0.3238 0.3264 0.3485 0.3508 0,3708 0.3729 0,3907 0.3925 0.4082 0.4099 0,4236 0.4251 0.4370 0.4382 0.4484 0.4495 0.4582 0.4591 0.4664 0.467t 0.4732 0.4738 0.4788 0.4793 0.4834 0.4838 0.4871 0,4875 0.4901 0.4904 0.4925 0.4927 0.4943 0.494s
2,0
2,t 2,2 2,3 2,4 2,5
2,6 2,7 2,8 2,9 3,0 3,1
3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9
0.4772 0,4821 0.4861 0,4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 0.4987 0.4990 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999 0.s000
0.4778 0,4826 0.4864 0.4896 0.4920 0.4940 0,49s5 0.4966 0.4975 0,4982 0.4987 0.4991 0.4993 0.4995 0.4997 0.4998 0,4998 0.4999 0.4999 0.s000
1
TABLA ÁNEA BAJO LA CURVA NORMAL
0.0120
0,0
0.0040
Tabla
0.32t2 0.3461 0.3686 0.3888 0,4066 0.4222 0.43s7 0.4474 0.4573 0.4656 0.4726 0.4783 0,4830 0.4868 0,4898 0.4922
0.494t 0.4956 0.4967 0.4976 0.4982 0.4987 0,4991 0,4994 0,4995 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000
0.49s7
0.4959
0.4968 0.4977 0.4983 0.4988 0.4991 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999
0,4969
0,s000
0.5000
0,4977 0.4984 0.4988
0.4992 0.4994 0,4996 0.4997 0.4998 0.4999 0.4999 0,4999
r285§
5
0.0199 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3531 0,3749 0.3944 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 0,4798 0.4842 0,4878 0.4906 0.4929 0.4946 0,4960 0.4970 0.4978 0.4984 0.4989 0.4992 0.4994 0.4996 0.4997 0,4998 0.4999 0.4999 0.4999 0.s000
6
7
0.0239 0.0279 0.0636 0.067s 0.1026 0.1064 0.1406 0.t443
8
9
0.0319
0.0359
0.0714 0.1103 0.1480 0.t772 0.1808 0.1844 0.2t23 0.2t57 0.2190
0.0753 0,1141 0.1517 0,1879
0.2224
0.2486 0.25t7 0,2549 0.2794 0,2823 0.2852 0.3078 0,3106 0.3133 0.3340 0.3365 0.3389 0.3577 0.3599 0,3621 0.3790 0,3810 0.3830 0.3980 0.3997 0.4015 0.4147 0.4t62 0.4t77 0.4292 0.4306 0.4319 0.4418 0.4429 0.4441 0,4525 0.4535 0.4545 0.4616 0.462s 0.4633 0.4693 0.4699 0.4706 0.4756 0.4761 0.4767 0.4808 0.4812 0.4817 0.4850 0.4854 0.4857 0,4884 0.4887 0.4890 0.4911 0.4913 0.4916 0.4932 0.4934 0,4936 0.4949 0.49s1 0.4952 0.4962 0,4963 0.4964 0.497t 0.4972 0.4973 0,4974 0.4979 0.4979 0.4980 0.4981 0.4985 0.4985 0.4986 0.4986 0.4989 0,4989 0.4990 0.4990 0.4992 0A992 0.4993 0.4993 0,4994 0.4995 0.4995 0,4995 0.4996 0.4996 0.4996 0.4997 0,4997 0.4997 0.4997 0.4998 0.4998 0.4998 0,4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0,4999 0.4999 0,4999 0.4999 0,4999 0,4999 0.s000 0.5000 0.s000 0.5000
0.2454 0.2764 0.30s1 0.331s 0.3554 0.3770 0.3962 0,4131 0,4279 0.4406 0.4515 0.4608 0,4686 0.4750 0.4803 0.4846 0.4881 0.4909 0.4931 0.4948 0.4961
ESTADÍSTICA II
Tabla 2
TABLA t-STUDENT a\ ,lt.r
(Valores "t", según el área sombreada a una o a dos colas)
(NrvEL DE STGNTFTCACTÓN PARA UNA PRUEBA DE DOS COLAS) 0,20
0,05
0,10
0,02
0,01
0,001
(NrvEL DE STGNTFICACTÓN PARA UNA PRUEBA DE UNA COLA)
0,10
0,05
0,025
0,01
0,005
0,0005
Lea usted el cruce de: la
Grados de LibeÉad
loll 1
2 3
4 5
6 7
I
9 10 11
t2 13
t4 15
16
t7 1B
19 20 2L 22 23
24 25
26 27 28 29
30 40 60 120
columna según nivel de significación con la fila según el grado de libertad
3,078 1,886 1,638 1,533 t.476 ,440 ,415 ,397 ,383 ,372 1,363 1,356 1,350 L,345 t,34t
1,337 1,333 1,330 1,328 1.325 t,323 1,321 1,319 1,318 L,3t6
1,315 t,3t4 1,313 1,311 1,310 1,303 L,296 1,289
6,3t4 2,920 2,353 2,132 2,0t5 t,9L3 1,895 1,860 1,833 L,Bl2 L,796 L,782 1,771 1,761 1,753
L,746 L,740 7,734 L,729 t,725 1,721 1,717 L,714 L,7Lt 1,708
1,706 t,703 t,70t 1,699 t,697 1,684 1,671 1,658
12,706 4,303
3,L82 2,776
2,571 2,447
2,365 2,306 2,262
2,228 2,201 2,179 2,760 2,745
2,L31 2,120 2,L10 2,10L 2,093 2.086 2,080
2,074 2,069 2,064 2,060
2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980
§286§
31,821 6,965 4,54L 3,747 3,365 3,t43 2,998 2,896 2,82L 2.764 2,718 2,681 2,6s0 2,624 2,602
2,583 2,567 2,552 2,539 ) .s)R 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457
2,423 2,390 2,358
63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3.169 3,106 3,055 3,0L2 2,977 2,947
2,92L 2,898 2,878 2,86t ).84\ 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750
2,704 2,660 2,617
636,619 31,598 L2,941 8,610 6,859 5,959 5,405 5,041
4,78L 4,587 4,437 4,318
4,22t 4,L40
4,t03 4,015 3,965 3,892 3,883 3.850 3,819 3,792 3,767
3,745 3,725 3,707 3,690 3,674 3,659
3,646 3,551 3,460
3,373
WALTER CÉSPEDES RAM íREZ
Tabla 3
TABLA JI.CUADRADO (Valores "x,'", según el área sombreada) Lea Usted el cruce de la columna según el área con la fila segÚn los grados de libertad 2 x"
I
2222222
v
J( 1
2 3
4 5 6 7 B
9 10 11
72 13
t4 15
16 77 18 19
20 2L
22 23 24 25 26 27 28 29 30
40 50 60 70
80 90 100
o,sss
I
o,ss X o,srs X oss X
o,so
J(
o,rs
7,BB 6,63 5,02 3,84 2,71 1,32
I
o,so
0,455
10,6 9,2t 7,38 s,99 4,61 2,77 1,39 12,8 11,3 9,35 7,8L 6,25 4,tt 2,37 14,9 13,3 11,1 9,49 7,78 5,39 3,36 16.7 15,1 tz,B 11,1 9,24 6,63 4,35 18,5 16,8 14,4 12,6 10,6 7,84 5,35 20,3 18,5 16,0 t4,L L2,0 9,04 6,3s 22,0 20,t t7,5 15,5 t3,4 t0,2 7,34 23,6 2t,7 19,0 16,9 L4,7 LL,4 8,34 25,2 23,2 20,5 18,3 16,0 t2,s 9,34 24,7 21,9 !9,7 17,3 L3,7 10,3 26,2 23,3 21,0 18,5 l4,B 11,3 27,7 24,7 22,4 19,8 16,0 12,3 29,1 26,1 23,7 27,1 l7,l 13,3 30.6 27.5 25.0 22.3 t8.2 14.3 34,3 32,0 28,8 26,3 23,5 19,4 15,3 33,4 30,2 27,6 24,8 20,5 16,3 35,7 34,8 31,5 28,9 26,0 21,6 17,3 37,2 38,6 36,2 32,9 30,1 27,2 22,7 18,3 40,0 37,6 34,2 3t,4 28,4 23,8 19,3 41,4 38,9 35,5 32,7 29,6 24,9 20,3 42,8 40,3 36,8 33,9 30,8 26,0 2L,3 4,2 41,6 38,1 35,2 32,0 27,1 22,3 45,6 43,0 39,4 36,4 33,2 28,2 23,3 46,9 44,3 40,6 37,7 34,4 29,3 24,3 48,3 45,6 41,9 38,9 35,6 30,4 25,3 49,6 47,0 43,2 40,1 36,7 31,5 26,3 51,0 48,3 44,5 41,3 37,9 32,6 27,3 52,3 49,6 45,7 42,6 39,1 33,7 28,3 53,7 50,9 47,0 43,8 40,3 34,8 29,3 66,8 63,7 s9,3 5s,B s1,8 45,6 39,3 79,5 76,2 7!,4 67,5 63,2 56,3 49,3 92,0 88,4 83,3 79,1 74,4 67,0 59,3 104,2 100,4 95,0 90,5 85,5 77,6 69,3 116,3 112,3 106,6 101,9 96,6 88,1 79,3 L28,3 t24,t llB,L 113,1 107,6 98,6 89,3
26,8 28,3 29,8 31,3 32.8
140,2 135,8 129,6 124,3 118,5 109,1
99,3
,287a
fra,
,(2o,ro r2o,os t'o,ozs I2o,or
r2o,oos
0,102 0,016 0,004 0,001 0,0002 0,000 0,575 0,2tt 0,103 0,051 0,0201 0,010 7,21 0,584 0,352 0,216 0,115 0,072 1,92 1,06 0,7t1 0,484 0,297 0,207 2,67 1,61 1,15 0,831 0,554 0,412
3,45 2,20 1,64 1,24 0,872 0,676 4,25 2,83 2,17 1,69 1,24 0,989 5,07 3,49 2,73 2,18 1,65 7,34 5,90 4,L7 3,33 2,70 2,09 L,73 6,74 4,87 3,94 3,25 2,56 2,16 7,58 5,58 4,57 3,82 3,05 2,60 8,44 6,30 5,23 4,40 3,57 3,07 9,30 7,04 5,89 5,01 4,ll 3,57 10,2 7,79 6,57 5,63 4,66 4,07 11,0 8,5s 7,26 6,26 5,23 4,60 11,9 9,31 7,96 6,91 5,81 5,!4 l2,B 10,1 8,67 7,56 6,41 5,70 L3,7 10,9 9,39 8,23 7,0L 6,26 14,6 ll,7 10,1 8,91 7,63 6,84 15,5 t2,4 10,9 9,59 8,26 7,43 16,3 13,2 11,6 10,3 8,90 8,03 L7,2 l4,o 12,3 11,0 9,54 8,64 18,1 14,8 13,1 lL,7 10,2 9,26 19,0 L5,7 13,8 12,4 10,9 9,89 19,9 16,5 14,6 13,1 11,5 10,5 20,8 17,3 15,4 13,8 12,2 LL,z 21,7 18,1 16,2 14,6 12,9 11,8 22,7 18,9 L6,9 15,3 t3,6 12,5 23,6 19,8 L7,7 16,0 t4,3 13,1 24,5 20,6 18,5 16,8 15,0 13,8 33,7 29,t 26,5 24,4 22,2 20,7 42,9 37,7 34,8 32,4 29,7 28,0 52,3 46,5 43,2 40,5 37,5 35,5 6!,7 55,3 5L,7 48,8 45,4 43,3 7t,L 64,3 60,4 s7,2 53,s 5t,2 80,6 73,3 69,1 65,6 61,8 59,2 90,1 82,4 77,9 74,2 70,1 67,3
Puntos "F" al 1olo Superior
\v\ 1
2 3
4 5
6 7 8 9 10 11
o
t2
N]
13
6 T
15
t4 16 17 1B
19 20
2l 22 23 24 25 30 40 60 120 @
123
4
4052,0 5000,0
5
7
6
s403,0 s525,0 5764,0 s8s9,0
98,5 99,0 99,2 99,2 99,3
99,3
34,t 30,8 29,5 28,7 28,2 27,9 21,2 18,0 16,7 16,0 15,5 15,2 16.3 13.3 12.1 11.4 11.0 10,7 t3,7 10,9 9,78 t2,2 9,55 8,45 11,3 8,65 7,59 10,6 8,02 6,99 10,0 7,56 6,5s 7,21 6,93 6,70 6,51 6,36
6,22 5,95 5,74 5,56 s,42
8,53 6,23 8,40 6,11 8,29 6,01 8,19 5,93 8,10 5,85
5,79 5,19 5,09 5,01 4,94
9,65 9,33 9,07 8,86 8,68
8,02 5,78 4,87 7,95 5,72 4,82 7,BB 5,66 4,76 7,82 5,61 4,72 7,77 5,57 4,68 7,56 5,39 4,51 7,3t 5,18 4,31 7,08 4,98 4,13 6,85 4,79 3,95 6.63 4,61 3,78
9,1s 8,75 8,47 7,85 7,46 7,19 7,07 6,63 6,37 6,42 6,06 s,80 5,99 s,64 5,39 5,67 5,32 5,07 5,41 5,06 4,82 5,21 4,86 4,62 5,04 4,70 4,46 4,89 4,s6 4,32 4,77 4,44 4,Zo 4,67 4,34 4,10 4,58 4,25 4,01 4,50 4,17 3,94 4,43 4,10 3,87 4,37 4,26 4,22 4,18
4,04 3,99 3,94 3,90 3,86
4,02 3,83 3,65 3,48 3,32
3,70 3,51 3,34 3,t7 3,02
4,3t
3,81
3,76 3,71
3,67 3,63 3,47 3,29 3,12 2,96 2,80
8
9
l0
t2
20 24 30 40 60
t5
5928,0 5982,0 6023,0 6056,0 6106,0 6157,0
99,4 99,4 99,4 99,4 99,4 99,4 27,7 27,5 27,3 27,2 27,1 26,9 15,0 14,8 14,7 14,5 14,4 14,2 10,5 10,3 10,2 10,1 9,89 9,72
7,87 6,62 5,81 s,26 4,85
8,26 8,10 6,99 6,84 6,18 6,03 5,61 5,47 5.20 5,06
7,98 6,72 5,91 5,35 4,94
4,89 4,64 4,44 4,28
4,74 4,50 4,30 4,74 4,t4 4,00
4,63 4,54 4,40 4,25 4,39 4,30 4,16 4,01 4,19 4,10 3,96 3,82 4,03 3,94 3,80 3,66 3,89 3,80 3,67 3,s2
4,03 3,93 3,84 3,77 3,70
3,78 3,68 3,60 3,52 3,46
7,72 ,s6 6,47 6,31 5,67 5,52 5,11 4,96 4,71 4,56 7
3,69 3,59 3,51 3,43 3,37
3,55 3,46 3,37 3,30 3,23
3,4t
3,40 3,31 3,35 3,26 3,30 3,21 3,26 3,17 3,22 3,13 3,30 3,17 3,07 2,98 3,12 2,99 2,89 2,80 2,95 2,82 7,72 2,63 2,79 2,66 2,56 2,47 2,64 2,s1 2,41 2,32
3,17
3,03 2,98 2,93 2,89
3,64 3,59 3,54 3,50 3,46
3,89 3,79 3,71 3,63 3,s6 3,51 3,45 3,41 3,36 3,32
3,lZ
3,07 3,03 2,99 2,84 2,66 2,50 2,34 2,18
3,31 3,23 3,15 3,09
2,Bs
2,70 2,52 2,35 2,19 2,04
120
ro
6209,0 6235,0 6261,06287,0 6313,0 6339,0
99,4 99,s 99,5 99,s 99,5 26,7 26,6 26,5 26,4 26,3 26,2 14,0 13,9 13,8 13,7 73,7 13,6 9,55 9,47 9,38 9,29 9,20 9,11 99,s
7,40 7,3t ,23 7,14 6,16 6,07 5,99 5,91 5,36 5,28 5,20 5,12 4,8t 4,73 4,65 4,57 4.4t 4.33 4,25 4,17 7
4,10 4,02 3,94 3,86 3,78 3,70 3,66 3,59 3,51 3,51 3,43 3,35 3,37 3,29 3,2t
7
,06
5,82 5,03 4,48 4,08
6,97 5,74 4,95 4,40 4,00
3,86 3,78 3,69 3,62 3,54 3,45 3,43 3,34 3,25 3,27 3,18 3,09 3,13 3,0s 2,96
3,26 3,18 3,10 3,02 3,16 3,08 3,00 2,92 3,08 3,00 2,92 2,84 3,00 2,92 2,84 2,76 2,94 2,86 2,78 2,69
2,93 7,83 2,75 2,67 2,61
2,84
2,64 2,58 2,54 2,49 2,45
2,55 2,s0 2,45 2,40 2,36
2,46 2,40 2,35
2,88 2,80 2,72 2,83 2,75 2,67 2,78 2,70 2,62 2,74 2,66 2,58 2,70 2,62 2,53
7,55 2,47 2,39 2,30 2,21 2,37 2,29 2,20 2,ll 2,02 2,20 2,12 2,03 1,94 1,84
2,03 1,95 1,86 7,76 1,88 t,79 1,70 1,59
1,66 7,47
2,75
2,66 Z,5B
2,52
2,31
2,27 ,11
o, 71
,53 ??
tt
(.o
ñ
*{ +E !'u
"3 o iri ^o_ oo -o
r¡ tlt g l{
rg E g i flo 9
qd 0 § 9o J.o O. z ñq óa e 'q
nt 1r
-H oro f,.L gm áF
ñ oo
-
u
I
Puntos "F" al 5olo Superior
\v\ 1
2 3
4 5
6 7 8 9 10 11 1',)
13
t4 I
¡.J
15
\o
16
@
-
L7 18 19
)(l 21
22 23
24 25
26 27
28 29 30 40 60
t20 @
1234567 161,4 199,5 215,7 224,6 230,2 234,0 2"i,8 18,51 19,00 19,16 19,25 19,30 19,33 19,15
9,55 9,28 9,12 9,01 8,94 8,89 7,7t 6,94 6,59 6,39 6,26 6,16 6,09 5.6t s.79 5,41 5,19 5,05 4,95 4,88 5,99 5,14 4,76 4,53 4,39 4,28 4,27 5,59 4,74 4,35 4,12 3,97 3,87 ?.79 5,32 4,46 4,07 3,84 3,69 3,58 3,50 5,72 4,26 3,86 3,63 3,48 3,37 3,29 4,96 4,10 3]1 3,48 3,33 3,?? 3,74 4,84 3,98 3,59 3,36 3,20 3,09 3,01 4,75 3,89 3,49 3,26 3,11 3,00 2,91 4,67 3,87 3,4L 3,18 3,03 Z,9Z 2,83 4,60 3,74 3,34 3,11 2,96 2,85 2,76 4.54 3,68 3,29 3,06 2,90 2,79 2,7r 4,49 3,63 3,24 3,01 2,85 7,74 2,66 4,45 3,59 3,20 2,96 2,81 2,70 2,67 4,41 3,55 3,16 2,93 2,77 2,66 2,58 4,38 3,52 3,13 2,90 2,74 2,63 2,54 4,35 3,49 3,10 2,87 2,7r 7,60 :,s1 3,07 2,84 2,6? Z,-1 2,49 4,32 3,47 3,0s 7,82 2,66 2,s5 2,46 4,30 3,44 3,03 2,80 2,64 2,53 2,44 4,28 3,42 3,01 2,78 2,62 2,57 2,42 4,26 3,40 2s9 7,76 2,60 2,49 2,40 4.24 339 4,23 3,37 2,98 2,74 2,59 2,47 2,39 4,Zt 3,35 2,96 2,73 2,57 2,46 2,37 4,20 3,34 2,95 2,71 2,56 2,45 2,36 4,18 3,33 2,93 2,70 2,55 2,43 7,35 4,t7 3,32 2,92 ?.,69 2,53 2,42 2,33 4,08 3,23 2,84 2,67 2,45 2,34 2,25 4,00 3,15 2,76 2,53 2,37 2,25 2,17 3,92 3,07 2,68 2,45 2,29 2,17 2,09 3.84 3.00 2.60 2,37 2,21 2,10 2,01
10,13
I
9
l0 t2 15
20
238,9 240,5 247,9 243,9 245,9 248,0 19,37 19,38 19,40 19,41 19,43 19,45
8,85 8,81 8,79 8,74 8,70 8,66 6,04 6,00 5,96 5,91 5,86 5,80 4,82 4,77 4,74 4,68 4,62 4,56 4,15 4,10 4,06 4,00 3,94 3,87 3,73 3,68 3,64 3,57 3,51 3,44 3,44 3,39 3,35 3,28 3,22 3,15 3,23 3,18 3,14 3,07 3,01 2,94 3.07 3.02 2,98 2,91 2,85 7,77 2,9s 2,90 2,85 2,79 7,72 2,65 2,85 2,80 2,75 2,69 2,62 2,54 2,77 2,71 2,67 2,60 2,53 2,46 2,70 2,65 2,60 2,53 2,46 2,29 2,64 z59_]b_]-fr-J& 2,35 2,59 2,54 2,49 2,42 2,35 2,28 2,55 2,49 2,45 2,38 Z,3L 7,23 2,5t 7,46 2,41 2,34 2,27 2,19 2,48 2,42 2,38 2,31 2,23 2,16 2,45 2,39 2,35 2,28 2,20 Z,!2 7,42 2,37 2,32 2,25 2,r8 2,10 2,40 2,34 2,30 2,23 2,15 2,07 2,37 2,32 2,27 2,20 2,13 2,05 2,36 2,30 2,25 2,78 2,11 2,03 2,34 2,28 2,24 2,t6 2,09 2,0t 7,32 2,77 2,22 2,15 2,07 1,99 2,31 2,25 2,20 Z,l3 2,06 1,97 2,29 2,24 2,79 2,12 2,04 1,96 2,28 2,22 2,lB 7,70 2,03 L,94 2,27 2,2t 2,16 2,09 2,01 1,93 2,18 2,12 2,08 2,00 t,92 1,84 2,10 2,04 1,99 1,92 1,84 1,75 2,02 1,96 1,91 ,83 1,75 1,66 1,94 1,8ti 1,83 1,-5 1,67 L,57
24 30 40 60 120
to
@
249,t 250,1 251,1 752,2 253,3 254,3 19,45 t9,46 79,47 19,48 19,49 19,50
8,62 8,59 8,57 8,55 8,53 5,75 5,72 5,69 5,66 5,63 4,50 4,46 4,43 4,40 4,36 3,81 3,77 3,74 3,70 3,67 3,38 3,34 3,30 3,27 3,73 3,08 3,04 3,01 2,97 2,93 2,86 2,83 2,79 2,75 2,71 2,70 2,66 2,62 2,58 2,54 2,6t 2,57 2,53 2,49 2,45 2,40 2,57 2,47 2,43 2,38 2,34 2,30 2,42 2,38 2,34 2,30 2,25 2,21 2,35 2,3L 2,27 2,22 2,78 7,13 2,29 2,25 2,20 2,16 2,11 2,07 2,24 2,t9 2,15 2,11 7,06 Z,o7 2,19 2,15 2,10 2,06 2,01 1,96 2,75 2,11 )-,06 2,02 1,97 1,92 2,ll 2,07 2,03 1,98 1,93 1,88 2,08 2,04 1,99 1,95 1,90 1,84 2,05 2,0L 1,96 1,92 l,B7 1,81 2,03 1,98 t,94 1,89 1,84 t,7B 2,01 1,96 1,91 1,86 1,81 1,76 1,98 1,94 1,q9 1,84 1,79 1,73 1,96 t,92 1,u7 1,82 1,77 r,71 1,95 1,90 1,85 1,80 1,75 1,69 1,93 . 88 1,84 7,79 7,73 1,67 1,91 1,87 7,92 1,77 l,7l 1,65 1,90 1,85 1,81 1,75 1,70 7,64 1.89 1.84 1,79 1,74 1,68 l,62 1,79 1,74 1,69 1,64 1,5E 1,51 1J0 1,65 1,59 1,53 1,47 1,39 1,61 1,55 1,50 7,43 1,35 L,25 1.57 1,46 39 1 2 1,22 1,00
U}
(O
a o
8,64 5,77 4,53 3,84 3,41 3,L2 2,90 2,74
*{ +E (lr f
rd H t o
iJ
1* H il
I is | Éq i A C A :J o!w-m
I
sf
A
3n =.'
9'b z = o
3H ii J^¡
P5 3Q a -l lc -H
E, Qr
trt .=. !, 'ñ 9rlo a¿
Ettl
áF ñ o o a
*
; ;
{ o
a
;3 'ñ
E
STAD I5T
ICA
II
Tabla 4 (continuación) TABLA DE DISTRIBUCIóN DE FISHER Los grados de l¡bertad de las columnas se refieren al numerador y
los de las filas al denom¡nador
qe:s= ñ-
I 3 6'6-
-i
S or 6- 6- 6' s 6-4-6-6'
.ji;jj
{$-qe-ñ o .E
ñ¡ N- N- N'..i
t,
, sol
do-6-riÉ;
rEl
B-
*l
oi úi 6- di
g 6-dridi
o
d_N_N-.¡i
N- N'N-.i N- N-
=l o.l B o' úi
ñ-
ri
^i
ñ'N'N-
N'N-
-,i
N-d-^¡ñ.i
6i 6i N'N'N-
6i ñ
RaRse
d- d- N- 6i 6i
tsoiúi+Éi
N- ñ- N- 6.i ..i
N-6i^i--j
§ oi 6- r: d;
d'N'N-
N-d-N-N-ñ
¡iru-¡-r-ñ d ó-úi§:6'
N-
^¡
N' -i
¡- ¡'n'¡-
N'..i N-
N'..i -^- -'
ru-
+ 6-6'+'ñ-
¡- ci ¡- -i
d-d-N-ñiñ N.N.^.d.Nt
..,
4290J
^i
Este documento se teminó de imprim¡r en los talleres gráficos de PUNTO Y GRAFIA S.A.C. Av. Del Río '113 Pueblo Libre flelf.:332-2328 Lima - PeÚ