Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Examen final de julio, bloque no 1. Apellidos y nombre:
10-07-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.75 puntos) Qu´e probabilidad hay de acertar la m´axima categor´ıa en el sorteo del euromill´on si se hace una sola apuesta? (5 n´ umeros acertados de 50 posibles y 2 n´ umeros acertados de 11 posibles)
Soluci´ on: A = “acertar el sorteo”, A1 = “acertar la primera parte del sorteo”, A2 = “acertar la segunda parte del sorteo”. P (A) = P (A1 )P (A2 ) = (
2! 1 1 5! )·( )= · = 8.58 · 10−9 . 50 · 49 · 48 · 47 · 46 11 · 10 50 11 5 2
2. (0.5 puntos) Si dos sucesos A y B son excluyentes o incompatibles con probabilidades P (A) y P (B), ¿Cu´al es la probabilidad de su uni´on?
Soluci´ on: P (A ∪ B) = P (A) + P (B).
3. (0.75 puntos) Sean dos Va X e Y independientes, con varianzas V ar(X) y V ar(Y ). La varianza de 2X − 3Y + 1 es: Soluci´ on: V ar(2X − 3Y + 1) = 22 V ar(X) + (−3)2 V ar(Y ) = 4V ar(X) + 9V ar(Y ).
P´agina 1 de 4
Examen final de julio, bloque no 1. – 10-07-2012 (cont.)
4. (0.75 puntos) Demostrar que V ar(X) = E(X 2 ) − (E(X))2 . Soluci´ on: V ar(X) = E((X − E(X))2 ) = E(X 2 + (E(X))2 − 2XE(X)) = E(X 2 ) − (E(X))2 .
5. (3.75 puntos) 5. Si una determinada Va X tiene como funci´on de densidad: {
C sin(x) 0
f (x) =
si π/2 < x < π , en otro caso
se pide: (a) (0.75 puntos) Hallar C para que f sea una funci´on de densidad. Soluci´ on: ∫ ∞ ∫ f (x)dx = −∞
∫
π/2
∫
π
0dx +
∞
C sin(x)dx +
−∞
π/2
π
0dx = −C[cos(x)]ππ/2 = C = 1.
(b) (0.75 puntos) Hallar su funci´on de distribuci´on. Soluci´ on: Si
x < π/2
F (x) = 0, ∫ x π/2 ≤ x ≤ π F (x) = sin(u)du = −[cos(u)]xπ/2 = − cos(x),
Si
π/2
Si
x>π
F (x) = 1.
(c) (0.75 puntos) Hallar su esperanza. Soluci´ on:∫
∫
∞
E(X) =
π
xf (x)dx = −∞
π/2
x sin(x)dx = −[x cos(x)]ππ/2 + [sin(x)]ππ/2 = π − 1.
(d) (0.75 puntos) Calcular la probabilidad de que X tome valores menores que 2. Soluci´ on:
∫
∫
2
P (X < 2) =
2
f (x)dx = −∞
π/2
sin(x)dx = −[cos(x)]2π/2 = − cos(2) + 0 ≈ 0.416.
Otra forma: P (X < 2) = P (X ≤ 2) = F (2) = − cos(2) ≈ 0.416.
P´agina 2 de 4
Examen final de julio, bloque no 1. – 10-07-2012 (cont.)
(e) (0.75 puntos) Sabiendo que X es inferior a 2, calcular la probabilidad de que sea inferior a 1.8. Soluci´ on: P (X < 1.8 ∩ X < 2) P (X < 1.8) P (X < 1.8|X < 2) = = ≈ P (X < 2) P (X < 2)
∫ 1.8
π/2 sin(x)dx
0.416
≈ 0.546.
6. (2 puntos) En un control de calidad de una empresa farmac´eutica se muestrearon al azar 50 vacunas de un lote de 1000 unidades, obteni´endose que 7 de ellas estaban contaminadas (C = “vacuna contaminada”; V = “vacuna v´alida”; C ∗ = “vacuna clasificada como contaminada”; V ∗ = “vacuna clasificada como v´alida”). Del test de calidad que se realiza para determinar la contaminaci´on de una vacuna, se sabe que tiene un 10 % de falsos positivos y un 4 % de falsos negativos. Se pide: (a) (0.5 puntos) Calcular la probabilidad de que una vacuna tomada al azar del lote de 1000 unidades est´e contaminada, suponiendo que la proporci´on de vacunas contaminadas en la muestra es representativa del lote completo. Soluci´ on: P (C) =
7 = 0.14. 50
(b) (0.75 puntos) Calcular la probabilidad de que una vacuna tomada al azar del lote sea clasificada como contaminada Soluci´ on: ∗ P (C ) = P (C ∗ |C)P (C) + P (C ∗ |V )P (V ) = (1 − 0.04)0.14 + 0.1(1 − 0.14) = 0.2204. (c) (0.75 puntos) Si la prueba ha clasificado una vacuna tomada al azar como v´alida, calcular la probabilidad de que salga a la calle estando realmente contaminada. Soluci´ on: P (C|V ∗ ) =
P (V ∗ ∩ C) P (V ∗ |C)P (C) 0.04 · 0.14 = = ≈ 0.00718. ∗ ∗ P (V ) 1 − P (C ) 1 − 0.2204
7. (1.5 puntos) Se estima que en Madrid la temperatura media en el mes de julio sigue una distribuci´on normal con media µ =26o C y desviaci´on t´ıpica σ =5o C. Se pide: (a) (0.75 puntos) Calcular la probabilidad de que en el a˜ no 2012 la temperatura media del o mes de julio supere los 35 C. Soluci´ on: P (X > 35) = P
(
X − 26 35 − 26 > 5 5
) = P (U > 1.8) = 1 − P (U ≤ 1.8) ≈ 0.03593.
(b) (0.75 puntos) Calcular la probabilidad de que la temperatura est´e dentro del intervalo (µ − 3σ, µ + 3σ).
P´agina 3 de 4
Examen final de julio, bloque no 1. – 10-07-2012 (cont.)
Soluci´ on: P (µ − 3σ < X < µ + 3σ) = P (−3 < U < 3) = Φ(3) − Φ(−3) = 2Φ(3) − 1 ≈ 0.9973.
P´agina 4 de 4
ESTADĂ?STICA. ER
1 CURSO. TITULACIONES DE GRADO DE LA ETSI MINAS Examen final de junio, bloque nÂş 1 Apellidos y nombre:
06-06-2012
Grupo:
INSTRUCCIONES:
La duraciĂłn de esta prueba es de 50 minutos.
Las preguntas se deben responder con claridad, precisiĂłn y brevedad en el espacio reservado para ello en la propia hoja de enunciado. Salvo indicaciĂłn contraria en el enunciado de la pregunta, los nĂşmeros reales se deben expresar con tres decimales.
Como material de apoyo para la realizaciĂłn de la prueba se podrĂĄ utilizar Ăşnicamente una calculadora.
Los telĂŠfonos mĂłviles deben estar apagados y guardados.
1. (0.75 puntos) Dado un espacio muestral â&#x201E;Ś infinito no numerable y acotado, se dice que P sigue una distribuciĂłn al azar o equiprobable si la probabilidad de obtener un determinado suceso A es:
P A
med A med Ί
2. (0.75 puntos) Anualmente, el nĂşmero de incendios forestales de superficie quemada superior a 2000 hectĂĄreas ocurridos en EspaĂąa viene dado por una Va con funciĂłn de masa de Poisson,
f (x ) = e â&#x2C6;&#x2019; Îť
Îťx x!
x = 0, 1, 2, ...
de parĂĄmetro Îť = 5. Calcular la probabilidad de que en un aĂąo haya al menos dos incendios forestales de mĂĄs de 2000 ha de superficie quemada.
2 1 0 1 1 0 1 1
1 5 0.9596
5 5 1! 0!
3. (0.5 puntos) Dos sucesos incompatibles son necesariamente (rodear con un cĂrculo): a) Independientes.
b) Dependientes.
c) Complementarios.
d) IdĂŠnticos.
4. (0.75 puntos) Un dado de roll de diez caras tiene cuatro caras con el nº 1, tres caras con el nº 2, dos caras con el nº 3 y una única cara con el nº 4. Se lanza el dado dos veces. Calcular la probabilidad de que la suma de las dos tiradas sea igual a 5.
1
4 3 2 1 0.4, 2 0.3, 3 0.2, 4 0.1 10 10 10 10
, 5 21,43 ∪ 24,13 ∪ 22,33 ∪ 23,23 21,43 + 24,13 + 22,33 + 23,23 0.4 × 0.1 + 0.1 × 0.4 + 0.3 × 0.2 + 0.2 × 0.3 0.2
5. (0.75 puntos) En el experimento del ejercicio anterior, si se sabe que la primera tirada ha salido un 2, calcular la probabilidad de que la suma sea mayor que 4.
, > 4,1ª 2 22,33 + 22,43 0.3 × 0.2 + 0.3 × 0.1 0.3 1ª 2 1ª 2 0.3
, > 4 | 1ª 2
6. (0.75 puntos) Sea una Va X con la función de densidad
Ax −2 + Bx f (x ) = 0
si si
x ∈ [1, 2]
x ∉ [1, 2]
y sea su esperanza E(X)=1.6402. ¿Qué valor deben tomar A y B para que f sea una función de densidad de probabilidad?
#$
$
#$
$
1 1 + " % + 1& + " %2 & 1 2 2
8 1 + " ln 2 + " % & 1.6402 3 3
Resolviendo el sistema resulta " 1 y 1.
7. (0.75 puntos) Enunciar brevemente los dos axiomas de la probabilidad.
1) Si B son excluyentes D B ∩ F ∅H:
∪ B C B
2) Ω 1
8. Varios test de inteligencia sobre una determinada población dieron un cociente intelectual (CI) que sigue una ley normal con media 110 y desviación típica 20. a) (1 punto) De acuerdo a los criterios diagnósticos de los trastornos mentales del DSM-IV-TR, determinar la probabilidad de que una persona elegida al azar tenga algún tipo de retraso mental (CI<70).
89 110 70 110 & : < 2 1 : < 2 1 Φ 2 < 20 20 1 0.97725 0.02275
89 < 70 %
b) (1 punto) ¿Qué intervalo centrado en 110 contendría al 50% de la población?
110 + 6 110 110 6 110 & <:< 110 6 < 89 < 110 + 6 % 20 20 6 6 6 6 6 6 < : < < Φ ; < Φ ; < Φ ; < >1 Φ ; <? ; 20 20 20 20 20 20 6 2Φ ; < 1 0.5 20
Φ;
6 6 0.67 → 6 13.4 < 0.75 → 20 20
9. Sea X la variable aleatoria del tiempo diario (horas) que pasa una persona viendo la televisiĂłn, cuyo modelo de distribuciĂłn no se conoce, pero sĂ se conoce E(X)=2 y Var(X)=9. a) (1 punto) Hallar la probabilidad de que al cabo de un aĂąo una persona haya visto la televisiĂłn durante mĂĄs de 600 horas. UV
T C B BW
X T C X B 365 Ă&#x2014; 2 730
Supuestas las B independientes: Z6[ T â&#x2C6;&#x2018; Z6[ B 365 Ă&#x2014; 3 1095 Por el teorema central del lĂmite: T 730 700 730 & : > 0.91 : < 0.91 > T > 700 % â&#x2C6;&#x161;1095 â&#x2C6;&#x161;1095 0.81859 10. La Va X tiene densidad
1 (2Ď&#x20AC; ) f (x ) =  0
si si
x â&#x2C6;&#x2C6; (â&#x2C6;&#x2019; Ď&#x20AC; , Ď&#x20AC; )
x â&#x2C6;&#x2030; (â&#x2C6;&#x2019; Ď&#x20AC; , Ď&#x20AC; )
a) (1 punto) Hallar su funciĂłn de distribuciĂłn y su funciĂłn de cuantiles.
FunciĂłn de distribuciĂłn: N
I 0 JK â&#x2030;¤ M
1 1 JK â&#x2C6;&#x2C6; P M, MQ + 2 2M R 2M N
I $
I 1 JK M
FunciĂłn de cuantiles: I
1 S â&#x2020;&#x2019; M 2S 1 JK S â&#x2C6;&#x2C6; P0,1Q + 2 2M
b) (1 punto) Calcular su esperanza y su varianza.
X
#$
$
X
#$
$
0 R 2M R
M 3 R 2M R
Z6[ X X
M 3
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Evaluaci´ on continua, prueba no 1. Ma˜ nana. Apellidos y nombre:
22-03-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.4 puntos) Si A y B no pueden suceder a la vez entonces P (AB) =
Soluci´ on: 0
2. (0.4 puntos) Si A y B no pueden suceder a la vez entonces P (A | B) = Soluci´ on: 0
3. (0.4 puntos) Expresado en funci´on de F (x), P (a < X ≤ b) = Soluci´ on: F (b) − F (a)
4. (0.4 puntos) Si X es continua con densidad f (x) entonces c
∫
Rf
(x) dx =
Soluci´ on: c
5. (0.4 puntos) Si X es continua con densidad f (x) entonces E (g (X)) =
P´agina 1 de 4
Evaluaci´ on continua, prueba no 1. Ma˜ nana. – 22-03-2012 (cont.)
Soluci´ on:
∫
∞
g(x)f (x)dx −∞
6. (0.4 puntos) Si X es una variable cualquiera se define V ar (X) =
Soluci´ on: E((X − E(X))2 )
7. (0.4 puntos) Si X es una variable cualquiera entonces V ar (a + bX) =
Soluci´ on: b2 V ar(X) ∑ 8. (0.4 puntos) Si Xi son cualesquiera con esperanzas E (Xi ) = µi entonces E ( ai Xi + c) =
Soluci´ on:
∑
ai µi + c
9. (0.4 puntos) Si X es cualquiera con E (X) = µ y V ar (X) = σ 2 entonces V ar
(
X−µ σ
) =
Soluci´ on: 1
10. (0.4 puntos) Si Xi son∑ independientes con esperanzas E (Xi ) = µ y V ar (Xi ) = σ 2 y si n es grande entonces P ( ni=1 Xi ≤ a) ≈ Soluci´ on:
( ϕ
a − nµ √ σ n
)
P´agina 2 de 4
Evaluaci´ on continua, prueba no 1. Ma˜ nana. – 22-03-2012 (cont.)
11. (2 puntos) En la secci´on de pron´ostico meteorol´ogico de un informativo de televisi´on el locutor dice lo siguiente: “la probabilidad de que llueva el s´abado es del 50 % y la probabilidad de que llueva el domingo tambi´en es del 50 % por lo tanto la probabilidad de que llueva el fin de semana es del 100 %”. ¿Es correcta la afirmaci´on del locutor? Si no lo es, ¿Cu´al es la probabilidad de que llueva en alg´ un momento del fin de semana? Nota: se supondr´a que la proposici´on “que llueva el fin de semana” es cierta si llueve el s´abado o el domingo y que los sucesos llover el domingo y llover el s´abado son independientes. Soluci´ on: Si se denota: A = “que llueva el s´abado” y B = “que llueva el domingo” entonces A ∪ B = “que llueva el fin de semana”. En consecuencia: P (A ∪ B) = P (A) + P (B) − P (AB) = 0.5 + 0.5 − 0.25 = 0.75. Por lo tanto la afirmaci´on del locutor es incorrecta, siendo la probabilidad de que llueva en alg´ un momento del fin de semana igual a 0.75. 12. (2 puntos) Sea X una variable aleatoria discreta y sea f la funci´on definida por { k 2|x| si x ∈ {−2, −1, 1, 2} , k ∈ lR. f (x) = 0 si x ∈ / {−2, −1, 1, 2} (a) (0.5 puntos) ¿Qu´e valor debe tomar k para que f sea la funci´on de masa de X? Soluci´ on: Sup´ongase que se denota por x1 = −2, x2 = −1, x3 = 1, x4 = 2 a los cuatro puntos del conjunto S = {−2, −1, 1, 2} en los que f toma valores no nulos. Entonces: 4 ∑ i=1
3 2 f (xi ) = k = 1 ⇒ k = ≈ 0.667. 2 3
(b) (1.5 puntos) Si F es la funci´on de distribuci´on de X, ¿cu´anto vale F (0)? Dib´ ujese una gr´afica de la funci´on F en el intervalo [−3, 3]. Soluci´ on: 3 1 F (0) = P (X ≤ 0) = f (−2) + f (−1) = k = = 0.500. 4 2 F(x) 1 5/6 1/2
1/6 −3
−2
−1
0
1
2
3
x
Figura 1: Dibujo de la funci´on F en el intervalo [−3, 3]
P´agina 3 de 4
Evaluaci´ on continua, prueba no 1. Ma˜ nana. – 22-03-2012 (cont.)
13. (2 puntos) Un oleoducto se forma uniendo tramos de tuber´ıa cuya √ longitud Xi var´ıa aleatoriamente seg´ un una distribuci´on desconocida con E(Xi )=5m y V ar(Xi )=0.5m. Calcule, aproximadamente, la probabilidad de que uniendo 1000 tramos de manera independiente se ∑ complete una longitud L = 1000 X i superior a 5010m. i=1 Soluci´ on:
√ ∑ E(Xi ) = 5m, Var(Xi ) = 0.5m. Aplicando el teorema central del l´ımite, L = 1000 i=1 Xi se puede √ aproximar mediante una variable aleatoria normal con E(L) = 1000 × 5 = √ 5000m y Var(L) = 1000 × 0.5 ≈ 15.811m. Entonces: P (L > 5010) ≈ P (U > 0.63246) = 1 − Φ(0.63246) ≈ 0.264.
P´agina 4 de 4
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Evaluaci´ on continua, prueba no 1. Tarde. Apellidos y nombre:
22-03-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.4 puntos) Si A y B no pueden suceder a la vez entonces P (A ∪ B) = Soluci´ on: P (A) + P (B)
2. (0.4 puntos) Si A y B pueden suceder a la vez entonces P (A ∪ B) = Soluci´ on: P (A) + P (B) − P (AB)
3. (0.4 puntos) Si A y B son independientes entonces, expresado en funci´on de P (A) y P (B), P (Ac B) = Soluci´ on: (1 − P (A))P (B)
4. (0.4 puntos) La funci´on de distribuci´on de X se define F (x) = Soluci´ on: P (X ≤ x)
5. (0.4 puntos) Si X es continua, expresado en funci´on de la densidad f (x), P (a < X < b) =
P´agina 1 de 4
Evaluaci´ on continua, prueba no 1. Tarde. – 22-03-2012 (cont.)
Soluci´ on:
∫
b
f (x)dx a
6. (0.4 puntos) Si X es continua con densidad f (x) se define E (X) =
Soluci´ on:
∫
∞
xf (x)dx −∞
( ) 7. (0.4 puntos) Si X tiene E (X) = µ y V ar (X) = σ 2 entonces E X 2 =
Soluci´ on: σ 2 + µ2
8. (0.4 puntos) Si X es una variable cualquiera entonces E (a + bX) =
Soluci´ on: a + bE(X)
9. (0.4 puntos) Si Xi son independientes con varianzas V ar (Xi ) = σi2 entonces V ar (
Soluci´ on:
∑
∑
ai Xi + c) =
a2i σi2
10. (0.4 puntos) Si X es cualquiera con E (X) = µ y V ar (X) = σ 2 entonces E
Soluci´ on: 0
P´agina 2 de 4
(
X−µ σ
) =
Evaluaci´ on continua, prueba no 1. Tarde. – 22-03-2012 (cont.)
11. (2 puntos) Se desea estudiar la validez de una nueva prueba cl´ınica para la detecci´on de cierta enfermedad, cuya prevalencia en la poblaci´on bajo estudio es de un 10 %. La prueba puede dar positivo o negativo. En el primer caso el individuo se clasifica como enfermo (E ∗ ) y en el segundo como sano (S ∗ ). Para la prueba se conocen los porcentajes de falsos positivos (la prueba da positivo estando el individuo sano) y de falsos negativos (la prueba da negativo estando el individuo enfermo), que resultan ser 4 % y 15 % respectivamente. Se pide calcular los valores predictivos positivo (probabilidad de que un individuo est´e enfermo (E) si la prueba ha dado positivo) y negativo (probabilidad de que el individuo est´e sano (S) si la prueba ha dado negativo) de la prueba.
Soluci´ on: Prevalencia = P (E) = 0.1. Falso positivo = P (E ∗ |S) = 0.04. Falso negativo = P (S ∗ |E) = 0.15. Valor predictivo positivo: P (E|E ∗ ) =
P (E ∗ |E)P (E) (1 − 0.15)0.1 = ≈ 0.702. ∗ ∗ P (E |E)P (E) + P (E |S)P (S) (1 − 0.15)0.1 + 0.04(1 − 0.1)
Valor predictivo negativo: P (S|S ∗ ) =
P (S ∗ |S)P (S) (1 − 0.04)(1 − 0.1 = ≈ 0.983. ∗ ∗ P (S |S)P (S) + P (S |E)P (E) (1 − 0.04)(1 − 0.1) + 0.15(0.1)
12. (2 puntos) Dada la funci´on f : R → R tal que f (x) = k/x si x ∈ (1, 2) y f (x) = 0 si x∈ / (1, 2), se pide contestar a las dos preguntas siguientes. (a) (1 punto) Determinar el valor de k para que f sea una funci´on de densidad de probabilidad. Soluci´ on:
∫ 1
2
1 k dx = k[ln x]21 = k ln 2 = 1 ⇒ k = ≈ 1.443. x ln 2
(b) (1 punto) Si X es una variable aleatoria cuya funci´on de densidad es f , determinar el cuantil de orden 0.95 (x0.95 , el n´ umero real tal que F (x0.95 ) = 0.95). Soluci´ on: 1 F (x0.95 ) = P (X ≤ x0.95 ) = ln 2
∫
x0.95
1
1 1 du = ln x0.95 = 0.95 ⇒ u ln 2
x0.95 = 20.95 ≈ 1.932. 13. (2 puntos) El volumen de ventas diarias de una empresa (expresado en miles de euros) es una variable aleatoria X con E(X) = 100 Ke y Var(X) = 4.1(Ke)2 . Determinar, aproximadamente, la probabilidad de que a lo largo de un periodo de 100 d´ıas, el volumen de ventas supere 10005Ke, suponiendo que el volumen de ventas de cada d´ıa es independiente del de los restantes.
P´agina 3 de 4
Evaluaci´ on continua, prueba no 1. Tarde. – 22-03-2012 (cont.)
Soluci´ on: Xi = volumen de ventas diarias de una empresa. E(Xi ) = 100 Ke, Var(Xi ) = 4.1(Ke)2 . Z = Volumen ∑de ventas en un periodo de 100 d´ıas. Aplicando el teorema central del l´ımite, Z = 100 mediante una i=1 Xi se puede aproximar √ √ √ variable aleatoria normal con E(Z) = 100 × 100 = 10000 Ke y Var(Z) = 100 × 4.1 ≈ 20.249 Ke. Entonces: P (Z > 10005) ≈ P (U > 0.247) = 1 − Φ(0.247) ≈ 0.401.
P´agina 4 de 4
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Examen final de julio, bloque no 2. Apellidos y nombre:
10-07-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.5 puntos) Si (X1 , X2 , ..., Xn ) es (una aleatoria de una Va X con E (X) = µ y ) muestra 2 2 V ar (X) = σ , demuestre que V ar X = σ /n Soluci´ on: Cap´ıtulo 5, secci´on 5.3
2. (0.5 puntos) Si X tiene densidad exponencial de par´ametro λ demuestre que X es insesgado para 1/λ Soluci´ on:
( ) Se sigue de que E (X) = 1/λ (vea el formulario) y E X = E (X).
3. (0.5 puntos) (cont.) ¿Cu´anto vale su varianza? Soluci´ on:
ya que
( ) 1 V ar X = nλ2 ( ) V ar (X) V ar X = n
y (vea el formulario) V ar (X) =
1 λ2
4. (1.5 puntos) La Va X tiene densidad { λ exp (−λ (x − θ)) si x > θ f (x) = 0 si x ≤ θ P´agina 1 de 5
Examen final de julio, bloque no 2. – 10-07-2012 (cont.)
para la cual es E (X) = θ + V ar (X) =
1 λ
1 λ2
Estime los par´ametros λ y θ por el m´etodo de los momentos y calcule las estimaciones con la muestra (1, 7, 4).(con 1 decimal)
Soluci´ on: V ar (X) =
1 λ2
λ =
√
b = λ
1 V ar (X)
1
√ 1 n
θ = E (X) − θb =
=√
∑
Xi2 −
1 λ√
1∑ Xi − n
1 E (X 2 ) − (E (X))2
(1 ∑ n
Xi
1∑ 2 Xi − n
)2
( ∑ )2 1 Xi n
Con la muestra (1, 7, 4) es 1∑ xi = (1 + 7 + 4) /3 = 4 n ( ) 1∑ 2 xi = 12 + 72 + 42 /3 = 22 n y resultan las estimaciones 1 ≈ 0.4 22 − 42 √ θb = 4 − 22 − 42 ≈ 1.6
b = λ
√
5. (0.5 puntos) T1 y T2 son estimadores insesgados de la magnitud µ. Compruebe que el estimador combinado T = αT1 + (1 − α) T2 es tambi´en insesgado. Soluci´ on: E (T1 ) = E (T2 ) = µ pues son insesgados. Por su parte (esperanza de una combinaci´on lineal) E (T ) = αE (T1 ) + (1 − α) E (T2 ) y resulta E (T ) = αµ + (1 − α) µ = µ
P´agina 2 de 5
Examen final de julio, bloque no 2. – 10-07-2012 (cont.)
6. (1 punto) (cont.) Los estimadores tienen distinta precisi´on: V ar (T1 ) = 1 y V ar (T2 ) = 2 y son independientes. Halle el valor del peso α que hace m´ınima V ar (T ) y calcule dicho valor m´ınimo.
Soluci´ on: Varianza de una combinaci´on lineal de Vas independientes: V ar (T ) = α2 V ar (T1 ) + (1 − α)2 V ar (T2 ) = α2 + 2 (1 − α)2 que es una funci´on de α continua y diferenciable (par´abola positiva). Para hallar el α que la hace m´ınima d V ar (T ) = α − 2 (1 − α) = 0 → α = 2/3 dα y el valor m´ınimo es
( )2 ( )2 2 1 6 2 V ar (T ) = +2 = = 3 3 9 3
( √ ) 7. (0.5 puntos) (cont.) Si T1 es N (µ, 1) y T2 es N µ, 2 , y son independientes, ¿cu´al es la distribuci´on del estimador T anterior (el de varianza m´ınima)?
Soluci´ on:
( √ ) T (combinaci´on lineal de Vas normales independientes) es N µ, 23 .
8. (2 puntos) (cont.) Construya un intervalo de confianza 1 − α para µ. Calc´ ulelo si se dispone de dos medidas particulares t1 = 10 y t2 = 8, con 1 − α = 0.95. Soluci´ on: Como
T −µ √ ∼ N (0, 1) 2/3 (
es P
−u1−α/2
T −µ < u1−α/2 < √ 2/3
) =1−α
y despejando µ ( P
√ T − u1−α/2
2 < µ < T + u1−α/2 3
√ ) 2 =1−α 3
La estimaci´on de µ es t=
2 1 × 10 + × 8 ≈ 9.3 3 3
P´agina 3 de 5
Examen final de julio, bloque no 2. – 10-07-2012 (cont.)
y el error 1 − α = 0.95 u1−α/2 = u0.975 = 1.96 √ √ 2 2 ε = u1−α/2 = 1.96 × = 1.6 3 3 9. (1.5 puntos) La resistencia a la compresi´on (en Nmm−2 ), en probetas de hormig´on de 28 d´ıas de curaci´on se modeliza como una ∑ variable aleatoria ∑ 2 X ∼ N (µ, σ). Con una muestra de 30 probetas de X se ha obtenido xi = 976.5 y xi = 32021. Estime un l´ımite x tal que P (X > x) ≥ 0.95 con una confianza del 95 % (es decir, al menos el 95 % del hormig´on colocado en obra posee, a los 28 d´ıas, una resistencia igual o mayor que x con una confianza del 95 %) (con 2 decimales). Soluci´ on: El l´ımite inferior buscado (de tolerancia) es de la forma x = x − k × s donde k = 2.220 en la tabla VI. 976.5 x= 30 y v ( n ) √ ( u ) (∑ )2 ∑ u 1 1 1 1 2 t 2 Xi − 32021 − × 976.5 = 2.852252588 s= Xi = n−1 n 29 30 i=1
x−k×s=
976.5 − 2.220 × 2.852252588 ≈ 26.22 Nmm−2 30
10. (1.5 puntos) Para estimar la proporci´on p de piezas defectuosas en una linea de producci´on se examina un lote de 1000 resultando 10 defectuosas. Calcule un intervalo aproximado para p de confianza 95 %.(redondeado a 3 decimales). Soluci´ on: El intervalo es (secci´on 6.4 del Cap´ıtulo 6) ( √ p∈
x ± u1−α/2
x (1 − x) n
)
1 − α = 0.95 u1−α/2 = u0.975 = 1.96 10 = 0.01 x = 1000 √ 0.01 × 0.99 ε = 1.96 × ≈ 6.1 × 10−3 1000
P´agina 4 de 5
Examen final de julio, bloque no 2. – 10-07-2012 (cont.)
y el intervalo resulta p ∈ (0.004, 0.016) con una confianza del 95 %.
P´agina 5 de 5
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Examen final de junio, bloque no 2. Apellidos y nombre:
06-06-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
Nota: En las cuestiones 1 a 4 (X1 , X2 , ..., Xn ) es una muestra aleatoria de una Va X con E (X) = µ y V ar (X) = σ 2 . ( ) 1. (0.5 puntos) ¿Cu´anto vale V ar X ? Soluci´ on: σ2 n
2. (0.5 puntos) ¿Cu´anto vale E Soluci´ on: E
(( ) ) 2 X ?
(( ) ) ( ) ( ( ))2 σ 2 2 X + µ2 = V ar X + E X = n
3. (0.5 puntos) ¿Cu´anto vale E
( ∑( 1 n
Xi − X
)2 )
?
Soluci´ on: n−1 2 σ n
4. (1.5 puntos) A partir de la identidad ( ) ( ) (Xi − µ) = Xi − X + X − µ demuestre que
∑
(Xi − µ)2 =
∑(
Xi − X
P´agina 1 de 4
)2
( )2 +n X −µ
Examen final de junio, bloque no 2. – 06-06-2012 (cont.)
Soluci´ on: Elevando al cuadrado: ( )2 ( )2 ( )( ) (Xi − µ)2 = Xi − X + X − µ + 2 Xi − X X − µ Sumando: ∑ Pero ∑(
(Xi − µ)2 =
Xi − X
)(
∑(
Xi − X
)2
+
∑(
∑( )2 )( ) X −µ +2 Xi − X X − µ
) ) ( )∑( ) ( ) (∑ X −µ = X −µ Xi − X = X − µ Xi − nX = 0
y resulta lo propuesto.
5. (0.5 puntos) Si T es un estad´ıstico tal que E (T ) = 2θ + 1 forme a partir de ´el un estimador insesgado para θ
Soluci´ on: T −1 2
6. (0.5 puntos) Si X ∼ N (µ, σ) y n = 20 halle el n´ umero a ( ) X −µ √ < a = 0.95 P −a < S/ n
Soluci´ on: La distribuci´on de
X−µ √ S/ n
es Student(19) as´ı que a = t0.975 (19) = 2.0930
7. (0.5 puntos) (cont.) Si x = 10 y s = 0.1, d´e un intervalo para µ
Soluci´ on: Despejando µ queda ( P
S S X − a√ < µ < X + a√ n n
) = 0.95
y sustituyendo ( µ∈
0.1 0.1 10 − 2.0930 × √ , 10 + 2.0930 × √ 20 20
con una confianza del 95 %.
P´agina 2 de 4
) = (9.953, 10.047)
Examen final de junio, bloque no 2. – 06-06-2012 (cont.)
8. (0.5 puntos) Si X ∼ N (µ, σ) y n = 20 halle el n´ umero a ( ) (n − 1) S 2 P < a = 0.95 σ2
Soluci´ on: La distribuci´on de
(n−1)S 2 σ2
es ji-cuadrado(19) as´ı que a = χ20.95 (19) = 30.1435
9. (0.5 puntos) (cont.) Si x = 10 y s = 0.1 d´e un l´ımite inferior para σ
Soluci´ on: Despejando σ queda
( √ P
S
n−1 <σ a
y sustituyendo
√ σ > 0.1 ×
) = 0.95
19 = 0.0794 30.1435
con una confianza del 95 %.
10. (0.5 puntos) A partir de una muestra (x1 , x2 , .., xn ) de una Va X con funci´on de densidad (de Pareto) a f (x) = a+1 x > 1 x cuya esperanza es a a>1 E (X) = a−1 hallar la estimaci´on de a por el m´etodo de los momentos.
Soluci´ on: Estimando E (X) por x y denotando b a la estimaci´on de a x=
b a x →b a= b a−1 x−1
11. (1.5 puntos) (cont.) Hallar la estimaci´on de a por el m´etodo de m´axima verosimilitud.
Soluci´ on: La funci´on de verosimilitud (densidad de probabilidad de la muestra como funci´on de a) es ∏ ∏ a ∏ 1 n L (a) = f (xi ) = a+1 = a xi xa+1 i
P´agina 3 de 4
Examen final de junio, bloque no 2. – 06-06-2012 (cont.)
y hay que hallar el a que la hace m´axima. Es m´as c´omodo maximizar ln L (a) ∑ ln L (a) = n ln a − (a + 1) ln xi derivando e igualando a cero d ln L (a) n ∑ n = − ln xi = 0 → b a= ∑ da a ln xi que corresponde a un m´aximo pues n d2 ln L (a) =− 2 <0 da2 a 12. (0.5 puntos) (cont.) Hallar la estimaci´on de E (X) por el m´etodo de los momentos. Soluci´ on: La estimaci´on es x 13. (0.5 puntos) (cont.) Hallar la estimaci´on de E (X) por el m´etodo de m´axima verosimilitud. Soluci´ on: Por la propiedad de invariaci´on la estimaci´on es b a b a−1 donde b a es la estimaci´on de m´axima verosimilitud de a. 14. (1.5 puntos) (cont.) Calcular las estimaciones anteriores con la muestra (1.11, 1.47, 1.48, 1.49, 1.56, 1.05, 13.38, 1.83, 4.51, 1.20). Soluci´ on: La estimaci´on de E (X) por el m´etodo de los momentos es 1.11 + 1.47 + 1.48 + 1.49 + 1.56 + 1.05 + 13.38 + 1.83 + 4.51 + 1.20 x= = 2.908 10 La estimaci´on de a por el m´etodo de los momentos es x 2.908 b a= = = 1.5241 x−1 2.908 − 1 La estimaci´on de a por el m´etodo de m´axima verosimilitud es n 10 b a= ∑ = = 1.5014 ln xi 6.6606 La estimaci´on de E (X) por el m´etodo de m´axima verosimilitud es b a 1.5014 = = 2.9944 b a−1 1.5014 − 1
P´agina 4 de 4
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Evaluaci´ on continua, prueba no 2. Ma˜ nana. Apellidos y nombre:
03-05-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
( ) 1. (0.5 puntos) Demuestre que para una muestra aleatoria de tama˜ no n, V ar X = Soluci´ on: ( ) V ar X = V ar
(
1∑ Xi n n
i=1
)
V ar(X) . n
n 1 ∑ 1 = 2 V ar(Xi ) = V ar(X). n n i=1
2. (0.5 puntos) Dados dos estimadores insesgados, T1 y T2 , de un cierto par´ametro θ y tales que V ar(T1 ) > V ar(T2 ). ¿Cu´al de los dos tiene un error cuadr´atico medio m´as peque˜ no?, ¿cu´anto vale? Soluci´ on: T2 ,
V ar(T2 ).
3. (0.5 puntos) Un estimador T converge en probabilidad a θ si se cumple: Soluci´ on: 1) l´ım E(T ) = θ, n→∞
2) l´ım V ar(T ) = 0, n→∞
n = tama˜ no de la muestra aleatoria.
4. (0.5 puntos) Si la estimaci´on de M´axima Verosimilitud de un cierto par´ametro p es pˆ, ¿cu´al es la estimaci´on de M´axima Verosimilitud de p2 + 3p? Soluci´ on: pˆ2 + 3ˆ p.
P´agina 1 de 4
Evaluaci´ on continua, prueba no 2. Ma˜ nana. – 03-05-2012 (cont.)
5. (0.5 puntos) Dada una muestra de n elementos, ¿un intervalo de confianza del 99 % tiene mayor o menor longitud que uno del 95 %?
Soluci´ on: Mayor.
6. (0.5 puntos) Si deseamos estimar un intervalo de confianza para la media de una distribuci´on normal con σ desconocida, ¿debemos usar la distribuci´on de Student o la Ji-cuadrado?
Soluci´ on: La de Student.
7. (0.5 puntos) Si [a, b] es un intervalo de confianza 1 − α para un par´ametro θ de una variable aleatoria X, ¿qu´e relaci´on hay entre [a, b] y θ?
Soluci´ on: θ ∈ [a, b] con confianza 1 − α
´o (equivalente) P (A < θ < B) = 1 − α
A, B : estad´ısticos cuyas realizaciones son, respectivamente, a y b. 8. (1.5 puntos) Una variable aleatoria X tiene una funci´on de distribuci´on F (x) = 1 − e−λx (x > 0). El par´ametro λ es desconocido aunque se sabe que solo puede valer 0.75 ´o 2. Una muestra de tama˜ no 1 ha resultado en un valor comprendido entre 1.7 y 2.6. Estime el par´ametro usando el principio de m´axima verosimilitud.
Soluci´ on: La funci´on de verosimilitud es: L(λ|x) = P (1.7 < X < 2.6) = F (2.6) − F (1.7) = e−1.7λ − e−2.6λ . Por otro lado L(0.75|x) = e−1.7(0.75) − e−2.6(0.75) ≈ 0.137 y L(2|x) = e−1.7(2) − e−2.6(2) ≈ 0.028, de donde se deduce que L(0.75|x) > L(2|x) y la estimaci´on del par´ametro es ˆ = 0.75 λ 9. (2 puntos) Sea una Va X de Poisson de par´ametro λ. (a) (1.5 puntos) Halle el estimador MV de λ con una muestra de tama˜ no n.
P´agina 2 de 4
Evaluaci´ on continua, prueba no 2. Ma˜ nana. – 03-05-2012 (cont.)
Soluci´ on: ) (∏ ) ∑ λx i 1 = e−nλ λ xi xi ! xi ! (∏ ) ∑ 1 ln L(λ|x) = −nλ + xi ln λ + ln xi ! d ln L nx (λ|x) = −n + =0 dλ λ b = x λ L(λ|x) =
∏(
e−λ
que corresponde a un m´aximo pues nx d2 ln L (λ|x) = − 2 < 0 dλ2 λ
∀λ
El estimador de m´axima verosimilitud es X. (b) (0.5 puntos) Halle el estimador de MV de
1 λ.
Soluci´ on: Si el estimador de MV de λ es X entonces, aplicando el principio de invariaci´on, el de 1/λ es 1/X. 10. (3 puntos) En un examen, evaluado de 0 a 10 puntos, han tomado parte todos los alumnos de una clase. Se sabe que la distribuci´on de las calificaciones del examen sigue una normal N (µ, σ) con par´ametros µ y σ desconocidos. El profesor corrige los 10 primeros ex´amenes y comprueba que obtienen el siguiente resultado: (3.5, 4, 6.5, 3, 7, 1.5, 4, 4.5, 9, 5). Se pide: (a) (1 punto) Estimar la nota media, µ, usando la media muestral, y la desviaci´on t´ıpica, σ, usando la desviaci´on t´ıpica muestral. Soluci´ on: ∑10 x =
s =
i=1 xi
10 [∑ 10
= 4.8
2 i=1 (xi − x) 9
]1 2
( 10 )2 21 10 ∑ ∑ 1 1 = x2i − xi ≈ 2.176 9 10 i=1
i=1
(b) (1 punto) Determinar intervalos de confianza del 95 % para la nota media y la desviaci´on t´ıpica. Soluci´ on: ) s s x − t0.975 (9) √ , x + t0.975 (9) √ µ ∈ 10 10 ( ) 2.1756 2.1756 = 4.8 − 2.2622 √ , 4.8 + 2.2622 √ ≈ (3.24, 6.36) 10 10 (
P´agina 3 de 4
Evaluaci´ on continua, prueba no 2. Ma˜ nana. – 03-05-2012 (cont.)
√ √ ) ( ) √ n−1 n−1 9 9 σ ∈ s ,s = 2.1756 , 2. 175 6 χ21−α/2 χ2α/2 χ20.975 (9) χ20.025 (9) ( ) √ √ 9 9 = 2.175 6 , 2.175 6 ≈ (1.497, 3.972) 19.0228 2.7004 ( √
(c) (1 punto) Determinar un intervalo de tolerancia para la calificaci´on del examen de contenido 0.95 y confianza tambi´en 0.95. Interpretar el resultado. Soluci´ on: p = 0.95, 1 − α = 0.95, n = 10. Entonces k = 3.393. El intervalo de tolerancia es entonces (x − ks, x + ks) = (4.8 − 3.393 · 2.1756, 4.8 + 3.393 · 2.1756) ≈ (−2.582, 12.182) El resultado nos dir´ıa que con una confianza del 95 %, el 95 % de los alumnos tendr´an una nota entre −2.58 y 12.18. Pero estos l´ımites sobrepasan las notas m´axima y m´ınima posibles y, por tanto, no obtenemos una informaci´on relevante. La muestra no aporta ninguna informaci´on adicional sobre algo que ya sab´ıamos sin necesidad de corregir ning´ un examen: m´as del 95 % (de hecho el 100 %) de las notas est´an en [0, 10] y por lo tanto en [−2.58, 12.18].
P´agina 4 de 4
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Evaluaci´ on continua, prueba no 2. Tarde. Apellidos y nombre:
03-05-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.5 puntos) Una muestra aleatoria simple de tama˜ no n = 5 de una variable aleatoria X es:
Soluci´ on: X = (X1 , X2 , X3 , X4 , X5 ) , donde las Xi son id´enticas a X e independientes.
2. (0.5 puntos) Demuestre que E(X) = E(X).
Soluci´ on: E(X) = E
(
1∑ Xi n n
i=1
) =
1∑ 1∑ n E(Xi ) = E(X) = E(X) = E(X). n n n n
n
i=1
i=1
3. (0.5 puntos) Un estimador T es insesgado para el par´ametro θ si E(T − θ) = Soluci´ on: 0.
4. (0.5 puntos) Una cierta distribuci´on de probabilidad contiene tres par´ametros. Tomamos una muestra de n elementos y queremos estimar dichos par´ametros en funci´on de los resultados de la muestra. Para ello usamos el m´etodo de los momentos. ¿Cu´antos momentos debemos calcular?
P´agina 1 de 4
Evaluaci´ on continua, prueba no 2. Tarde. – 03-05-2012 (cont.)
Soluci´ on: Tres.
5. (0.5 puntos) Si deseamos estimar un intervalo de confianza para la desviaci´on t´ıpica de una distribuci´on normal, ¿debemos usar la distribuci´on de Student o la Ji-cuadrado?
Soluci´ on: La Ji-cuadrado.
6. (0.5 puntos) ¿Qu´e tama˜ no de muestra se necesita para estimar, con confianza 0.95, la media de una variable aleatoria normal de σ = 0.2 con un error menor que 0.01?
Soluci´ on: n=
(u
0.975 σ
(
)2
ε
=
1.96(0.2) 0.01
)2 ≈ 1536.6 ⇒ n = 1537.
7. (0.5 puntos) Si [a, b] es un intervalo de tolerancia con contenido p y confianza 1 − α para X, ¿qu´e relaci´on hay entre [a, b] y X?
Soluci´ on: P (a < X < b) ≥ p con confianza 1−α
´o (equivalente) P (P (A < X < B) ≥ p) = 1−α.
A, B : estad´ısticos cuyas realizaciones son, respectivamente, a y b.
8. (1.5 puntos) Una variable aleatoria X tiene funci´on de masa de Poisson. El par´ametro de la distribuci´on, λ, es desconocido, aunque se sabe que solo puede ser igual a 2 ´o 3. Una muestra de tama˜ no 2 de X ha resultado x = (1, 3). Estime λ usando el principio de m´axima verosimilitud.
Soluci´ on: La funci´on de verosimilitud es: L(λ|x) = e−λ
λx1 −λ λx2 λ4 e = e−2λ . x1 ! x2 ! 6
Por otro lado L(2|x) = 26 e−2(2) ≈ 0.049 y L(3|x) = 36 e−2(3) ≈ 0.033, de donde se ˆ = 2. deduce que L(2|x) > L(3|x) y la estimaci´on del par´ametro es λ 4
4
P´agina 2 de 4
Evaluaci´ on continua, prueba no 2. Tarde. – 03-05-2012 (cont.)
9. (2 puntos) La variable X tiene una funci´ √ πon de densidad f (x) = Rayleigh) y su esperanza es E (X) = σ 2 . Se pide:
( ) 2 − x2 x 2σ e σ2
x > 0 (de
(a) (1.5 puntos) Hallar la estimaci´on de m´axima verosimilitud de σ con una muestra (x1 , x2 , ..., xn ) . Soluci´ on: ( ) ∏ xi x2i exp − 2 L (σ|x) = f (xi ) = σ2 2σ ∑ ( )∏ 2 xi 1 exp − = xi σ 2n 2σ 2 ∑ 2 ∑ xi ln L (σ|x) = −2n ln σ − + ln xi 2σ 2 igualando a cero la derivada √ ∑ 2 d 1 ∑ 2 2n xi = 0 → σ b = ln L (σ|x) = − + xi dσ σ σ3 2n ∏
√
la soluci´on es σ b=
1 ∑ 2 xi 2n
que corresponde a un m´aximo pues ( 2 ) d 8n2 ∑ ln L (b σ |x) = − <0 dσ 2 x2i (b) (0.5 puntos) Hallar la estimaci´on de m´axima verosimilitud de E (X) Soluci´ on: √ La estimaci´onde MV de E (X) es σ b π2 . 10. (3 puntos) La resistencia a la rotura de cierto tipo de cables de acero, expresada en Kp, se supone que es una VA X ∼ N (µ, σ). Una muestra de 6 cables ha dado los valores (533, 538, 552, 539, 564, 541). Se pide: (a) (1 punto) Estimar la resistencia media, µ, usando la media muestral, y la desviaci´on t´ıpica, σ, usando la desviaci´on t´ıpica muestral. Soluci´ on: ∑6
i=1 xi
= 544.5 Kp 6 [ ( 6 )] 12 [ ( 6 )] 12 ∑ 1 ∑ 1 s = (xi − x)2 x2i − 6x2 = 5 5 i=1 i=1 [ ]1 2 1 = (1779535 − 1778881.5) ≈ 11.432 Kp 5
x =
(b) (1 punto) Construir intervalos del 95 % para la resistencia media y la desviaci´on t´ıpica.
P´agina 3 de 4
Evaluaci´ on continua, prueba no 2. Tarde. – 03-05-2012 (cont.)
Soluci´ on:
√ El intervalo del 95 % para µ es x ± t0.975 s/ n donde t0.975 (5) = 2.5706 y resulta µ ∈ (532.502, 556.498) Kp. ( √ ) √ n−1 n−1 El intervalo del 95 % para σ es s χ2 , s χ2 donde χ20.975 (5) = 12.8325 y 1−α/2
α/2
χ20.025 (5) = 0.8312 y resulta σ ∈ (7.136, 28.039) Kp. (c) (1 punto) Estimar con una confianza del 99 % la tensi´on que pueden soportar el 95 % de los cables, es decir, el l´ımite inferior de tolerancia para la resistencia. Soluci´ on: Para hallar el l´ımite inferior de tolerancia con 1 − α = 0.99, p = 0.95 y n = 6, en la tabla V se lee k = 5.406 y el l´ımite inferior es xL = 544.5 − 5.406 × 11.432 = 482.696 es decir, con una confianza del 99 % P (X > 482) ≥ 0.95 o, lo que es lo mismo, el 95 % de los cables tienen una resistencia mayor que 482 Kp.
P´agina 4 de 4
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Examen final de julio, bloque no 3.
10-07-2012
Apellidos y nombre:
Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.75 puntos) Suponga que b0 + b1 x es la recta de m´ınimos∑cuadrados que ajusta la muestra {(xi , yi )}, i = 1, 2, ..., n. Si ybi = b0 + b1 xi , demuestre que ni=1 (yi − ybi ) = 0. Soluci´ on: Si b0 y b1 son los coeficientes de la recta de m´ınimos cuadrados se debe verificar: ∑ ∂q (b0 , b1 ) = (yi − ybi ) = 0 ∂b0 n
i=1
En donde q(b0 , b1 ) =
∑n
i=1 (yi
− (b0 + b1 xi ))2 .
2. (0.75 puntos) Si en una muestra {(xi , yi )}, i = 1, 2, ..., n se verifica ¿c´omo est´an situados en el plano los puntos de la muestra?
∑n
i=1 (xi
− x)2 = 0,
Soluci´ on: Est´an alineados seg´ un una recta vertical.
3. (0.75 puntos) En la ecuaci´on Xt Xb = Xt y, ¿Cu´al es el vector Xt y si se desea ajustar la par´abola y = b0 + b1 x + b2 x2 a los datos {(xi , yi )} = {(1, 2), (3, 3), (5, 2), (2, 8)}? Soluci´ on:
15 X t y = 37 111
P´agina 1 de 5
Examen final de julio, bloque no 3. – 10-07-2012 (cont.)
4. (0.5 puntos) ¿Cu´ales son los valores posibles de r (coeficiente de correlaci´on lineal)?
Soluci´ on: r ∈ [−1, 1]
5. (0.75 puntos) Suponga que b0 + b1 x es la recta de m´ınimos cuadrados ∑ que ajusta la ∑muestra {(xi , y∑ bi = b0 + b1 xi , ¿cu´al es la relaci´on entre ni=1 (yi − y)2 , ni=1 (b yi − i )}, i = 1, 2, ..., n. Si y y)2 y ni=1 (yi − ybi )2 . Soluci´ on:
∑
(yi − y)2 =
∑
(yi − ybi )2 +
∑
(b yi − y)2
6. (1.5 puntos) En un ajuste por m´ınimos cuadrados se utiliza una muestra de tama˜ no n = 20. ∑ Sabiendo que r = 0.9, b1 = 0.5 y ni=1 (xi − x)2 = 40, halle la cota de error de la estimaci´on de µ(x) = β0 + β1 x en x = x con una confianza del 99 %. Utilice cuatro decimales en los c´alculos.
Soluci´ on:
√
ε = t1− α2 s
1 (x − x)2 +∑ = t1− α2 s n (xi − x)2
Donde: 1 1 s = SSres = 18 18 2
(
√
1 = 2.8784 · 0.3610 · n
√
1 = 0.2324. 20
) 1 1 · 0.2346 · 0.52 · 40 = 0.1303, − 1 SSex = 2 r 18
s = 0.3610.
7. (3.5 puntos) Se realiza un estudio de mercado del precio de la vivienda en una cierta zona. Para ello, se anotan los precios de las viviendas en venta y su superficie. El resultado es la siguiente tabla: Precio (miles de euros) Superficie (metros cuadrados)
102 50
123 60
161 80
79 40
96 47
150 75
53 25
(a) (1.5 puntos) Ajuste el modelo lineal Y (x) = β0 + β1 x + U a los datos de la muestra (siendo x la superficie e Y(x) el precio), estimando β0 y β1 por el m´etodo de m´ınimos cuadrados. Calcule el coeficiente de correlaci´on del ajuste y estime la desviaci´on t´ıpica de Y (x). Utilice cuatro cifras decimales en los c´alculos.
P´agina 2 de 5
Examen final de julio, bloque no 3. – 10-07-2012 (cont.)
Soluci´ on: ∑ ∑ ∑ x = 53.8571, y = 109.1429, x2i = 22559, yi2 = 92220, xi yi = 45607. ∑ ∑ ∑ ∑ (xi − x)2 = x2i − nx2 = 2254.8571, (yi − y)2 = yi2 − ny 2 = 8834.8571 ∑ ∑ (xi − x)(yi − y) = xi yi − nxy = 4460.1429. b1 =
√ =
(xi − x)(yi − y) 4460.1429 ∑ = = 1.9780. (xi − x)2 2254.8571 b0 = y − b1 x = 2.6126. √∑ ∑ (yi − y)2 − b21 (xi − x)2 s= n−2
8834.8571 − 1.97802 · 2254.8571 = 1.5978. 5
∑
r =
(xi − x)(yi − y) 4460.1429 √∑ =√ = 0.9993. ∑ 2 2 8834.8571 · 2254.8571 (xi − x) (yi − y)
(b) (1 punto) Suponiendo un modelo normal, construya un intervalo de confianza del 95 % para el precio de una vivienda de 85 metros cuadrados. Soluci´ on: El intervalo lo delimitan √ (b0 + b1 x) ± t1− α2 s
(x − x)2 1 +∑ n (xi − x)2 √
= 2.6126 + 1.9780 · 85 ± 2.5706 · 1.5978 = 170.7439 ± 3.1091 miles de euros.
1 (85 − 53.8571)2 + 7 2254.8571
donde hemos usado t1− α2 (n − 2) = t0.975 (5) = 2.5706. (c) (1 punto) Suponiendo un modelo normal, construya un intervalo de confianza del 95 % para el precio por metro cuadrado de las viviendas situadas en la zona estudiada. Soluci´ on: El intervalo lo delimitan √ 1.9780 ± t1− α2 s
1 ∑ (xi − x)2
√ = 10.2840 ± 2.5706 · 1.5978
1 2254.8571
= 1.9780 ± 0.0865 miles de euros/m2 8. (1.5 puntos) Un serie de medidas para determinar la masa del bos´on de Higgs (medida en GeV/c2 , es decir Gigaelectron-voltios partido por la velocidad de la luz al cuadrado) arroja los siguientes valores: x = (112.4, 121.3, 121.4, 124.0, 130.0, 132.5, 133.3, 135.0, 155.0)
P´agina 3 de 5
Examen final de julio, bloque no 3. – 10-07-2012 (cont.)
(a) (1 punto) Calcule los cuartiles, los valores at´ıpicos de la muestra y estudie la simetr´ıa. Soluci´ on: Con p = 0.25 es np + 0.5 = 9 · 0.25 + 0.5 = 2 + 0.75, as´ı que k = 2 y r = 0.75. b Por lo tanto q1 = Q(0.25) = x2 +0.75(x3 −x2 ) = 121.3+0.75(121.4−121.3) = 2 121.374 GeV/c . q2 = xm = x8 = 130 GeV/c2 . Con p = 0.75 es np + 0.5 = 9 · 0.75 + 0.5 = 7 + 0.25, as´ı que k = 7 y r = 0.25. b Por lo tanto q3 = Q(0.75) = x7 + 0.25(x8 − x7 ) = 133.3 + 0.25(135 − 133.3) = 2 133.725 GeV/c . El coeficiente de simetr´ıa es: q3 + q1 − 2xm 133.725 + 121.374 − 2 · 130 = = −0.3968. q3 − q1 133.725 − 121.374 La muestra es asim´etrica a la izquierda (los datos a la izquierda de la mediana se extienden m´as lejos que a la derecha). El l´ımite inferior de valores at´ıpicos es li = q1 − 1.5(q3 − q1 ) = 102.85 < x1 , as´ı que no hay valores at´ıpicos inferiores. El l´ımite superior de valores at´ıpicos es ls = q3 + 1.5(q3 − q1 ) = 152.25 < x9 , as´ı que x9 = 155 es at´ıpico.
P´agina 4 de 5
Examen final de julio, bloque no 3. – 10-07-2012 (cont.)
(b) (0.5 puntos) Dibuje el diagrama de caja (boxplot) de la muestra. ¿Es consistente el resultado obtenido con la masa de 126 GeV/c2 predicha por la teor´ıa? Soluci´ on:
x9
155
2
Masa del bosón de Higgs (GeV/c )
150 145 140 135
x
8
q3
x
130
m
125 120
q1
115 x1 1
1
Figura 1: Diagrama de caja de la muestra x El diagrama de caja indica que el resultado podr´ıa ser consistente con la masa predicha por la teor´ıa pues se observa que 126 est´a dentro del rango intercuart´ılico y no muy alejado de xm . En cualquier caso los diagramas de caja no dan resultados concluyentes, habr´ıa que analizar la muestra en detalle: calcular la media (estimaci´on de la masa del bos´on) y estimar el error cometido en la estimaci´on (una conclusi´on del an´alisis ser´ıa que habr´ıa que aumentar el tama˜ no de la muestra para obtener acotaciones del error aceptables). El diagrama de caja u ´nicamente permite una visi´on r´apida de la distribuci´on de la muestra pero no puede sustituir a la muestra.
P´agina 5 de 5
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Examen final de junio, bloque no 3. Apellidos y nombre:
06-06-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.75 puntos) Suponga que b0 + b1 x es la recta de m´ınimos∑cuadrados que ajusta la muestra {(xi , yi )}, i = 1, 2, ..., n. Si ybi = b0 + b1 xi , demuestre que ni=1 xi (yi − ybi ) = 0. Soluci´ on: Si b0 y b1 son los coeficientes de la recta de m´ınimos cuadrados se debe verificar: ∑ ∂q (b0 , b1 ) = xi (yi − ybi ) = 0 ∂b1 n
i=1
En donde q(b0 , b1 ) =
∑n
i=1 (yi
− (b0 + b1 xi ))2 .
2. (1.5 puntos)∑En el modelo lineal Y (x) = β0 +β1 x+U , el estimador de m´ınimos cuadrados de n (xi −x)(Yi −Y ) ∑n β1 es B1 = i=1 umero de elementos de y el de β0 es B0 = Y −B1 x, siendo n el n´ 2 j=1 (xj −x) ( ) ∑ la muestra. Demuestre que B0 tambi´en se puede expresar como ni=1 n1 − ∑n xi(x−x x Yi . 2 j −x) j=1
Soluci´ on: ( ) ∑n ∑n ∑n ∑n (xi − x) Yi i=1 (xi − x) Yi − Y i=1 (xi − x) i=1 (xi − x) Yi − Y B1 = = = ∑i=1 ∑n ∑n n 2 2 2 . j=1 (xj − x) j=1 (xj − x) j=1 (xj − x) ∑ Ya que (xi − x) = 0. Sustituyendo el valor de B1 en la expresi´on de B0 : ( ) ∑n n n ∑ ∑ (x − x) Y 1 x − x 1 i i i Yi − ∑i=1 − ∑n B0 = n 2 x= 2 x Yi . n n (x − x) j j=1 j=1 (xj − x) i=1 i=1
3. (0.5 puntos) Se dispone de una muestra {(xi , yi )}, i = 1, 2, ..., n para la que se cumple r = 1. ¿C´omo est´an situados en el plano los puntos de la muestra?
P´agina 1 de 5
Examen final de junio, bloque no 3. – 06-06-2012 (cont.)
Soluci´ on: Formando una recta
4. (0.75 puntos) En la ecuaci´on Xt Xb = Xt y, ¿Cu´al{ es la matriz X si se desea ajustar } el 2 1 plano y = b0 + b1 x + b2 z a los datos {(xi , zi , yi )} = ( 4 , 1, 2), (1, 2, 3), ( 3 , 5, 1), (2, 6, 8) ? Soluci´ on:
1 1/4 1 1 1 2 X= 1 2/3 5 1 2 6
5. (0.75 puntos) Suponga que b0 + b1 x es la recta de m´ınimos cuadrados que ajusta la muestra {(xi , yi )}, i = 1, 2, ..., n. Si ybi = b0 + b1 xi , demuestre que y = yb. Soluci´ on: yb =
1∑ 1∑ ybi = (b0 + b1 xi ) = b0 + b1 x = y. n n n
n
i=1
i=1
6. (0.75 puntos) En un ajuste por∑m´ınimos cuadrados se utiliza una muestra de tama˜ no n = 20. Sabiendo que R2 = 0.82 y ni=1 (yi − y)2 = 40, halle la cota de error de la estimaci´on de µ(x) = β0 + β1 x en x = x con una confianza del 95 %. Utilice cuatro decimales en los c´alculos.
Soluci´ on:
√
ε = t1− α2 s
1 (x − x)2 +∑ = t1− α2 s (xi − x)2 n
√
1 = 2.1009 · 0.6325 · n
√
1 = 0.2971. 20
Donde: s2 =
) 1 1 ( 1 SSres = 1 − R2 SStot = · 0.18 · 40 = 0.4, 18 18 18
s = 0.6325.
7. (3.5 puntos) Una empresa mide el tiempo (en minutos), y, que 15 empleados tardan en llegar al trabajo desde su domicilio. En la muestra obtenida por la empresa tambi´en se anota la distancia (en Km), x, entre el domicilio de cada ∑ empleado y el centro ∑15 de2 trabajo. ∑15 15 y = 403, x = 184, De esta muestra se conoce lo siguiente: i=1 xi = 2616, i=1 i i=1 i ∑15 ∑15 2 i=1 xi yi = 5623. i=1 yi = 12493 y
P´agina 2 de 5
Examen final de junio, bloque no 3. – 06-06-2012 (cont.)
(a) (1.5 puntos) Ajuste el modelo lineal Y (x) = β0 + β1 x + U a los datos de la muestra, estimando β0 y β1 por el m´etodo de m´ınimos cuadrados. Calcule el coeficiente de correlaci´on del ajuste y estime la desviaci´on t´ıpica de Y (x). Utilice cuatro cifras decimales en los c´alculos. Soluci´ on: x= ∑
(xi − x)2 =
∑
184 = 12.2667, 15
403 y= = 26.8667. 15 ∑ ∑ (yi − y)2 = yi2 − ny 2 = 1665.7333.
x2i − nx2 = 358.9333, ∑ ∑ (xi − x)(yi − y) = xi yi − nxy = 679.5333. b1 =
679.5333 (xi − x)(yi − y) ∑ = = 1.8932. 2 358.9333 (xi − x)
403 184 b 0 = y − b1 x = − 1.8932 = 3.6434. 15 15 √∑ ∑ (yi − y)2 − b21 (yi − y)2 s= n−2 √ 1665.7333 − 1.89322 · 358.9333 = 5.4011. = 13 r =
∑ (xi − x)(yi − y) 679.5333 √∑ =√ = 0.8788. ∑ 2 2 358.9333 · 1665.7333 (xi − x) (yi − y)
(b) (1 punto) Suponiendo un modelo normal, construya un intervalo de confianza del 95 % para el tiempo medio que tardan en llegar los empleados que viven a una distancia de 7 Km del centro de trabajo. Soluci´ on: El intervalo lo delimitan √ (b0 + b1 x) ± t1− α2 s
1 (x − x)2 +∑ n (xi − x)2 √
= 3.6434 + 1.8932 · 7 ± 2.1604 · 5.4011 = 16.8958 ± 4.4270 min.
1 (7 − 12.2667)2 + 15 358.9333
donde hemos usado t1− α2 (n − 2) = t0.975 (13) = 2.1604. (c) (1 punto) Suponiendo un modelo normal, construya un intervalo de tolerancia de contenido p = 0.95 y confianza 0.95 para el tiempo que tardan en llegar los empleados que viven a una distancia de 7 Km del centro de trabajo. Soluci´ on: El intervalo lo delimitan yL = (b0 + b1 7) − ks = 16.8958 − 3.1091 · 5.4011 = 0.1030 min. yS
= (b0 + b1 7) + ks = 16.8958 + 3.1091 · 5.4011 = 33.6886 min.
P´agina 3 de 5
Examen final de junio, bloque no 3. – 06-06-2012 (cont.)
En donde: √
[ )] ( 13 d2 d4 2u20.975 − 3 − k = u0.975 1+ 2 24 χ20.05 [ √ ( )] 13 d2 d4 2(1.96)2 − 3 = 1.96 1+ − = 3.1091. 5.8919 2 24 d2 =
1 (x − x)2 1 (7 − 12.2667)2 +∑ = + = 0.1439. n 15 358.9333 (xi − x)2
8. (1.5 puntos) En 1879 Michelson realiz´o 100 medidas de la velocidad de la luz en el aire. La medidas se realizaron en cinco grupos de 20 medidas cada uno. A continuaci´on se proporciona la muestra correspondiente a uno de los grupos. La unidad son 1000 Km/s y se les ha restado 299 (es decir, el n´ umero 0.65 corresponde a una medida de 299.65 × 103 Km/s). x = (0.65, 0.74, 0.76, 0.81, 0.85, 0.85, 0.88, 0.90, 0.93, 0.93, 0.95, 0.96, 0.96, 0.98, 0.98, 0.98, 1.00, 1.00, 1.00, 1.07) (a) (1 punto) Calcule los cuartiles, los valores at´ıpicos de la muestra y estudie la simetr´ıa. Soluci´ on: Con p = 0.25 es np + 0.5 = 20 · 0.25 + 0.5 = 5 + 0.5, as´ı que k = 5 y r = 0.5. b Por lo tanto q1 = Q(0.25) = x5 +0.25(x6 −x5 ) = 0.85+0.5(0.85−0.85) = 0.85 3 (299.85 · 10 Km/s). q2 = xm = x8 = 0.94 (299.94 · 103 Km/s). Con p = 0.75 es np + 0.5 = 20 · 0.75 + 0.5 = 15 + 0.5, as´ı que k = 15 y r = 0.5. b Por lo tanto q3 = Q(0.75) = x15 + 0.5(x12 − x11 ) = 0.98 + 0.75(0.98 − 0.98) = 3 0.98 (299.98 · 10 Km/s). El coeficiente de simetr´ıa es: q3 + q1 − 2xm 0.98 + 0.85 − 2 · 0.94 = = −0.3846. q3 − q1 0.98 − 0.85 La muestra es asim´etrica a la izquierda (los datos a la izquierda de la mediana se extienden m´as lejos que a la derecha). El l´ımite inferior de valores at´ıpicos es li = q1 − 1.5(q3 − q1 ) = 0.6550 > x1 , as´ı que x1 = 0.65 es at´ıpico. El l´ımite superior de valores at´ıpicos es ls = q3 + 1.5(q3 − q1 ) = 1.175 > x20 , as´ı que no hay valores at´ıpicos superiores. (b) (0.5 puntos) Dibuje el diagrama de caja (box-plot) de la muestra.
P´agina 4 de 5
Examen final de junio, bloque no 3. – 06-06-2012 (cont.)
Soluci´ on:
x20
300.05
Velocidad de la luz (103 Km/s)
300
q3
299.95
xm
299.9 299.85
q
1
299.8 299.75
x
2
299.7 x
299.65
1
1
Figura 1: Diagrama de caja de la muestra X
P´agina 5 de 5
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Evaluaci´ on continua, prueba no 3. Ma˜ nana.
24-05-2012
Apellidos y nombre:
Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.75 puntos) Escriba la cantidad que se hace m´ınima para ajustar el modelo lineal µ (x) = β0 + β1 x a la muestra {(xi , yi )}, i = 1, 2, ..., n Soluci´ on: q(b0 , b1 ) =
n ∑
((yi − (b0 + b1 xi ))2
i=1
2. (0.75 puntos) Si en una muestra {(xi , yi )}, i = 1, 2, ..., n se verifica ¿c´omo est´an situados en el plano los puntos de la muestra?
∑n
i=1 (yi
− y)2 = 0,
Soluci´ on: Est´an alineados seg´ un una recta horizontal.
3. (0.5 puntos) ¿Cu´ales son los valores posibles de R2 ?
Soluci´ on: R2 ∈ [0, 1]
4. (0.75 puntos) Se dispone de una muestra {(xi , yi )}, i = 1, 2, ..., n para los que se cumple yi = 3xi + 2. ¿Cu´anto vale el coeficiente de correlaci´on lineal? Soluci´ on: r = 1.
P´agina 1 de 4
Evaluaci´ on continua, prueba no 3. Ma˜ nana. – 24-05-2012 (cont.)
5. (0.75 puntos) Suponga que b0 + b1 x es la recta de m´ınimos∑cuadrados que ajusta la muestra {(xi , yi )}, i = 1, 2, ..., n. Si ybi = b0 + b1 xi , demuestre que ni=1 (xi − x)(yi − ybi ) = 0. Soluci´ on: n n n ∑ ∑ ∑ (xi − x)(yi − ybi ) = xi (yi − ybi ) − x (yi − ybi ) = 0 − 0 = 0, i=1
i=1
i=1
ya que: ∑ ∂q (b0 , b1 ) = xi (yi − ybi ) = 0 ∂b1 n
∑ ∂q (b0 , b1 ) = (yi − ybi ) = 0. ∂b0 n
y
i=1
i=1
6. (0.75 puntos) Si el modelo ajustado por m´ınimos cuadrados es µ b (x) = 2 − 5x y R2 = 0.64, ¿cu´anto vale r?
Soluci´ on:
√ r = − 0.64 = −0.8.
7. (0.75 puntos) ¿C´omo se caracteriza la simetr´ıa o asimetr´ıa de una muestra por medio de los cuartiles emp´ıricos?
Soluci´ on: Estudiando si q3 − xm es igual o distinto que xm − q1 . Si son iguales la muestra es sim´etrica, si son distintos la muestra es asim´etrica.
8. (3.5 puntos) Se dispone de la muestra {(1.70, 1.73), (1.73, 1.75), (1.78, 1.73), (1.70, 1.70), (1.75, 1.73), (1.80, 1.78)}, donde x es la altura del padre e y la del hijo (en metros). (a) (1.5 puntos) Ajuste un modelo lineal Soluci´ on: ∑ ∑ ∑
xi = 10.46, yi = 10.42,
∑ ∑
x2i = 18.2438 yi2 = 18.0996
xi yi = 18.1694 (∑ )2 ∑ x2i − xi /n = 0.0085333 (xi − x)2 = ( ∑ ∑ ∑ )2 (yi − y)2 = yi2 − yi /n = 0.0035333
∑
P´agina 2 de 4
Evaluaci´ on continua, prueba no 3. Ma˜ nana. – 24-05-2012 (cont.)
∑
∑ ∑ xi yi − ( xi ) ( yi ) /n ∑ 2 ∑ = = 0.453125 xi − ( xi ) /n = y − b1 x = 0.946719 m
b1 b0 SSres =
∑
(yi − ybi )2 =
∑
(yi − y)2 − b21
∑
(xi − x)2
= 0.003533 − 0.4531252 × 0.008533 = 0.0017812 √ √ SSres 0.0017812 s= = = 0.0211 m n−2 4 (b) (0.5 puntos) ¿Qu´e porcentaje de la variabilidad de las alturas de los hijos es explicado por la relaci´on lineal con las alturas de los padres? Soluci´ on: R2 = 1 −
SSres 0.0017812 =1− = 0.49588 SStot 0.0035333
(49.59 %)
(c) (0.5 puntos) ¿Cu´al es la estimaci´on de la altura media de los hijos cuyos padres son de 1.75 m? Soluci´ on: µ b (1.75) = 0.946719 + 0.453125 × 1.75 = 1.73968775 m
(d) (1 punto) Suponiendo un modelo normal, acote el error de la estimaci´on anterior con una confianza del 95 %. Soluci´ on: t0.975 (4) = 2.7764
√
1 (x − x)2 +∑ n (xi − x)2 √ 1 (1.75 − 10.46/6)2 + = 2.7764 × 0.0211 × 6 0.0085333 = 0.0242868322 m
ε = t1−α/2 × s ×
9. (1.5 puntos) En la siguiente muestra se recoge el peso (en centigramos) de 18 semillas de una leguminosa: ( ) x = 18, 19 20 21 22 23 24 24 25 25 26 27 28 29 29 29 30 31 . Se pide: (a) (1 punto) Dibujar el histograma que estima la densidad de probabilidad de la variable aleatoria X = peso de la semilla (en centigramos) a partir de la muestra anterior. Al
P´agina 3 de 4
Evaluaci´ on continua, prueba no 3. Ma˜ nana. – 24-05-2012 (cont.)
dibujarlo se tomar´a el origen de intervalos en 18 y la longitud de las clases (h) igual a 5. Es imprescindible indicar qu´e representan los ejes de abscisas y de ordenadas y escribir en ambos los valores num´ericos necesarios para poder interpretar el resultado. Soluci´ on: 0.1 0.09
Densidad de probabilidad
0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0
18
20
22 24 26 28 30 Peso de las semillas (centigramos)
32
34
(b) (0.5 puntos) Escribir la expresi´on de la funci´on de densidad emp´ırica dibujada en el apartado anterior y comprobar que, efectivamente, verifica las propiedades de una funci´on de densidad. Soluci´ on:
0 6 18·5 ≈ 0.0667 7 b f (x) = 18·5 ≈ 0.0778 5 18·5 ≈ 0.0556 0
fb es una funci´on de densidad porque: 1. fb(x) ≥ 0 ∀x ∈ ℜ, ∫ 6 7 + 18 + 2. ℜ fb(x)dx = 18
5 18
= 1.
P´agina 4 de 4
si x < 18 si x ∈ [18, 23] si x ∈ (23, 28] si x ∈ (28, 33] si x > 33
Estad´ıstica 1er Curso. Titulaciones de grado de la ETSI Minas
Evaluaci´ on continua, prueba no 3. Tarde. Apellidos y nombre:
24-05-2012 Grupo:
Instrucciones : La duraci´on de esta prueba es de 50 minutos. Las preguntas se deben responder con claridad, precisi´on y brevedad en el espacio reservado para ello en la propia hoja de enunciados. Salvo indicaci´on contraria en el enunciado de la pregunta, los n´ umeros reales se deben expresar con tres decimales. Como material de apoyo para la realizaci´on de la prueba se podr´a utilizar u ´ nicamente una calculadora. Los tel´efonos m´oviles deben estar apagados y guardados.
1. (0.75 puntos) En el modelo lineal Y (x) = β0 + β1 x + U , el estimador de m´ınimos cuadrados ∑ (xi −x)(Yi −Y ) ∑ de β1 es B1 = . Demuestre que B1 tambi´en se puede expresar como B1 = (x −x)2 ∑ (x −x)Yi ∑ i (xi −x)2
i
Soluci´ on:
∑
B1 = Ya que
∑
( ) ∑ ∑ ∑ (xi − x) Yi − Y (xi − x) (xi − x) Yi − Y (xi − x) Yi = = ∑ . ∑ ∑ 2 2 (xi − x) (xi − x) (xi − x)2
(xi − x) = 0.
2. (0.75 puntos) Se dispone de una muestra {(xi , yi )}, i = 1, 2, ..., n para los que se cumple yi = 2xi . ¿Cu´anto vale el coeficiente de correlaci´on lineal? Soluci´ on: r = 1.
3. (0.75 puntos) En la ecuaci´on Xt Xb = Xt y, ¿Cu´al es { la matriz X si se desea } ajustar la par´abola y = b0 + b1 x + b2 x2 a los datos {(xi , yi )} = ( 21 , 2), (1, 3), ( 32 , 5), (2, 8) ? Soluci´ on:
1 1/2 1/4 1 1 1 X= 1 3/2 9/4 1 2 4
P´agina 1 de 5
Evaluaci´ on continua, prueba no 3. Tarde. – 24-05-2012 (cont.)
4. (0.75 puntos) Indique cu´al es la expresi´on del coeficiente de determinaci´on de un ajuste por m´ınimos cuadrados y explique brevemente que representa.
Soluci´ on:
∑n ∑n yi − y)2 bi )2 i=1 (b i=1 (yi − y ∑ ∑ R = n = 1 − . n 2 2 i=1 (yi − y) i=1 (yi − y) 2
El coeficiente de determinaci´on, R2 , representa la proporci´on de la variabilidad total de las yi explicada por la relaci´on lineal y(x) = b0 + b1 x.
5. (0.75 puntos) Suponga que b0 + b1 x es la recta de m´ınimos cuadrados que ajusta la muestra {(xi , yi )}, i = 1, 2, ..., n. Si zi = yi − ybi , en donde ybi = b0 + b1 xi , ¿cu´anto vale z? Soluci´ on: ∑n ∑n ∑n ybi i=1 zi i=1 yi z= = − i=1 = y − yb = 0. Debido a que n n n
yb = b0 + b1 x = y.
6. ∑ (0.75 puntos) De una muestra de tama˜ no n se conocen los siguientes datos: r = 0.8, ∑n n 2 2 i=1 (xi − x) = 16.9, i=1 (yi − y) = 96.1, x = 6 e y = 12. A partir de los mismos, obt´enganse la recta de regresi´on m´ınimo cuadr´atica de X sobre Y.
Soluci´ on:
√∑
a1 = r Por lo tanto:
n (xi ∑i=1 n i=1 (yi
√ − x)2 16.9 ≈ 0.335, = 0.8 2 − y) 96.1
a0 = x − a1 y ≈ 1.974.
b E(X|Y = y) = 1.974 + 0.335y.
7. (0.5 puntos) Dada la muestra {1, 1, 2, 3, 5, 6, 7, 8}, determinar el cuartil q2 (es decir, la mediana).
Soluci´ on: 4
8. (3.5 puntos) Con objeto de verificar experimentalmente la ley de Hooke, se miden las distintas fuerzas Fi que soporta un muelle a distintas longitudes xi conocidas. Se obtienen as´ı los datos de la siguiente tabla Fuerza (Newtons) Longitud (metros)
1 0.22
2 0.30
P´agina 2 de 5
3 0.39
4 0.51
5 0.62
6 0.68
Evaluaci´ on continua, prueba no 3. Tarde. – 24-05-2012 (cont.)
Teniendo en cuenta que la ley de Hooke establece que la fuerza aplicada es proporcional a la deformaci´on, F = k(x − x0 ) (es decir, F = b1 x + b0 siendo b1 = k y b0 = −kx0 ), se pide: (a) (1.5 puntos) Ajustar los datos al modelo lineal y calcular el coeficiente de correlaci´on r. Dar una estimaci´on de la constante del muelle k. Soluci´ on: ∑ ∑ ∑ ∑
21 = 3.5 6 2.72 = 2.72, x = = 0.45333 6 = 91
Fi = 21, F = xi
Fi2
Fi xi = 11.21 ∑ x2i = 1.3974
∑ 2.72 11.21 − 6 21 xi Fi − nxF 6 6 = b1 = ∑ 2 ( )2 = 10.2840 xi − nx2 1.3974 − 6 2.72 6 2.72 21 − 10.2840 = −1.1621 b0 = F − b1 x = 6 6 √ ) (∑ 2 ∑ 2 2 Fi − nF − b21 xi − nx2 s= n−2 v ( ) u u 91 − 6 ( 21 )2 − 10.28402 1.3974 − 6 ( 2.72 )2 t 6 6 = 0.1732 = 4 ∑
r =
=
∑ (xi − x)(Fi − F ) xi Fi − nxF √∑ =√ ) ∑ ( ) (∑ 2 ∑ 2 2 (xi − x)2 (Fi − F )2 xi − nx2 Fi − nF 2.72 11.21 − 6 21 6 6 √( = 0.9966 ( 2.72 )2 ) ( ( 21 )2 ) 1.3974 − 6 6 91 − 6 6
La constante k se puede aproximar por 10.2840 N/m. (b) (1 punto) Suponiendo un modelo normal, calcular un intervalo de confianza del 95 % para la fuerza que corresponder´ıa a una longitud de muelle de 0.4 m. Soluci´ on: El intervalo lo delimitan √ (b0 + b1 x) ± t1− α2 s
1 (x − x)2 +∑ n (xi − x)2
= −1.1621 + 10.2840 · 0.4 ± 2.7764 · 0.1732 = 2.9515 ± 0.20625 N
P´agina 3 de 5
√
1 (0.4 − 0.4533)2 + 6 0.1643
Evaluaci´ on continua, prueba no 3. Tarde. – 24-05-2012 (cont.)
donde hemos usado t1− α2 (n − 2) = t0.975 (4) = 2.7764. (c) (1 punto) Suponiendo un modelo normal, calcular un intervalo de confianza del 95 % para el valor de k. Soluci´ on: El intervalo lo delimitan √ 10.2840 ± t1− α2 s
1 ∑ (xi − x)2
√ = 10.2840 ± 2.7764 · 0.1732
1 0.1643
= 10.2840 ± 1.1863 N/m 9. (1.5 puntos) La Agencia europea para la seguridad y la salud en el trabajo fija un l´ımite de exposici´on profesional para el plomo en el aire de 150µgm−3 . Para controlar los valores X de contaminaci´on en un laboratorio se han muestreado 15 puntos resultando las siguientes concentraciones (en µgm−3 ) : 4, 7, 15, 19, 22, 59, 68, 80, 115, 120, 132, 208, 309, 371, 579. (a) (0.5 puntos) Calcule los cuartiles, el coeficiente de simetr´ıa y los valores at´ıpicos. Soluci´ on: Con p = 0.25 es np + 0.5 = 15 · 0.25 + 0.5 = 4 + 0.25, as´ı que k = 4 y r = 0.25. b Por lo tanto q1 = Q(0.25) = x4 + 0.25(x5 − x4 ) = 19 + 0.25(22 − 19) = 19.75. q2 = xm = x8 = 80. Con p = 0.75 es np+0.5 = 15·0.75+0.5 = 11+0.75, as´ı que k = 11 y r = 0.75. b Por lo tanto q3 = Q(0.75) = x11 + 0.75(x12 − x11 ) = 132 + 0.75(208 − 132) = 189. El coeficiente de simetr´ıa es: q3 + q1 − 2xm 189 + 19.75 − 2 · 80 = = 0.288. q3 − q1 189 − 19.75 La muestra es asim´etrica a la derecha (los datos a la derecha de la mediana se extienden m´as lejos que a la izquierda). El l´ımite inferior de valores at´ıpicos es li = q1 − 1.5(q3 − q1 ) = −234.12 < x1 , as´ı que no hay valores at´ıpicos inferiores. El l´ımite superior de valores at´ıpicos es ls = q3 + 1.5(q3 − q1 ) = 442.88 < x15 , as´ı que x15 = 579 es at´ıpico. (b) (1 punto) Dibuje el diagrama de caja de la muestra de X
P´agina 4 de 5
Evaluaci´ on continua, prueba no 3. Tarde. – 24-05-2012 (cont.)
Soluci´ on:
600
x15
500
400
x14
300
200
q
3
100
xm q
0
1
x1 1
Figura 1: Diagrama de caja de la muestra X
P´agina 5 de 5