Liceo de Santo Domingo Bachillerato Internacional Matemáticas: Aplicaciones e Interpretación NM
Compilación de Ejemplos y Ejercicios Para Estadística y probabilidad
Profesoras: Licda. Milagro Cordero Herrera Licda. Irene Cruz Salazar
Heredia, CR 2021
Estadística y Probabilidad Recolectando y organizando datos univariados
Ronald Fisher (1890 – 1962) vivió en el Reino Unido y Australia, ha sido descrito como "un genio que casi sin ayuda ha creado las bases para las estadísticas modernas". El usó estadísticas para analizar problemas en medicina, agricultura y las ciencias sociales.
Los datos univariados tienen solo una variable. Hay dos tipos principales de datos: cualitativos y cuantitativos. Los datos cualitativos son datos que no se dan numéricamente, por ejemplo, sabor de helado favorito. Los datos cuantitativos son numéricos y se pueden clasificar como discretos o continuos. Los datos discretos son datos que se pueden contar, por ejemplo, el número de automóviles en un estacionamiento o datos que solo pueden tomar valores específicos, por ejemplo, tamaño del zapato. Los datos continuos se pueden medir, por ejemplo, altura, peso y tiempo. Los datos discretos y continuos se pueden organizar en una tabla de frecuencias o una tabla de frecuencias agrupadas. Para datos continuos, las clases deben cubrir el rango completo de los valores y no deben superponerse. Ejemplo Las edades de los niños en un club de fútbol En el siglo 19 el psicólogo alemán Gustav Fechner popularizó la son: 10 11 11 10 12 13 11 10 12 14 15 15 16 mediana, aunque el matemático 10 11 15 10 11 11 12 12 12 13 16 16 14 15 12 francés Pierre Laplace lo había usado 12 10 11 11 14 14 15 16 16 11 10 13 antes. A) Indique si estos datos son discretos o continuos. B) Construya una tabla de frecuencias agrupadas para estos datos. X representa la edad. Práctica 1. Indique si los siguientes conjuntos de datos son discreto o continuos. a) La cantidad de manzanas en una bolsa. b) Los pesos de los estudiantes en el sexto grado. c) La cantidad de autos azules en un estacionamiento. d) El tamaño de los tacos de un equipo de fútbol. e) La cantidad de visitantes a la Torre de Londres cada semana. f) Los pesos de 20 cachorros. g) La profundidad de la nieve en una pista de esquí. h) El número de seises cuando lanzas un dado 25 veces. i) El tiempo que lleva correr 100 metros. j) Las longitudes de 20 gusanos. 2. Construya una tabla de frecuencias para estos datos. El número de dulces en 25 paquetes: 21 23 22 24 21 22 23 25 24 24 22 23 25 21 23 23 24 26 25 25 21 22 22 24 22
3. Construya una tabla de frecuencia agrupada para los datos siguientes. Las alturas, en metros, de 20 árboles en un jardín: 5.8 3.6 3.9 4.1 4.4 3.2 2.4 2.6 5.1 2.5 4.5 3.6 2.4 5.2 4.7 3.5 3.3 2.8 4.1 2.1 4. Los siguientes datos muestran los pesos de 25 perros, en kilogramos: 2 5 31 22 16 7 12 35 9 18 5 11 15 6 3 14 8 10 12 25 27 34 7 1 5. Construya una tabla adecuada para estos datos. Medidas de tendencia central (o promedios) Las medidas más comunes de tendencia central son la media, la mediana y moda. La moda de un conjunto de datos es el valor que ocurre con mayor frecuencia. Puede no haber moda o varias modas. La mediana de un conjunto de datos es el valor que se encuentra en el medio, los datos se ordenan de menor a mayor y será el dato que está en el centro. Cuando hay dos valores medios, la mediana es el punto medio entre los dos valores. (Se suman y se divide entre dos). La media de un conjunto de datos es la suma de todos los valores divididos por el número de valores. Para un conjunto discreto de datos de valores, la fórmula es: 1 𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 , donde ∑𝑛𝑖=1 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 y ∑ significa la suma de. Para un conjunto de datos de frecuencia, la fórmula es 𝑥̅ = ∑𝑛
1
𝑖=1 𝑓𝑖
∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖 donde
∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖 = 𝑓1 𝑥1 + 𝑓2 𝑥2 + 𝑓3 𝑥3 + ⋯ + 𝑓𝑛 𝑥𝑛 . Cuando hay una tabla de frecuencias, debe usar los valores de datos y frecuencias correspondientes para calcular la media. Ejemplos 1. Las calificaciones en una prueba de historia para 14 estudiantes fueron las siguientes: 58 67 66 58 79 83 76 49 35 58 88 91 47 69. 35 47 49 58 58 58 66 67 69 76 79 83 88 91 a) Encuentra la moda, la mediana y la media. Mo = 58 66+67 Me = 2 = 66.5 35 + 47 + 49 + 58 + 58 + 58 + 66 + 67 + 69 + 76 + 79 + 83 + 88 + 91 𝑋̅ = = 66 14 Cuando un 1º estudiante tomó la prueba, la media se convirtió en 66.2. b) Calcule la calificación del decimoquinto alumno. 35 + 47 + 49 + 58 + 58 + 58 + 66 + 67 + 69 + 76 + 79 + 83 + 88 + 91 + 𝑥 = 66.2 15 35 + 47 + 49 + 58 + 58 + 58 + 66 + 67 + 69 + 76 + 79 + 83 + 88 + 91 + 𝑥 = 66.2 ∗ 15
924 + 𝑥 = 993 𝑥 = 993 − 924 𝑥 = 69
2. Mindy abre algunas bolsas de dulces y cuenta cuántas piezas hay en cada bolsa. Sus resultados son: Número de confites Frecuencia 23 2 24 3 25 9 26 5 27 1 Encuentra el número medio de dulces en una bolsa. 23 ∗ 2 + 24 ∗ 3 + 25 ∗ 9 + 26 ∗ 5 + 27 ∗ 1 𝑋̅ = = 25 20 * 3. Responda las siguientes preguntas y, en cada caso, interprete el significado de los valores calculados, y discuta por qué los valores extremos o una moda extrema afectan más la media que la mediana. a) La cantidad de helados vendidos durante un período de 13 semanas es la siguiente: 146 151 158 158 161 149 160 147 158 160 216 225 238. Escriba la moda y use la tecnología para encontrar la media y la mediana de este conjunto de datos. 146 147 149 151 158 158 158 160 160 161 216 225 238 Mo = 158 Me = 158 146+147+149+151+158+158+158+160+160+161+216+225+238 𝑋̅ = = 171 13 b) Se lanzan dos dados 100 veces y su puntaje total se registra en la tabla: Puntaje 2 3 4 5 6 7 8 9 10 11 12 Frecuencia 21 9 8 4 7 20 13 9 6 2 1 21 30 38 42 49 69 Escriba la moda y use la tecnología para encontrar la media y la mediana de este conjunto de datos. Mo = 2 Me = 7 2∗21+3∗9+4∗8+5∗4+6∗7+7∗20+8∗13+9∗9+10∗6+11∗2+12∗1 𝑋̅ = = 5,82 100 c) Los pesos, w kg, de 50 gatos se registran en la tabla: Pesos (kg) Frecuencia FAcum Xi 5 2,5 2≤𝑤<3 5 24 3,5 3 ≤ 𝑤 < 4 19 17 41 4,5 4≤𝑤<5 46 5,5 5≤𝑤<6 5 49 6,5 6≤𝑤<7 3 50 7,5 7≤𝑤<8 1 50 Total Encuentre una aproximación para la mediana y la media, y escriba la clase modal. Clase modal: [3, 4[
Mediana: 4,5 𝑋̅ =
2,5 ∗ 5 + 3,5 ∗ 19 + 4,5 ∗ 17 + 5,5 ∗ 5 + 6,5 ∗ 3 + 7,5 ∗ 1 = 4,20 50
Práctica TOK ¿Por qué algunas veces las matemáticas y la estadística han sido 1. Para los siguientes conjuntos de datos, tratado como temas separados? busque la media, mediana y la moda. Indique cuál de estas medidas son las más apropiadas para usar en cada caso, dando una razón para su respuesta. a. Los tiempos, en minutos, para correr 1500 metros: 7.2, 7.3, 7.5, 7.8, 8.0, 8.3, 8.6, 8.6, 8.6, 9.0, 9.2, 9.5, 10.0, 10.5, 10.6, 11.1, 15.3, 16.8, 17.2. b. Los pesos, en kg, de 13 calabazas: 2.6, 2.9, 4.7, 6.8, 6.9, 7.2, 8.5, 8.9, 10.1, 11.5, 12.5, 14.7, 15.0 c. Las cantidades mensuales de dinero, en euros, para 21 estudiantes de sexto grado: 10, 10, 10, 15, 15, 15, 15, 20, 25, 25, 30, 30, 35, 35, 35, 40, 40, 50, 50, 80, 100. 2. Para los siguientes conjuntos de datos, busque i la clase modal ii una aproximación para la media iii una aproximación para la mediana. Comenta sobre el significado de estos valores e indique cuál es el más apropiado para utilizar en cada caso, dando una razón para su responder. a. Número de carros (n) 0 ≤ 𝑛 < 30 30 ≤ 𝑛 < 60 60 ≤ 𝑛 < 90 90 ≤ 𝑛 < 120 120 ≤ 𝑛 < 150 150 ≤ 𝑛 < 180
Frecuencia 12 28 39 42 54 65
b. Velocidad de carros (s mph) 40 ≤ 𝑠 < 45 45 ≤ 𝑠 < 50 50 ≤ 𝑠 < 55 55 ≤ 𝑠 < 60 60 ≤ 𝑠 < 65 65 ≤ 𝑠 < 70 Total
Frecuencia 4 8 23 15 6 4 60
c. Tiempo de completar un rompecabezas (t minutos) 2≤𝑡<3 3≤𝑡<4
Frecuencia 2 5
4≤𝑡<5 5≤𝑡<6 6≤𝑡<7 7≤𝑡<8 8≤𝑡<9
3 7 4 9 3
Ejemplo Las edades de 15 gatos son: 10, 10, 11, 11, 11, 12, 12, 12, 12, 13, 13, 14, 14, 24, 25. Encuentre la mediana, la media y la moda de estos datos. Comente si hay puntos de datos que distorsionan el cálculo de la media. Elimine estos valores y vuelva a calcular la media. Discute tu respuesta. Me = 12 10 + 10 + 11 + 11 + 11 + 12 + 12 + 12 + 12 + 13 + 13 + 14 + 14 + 24 + 25 = 13,6 15 Mo = 12 10 + 10 + 11 + 11 + 11 + 12 + 12 + 12 + 12 + 13 + 13 + 14 + 14 𝑋̅ = = 11,9 13 𝑋̅ =
Los valores atípicos son valores de datos extremos, TOK ¿Hay alguna diferencia entre información y datos? o el resultado de errores en la lectura de datos, que pueden distorsionar los resultados de los procesos estadísticos. Los valores atípicos pueden afectar la media haciéndola más grande o más pequeña, pero lo más probable es que no afecten la mediana o la moda. Práctica Encuentre la media, la mediana y la moda para los siguientes conjuntos de datos y comentarios sobre cualquier dato que creas que puede ser valores atípicos a) Los tiempos de 25 llamadas telefónicas en minutos: 1.0, 1.5, 2.3, 2.6, 2.8, 3.0, 3.4, 3.8, 4.1, 4.5, 4.6, 4.8, 5.2, 5.3, 5.5, 5.8, 6.0, 6.3, 6.6, 7.3, 7.5, 7.5, 7.5, 17.8, 25.0 b) Las alturas, en metros, de 15 girasoles: 1.1, 2.2, 2.5, 2.5, 3.1, 3.5, 3.6, 3.9, 4.1, 4.4, 4.6, 4.9,
2.5, 4.0, 6.1
c) Los resultados de una prueba de geografía: 22, 39, 45, 46, 52, 54, 58, 62, 62, 67, 70, 75, 82, 89, 91, 95,
46, 62, 78, 98.
Medidas de dispersión Las medidas de dispersión miden cuán extendido es un conjunto de datos. La medida más simple de dispersión es el rango, que se encuentra restando el número más pequeño del número más grande. La desviación estándar, 𝜎𝑥 , da una idea de cómo son los valores de los datos en relación con la media. La desviación estándar también se conoce como la desviación cuadrática o media cuadrática; su fórmula es 𝑛
𝑛
𝑖=1
𝑖=1
1 1 𝜎𝑥 = √ ∑(𝑥𝑖 − 𝑥̅ )2 = √ ∑ 𝑥𝑖 2 − 𝑥̅ 2 𝑛 𝑛 En los exámenes, usará tecnología para encontrar la desviación estándar. Ejemplo Para cada uno de los tres conjuntos de datos en el Ejemplo *, encuentre la desviación estándar y compare con la media. 146 151 158 158 161 149 160 147 158 160 216 225 238. 𝑋̅ = 171 n = 13 𝑛
1 1 𝜎𝑥 = √ ∑(𝑥𝑖 − 𝑥̅ )2 = √ ((146 − 171)2 + (151 − 171)2 + (146 − 171)2 = 𝑛 13 𝑖=1
La varianza es la desviación estándar al cuadrado: (𝜎𝑥 )2 Si bien la desviación estándar es útil para interpretar la propagación de datos sobre la media, otros procesos estadísticos como la regresión de cuadrados, la teoría de probabilidad y las inversiones utilizan la diferencia. El rango intercuartil [IQR] es el cuartil superior, 𝑄3 menos el inferior cuartil, 𝑄1 Cuando los valores de los datos están ordenados, el cuartil inferior son los datos hasta el percentil 25 y el cuartil superior es el punto de datos en el percentil 75. El rango intercuartil es otro método para interpretar la propagación de datos. Es más confiable que el rango porque no se ve afectado por valores atípicos. Considere los siguientes puntajes en un examen de biología, ordenados: 18, 22, 26, 39, 45, 46, 46, 52, 54, 58, 62, 62, 62, 67, 70, 71, 75, 78, 82, 89, 91, 95, 98 n = 23 La mediana es el valor medio, 62, ya que la mitad de los números están por encima del 62 y la mitad de los números están por debajo de 62. (𝑛+1) Para buscar 𝑄1 localice el número que está en el lugar 4 . El número está en la (23+1)
posición = 6, el 6to lugar, entonces el cuartil inferior es 46, ya que una 4 cuarta parte de los números están por debajo de 46 y tres cuartos de los números están por encima de 46.
Para encontrar 𝑄3 localice el número que está en la posición 3(23+1)
3(𝑛+1) 4
. En este
ejemplo sería la posición 4 = 18, entonces el cuartil superior es 78, ya que tres cuartos de los números están por debajo de 78 y un cuarto de los números están por encima de 78. El rango intercuartil es entonces 𝑄3 − 𝑄1 = 78 − 46 = 32. Ejemplo Para los conjuntos de datos en el Ejemplo *, encuentre: i la varianza a 2 cs ii el rango iii el IQR. La media de un conjunto de números es 𝑥̅ y la desviación estándar es 𝜎𝑥 . Si sumas o restas k de cada uno de los números, entonces la media es 𝑥̅ ± 𝑘 y la desviación estándar es 𝜎𝑥 . Si multiplica cada número por k entonces la media es 𝑘 ∗ 𝑥̅ y la desviación estándar es |𝑘 | ∗ 𝜎𝑥 .
TOK ¿Hacer diferentes medidas de tendencia central expresan diferentes propiedades de los datos? ¿Qué tan confiables son las medidas matemáticas?
Práctica 1. Stan dividió el césped en 30 parcelas iguales. Él contó el número de margaritas en cada parcela: 2, 3, 4, 5, 6, 6, 8, 8, 9, 11, 12, 12, 12, 13, 13, 15, 15, 15, 15, 15, 16, 16, 17, 18, 21, 22, 24, 25, 26, 34 a. Indique si los datos son discretos o continuos. b. Encuentra la media, la mediana y la moda, y comentar cuál, es más apropiado para usar. c. Encuentre la desviación estándar y comente el resultado. d. Encuentre el rango y el rango intercuartil. 2. Gal preguntó a 60 personas cuánto dinero gastaron la última vez que habían comido en un restaurante. La tabla muestra sus resultados. Costo de la comida (UK£) Frecuencia 6 10 ≤ 𝑐 < 20 12 20 ≤ 𝑐 < 30 28 30 ≤ 𝑐 < 40 10 40 ≤ 𝑐 < 50 4 50 ≤ 𝑐 < 60 a. Escribe la clase modal. b. Encuentre estimaciones para la media y la mediana. c. Encuentre un estimado para la desviación estándar y comente el resultado. d. Encuentre estimaciones para la varianza, el rango y el rango intercuartil, y explique por qué estas son todas estimaciones.
3. Los salarios mensuales de los empleados en una tienda minorista tenía un valor promedio de US $ 3500 y desviación estándar US $ 250. En el fin de año todos recibieron un aumento de US $ 100. Escribe la nueva media y la nueva desviación estándar. 4. La cantidad de dulces en 25 bolsas tiene una media de 30 y una desviación estándar de 3. En una promoción especial, se duplica el número de dulces en cada bolsa. Escriba la nueva media y la nueva desviación estándar del número de dulces en una bolsa. 5. La clase de grado 8 de Ana presentó un Examen de inglés. La calificación estaba fuera de 40 puntos La nota media fue 32 marcas y la desviación estándar fueron 8 marcas. Para cambiar esto a una marca de 100, Ana piensa que sería aceptable para multiplicar todas las calificaciones por 2 y luego agregue 20 a cada uno. María cree que sería más justo multiplicar todas las calificaciones por 2.5. Fernanda sugiere multiplicar por 3 y restando 20 de cada grado. a. Escriba la nueva media y la nueva desviación estándar para cada sugerencia. Técnicas de muestreo Una población es el grupo completo del que puede recopilar datos. Una muestra es un pequeño grupo elegido de la población. El muestreo aleatorio simple consiste en seleccionar una muestra completamente al azar, por ejemplo, usando un generador de números aleatorios o escogiendo números de un sombrero. El muestreo sistemático es, por ejemplo, tomar cada quinta entrada comenzando en un lugar al azar. El muestreo de conveniencia es obtener datos al seleccionar personas que son fáciles de llegar, por ejemplo, a personas en una escuela, club, etc. No incluye una muestra de participantes y, por lo tanto, los resultados podrían estar sesgados. Una muestra sesgada es aquella que no es aleatoria, por ejemplo, investigando hábitos en automóviles y solo entrevistar a personas que salen de un garaje. Ejemplo Los siguientes datos muestran los coeficientes intelectuales de 200 personas: 56 62 65 68 69 70 71 71 75 77 79 79 81 81 81 83 84 85 85 85 86 86 86 87 87 87 87 87 87 87 88 88 88 88 88 89 89 89 89 89 89 89 89 89 89 89 89 91 92 92 92 92 93 93 93 93 93 93 94 94 94 94 94 94 94 95 95 95 95 95 95 96 96 96 96 96 96 96 97 97 97 98 98 98 98 98 98 98 99 99 99 99 99 99 99 99 99 99 99 99 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 101 101 101 101 101 101 101 101 101 101 102 102 102 102 103 103 103 103 104 104 104 104 104 105 106 106 107 107 107 107 107 107 107 107 107 107 108 108 108 109 110 110 110 110 112 112 113 113 113 114 114 115 115 117 118 119 121 121 125 128 129 129 131 134 135 136 137 140 141 143 145 148 156
a. Encuentre la media de los coeficientes intelectuales. (56+62+65+68+69+70+2*71+75+77+2*79+3*81+83+84+2*85+3*86+7*87+5*88+1 2*89+91+4*92+6*93+7*94+6*95+7*96+3*97+7*98+12*99+27*100+10*101+4*102 +4*103+5*104+105+2*106+10*107+3*108+109+4*110+2*112+3*113+2*114+2*11 5+117+118+119+2*121+125+128+129+131+134+135+136+137+140+141+143+1 45+148+156)/200 = 19 734 / 200 = 98,67 b. Encuentra la media de los primeros 20 números y los últimos 20 números. Comente sobre el tipo de muestra que es y las ventajas y/o desventajas que pueda tener. Media de los primeros 20 1507/20 = 75,35 Media de los últimos 20 2653 / 20 = 132,65 c. Encuentre la media del subconjunto de datos que consiste en cada quinto coeficiente intelectual. Comente sobre el tipo de muestra que es y las ventajas y/o desventajas que pueda tener. d. Encuentre la media de una muestra aleatoria de 30 IQ. Comente sobre el tipo de muestra que es y las ventajas y/o desventajas que pueda tener. e. Comente cuál de estos métodos ofrece la mejor aproximación a la media de todos 200 IQs. El muestreo de cuotas establece ciertas cuotas para su muestra, por ejemplo, seleccionar una muestra de ocho niños y ocho niñas. Por ejemplo, el comedor escolar está considerando introducir un nuevo menú de almuerzo y quisiera comentarios de los estudiantes. La escuela tiene 250 niños y 300 niñas y el gerente de la cafetería decide entrevistar a 25 niños y 30 niñas para conocer su opinión del nuevo menú. Se para a la entrada de la cafetería y entrevista a los primeros 25 niños y 30 niñas que entran a la cafetería. Esto se llama una muestra de cuota. No es al azar. Puede ser parcial y no fidedigno. La ventaja es que es económico, fácil de realizar y ahorra tiempo. Sin embargo, es más confiable que el muestreo de conveniencia donde las personas se seleccionan según la disponibilidad y pueden no ser representativos de la población. Este tipo de muestreo produce una muestra no probabilística y también puede ser parcial y poco confiable. El muestreo estratificado es seleccionar una muestra aleatoria donde los números en ciertas categorías son proporcionales a sus números en la población. Por ejemplo, si el 20% de los estudiantes en una escuela estaban en el Grado 7, entonces usted elegiría el 20% de su muestra del Grado 7. El 20% debe ser una muestra aleatoria y no una muestra de conveniencia.
Ejemplo Mandy les pide a todos los estudiantes de su escuela que realicen una prueba de memoria. Los estudiantes tienen que recuerda tantos objetos como sea posible de los 20 que Mandy les muestra. Los resultados se muestran a continuación: Clase de 7 (20 estudiantes) 16, 15, 13, 15, 12, 8, 18, 16, 12, 11, 14, 12, 16, 9, 11, 10, 17, 13, 14, 13 Clase de 8 (27 estudiantes) 19, 15, 16, 14, 11, 16, 18, 15, 13, 12, 10, 8, 20, 14, 17, 12, 10, 7, 19, 20, 13, 12, 16, 16, 16, 15, 11 Clase de 9 (23 estudiantes) 12, 14, 15, 8, 2, 13, 15, 19, 16, 13, 11, 10, 12, 12, 20, 15, 11, 10, 2, 13, 16, 15, 15. Clase de 10 (26 estudiantes) 9, 10, 10, 12, 18, 16, 12, 15, 11, 11, 14, 16, 19, 19, 11, 15, 12, 13, 13, 14, 13, 13, 9, 10, 8, 15 Clase de 11 (30 estudiantes) 16, 15, 15, 16, 16, 18, 11, 12, 13, 9, 10, 11, 16, 12, 15, 12, 12, 15, 15, 15, 18, 20, 16, 12, 12, 15, 14, 14, 14, 14 Clase de 12 (24 estudiantes) 9, 11, 16, 14, 13, 13, 18, 19, 12, 10, 11, 9, 16, 16, 18, 14, 15, 15, 16, 13, 13, 12, 18, 19 a. Para tomar una muestra estratificada de 40 estudiantes de los 150 en total, demuestre que Mandy necesita seleccionar cinco estudiantes de la clase 7. 40 𝑥 = 𝑥 = 5,33 = 5 150 20 b. Determine cuántos estudiantes Mandy necesita seleccionar de cada una de las otras clases. 40 𝑥 = 𝑥 = 7,2 = 7 150 27 40 𝑥 = 𝑥 = 6,13 = 6 150 23 40 𝑥 = 𝑥 = 6,93 = 7 150 26 40 𝑥 = 𝑥=8 150 30 40 𝑥 = 𝑥 = 6,4 = 6 150 24 Práctica 1. Las alturas, al cm más cercano, de los estudiantes en una escuela son las siguientes: Clase de 7 (28 estudiantes) 153, 149, 155, 148, 151, 150, 156, 154, 149, 152, 155, 154, 152, 156, 150, 151, 154, 155, 158, 147, 154, 155, 155, 156, 149, 151, 152, 153. Clase de 8 (30 estudiantes) 155, 154, 156, 158, 153, 155, 158, 157, 156, 155, 149, 151, 154, 153, 155, 154, 152, 159, 151, 149, 148, 153, 156, 155, 157, 155, 154, 157, 155, 156.
Clase de 9 (26 estudiantes) 151, 158, 155, 156, 155, 158, 159, 160, 154, 153, 148, 156, 149, 150, 157, 156, 157, 156, 154, 155, 158, 153, 155, 150, 158, 160. Clase de 10 (24 estudiantes) 161, 158, 156, 148, 155, 156, 149, 159, 155, 156, 157, 158, 158, 161, 151, 159, 155, 156, 153, 160, 158, 155, 156, 158. Clase de 11 (25 estudiantes) 163, 160, 158, 149, 151, 159, 158, 162, 161, 156, 155, 154, 150, 151, 160, 159, 158, 156, 156, 155, 156, 157, 158, 158, 157. Clase de 12 (27 estudiantes) 151, 163, 165, 158, 155, 156, 159, 160, 161, 165, 159, 155, 156, 158, 158, 157, 155, 154, 152, 150, 163, 159, 158, 155, 156, 162, 158. a. Encuentra la altura media de toda la escuela. b. Use un método de muestreo apropiado para recolectar una muestra de 50 estudiantes y encontrar la media de la muestra. Comente si su muestra es imparcial o no. 2. Las edades de 100 personas en un campamento familiar son los siguientes: 1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10, 10, 10, 11, 11, 12, 12, 12, 12, 12, 13, 13, 14, 15, 15, 16, 16, 18, 18, 18, 19, 19, 19, 20, 21, 21, 23, 24, 24, 25, 34, 35, 35, 35, 36, 36, 37, 38, 38, 38, 39, 40, 40, 40, 41, 42, 42, 43, 43, 45, 45, 47, 49, 49, 50, 50, 50, 55, 57, 62, 62, 63, 65, 65, 67, 67, 69, 70, 71, 72 El gerente decide cobrar menos por personas mayores de 60 años. a. Encuentra la edad media de las 100 personas y decida si el gerente perderá muchos ingresos debido a esto decisión. b. Usando un método de muestreo apropiado, elige una muestra aleatoria de 35 personas y encuentre la edad media de la muestra. c. Utilizando un método de muestreo sistemático de cada tercera persona, encuentre la edad media de su muestra d. Comente sobre qué método de las partes b y c dará la mejor aproximación a la media poblacional. 3. El número de goles marcados en 50 partidos hockey es el siguiente: Niñas: 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 6, 6, 7, 7, 8, 9. Niños: 0, 1, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8. a. Encuentra el número medio de goles marcados en los 50 partidos b. Tomando una muestra aleatoria de 12 niñas y 12 niños, encuentran la media de estos 24 partidos. c. Comente si su muestra da una buena aproximación a la media de la población
Presentación de datos ¿Cuáles son los beneficios de Histogramas de frecuencia compartir y analizar datos de Un histograma de frecuencia es muy similar a un diferentes países? gráfico de barras. Sin embargo, en un histograma no hay espacios entre las barras. Los gráficos de barras son útiles para graficar datos cualitativos como el color favorito, mientras que los histogramas se usan para graficar datos cuantitativos. En los histogramas de frecuencia, como en los gráficos de barras, el eje vertical representa frecuencia. Para dibujar un histograma de frecuencia, necesita encontrar los valores inferior y superior de los límites de las clases y dibujar las barras entre estos límites. Ejemplo Belinda recopiló datos sobre el tiempo en segundos que las niñas y los niños de su grupo de año tomaron para completar una carrera de 100 m. Los resultados son: Tiempo de las niñas: 13.5, 13.8, 14.1, 14.3, 14.6, 14.7, 14.9, 15.2, 15.2, 15.3, 15.5, 15.5, 15.6, 15.7, 15.9, 16.1, 16.1, 16.3, 16.3, 16.3, 16.4, 16.6, 16.7, 16.7, 16.9, 17.2, 17.2, 17.5, 17.6, 17.8, 17.8, 18.4, 18.5, 18.9, 19, 20.1, 20.7, 21.4, 21.8, 22.5 Tiempo de los niños: 11.5, 11.8, 12.1, 12.4, 12.4, 12.6, 13.1, 13.2, 13.2, 13.2, 13.5, 13.6, 13.7, 14, 14.1, 14.1, 14.2, 14.3, 14.3, 14.3, 14.5, 14.6, 14.7, 14.9, 15.3, 15.4, 15.5, 15.5, 15.5, 15.7, 15.8, 16.3, 16.4, 16.6, 16.6, 16.7, 17.1, 17.4, 17.7, 20.5. a. Complete la tabla de frecuencias para estos datos. Tiempo (t segundos) Frecuencia Frecuencia (niñas) (niños) 0 2 11 ≤ 𝑡 < 12 0 4 12 ≤ 𝑡 < 13 2 7 13 ≤ 𝑡 < 14 5 11 14 ≤ 𝑡 < 15 8 7 15 ≤ 𝑡 < 16 10 5 16 ≤ 𝑡 < 17 6 3 17 ≤ 𝑡 < 18 3 0 18 ≤ 𝑡 < 19 1 0 19 ≤ 𝑡 < 20 2 1 20 ≤ 𝑡 < 21 2 0 21 ≤ 𝑡 < 22 1 0 22 ≤ 𝑡 < 23 40 40 Total b. Dibuje un histograma de frecuencia para las niñas y un histograma de frecuencia para los niños representando estos datos. c El profesor de educación física estaba interesado en comparar los tiempos de los niños y las niñas para la carrera de 100 m. Encuentre la siguiente información:
Niñas Niños
Tiempo más rápido 13,5 11,5
Cuartil inferior 15,4 13,35
Mediana 16,35 14,4
Cuartil superior 17,8 15,75
Tiempo más lento 22,5 20,5
Puede usar los cinco valores del ejemplo para dibujar un diagrama de caja y bigotes para comparar los conjuntos de datos. Los diagramas de cajas y bigotes son muy convenientes para comparar conjuntos de datos. Aquí puedes ver fácilmente que los niños tienen un tiempo más rápido que las niñas para los cinco valores. Sin embargo, la difusión de datos para niñas y niños es bastante igual. También puede ver que en ambos casos los datos no son simétricos sobre la mediana. Los datos entre la mediana y el tiempo más lento está más extendido que el resto de los datos.
Para dibujar un diagrama de caja y bigotes, necesita cinco datos, llamados el resumen de cinco números: el valor más pequeño, el cuartil inferior (LQ), la mediana, el cuartil superior (UQ) y el valor más grande. • Un valor atípico es un valor que es mucho más pequeño o mucho más grande que los otros valores. Un valor atípico es un punto menor que el LQ - 1.5 x IQR o mayor que UQ + 1.5 x IQR. Ejemplo Los datos sobre el tamaño de los zapatos de un grupo de estudiantes se muestran en la siguiente tabla Tamaño zapato 34 36 37 38 39 40 41 42 49 Mujeres 2 2 10 8 7 3 0 0 0 Hombres 0 0 3 7 12 9 3 1 1 Dibuja una gráfica de caja y bigotes para las mujeres y para los hombres y compare las dos gráficas. Indique si los diagramas de caja son simétricos. Comente si hay valores atípicos.
Dibuje nuevamente los diagramas de caja mostrando claramente los valores atípicos. Los valores atípicos represéntelos por cruces. Interpretando un diagrama de cajas y bigotes: • El 25% de los valores están entre el valor más pequeño y el LQ. • El 25% de los valores están entre el LQ y la mediana. • El 25% de los valores están entre la mediana y la UQ. TOK ¿Puedes justificar el uso de las estadísticas para engañar a otros? • El 25% de los valores están entre la UQ y el ¿Qué tan fácil es ser engañado por las valor más grande. estadísticas? Práctica 1. Theo lanzó un dado 40 veces. Los números que aparecieron fueron: 2331665244115634223516422314451663221145 Millie también lanzó un dado 40 veces y los números que arrojó se muestran a continuación: 6556113454322245466112213336554122336513 a. Construir tablas de frecuencia para estos dos conjuntos de datos b. Dibuja un histograma para representar cada conjunto de datos y compare los dos histogramas. 2. Las alturas, en cm, de 32 gimnastas femeninas son las siguientes: 148, 152, 147, 149, 150, 147, 151, 142, 156, 148, 148, 149, 150, 152, 155, 154, 151, 154, 148, 150, 149, 145, 147, 148, 161, 152, 162, 149, 146, 151, 150, 157 a. Construir una tabla de frecuencia agrupada, utilizando grupos de 5 cm. b. Dibuja un histograma para representar estos datos. c. Dibuje un diagrama de caja y bigotes para representar los datos. d. Indique si los datos son simétricos o no. Justifique su respuesta. 3. Los tiempos, en minutos, para completar 200 juegos de ajedrez se muestran en la tabla. Tiempo (x minutos) Frecuencia 36 20 ≤ 𝑥 < 30 62 30 ≤ 𝑥 < 40 48 40 ≤ 𝑥 < 50 22 50 ≤ 𝑥 < 60 10 60 ≤ 𝑥 < 70 2 70 ≤ 𝑥 < 80 5 80 ≤ 𝑥 < 90 a. Dibuje un histograma para representar estos datos, b. Encuentre la media, mediana, LQ, UQ y rango y determinar si hay valores atípicos. c. Dado que el tiempo más rápido fue 26 minutos y el tiempo más largo fue 84 minutos, dibuje un diagrama de caja y bigotes para representar estos datos. d. Marcus tardó 45 minutos en completar su juego. Comenta si piensas que debería estar satisfecho con este resultado.
4. Las gráficas de caja y bigotes muestran los puntajes en una prueba de matemáticas para 60 niños (arriba) y 60 chicas (abajo).
a. Escriba la puntuación media para los niños y para las niñas. b. Encuentra el rango intercuartil para los niños y para las chicas. c. Escriba el porcentaje de niños que anotó entre 45 y 55. d. Escriba el porcentaje de niñas que anotó entre 65 y 95. e. Encuentra el número de niños que obtuvieron menos puntajes de 45. f. Encuentra el número de chicas que obtuvieron puntajes más de 50. g. Comente si los datos son simétricos. La frecuencia acumulada es la suma de todas las frecuencias hasta un determinado valor. Para dibujar una curva de frecuencia acumulativa, necesita construir una tabla de frecuencia acumulativa, con el límite superior de cada intervalo de clase en una columna y la frecuencia acumulativa correspondiente en otra. Luego trazar el límite de la clase superior en el eje x la frecuencia acumulada en el eje y. Ejemplo: Se anotó el número de visitantes, n, al castillo de Hailes en 200 días separados del año. Número de visitantes (n) Frecuencia 16 0 ≤ 𝑛 < 50 38 50 ≤ 𝑛 < 100 50 100 ≤ 𝑛 < 150 36 150 ≤ 𝑛 < 200 32 200 ≤ 𝑛 < 250 19 250 ≤ 𝑛 < 300 6 300 ≤ 𝑛 < 350 3 350 ≤ 𝑛 < 400 a. Explique cómo puedo saber que hubo menos de 100 visitantes en 54 días. b. Complete esta tabla con los límites superiores y frecuencias acumuladas Límite superior Frecuencia acumulada 16 𝑛 < 50 54 𝑛 < 100 104 𝑛 < 150 140 𝑛 < 200 172 𝑛 < 250 191 𝑛 < 300 197 𝑛 < 350 200 𝑛 < 400
c. Dibuje una curva de frecuencia acumulativa para estos datos. d. Use su curva de frecuencia acumulativa para encontrar una estimación para la mediana, el cuartil menor y el cuartil superior. (En otras palabras, encuentre los valores en el eje x correspondiente a 100, 50 y 150 en su eje y). e. Encuentre una estimación para el percentil 85. f. Si le dicen que el número más bajo de visitantes fue 25 y el número más alto fue 370, dibuje un diagrama de caja y bigotes para representar estos datos. g. Determine si hay valores atípicos. Para encontrar cualquier percentil, p%, lee el valor en la curva correspondiente a p% de la frecuencia total. Práctica Hans Rosling (1948 - 2017) Era 1. La tabla muestra los tiempos promedio, en profesor de salud internacional en el Instituto de Karolinska de Suecia. minutos, que 100 personas esperaron un tren. Cofundador de medicamentos sin Tiempo (x minutos) Frecuencia FA fronteras de Suecia, y fue capaz de 5 5 0≤𝑥<2 mostrar claramente la importancia de coleccionar y analizar datos reales 11 16 2≤𝑥<4 en orden para entender situaciones y 23 39 4≤𝑥<6 planes para el futuro. 31 70 6≤𝑥<8 19 89 8 ≤ 𝑥 < 10 8 97 10 ≤ 𝑥 < 12 3 100 12 ≤ 𝑥 < 14 a. Construir una tabla de frecuencia acumulativa para estos datos. b. Dibuje la curva de frecuencia acumulativa. c. Use su gráfica para encontrar estimaciones para la mediana y el rango intercuartílico. d. Encuentra el décimo percentil. 3 La compañía de trenes reembolsará la tarifa si los clientes tienen que esperar 11 minutos o más para un tren e. Determine cuántos clientes pueden solicitar un reembolso de su tarifa. 25 personas 2. La curva de frecuencia acumulativa muestra las longitudes, en cm, de 100 serpientes en un zoológico. a. Escriba estimaciones para la mediana, el cuartil inferior y el superior. b. La serpiente más pequeña mide 9 cm de largo y el más largo es 650 cm de largo. Dibuja un diagrama de cajas y bigotes para representar estos datos. c. Construya una tabla de frecuencias para las longitudes de las serpientes.
Datos bivariados TOK ¿Por qué hay diferentes fórmulas Los datos bivariados tienen dos variables; los para las mismas medidas estadísticas, datos univariados tienen solo una variable. como media y desviación estándar? Con datos bivariados, se tienen datos de dos variables diferentes recopiladas de las mismas personas, se desea comparar para ver si hay alguna correlación entre las dos variables. Tipos de correlación
La correlación puede ser positiva. Cuando la variable independiente aumenta, también lo hace la variable dependiente.
La correlación puede ser negativa. Cuando la variable independiente aumenta, la variable dependiente disminuye.
Puede no haber correlación. Esto ocurre cuando los puntos son dispersos al azar.
La correlación también se puede describir como fuerte, moderada o débil.
Fuerte
Moderada
Débil
TOK ¿Hasta qué punto podemos Ejemplos confiar en la tecnología para producir 1. La tabla muestra las alturas y los pesos de nuestros resultados? 10 camellos. Peso (kg) 450 600 500 750 750 650 900 600 650 800 Altura (m) 1.45 1.6 1.5 1.85 1.9 1.75 2.0 1.7 1.65 1.8 a. Dibuje un gráfico de dispersión para representar esta información. b. Comenta sobre la relación.
2. La tabla muestra el número de miembros en cada una de las nueve familias y el número de mascotas que tiene la familia. Número de miembros 2 3 4 4 5 5 6 2 8 Número de mascotas 1 0 3 3 5 4 4 2 5 a. Dibuje un gráfico de dispersión para representar estos datos. b. Describa la correlación entre las dos variables. c Indique, con un motivo, si cree que una variable "causa" la otra. 3. La tabla muestra el número de escuelas y el número de restaurantes en una ciudad durante un período de 40 años. Año 1980 1985 1990 1995 2000 2005 2010 2015 2020 Número de 12 13 15 15 16 12 12 18 19 escuelas Número de 28 30 33 34 36 36 38 39 40 restaurantes a. Dibuje un gráfico de dispersión de la cantidad de escuelas y la cantidad de restaurantes. b. Describa la correlación entre las dos variables. c. Indique si cree que un conjunto de variables "causa" el otro. d. Indique una posible razón por la cual la cantidad de escuelas y la cantidad de restaurantes aumentó durante el período de 40 años. 4. La tabla muestra la temperatura en ° C y el tiempo en días que tarda la crema en agriarse. Temperatura (℃) 4 8 12 16 20 24 28 Tiempo en días 15 13 9 6 4 2 1 a. Dibuje un gráfico de dispersión para representar estos datos. b. Describa la correlación entre las dos variables. c. Indique si una variable "causa" la otra. Práctica 1. Para los siguientes gráficos de dispersión, describa el tipo de correlación y la fuerza de la relación.
2. La tabla muestra las alturas, en cm, y los pesos, en kg, de 11 jugadores de fútbol seleccionados en aleatorio. Altura (h cm) 161 173 154 181 172 184 176 169 165 180 173 Peso (w kg) 74 76 61 80 76 88 79 76 75 83 75 a. Trace los puntos en un diagrama de dispersión. b. Comente sobre el tipo de correlación. Interpreta lo que esto significa en términos de jugadores de fútbol. c. Indique si la correlación podría indicar una causalidad en este caso. Justifica tu respuesta. 3. La tabla muestra el tamaño, en pulgadas, de 10 pantallas de computadoras portátiles y el costo, en euros, de la computadora portátil. Tamaño 11.6 11.6 13.3 14 14 14 15 15.6 15.6 15.6 (pulgadas) Costo (euros) 145 170 700 450 370 175 320 500 420 615 a. Trace los puntos en un diagrama de dispersión. b. Describe e interpreta la correlación. c. Indique si cree que el tamaño influye en el costo. 4. Doce estudiantes tomaron exámenes en inglés y matemáticas. Los resultados se muestran en la tabla. Inglés 44 66 71 33 87 90 55 76 65 95 40 58 Matemáticas 71 75 58 63 55 87 54 58 77 54 56 51 a. Trace los puntos en un diagrama de dispersión. b. Describe la correlación. c. Indique si cree que la calificación del examen de inglés influye en la calificación para el examen de matemáticas. 5. Los datos en la tabla muestran la posición en la liga y el número de goles marcados para cada equipo en una liga de hockey. Posición 1 2 3 4 5 6 7 8 9 10 11 12
Goles 52 50 47 44 43 37 36 24 16 12 10 7 a. Trace los puntos en un diagrama de dispersión. b. Describe la correlación. c. Indique si cree que la posición en la liga influye en el número de goles anotados. Correlación En 1956, el estadístico australiano, Oliver Lancaster hizo el primer caso Existe una relación funcional entre variables convincente para un enlace entre la cuando hay una fórmula (o función) que exposición a la luz solar y el cáncer de relaciona una variable con la otra, entonces piel utilizando herramientas estadísticas incluyendo correlación y todos los puntos de datos se encuentran en la regresión. misma línea o curva (la gráfica de la formula). Una relación estadística significa que no existe una relación tan directa, pero los puntos de datos, cuando se trazan, pueden indicar una tendencia a ser cerca de alguna línea o curva. Es posible clasificar una correlación en términos de la forma mostrada por los puntos en un gráfico de dispersión. Si todos los puntos de datos se encuentran cerca de una línea, entonces se dice que la correlación es línea. Este es un ejemplo de correlación lineal. Podría, por ejemplo, representar la relación entre las edades de los corredores en una carrera y sus tiempos para la carrera. Este es un ejemplo de correlación no lineal. Por ejemplo, mostrar el número de gérmenes en un plato en un laboratorio a medida que pasa el tiempo.
Si todos los puntos de datos se encuentran en una línea recta, entonces se dice que la correlación es una correlación lineal perfecta. Este es un ejemplo de una correlación lineal perfecta. En una correlación perfecta, los puntos de datos se encuentran en gráfico de una función o sus coordenadas están vinculadas a través de una fórmula.
Este es un ejemplo de una correlación no lineal perfecta. Podría, por ejemplo, mostrar la relación entre distancia horizontal y la altura cuando se lanza una pelota en el aire.
Ejemplo TOK ¿Cuál es la diferencia entre Indique si las siguientes afirmaciones son correlación y causalidad? ¿En qué medida estos diferentes procesos verdaderas o falsas. afectan la validez del conocimiento a. Las calificaciones del IB obtenidas por un obtenido? estudiante son un efecto de las calificaciones pronosticadas por sus maestros. FALSA b. La altura de una persona es una causa de su peso. FALSA c. La cantidad de helados vendidos es una causa de altas temperaturas, VERDADERA d. Fumar es una causa de cáncer de pulmón. VERDADERA Hasta ahora hemos clasificado las relaciones cualitativamente, es decir: • lineal o no lineal • positivo / negativo / débil / fuerte / moderado / sin correlación. Ahora se verá un método para clasificar la correlación cuantitativamente. Hay varias formas de clasificar la fuerza de una correlación numéricamente. Uno de estos es el coeficiente de correlación de momento del producto de Pearson. El coeficiente de correlación de momento del producto de Pearson, r, es una medida de la correlación lineal entre dos variables x y y, y puede tomar un valor entre -1 y 1 inclusive. Estos son algunos ejemplos de conjuntos de datos y sus valores:
Correlación lineal positiva débil r = 0,3
Correlación lineal fuerte positiva: r = 0,9
Correlación lineal negativa moderada: r = - 0.6
El coeficiente de correlación, r, indica qué tan cerca caen los puntos de una recta línea y si la correlación es positiva o negativa.
Karl Pearson (1857 - 1936) fue un abogado inglés y matemático. Sus contribuciones a las estadísticas incluyen el momento del producto coeficiente de correlación y la prueba chi-cuadrado. Fundó la primera universidad del mundo con un departamento de estadística en el colegio universitario de Londres en 1911.
La fórmula para encontrar el coeficiente de correlación producto momento Pearson es 𝑠𝑥𝑦 𝑟 = 𝑠 𝑠 , donde 𝑠𝑥𝑦 es la covarianza (una medida de cómo dos variables varían 𝑥 𝑦
juntas), 𝑠𝑥 y 𝑠𝑦 son las desviaciones estándares de x y y respectivamente. (∑ 𝑥 )(∑ 𝑦) (∑ 𝑥 )2 (∑ 𝑦)2 , 𝑆𝑥 = √∑ 𝑥 2 − 𝑦 𝑆𝑦 = √∑ 𝑦 2 − 𝑛 𝑛 𝑛 Tenga en cuenta que: • Al encontrar r, el orden de las variables no es importante. • El coeficiente de correlación; r, no tiene unidades. 𝑆𝑥𝑦 = ∑ 𝑥𝑦 −
Ejemplo La tabla proporciona resultados de exámenes en matemáticas y biología para ocho estudiantes. Matemáticas (x) 20 25 28 30 32 37 42 48 Biología (y) 24 20 22 21 25 28 30 32 a. Trace los puntos de datos. b. Comente cualquier correlación que pueda ver en el gráfico. c. Encuentre el coeficiente de correlación de momento del producto de Pearson para estos datos y compárelo con tu respuesta a la parte b. x y x*y X´2 Y´2 20 24 20*24 = 480 20´2= 400 24´2= 576 25 20 25*20= 500 25´2 = 625 20´2= 400 28 22 28*22=610 28´2= 784 22´2=484 30 21 30*21= 630 30´2= 900 21´2= 441 32 25 32*25= 800 32´2= 1024 25´2= 625 37 28 37*28= 1036 37´2=1369 28´2= 784 42 30 42*30=1260 42´2=1764 30´2=900 48 32 48*32= 1536 48´2= 2304 32´2= 1024 262 202 6852 9170 5234
𝑆𝑥𝑦 = 6852 −
(262)2 262 ∗ 202 = 236,5 𝑆𝑥 = √9170 − = 24,279 𝑆𝑦 8 8 = √5234 −
𝑟=
236,5 24,279∗11,554
(202)2 = 11,554 8
= 0,843 Correlación lineal positiva fuerte
Práctica 1. Se realiza un pequeño estudio con 10 niños para investigar la correlación entre la gestación edad al nacer (en semanas) y peso al nacer (en gramos). Los resultados se muestran en la tabla. Edad al nacer (semanas) Peso al nacer (g)
34.6
36
39.3
42.4
40.3
41.4
39.7
41.1
37
42.1
1895
2028
2837
3826
3258
3660
3350
3300
3000
3900
a. Trace los puntos de datos en un gráfico de dispersión. Rotula los ejes. b. Encuentre el coeficiente de correlación de momento del producto de Pearson, r. c. Comente sobre la correlación. 2. Un biólogo está estudiando la relación entre la altura sobre el nivel del mar y el número de ciertas especies de plantas a esa altura particular sobre un área de 100 m2. La tabla muestra la información recopilada. Altura (metros) 0 100 200 450 500 700 900 1000 Número de plantas 1 2 5 8 8 10 12 13 a. Trace los puntos de datos en un gráfico de dispersión. Rotula los ejes. b. Encuentre el coeficiente de correlación de momento del producto de Pearson, r. c. Comente sobre la correlación. 3. Las alturas (en metros) y los pesos (en kilogramos) de 10 jugadores de baloncesto se dan en la tabla. Altura 1.98 2.11 2.06 2.08 2.13 1.96 1.93 2.02 1.83 1.98 (metros) Peso (kg) 93 117.9 104.3 95.3 113.4 84 86.2 99.8 83.9 97.5 a. Graficar los puntos de datos en un gráfico de dispersión. Rotula los ejes. b. Encuentre el coeficiente de correlación de momento del producto de Pearson, r. c. Comente sobre la relación entre el coeficiente y el gráfico. Aquí hay una tabla para interpretar una correlación según el valor de r. Valor de r Correlación 0 ≤ |𝑟| ≤ 0.25 Muy débil 0.25 < |𝑟| ≤ 0.5 Débil 0.5 < |𝑟| ≤ 0.75 Moderado 0.75 < |𝑟| ≤ 1 Fuerte
TOK "Todo lo que puede ser contado no cuenta. Todo lo que cuenta no se puede contar " (Albert Einstein). ¿Qué cuenta como comprensión en matemáticas?
Práctica 1. Etiquete cada uno de estos gráficos de dispersión con los siguientes valores de r: -0.6, 1, 0.9
2. Un sistema de calificación escolar varía de 0 a 10. La tabla muestra, para 10 estudiantes, el número de horas que estudian en promedio por semana, s, y sus calificaciones, g. s 32 30 40 48 35 50 52 60 43 50 g 4 4 6 7 6 7 8 9 6 10 a. Encuentre el producto de Pearson, r, para estos datos. b. Describa la correlación c. Comente sobre el efecto en la nota entre más horas de estudio. 3. Se unieron diferentes pesos y las longitudes. La tabla resume los resultados. Peso (g) 0 10 30 50 90 110 150 200 220 250 Longitud (cm) 0 0.5 2 3 6 6.5 8 10 12 16 a. Encuentre el coeficiente de correlación producto de Pearson, r, para estos datos. b. Comente sobre la correlación. 4. Para cada uno de los siguientes conjuntos de datos: a. Trace los puntos en un diagrama de dispersión. b. Encuentre el coeficiente de correlación de momento del producto de Pearson, r, para los datos. c. Identifique cualquier valor atípico. Describa si siguen o no la tendencia de los datos. d. Calcule el cambio en el valor de r si se eliminan los valores atípicos. 1. x 1 y 4
3 4
2 3
3 5
4 4
4 5 12 6
6 5
7 6
8 7
9 7
x 1 y 4
3 4
2 3
3 5
4 4
5 6
7 6
8 7
9 7
10 12
2. 6 5
3. x 5 10 15 20 25 30 35 30 40 18 27 13 y 650 700 20 560 615 540 570 800 480 600 550 670 TOK ¿Cómo pueden se causales las La línea de mejor ajuste relaciones que se han establecido en Una línea de mejor ajuste es una línea matemáticas? dibujada en un diagrama de dispersión que muestra la tendencia seguido por los puntos de datos. Esta línea se puede usar para hacer predicciones. Para dibujar una línea de mejor ajuste a simple vista: a. Encuentre el punto medio, cuyas coordenadas se calculan al encontrar el punto medio de los valores de x y la media de los valores y; Es el punto (x, y). Trace
este punto en el diagrama de dispersión. Se utilizará como punto de referencia para dibujar la línea. b. Dibuja una línea a través del punto medio que equilibra el número de puntos encima de la línea con el número de puntos debajo de la línea.
Ejemplo Veamos nuevamente los resultados de las pruebas en matemáticas y biología del ejemplo anterior. Matemáticas (x) 20 25 28 30 32 37 42 48 Biología (y) 24 20 22 21 25 28 30 32 a. Encuentra la media de los resultados de la prueba de matemáticas, 262 𝑋̅ = = 32,75 8 b. Encuentre la media de los resultados de la prueba de biología. 202 𝑌̅ = = 25,25 8 c. Trace y etiquete el punto medio en su diagrama de dispersión y úselo para dibujar una línea de mejor ajuste a simple vista.
Pruebas de matemáticas y Biología 35 30 25 20 15 10 5 0
0
10
20
30
40
50
60
d. Por lo tanto, pronostique el resultado de la prueba de biología para alguien que obtuvo 40 en su prueba de matemáticas. Y= mx + b Y = ax + b Y = 0,411x + 11,8 X = 40 Y= 0,411*40+11,8 = 28,24
Práctica 1. Para cada conjunto de datos: i. Trace los puntos en un diagrama de dispersión. ii. Describa el tipo de correlación. iii. Encuentre la media de x y la media de y. iv. Trace y etiquete el punto medio en su diagrama y dibuja una línea de mejor ajuste a través del punto medio. a. x 10 11 12 13 14 15 16 17 18 20 y 18 20 19 21 24 23 24 26 27 32 b. X -3 -2 -1 0 1 2 3 4 5 6 y 15 13 10 7 6 4 5 2 3 0 2. La tabla muestra el área (a, en millones de pies cuadrados) de diez centros comerciales, con el número anual de visitantes (v, en millones). x 2.7 2.2 1.8 2.6 1.8 2.2 2.2 2 1.4 1 y 28 22 26 25 23 22 22 21 20 18 a. Trace un diagrama de dispersión para estos datos. b. Describe la correlación c. Encuentra el área media de las compras en centros comerciales d. Encuentre el número medio anual de visitantes e. Trace y etiquete el punto medio en el diagrama de dispersión. f. Dibuja una línea de mejor ajuste. Un residual es la diferencia entre el valor real y el valor predicho de y. Por lo tanto, los residuos son los errores cometidos al usar líneas de mejor ajuste para hacer predicciones. La línea de regresión de mínimos cuadrados es la línea de mejor ajuste que tiene el menor valor posible para la suma de los cuadrados de los residuos. Si x es la variable independiente y y es la variable dependiente entonces la línea de regresión de mínimos cuadrados también se llama línea de regresión de y en x. La ecuación de la línea de regresión de y en x es: 𝑆𝑥𝑦 (𝑥 − 𝑥̅ ) 𝑦 − 𝑦̅ = (𝑆𝑥 )2 Donde 𝑥̅ y 𝑦̅ son las medias de los datos de x y y respectivamente. (∑ 𝑥 )(∑ 𝑦) (∑ 𝑥 )2 (𝑆𝑥 )2 = ∑ 𝑥 2 − 𝑆𝑥𝑦 = ∑ 𝑥𝑦 − 𝑛 𝑛 Ejemplo TOK ¿Hasta qué punto puedes usar 1. Para el conjunto de puntos de datos confiablemente la ecuación de la línea (1,2), (3,4), (5,3), encuentre la línea de de regresión para hacer predicciones? regresión de y en x usando las fórmulas.
2. En una estación de autobuses, la temperatura máxima en ° C (x) y el número de botellas de agua vendida (y) se registró durante 10 días consecutivos. Los datos recopilados se resumen en la tabla. Días 1 2 3 4 5 6 7 8 9 10 x 20 19 21 21.3 20.2 20.5 21 19.3 18.5 18 y 140 130 140 145 143 145 145 125 120 123 a. Grafique los puntos de datos en un diagrama de dispersión. b. Comente la correlación. c. Encuentre la ecuación de la línea de regresión de y en x. d. Dibuje la línea de regresión en el diagrama de dispersión. e. Se prevé que la temperatura sea de 19.5 ° C. Calcule cuántas botellas de agua deben estar abasteciendo de acuerdo con esta línea de regresión. Práctica 1. Los tiempos de viaje en minutos (x) y el precio en euros (y) de diez trenes diferentes se muestran en la tabla. x 128 150 102 140 140 98 25 130 80 132 y 25.95 40 24.85 31.8 30.2 28.95 21.85 34.5 23.25 26 a. Calcular el valor de r. Comenta la correlación. b. Escriba la ecuación de la línea de regresión de y en x. c. Encuentre el tiempo medio de viaje. d. Encuentra el precio medio. e. Graficar los puntos de datos en un diagrama de dispersión junto con la línea de regresión de y en x, marcando claramente y etiquetando el punto medio. 2. Se realizó una prueba de memoria a un grupo de diez personas. A cada uno de ellos fue mostrado imágenes de 20 objetos diferentes, luego de 5 minutos se les pidió que nombraran los objetos que recordaban. Los tiempos para recordar esos nombres (en minutos) se registraron. Los resultados se muestran en la tabla. Objetos recordados (x) 12 16 9 10 14 18 12 15 12 15 Tiempo (y) 1.9 2.2 1.2 2 2 2.5 2.3 2.2 2.4 2.4 a. Calcule el valor de r. Comente la correlación. b. Escriba la ecuación de la línea de regresión de y en x. c. Encuentra el número medio de objetos recordados. d. Encuentra el tiempo medio que lleva recordar los objetos. e. Grafique los puntos de datos en un diagrama de dispersión junto con la línea de regresión de y en x, claramente marcado y etiquetado el punto medio. Ejemplo Se toma una muestra aleatoria de 12 estudiantes para ver si hay una relación lineal entre altura en cm (x) y la talla de zapato (y). Los datos recopilados se muestran en la tabla. Altura (x 160 187 175 180 186 170 185 172 174 180 165 170 cm) Talla de 37 42 39 38 40 38 41 39 38 40 37 39 zapato (y)
a. Grafique los puntos de datos en un diagrama de dispersión. Comente sobre la correlación. b. Explique por qué es apropiado encontrar la línea de regresión de y en x. c. Encuentre la línea de regresión de y en x. Dibuja la línea en el diagrama de dispersión. d. Por lo tanto, calcule el tamaño del zapato de un estudiante que mide 163 cm de alto. Explica por qué el proceso es válido. e. Explique por qué no es confiable usar la línea de regresión de y en x para estimar el tamaño del zapato de un estudiante que mide 1 50 cm de alto. f. Explique por qué no es apropiado usar la línea de regresión de y en x para estimar la altura de un estudiante cuyo tamaño de zapato es 38. Práctica 1. El CEO de una empresa editorial quiere saber si hay una asociación lineal entre el número de páginas en un libro (x) y el número de errores (y) encontrados en el libro. Diez libros fueron elegidos al azar, y la información se muestra en la tabla. x 100 130 120 80 220 260 290 300 200 150 y 8 10 13 10 12 13 15 16 9 10 a. Grafique los puntos de datos en un gráfico de dispersión. Rotula los ejes. b. Describe la correlación. Por lo tanto, explica por qué es apropiado encontrar la línea de regresión. c. Encuentre la línea de regresión de y en x. d. Por lo tanto, estimar el número de errores en un libro que tiene 280 páginas. e. Comente si sería confiable usar esta ecuación para estimar el número de errores en un libro que tiene 400 páginas. 2. Un grupo de 10 empleados en una fábrica fueron dado un número (x) de sesiones de entrenamiento. Luego se les pidió que completaran una tarea. Los tiempos necesarios para completar esta tarea (y) fueron registrados, medidos en minutos. Los resultados se muestran en la tabla. Número de sesiones (x) 3 4 5 3 7 7 8 9 9 8 Tiempo necesario (y) 10 15 14 12 7 12 6 5 6 4 a. Encuentre el coeficiente de correlación, r. b. Comenta sobre la relación entre el número de sesiones de entrenamiento y el tiempo necesario para completar la tarea. c. Encuentra la ecuación de la línea de regresión de y en x. d. Por lo tanto, estimar cuánto tiempo llevaría un empleado para completar la tarea si recibe seis sesiones de entrenamiento.
Funciones lineales por partes TOK A menudo podemos usar Un problema del mundo real no siempre matemáticas para modelar procesos puede ser representado por una simple cotidianos. ¿Crees que esto es porque función lineal. Sin embargo, a menudo es creamos matemáticas para emular situaciones de la vida real o porque el posible desglosar un problema en mundo es fundamentalmente matemático? elementos que pueden ser modelados por una función lineal. Una función cuyo gráfico se compone de segmentos de línea se llama función lineal por partes. Ejemplo Para la función por partes 𝑓 (𝑥 ) = {
4 −2≤𝑥 ≤3 −𝑥 + 7 3 < 𝑥 ≤ 7
a. Encuentre: i. f(0) = 4 ii. f(6) = - 6 +7 = 1 b. Escriba el dominio. [−2,7] c. Trace el gráfico. 4,5 4 3,5 3 2,5 2 1,5 1 0,5
0 -4
-2
0
2
4
6
Práctica 1. Para cada una de las siguientes funciones lineales por partes: 1+𝑥 −3 ≤𝑥 ≤4 a. 𝑓(𝑥 ) = { 9 − 𝑥 4 < 𝑥 ≤ 10 i. Escribo el dominio. ii. Trace el gráfico. iii. Encuentra f(3) y f(- 3). 𝑥 𝑥≥0 −𝑥 𝑥<0 i. Escribo el dominio. ii. Trace el gráfico. b. 𝑓(𝑥 ) = {
8
iii. Encuentra f(3) y f(- 3). 2. Considere el conjunto de puntos de datos en la tabla. x 1 3 4 6 7 9 10.5 12 13 15 14 17 16 18 y 5.3 4.8 4 4.2 3.4 3.1 3 2 4 7.3 8 11.5 11 15 a. Trace estos puntos en un diagrama de dispersión. b. Encuentre el modelo lineal por partes que mejor se ajusta a estos puntos de datos. c. Dibuje su modelo en el mismo conjunto de ejes utilizados para la parte a. d. Por lo tanto, estimar el valor de y cuando: i. x = 8 ii. x = 15.5 Interpretando la línea de regresión Práctica 1. Decida si las siguientes frases son verdaderas o falsas a. Cuando el gradiente de la línea de regresión es positivo, la correlación es fuerte. b. Una correlación lineal negativa será modelada por una línea con un gradiente negativo. 2. Para cada uno de los siguientes escenarios: a Se les pidió a varios estudiantes su nota promedio al final del último año de secundaria x, y su calificación promedio al final de su primer año en la universidad, y. Al calcular la línea de regresión para los datos resultantes, el resultado fue 𝑦 = −2.50 + 1.04𝑥 . i. Escribo el valor del gradiente (pendiente) de la línea de regresión e interpreta su sentido. ii. Indique el valor de la intersección y de la línea de regresión e interpretar, es decir, si es relevante, dando una razón si no tiene sentido. b. Se encuentra que la relación entre la altura en centímetros, x, y el peso en kilogramos, y, de un grupo de estudiantes de 15 años pueden ser modelados con la línea de regresión 𝑦 = −70 + 0.87𝑥 . i. Escribo el valor del gradiente (pendiente) de la línea de regresión e interpreta su sentido. ii. Indique el valor de la intersección y de la línea de regresión e interpretar, es decir, si es relevante, dando una razón si no tiene sentido. c. Un vendedor de autos quiere estudiar la relación entre el tiempo en años después de comprar un tipo particular de automóvil, x, y el valor del automóvil en USS, y. Se encuentra que la línea de regresión es 𝑦 = −2.50𝑥 + 9000. i. Escribo el valor del gradiente (pendiente) de la línea de regresión e interpreta su sentido.
ii. Indique el valor de la intersección y de la línea de regresión e interpretar, es decir, si es relevante, dando una razón si no tiene sentido.
3. Se suspenden diferentes pesos de un resorte y la longitud de la medida del resorte. Los resultados se muestran en la tabla. Peso (x g) 100 150 200 250 300 350 400 Longitud (y cm) 26 35 32 32 48 49 52 a. Encuentre el coeficiente de correlación, r. b. Comente sobre la correlación. c. La ecuación de la línea de regresión de y en x, es y = ax + b. i. Encuentra el valor de a. Comenta sobre su sentido. ii. Encuentre el valor de b e interprete su significado si es relevante. Si no es relevante, explique por qué. Probabilidad Teórica y experimental La probabilidad es sinónimo de incertidumbre, probabilidad, oportunidad y posibilidad. Puedes cuantificar la probabilidad a través de tres enfoques principales: subjetivo, experimental y teórico.
La teoría de la probabilidad era primero estudiada para aumentar las posibilidades de ganar cuando se juega, los primeros trabajos en el tema fue por italiano matemático Girolamo Cardano en el siglo16.
Probabilidad subjetiva Puede juzgar que es más probable que llegue a la escuela a tiempo si usted toma una ruta particular, según su experiencia con el tráfico. Las probabilidades subjetivas se basan en experiencias y opiniones pasadas en lugar de cálculos formales. Probabilidad experimental Debe usar estos términos cuando discuta y cuantifique probabilidades: Experimento: proceso mediante el cual se obtiene una observación. Ensayos: repetir un experimento varias veces. Resultado: un posible resultado de un experimento. Evento: un resultado o conjunto de resultados. Espacio de muestras: el conjunto de todos los resultados posibles de un experimento, siempre denotado por U. Estos términos se ilustran en el siguiente ejemplo. Erin quiere explorar la probabilidad de arrojar un número primo con un dado octaédrico. Ella diseña un experimento que siente que es eficiente y sin sesgos. Erin coloca el dado en una taza, lo sacude, gira la taza al revés, y lee y registra el número arrojado. Erin repite su experimento hasta que haya completado 50 pruebas. Ella sabe que el resultado de cada ensayo puede ser cualquier número de 𝑈 = {1, 2, 3, 4, 5, 6, 7, 8} y que el evento que está explorando puede ser descrito como: "lanzar un primo con un dado octaédrico" un conjunto de resultados que hacen que la afirmación sea verdadera: {2, 3, 5, 7}. Erin puede escribir P (arrojar
un primo) para representar la probabilidad de su evento ocurre o P(A) si A denota el conjunto{2, 3, 5, 7}. Una suposición crucial en muchos problemas es el de resultados igualmente probables. Una consecuencia de la geometría de las formas que se muestran aquí es que forma dados justos. Cada resultado en un dado justo es tan probable como cualquier otro. Probabilidad teórica La probabilidad teórica brinda una forma de cuantificar la probabilidad de que no requiere realizar una gran cantidad de ensayos. 𝑛(𝐴) La fórmula para la probabilidad teórica 𝑃(𝐴) de un evento 𝐴 es: 𝑃 (𝐴) = donde 𝑛(𝑈)
𝑛(𝐴) es el número de resultados que hacen que A suceda y 𝑛(𝑈) es el número de resultados en el espacio muestral. Siempre que 𝑃(𝐴) represente una probabilidad teórica, subjetiva o experimental, entonces 0 ≤ 𝑃(𝐴) ≤ 1. Ejemplo Encuentre la probabilidad de cada evento y decida qué evento es menos probable. T: arroja un factor de 24 en un dado de cuatro lados. 1, 2, 3, 4 R = 1, 24, 2, 12, 3, 8, 4, 6 P(T) = 4/4 = 1 O: lanzar un primo en un dado de ocho lados. 1, 2, 3, 4, 5, 6, 7, 8 Total de cosas q pasen 8 2, 3, 5 , 7 Total de respuestas q me interesan 4 P(O) = 4/8 D: lanzar al menos 11 en un dado de 12 lados. Total de respuestas 12 Total q interesen (11,12) : 2 P(D) = 2/12 C: lanzar como máximo 3 en un dado de seis lados. Total de respuestas: 6 Total que interesen: (1, 2, 3) 3 P(C) = 3/6 I: lanza un múltiplo de 5 en un dado de 20 lados. Total de respuestas: 20 Total que interesen: (5, 10, 15,20) 4 P(I)=4/20 Todos los dados son justos.
Práctica 1. Ann y Ruth están diseñando un juego para un Proyecto CAS. Los números 1, 2, 3, ..., 11 son escrito en boletos idénticos y un boleto se extrae al azar de un sobre. Encontrar la probabilidad de que el número en el boleto retirado es: a. un impar. b. cuadrado c. primo. d. cuadrado e impar. e. cuadrado y primo. f. primo e impar. g. primo y par. 2. Un número de identificación personal (PIN) consta de cuatro dígitos. Considera el PIN 0005 igual al número 5, etc. Encuentra la probabilidad de que un PIN sea: a. igual a 0000 b. menos de 8000 y más de 7900 TOK ¿La ética juega un papel en el c. divisible por 10 uso de las matemáticas? d. al menos 13. Así como la probabilidad teórica le brinda una forma de predecir el comportamiento a largo plazo de frecuencia relativa, una simple reorganización le brinda una forma de predecir cómo muchas veces es probable que ocurra un evento en un número determinado de ensayos. Ejemplos 1. a. Se lanza una moneda justa 14 veces. Predecir la cantidad de veces que espera que una corona esté boca arriba. 14*1/2= 7 b. Los datos estadísticos acumulados durante cinco años muestran que la probabilidad de que un estudiante esté ausente en una escuela es 0.05. Hay 531 estudiantes en la escuela. Predecir el número de estudiantes que esperan estar ausentes en un día determinado e interpretar tu respuesta. 531*0,05= 26,55 c. Exponga los supuestos que respaldan su respuesta para la parte b. Esto supone que las ausencias en todos los días del año son igualmente probables. 2. Una ciudad costera realiza una encuesta a los turistas en julio de 2018. El tipo de alojamiento elegido y se registra la edad del turista. La información se proporciona en la tabla a continuación: Tipo de alojamiento Edades Hotel Campers Tienda Apartamento Total 18 - 30 67 81 125 32 305 31 – 50 107 230 73 119 529
51 – 70 87 76 34 89 286 109 32 15 54 210 >70 Total 370 419 247 294 1330 a. Se elige un turista al azar de la encuesta para recibir una oferta promocional. Determinar a qué grupo de edad es más probable que pertenezca el turista. De 31 a 50 b. Encuentre la probabilidad de que el turista elegido pertenezca a este grupo de edad, expresando su respuesta como un decimal. 529/ 1330 = 0,398 c. En julio de 2019, se prevé que 16000 turistas visiten la ciudad. Si los hoteles de la ciudad tienen capacidad para 5000, predice si la ciudad tiene suficiente capacidad hotelera para satisfacer la demanda. 16 000 * 370/1330 = 4451, Si tiene suficiente capacidad. Práctica 1. Se realizó una encuesta en una ciudad pequeña un sábado por la tarde. Se les preguntó a los compradores cómo viajaron ese día Los resultados se muestran en la tabla de abajo. Modo de transporte Carro Bus A Pie Total Hombre 40 59 37 136 Mujer 33 41 29 103 Total 73 100 66 239 Un comprador fue seleccionado al azar. a. Encuentra la probabilidad de que este comprador viajara en coche Un comprador masculino fue seleccionado al azar. b. Encuentra la probabilidad de que este hombre viajaba a pie. c. 1300 compradores visitan la ciudad. Estime el número de compradores quien viajó en autobús. 2. Un frasco grande contiene 347 canicas, 125 de los cuales son rojos. Se elige una canica al azar y reemplazado. Encuentra el número esperado de veces que la canica no sea roja en 531 ensayos. 3. Se elige una letra al azar de la palabra "ICOSAEDRO". Encuentra el número esperado de veces de elegir una vocal en 79 ensayos. 4. El control de calidad se lleva a cabo en una fábrica de ropa, 1,37% de las prendas producidas por la máquina A tiene defectos y el 0,41% de las prendas producidas por la máquina B tienen defectos. Un gerente de control de calidad inspecciona 67 prendas de la máquina A y 313 prendas de la máquina B. Encuentre el número esperado de defectos.
Representando probabilidades combinadas con diagramas Has dado los primeros pasos en la cuantificación de probabilidades, experimentos aleatorios, cómo hacer predicciones en el mundo del azar aplicando fórmulas. Las situaciones de probabilidad tienen una estructura que puedes representar de diferentes maneras, por ejemplo, en problemas donde dos o más conjuntos se combinan de alguna manera. Dos representaciones de problemas de probabilidad utilizadas con frecuencia son los diagramas de Venn y diagramas de espacio muestral. Un diagrama de Venn representa el espacio muestral en un rectángulo. Dentro del rectángulo, cada evento está representado por un conjunto de resultados en un círculo o una forma ovalada y está etiquetada. Ejemplos 1. En una encuesta de clase, Rikardo, Malena, Daniel, Maria, India y James informaron que estudian sistemas y sociedades ambientales (ESS). India, Pietro, Mathea y Haneen dijeron que ellos estudian geografía, Rikardo y James fueron los únicos que informaron que estudiaron español, mientras que Sofía y Yulia no estudiaron ninguno de los temas mencionados en la encuesta. Representar los datos en un diagrama de Venn.
U = 11 Use el diagrama de Venn para encontrar las probabilidades que un estudiante eligió al azar de esta clase: a. estudia ESS. 6/11 b. estudia ESS pero no español. 4/11 c. estudia las tres materias. 0 d. estudia exactamente dos de las materias. 3/11
2. En una clase de 26 estudiantes, se encuentra que 10 estudian geografía, 16 estudian historia y 4 ni historia ni geografía. a. Calcular la cantidad de estudiantes que estudian historia y geografía,
b. Por lo tanto, encuentre la probabilidad de que un estudiante seleccionado al azar de esta clase estudie exactamente una de estas materias.
a) 4+16-x+x+10-x=26 30-x=26 30-26=x 4=x b) (12+6)/26 = 18/26 Práctica (7c 321-643) 1. Una encuesta de 117 consumidores encontró que 81 tenía una tableta, 70 tenía un teléfono inteligente y 29 tenían un teléfono inteligente y una tableta. a. Encuentre el número de consumidores encuestados que no tenía ni un teléfono inteligente ni una tableta. b. Encuentra la probabilidad de que al elegir uno de los consumidores encuestados en aleatorio, sea un consumidor que solo tiene un teléfono inteligente. c. En una población de 10000 consumidores, predecir cuántos tendrían solo una tableta. 2. En una clase de 20 estudiantes, 12 estudian biología, 15 estudian historia y 2 estudiantes ni biología ni historia. a. Encuentra la probabilidad de que un estudiante seleccionado al azar de esta clase estudia tanto biología e historia. b. Dado que un estudiante seleccionado al azar estudia biología, encuentra la probabilidad de que este estudiante también estudia historia. c. En un experimento, se selecciona un estudiante en aleatorio de esta clase y del estudiante se anotan las opciones de curso, si el experimento se repite 60 veces, encuentra el número esperado de veces que un estudiante que se elige lleve tanto biología como historia. 3. Un garaje mantiene registros de los últimos 94 autos probados para la capacidad de circulación. Las principales razones para reprobar la prueba son neumáticos defectuosos, dirección o carrocería. En total, 34 falló para los neumáticos, 40 falló para la dirección y 29 fracasaron en la carrocería, 11 autos fallaron por otras razones, 7 autos fallaron por neumáticos y dirección, 6 para dirección y carrocería y 11 para carrocería y neumáticos, los propietarios del garaje desean calcular la cantidad de autos que fallaron en las tres razones. a Dibuja un diagrama de Venn para representar la información, usando x para representar la cantidad de autos que fallan en las tres razones. b. Por lo tanto, calcule el valor de x.
c. Por lo tanto, encuentre la probabilidad de que un automóvil seleccionado al azar de este conjunto de datos falló por al menos dos razones. Un diagrama de espacio muestral es una forma útil de representar todo el espacio muestral y a menudo toma la forma de una tabla. Ejemplo Se afirma que cuando se lanza este par de dados Sicherman y los dos números obtenidos sumados, la probabilidad de cada total es igual que si los dos dados estuvieran numerados con 1, 2, 3, 4, 5 y 6. Verifique esto. 1 1 2 2 3 2 3 3 4 3 4 4 5 P(2)=1/36 P(3)=2/36 P(8) = 5/36 P(9)=4/36
3 4 5 5 6 6 7
4 5 6 8 5 6 7 9 6 7 8 10 6 7 8 10 7 8 9 11 7 8 9 11 8 9 10 12 P(4) = 3/36 P(5) = 4/36 P(6)= 5/36 P(7)=6/36 P(10) = 3/36 P(11) = 2/36 P(12) = 1/36
1 2 3 4 5 6 7 P(3)=2/36 P(9)=4/36
2 3 4 5 6 7 8
3 4 5 6 4 5 6 7 5 6 7 8 6 7 8 9 7 8 9 10 8 9 10 11 9 10 11 12 P(4) = 3/36 P(5) = 4/36 P(6)= 5/36 P(7)=6/36 P(10) = 3/36 P(11) = 2/36 P(12) = 1/36
1 2 3 4 5 6 P(2)=1/36 P(8) = 5/36
Una vez que se ha invertido tiempo en dibujar un diagrama, puede usarse para cuantificar muchas probabilidades diferentes. TOK ¿Cómo un conocimiento de la
Ejemplo teoría de la probabilidad afecta la toma de decisiones? Usa el diagrama de espacio muestral del ejemplo anterior para encontrar la probabilidad que el total encontrado al lanzar dos dados Sicherman es: a. como máximo 4 (2,3,4) = (1+2+3)/36 = 6/36 b. un factor de 24 (2, 3, 4, 6, 8, 12) = (1+2+3+5+5+1)/36 = 17/36
c. como mínimo 8. (8, 9, 10, 11, 12) = (5+4+3+2+1)/36 = 15/36 Práctica 1. Jakub diseña un dado cúbico justo numerado con los primeros seis números primos. Él tira su dado y un tetraédrico justo (de cuatro lados) numerado con los primeros cuatro cuadrados números y anota la diferencia entre los dos números, D. Encuentra la probabilidad de que D sea: a. un número primo b. un número cuadrado 2. a. Se tiran dos dados cúbicos justos en un juego. El puntaje es el mayor de los dos números. Si aparece el mismo número en ambos dados, entonces la puntuación es el número. Encuentre la probabilidad de que el puntaje es como máximo 4. b. En 945 pruebas de este juego, encuentra la frecuencia esperada del evento "la puntuación es de al menos 4 ". 3. Pierfranco diseña un juego. Lanza una moneda justa con un lado etiquetado X y el otro etiquetado Y. Si el resultado es X, se elige un número al azar del conjunto {5, 10, 15, 20, 25, 30, 45}. Si el resultado es Y, la computadora elige del conjunto {30, 40, 50, 60, 70, 80, 90}. Pierfranco anota un punto si el resultado es un múltiplo de 6. Encuentra el número esperado de puntos que Pierfranco marcaría si jugara el juego 54 veces. Representando probabilidades combinadas con diagramas y fórmulas Hay otras formas de encontrar probabilidades de eventos combinados, que pueden agregar a sus habilidades para resolver problemas. En esta sección, utilizará diagramas de Venn para investigar y representar leyes. de probabilidad y usará este lenguaje, estos símbolos y definiciones: Nombre Símbolo Definición informal Definición formal Intersección
𝐴∩𝐵
AyB
Unión Complemento Condicional
𝐴∪𝐵 𝐴´ 𝐴/𝐵
AoB No A A dado B
Los eventos A y B ocurren ambos. Los eventos A y B o ambos. El evento A no ocurre El evento A ocurre dado que el evento B ha ocurrido.
Ejemplo Un estudiante es elegido al azar de esta clase. Si E es el evento "el estudiante toma ESS" y G es el evento "el estudiante toma geografía", luego encuentra estos probabilidades e interpretar lo que significan: 1 1 a. 𝑃(𝐸 ∩ 𝐺 ) = 11 y 𝑃(𝐺 ∩ 𝐸) = 11 9
9
b. 𝑃(𝐸 ∪ 𝐺 ) = 11 y 𝑃(𝐺 ∪ 𝐸) = 11 c. 𝑃 (𝐸´) =
5
11
1
1
d. 𝑃(𝐸 ⁄𝐺 ) = 4 y 𝑃(𝐺 ⁄𝐸 ) = 6 Así como las áreas de las matemáticas como la trigonometría o las secuencias tienen fórmulas, también lo hace la probabilidad como las leyes de probabilidad. TOK Cuando miras las series de crímenes, Dos eventos A y B son mutuamente leyendo un libro o escuchando las noticias, excluyentes si no pueden ocurrir ambos. la evidencia de ADN a menudo cierra un Por lo tanto: caso. Si era así de simple, la detección adicional o la investigación sería necesario. • Saber que A ha ocurrido significa que Investigue la "Falacia del fiscal". ¿Cómo sabes que B no puede, y que saber que B razonará el contraste con emoción al hacer ocurre significa que sabes que A no puede. una decisión basada únicamente en evidencia de ADN? • La ocurrencia de cada evento excluye la posibilidad del otro. • En consecuencia, 𝑃 (𝐴 ∩ 𝐵) = 𝑃(𝐵 ∩ 𝐴) = 0. A y A 'son eventos complementarios. Esto significa que • A y A 'son mutuamente excluyentes. • P (A) + P (A ') = 1
Las leyes de probabilidad pueden usarse en el cálculo de probabilidades de eventos combinados y también para hacer y justificar declaraciones sobre eventos combinados. Ejemplos 1. Catarina explora los nombres de los estudiantes en su clase de 15 estudiantes. Ordena los datos de los 15 estudiantes y determina los conjuntos A y B: 𝐴 = {𝐸𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑐𝑜𝑛 𝑒𝑥𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑑𝑜𝑠 𝑣𝑜𝑐𝑎𝑙𝑒𝑠 𝑒𝑛 𝑠𝑢 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑝𝑖𝑙𝑎} = {𝐶𝑙𝑎𝑟𝑎, 𝑇𝑜𝑚á𝑠, 𝐹𝑎𝑛𝑦𝑔𝑢, 𝑅𝑒𝑎, 𝐽𝑎𝑚𝑒𝑠} 𝐵 = {𝐸𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑐𝑜𝑛 𝑒𝑥𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑡𝑟𝑒𝑠 𝑣𝑜𝑐𝑎𝑙𝑒𝑠 𝑒𝑛 𝑠𝑢 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑝𝑖𝑙𝑎} = {𝐵𝑎𝑟𝑏𝑜𝑟𝑎, 𝐴𝑐ℎ𝑖𝑙𝑙𝑒, 𝑀𝑎𝑙𝑒𝑛𝑎, 𝐷𝑎𝑛𝑖𝑒𝑙, 𝑂𝑙𝑖𝑣𝑒𝑟, 𝑅𝑖𝑘𝑎𝑟𝑑𝑜} a. Representar la información de Catarina en un diagrama de Venn. Un alumno de la clase es elegido al azar.
b Encuentre 5 6 𝑃(𝐴) = 15 , 𝑃(𝐵) = 15 𝑦 𝑃 (𝐴 ∩ 𝐵) = 0. c. Indique con una razón si los eventos A y B son mutuamente excluyentes. Porque su intersección es 0.
11
d. Por lo tanto, escriba 𝑃(𝐴 ∪ 𝐵) = 15 2. Catarina explora aún más el número de hermanos de los estudiantes en su clase de 15 estudiantes. Ella escribe otro conjunto: 𝐶 = {𝐸𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑐𝑜𝑛 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛 ℎ𝑒𝑟𝑚𝑎𝑛𝑜} = {𝐴𝑙𝑒𝑥𝑎𝑛𝑑𝑟𝑎, 𝐼𝑠𝑎𝑏𝑒𝑙𝑙𝑎, 𝐿𝑢𝑘𝑎𝑠, 𝑃𝑎𝑢𝑙𝑎, 𝑂𝑙𝑖𝑣𝑒𝑟, 𝑅𝑖𝑘𝑎𝑟𝑑𝑜} 𝐵 = {𝐸𝑠𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑒𝑠 𝑐𝑜𝑛 𝑒𝑥𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑡𝑟𝑒𝑠 𝑣𝑜𝑐𝑎𝑙𝑒𝑠 𝑒𝑛 𝑠𝑢 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑝𝑖𝑙𝑎} = {𝐵𝑎𝑟𝑏𝑜𝑟𝑎, 𝐴𝑐ℎ𝑖𝑙𝑙𝑒, 𝑀𝑎𝑙𝑒𝑛𝑎, 𝐷𝑎𝑛𝑖𝑒𝑙, 𝑂𝑙𝑖𝑣𝑒𝑟, 𝑅𝑖𝑘𝑎𝑟𝑑𝑜} a. Dibuja los conjuntos B y C en un diagrama de Venn.
Un alumno de la clase es elegido al azar, 6 6 2 B. Encuentre 𝑃(𝐵) = 15 , 𝑃(𝐶 ) = 15 𝑦 𝑃(𝐵 ∩ 𝐶 ) = 15. c. Indique con una razón si los eventos B y C son mutuamente excluyentes, No porqué si intersección es distinta de 0 10 d. Por lo tanto, escriba 𝑃(𝐵 ∪ 𝐶 ) = 15. Práctica 1. Una escuela está inspeccionando 24 casilleros estudiantiles antes del comienzo del nuevo año académico para ver si se han dejado ordenadas. Se encuentra que a algunos armarios les quedan algunos alimentos adentro y algunos armarios tienen artículos de papelería dentro. Casilleros 2, 5, 7, 8, 11, 17, 18 y 19 todos tienen alimentos y casilleros 1, 3, 4, 11, 13, 15, 17, 20 y 21 tienen artículos de papelería. a Dibuje esta información en un diagrama de Venn. b. Indique con una razón si los eventos "un casillero elegido al azar contiene elementos de comida" y "un casillero elegido al azar contiene artículos de papelería" son mutuamente excluyentes. c. Encuentra la probabilidad de que un casillero seleccionado al azar tiene al menos un tipo de elemento dejado adentro. 2. Finn explora las edades de las personas en su familia. Él representa las edades de su familia con el conjunto 𝑈 = {2, 3, 4, 6, 8, 9, 10, 12, 14, 15, 16, 25, 35, 55, 65}. a. Dibuje los siguientes conjuntos en un diagrama de Venn: 𝐴 = {𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑝𝑎𝑟𝑒𝑠} = {2, 4, 6, 8, 10, 12, 14, 16} 𝐵 = {𝑚ú𝑙𝑡𝑖𝑝𝑙𝑜𝑠 𝑑𝑒 3} = {3, 6, 9, 12, 15} 𝐶 = {𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑝𝑟𝑖𝑚𝑜𝑠} = {2, 3}
𝐷 = {𝑛ú𝑚𝑒𝑟𝑜𝑠 𝑚𝑎𝑦𝑜𝑟𝑒𝑠 𝑑𝑒 30} = {35, 55, 65} b. Finn elige un miembro de la familia al azar. Use su diagrama para determinar cuál, si cualquiera, de A, B, C o D puede formarse mutuamente excluyente. ¿Qué queremos decir con un “Juego justo"? ¿Es justo lo que los casinos hacen?
Dos eventos A y B son independientes si la ocurrencia de cada evento no afecta de ninguna manera la ocurrencia del otro. De manera equivalente, saber que A ha ocurrido no afecta la probabilidad de B, y saber que B ocurre no afecta la probabilidad de A. Dos eventos A y B son dependientes si no son independientes. Estas leyes de probabilidad pueden usarse para hacer y justificar declaraciones sobre eventos combinados. Ejemplo Este diagrama de Venn muestra el número de estudiantes en una clase que estudian español y la cantidad de estudiantes que estudian matemáticas. Determine si S y M son eventos independientes mediante: 8 2 2 a. Calcule y considerar los valores de 𝑃(𝑆) = 20 = 5 𝑦 𝑃 (𝑆/𝑀) = 5. 𝑃(𝑆) = 𝑃(𝑆/𝑀) por lo tanto son independientes 8 5 1 2 1 b. Calcule y considerar los valores de 𝑃(𝑆) 𝑥 𝑃(𝑀) = 20 ∗ 20 = 10 𝑦 𝑃(𝑆 ∩ 𝑀) = 20 = 10. 𝑃(𝑆) 𝑥 𝑃(𝑀) = 𝑃(𝑆 ∩ 𝑀) por lo tanto son independientes.
Ahora que ha aprendido sobre eventos mutuamente excluyentes y eventos independientes, puede obtener conocimiento y comprensión sobre cómo difieren estos términos. Puede usar las leyes de probabilidad para justificar otras declaraciones. Ejemplos 1. Para una encuesta de consumidores, se hacen preguntas a 2371 adultos. Un adulto es elegido al azar de los que participan. C es el evento "al adulto le gusta el café". D es el evento "el adulto se llama David". a. Se le da que C y D son eventos independientes. Explica por qué. b. Dado que P (C) = 0.8 y P (D) = 0.007, interprete sus respuestas en contexto en cada una de las siguientes. Encontrar: i. 𝑃(𝐶 ∩ 𝐷 ) = ii. 𝑃 (𝐶 ∪ 𝐷 ) = c. Determine si C y D son mutuamente excluyentes. Justifica tu respuesta.
2. El diagrama de Venn muestra el número de estudiantes en una clase que pueden hablar español, italiano, ambos idiomas o ninguno. Un alumno es elegido al azar de la clase. Deje que S e I sean los eventos "elija un hispanohablante" y "elija un hablante italiano" respectivamente. Encontrar: a. 𝑃(𝑆) = b. 𝑃(𝐼 ) = c. 𝑃(𝑆/𝐼 ) = e. 𝑃(𝐼 ∩ 𝑆) = f. 𝑃 (𝑆)𝑥𝑃(𝐼 ) = Por lo tanto, determine si S e I son independientes.
d. 𝑃(𝐼/𝑆) =
Práctica 1. Para estos pares de eventos, indique si son mutuamente excluyentes, independientes o ninguno. a. A = lanzar una corona sobre una moneda justa. B = lanzar un número primo en un dado justo numerado 1,2, 3, 4, 5, 6. b. C = lloverá mañana. D = está lloviendo hoy. c. D = arrojar un número primo en un dado justo numerado 1,2, 3, 4, 5, 6. E = lanzar un número par en el mismo dado. d. F = lanzar un número primo en un dado justo numerado 1, 2, 3, 4, 5, 6. G = lanzar un número par en otro dado. e. G = elige un número al azar de {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} que sea más que 6. H = elige un número de mismo conjunto que es al menos 7. f. M = elige un número al azar de {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} que no sea más de 5. H = elige un número del mismo conjunto que es 4 o más. g. S = elige un hablante de español al azar de un conjunto de estudiantes representados a continuación. 10/40 = ¼ T = elige un hablante turco al azar de este conjunto 28/40 = 7/10 7/40 = ¼ * 7/10 = 7/40 2. En una encuesta realizada en un aeropuerto, se encontró que los eventos A: "la persona tiene un pasaporte australiano" y V: “la persona elegida al azar tiene tres vocales en su primer nombre" son independientes. Se encuentra también que P(A) = 0.07 y P (V) = 0.61. Encuentre 𝑃 (𝐴 ∪ 𝑉 ) =
3. Un grupo de 50 inversionistas de propiedades en el norte de Europa, el siguiente diagrama de Venn muestra cuántos inversores poseen propiedades en Ámsterdam, Bruselas o Colonia. Uno de los inversores es elegido al azar. a. Encuentra 𝑃(𝐵/𝐴) = b. Encuentra 𝑃(𝐶/𝐴) = c. Interprete sus respuestas para a y b. 10 1 d. Se da que 𝑃(𝐶/𝐵) = 23 y 𝑃 (𝐴/𝐶 ) = 3 . Calcule el resto de las regiones que se muestran en el diagrama de Venn. Representaciones completas, En TOK puede ser útil dibujar una distinción entre conocimiento compartido y conocimiento concisas y consistentes. personal. El IB usa un Diagrama de Venn para Puede usar diagramas como una rica representar estos dos tipos de conocimiento Si fuente de información para resolver tienes que pensar sobre matemáticas (o cualquier materia) ¿qué podría pasar en las tres problemas. Elegir la forma correcta de regiones ilustradas en el diagrama? representar un problema es una habilidad que vale la pena desarrollar. Por ejemplo, considere el siguiente problema: En una clase de 15 estudiantes, 3 estudian arte, 6 biología de quien 1 estudia arte. Un estudiante es elegido al azar. ¿Cuántas probabilidades simples puedes encontrar? ¿Cómo? ¿Cuántas probabilidades combinadas puedes encontrar? Que A represente el evento "Se elige un estudiante de arte de este grupo" y B "Se elige un estudiante de biología". 3 Si representa el problema solo como texto, las probabilidades simples 𝑃(𝐴) = 15 = 1
6
2
y 𝑃 (𝐵) = 15 = 5 se pueden encontrar fácilmente, pero calcular esto no te 5 muestra todo, de cómo los conjuntos se relacionan entre sí. Representa esta información de la siguiente manera en un diagrama de Venn para ver más detalle:
De ahí la probabilidad de que un estudiante elegido al azar no estudie biología ni 7 arte es 𝑃 (𝐴´ ∩ 𝐵´) = 15 . 1
5
2
La probabilidad simple 𝑃(𝐵) = 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐴´ ∩ 𝐵) = 15 + 15 = 5 que se representa como una unión de dos eventos mutuamente excluyentes en el diagrama de Venn. Por lo tanto, el diagrama de Venn se puede utilizar para encontrar todo lo simple, probabilidades combinadas y condicionales. Representa el problema como un diagrama de árbol, primero elegir un estudiante del grupo y determinar si estudia arte o no. Las probabilidades en este proceso pueden ser representadas como un árbol con los dos eventos A y A '. Para construir la siguiente parte del árbol, imagine, un estudiante que estudia arte y considera si este estudiante estudia biología o no. Esto implica escribir el mismo condicional de probabilidades como se encuentran en el diagrama de Venn. Del mismo modo, complete el resto del árbol mostrado. Luego aplique la ley de multiplicación de la probabilidad para encontrar la probabilidad representada al final de cada "rama" del árbol. Por ejemplo, 𝑃 (𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵/ 1 1 1 𝐴) = 𝑥 = . Se ve que la probabilidad 5 3 15 total de 1 se distribuye a lo largo de las ramas del árbol aplicando la ley de multiplicación de probabilidad para los otros eventos combinados. 1
1
2
Note que la probabilidad simple 𝑃(𝐵) = 𝑃(𝐴 ∩ 𝐵) + 𝑃 (𝐴´ ∩ 𝐵) = 15 + 3 = 5 se puede encontrar en las probabilidades al final de dos ramas del diagrama de árbol. Un diagrama de árbol es otra forma de En 1933, el matemático ruso Andrey representar los resultados posibles de un Kolmogorov construyó la teoría de la evento. El final de cada rama representa un probabilidad de axiomas fundamentales de una manera evento combinado. comparable con el tratamiento de Puede elegir un diagrama para hacer su Euclides de la geometría que forma la cálculo más fácil y eficiente. Además, a veces base de la teoría moderna de la probabilidad. El trabajo de Kolmogorov puedes elegir cómo calcular una probabilidad está disponible en inglés, traducción para hacerlo más fácil y eficiente, como se titulada “Los fundamentos de la teoría muestra en el siguiente ejemplo: de probabilidades”.
Ejemplo Una caja en una tienda de electrónica contiene baterías de nueve voltios de diferentes colores. Existen cinco rojos, seis azules y siete naranjas. Se eligen dos baterías para encender una radio que requiere dos baterías. Encuentre la probabilidad de que ambas baterías sean de diferentes colores.
La ley de probabilidad complementaria P (A) = 1 - P (A ') puede darle una manera rápida de resolver problemas. Ejemplo Mark compra sus camisetas de exactamente dos proveedores: 2aT y Netshirts, y solo compra dos colores: gris y azul. Compra el 73% de sus camisetas de 2aT. Además, el 16% de sus camisetas 2aT son grises y el 80% de sus camisetas de Netshirts son grises. a. Copie y complete el diagrama de árbol. b. Calcule la probabilidad de que una camiseta al azar elegido por Mark una mañana es gris. c. Dado que Mark elige una camiseta gris, determine la probabilidad de que fue suministrada por Netshirts.
Práctica 1. Una caja de joyería contiene 13 aretes de oro, 10 aretes de plata y 12 aretes de titanio. Dos de los aretes se sacan al azar con reemplazo. Encuentre la probabilidad de que estén hechos de diferentes metales. 2. Un supermercado utiliza dos proveedores, C y D, de fresas. El proveedor C suministra el 70% de las fresas del supermercado. Las fresas se examinan en un control de calidad (QCI); 90% de las fresas suministradas por C pasan QCI y el 95% de las fresas de D pasan QCI. Se selecciona una fresa al azar. a. Encuentra la probabilidad de que la fresa pasa QCI. b. Dado que una fresa pasa QCI, encuentra la probabilidad de que venga del proveedor D. c. En una muestra de 2000 fresas, encuentre la cantidad esperada de fresas que fallarían QCI. d. El supermercado quiere que la probabilidad que una fresa pase QCI sea 0.93. Encuentra el porcentaje de fresas que debe ser suministrado por D para lograr esto. 3. Una fábrica produce una gran cantidad de coches eléctricos. Se elige un auto al azar de la línea de producción como premio en una competencia. La probabilidad de que el auto sea el azul es 0.5. La probabilidad de que el auto tenga cinco puertas es 0.3. La probabilidad de que el auto es azul o tiene cinco puertas es 0.6. Encuentra la probabilidad de que el auto elegido no sea un carro azul con cinco puertas. Pietro resuelve este problema con un diagrama de Venn pero María lo resuelve con un diagrama de árbol. Ambos obtienen la respuesta correcta. Resuelva el problema en ambos sentidos. Discuta y luego indique cuál es el método más eficiente.
Modelado de comportamiento aleatorio: variables aleatorias y distribuciones de probabilidad. Se utiliza un modelo para representar Los datos discretos son datos que pueden ser una situación matemática. ¿En qué contados, por ejemplo, el número de forma los modelos pueden ayudar o automóviles en un estacionamiento o datos dificultar la búsqueda del conocimiento? que solo puede tomar valores específicos, por ejemplo, el tamaño del zapato. Se pueden medir datos continuos, por ejemplo, altura, peso y hora. Por ejemplo, si una cafetería tiene cuatro cafeteras, la cantidad de los percoladores que fallan en un día determinado, X, es una cantidad que cambia aleatoriamente según la durabilidad y fiabilidad de la maquinaria. Por el contrario, el peso de una bolsa de café, Y, varía aleatoriamente según los procesos de pesaje y envasado en fábrica. Estos son ambos ejemplos de variables aleatorias: el valor de estas variables cambia de acuerdo con el azar. El valor de Y es una medida que puede tomar cualquier número real en un intervalo. Utilizamos la siguiente terminología para variables aleatorias que son contables. Ejemplo: Sea X el número de percoladores que fallan en un determinado día. Terminología
X es una variable aleatoria discreta.
Explicación Discreto: X se puede encontrar contando. Aleatorio: X es el resultado de un proceso aleatorio. Variable: X puede tomar cualquier valor en el dominio {0,1,2,3,4}
Un primer paso para adquirir conocimiento sobre X es completar una tabla: Número de 0 1 2 3 4 percoladores que fallan 𝑃(𝑋 = 𝑥) 𝑃(𝑋 = 0) 𝑃 (𝑋 = 1) 𝑃(𝑋 = 2) 𝑃 (𝑋 = 3) 𝑃(𝑋 = 4) Las cinco probabilidades deben sumarse a una, y cada una debe satisfacer 0 ≤ 𝑃(𝑋 = 𝑥) ≤ 1 Conocerlos establece la distribución de probabilidad de X ya que la tabla muestra cómo se distribuye la probabilidad completa de 1 a cada valor de la variable aleatoria en su dominio. Una distribución de probabilidad discreta es el conjunto de todos los valores posibles de una variable aleatoria discreta (un subconjunto de Z) junto con sus probabilidades correspondientes. Ejemplos 𝑡−2 1. a. Demuestre que la función 𝑓 (𝑡) = 15 , 𝑡 ∈ ℤ, 3 ≤ 𝑡 ≤ 7, define una distribución de probabilidad discreta mediante la construcción de una tabla de valores. T=3 T=4 T=5 T=6 T=7 1/15 2/15 3/15 4/15 5/15
b. Si 𝑃(𝑇 = 𝑡) = 𝑓(𝑡), representa la distribución como un gráfico de barras. 2. Se arrojan un dado cúbico justo y un dado tetraédrico justo. La variable aleatoria discreta S es definida como la suma de los números en los dos dados. a. Construya la distribución de probabilidad de S como: i. una tabla de valores ii. un gráfico de barras iii. una función por partes. b. Por lo tanto, encuentre las probabilidades: i. 𝑃(𝑆 > 2) ii. 𝑃(𝑆 𝑠𝑒𝑎 𝑐𝑜𝑚𝑜 𝑚á𝑥𝑖𝑚𝑜 6) iii. 𝑃(𝑆 ≤ 6/𝑆 > 2). Práctica 𝑡−4 1. Muestre que la función 𝑓 (𝑡) = , 𝑡 ∈ ℤ, 5 ≤ 𝑡 ≤ 10, define una distribución de 21 probabilidad discreta mediante la construcción de una tabla de valores. 2. Sarah investiga partos múltiples en una clínica, donde guarda registros durante un período de años de los géneros de trillizos nacidos. Hay ocho secuencias posibles de géneros en un conjunto de trillizos, por ejemplo, MFM. a. Construye el espacio muestral de todas las posibles secuencias. b. Suponiendo que P (Masculino) = P (Femenino) = 0.5, construya la tabla de distribución de probabilidad de la variable aleatoria F = el número de mujeres nacidas en un conjunto de trillizos. 3. La distribución de probabilidad de una variable aleatoria discreta A se define en esta tabla: a 5 8 9 10 11 12 𝑃(𝐴 = 𝑎) 0.5 0.05 0.04 0.1 0.2 𝑃(𝐴 = 12) Encuentre: a. 𝑃(𝐴 = 12) b. 𝑃(8 < 𝐴 ≤ 10) c. 𝑃(𝐴 𝑛𝑜 𝑒𝑠 𝑚á𝑠 𝑞𝑢𝑒 9) d. 𝑃(𝐴 𝑒𝑠 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 10) e. 𝑃(𝐴 > 8/𝐴 ≤ 11) 4. Parte de la distribución de probabilidad discreta de la variable aleatoria discreta T con el dominio {1, 2, 3, 4, 5} se muestra en el gráfico de barras.
Dado que 𝑃(𝑇 = 4) = 4𝑃(𝑇 = 5), construya la tabla de distribución de probabilidad para T.
Ejemplo La distribución de probabilidad de una variable aleatoria discreta U se define por 𝑃(𝑈 = 𝑢) = 𝑘 (𝑢 − 3)(8 − 𝑢), 𝑢 𝜖 {4, 5, 6, 7}. U 4 5 6 7 P(u) 4k 6k 6k 4k 4k+6k+6k+4k=1 20k=1 K= 1/20 U 4 5 6 7 P(u) 1/5 3/10 3/10 1/5 a. Encuentre el valor de k y por lo tanto, dibuje la tabla de distribución de probabilidad de U. b. En 100 ensayos, calcule el valor esperado de cada posible resultado de U. P(4) 100*1/5=20 P(5) 100*3/10=30 P(6) 100*3/10=30 P(7) 100*1/5=20 c. Encuentre la media de los valores de U encontrados en estos 100 ensayos asumiendo las frecuencias de cada resultado de U viene dado por sus valores esperados en b. (20*4+30*5+30*6+20*7)/100 =5,5 d. Interpreta tu respuesta. El valor esperado de una variable aleatoria discreta X es 𝑬(𝒙) = 𝝁 = ∑𝒙 𝒙𝑷(𝑿 = 𝒙) Ejemplo Un quiosco en Oxford recibe seis copias de un periódico escocés cada domingo. El quiosco tiene un pedido regular de sus clientes para tres periódicos, pero las ventas varían de TOK ¿Confías en la intuición para acuerdo con los acontecimientos actuales, el ayudarte a tomar decisiones? deporte, etc. El quiosco de prensa ha recopilado datos durante varios años para ayudar a predecir sus ventas, creando una tabla de distribución de probabilidad para la variable aleatoria S, la cantidad de periódicos escoceses vendidos el domingo. S 2 3 4 5 6 𝑃(𝑆 = 𝑠) 0.05 0.39 0.29 0.22 0.05 Por lo tanto, encuentre el número esperado de periódicos vendidos e interprete su significado en contexto. 𝐸(𝑥) = 𝜇 = ∑ 𝑥𝑃(𝑋 = 𝑥) = 2 ∗ 0.05 + 3 ∗ 0,39 + 4 ∗ 0.29 + 5 ∗ 0,22 + 6 ∗ 0,05 = 3,83 𝑥
Si X es una variable aleatoria discreta que representa la ganancia de un jugador, entonces si 𝐸 (𝑋) = 0, el juego es justo. Ejemplo Algunos estudiantes tienen una reunión para diseñar un juego de dados para recaudar fondos para caridad como parte de un proyecto CAS. Algunas de las decisiones tomadas en la reunión se pierden. Esta tabla de distribución de probabilidad incompleta permanece: x (precio en US$) 1 2 4 6 7 11 1 x y 1 𝑃(𝑋 = 𝑥) 40 4 8 67 Los estudiantes también recuerdan que 𝐸 (𝑋) = 20 y que la función de distribución de probabilidad generaliza a un modelo lineal. a. Determine las entradas que faltan en la tabla y, por lo tanto, encuentre la función de distribución de probabilidad. 11/40+1/4+x+y+1/8=1 1*11/40+2*1/4+4*x+6*y+7*1/8=67/20 X+y= 1-11/40-1/4-1/8 4x+6y=67/20-1*11/40-2*1/4-7*1/8 X+y=7/20 4x+6y=17/10 X= 7/20-y 4(7/20-y)+6y=17/10 X= 7/20-3/20 7/5-4y+6y=17/10 X= 1/5 2y=3/10 Y=3/20 x (precio en US$) 1 2 4 6 7 11 1 1 3 1 𝑃(𝑋 = 𝑥) 40 4 5 20 8 b. Encuentre la tarifa de entrada más pequeña que los estudiantes podrían establecer para jugar para poder predecir un lucro. Comente sobre las ventajas y desventajas de una serie de posibles tarifas de entrada. Práctica 1. Un bolso contiene siete monedas y tres llaves. Se sacan dos artículos del bolso uno tras otro y no reemplazados. Encontrar el número esperado de llaves sacadas del bolso. 2. Un bolso contiene cinco monedas, cuatro llaves. y ocho mentas. Se sacan dos artículos. del bolso uno tras otro y no reemplazados. Encuentra el número esperado de mentas sacadas del bolso. 3. Se venden diez mil boletos de lotería de US$10. Un boleto gana un premio de US$5000, cinco boletos ganan US$1000 y diez boletos ganan US$200. Encontrar: a. la probabilidad de ganar cada premio en la lotería. b. la ganancia esperada de un boleto. c. el precio de un boleto para hacer de la lotería un juego justo.
Modelando el número de éxitos en un número fijo de ensayos Aprendimos que una función de distribución de probabilidad se puede encontrar como una generalización de un proceso aleatorio. Se encuentra un ejemplo del proceso que aprenderá en esta sección en el trabajo de los psicólogos cognitivos Daniel Kahneman y Amos Tversky (1972). Una pregunta que plantearon en una encuesta fue: "Se encuestó a todas las familias de seis niños en una ciudad. En 72 familias, el orden exacto de nacimiento de niños y niñas fue GBGBBG. ¿Cuál es tu estimación del número de familias encuestadas en las que el orden exacto de nacimientos fue BGBBBB? " La estimación mediana fue de 30, lo que sugiere que los participantes en la encuesta juzgaron que GBGBBG era más del doble de probabilidades de un resultado como BGBBBB. Los psicólogos han estudiado esta "falacia representativa" en la investigación sobre juicios subjetivos y prejuicios. Aprenderá en esta sección las matemáticas necesarias para modelar situaciones como esta; una familia de seis hijos puede ser modelada como secuencia de seis ensayos independientes (nacimientos) en los que la probabilidad de un parto femenino es constante (0.5) durante los seis ensayos. Hay diferentes formas de representar, experimentar y comprender. los procesos detrás de cuantificar las probabilidades en este tipo de experimentos. Dos ejemplos son el triángulo de Pascal y el tablero de Galton. Los números en el triángulo de Pascal son coeficientes binomiales. Se pueden calcularlos con tecnología.
El científico holandés Christian Huygens un maestro de Leibniz, publicó el primer libro en probabilidad en 1657.
Los coeficientes binomiales en la fila (𝑛 + 1) del triángulo están representados por 𝑛! 𝑛 la siguiente notación: 𝐶0𝑛 , 𝐶1𝑛 , 𝐶2𝑛 , … , 𝐶𝑟𝑛 , … , 𝐶𝑛−1 , 𝐶𝑛𝑛 , donde 𝐶𝑟𝑛 = ( ) y 𝑟! 𝑛−𝑟 !
𝐶24
4!
4∗3∗2∗1
𝑛! = 𝑛𝑥 (𝑛 − 1)𝑥 (𝑛 − 2)𝑥 … 𝑥3𝑥2𝑥1. = 2!(4−2)! = 2∗1∗2∗1 = 6 12! 12 ∗ 11 ∗ 10 ∗ 9 ∗ 8 ∗ 7 ∗ 6 ∗ 5 ∗ 4 ∗ 3 ∗ 2 ∗ 1 𝐶312 = = = 220 3! (12 − 3)! 3∗2∗1∗9∗8∗7∗6∗5∗4∗3∗2∗1 Definición formal de la distribución binomial: En una secuencia de n ensayos independientes de un experimento en el que hay exactamente dos resultados "éxito" y "fracaso" con probabilidades constantes P(éxito) = p, P(fracaso) = 1 - p, si X denota la variable aleatoria discreta igual al número de éxitos en n pruebas, entonces la función de distribución de probabilidad es 𝑃(𝑋 = 𝑥 ) = 𝐶𝑥𝑛 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 , 𝑥𝜖 {0, 1, 2, 3, … , 𝑛}. Esto se resume en palabras como "X es la distribución binomial con parámetros n y p" y en símbolos como 𝑋~𝐵(𝑛, 𝑝). Ejemplo Un cuestionario de opción múltiple tiene seis preguntas, cada una de las cuales tiene cuatro opciones igualmente probables A, B, C y D para elegir. Si se adivinan las respuestas y X representa el número de respuestas correctas, encuentre:
1
𝑋~𝐵(6, 4).
12
1
a. 𝑃(𝑋 = 2) = 𝐶26 4 (1 − 4)6−2 = 0,297 b. 𝑃(𝑋 ≤ 2) = 𝑃 (𝑋 = 2) + 𝑃(𝑋 = 1) + 𝑃 (𝑋 = 0) = 0,297 + 0,356 + 0,178 = 0,831 c. 𝑃 (𝑋 < 2) = 𝑃(𝑋 = 1) + 𝑃 (𝑋 = 0) = 0,356 + 0,178 = 0,534 d. 𝑃(3 ≤ 𝑋 < 6) = 𝑃(𝑋 = 3) + 𝑃 (𝑋 = 4) + 𝑃(𝑋 = 5) = 0,132 + 0,0330 + 0,00439 = 0,169 Es esencial examinar el contexto de un TOK Juega el juego de la Paradoja de problema para entender si la distribución San Petersburgo y decide cuanto binomial es un modelo apropiado a aplicar. pagarías por jugar el juego. Para determinar si un contexto puede ser modelado por una distribución binomial, conteste: • ¿Qué es el conteo aleatorio de variables? Estas pruebas deben ser independientes entre sí, lo que significa que saber lo que sucede en una prueba no cambia las probabilidades en cualquier otro juicio. • ¿Cuántas pruebas hay? Este es el parámetro n. • ¿Cuál es la probabilidad de éxito en cada prueba? Siempre debe ser el mismo. Este es el parámetro p.
Ejemplo Para cada situación, indique si la variable aleatoria se distribuye binomialmente. Si es así, encuentre la probabilidad solicitada. a. Una moneda está sesgada para que la probabilidad de una cara sea 0.74. La moneda se lanza siete veces. A es el número de cruz. Encuentra P(A = 5). 𝐴~𝐵(7, 0.26) 𝑃 (𝐴 = 5) = 0,0137 b. Una bolsa contiene 12 bombones blancos y 7 bombones oscuros. Se selecciona un chocolate al azar y se anota el tipo y luego se come. Esto se repite cinco veces. B es el número de chocolates oscuros comidos. Encuentra P (B = 4). No es binomial c. Una bolsa contiene 10 dados rojos, 1 dado azul y 7 dados amarillos. Se selecciona un dado al azar y su color es anotado y reemplazado. Esto se repite 12 veces. C es el número de dados amarillos. Encuentre 𝑃(𝐶 ≤ 6). 7 𝐶~𝐵(12, 18) 𝑃(𝐶 ≤ 6) = 𝑃(𝐶 = 6) + 𝑃(𝐶 = 5) + 𝑃(𝐶 = 4) + 𝑃(𝐶 = 3) + 𝑃(𝐶 = 2) + 𝑃(𝐶 = 1) + 𝑃(𝐶 = 0) = 0,166 + 0,224 + 0,220 + 0,154 + 0,0725 + 0,0207 + 0,00271 = 0,860 d. Ciaran juega una lotería en la que la probabilidad de comprar un boleto ganador es 0.001. E es la cantidad de boletos que Ciaran compra hasta que gana un premio. Encuentre P (E <7). No es binomial
La distribución binomial se puede aplicar en situaciones de resolución de problemas. Ejemplo Resuelve los problemas, indicando cualquier suposición e interpretación que hagas. a. En una familia de seis hijos, encuentre: i. la probabilidad de que haya exactamente tres chicas 𝑀~𝐵(6,0.5) 𝑃 (𝑀 = 3) = 0,313 ii. la probabilidad de que nazcan exactamente tres niñas consecutivas. Mmmhhh Hmmmhh Hhmmmh Hhhmmm
1 6
𝑃 (3𝑀𝐶 ) = 4 ∗ (2) = 0,0625
b. Un estudio muestra que el 0.9% (p=0,009) de una población de más de 4 000 000 tiene un virus. Encuentra la muestra más pequeña de la población para que la probabilidad de que la muestra no tenga virus sea menos de 0.4. 𝑉~𝐵(𝑥, 0.009) 𝑃 (𝑉 = 0) = 0.4 N= n x= 0 p= 0,009 𝐶𝑥𝑛 ∗ 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝐶𝑥𝑛 =
𝑛! 𝑥!(𝑛−𝑥)!
𝑛! ∗ 0,0090 ∗ 0,991(𝑛−0) = 0.4 0! (𝑛 − 0)! 𝑛! ∗ 1 ∗ 0,991𝑛 = 0.4 𝑛! 0,991𝑛 = 0.4 log(0,991𝑛 ) = log (0.4) 𝑛 log(0,991) = log (0.4) log(0.4) 𝑛= log(0,991) 𝑛 = 101,35 N = 102
Práctica 1. Para cada contexto, determine si se puede aplicar el modelo binomial. Si puede, anote la distribución en la forma 𝑋~𝐵(𝑛, 𝑝). Si no puede, indique por qué. a. Un dado justo numerado 1, 2, 3 y 4 es arrojado siete veces. Encuentra la probabilidad que se obtiene exactamente un número par tres veces.
b. Una caja contiene seis dados verdes, tres dados rojos y tres dados blancos. Se selecciona un dado al azar de la casilla. Se nota el color del dado y no se sustituye. Este experimento se repite cuatro veces. Encuentre la probabilidad de que un dado verde se selecciona menos de tres veces. c. Un dado se selecciona al azar de la misma caja, su color anotado y el dado sustituido. Este experimento se repite cuatro veces. Encuentre la probabilidad de que un dado verde se selecciona menos de tres veces. d. Jasmine está empacando su bolso por cuatro días para el Festival de Música. La previsión del tiempo para cada uno de los días establece que la probabilidad de lluvia es un valor constante del 30% Encuentra la probabilidad de que llueva en al menos dos de los cuatro días. e. En un partido de fútbol, siete jugadores suplentes. están disponibles para su selección durante el partido. Las reglas de la FIFA establecen que un máximo de tres sustituciones se puede hacer en un partido. Encuentre la probabilidad de que exactamente se hacen tres sustituciones en un partido. 2. Se lanza una moneda justa seis veces. Calcula la probabilidad de obtener: 1 𝑋~𝐵(6, 2). a. exactamente tres caras. b. no más de cuatro caras. c. al menos tres caras y menos de seis. 3. Unas bufandas de seda se producen en una fábrica. Las investigaciones de control de calidad encuentran que 0.5% de las bufandas producidas tienen fallas, Se selecciona una muestra de 30 bufandas de la fábrica. Calcula la probabilidad de que la muestra tenga: 𝑋~𝐵(30, 0.005). a. exactamente una bufanda defectuosa. b. sin bufandas defectuosas. c. más de tres bufandas defectuosas. 4. Zeke está explorando una moneda sesgada. Él le dice a Francesco que la probabilidad de tirar una cara en una moneda que ha diseñado es 0.964. Sin embargo, la probabilidad de tirar exactamente cuatro caras con esta moneda en cinco ensayos son aproximadamente lo mismo que la probabilidad del mismo evento, pero con una moneda justa. Francesco no cree que esto sea cierto. Demuestre que Zeke está en lo correcto.
En estadística aprendiste sobre las medidas de tendencia central (media, mediana y moda), y medidas de dispersión (rango, rango intercuartil y desviación estándar). Has aprendido que la media de la distribución binomial 𝑋~𝐵(𝑛, 𝑝) es 𝐸 (𝑋) = 𝑛𝑝. Ahora explorarás su varianza. La varianza es el cuadrado de la desviación estándar, y la desviación estándar compara cada dato punto con la media.
TOK A mediados de la década de 1600, los matemáticos Blaise Pascal, Pierre de Fermat y Antoine Gombaud discutieron sobre este simple problema de juego: ¿Qué es más probable: tirar al menos un seis en cuatro lanzamientos de un dado o tirar al menos un doble seis en 24 tiros con dos dados?
Si 𝑋~𝐵(𝑛, 𝑝) entonces 𝐸(𝑋) = 𝑛𝑝 y 𝑉𝑎𝑟(𝑋) = 𝑛𝑝(1 − 𝑝). Ejemplo Se están inspeccionando dos máquinas en una fábrica de bombillas porque el control de calidad planteaba preocupaciones. Los gerentes han descubierto que la probabilidad de que la primera máquina produzca una bombilla defectuosa es 0.3, y que la probabilidad de que la segunda máquina produzca una bombilla defectuosa es 0.2. Los inspectores toman una muestra de seis bombillas de la primera máquina y cinco de la segunda, use que 𝑋~𝐵(6,0.3) y 𝑌~𝐵(5,0.2) para modelar el número de bombillas defectuosas en las muestras de la primera y segunda máquinas respectivamente. Compare y contraste la tendencia central y la propagación de estos variables aleatorias distribuidas binomialmente. 𝐸 (𝑋) = 6 ∗ 0,3 = 1,8 𝐸 (𝑌) = 5 ∗ 0,2 = 1 X tiene el valor esperado más alto: en promedio casi el doble de bombillas defectuosas predice que van a aparecer en la muestra de 6 que en la muestra de 5. 𝑉𝑎𝑟(𝑋) = 6 ∗ 0,3(1 − 0,3) = 1,26 𝑉𝑎𝑟(𝑌) = 5 ∗ 0,2(1 − 0,2) = 0,8 Hay más propagación prevista en los valores del número de bombillas defectuosas desde la primera máquina. Práctica 1. Dado X ~ B (6, 0.29) encuentre las probabilidades: a. 𝑃(𝑋 = 4) b. 𝑃(𝑋 ≤ 4) c. 𝑃(1 ≤ 𝑋 < 4) d. 𝑃(𝑋 ≥ 2) = e. 𝑃(𝑋 ≤ 4/𝑋 ≥ 2) = f. Use sus respuestas para determinar si 𝑋 ≤ 4 y 𝑋 ≥ 2 son eventos independientes. g. Encuentre 𝐸(𝑋). h. Encuentre la varianza de X.
2. Un dado octaédrico justo numerado 1, 2, …, 8 es arrojado siete veces. Q denotar el número de números primos arrojado. Encuentre: (Primos 2, 3, 5, 7) X ~ B (7,4/8 ) a. la probabilidad de que al menos se arrojan tres números primos. b. E (Q) = c. la varianza de Q. 3. a. Una moneda sesgada está coloreada de rojo en un lado y negro por el otro. La probabilidad de tirar rojo es 0.78. Se tira la moneda 10 veces, encuentre la probabilidad de: i. arrojar exactamente tres negros. ii. el número de rojos arrojados es más de tres, pero menos de siete. Deje que A represente el evento "se arroja menos de tres negros" y B "se arroja más de siete negros". b. Encuentre las probabilidades P (A), P (B), P (A \ B). Por lo tanto, determine si los eventos A y B son: c. independiente d. mutuamente excluyentes. 4. En una competencia de matemáticas, los estudiantes intentan encontrar la respuesta correcta entre cinco opciones en un examen de opción múltiple de 25 preguntas. Alex decide que su mejor estrategia es adivinar todas las respuestas. a. La condición para un modelo apropiado para la variable aleatoria A = el número de preguntas que Alex responde correctamente. Encuentre la probabilidad de que el número de preguntas que Alex responde correctamente es: b. como máximo cinco c. al menos siete d. no más de tres, e. Escriba E (A) e interprete este valor. f. Halla la probabilidad de que Alex marque más de lo esperado. g. En la prueba, se otorga 4 puntos una respuesta correcta, una respuesta incorrecta incurre en una penalidad de 1 punto. Si Alex adivina todas las preguntas, encuentre el valor esperado de sus puntos totales para el examen. h. Cuatro estudiantes en total deciden adivinar todas sus respuestas Encuentra la probabilidad de que al menos dos de los cuatro estudiantes obtendrán siete o más preguntas correctas. Medidas de modelado que se distribuyen al azar Considere la altura Y metros de un humano adulto elegido al azar. Utilizamos la siguiente terminología para variables aleatorias que se encuentran midiendo: Terminología
Y es una variable continua aleatoria
Explicación Continuo: se puede encontrar midiendo y, por lo tanto, es un número real. Aleatorio: el resultado de un proceso aleatorio. Variable: Y puede tomar un valor cualquiera en un dominio que es un subconjunto de ℝ. (Y tiene dominio 0,67 m <Y <2,72 m según el Libro Guinness.)
Por ejemplo, se prueban 300 baterías en un control de calidad. La vida útil de cada batería se mide en el segundo más cercano, La vida útil de una batería elegida al azar, L, es una variable aleatoria continua. La figura 1 representa los 300 puntos de datos.
La figura 2 representa el mismo conjunto de datos. El histograma de frecuencia es ampliamente simétrico y puede modelarse mediante la curva "en forma de campana" que se muestra. Baterías que duran períodos de tiempo relativamente largos o cortos son raros. Si se puede modelar un La curva normal también se conoce como Curva gaussiana, y lleva el conjunto de nombre del matemático alemán, Carl datos Friedrich Gauss (1777 - 1855), quien lo continuos con esta forma, decimos que los usó para analizar datos astronómicos. Esto se ve en las 10 viejas notas de datos se distribuyen normalmente o que los Deutsche Mark. datos siguen una distribución normal. Los matemáticos franceses Abraham De Moivre y Pierre Laplace estuvieron involucrados en el Trabajo temprano del crecimiento de la curva normal. De Moivre desarrolló la curva normal como una aproximación del teorema binomial en 1733 y Laplace usó la curva normal para describir la distribución de errores en 1783 y en 1810 para probar el teorema del límite central.
TOK ¿Piensas qué la matemática es útil para medir los riesgos? ¿En qué medida juega la emoción y la fe cuando se toman riesgos?
Ejemplos 1. T es el tiempo de espera en segundos para una atención al cliente TechCo para responder a la primera pregunta de un cliente en una sesión de chat en línea. T ~ N (19.1, 32). Encuentre: a. 𝑃(𝑇 < 17) b. 𝑃(𝑇 ≤ 21) c. 𝑃(𝑇 ≥ 20.3) d. el número esperado de veces que la espera es menor que 21 segundos en una muestra de 107 chats. 2. Las longitudes de truchas se distribuyen normalmente con una media de 39 cm y una desviación estándar de 6,1 cm. a. Encuentre la probabilidad de que una trucha tenga menos de 35 cm de largo. b. Cliff atrapa cinco truchas en una tarde. Encuentre la probabilidad de que al menos dos de las truchas son más de 35 cm de largo. Indique cualquier suposición que haga. c. Encuentre la probabilidad de que una trucha capturada sea más larga que 42 cm dado que es más larga que 40 cm. d. Determine si los eventos L> 42 y L> 40 son independientes.
Práctica 1. La duración de un viaje en autobús local desde el hogar hasta la escuela de Anrai es una variable aleatoria normalmente distribuida 𝑇𝐿 con media 31 minutos y desviación estándar 5 minutos. Dibuje los siguientes eventos en tres diagramas separados: a. 𝑃(𝑇𝐿 ≥ 31) b. 𝑃(29 ≤ 𝑇𝐿 < 32) c. 𝑃(𝑇𝐿 < 36) 2. Una gran muestra de botellas de champú son inspeccionadas. El contenido de las botellas S es distribuido normalmente con una media de 249 ml y desviación estándar 3 ml. a. Haga un boceto de un diagrama para representar esta información. b. Estime la probabilidad de que la botella de champú seleccionada al azar contendrá menos de 246 ml. c. Verifique su respuesta utilizando tecnología. d. La botella está etiquetada "Contenido 250 ml". Predecir el número de botellas en una muestra de 200 que contendrá esa cantidad. 3. 𝑄~𝑁(4.03, 0.72 ). Encuentre las probabilidades con tecnología: a. 𝑃(𝑄 < 4) b. 𝑃(𝑄 < 3.4) c. 𝑃(𝑄 > 5) d. 𝑃(3.5 ≤ 𝑄 < 4.5) e. 𝑃(𝑄 < 4.9/𝑄 > 2.9) 4. a Une estos cinco histogramas con el diagrama de caja y bigotes correcto.
b. Identifique el histograma de un conjunto de datos que sigue la distribución normal. c. Indique, con una razón, qué afirmación es verdadera: p: Un conjunto de datos cuyo histograma es simétrico puede representarse mediante un diagrama de cajas y bigotes simétrico. q: Un conjunto de datos que sigue la distribución normal debe tener un diagrama de cajas y bigotes simétrico. r: Un conjunto de datos con un diagrama simétrico de caja y bigotes debe distribuirse normalmente. El científico belga Lambert Quetelet aplico la distribución normal a características humanas en el siglo 19. Él notó que tales características como altura, peso y la fuerza eran distribuidas normalmente.
Ejemplo Los pesos W de coliflores comprados en un supermercado se distribuyen normalmente con una media de 821 g y desviación estándar 40 g. El 8% más pesado de las coliflores son clasificado como de gran tamaño y reempaquetado. Encuentra el rango de pesos de coliflores clasificadas como de gran tamaño. Expresa tu respuesta correcta al gramo más cercano.
Práctica 1. Se distribuye el peso de una bolsa de arroz normalmente con media de 998 g y desviación estándar 10 g. Se sabe que el 20% de los paquetes pesan menos de r g. Encuentra el valor de r. 2. El peso de un paquete de tres plátanos es distribuido normalmente con media 372 g y desviación estándar 13 g. Se sabe que el 17% de los paquetes pesan más de t g. Encuentra el valor de t. 3. Las velocidades de los automóviles que pasan un punto en una carretera son analizadas por la policía. Se encuentra que las velocidades siguen una distribución normal con una media de 115,7 km/h y desviación estándar 10 km/h. a. Encuentre la probabilidad de que un automóvil elegido viaje entre 110 km/h y 120 km/h. b. Se toma una muestra de ocho automóviles. Encuentra el número esperado de la muestra que viajan entre 110 km/h y 120 km/h. c. Encuentre la probabilidad de que, en la muestra de ocho, más de cinco autos viajen entre 110 km/h y 120 km/h. 4. Catarina encuentra un conjunto de edades X medidas en años que siguen una distribución normal con media 70 años y varianza 25 años. Ella representa los datos con un diagrama de cajas y bigotes. a. Calcule el cuartil superior de X. b. Determine si la longitud del cuadro representa más que, menos que o igual a 10 años. Charles Pearson (1863-1945) fue un psicólogo ingles quien Correlación de coeficiente de Spearman desarrolló el rango de El coeficiente de correlación de momento del correlación, generalmente producto de los rangos de un conjunto de mostrada como la letra griega 𝜌 datos es llamado coeficiente de correlación (rho) o, 𝑟𝑠 , como una herramienta para psiquiatría. de rango de Spearman. La notación BI es 𝑟𝑠 . El coeficiente de correlación de Spearman muestra hasta qué punto La variable aumenta o disminuye a medida que aumenta la otra variable. Un valor 𝑟𝑠 de 1 significa que el conjunto de datos está aumentando estrictamente y un valor de -1 significa que está disminuyendo estrictamente. Datos que solo aumentan o disminuyen es conocido como monotónico Un valor cercano a 0 sugiere que los datos no aumentan constantemente o decreciente.
Ejemplos 1. Encuentre el coeficiente de correlación de rango de Spearman para los siguientes conjuntos de datos. a. Tiempo dedicado al entrenamiento, x horas 23 34 17 23 29 Tiempo para correr 2 km, y minutos 12 10 14 11 11 b. Número de mascotas, x 1 2 3 Tiempo dedicado cada semana al cuidado para ellos, y horas 6 7 8
45 8 4 5 8 16
2. Se le pidió a una estudiante que clasificara nueve marcas diferentes de hamburguesas en términos de cuál le gustaba más a lo que menos le gustaba. Puso 1 para el que más le gustaba y 9 para el que menos le gustaba. Estas clasificaciones y los costos de las hamburguesas se dan en la tabla. Hamburguesa A B C D E F G H I Rango de Sabor 7 3 4 6 1 9 2 5 8 Costo, US $ 3.50 7.45 6.50 4.50 8.50 2.65 3.95 4.35 1.45 a. Explique por qué no puede usar Pearson en este ejemplo. b. Encuentre el coeficiente de correlación de rango de Spearman para estos datos y comente su respuesta. TOK ¿Qué problemas prácticos se pueden hacer o resolver con matemáticas?
El coeficiente de correlación de rango de Spearman solo es válido para los datos dados en la pregunta si algunos puntos de datos son similares, cualquier pequeño cambio podría afectar el valor de 𝑟𝑠 . Práctica 1. Escribe el valor del coeficiente de correlación de Spearman para cada uno de los conjuntos de datos mostrados.
2. Se le pide a un grupo de estudiantes que clasifiquen seis bocadillos por sabor y relación calidad-precio. Los rangos se promedian y se registran en la siguiente tabla. Calcular el coeficiente de correlación de Spearman para los datos y comente sobre los resultados. Palomitas Papas Barras de Masticables Galleta con chispas de de maíz fritas chocolate chocolate Sabor 2 4 1 5 3 Valor 5 3 2 4 1 3. Una clase tomó un examen de matemáticas (marcado de 80) y un examen de inglés (marcado de 100), y los resultados se dan en la siguiente tabla. Matemáticas 15 25 32 45 60 22 24 28 28 29 29 Inglés 44 42 42 49 52 44 54 59 69 28 89 a. Calcular el PMCC para estos datos y comentar el resultado. b. Utilice un software de gráficos para trazar estos puntos en un diagrama de dispersión y comenta tu resultado de a. c. Calcular el coeficiente de correlación de Spearman coeficiente para estos datos y comenta tu resultado. d. Indique cuál es la medida más válida de correlación, y dar una razón.
Las ventajas del coeficiente de correlación de rango de Spearman sobre el PMCC son: • Se puede usar en datos que no son lineales. • Se puede usar en datos que se han clasificado incluso si los datos originales son desconocido o no se puede cuantificar. • No se ve muy afectado por los valores atípicos. Prueba de independencia 𝝌𝟐 Si un científico toma 20 plantas de un campo y mide sus alturas, puede usar estos datos para encontrar la desviación estándar o la media de la muestra particular de las plantas. ¿Qué nos dice esto acerca de la media o desviación estándar de todas las plantas en el campo? ¿Cuál podría ser la precisión de la predicción? La mayor parte del trabajo en estadística como disciplina implica recolectar una muestra y, a partir de ella, estimar: • parámetros; por ejemplo, la media o el coeficiente de correlación de una población entera, cuando todo lo que tiene son estos valores para una muestra de la población. • la distribución de la población; por ejemplo, si la población se distribuye normalmente. TOK El uso de valores p y la prueba de la hipótesis nula es "seguramente es el procedimiento más equivocado alguna vez institucionalizado en el entrenamiento de memoria de estudiantes de ciencias ". - William Rozeboom. ¿En términos prácticos, decir que un resultado es significativo es igual a decir que es verdad?
Evaluación de la hipótesis En estadística, una hipótesis es una declaración sobre los parámetros o características desconocidas de un conjunto de datos. El objetivo de una prueba estadística es tratar de averiguar si los datos apoyan tu hipótesis. Si lo hace, este es un ejemplo de estadística inferencial: has inferido algo de las estadísticas de la muestra que estás considerando. Nuestra hipótesis inicial se llama hipótesis nula y se escribe como 𝐻0 . Cada hipótesis tiene una hipótesis alternativa que será aceptada si se rechaza 𝐻0 ; escribimos esto como 𝐻1 . Por ejemplo, si estuviéramos interesados en saber si una media poblacional es 20 cm o más de 20 cm podríamos escribir: 𝐻0 : 𝜇 = 20, 𝐻1 : 𝜇 > 20 La fórmula para los grados de libertad es v = (filas- 1) (columnas - 1). En los exámenes, v siempre será mayor que 1. 2 La estadística de prueba 𝜒 2 es 𝜒𝑐𝑎𝑙𝑐 =∑
(𝑓0 −𝑓𝑒 )2 𝑓𝑒
donde 𝑓0 son los valores
observados y 𝑓𝑒 son los valores esperados. Si este número es mayor que un valor crítico, rechace la hipótesis nula. Si es más pequeño que el valor crítico se acepta la hipótesis nula.
Práctica 1. Misty estaba interesada en averiguar si la preferencia por el color del automóvil dependía del género. Ella le preguntó a 80 de sus amigos y los resultados se muestran en la tabla. Color de carro Blanco Negro Rojo Azul Totales Hombre 6 14 10 8 38 Mujer 12 8 9 13 42 Totales 18 22 19 21 80 a. Muestre que el número esperado de los hombres que prefieren los autos negros son 10.45 b. Demuestre que el número esperado de las mujeres que prefieren los autos blancos es 9.45. c. Encuentre el valor de 𝜒 2 2. Ziyue le preguntó a su grupo cómo viajas a la escuela, sus resultados se muestran en la tabla. Transporte Carro Bus Bicicleta Caminando Hombre 12 12 28 8 Mujer 21 13 15 11 a. Muestra que el número esperado de los hombres que vienen en bicicleta son 21.5. b. Demuestre que el número esperado de las mujeres que vienen en auto tienen 16.5. c. Use su GDC para encontrar el valor de 𝜒 2. Si la prueba estadística de 𝜒 2 es menor que el valor crítico, entonces se acepta la hipótesis nula. Si es mayor que el valor crítico, entonces no se acepta la hipótesis nula. 2 𝜒𝑐𝑎𝑙𝑐 < 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0 2 𝜒𝑐𝑎𝑙𝑐 > 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 TOK ¿Cómo puede un modelo matemático darnos conocimiento Si el valor p es mayor que el nivel de incluso si no da predicciones precisas? significancia (0.01, 0.05 o 0.10) entonces se acepta la hipótesis nula. Si es menor que el nivel de significancia, entonces no se acepta la hipótesis nula. 𝑣𝑎𝑙𝑜𝑟 𝑝 > 0.05 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝐻0 𝑣𝑎𝑙𝑜𝑟 𝑝 < 0.05 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 Puede usar la prueba estadística, el valor crítico o el valor de p y el nivel de significancia para llegar a una conclusión. Se dará uno de estos valores (el valor crítico o el nivel de importancia), por lo que debe saber cómo usar ambos. Ejemplos 1. A 80 personas se les preguntó por su género musical favorito: pop, clásico, folk o jazz. Los resultados están en la siguiente tabla. Género Pop Clásico Folk Jazz Totales Hombre 18 9 4 7 38 Mujer 22 6 7 7 42 Totales 40 15 11 14 80
Se realizó una prueba 𝜒 2 al nivel de significancia del 1%. El valor crítico para esta prueba es 11.345. a. Escriba las hipótesis nula y alternativa. b. Demuestre que el valor esperado para una mujer que le gusta el pop es 21. c. Escriba el número de grados de libertad. d. Encuentre el estadístico de prueba 𝜒 2 y el valor p. e. Indique si la hipótesis nula es aceptada o no, dando una razón para su respuesta. 2. Los bulldogs estadounidenses se clasifican por altura, h, como Pocket, Standard o XL. Los Pocket tienen h <42 cm de alto, los Standard tienen 42 <h <50 y los XL tienen 50 <h <58. En una exposición canina, Marius mide y pesa 50 perros. Le interesa saber si la clase de perro es independiente del peso y decide realizar una prueba 𝜒 2 al nivel de significancia del 5%, los resultados se muestran en la tabla. Altura Peso Altura Peso Altura Peso 36 30 42 38 50 39 37 33 42 39 51 41 37 36 43 36 51 42 38 31 43 44 52 45 38 38 44 42 52 45 39 32 44 48 52 51 39 39 45 46 53 53 39 42 46 49 54 55 40 41 46 38 54 48 40 43 46 42 54 56 40 38 47 46 55 58 41 38 47 50 55 51 41 44 47 52 56 54 41 46 48 49 56 53 41 45 48 48 56 55 41 47 48 42 57 58 49 53 57 59 a. Encuentra el peso medio de los 50 perros. b. Complete la siguiente tabla: Clase Pocket Standard XL < 𝑚𝑒𝑑𝑖𝑎 ≤ 𝑚𝑒𝑑𝑖𝑎 c. Escriba las hipótesis nulas y alternativas. d. Escriba el número de grados de libertad. e. Demuestre que el número esperado de perros XL que pesan menos que la media es 8.16. f. Encuentre la prueba estadística 𝜒 2 y el valor de p. g. Comente su respuesta.
Práctica 1. Pippa envía un cuestionario a 50 de sus compañeros preguntando cuál es su deporte favorito ella quiere hacer una prueba 𝜒 2 con un nivel de significancia del 10% para saber si el deporte favorito es independiente del género. Los resultados son los siguientes: Hombres: ciclismo, ciclismo, baloncesto, fútbol, fútbol, fútbol, baloncesto, baloncesto, baloncesto, baloncesto, fútbol, fútbol, fútbol, ciclismo, ciclismo, baloncesto, baloncesto, baloncesto, baloncesto, baloncesto, ciclismo, ciclismo, ciclismo. Mujeres: fútbol, fútbol, fútbol, baloncesto, baloncesto, ciclismo, baloncesto, baloncesto, baloncesto, ciclismo, ciclismo, ciclismo, fútbol, fútbol, fútbol, ciclismo, baloncesto, baloncesto, ciclismo, fútbol, fútbol, fútbol, fútbol, ciclismo, ciclismo, ciclismo, baloncesto. a. Realice una tabla de contingencia para mostrar los resultados. b. Escriba la hipótesis nula y la alternativa. c. Escriba el número de grados de libertad. d. Encuentre el valor de 𝜒 2 y el valor de p. e. Compruebe que los valores esperados son mayores de 5. Si el valor crítico es 4.605. f. Escriba la conclusión de la prueba. g. Comente si el valor de p apoya esta conclusión. 2. Se realizó una encuesta para averiguar qué tipo de pan que prefieren los hombres y las mujeres. Ochenta personas fueron entrevistadas afuera de una panadería y se muestran los resultados abajo. Pan Blanco Integral Maíz Multigranos Totales Hombres 14 10 7 8 39 Mujeres 17 6 6 12 41 Totales 31 16 13 20 80 2 Usando la prueba 𝜒 con una significancia del 5%, determinar si el tipo favorito de pan es independiente del género. a. Escriba la hipótesis nula y la hipótesis alternativa. b. Demuestre que la frecuencia esperada para las mujeres que comen pan blanco aproximadamente 17.9. c. Escriba el número de grados de libertad. d. Escriba el valor de 𝜒 2 y el valor de p. El valor crítico es 7.815. e. Comente el resultado. 3. Tres sabores diferentes de comida para perros fueron probado en diferentes razas de perros para ver si hubo alguna conexión entre el sabor favorito y la raza. Los resultados se muestran en la siguiente tabla. Sabor Res Pollo Cordero Totales Bóxer 14 6 8 28 Labrador 17 11 10 38 Poodle 13 8 14 35 Collie 6 5 8 19 Totales 50 30 40 120
Realice una prueba 𝜒 2 con un nivel de significancia del 5% para probar si el sabor favorito es independiente de la raza del perro a. Escriba la hipótesis nula y la hipótesis alternativa. b. Escriba la tabla de frecuencias esperadas. c. Combina los resultados para collie y poodle para que todos los valores esperados sean mayores de cinco y anote la nueva tabla de valores observados. d. Escriba la prueba estadística 𝜒 2 y el valor de p para estos datos. El valor crítico es 9.488. e. Comenta tu resultado con un nivel de significancia del 5%. Prueba 𝝌𝟐 de ajuste de bondad La prueba de independencia usando las TOK ¿Cómo tener innovaciones tecnológicas afecta la naturaleza y la tablas de contingencia son un ejemplo de práctica de las matemáticas? prueba de bondad de ajuste, pero puede se puede usar para cualquier distribución. En la prueba de bondad de ajuste 𝜒 2, el número de grados de libertad es 𝑣 = (𝑛 − 1). Ejemplo Se les pregunta a los estudiantes de 8 año en qué día de la semana son sus cumpleaños este año. La tabla muestra los resultados. Día Domingo Lunes Martes Miércoles Jueves Viernes Sábado Frecuencia 12 14 18 17 15 15 14 a. Escriba la tabla de valores esperados, dado que cada día es igualmente probable. b. Realice una prueba de bondad de ajuste 𝜒 2 con un nivel de significancia del 5% para estos datos. c. El valor crítico es 12.592. Escriba la conclusión de la prueba. Práctica. 1. Terri compra 10 paquetes de Skittles y cuenta cuántos hay de cada color (amarillo, naranja, rojo, morado y verde). En total ella tiene 600 dulces. Según el sitio web de Skittles, los colores deben distribuirse uniformemente con 20% de cada color en una bolsa. Los resultados para las 10 bolsas de Terri son: Color Frecuencia Amarillo 104 Naranja 132 Rojo 98 Morado 129 Verde 137 a. Encuentra las frecuencias esperadas. b. Escriba el número de grados de libertad. c. Determinar los resultados de una prueba de ajuste de bondad con nivel de significancia del 5% para encontrar si los datos de Terri se ajustan a una distribución uniforme. Recuerda escribir las hipótesis nula y alternativa.
El valor crítico para esta prueba es 9.488. d. Indique la conclusión de la prueba y dé una razón para su respuesta. 2. Hay 60 estudiantes en el grado 12. El Sr. Stewart les pregunta en qué mes están de cumpleaños, los resultados se muestran en la tabla. Mes Ene Feb Mar Abr May Jun Jul Ago Set Oct Nov Dic Fr 3 5 4 6 5 6 4 7 8 6 3 3 Los meses en que las personas cumplen años se distribuyen de manera uniforme. a. Escriba la tabla de valores esperados. b. Escriba el número de grados de libertad. c. Determinar los resultados de una prueba de ajuste de bondad con nivel de significancia del 10% para averiguar si los datos se ajustan a una distribución uniforme. Recuerde escribir las hipótesis nulas y alternativas. El valor crítico para esta prueba es 17.275. d. Indique la conclusión de la prueba y dé una razón para su respuesta. Ejemplo Los puntajes para las pruebas de coeficiente intelectual se distribuyen normalmente con una media de 100 y desviación estándar de 10. Cinzia da unas pruebas de coeficiente intelectual para los 200 estudiantes del Programa del Diploma IB en el colegio. Sus resultados se muestran en la tabla. Puntuación x Frecuencia 5 𝑥 < 90 14 90 ≤ 𝑥 < 100 100 ≤ 𝑥 < 110 74 110 ≤ 𝑥 < 120 58 120 ≤ 𝑥 < 130 34 15 130 ≤ 𝑥 Cinzia quiere probar si estos resultados también son distribuidos normalmente y realiza una prueba de bondad de ajuste de 𝜒 2 con nivel de significancia del 10%. a. Escriba sus hipótesis nulas y alternativas. b. Encuentre los valores esperados. c. Si alguno de los valores esperados es inferior a 5, vuelva a escribir ambas tablas. d. Escriba el número de grados de libertad. El valor crítico es 6.251. e. Encuentre la prueba estadística 𝜒 2 y el valor de p y establezca la conclusión de la prueba. Práctica 1. Marius trabaja en una pescadería. Una semana mide 250 peces antes de venderlos. Los resultados se muestran en la tabla. Longitud del pez, x cm Frecuencia 5 9 ≤ 𝑥 < 12 22 12 ≤ 𝑥 < 15 71 15 ≤ 𝑥 < 18 88 18 ≤ 𝑥 < 21
52 21 ≤ 𝑥 < 24 10 24 ≤ 𝑥 < 27 2 27 ≤ 𝑥 < 30 A Marius le dicen que la longitud del pez debería distribuirse normalmente con una media de 19 cm y desviación estándar de 3 cm, entonces decide realizar una prueba de bondad de ajuste 𝜒 2 con nivel de significancia del 5% para descubrir si el pez que midió podría venir de una población con esta distribución. a. Escriba las hipótesis nula y alternativa. b. Encuentra la probabilidad de que un pez este entre 9 cm y 12 cm. c. En total, se midieron 250 peces. Calcule cuántos peces se espera que estén entre 9 cm y 12 cm. d. Complete la tabla de valores esperados para 250 peces distribuidos normalmente con una media de 19 cm y desviación estándar de 3 cm. Longitud del pez, x cm Probabilidad Frecuencia esperada 0.009386 2.35 9 ≤ 𝑥 < 12 0.0814 20.3 12 ≤ 𝑥 < 15 15 ≤ 𝑥 < 18 18 ≤ 𝑥 < 21 21 ≤ 𝑥 < 24 0.04396 10.99 24 ≤ 𝑥 < 27 0.00371 0.927 27 ≤ 𝑥 < 30 Dos de las frecuencias esperadas son menos de 5. e. Discuta lo que tiene que hacer en este caso. f. Vuelva a escribir la tabla original y la tabla de valores esperados para que todos los valores esperados sean mayores que 5. g. Escriba el número de grados de libertad. h. Encuentre el valor 𝜒 2 y el valor p. El valor crítico es 9.488. i. Anote su conclusión para esta prueba. 2. La vida útil de las bombillas se distribuye normalmente con una vida media de 1200 horas y una desviación estándar de 100 horas. Se prueban cuatrocientas bombillas y los resultados se muestran en la tabla. Vida útil, h ℎ < 1000 1000 ≤ ℎ 1100 ≤ ℎ 1200 ≤ ℎ 1300 ≤ ℎ ℎ ≥ 1400 horas < 1100 < 1200 < 1300 < 1400 Frecuencia 24 52 92 164 42 26 a. Complete la tabla de frecuencias esperadas. Vida útil, h ℎ < 1000 1000 ≤ ℎ 1100 ≤ ℎ 1200 ≤ ℎ 1300 ≤ ℎ ℎ ≥ 1400 horas < 1100 < 1200 < 1300 < 1400 Frecuencia esperada b. Escribe el número de grados de libertad. c. Determine los resultados de una prueba de bondad de ajuste al nivel de significancia del 5% para averiguar si los datos se ajustan a una distribución normal. Recuerde escribir la hipótesis nula y la alternativa. El valor crítico para esta prueba es 11.070. d. Indique la conclusión de la prueba y dé una razón para su respuesta.
TOK ¿Hasta qué punto puede el conocimiento compartido estar Ejemplo distorsionado y ser engañoso? Encuentre la probabilidad cuando lanzas tres monedas, se puede obtener: 0 caras, exactamente 1 cara, exactamente 2 caras, 3 caras. Agar lanza tres monedas 200 veces y anota el número de caras cada vez. Sus resultados son los siguientes. Número de caras Frecuencia 0 28 1 67 2 83 3 22 Ella está interesada en averiguar si sus resultados siguen una distribución binomial y realiza una prueba de bondad de ajuste 𝜒 2 con nivel de significancia del 5%. a. Usando los términos de B (3, 0.5) y el hecho de que Hagar arrojó la moneda 200 veces, encuentre los valores esperados para el número de caras. b. Comente si alguno de estos valores es menor que 5. c. Escriba las hipótesis nulas y alternativas y los grados de libertad. El valor crítico es 7.815. El físico franco Oppenheimer escribió: "La predicción d. Encuentre el valor 𝜒 2 y el depende solo bajo el supuesto que se observaron patrones repetidos". Este es el peligro de valor de p. extrapolación. Existen muchos ejemplos de su fracaso en el e. Escriba la conclusión de pasado: precios de acciones, la propagación de esta prueba. enfermedades y cambio climático.
Práctica 1. Percy siembra tres semillas en cada una de 50 diferentes huecos. La probabilidad de que una semilla germine es 0.75. El número de semillas que germinan en cada maceta se muestra en la tabla. Número de semillas que germinan 0 1 2 3 Frecuencia 5 10 15 20 a. Usando la expansión binomial B (3, 0.75), encuentre las probabilidades esperadas de 0, 1,2 o 3 semillas germinadas. b. Escriba la tabla de frecuencias esperadas. c. Indique si hay o no hay valores esperados menores de 5. d. Escriba el número de grados de libertad. e. Determinar los resultados de una prueba de ajuste bondad con un nivel de significancia del 5% para averiguar si los datos se ajustan a una distribución binomial. Recuerde escribir las hipótesis nulas y alternativas. El valor crítico para esta prueba es 5.991. f. Estado la conclusión de la prueba y de una razón para su respuesta. 2. El número de niños en 100 familias con tres hijos se muestra en la tabla. Número de niños 0 1 2 3 Frecuencia 16 23 32 19 a. Si la probabilidad de tener un niño es 0.5, use la expansión binomial B (3, 0.5) para encontrar los valores esperados.
b. Indique si hay o no hay valores esperados menores de 5. c. Escriba el número de grados de libertad. d. Determinar los resultados de una prueba de ajuste bondad con un nivel de significancia del 1% para averiguar si los datos se ajustan a una distribución binomial. Recuerda escribir las hipótesis nula y alternativa. El valor crítico para esta prueba es 11.345. e. Indique la conclusión de la prueba y dé una razón para su respuesta. La prueba t Ejemplos 1. Arthur les da a sus dos grupos de química la misma prueba. Él quiere averiguar si hay alguna diferencia entre los niveles de logro de los dos grupos. Los resultados son: Grupo 54 62 62 43 85 69 23 81 42 92 55 59 68 22 1 Grupo 23 62 58 46 91 48 82 81 62 24 52 66 2 a. Escriba las hipótesis nulas y alternativas. b. Encuentre el valor de T y el valor de p para una prueba T al nivel de significancia del 5%. c. Escriba la conclusión. 2. Una compañía petrolera afirma haber desarrollado un combustible que aumentará la distancia recorrida por cada litro de combustible. Diez scooters se llenan con un litro de combustible normal y diez scooters se llenan con un litro de combustible nuevo. Las distancias, en km, recorridos en un litro por cada scooter son los siguientes: Combustible original 36 38 44 42 45 39 48 51 38 43 Combustible nuevo 43 39 51 49 53 48 52 46 53 49 a. Escriba las hipótesis nula y alternativa, b. Encuentre el valor de T y el valor de p para una prueba T al nivel de significancia del 5%. TOK ¿Qué cuenta como comprensión c. Escriba la conclusión de la prueba. en matemáticas? Práctica 1. Petra notó que uno de sus manzanos creció a la sombra y los demás no. Ella quería saber si las manzanas del árbol a la sombra pesaban menos que las otras, ella recogió nueve manzanas de cada árbol y los pesó en gramos. Árbol en la sombra 75 82 93 77 85 78 91 83 92 Árbol no a la sombra 74 81 95 79 95 82 93 88 90 a. Escriba la hipótesis nula y la alternativa. b. Indique si se trata de una prueba de una cola o una prueba de dos colas. c. Encuentre el valor de T y el valor de p para una prueba T al nivel de significancia del 10%. d. Escriba la conclusión de la prueba.
2. Las vidas de dos tipos diferentes de bombillas se probaron para averiguar si uno era mejor que el otro o no, los números de horas se enumeran en la tabla. Bombillo 1 1236 1350 1489 2052 1986 1825 2134 1985 Bombillo 2 1562 1432 1262 2145 1829 1982 1629 1265 a. Escriba la hipótesis nula y la alternativa. b. Indique si se trata de una prueba de una cola o una prueba de dos colas. c. Encuentre el valor de T y el valor de p para una prueba T al nivel de significancia del 5%. d. Escriba la conclusión de la prueba. 3. Los pesos, en kg, de los niños y las niñas en 6 Grado fueron escritos para descubrir si los niños pesaban menos que las niñas. Peso de niños Peso de niñas 33 35 32 39 35 43 36 45 41 39 32 44 38 38 34 32 36 31 a. Escriba la hipótesis nula y la alternativa. b. Indique si se trata de una prueba de una cola o una prueba de dos colas. c. Encuentre el valor de T y el valor de p para una prueba T al nivel de significancia del 5%. d. Escriba la conclusión de la prueba.