Facultad Regional Multidisciplinaria de Estelí FAREM ESTELÍ Recinto Universitario “Leonel Rugama Rugama” Departamento de Ciencias de la Educación y Humanidades 2019: Año de la Reconciliación
Estadística y Probabilidades Física Matemática II Año
Elaborado: M.Sc. Cliffor Jerry Herrera Castrillo
18 de mayo 2019
Índice Introducción _____________________________________________________________ 1 Unidad I. Estadística Descriptiva ____________________________________________ 2 Conceptos fundamentales de la estadística descriptiva ________________________ 3 Reseña histórica de la estadística ________________________________________ 3 Utilidad e importancia ________________________________________________ 4 Estadística __________________________________________________________ 4 Población y muestra __________________________________________________ 5 Población _________________________________________________________ 5 Muestra ___________________________________________________________ 6 Variable ____________________________________________________________ 6 Tipos de Variables __________________________________________________ 7 Medición y escalas de medidas __________________________________________ 8 Distribución de frecuencias _____________________________________________ 13 Procedimiento a seguir en un estudio estadístico __________________________ 13 Tabla para datos no agrupados ________________________________________ 13 Tabla para datos agrupados ___________________________________________ 14 Tipos de Gráficos _____________________________________________________ 19 Medidas de tendencia central ___________________________________________ 28 Datos no agrupados __________________________________________________ 28 Datos agrupados ____________________________________________________ 31 Formas de la distribución _______________________________________________ 34 Medidas de variabilidad o dispersión _____________________________________ 35 Datos agrupados. ____________________________________________________ 35 Medidas de posición ___________________________________________________ 39 Coeficiente de curtosis (K) ______________________________________________ 41 Unidad II. Probabilidades _________________________________________________ 49 Definiciones __________________________________________________________ 51
Probabilidades ______________________________________________________ 51 Experimento ________________________________________________________ 51 Espacio Muestral ____________________________________________________ 52 Suceso aleatorio _____________________________________________________ 53 Suceso elemental ____________________________________________________ 54 Suceso compuesto ___________________________________________________ 54 Algunas definiciones y operaciones con conjuntos _________________________ 54 Definición clásica de probabilidad (modelo clásico o a priori) _________________ 55 Tipos de probabilidad __________________________________________________ 56 Sucesos independientes _________________________________________________ 58 Sucesos dependientes __________________________________________________ 58 Probabilidad condicional _______________________________________________ 58 Regla de la multiplicación ______________________________________________ 59 Probabilidad total _____________________________________________________ 61 Regla de Bayes ________________________________________________________ 61 TECNICAS DE CONTEO ______________________________________________ 65 La distribución acumulada ____________________________________________ 77 Valor esperado ______________________________________________________ 78 Varianza ___________________________________________________________ 79 Distribución geométrica ______________________________________________ 80 Distribución híper – geométrica________________________________________ 81 Teorema de Chebyshev _______________________________________________ 82 Distribución híper – geométrica multii - variada __________________________ 83 La distribución binomial _______________________________________________ 85 Proceso de Bernoulli _________________________________________________ 85 Distribución binomial ________________________________________________ 85 Media, varianza y desviación estándar de la distribución binomial _________ 86 Distribución binomial negativa. ________________________________________ 87
La distribución de Poisson ______________________________________________ 87 Media, varianza y desviación estándar de la distribución de Poisson ________ 89 La distribución normal _________________________________________________ 90 Áreas bajo la curva normal ___________________________________________ 90 Estandarización _____________________________________________________ 91 Uso de la tabla ______________________________________________________ 91 Unidad III. Estadística inferencial _________________________________________ 104 Muestreo ___________________________________________________________ 105 Conceptos básicos __________________________________________________ 105 Ventajas del muestreo ______________________________________________ 107 1.
Rapidez y bajo costo de la información requerida __________________ 107
2.
Es un procedimiento práctico cuando la población es muy grande o infinita 107
3.
Evita la destrucción de toda la población__________________________ 107
Métodos de muestreo _______________________________________________ 108 Muestreo no probabilístico _________________________________________ 108 Muestreo probabilístico. _____________________________________________ 109 Tipos de muestreo probabilístico ______________________________________ 109 Muestreo aleatorio simple __________________________________________ 109 Muestreo aleatorio sistemático ______________________________________ 111 Estimación __________________________________________________________ 113 Precisión y exactitud de un estimador __________________________________ 113 Errores de muestreo ________________________________________________ 114 Errores ajenos al muestreo _________________________________________ 114 Propiedades de une estimador ________________________________________ 114 Estimador por intervalos de confianza._________________________________ 115 Intervalo de confianza para la media __________________________________ 119 Prueba de hipótesis
___________________________________________________ 123
Tipos de hipótesis
__________________________________________________ 123
Pruebas de una cola (o unilaterales) __________________________________ 125 BibliografĂa ___________________________________________________________ 138 Solucionario de Ejercicios Propuestos ______________________________________ 139
Estadística y Probabilidades – II Año de Física Matemática
Introducción La Matemática es lógica, precisa, rigurosa, abstracta, formal y bella. Representa un saber escalonado, donde cada etapa es necesaria para afrontar la siguiente. Esta ciencia fortalece el pensamiento crítico para entender mejor el entorno, desarrolla la lógica de pensamiento para la toma de decisiones. Por tanto, contribuye al desarrollo de las inteligencias, los sentimientos y la personalidad. En la carrera de Física – Matemática la asignatura de Estadística y Probabilidad tiene como asignatura precedente a Matemática General y como asignaturas consecuentes a Metodología de la Investigación e Investigación Aplicada. Su propósito es contribuir a fundamentar las técnicas estadísticas y probabilísticas utilizadas en las investigaciones de enfoque cuantitativo o positivistas. Actualmente nos encontramos con un crecimiento progresivo de ciencias interdisciplinarias, que armonizan diversas ramas del saber en una sola. Así, se habla de bioestadística, psicología matemática, etc. De manera similar con la asignatura de Estadística y Probabilidad estamos integrando los conocimientos pedagógicos adquiridos sobre la enseñanza de la Física - Matemática y las herramientas estadísticas para enfrentar los procesos de enseñanza aprendizaje de la matemática y la investigación en el campo educativo, auxiliándonos de la calculadora y un determinado paquete estadístico para la interpretación de resultados. (Universidad Nacional Autónoma de Nicaragua UNAN MANAGUA, 2013) Esperó que este módulo pueda contribuir a tu formación profesional con una concepción científica y humanista, capaz de interpretar los fenómenos sociales y naturales con un sentido crítico, reflexivo y propositivo.
1 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Unidad I. Estadística Descriptiva Objetivos de la asignatura Objetivos Conceptuales ▪
Conocer los conceptos y definiciones fundamentales de estadística descriptiva.
Objetivos Procedimentales ▪
Aplicar los conceptos y definiciones fundamentales de la estadística descriptiva en la resolución de problemas de la vida cotidiana.
Objetivos Actitudinales ▪
Valorar la importancia de la Estadística Descriptiva como instrumento para la solución de problemas de su entorno social.
Contenidos Conceptuales Conceptos
Contenidos Procedimentales Contenidos Cognitivos
fundamentales Aplicación de los conceptos Valoración
de la estadística descriptiva Reseña
histórica
estadística,
de
población
muestra.
y
definiciones importancia
la fundamentales
de
de
la
de
la
la estadística descriptiva como
y estadística descriptiva en la instrumento
para
la
Variables. resolución de problemas de solución de problemas de su
Medición
y
escalas
de la vida cotidiana.
entorno social.
medidas. Distribución de
Participación activa en la
frecuencias.
Tipos
resolución
Gráficos.
Percentiles.
Medidas central.
de
de
de
problemas
basados en la realidad.
Tendencias
Medidas
de
variabilidad.
2 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Conceptos fundamentales de la estadística descriptiva Reseña histórica de la estadística Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia de guerrera. Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas.
3 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Utilidad e importancia Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.
Estadística La palabra estadística se emplea en una gran variedad de formas. En plural se emplea como sinónimo de dato. El trabajo estadístico o la investigación estadística es un proceso que pasa generalmente por las siguientes etapas: ▪
Formulación del problema o la tarea
▪
Diseño del experimento
▪
Recopilación de los datos
▪
Clasificación, tabulación y descripción de datos
▪
Generalización o inferencia
Definición: en este documento se define estadística como, la ciencia que proporciona un conjunto de métodos, técnicas o procedimientos para: -
recopilar
-
organizar (clasificar, agrupar),
-
presentar, y
-
analizar,
datos con el fin de describirlos o realizar generalizaciones válidas. La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la estadística descriptiva y la inferencial. 4 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Se denomina estadística descriptiva, al conjunto de métodos estadísticos que se relacionan con el resumen y descripción de los datos, como tablas, graficas, y el análisis mediante algunos cálculos. Se denomina inferencia estadística al conjunto de métodos con los que se hace la generalización o inferencia sobre una población utilizando una muestra. La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que éstas sean dadas con una medida de confiabilidad que es la probabilidad. Estas dos partes de la estadística no son mutuamente excluyentes, ya que para utilizar los métodos de la inferencia estadística, se requiere conocer los métodos de la estadística descriptiva.
Población y muestra Población Definición. En forma general, en estadística; se denomina población, a un conjunto de elementos (que consiste de personas, objetos…), que contienen una o más características observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos. A cada elemento de una población se denomina unidad elemental o unidad estadística. Por ejemplo, los empleados de una empresa en un día laborable, constituyen una población en la que cada empleado (unidad estadística), tiene muchas características a ser observadas, como por ejemplo: Género, estado civil, lugar de procedencia, grado de instrucción, etc. (características cualitativas), o número de hijos, ingresos mensuales, etc. (características cuantitativas). El resultado de medir una característica observable de una unidad elemental, se denomina dato estadístico o valor observado o simplemente observación. Por otra parte, la población; viene definida por la tarea o investigación estadística a realizarse. Y
como la
medición o conteo
de la característica especificada por la
investigación se hace a cada unidad elemental, se puede considerar a la población como la totalidad de valores
posibles de una característica particular especificada por la
investigación estadística. En este sentido la población consiste de un conjunto de datos 5 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
estadísticos que se reúnen de acuerdo con la formulación de una investigación estadística o con la definición de la población específica. Parámetro: Se denomina parámetro a una medida descriptiva que resuma una característica de la población, tal como la media ( ) o la varianza ( 2 ), calculada a partir de los datos observados de toda la población. Tipos de población: Por el número de elementos que la componen, la población se clasifica en finita o infinita. La población es finita si tiene un número finito de elementos. En caso contrario la población es infinita. En la práctica una población finita con un número grande de elementos se considera como una población infinita. Muestra Después de definir la investigación estadística a realizar, se debe decidir entre investigar toda la población o sólo una parte de ella. El primer procedimiento es denominado censo y el segundo es llamado muestreo. Definición. Se denomina muestra a una parte de la población seleccionada de acuerdo con un plan o regla, con el fin de obtener información acerca de la población de la cual proviene. La muestra debe ser seleccionada de manera que sea representativa de la población. Un método de selección de muestras representativas es al azar simple, esto es, cada elemento de la población tiene la misma posibilidad de ser seleccionada para la muestra. Estadística o estadígrafo. Se denomina estadística a una medida descriptiva que resuma una característica de la muestra, tal como la media ( x ) o la varianza ( s 2 ) calculada a partir de los datos observados de una muestra aleatoria. Es importante tener en cuenta, si el análisis estadístico se está haciendo con una muestra o con una población. En ambos casos las medidas descriptivas son las mismas. Para diferenciarlos, los parámetros de la población, se representan por letras griegas.
Variable Es una característica que toma distintos valores cuando se observa en diferentes individuos.
6 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Se denomina variable estadística a una característica definida en la población por la tarea o investigación estadística, que puede tomar dos o más valores (cualidades o números). Se representa por una letra del alfabeto. Por ejemplo, en la población constituida por los empleados de la universidad, algunas variables estadísticas definidas en ésta población son: X: "Género". Valores: Masculino, Femenino Y: "estado civil". Valores: Soltero, casado, viudo, divorciado Z: "número de hijos", Valores: 0,1,2, etc. W: "ingresos mensuales", Valores: Números reales positivos. Ejemplo: El peso de un embarque, la rapidez de una impresora, el número de artículos defectuosos que se elaboran en una fábrica, la calidad de café que se produce en Nicaragua, etc. Tipos de Variables Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición existen
dos tipos de variables: Variable cualitativa Son aquellas que se ordenan en categorías debido a su carácter subjetivo y absoluto. Pueden ser de dos tipos nominales y ordinales. -
Variables nominales
Los valores no pueden ser sometidos a criterios de orden o importancia. Ejemplo: “El sexo de una persona”, La nacionalidad, etc. -
Variables ordinales
Las variables pueden tomar distintos valores ordenados siguiendo una escala estadística. Clasifica a los elementos en distintas categorías. . Ejemplo: Los estratos sociales, (baja, media alta) La satisfacción al adquirir un artículo (No me gusta, es regular, bueno, muy bueno, excelente).
7 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Variable cuantitativa Son las que sus características están expresadas en valores numéricos. Se dividen en continuas y en discretas. -
Variables continuas
Pueden adquirir cualquier valor dentro de un intervalo especificado. Resultan del proceso de medición. Ejemplo; La estatura de una persona, los ingresos mensuales de los trabajadores, el consumo de energía eléctrica en un centro de trabajo, la duración de una llamada telefónica, Etc. -
Variables discretas
Los valores de las variables son enteros y resultan del proceso del conteo. Ejemplo: El número de letras de una palabra, el número de estudiantes que asistieron hoy a clases, el número de llamadas telefónicas registradas en un teléfono celular, etc.
Medición y escalas de medidas La medición puede definirse como la asignación de números a objetos y eventos de acuerdo con ciertas reglas; la manera como se asignan esos números determina el tipo de escala de medición. Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema se transforma en explicitar a) las reglas para asignar números b) las propiedades matemáticas de las escalas resultantes c) las operaciones estadísticas aplicables a las medidas hechas con cada tipo de escala. Las escalas de medición se clasifican en cuatro grupos: escala nominal, ordinal, intervalo y escala de razón. Escala nominal. El nivel nominal de medición, describe variables de naturaleza categórica que difieren en cualidad más que en cantidad. Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta 8 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
en función de los deseos o conveniencia del investigador. Este nivel de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas. Por ejemplo, los sujetos que son del curso de A de 2º de eso y los de B generan dos grupos. Cada sujeto se asigna a un grupo, y las variables son de tipo cualitativo (de cualidad) y no cuantitativo puesto que indica donde está cada sujeto y no "cuanto es de un curso y no de otro". En este ejemplo los números 2 y 3 pueden sustituir las letras A y B, de forma que 2 y 3 son simples etiquetas que no ofrecen una valoración numérica sino que actúan como nominativos. En esta escala hay que tener en cuenta dos condiciones: No es posible que un mismo valor o sujeto esté en dos grupos a la vez. No se puede ser de 2º y 3º a la vez. Por lo tanto este nivel exige que las categorías sean mutuamente excluyentes entre sí. Los números no tienen valor más que como nombres o etiquetas de los grupos. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número es para identificar. Un número no tiene mayor valor que otro. Un ejemplo son los números de las camisetas de los jugadores de un equipo de béisbol. El número mayor no significa que tiene el mayor atributo que el número menor, es aleatorio o de capricho personal a quien otorga el número. Para el procesamiento de datos, los nombres pueden ser remplazados por números, pero en ese caso el valor numérico de los números dados es irrelevante. Los números se usan como identificadores o nombres. La operación matemática permitida es el conteo. Ejemplos de medidas nominales son algunas de estas variables: estado marital, género, raza, credo religioso, afiliación política, lugar de nacimiento, el número de seguro social, el sexo, los números de teléfono, entre otros. Escala ordinal: Surge a partir de la operación de ordenamiento; en esta escala se habla de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto está cerca o lejos del segundo puesto. Los valores de la escala representan categorías o grupos de pertenencia, concierto orden asociado, pero no una cantidad mensurable. La escala ordinal tiene las propiedades de identidad y magnitud. Los números representan una cualidad que se está midiendo, y expresan si una observación tiene más de la cualidad medida que otra. La 9 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
distancia entre puntos de la escala no es constante: no se puede determinar la distancia entre las categorías, sólo es interpretable el orden entre sus valores. Ejemplos: situación socioeconómica, nivel educativo. Escala de intervalos. Esta escala representa magnitudes, con la propiedad de igualdad de la distancia entre puntos de escala de la misma amplitud. Aquí puede establecerse orden entre sus valores, hacerse comparaciones de igualdad, y medir la distancia existente entre cada valor de la escala. El valor cero de la escala no es absoluto, sino un cero arbitrario: no refleja ausencia de la magnitud medida, por lo que las operaciones aritméticas de multiplicación y división no son apropiadas. Cumple con las propiedades de identidad, magnitud e igual distancia. La igual distancia entre puntos de la escala significa que puede saberse cuántas unidades de más tiene una UO comparada con otra, con relación a cierta característica analizada. Por ejemplo, en la escala de temperatura centígrada puede decirse que la distancia entre 25° y 30°C es la misma que la existente entre 20° y 25° C, pero no puede afirmarse que una temperatura de 40° C equivale al doble de 20° C en cuanto a intensidad de calor se refiere, debido a la ausencia de cero absoluto. Escala de razón. Corresponde al nivel de medición más completo. Tiene las mismas propiedades que la escala intervalos, y además posee el cero ab- soluto. Aquí el valor cero no es arbitrario, pues representa la ausencia total de la magnitud que se está midiendo. Con esta escala se puede realizar cualquier operación lógica (ordenamiento, comparación) y aritmética. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Ejemplos: longitud, peso, distancia, ingresos, precios. Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo, la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala de razón comienza desde el cero y aumenta en números sucesivos iguales a cantidades del atributo que está siendo medido.
10 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Resumen Tipos de variables
Cualitativas
Cuantitativas
Nominales
Ordinales
Continuas
Discretas
No orden
Existe orden
No entero
Entero
Ejercicios Ejercicios 1.1: Determine en cada una de las siguientes situaciones: la población y la muestra. Un fabricante de medicamentos desea conocer la proporción de personas cuya hipertensión (presión alta) puede ser controlada por un nuevo producto fabricado por la compañía. Al realizar un estudio a 5000 individuos hipertensos se obtuvo que el 80 % de ellos pudo controlar su hipertensión utilizando el nuevo medicamento. Suponiendo que estas 5000 personas son representativas del grupo de pacientes hipertensos. Ejercicios 1.2: Construya variables relacionadas con su carrera, 4 nominales, 4 ordinales, 4 continuas y 4 discretas. Ejercicio 1.3: Indica qué variables son cualitativas (ordinal o nominal) y cuales cuantitativas (continuas o discretas): a) Censo anual de los nicaragüenses: b) Temperaturas en grados Celsius registradas cada hora en un observatorio: c) Tu comida favorita: d) Cuántos goles ha marcados tu equipo favorito en la última temporada: e) El color de los ojos de tus compañeros de clase: 11 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
f) Coeficiente intelectual de los alumnos de esta clase: g) Asignatura favorita: h) Cuántas acciones se han vendido hoy en la Bolsa: i) Profesiones militares (tropa, suboficiales, oficiales, jefes, generales): j) Duración del viaje en coche a ciudades de Nicaragua: k) El diámetro de las ruedas de varios coches: l) La nacionalidad de una persona: m) Número de litros de agua contenidos en un depósito: n) La calificación de un examen (suspenso, aprobado, notable, sobresaliente): o) Número de libros en un estante de librería: p) Suma de puntos tenidos en el lanzamiento de un par de dados: q) La profesión de una persona: r) Cuántos estudiantes se han matriculado en este curso: s) La superficie de un edificio: t) Puesto conseguido en una prueba deportiva (1º, 2º, 3º,…): u) Número de hijos de 50 familias: v) Medallas de una prueba deportiva (oro, plata, bronce): Ejercicio. 1.4: Indique el nivel de medición de las siguientes variables. Teniendo en cuenta que las variables se pueden clasificar en nominales, ordinales, de intervalo y razón: a) Altura física en centímetros: b) Estatus laboral (inexperto/semiexperto/experto): c) Peso físico en Kilogramos: d) Sexo: e) Calidad percibida del cuidado proporcionado (excelente/bueno/suficiente/pobre): f) Diagnóstico “sobrecarga del rol del cuidador”: g) ¿Se puede bañar sólo? h) Temperatura corporal: i) Estado civil: j) ¿Tiene alguna preferencia religiosa? (católica/protestante/judía/islámica/protestante/otra): 12 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Distribución de frecuencias Después de la recopilación de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten su comprensión y su posterior análisis y utilización. Para ello, se ordenan en cuadros numéricos y luego se representan en gráficos. Todo cuadro numérico debe tener: -
Un título adecuado para evitar confusiones y para expresar brevemente su contenido.
-
La fuente de los datos, si no son datos propios.
-
Las unidades en que se expresan los datos.
Los cuadros numéricos de una sola variable estadística se denominan distribución de frecuencias. En el procedimiento para construir distribuciones de frecuencias
nos referiremos a
muestras, mientras no se diga lo contrario. Procedimiento a seguir en un estudio estadístico Recogida de datos: Planteado el test o encuesta oportuno y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionará en gran medida su posterior tratamiento. Organización de los datos: determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico apropiado. Análisis final: La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los diferentes parámetros estadísticos (de centralización, posición, dispersión, etc.) Tabla para datos no agrupados Frecuencias Frecuencia absoluta (f): Para datos no agrupados en intervalos, es el número de veces que se presenta cada valor de la variable. Si los datos se agrupan en intervalos, es el número de observaciones que pertenecen a dicho intervalo. 13 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática Frecuencia absoluta acumulada (fa): Para un cierto valor de la variable, la frecuencia absoluta acumulada nos da el número de observaciones menores o iguales que dicho valor. Frecuencia relativa (fr): Cociente entre la frecuencia absoluta y el número total de observaciones (N). Frecuencia relativa porcentual (fr%): Frecuencia relativa multiplicada por 100 (es la expresión de las frecuencias en %). Frecuencias relativas acumuladas (fra): Es la relación de la frecuencia acumulada de una clase expresada respecto al total de observaciones
Ejemplo Las puntuaciones obtenidas por un grupo en una prueba de matemáticas han sido: 15; 20; 15; 18; 22; 13; 13; 16; 15; 19; 18; 15; 16; 20; 16; 15; 18; 16; 14; 13. Construir la tabla de distribución de frecuencias
xi
Recuento
13 14 15 16 18 19 20 22 Σ
III I IIIII IIII III I II I
Frecuencia Absoluta (f) 3 1 5 4 3 1 2 1 20
Frecuencia absoluta acumulada 3 3+1=4 4+5=9 9+4=13 13+3=16 16+1=17 17+2=19 19+1=20
Frecuencia relativa 320=0,15 120=0,05 520=0,25 420=0,2 320=0,15 120=0,05 220=0,1 120=0,05 1
Frecuencia relativa porcentual 0,15x100=15 0,05x100=5 0,25x100=25 0,2x100=20 0,15x100=15 0,05x100=5 0,1x100=10 0,05x100=5 100
Frecuencia relativa acumulada
(fra%)
0,15 0,15+0,05=0,2 0,2+0,25=0,45 0,45+0,2=0,65 0,65+0,15=0,8 0,8+0,05=0,85 0,85+0,1=0,95 0,95+0,05=1
15 20 45 65 80 85 95 100
Tabla para datos agrupados Pasos para la construcción de una tabla de distribución de frecuencias 1) Ordenar los datos de menor a mayor. Se puede usar el diagrama de tallo y hojas. 2) Calcular el rango. Para esto se resta al valor mayor menos el valor menor. Es decir R = VM – Vm 3) Se determina el valor de K (número de clases o grupos que se desean) en caso de que no dispongamos de este dato se puede usar la fórmula K = 1 + 3.32 log(n). 14 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
4) Hallar el cociente
R k
5) Determinar la amplitud del intervalo de clases C.
C=
R ( TRUNCADO ) + U k
U significa las unidades decimales. Si los datos tienen cero cifras decimales, se usa u =1 Si los datos tienen una cifra decimal, se usa u = 0,1 Si los datos tienen dos cifras decimales, se usa u = 0,01
Otra manera de encontrar el valor de C es dividiendo R entre 5 y R entre 20. Después se escoge un valor entre esos dos cocientes, preferiblemente entero impar siempre y cuando sea posible. Esto es,
R R (Lo anterior se debe a que no es aconsejable hacer tablas C 5 20
con menos de 5 grupos ni mayor de 20. Cualquier cantidad de clases entre 5 y 20 es aceptable.
6) Construir la tabla de distribución de frecuencias Se toma el valor menor de los datos como el límite inferior de la primera clase. Para calcular el límite superior se aplica la fórmula
LS = Li + C -- U Nota 1: Para determinar los límites inferiores de las clases siguientes, sólo se le suma el valor de C al límite inferior anterior. De igual manera se trabaja con los límites superiores. La última clase debe contener al valor mayor de los datos. Ejemplo1. En una cooperativa de taxis de Managua se midió el rendimiento en el consumo de la gasolina en km / gal, a 40 unidades. Los resultados fueron. 45
38,4
44,3
44,2
43,6
45,3
44,5
39,8
44,2
44,4
43,2
44,0
43,8
43,8
45,5
44,5
44,6
44
45,2
38,7
44,4
44.7
44,1
44,3
43,9
44,1
45,8
42,2
41,2
40,6
42,1
45,6
44,5
39,7
40,7
42,3
45,2
43,3
44,7
38,6 15
MS.c Cliffor Jerry Herrera castrillo
EstadĂstica y Probabilidades – II AĂąo de FĂsica MatemĂĄtica
Agrupe estos datos en una tabla de distribuciĂłn de frecuencias TDF que tenga 7 clases.
Paso 1. Diagrama de tallo y hojas.
Tallo
hojas
38
4; 6; 7
39
7; 8
40
6; 7
41
2
42
1; 2; 3
43
2; 3; 6; 8; 8; 9
44
0; 0; 1; 1; 2; 2; 3; 3; 4; 4; 5; 5; 5; 6; 7; 7
45
0; 2; 2; 3; 5; 6; 8
38,4
39,8
42,1
43,3
43,9
44,1
44,3
44,5
44,7
45,3
38,6
40,6
42,2
43,6
44,0
44,2
44,4
44,5
45,0
45,5
38,7
40,7
42,3
43,8
44,0
44,2
44,4
44,6
45,2
45,6
39,7
41,2
43,2
43,8
44,1
44,3
44,5
44,7
45,2
45,8
Paso 2.
R = 45,8 – 38,4 R = 7,4
Paso 3. El valor de K= 7 clases (dato proporcionado en el ejercicio) đ?‘…
=
7,4
Paso 4.
Cociente
Paso 5.
C = 1.0 + 0.1 (ya que los datos tienen una cifra decimal u = 0.1) Resulta
đ?‘˜
7
= 1,05714286 Se trunca a una cifra decimal, queda en 1.0
C = 1.1
16 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Paso 6.
Kilómetros
por Cantidad
galón de gasolina Li
n =
f
de
vehículos
LS
f
38,4
-
39,4
3
39,5
-
40,5
2
40,6
-
41,6
3
41,7
-
42,7
3
42,8
-
43,8
5
43,9
-
44,9
17
45,0
-
46,0
7
= 40
Para la primera clase, LS = 38,4+ 1,1 - 0,1 LS = 39.4 Se completa la tabla con la información de la nota 1. (Ver página anterior)
Se procede ahora a calcular la frecuencia acumulada, frecuencia relativa, porcentaje de frecuencia relativa, porcentaje de frecuencia acumulada, marca de clases y límites reales. Frecuencia acumulada: Se encuentra sumando a la frecuencia de la clase, la frecuencia de las clases anteriores.
Frecuencia relativa: Es la proporción de casos que hay en cada clase. Se encuentra dividiendo la frecuencia de la clase entre el total de datos n. fr =
f n
Porcentaje de frecuencia relativa: Para hallar el porcentaje de frecuencia relativa, se multiplica la frecuencia relativa por 100. . O sea: %fr = fr x 100 17 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Porcentaje de frecuencia acumulada: Se puede calcular acumulando el porcentaje de la frecuencia relativa, o aplicando la expresión: fa x 100 n
%fa =,
Marca de clases: Es el punto medio de la clase. Se representa por Xc Se encuentra aplicando la fórmula
xC = Li + LS 2
Límites reales: Para encontrar los límites reales se aplican las fórmulas: Lir = Li -
U 2
Lsr = Ls +
y
U 2
Kilómetros
Cantidad
Kilómetros
por galón de
de
por galón de
gasolina
vehículos
Li
LS
fi
fa
fr
%fr
%fa
Xc
gasolina Lir
Lsr
38.4
-
39.4
3
3
0.075
7.5
7.5
38.9
38.35 - 39.45
39.5
-
40.5
2
5
0.05
5
12.5
40
39.45 - 40.55
40.6
-
41.6
3
8
0.075
7.5
20
41.1
40.55 - 41.65
41.7
-
42.7
3
11
0.075
7.5
27.5
42.2
41.65 - 42.75
42.8
-
43.8
5
16
0.125
12.5
40
43.3
42.75 - 43.85
43.9
-
44.9
17
33
0.425
42.5
82.5
44.4
43.85 - 44.95
45.0
-
46.0
7
40
0.175
17.5
100
45.5
44.95 - 46.05
1
100
n =
f
= 40
En este ejemplo, los datos tienen una cifra decimal, por eso se toma u = 0.1 Interpretación de la quinta clase: Puede observarse que hay una frecuencia de 5 vehículos que tienen un rendimiento de 42.8 a 43,8 kilómetros por galón de gasolina, esto equivale al 12,5% de las unidades en estudio. 18 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
En relación a la frecuencia acumulada, hay 16 unidades cuyo rendimiento es menor o igual a 43,8 kilómetros por galón. Dicho de otra manera, el 40%de las unidades estudiadas reflejan un rendimiento menor o igual a 43,8 kilómetros por galón.
Ejercicio 1.5 Construya una tabla de frecuencias para la edad en años cumplidos de 40 estudiantes de nuevo ingreso de la FAREM-Estelí. 21
20
19
23
22
19
16
22
24
17
19
18
20
27
20
23
18
19
17
24
18
19
21
25
23
21
22
20
17
23
22
20
19
26
18
20
18
17
22
21
Tipos de Gráficos Un gráfico (o gráfica) es el recurso de representar los datos numéricos por medio de líneas, diagramas, dibujos, etc. La representación gráfica es un importante suplemento al análisis y estudio estadístico. Los gráficos llaman la atención del lector y hacen que de un vistazo éste tenga una mayor comprensión de los datos. Un buen gráfico puede captar al lector para que a continuación lea todo el estudio. Si un estudio se compone únicamente de texto y tablas, posiblemente no todos los lectores lean el estudio.
Técnicas de representación gráfica El uso de gráficas permite al observador, tener una apreciación de manera rápida sobre los altibajos de la gráfica, para analizar luego, las causas posibles del comportamiento de la misma.
Regla de los ¾ de altura. Se aplica la ecuación Y = ¾ x 19 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Por ejemplo si el eje X mide 12 cm, entonces el eje Y mide ¾ de (12) = 9 cm.
Con los datos de la tabla de distribución de frecuencias se pueden construir:
1) Histograma de frecuencias Consiste en una serie de rectángulos continuos cuya base en el eje x está determinada por los límites reales y la altura de cada barra, es la frecuencia absoluta de la clase.
Rendimiento de la gasolina
Coop. de Taxis de Managua I semestre 2016 17
18 16
Unidades de taxi
14 12
10 7
8
5
6 4
3
2
3
3
2 0 38.35
39.45
40.55
41.65
42.75
43.85
44.95
Km / Galón
2) Polígono de frecuencias Es un diagrama formado por segmentos de recta que une los puntos de las alturas (frecuencia de cada clase) Para graficar se escriben en el eje X, las marcas de clase y en el eje Y las frecuencias.
20 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Rendimiento de la gasolina Coop. de Taxis de Managua I semestre 2016
18
17
Unidades de taxi
16 14 12
10 8
7
6 4 2
5 3
3
2
3
0
38.9
40
41.1
42.2 43.3 Km. / galón
44.4
45.5
3) Polígono de frecuencia acumulada Es un diagrama donde se ubican los límites reales superiores en el eje X y la frecuencia acumulada en el eje Y .La línea que se forma solamente crece.
Rendimiento de la gasolina Coop. de Taxis de Managua I Semestre 2016
45
Unidades de taxi
40
40
35
33
30 25 20
16
15
11
10 5 0
8 3
5
39.45 40.55 41.65 42.75 43.85 44.95 46.05 Km / galón
Los gráficos fueron construidos con el programa EXCEL
21 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Otros Gráficos En una gráfica de barras los datos de cada una de las modalidades C i se representan por una barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su frecuencia. Las barras se dibujan dejando un espacio entre ellas. Si la escala es nominal las categorías pueden ser colocadas en cualquier orden. Pero, si el nivel es ordinal las categorías deben ir ordenadas. En una gráfica circular, los datos de cada categoría C i se representan por un sector circular cuyo ángulo en el centro es igual a hi360. Si la gráfica por sectores circulares es tridimensional es denominada de pastel. Ejemplo: En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas: B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N. Construir la distribución de frecuencias. Graficar la distribución SOLUCION. La tabulación de estos datos, donde la variable cualitativa es X: Color de bebida gaseosa, es la distribución de frecuencias del cuadro 1.2. La figura 1.1 es la representación gráfica por medio de barras de la distribución de personas por el color de su bebida gaseosa preferida. .
22 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Cuadro 1.2. Distribución de personas por su color preferido de una marca de bebida gaseosa. Valores de
Frecuencias
Frecuencias
Frecuencias
X
Absolutas: f i Relativas: hi Porcentajes: pi
Negro (N)
9
0,45
45
Blanco (B)
8
0,40
40
Rojo (R)
3
0,15
15
Total
20
1,00
100
Personas 9 8 7 6 5 4 3 2 1 0
0.45 0.40
0.15
Negro
Blanco
Rojo
Fig. 1.1 Gráfica de barras
La figura 1.2 es la representación mediante gráfica de sectores circulares del cuadro 1.2. La frecuencia 45% es equivalente a 0.45 360 = 162 , la frecuencia 40% es equivalente a 0.40 360 = 144 , y la frecuencia 15% es equivalente a 0.15 360 = 54
23 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática 15% 40%
R B N 45%
Fig. 1.2 Gráfica circular Gráfica de barras agrupadas Si se trata de comparar solamente las componentes o las frecuencias en cada modalidad, se puede utilizar un gráfico de barras agrupadas. En cada modalidad se trazan tantas barras adjuntas como componentes hay. Por ejemplo, la figura 1.3 representa las frecuencias de cada componente en cada modalidad del cuadro 1.9. 30 25 20 Hombres Mujeres
15 10 5 0 1975
1980
1985
1990
Fig. 1.3. Población de una ciudad de 1975 a 1990
Gráfica de barras componentes a) Si se quiere resaltar a la vez el total y las frecuencias de cada componente en cada modalidad, entonces, conviene utilizar un gráfico de barras componentes como el de la figura 1.4. En cada modalidad se traza una barra cuyo largo es proporcional al total de sus datos. La gráfica 1.14 de barras componentes, del cuadro resume la variación de la población de una ciudad desde 1975 hasta 1990, resaltando el total y los parciales en cada modalidad.
24 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática 50 40 30
Mujeres Hombres
20 10 0 1975
1980
1985
1990
Fig. 1.4. Población de una ciudad de 1975 a 1990 b) Si se trata de destacar la importancia relativa de sus componentes, se puede utilizar un gráfico, como la figura 1.15, donde todas las barras son de igual longitud y equivalentes al 100% en cada categoría. El cuadro, tiene los mismos datos del cuadro, sólo que ahora se consideran los porcentajes o valores relativos, en vez de los valores absolutos. Cuadro. Población (en %) de una ciudad de 1975 a 1990 Año
Hombres Mujeres Total
1975
32,0
68,0
100
1980
37,5
62,5
100
1985
25,0
75,0
100
1990
40,0
60,0
100
La proporción de cada componente respecto al total en cada categoría, se representa en la figura 1.5.
25 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
Mujeres Hombres
1975
1980
1985
1990
Fig. 1.5. Población de una ciudad de 1975 a 1990 en porcentajes Cuando se utilizan figuras de igual tamaño para reflejar la característica que se quiere representar, al gráfico estadístico, se denomina pictografía. En una pictografía el número de figuras en cada categoría o modalidad es proporcional a la frecuencia absoluta respectiva. Existe otra gran variedad de gráficas o diagramas para mostrar datos ó para mostrar relaciones entre varios grupos de datos. Aquí la imaginación del dibujante juega un papel muy importante. Ejercicio 1.6 Se realiza un estudio para conocer el número de computadoras que hay en cada vivienda del municipio de Ocotal, Nueva Segovia y se obtienen los siguientes datos: 0, 1, 2, 4, 2, 2, 0, 0, 4, 3, 1, 3, 4, 3, 4, 1, 1, 1, 2, 1, 3, 4, 2, 2, 4, 2, 2, 1, 4, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 1, 1, 3, 3, 1, 1, 2, 2, 1 Construye un diagrama de barras, con la información dada. Ejercicio 1.7 Los puntos obtenidos por los jugadores de dos equipos de baloncesto han sido los siguientes: 9 12 6 11 19 5 8 13 2 8 5 12 0 9 4 15 18 10 6 16 Construye el histograma asociado a dichos datos tomando las puntuaciones en intervalos de 5 puntos. Ejercicio 1.8 26 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
La superficie arbolada afectada por incendios forestales en España, para el período 20052014, se da en la siguiente tabla:
Representa mediante un polígono de frecuencias la superficie arbolada afectada por los incendios.
27 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Medidas de tendencia central Las medidas de tendencia central tienden a ocupar la parte central de la distribución de datos. Entre ellas tenemos la media aritmética, mediana y moda, y pueden ser calculadas tanto para datos no agrupados como para datos agrupados. Datos no agrupados •
Media aritmética:
Es el promedio de los valores de las observaciones, es decir, se suman los datos y se divide entre el número de datos. En símbolo, se escribe así: X =
x n
Ejemplo 2. Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9 X =
•
x n
X =
3+5+7 + 4+8+ 4+9+6+7+ 4+9 66 X = 11 11
X
=6
Mediana:
Es el puntaje central de la distribución de datos. Esto es que el 50% de los valores de la muestra se encuentra por encima del valor de la mediana y el otro 50%, se encuentra por debajo de ella.
Para calcular la mediana se busca el valor que se encuentra en el centro de los datos ordenados de menor a mayor. Si el número de datos (n) es impar, quedará un número solo en el centro. Ese valor es la mediana. Pero si (n) es par, quedarán dos valores centrales., entonces se promedian los dos valores y el resultado es el valor de la mediana.
Ejemplo 3. Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9 Primero se ordena de menor a mayor. 3, 4, 4, 4, 5, 6, 7, 7, 8, 9, 9
La mediana es
Me = 6
Ejemplo 4. 28 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
La mediana para el conjunto de datos 1, 2, 4, 6, 7, 8, 9, 10 es
6+7 Me = 6.5ya que n es 2
par. •
Moda
De una serie de datos es el valor que ocurre con mayor frecuencia. Es decir, es el dato más repetido. La moda de una serie de datos es el valor Mo , que se define como el dato que más veces se repite. La moda no siempre existe y si existe, no siempre es única. En matemática, la moda es el valor de la variable en el que existe un máximo absoluto (o dos o más máximos relativos iguales). La moda es una medida promedio que se usa cuando se quiere señalar el valor más común de una serie de datos. Por ejemplo, los comerciantes se estoquean con productos que están de moda. La moda es el promedio menos importante debido a su ambigüedad. Ejemplo5. Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9 Se repiten tres valores el 4, el 7 y el 9. Pero el 4 se repite más veces por tanto la moda es Mo = 4.
Ejercicios Propuestos Ejercicio 1.9 Calcular la mediana para las siguientes series de datos. a) 120, 3, 14, 1, 99, 7, 30, 2,000, 16 b) 30, 77, 3, 300, 36, 11, 10,000, 29 Ejercicio 1.10 29 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Determine la moda en la siguiente serie de datos: a) 7, 9, 7, 8, 7, 4, 7, 13, 7 b) 5, 3, 4, 5, 7, 3, 5, 6, 3 c) 31, 11, 12, 19 Ejercicio 1.11 Calcular la media aritmética de la distribución del número de hijos por familia, según la tabla presentada Valores de X
frecuencias
Productos
xi
fi
fi xi
0
1
0
1
4
4
2
7
14
3
6
18
4
2
8
Total
20
44
Calcular la moda de los 45 ingresos quincenales
30 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Datos agrupados
Donde:
Lir: Es el límite inferior real •
Media
X =
fX
n: Es el tamaño de la muestra
c
fc: Frecuencia de la clase
n
faA: Frecuencia acumulada
n 2 − fa A .C • Mediana Me = Lir + f c •
Moda
anterior C: Amplitud del intervalo de clase
1 : Se resta la mayor frecuencia
1 Mo = Lir + .C + 2 1
menos la frecuencia de la clase anterior.
2 : Se resta la mayor frecuencia menos la frecuencia de la clase siguiente.
Ejemplo 6. Calcular la media aritmética, mediana y moda con los datos del ejemplo (1) sobre el combustible de la cooperativa de taxis de Managua.
Lir
Lsr
fa
f
Xc
fXc
38,35
39,45
3
3
38,9
116,7
39,45
40,55
2
5
40,0
80
40,55
41,65
3
8
41,1
123,3
41,65
42,75
3
11
42,2
126,6
42,75
43,85
5
16
43,3
216,5
43,85
44,95
17
33
44,4
754,8
44,95
46,05
7
40
45,5
318,5
Total
1 736,40
31 MS.c Cliffor Jerry Herrera castrillo
EstadĂstica y Probabilidades – II AĂąo de FĂsica MatemĂĄtica
a) Media
X =
ďƒĽ fX
c
n
1 736,40 đ?‘‹Ě… = 40
X
= 43.41 kilĂłmetros por galĂłn
b) Mediana: Se encuentra en la primera clase de arriba hacia abajo cuya frecuencia acumulada es mayor o igual que la mitad de los datos de la muestra
n n 40 o sea = 2 2 2
= 20 Se encuentra en la sexta clase.
ďƒŠ 20 − 16 ďƒš .(1.1) Me = 44,10kilĂłmetros por galĂłn ďƒŤ 17 ďƒşďƒť
Me = 43,85 + ďƒŞ
c) Moda: Se encuentra en la clase que tiene la mayor frecuencia.
ď „1 : = 17 – 5 = 12
y
ď „ 2 : = 17 – 7 = 10
ďƒŠ
ď „1 ďƒš ďƒş.C ď „ + ď „ 2ďƒť ďƒŤ 1
Mo = Lir + ďƒŞ
ďƒŠ 12 ďƒš
.(1.1) = 44,45 Mo = 44,45 kilĂłmetros por galĂłn Mo = 43,85 + ďƒŞ ďƒŤ12 + 10 ďƒşďƒť Se puede concluir que el rendimiento promedio en el combustible es de 43.41 kilĂłmetros por galĂłn, que el 50% de las unidades muestreadas refleja un rendimiento menor o igual a 44.10 y el otro 50%mantiene un rendimiento superior a 44.10, kilĂłmetros por galĂłn y que el rendimiento mĂĄs repetido es de 44.45 kilĂłmetros por galĂłn.
Ejercicio 1.12 Calcular la mediana, moda y media aritmetica para la muestra de los 45 ingresos quincenales tabulados en la siguiente tabla:
32 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ingresos
Número de personas
Frec. acumuladas
Ii
fi
Fi
[26,34[
1
1
[34,42[
2
3
[42,50[
4
7
[50,58[
10
17
[58,66[
16
33
[66,74[
8
41
[74,82[
3
44
[82,90]
1
45
Total
45
Ejercicio 1.13 Calcular la media aritmética de la distribución del número de hijos por familia Valores de X
frecuencias
Productos
xi
fi
fi xi
0
1
0
1
4
4
2
7
14
3
6
18
4
2
8
Total
20
44
33 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Formas de la distribución Muchas distribuciones de variables continuas se pueden representar de manera gráfica mediante una curva en forma de campana.
Simétrica: Se dice que una distribución es simétrica, si se puede doblar a lo largo de un eje vertical de modo que los lados coincidan. En este caso la media, mediana y la moda coinciden con el eje de simetría. El sesgo es igual a cero.
X
= Me = Mo
Asimétrica Si la curva no es simétrica se dice que es sesgada, ya sea positiva o negativamente. •
Una distribución es “sesgada a la derecha” o tiene asimetría positiva, si
Mo
< Me < X
Mo < Me < X •
Una distribución es “sesgada a la izquierda” o tiene asimetría negativa, si
X < Me<
X < Me<
Mo
Mo
Respecto al problema (el caso de la gasolina) la media es menor que la mediana y menor que la moda, por tanto tiene una asimetría negativa.
34 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Medidas de variabilidad o dispersión Datos agrupados.
f (X
2
n
a) La varianza: La varianza se calcula mediante la fórmula S2 =
u =1
c
− X)
n −1
b) Desviación estándar:
S2
Es la raíz cuadrada de la Varianza. S = c) Coeficiente de variación: Se calcula mediante la fórmula CV =
S x100 X
Es útil siempre que no será mayor del 20%.
d) Coeficiente de asimetría. Sesgo =
3( X − M e ) S
Ejemplo 7. Con los datos del problema (6), calcular: a) La varianza b) La desviación estándar c) El coeficiente de variación d) El coeficiente de asimetría.
Lir
Lsr
f
fa
Xc
fXc
( Xc- X)
( Xc- X)2
f ( Xc- X) 2
38,35
39,45
3
3
38,9
116,7
-4,51
20,3401
61,0203
39,45
40,55
2
5
40,0
80,0
-3,41
11,6281
23,2562
40,55
41,65
3
8
41,1
123,3
-2,31
5,3361
16,0083
41,65
42,75
3
11
42,2
126,6
-1,21
1,4641
4,3923
42,75
43,85
5
16
43,3
216,5
-0,11
0,0121
0,0605
43,85
44,95
17
33
44,4
754,8
0,99
0,9801
16,6617
44,95
46,05
7
40
45,5
318,5
2,09
4,3681
30,5767
Total
40
1 736,40
151,9760
35 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
f (X
2
n
2
a) S = b) S = c) CV =
u =1
c
− X)
S2 =
n −1
S2
151.9760 39
3.8968
S=
S2 = 3.8968 S = 1.97 km. por galón.
S 1.97 x100 CV = x100 Cv = 4.54 % X 43.41
3( X − M e )
d) Sesgo =
S
Sesgo =
3(43.41 − 44.10) 1.97
Sesgo = - 1.05
Interpretación: La desviación estándar: La dispersión que presentan los datos es de 1,97 kilómetros por galón, con respecto al rendimiento promedio.
El coeficiente de variación: Representa en términos porcentuales la relación de la desviación estándar con respecto a la media, es decir, que los datos se desvían respecto a la media aritmética en un 4,54 %
Coeficiente de asimetría o Sesgo: Nos da un valor negativo lo que comprueba el análisis anterior, puesto que los datos tienen una mayor frecuencia al final de la distribución. Tiene asimetría negativa.
EJERCICIO (1)
1)
En la zona baja de Managua hay 27 pozos para suministrar agua a la ciudad Capital. Los caudales de dichos pozos se miden en galones por minuto. (GPM) y sus mediciones son las siguientes.
800
2200
1212
1200
2230
1115
1100
511
1100
1000
800
800
1000
1200
800
750
710
700
1200
600
550
450
400
380
350
1200
1000
36 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 6 clases. b) Calcular la media, mediana y moda c) Calcular la varianza y la desviación estándar d) Trazar el histograma de frecuencias.
2)
Los datos son mediciones de la intensidad solar directas (en Watts / m 2) realizados en diferentes días en una localidad.
562
869
708
775
704
775
809
856
655
806
878
909
918
558
768
870
918
940
946
661
820
898
935
952
957
693
835
905
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 5 clases. b) Calcular la media, mediana y moda c) Calcular la varianza y la desviación estándar d) Trazar el polígono de frecuencias.
3)
Los contenidos de nicotina, en miligramos de 40 cigarrillos de cierta marca son:
1.09
1.79
2.03
1.63
1.69
0.85
1.64
1.51
1.74
1.37
1.86
2.31
1.88
2.17
1.75
1.82
1.58
1.75
0.72
1.97
1.40
1.68
2.28
1.67
2.11
1.92
2.46
1.70
2.37
1.85
1.24
2.09
1.64
1.47
1.93
1.90
1.79
2.08
2.55
1.69
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 6 clases. b) Calcular la media, mediana y moda 37 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
c) Calcular la varianza y la desviación estándar d) Trazar el polígono de frecuencia acumulada.
4)
En la redacción de un diario, el tiempo requerido para formar la página completa fue registrada durante 50 días. El dato redondeado a la décima de un minuto más cercana se da a continuación.
20.8
22.8
21.9
22
20.7
20.9
25
22.2
22.8
20.1
25.3
20.7
22.5
21.2
23.8
20.9
22.9
23.3
23.5
19.5
23.7
20.3
23.6
19
25.1
19.5
24.1
24.2
25
21.8
21.3
21.5
23.1
19.9
24.2
24.1
19.8
23.9
22.8
22.7
19.7
24.5
23.8
20.7
23.8
24.3
21.1
20.9
21.6
22.7
a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 7 clases. b) Interprete la quinta clase.
5)
Los precios en dólares de un repuesto para computadora en una ciudad son: 32
38
42
39
41
35.4
47.8
40
36.7
38.3
36.7
41.5
39.6
41.52
15.7
43.6
39.4
45.6
49.4
48
43.7
42.6
45.6
44
48.6
34.2
31.2
47.6
43.5
30.4
a) Construya una tabla de distribución de frecuencias. b) Interprete la frecuencia absoluta y acumulada de la cuarta clase. c) Interprete el porcentaje de frecuencia relativa y el porcentaje acumulado de la clase de mayor frecuencia.
38 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Medidas de posición •
Deciles: Son valores posicionales que dividen a la información en diez partes iguales. El primer decil deja 10% de la información por debajo de él y el 90% por encima de él. Los deciles se representan por Di donde i = 1, 2, 3, . . . 10
•
Cuartiles: Son valores posicionales que dividen a la información en cuatro partes iguales, el primer cuartil deja el 25% de la información por debajo y el 75% por encima. El segundo cuartil al igual que la mediana divide a la información en dos partes iguales. Por último, el tercer cuartil deja 75% por debajo y el 25% por encima. Los cuartiles se representan por Qi donde i= 1, 2, 3, 4.
•
Percentiles: Son valores posicionales que dividen a la información en cien partes iguales. Los percentiles se representan por Pi donde 1 < i < 100.
Representación gráfica
P
D1
D2
D3
D4
10%
20%
30%
40%
D5
D6
D7
D8
D9
60%
70%
80%
90%
D10
100% Q1
Q2
Q3
25%
50%
75%
in 10 − f a A .C Deciles Di = Lir + f c
in 4 − fa A .C Cuartiles Qi = Lir + f c
39 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
in − f A a 100 .C Percentiles Pi = Lir + f c Ejemplo 8. Con los datos de la tabla del ejemplo (7);
Lir
Lsr
f
fa
38,35
39,45
3
3
39,45
40,55
2
5
40,55
41,65
3
8
41,65
42,75
3
11
42,75
43,85
5
16
43,85
44,95
17
33
44,95
46,05
7
40
Total
40
Calcular: a) El decil 2
d) Percemtil 10
b) Cuartil 1
e) Percentil 90
c) Cuartil 3
in 10 − f a A .C D2 = 40.55 + a) Di = Lir + f c
2(40) 10 − 5 .(1.1) 3
D2 = 41.65
40 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
3(40) in − 16 − f A a 4 4 . C .(1.1) b) Qi = Lir + Q3= 43.85 + f 17 c
in − f A a 4 .C Q1= 41.65 + c) Qi= Lir + f c
1(40) 4 − 8 .(1.1) 3
10(40) in − f A a 100 − 3 100 .(1.1) .C P10 = 39.45 + d) Pi = Lir + f 2 c
Q3 = 44.76
Q1 = 42.38
P10 = 40.00
90(40) in 100 − 33 100 − f a A .(1.1) P90 = 45.42 .C P90 = 44.95 + e) Pi = Lir + f 7 c Interpretación: El D2 significa que el 20% de los datos de la muestra, tienen un rendimiento de 41.65 km por galón o menos. El Q1indica que el 25% de los datos de la muestra tienen un rendimiento menor o igual a 42.38 km por galón. De manera similar se interpretan las otras medidas.
Coeficiente de curtosis (K) Otra manera de medir la forma de la distribución es con la curtosis, la cual nos dice qué tan puntiaguda es la gráfica de una distribución y se presenta en tres tipos: Platicúrtica: La forma geométrica es aplanada Mesocúrtica: Tiene una forma que no es ni aplanada ni puntiaguda. Leptocúrtica: La forma geométrica es puntiaguda o esbelta.
41 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Platicúrtica
Mesocúrtica
Q3 − Q1 2
Leptocúrtica
44.76 − 42.38 Q = 1.19 2
K=
Q P90 − P10
K=
1.19 K = 0,2195A Q se le conoce como rango semi intercuartil. 45.42 − 40
Q=
Q=
Ejemplo 9.La siguiente distribución de frecuencia representa el tiempo promedio en minutos que 20 clientes de un banco, llevan a cabo una transacción bancaria.
Tiempo en minutos Li
Lir
Ls
Lsr
Cantidad de
Tiempo
clientes (f) promedio 3 4
2,1
6 3 2
6,0
2 Total
20
a) Completar la tabla de distribución de frecuencias. b) Calcular la desviación estándar S e interpretarla. c) ¿Qué porcentaje de clientes realizó su transacción bancaria entre 1.95 y 5.50 minutos.
2,1 + C + C + C = 6,0 Lir = Xc -
C 2
3C = 6,0 – 2,1 = 3,9
C = 1,3
Se usa para calcular el límite inferior real. 42
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Lsr = Xc +
C 2
Se usa para calcular el límite superior real.
a) Li
Ls
Lir
Lsr
f
Xc
fa
fXc
Xc - X
(Xc - X)2
f (Xc - X)2
0,2
1,4
0,15
1,45
3
0,8
3
2,4
-2,795
7,812
23,436
1,5
2,7
1,45
2,75
4
2,1
7
8,4
-1,495
2,235
8,9401
2,8
4,0
2,75
4,05
6
3,4
13
20,4
-0,195
0,038
0,2282
4,1
5,3
4,05
5,35
3
4,7
16
14,1
1,105
1,221
3,6631
5,4
6,6
5,35
6,65
2
6
18
12
2,405
5,784
11,568
6,7
7,9
6,65
7,95
2
7,3
20
14,6
3,705
13,727
27,454
Σ
71,9
Σ
75,29
20
b) Media aritmética X =
2
La varianza S =
fX n
f (X
c
X =
− X)
71.9 X = 3,595 minutos 20
2
c
n −1
S 2 = 3,9626
S = 1,9906 minutos
in 100 − f a A .C 1.95 está en la segunda clase y 5.50 en la quinta. c) Pi = Lir + f c i (20) 100 − 3 .(1.3) i = 22.69 % 1,95 = 1.45 + 4 i (20) 100 − 16 .(1.3) i = 81.15 % 5.50 = 5.35 + 2 Por tanto el porcentaje es 81.15% – 22.69 % = 58.46% 43 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Interpretación Inciso (b) El tiempo promedio que los clientes se tardan en realizar sus transacciones bancarias es de 3.595 minutos con una desviación estándar de 1.99. Esto quiere decir que la variación de los tiempos que se tardan los clientes en realizar sus operaciones bancarias es de 1.99 minutos con respecto al tiempo promedio.
Inciso (c) El 58.46 % de los clientes se tardan entre 1.95 y 5.50 minutos en realizar las operaciones bancarias.
EJERCICIO (2)
1) Una compañía de computadoras recopiló datos con respecto al tiempo (en minutos) que requerían cada uno de los 40 vendedores para realizar una venta. La siguiente tabla representa la distribución de tiempo requerido por vendedor. Li
Ls
F
fr
1
10
11
20
1
21
30
4
31
40
41
50
51
60
0.375
61
70
0.225
71
80
0.075
2
5
a) Completar la tabla b) Calcular el coeficiente de asimetría c) Calcular el coeficiente de curtosis d) Interpretar la forma de la distribución.
2) Una fábrica de cremalleras manufactura 15 productos básicos. La compañía tiene registros del número de elementos de cada producto fabricado al mes con el fin de 44 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
examinar los niveles relativos de producción. A partir de los datos obtenidos, la dirección de la Compañía construyó la siguiente tabla.
Clases
frecuencia
9,700
9,899
3
9,900
10,099
8
10,100
10,299
2
10,300
10,499
0
10,500
10,699
2
a) ¿Qué nivel de producción excedió el 75% de sus productos durante ese mes? b) ¿Qué nivel de producción excedió el 90% de sus productos durante ese mes? c) Analice la forma de la distribución.
3) La responsable de la biblioteca de una Universidad ordenó un estudio del tiempo que un estudiante tiene que esperar (en minutos) para que le sea entregado el libro solicitado para consulta. Se tomó una muestra a 20 estudiantes en un día normal. Los datos fueron: 12, 16, 11, 10, 14, 3, 11, 17, 9, 18, 16, 4, 7, 14, 15, 16, 5, 6, 7, 7 a) Hallar la media aritmética, media geométrica, media armónica, mediana y moda. b) ¿Cuánto tiempo máximo se debe suponer que el 75 % de los estudiantes debe esperar para obtener su libro de consulta?
8- Gráficas para datos que representan variables ordinales o nominales. 1- Diagramas de barras Se elabora mediante la utilización de barras rectangulares de ancho igual y con la misma distancia de separación entre una y otra. Puede ser simple o compuesto.
Ejemplo 10. La tabla siguiente muestra los datos sobre las preferencias de algunos deportes como Baloncesto, fútbol, natación y atletismo, para hombre y mujeres. 45 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Hombres
%
Mujeres
%
Baloncesto
6
31.58
13
68.42
Fútbol
15
78.95
4
21.05
Natación
11
57.89
8
42.11
Atletismo
8
42.11
11
57.89
Preferencia de algunos deportes según el sexo 16
Cant. de atletas
14 12 10 8 Homres
6
mujeres
4 2 0 Baloncesto
Fútbol
Natación
Atletismo
Disciplina
46 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
2- Diagrama Circular con los datos del ejemplo 10. Preferencia por algunos deportes según el sexo Atletismo 20% Natación 28%
Baloncesto 15%
Fútbol 37%
Ejemplo 11. El Banco Central de Nicaragua registró las exportaciones en el período 2001 - 2004 (en millones de dólares)
Rubro Café Carne Mariscos Oro Azúcar
2001 103 66 76 30 49
Exportaciones 2002 2003 74 86 78 84 79 69 35 35 29 26
2004 124 110 88 47 29
.
47 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Exportaciones de Nicaragua Banco Central de Nicaragua
Fuente:
140 120 Café
MIllones $
100
Carne
80
Marisco 60
Oro
40
Azúcar
20 0
2001
2002
2003
2004
Años
48 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Unidad II. Probabilidades Objetivos de la Unidad Objetivos Conceptuales ▪
Explicar el concepto y las diferentes definiciones de probabilidad
▪
Explicar los conceptos de variable aleatoria y función de distribución
Objetivos Procedimentales ▪
Aplicar el concepto y las diferentes definiciones de probabilidad en la resolución de ejercicios.
▪
Aplicar el concepto de variable aleatoria y establecer su correspondiente distribución de probabilidad.
Objetivos Actitudinales ▪
Valorar la importancia de la probabilidad y sus aplicaciones en su entorno.
▪
Ser consciente de la utilidad de las propiedades de la probabilidad para resolver diferentes situaciones relativas al entorno social.
Contenidos Conceptuales Concepto
y
Contenidos Procedimentales Contenidos Actitudinales
diferentes Aplicación del concepto y Valoración
definiciones
de de
las
diferentes importancia
de
la
de
la
probabilidad,
definiciones de probabilidad probabilidad
Variables aleatorias
en la resolución de ejercicios herramienta para la solución
Fenómenos
aleatorios, y problemas de la vida de problemas de su entorno
determinísticos, muéstrales enumeración, sucesos. posibilidad,
espacios cotidiana.
finitos
social.
y Aplicación del concepto de Concientización sobre la
eventos
o variable
aleatoria
en la importancia
Incertidumbre, resolución de ejercicios y probabilidad evolución problemas
de
la
probabilidad. Relación y Diagramación
de
la como
vida herramienta para la solución
histórica del concepto de cotidiana.
diferencia
como
de problemas de su entorno de
árbol, social.
entre principio de Multiplicación, 49
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Contenidos Conceptuales
Contenidos Procedimentales Contenidos Actitudinales
probabilidad y estadística. permutaciones,
Participación activa en las
Definición de probabilidad: combinaciones. Definición distintas subjetiva,
clásica
o
Laplace,
frecuencial
de subjetiva,
de los grandes números. Concepto aleatoria
de y
distribución. aleatorias
espacio
aprendizaje
de basada en la cooperación
probabilidad. Regla aditiva grupal
variable de
función
clásica, organizativas del proceso
o frecuencial y axiomática de enseñanza
empírica, axiomática. Ley probabilidad,
formas
Probabilidad.
de Probabilidad condicional e
Variables independencia de sucesos. discretas
y Regla
multiplicativa
de
continuas, media y varianza. probabilidad. Teorema de Distribución
Bernoulli
y Bayes
Binomial.
Experimentos probabilístico
Distribución Normal.
Binomial,
distribución
Binomial.
Distribución
Normal.
Introducción: Sin tener en cuenta la profesión que se haya elegido, en algún momento se deben tomar decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas las consecuencias de tales decisiones. Por ejemplo, los inversionistas deben decidir sobre la conveniencia de invertir en una acción en particular, con base a las expectativas sobre rendimientos futuros. Los empresarios, al decidir comercializar un producto, enfrentan la incertidumbre sobre la posibilidad de éxito. En la actualidad, vemos que la teoría de las probabilidades ocupa un lugar importante en asuntos de negocios. La póliza de seguros de vida, por ejemplo, se basa en tablas de mortalidad y éstas a su vez, se basan en la teoría de las probabilidades. Otras tasas de seguros tales como seguros de bienes raíces y de automóviles se determinan de manera similar. La
50 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
probabilidad también juega un papel importante en la estimación del número de unidades defectuosas en un proceso de fabricación. La probabilidad de recibir pagos sobre cuentas por cobrar, las venta potenciales de un nuevo producto, los apostadores profesionales, un evento deportivo, etc son ejemplos de aplicación de la teoría de las probabilidades.
Definiciones Probabilidades Se define probabilidades como el estudio de experimentos aleatorios o de libre determinación Experimento En estadística la palabra experimento se utiliza para describir un proceso que genera un conjunto de datos cualitativos o cuantitativos. En la mayoría de los casos, los resultados del experimento dependen del azar, por lo tanto no pueden pronosticarse con exactitud.
Experimento aleatorio Definición. Un experimento aleatorio es todo proceso que consiste de la ejecución de un acto (o prueba) una o más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede predecir con certeza. Ejemplos 1, son experimentos aleatorios: lanzar un dado y observar el resultado, contar objetos defectuosos producidos diariamente por cierto proceso, aplicar una encuesta para obtener opiniones, etc. Experimento no aleatorio Son aquellos en donde el resultado sí puede predecirse con toda certeza Ejemplo 2. En condiciones normales elevamos la temperatura del agua a 100 grados en la escala centígrada, de hecho sabemos que se evaporará. Ejemplo 3. Tomamos un dado y marcamos con un mismo número en todas sus caras, al lanzarlo sabemos con toda seguridad cuál número va a caer.
51 MS.c Cliffor Jerry Herrera castrillo
EstadĂstica y Probabilidades â&#x20AC;&#x201C; II AĂąo de FĂsica MatemĂĄtica
Espacio Muestral DefiniciĂłn. Se denomina espacio muestral al conjunto que consiste de todos los resultados posibles de un experimento aleatorio. Este conjunto se denotarĂĄ por S. Cada resultado posible de un experimento aleatorio es un elemento del espacio muestral. A cada elemento del espacio muestral se denomina tambiĂŠn punto muestral. Esto es, el espacio muestral se describe por đ?&#x2018;&#x2020; = {đ?&#x2018;Ľâ &#x201E;đ?&#x2018;Ľ đ?&#x2018;&#x2019;đ?&#x2018; đ?&#x2018;˘đ?&#x2018;&#x203A; đ?&#x2018;?đ?&#x2018;˘đ?&#x2018;&#x203A;đ?&#x2018;Ąđ?&#x2018;&#x153; đ?&#x2018;&#x161;đ?&#x2018;˘đ?&#x2018;&#x2019;đ?&#x2018; đ?&#x2018;Ąđ?&#x2018;&#x;đ?&#x2018;&#x17D;đ?&#x2018;&#x2122; } Si el espacio muestral tiene un nĂşmero finito de elementos es posible enlistar a todos estos, y si el nĂşmero de elementos es grande o infinito el espacio muestral se describirĂĄ mediante un enunciado o regla.
Ejemplo 4. A continuaciĂłn se dan algunos experimentos aleatorios y sus correspondientes espacios muĂŠstrales: 1) El experimento aleatorio de lanzar un dado y observar el resultado obtenido, es de una sola prueba, cuyo espacio muestral se puede escribir como el siguiente conjunto de puntos muĂŠstrales: S1 = {1, 2, 3, 4, 5, 6}. 2) El experimento aleatorio de lanzar una moneda 3 veces, consiste de 3 pruebas, cuyo espacio muestral puede escribirse como el conjunto de ternas ordenadas: S2 = {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS}. NOTA. Los espacios muestrales de experimentos aleatorios que consisten de dos o mĂĄs pruebas sucesivas se obtienen tambiĂŠn de un diagrama tipo ĂĄrbol, como el de la figura para S2.
52 MS.c Cliffor Jerry Herrera castrillo
EstadĂstica y Probabilidades â&#x20AC;&#x201C; II AĂąo de FĂsica MatemĂĄtica 3a.prueba 2a.prueba 1a.Prueba
C C
C
Puntos muestrales CCC
S
CCS
C
CSC
S C
SCC
S C S S
CSS
S
SCS
C
SSC
S
SSS
Diagrama del ĂĄrbol. 3) Si el experimento aleatorio es lanzar una moneda tantas veces como sea necesario hasta que aparezca la primera cara, su espacio muestral es el conjunto: S4 = {C, SC, SSC, SSSC,...etc.}. 4) Si el experimento aleatorio es medir la vida Ăştil (en horas) de una marca de artefacto elĂŠctrico, su espacio muestral es el conjunto: đ?&#x2018;&#x2020;5 = {đ?&#x2018;Ą â&#x2C6;&#x2C6; â&#x201E;?/đ?&#x2018;Ą â&#x2030;Ľ 0} (AquĂ, â&#x201E;? representa a los nĂşmeros reales).
ClasificaciĂłn de los espacios muestrales. Por el nĂşmero de elementos o puntos muestrales, los espacios muestrales se clasifican en: 1) Discretos finitos, consisten de un nĂşmero finito de elementos, por ejemplo, los espacios S1, S2, S3. 2) Discretos infinitos, consisten de un nĂşmero infinito numerable de elementos, por ejemplo, el espacio S4. 3) Continuos, consisten de un nĂşmero infinito no numerable de elementos, por ejemplo, los espacios S5, y S6 Suceso aleatorio Se llama suceso aleatorio a todo suceso que puede ocurrir o puede no ocurrir como resultado de la realizaciĂłn de un fenĂłmeno.
53 MS.c Cliffor Jerry Herrera castrillo
EstadĂstica y Probabilidades â&#x20AC;&#x201C; II AĂąo de FĂsica MatemĂĄtica
Suceso elemental Se llama suceso elemental a aquel suceso A que no se puede expresar como suma de dos sucesos diferentes de A. Los sucesos elementales se identifican con los elementos del espacio muestral y ĂŠstos son los resultados posibles del hecho o experimento. đ?&#x2018;&#x2020; = {đ?&#x2018;?, đ?&#x2018; } Ejemplo 5. {đ?&#x2018;? }
Suceso elemental
{đ?&#x2018; }
Suceso elemental Suceso compuesto
Es el resultado de dos o mĂĄs sucesos elementales.
Ejemplo 6. Al lanzar un dado corriente el espacio muestral, es S = 1 1,2
,2 3
4
1, 2, 3
5
6
1, 2, 3, 4, 5, 6
luego:
Son elementales: en cambio, los sucesos:
2, 3, 5 etc. Son sucesos compuestos.
Algunas definiciones y operaciones con conjuntos Conjunto universo: Comprende la totalidad de los elementos. Se representa por U. Ejemplo 7. a) El conjunto formado por las letras vocales.
U=
b) El conjunto formado por los nĂşmeros dĂgitos. U =
a, e, i, o, u 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
Conjunto uniĂłn: Se define como el conjunto formado por los elementos que pertenezcan al primer conjunto, al segundo conjunto y a ambos. Se denota por A U B =
Conjunto
x/ x Đ&#x201E; A, x Đ&#x201E; B
y x Đ&#x201E; (Aâ&#x2C6;ŠB)
intersecciĂłn: Se define como el conjunto formado por los elementos que
pertenecen a ambos conjuntos. Se denota por A â&#x2C6;Š B = x / x Đ&#x201E; A y x Đ&#x201E; B
Conjunto complemento: Se define el complemento de A como el conjunto formado por los elementos que estĂĄn en el universo pero que no estĂĄn en el conjunto A. 54 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Se denota por Ac =
x/xЄU y xЄA
Diferencia de conjuntos: La diferencia de dos conjuntos denotada por A – B se define como el conjunto formado por los elementos que pertenecen al conjunto A pero que no pertenecen al conjunto B. A–B =
x/xЄA y xЄB
Conjunto vacío: El conjunto vacío se caracteriza por la carencia de elementos. Se denota por Ø o bien por.
Ejemplo 8. Sean los conjuntos: U = 1, 3, 4, 5, 7, 8, 9
A = 1, 4, 7
B = 3, 4, 5, 8
C = 1, 7, 8
Calcular: 1) A U B,
3) (A ∩ B) - (B ∩ C)
2) A U (B – C),
4) (A U B) c,
5) Ac ∩ Bc
Solución: 1) A U B =
1, 3, 4, 5, 7, 8
2) A u (B – C) =
1, 3, 4, 5, 7
3) (A ∩ B) - (B ∩ C) = 4) (A U B)c = 5) A ∩ B′ =
4
9 3, 5, 8, 9
∩
1, 7, 9
=
9
Definición clásica de probabilidad (modelo clásico o a priori) Si un experimento aleatorio tiene n resultados igualmente posibles (n > 0) de los cuales m son favorables a la ocurrencia de un suceso A, entonces se llama probabilidad de un suceso A al cociente m / n y se denota por P(A); es decir:
P(A) = MS.c Cliffor Jerry Herrera castrillo
m n
55
Estadística y Probabilidades – II Año de Física Matemática
m: Son casos favorables al suceso A n: Son casos posibles (o totales) del experimento. Propiedades 1-
0 ≤ P(A) ≤ 1
2-
P (S) = 1
3-
P (A U B) = P (A) + P (B)
4-
si (A ∩ B) = Ø
P (A U B) = P (A) + P (B) – P (A ∩ B)
5-
P (Ø) = 0
6-
P (Ac) = 1 - P (A)
si (A ∩ B) ≠ Ø
Tipos de probabilidad Probabilidad Objetiva: La probabilidad objetiva se divide en dos: 1) Probabilidad clásica (O A PRIORI): Esta se basa en la suposición de que los resultados de los experimentos son igualmente probables. Usando el punto de vista clásico la probabilidad de que un evento ocurra, se calcula dividiendo el número de casos favorables, entre el número de posibles resultados. Esto es: Número de casos favorables Probabilidad de un evento = ------------------------------------------Número de resultados posibles Ejemplo9.: Probabilidad de un evento =
----------------------------------------------
Se lanza un dado corriente ¿Cuál es la probabilidad de obtener un número par? Número de resultados posibles
Solución: P(par) = 3 / 6 = 1 / 2 = 0.50 o bien 50 % Otros ejemplos cásicos son: •
Lotería estatal
•
Juegos de cartas, etc.
2) Probabilidad empírica (MODELO A POSTERIORI): Se basan en la frecuencia relativa histórica. Esto es, la probabilidad de que un evento ocurra a lo largo del
56 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
tiempo, se determina observando el número de veces que eventos similares ocurrieron en el pasado. Número de veces que ocurrió el evento en el pasado Probabilidad de que un evento ocurra = ---------------------------------------------Número de observaciones Ejemplo 10. Un estudio de 751 administradores graduados en una Universidad, mostraron que 383 no fueron empleados en su área principal de estudio.
Como ilustración, una persona
que se especializó en contabilidad, es ahora Gerente de mercadotecnia en una empresa procesadora de tomates. ¿Cuál es la probabilidad de de que un determinado graduado de negocios, sea empleado en un área distinta a su área principal de la escuela? P(A) =
383 751
Por tanto,
P(A) = 51 %
Otros ejemplos empíricos son: •
Establecer tasas de seguros
•
Reportear índices de curación de varias enfermedades y condiciones, etc.
3) Probabilidad Subjetiva: La probabilidad de que un evento particular ocurra, que es asignada por un individuo, basándose en la información que tenga disponible.
Ejemplo 11. •
Apostar en eventos atléticos.
•
Estimar el futuro de una industria.
4) Probabilidad Conjunta: Es una probabilidad que mide la posibilidad de que dos o más eventos ocurran simultáneamente. No son mutuamente excluyentes: P (A U B) = P (A) + P (B) – P (A ∩ B)
57 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ejemplo 12. Las probabilidades de que la recepcionista de un dentista, su asistente o ambos se enfermen cierto día son 0.04, 0.07 y 0.02 respectivamente. ¿Cuál es la probabilidad de que cuando menos uno de los dos se enferme ese día? P(A U B) = 0,04 + 0,07 – 0,02 P(A U B) = 0,09 Sucesos independientes Si la ocurrencia de un suceso A no altera la probabilidad de ocurrencia de otro suceso B, se puede adoptar el término de independencia para describir esta situación y decir que A y B son independientes. Dos sucesos A y B de llaman independientes si y sólo si: P (A ∩ B) = P (A) . P (B) Sucesos dependientes Se dice que dos sucesos son dependientes si la ocurrencia de uno de ellos, afecta la ocurrencia del otro.
Probabilidad condicional Se llama probabilidad condicional o probabilidad de un suceso A condicionada por la ocurrencia de otro suceso B al cociente.
P( A / B) =
P( A B) P(B) ≠ 0.P(A / B): Léase “Probabilidad de A dado B”. P( B)
Ejemplo 13. La probabilidad de que un vuelo de programación regular despegue a tiempo es P(D) = 0,83; la de que llegue a tiempo es P(A) = 0,82 y la de que despegue y llegue a tiempo es P (D A) = 0,78. Encuentre la probabilidad de que un avión: a) Llegue a tiempo dado que despegó a tiempo. b) Despegue a tiempo dado que llegó a tiempo. a) P(A / D) =
P( A D ) P(A / D) = P (D )
0,78 0,83
= 0,94
58 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
b)P(D / A) =
P (D A) 0,78 P(D / A) = 0,82 = 0,9512 P ( A)
Ejemplo 14. Una universidad que proporciona educación para ambos sexos tiene tres carreras: ciencias, administración e ingeniería. La inscripción es la siguiente:
Ciencias
Administración
Ingeniería
Total
Hombre
250
350
200
800
Mujer
100
50
50
200
Total
350
400
250
1,000
Si se ha de seleccionar aleatoriamente un estudiante: a) ¿Cuál es la probabilidad de que estudie ciencias dado que es varón? b) ¿Cuál es la probabilidad de que sea mujer dado que es estudiante de ingeniería?
250 P(C H ) 250 a) P(C / H) = P(C / H) = 1000 = = 0,3125 800 P (H ) 800 1000
P(M I ) b) P(M / I) = P (I )
50 50 P(M / I) = 1000 = = 250 250 1000
0,20
Regla de la multiplicación Sean A y B dos eventos contenidos en S (espacio muestral), entonces la probabilidad de que se dé A y B es igual al producto de la probabilidad de B por la probabilidad de A dado B; es decir:
P (A ∩ B) =P(B) . P (A / B)
Ejemplo 15. Una urna contiene 5 pelotas rojas, 3 azules y 2 blancas. Si se extraen dos de ellas (primero una y después la otra) y sin remplazamiento. Hallar la probabilidad de que: 59 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
a) ambas sean rojas b) una sea roja c) la primera sea roja d) al menos una sea roja e) ninguna sea roja.
R 4/9 R
3/9
A
5/10 2/9 5/9 2/9
3/10
B R A
A 2/9 B R
2/10 5/9 3/9 B
A 1/9 B
a) P (RR) = P(R) . P(R) = (5/10) . (4/9) = 20 / 90 = 2/9 b) P (una sea roja) = P (RA) + P (RB) + P (AR) + P/BR) = (5/10) (3/9 ) + (5/10) ( 2/9 ) + (3/10) (5/9) + (2/10) (5/9) = 15/90 + 10/90 + 15/90 + 10/90 = 50/90 = 5/9
c) P (la primera es roja) = P(RR) + P/RA) + P(RB) = (5/10) (4/9) + (5/10) (3/9) + (5/10) (2/9) = 20/90 + 15/90 + 10/90 = 45/90= 1 / 2
d) P (al menos una sea roja) = P(1 roja) + P(2 rojas) = 5 / 9 + 2 / 9 = 7 / 9
e) P (ninguna sea roja) = P (AA) + P (AB) + P (BA) + P (BB) 60 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
= (3/10) (2/9) + (3/10) (2/9) + (2/10) (3/9) + (2/10) (1/9) = 6 / 90 + 6 / 90 + 6 / 90 + 2 / 90 = 20 / 90 = 2/9
Probabilidad total Si B1, B2, . . . . .Bn representa una partición de S y se B es un evento arbitrario sobre S, entonces la probabilidad total sobre A está dado por:
P(A) = P(B1) . P/A / B1) + P(B2) . P/A / B2) + . . . . . P(Bk) . P/A / Bk) Este teorema es muy útil ya que existen numerosas situaciones prácticas en las cuales P(A) no puede calcularse directamente, sin embargo con la información de que B ha ocurrido, es posible evaluar P(A / B) y por tanto, determinar a P(A) cuando se obtienen los valores de P(B). Otro resultado importante de la ley total de probabilidad es conocida como teorema de Bayes.
Regla de Bayes Si B1, B2, . . . . Bk constituye una partición del espacio de muestreo S y si A es un evento arbitrario sobre S, entonces para r = 1, 2, . . . . . k.
P (Br / A) =
P(Br )P(A / Br )
P(B )P( A / B ) k
1
i
o bien:
i
P(Br )P (A / Br )
P(Br / A) =
P( B1 ).P( A / B1 ) + P( B2 ) P( A / B2 ) + .......... ...P( Bk ) P( A / Bk )
Ejemplo 16. Tres compañías suministran transistores NPN a un fabricante de equipo de telemetría. Supuestamente todos los transistores están hechos de acuerdo a las mismas especificaciones. Sin embargo, el fabricante ha probado durante varios años dos parámetros de calidad de los transistores. Y los registros indican la siguiente información, declarándose defectuoso a un transistor si cualquiera de los parámetros está fuera de especificación. 61 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
__________________________________________________________________ Firma
Proporción de defectuoso
Proporción suministrada por
_________________________________________________________________ 1
0,02
0,15
2
0,01
0,80
3
0,03
0,05
-------------------------------------------------------------------------------------------------------------Debido a los costos involucrados el fabricante ha cesado las pruebas, y puede considerarse de manera razonable que las fracciones de defectos y la mezcla en inventario son las mismas que durante el período en que se realizaron los registros. El director de producción selecciona aleatoriamente un transistor, lo lleva al departamento de prueba y descubre que es defectuoso. Si A es el evento de que un elemento es defectuoso, y si B es el evento de que el elemento proviene de la compañía i (i = 1, 2, 3), entonces es posible evaluar P (Bi /A). Por ejemplo, suponga que se desea determinar P(B3 / A). Entonces:
P(B3 )P( A / B3 ) P (B3/ A) = P ( B1 ).P ( A / B1 ) + P ( B2 ) P ( A / B2 ) + ( B3 ) P( A / B3 ) P (B3/ A) = P (B3/ A) =
(0.05)(0.03) (0..15)(0.02) + (0.80)(0.01) + (0.05)(0.03) 3 = 0.12 25
Ejercicio
1.- Las probabilidades de que una estación de televisión reciba 0, 1, 2, 3, 4, . . . 7 o cuando menos 8 quejas después de transmitir un programa de controversia son, respectivamente 0.02, 0.04, 0.07, 0.12, 0.15, 0.19, 0.18, 0.14 y 0.09: ¿Cuáles son las probabilidades de que después de transmitir un programa la estación reciba: a) Cuando menos 5 quejas? b) Cuando mucho 3 quejas? c) De dos a cuatro quejas?.
62 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
2.-Las probabilidades de que la utilidad de una nueva máquina de escribir se clasifique como difícil, muy difícil, promedio, fácil o muy fácil son respectivamente 0,11; 0,16; 0,35; 0,28 y 0,10. Determine las probabilidades de que la utilidad de la nueva máquina de escribir se clasifique como: a) difícil o muy difícil. b) difícil, promedio o fácil. c) fácil o muy fácil.
3.- Un artista que ha introducido una pintura al óleo grande y una pequeña a una exposición, siente que las probabilidades son respectivamente 0,15; 0,18 y 0,11 de que venderá el óleo grande, el pequeño o ambos. ¿Cuál es la probabilidad de que venderá alguna de las dos pinturas?.
4.- La probabilidad de que un conductor imprudente será multado, se le revocará la licencia o ambas son, respectivamente; 0,88; 0,60 y 0,55; ¿Cuál es la probabilidad de que será multado o de que se le revocará la licencia?.
5.- La probabilidad de que un concierto dado reciba la publicidad adecuada es 0,80; y la probabilidad de que recibirá la publicidad adecuada y también será un gran éxito es 0,76. ¿Cuál es la probabilidad de que si el concierto recibe la publicidad adecuada será un gran éxito?.
6.- La profesora de inglés piensa que la probabilidad es 0,60 de que un examen final por escrito que recibe estará bien redactado. Si la probabilidad es 0,51 de que este examen final estará bien escrito y también recibirá una buena calificación. ¿Cuál es la probabilidad de que un examen final bien escrito recibirá una buena calificación?.
7.- En dos tiros de un dado equilibrado, determine las probabilidades de obtener: a) Dos seis. b) Primero un seis y después algún otro número. 63 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
8.- Un zoólogo tiene cuatro cerdos de guinea machos y ocho hembras y elige a dos de ellos al azar para realizar un experimento; ¿cuáles son las probabilidades de que: a) ambos animalitos sean machos. b) ambos animalitos sean hembras. c) habrá uno de cada sexo.
9.- La probabilidad es 0,70 de que una rara enfermedad tropical se diagnostique correctamente. Si ésta se diagnostica en forma correcta la probabilidad es 0,90 de que el paciente se sanará. Si no, la probabilidad es 0,40 de que el paciente se sanará. Si se cura un paciente que tiene esta enfermedad, ¿cuál es la probabilidad de que se haya diagnosticado correctamente?.
10.- En una fábrica de zapatos se sabe por experiencia pasada que la probabilidad es 0,82 de que un trabajador que ha asistido a un programa de capacitación de la fábrica, cumplirá con la cuota de producción, y que la probabilidad correspondiente es 0,53 para un trabajador que no asistió al programa de capacitación. El 60 % de los trabajadores asisten al programa de capacitación de la fábrica. ¿Cuál es la probabilidad de que un trabajador que cumple con la cuota de producción habrá asistido al curso?.
11) En una ciudad se seleccionó una muestra de 500 personas para determinar diversas informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas hechas se encontraba ¿Prefiere comprar productos nacionales o importados?. De 240 hombres, 140 contestaron que prefieren comprar productos importados y 80 mujeres expresaron que prefieren productos nacionales. a) Elabore una tabla de contingencias en donde las variables cualitativas son sexo y preferencias por sus productos. b) Se selecciona una persona de manera aleatoria. Determinar la probabilidad de que el entrevistado: 1) Sea hombre 2) Sea mujer 64 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
3) Prefiera comprar productos importados 4) Prefiera comprar productos nacionales
TECNICAS DE CONTEO A) Notación factorial El producto de los enteros positivos de 1 a n inclusive ocurre con mucha frecuencia en matemáticas. Este se representa por el símbolo especial n! Que se lee “n factorial”. Es decir: n! = 1 .2 .3 . . . . (n – 2) (n – 1) n = n (n – 1) ( n – 2) . . . . 3 .2 . 1 Ejemplo 17. : a) 5! = 5 .4 .3 .2 . 1 = 120
e) 1!
b) 4! =
4 .3 .2 . 1 = 24
f)
c) 3! =
3 .2 . 1 =
6
g)
d) 2! =
2.1=
2
h) 12 .11 . 10 =
0!
=
1
=
1
8! 8.7.6! = = 56 6! 6! 12.11.10.9! 12! = 9! 9!
B) Coeficientes binomiales El símbolo donde n y r son números enteros positivos con r < n (léase “nCr” o “n r n
tomado r en r”) se define de la siguiente manera.
n(n − 1)(n − 2).....(n − r + 1) n = r (r − 1).... 3.2.1 r
o
n! n = r r!.(n − r ).!
Ejemplo 18.
8! 8.7.6! 8.7 56 8 = = = = 28 = 2!.(8 − 2).! 2.6! 2 2 2
65 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
10! 10.9.8.7! 10.9.8 720 10 = = = = 120 = 3!.(10 − 3).! 3.2.1.7! 3 .2 .1 6 3
C) Permutaciones Cualquier ordenamiento (o arreglo) de un conjunto de n objetos en un orden dado se denomina una permutación de los objetos tomados todos al tiempo. Cualquier ordenamiento de cualquier r < n de estos objetos en un orden determinado se denomina una permutación r (o una permutación de n objetos tomados r a la vez).
1) P(n.n) =
n!
Cuando r = n
2) P(n.r) =
n! Cuando r < n .(n − r ).!
3) P(n.r) =
n! Cuando hayan repeticiones y n = n1 + n2 + . . . . + nr. .n1 !.n 2 !....nr!
4) P(n) = (n – 1)!
Cuando se trate de un arreglo circular.
Ejemplo 19. ¿De cuántas maneras se pueden colocar 5 bolas de diferentes colores en una línea horizontal? Solución: P (5, 5) = 5! = 120 maneras.
Ejemplo 20. ¿De cuántas maneras se pueden sentar 8 personas en un banco que tiene capacidad para cuatro? Solución: P (8, 4) =
8! 8! 8.7.6.5.4! = = = 8 .7 .6 .5 = 1, 680 maneras. .(8 − 4 ).! 4! 4!
Ejemplo 21. ¿Cuántas señales diferentes se pueden hacer con 10 banderas de las cuales 4 de ellas son rojas, 3 son blancas, 2 son azules y 1 es amarilla?. Solución: P (10.4) =
3,628,800 n! 10! = = .n1 !.n 2 !....nr! .4!.3 2 !.2!.1! (24)(6)(2)(1)
=
3,628,800 =12,600 288
66 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ejemplo 22. ¿De cuántas maneras se pueden sentar a comer 5 personas alrededor de una mesa redonda?. Solución: P (5, c) = (5 - 1)! = 4! = 4 .3 .2 . 1 = 24 maneras.
D) Reglas de adición y de multiplicación Ejemplo 23. Un restaurante tiene en su menú de postres, 4 clases de ponqués, 2 clases de galletas y 3 clases de helados. Encuentre el número de formas en que una persona puede selecciona: a) Uno de los postres
Solución 4 + 2 + 3 = 9
b) Uno de cada clase de postres.
R.
Solución (4) (2) (3) = 24
9
R. 24
Ejemplo 24. Una clase está conformada por 8 estudiantes hombres y 6 estudiantes mujeres. Encuentre el número de formas en que la clase puede elegir: a) Un representante para la clase.
Solución
8 + 6 = 14
b) 2 representantes para la clase, un hombre y una mujer.
R. 14
Solución. (8) (6) R. 48
c) Un presidente y un vicepresidente. Solución (14) (13)= 182
R. 182
E) Combinaciones Supongamos que tenemos una colección de n objetos. Una combinación de estos n objetos, tomados r a la vez, es cualquier selección de r objetos donde el orden no cuenta. En otras palabras, una combinación r de un conjunto de n objetos es cualquier subconjunto de r elementos. Ejemplo 25. Encuentre el número de combinaciones de cuatro objetos a, b, c, d , tomados en grupos de a tres y compare con las permutaciones de los cuatro objetos tomados en grupos de a tres. Combinaciones
Permutaciones
abc
abc, acb, bac, bca, cab, cba
abd
abd, adb, bad, bda, dab, dba
acd
acd, adc, cad, cda, dac, dca
bcd
bcd, bdc, cbd, cdb, dbc, dcb 67
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
n La fórmula para las combinaciones es: = r
n! r!.(n − r ).!
Ejemplo 26. Una señora tiene 11 amigos de confianza. a) ¿De cuántas maneras puede invitar 5 de ellos a comer? b) ¿De cuántas maneras si dos de ellos son casados y sólo asisten si van juntos? c) ¿De cuántas maneras si dos de ellos están disgustados y no asistirán juntos?
Solución: 11 a) = 5
11! 11! 11.10.9.8.7.6! = = 5!.(11 − 5).! 5!.6.! 5!.6.!
=
11.10.9.8.7 55,440 = = 462 120. 120
2 9 2 9 b) + = 1(84) + 1(126) = 84 + 126 = 210 2 3 0 5 2 9 c) = 2 (126) = 252 1 4
Ejemplo 27. Una clase está conformada por 9 varones y 3 mujeres. El profesor quiere organizar un comité de cuatro personas. a) ¿De cuántas maneras puede formar el comité? b) ¿Cuántos comité tendrán exactamente 1 mujer? c) ¿Cuántos comité tendrán 1 mujer por lo menos? Solución:
12! 12 = = 4 4!.(12 − 4 ).!
a)
12! 12.11.10.9.8! 12.11.10.9 12.11.10.9 11,880 = = = = = 495 4!.8! 4!. 24. 24. 4!.8!
3 9 b) = 3 (84) = 252 1 3
3 9 3 9 3 9 c) + + = 3 (84) + 3 (36) + 1 (9) = 252 + 108+ 9 = 369 1 3 2 2 3 1
68 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
EJERCICIO Permutaciones 12) ¿Cuántos números impares de 4 cifras pueden formarse con los números dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
13) Encuentre el número de formas cómo se pueden distribuir 9 juguetes entre 4 niños, si el más pequeño debe recibir 3 juguetes, y cada uno de los otros, dos juguetes.
14) Un grupo que debate está conformado por 3 muchachos y 3 niñas. Encuentre el número n de formas en las cuales se pueden sentar en una fila donde a) no hay restricciones, b) los muchachos y las niñas se sientan juntas, c) solamente las niñas se sientan juntas.
15) Encuentre el número n de formas en que un juez puede otorgar el primero, segundo y tercer lugares en un concurso con 18 participantes
16) Encuentre el número n de formas en que 5 libros grandes, 4 libros medianos y 3 libros pequeños se pueden colocar en una repisa de manera que todos los libros del mismo tamaño estén juntos.
Reglas de adición y de la multiplicación 17) Suponga que una clave consiste en 4 caracteres donde el primer carácter debe ser una letra del alfabeto, pero cada uno de los demás caracteres puede ser una letra o un dígito. Encuentre el número de: a) Palabras claves b) Palabras claves que empiezan con una de las cinco vocales
18) Hay 6 caminos entre A y B y 4 caminos entre B y C. Encuentre el número n de formas en que una persona puede conducir: a) Desde A hasta C a través de B, b) Viaje de ida y regreso desde A hasta C a través de B.
69 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
c) Viaje de ida y regreso desde A hasta C a través de B sin utilizar el mismo camino más de una vez.
Combinaciones 19) Un estudiante tiene que contestar 10 de 13 preguntas en un examen: a) ¿Cuántas selecciones hay? b) ¿Cuántas habrá si el estudiante debe responder las dos primeras preguntas? c) ¿Cuántas si el estudiante debe responder la primera o la segunda pregunta, pero no ambas?. 20) ¿Cuántos comités formados por 3 hombres y 2 mujeres se pueden organizar si se dispone de 5 mujeres y 8 hombres?.
21) Encuentre el número m de formas en que 12 estudiantes pueden ser repartidos en 3 equipos T1, T2, T3 de manera que cada equipo contenga 4 estudiantes.
22) Un restaurante tiene 6 postres diferentes. Encuentre el número de formas en que un cliente puede escoger 2 de los postres.
23) Una caja contiene 6 medias azules y 4 medias blancas. Encuentre el número de formas en que puede sacarse de la caja 2 medias cuando a) no hay restricciones, b) hay colores diferentes, c) las medias so del mismo color.
Otros problemas (variados) 24) La caja A contiene 5 canicas rojas y 3 canicas azules y la caja B contiene 3 rojas y 2 azules. Se saca una canica al azar de cada caja. a) Encuentre la probabilidad p de que ambas canicas sean rojas b) Encuentre la probabilidad p de que una sea roja y una sea azul
25) Un lote de producción de 100 unidades de las cuales se sabe que 20 están defectuosas. Una muestra aleatoria de 4 unidades se selecciona sin reemplazo, ¿cuál es la probabilidad de que la muestra no contenga más de 2 unidades defectuosas?. 70 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
26) Se elige al azar un punto dentro de un círculo ¿cuál es la probabilidad de que el punto esté más cerca del centro que de la circunferencia?
27) La probabilidad de que una industria estadounidense se ubique en Munich es de 0.7, de que se ubique en Bruselas es de 0.4 y de que se encuentre ya sea en Bruselas o en Munich, o en ambas, es de 0.8, ¿Cuál es la probabilidad de que la industria se ubique: a) en ambas ciudades b) en ninguna de ellas?
28) Dos hombres A y B disparan a un objetivo. Suponga que P(A) = 1/3 y P(B) = 1/5 representan sus probabilidades de tocar el objetivo. (Se supone que los eventos A y B son independientes). Encuentre la probabilidad de que: a) A no logre el objetivo
c) uno de ellos logre el objetivo
b) Ambos logren el objetivo d) Ninguno logre el objetivo
29) Hay cinco caballos en una carrera. Adriana escoge a dos de ellos y les apuesta. Encuentre la probabilidad p de que Adriana sea la ganadora. 30) Sea P(A) = 0.6
P(A B) = 0.2
P(B) = 0.3
Hallar la probabilidad de que: a) A no ocurra
c) A o B ocurra
b) B no ocurra
d) No ocurra A ni B
31) El peso de un dado ha sido alterado de manera que los resultados produzcan la siguiente distribución de probabilidad:
Resultado
X
Probabilidad P(x)
1
2
3
4
5
6
0.1
0.3
0.2
0.1
0.1
0.2
Considere los eventos A = par
B = 2, 3, 4, 5
C = x < 3
D = x > 7
Encuentre las siguientes probabilidades: 71 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
a) P(A) b)P(B) c) P(C) d)P(D)
32) En una bolsa se han colocado 4 pelotas blancas y 3 negras, y en una segunda bolsa, 3 blancas y 5 negras. Se saca una pelota de la primera bolsa y, sin verla, se mete en la segunda. A continuación se saca una pelota de la segunda bolsa ¿Cuál es la probabilidad de que la pelota que se saque de esta última sea negra?
33) Una firma de transporte tiene un contrato para enviar carga de mercancías de la ciudad A a la ciudad B. No hay rutas directas que enlacen A con B, pero hay seis carreteras de A a X y cinco de X a B ¿Cuántas rutas en total deben considerarse?.
34) El gerente de una pequeña planta desea determinar el número de maneras en que puede asignar trabajadores al primer turno. Cuenta con 15 hombres que pueden servir como operadores del equipo de producción, 8 que pueden desempeñarse como personal de mantenimiento y 4 que pueden ser supervisores. Si el turno requiere 6 operadores, 2 trabajadores de mantenimiento y 1 supervisor. ¿De cuántas maneras puede integrarse el primer turno?.
35) En cierta universidad 20 por ciento de los hombres y 1 por ciento de las mujeres miden más de dos metros de altura. Asimismo, 40 por ciento de los estudiantes son mujeres. Si se selecciona un estudiante al azar y se observa que mide más de dos metros; ¿cuál es la probabilidad de que sea mujer?
36) En un centro de maquinaria hay cuatro máquinas automáticas para producir tornillos. Un análisis de los registros de inspección anteriores producen los siguientes datos. (Par)
Máquina
Porcentaje de producción
Porcentaje de defectuosos 72
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
1
15
4
2
30
3
3
20
5
4
35
2
Las máquinas 2 y 4 son nuevas y se les ha asignado más producción que a las máquinas 1 y 3. Suponga que la combinación de inventarios refleja los porcentajes de producción indicados: a) Si se elige un tornillo al azar del inventario ¿cuál es la probabilidad de que esté defectuoso?. b) Si se elige un tornillo y se encuentra que es defectuoso ¿Cuál es la probabilidad de que se haya producido en la máquina 3?.
37) Una empresa industrial grande utiliza tres hoteles locales para proporcionar alojamiento a sus clientes durante la noche. De pasada experiencia se sabe que al 20 % de ellos se les asigna habitación en el Ramada Inn, al 50 % en el Sheraton y al 30 % en el Lakeview Motor Lodge. Si existe una falla en el servicio de plomería en el 5 % de los cuartos del Ramada Inn, en 4 % de los cuartos del Sheraton y en 8 % de los cuartos del Lakeview Motor Lodge, ¿cuál es la probabilidad de que: a) A un cliente se le asigne un cuarto con problemas de plomería? b) A una persona con un cuarto que tenga problemas de plomería se la asigne acomodo en el Lakeview Lodge?
38) Un espacio muestral de 200 adultos se clasifica de acuerdo a su sexo y nivel de educación. Educación
Hombre
Mujer
Primaria
38
45
Secundaria 28
50
Técnica
17
22
Si se selecciona aleatoriamente una persona de este grupo, encuentre la probabilidad de que: 73 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
a) Sea hombre dado que tiene educación de nivel secundaria. b) No tenga
una función que asocia un número real con cada elemento del espacio muestral.
Una variable aleatoria es una variable cuyo valor es el resultado de un evento aleatorio. Ejemplo 1. Lance una moneda al aire tres veces y anote el número de caras que se obtiene. El espacio muestral es S = ccc, ccs, csc, css, scc, scs, ssc, sss
Suponga que la variable aleatoria está formada por el número de caras. Entonces los resultados posibles son 0 caras, 1 cara, 2 caras o 3 caras. Estos son los valores de la variable aleatoria. Ejemplo 2. Los pesos de envío de la leche en recipientes oscilan entre 10 a 25 kilogramos. Los pesos reales de los recipientes llenos de leche, en kilogramos, son los valores de la variable aleatoria “peso”.
Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria discreta puede asumir sólo ciertos valores. Con frecuencia son números enteros. Resultan principalmente del conteo.
El número de caras en el experimento de lanzamiento de la moneda es un ejemplo de una variable aleatoria discreta. Los valores de la variable se restringen sólo a ciertos números: 0, 1, 2 y 3. Ejemplo 3. El empleado de un almacén regresa tres cascos de seguridad al azar a tres empleados de un taller siderúrgico que ya los había probado. Si Smith, Jones y Brown, en ese orden reciben uno de los tres cascos. Liste los puntos muestrales para los posibles órdenes de regreso de los cascos y encuentre el valor de la variable aleatoria X que representa el número de asociaciones correctas.
74 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Solución: Si S, J y B representan los cascos de Smith, Jones y Brown, respectivamente, entonces los posibles arreglos en los que se pueden regresar los cascos y el número de asociaciones correctas son:
Espacio muestral
m
SJB
3
SBJ
1
JSB
1
JBS
0
BSJ
0
BJS
1
Una variable aleatoria continua resulta principalmente de la medición y puede tomar cualquier valor, al menos dentro de un rango dado.
Un ejemplo son los pesos del agua mineral. Los recipientes llenos de agua pueden tomar cualquier valor entre 10 y 25 Kg.
Otros ejemplos: Estatura de clientes en una tienda de ropa Ingresos de los empleados de una camaronera Tiempo transcurrido entre la llegada de cada cliente en una granja agropecuaria.
Definición: Si un espacio muestral contiene un número finito den posibilidades o una serie interminable con tantos elementos como números enteros existen, se llama espacio muestral discreto. Definición: Si un espacio muestral contiene un número infinito de posibilidades igual al número de puntos en un segmento de línea, se llama espacio muestral continuo. 75 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Distribuciones discretas de probabilidad Una variable aleatoria discreta toma cada uno de sus valores con cierta probabilidad. En el caso de lanzar una moneda tres veces, la variable X que representa el número de caras, toma el valor 2 con probabilidad de 3 , puestres de los ocho puntos muestrales igualmente posibles 8
tienen como resultado dos caras y un sol.
X P(x)
0 1 8
1 3 8
2
Σ
3
3 8
1
1 8
En el caso de los cascos (ejemplo 3), la distribución de probabilidad es: X P(x)
0 1 3
1 1 2
Σ
3 1
1 6
Ejemplo 4. Un embarque de ocho microcomputadoras similares para una tienda, contiene tres que están defectuosos. Si una escuela hace una compra al azar, de dos de estas computadoras, encuentre la distribución de probabilidad para el número de defectuosas.
La variable aleatoria puede tomar cualquiera de los números 0, 1, y 2.
3 5 0 2 = 10 f(1) = P(X = 1) = f(0) = P(X = 0) = 28 8 2
X P(x)
3 5 1 1 = 15 28 8 2
0
1
2
Σ
10 28
15 28
3 28
1 76
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
3 5 2 0 = f(1) = P(X = 2) = 8 2
3 28
La distribución acumulada La distribución acumulada F(x) de una variable aleatoria discreta X con distribución de probabilidad f(x) es:
F(x) = P(X< x) =
f (t )
para
−< x <
tx
Ejemplo 5. Si una agencia de autos vende 50% de su inventario de cierto vehículo equipado con bolsas de aire, encuentre: a) Una fórmula para la distribución de probabilidad del número de autos con bolsas de aire entre los siguientes cuatro autos que venda la agencia. b) La distribución acumulada de la variable aleatoria X.
Solución a) El evento de vender x modelos con bolsas de aire y 4 – x modelos sin bolsas de aire, 4 puede ocurrir de formas, donde x puede ser 0, 1, 2, 3, o 4. Entonces la x
distribución de probabilidad es:
4 x f(x) = para0, 1, 2, 3, o 4 16 b) F(0) = f(0) = 1 / 16 F(1) = f(0) + f(1) = 5 / 16 F(2) = f(0) + f(1) + f(2) = 11 / 16 F(3) = f(0) + f(1) + f(2) + f(3) = 15 / 16 77 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
F(4) = f(0) + f(1) + f(2) + f(3) + f(4) = 1
x
0
1
2
3
4
Σ
P(x)
1/16
4/16
6/16
4/16
1/16
1
F(x)
1/16
5/16
11/16
15/16
1
Histograma de probabilidad 0.40
0.38
0.35 0.30
0.25
0.25
0.25 0.20
0.15 0.10
0.06
0.06
0.05 0.00 0
1
2
3
4
Distribución acumulada discreta 16/16 12/16 8/16 4/16 0
1
2
3
4
Valor esperado El valor esperado (o media) se encuentra multiplicando cada resultado posible de la variable por su probabilidad y luego se suman esos productos.
= E ( X ) = ( xi ) P( xi ) 78 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Varianza La varianza de una distribución de probabilidad es la suma del cuadrado de las desviaciones de cada valor de la variable aleatoria con respecto a la media, multiplicada por sus probabilidades respectivas.
2 = ( xi − ) 2 P( xi ) Ejemplo 6. La distribución de probabilidad de lanzar un dado se muestra en las primeras dos columnas de la siguiente tabla. Calcular el valor esperado (o media), varianza y desviación estándar.
(1)
(2)
(3)
(4)
Solución
P(xi)
(xi).P (xi)
1
1/6
1/6
(1-3.5) . 1/6= 1.04166
2
1/6
2/6
(2-3.5) . 1/6 = 0.37500
3
1/6
3/6
(3-3.5) . 1/6 = 0.04166
4
1/6
4/6
(4-3.5) . 1/6 = 0.04166
5
1/6
5/6
(5-3.5) . 1/6 = 0.37500
6
1/6
6/6
(6-3.5) . 1/6 =1.04166
1
21 = 3.5 6
( xi − ) 2 P( xi )
(xi)
a) Media = 3.5= E ( X ) =
b) Varianza
2
2
2
2
2
2
Σ = 2.91664
21 6
2 = 2.91664 79
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
= 1.7078
c) Desviación estándar
Distribución geométrica Si pruebas independientes repetidas pueden tomar como resultado un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria X, el número de la prueba en el que ocurre el primer éxito, es:
G(x,p) = p . qx – 1 x = 1, 2, 3, . . . . Ejemplo 7. Se sabe que en cierto proceso de fabricación, en promedio, uno de cada 100 artículos está defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se inspecciona, sea el primer defectuoso que se encuentra?. Solución
p = 0.01, q = 0.99,
x = 5g(5, 0.01) = (0.0.1) (0,99) 5 – 1
= 0,0096
Ejemplo 8. En “tiempo ocupado” un conmutador telefónico está muy cerca de su capacidad, por lo que los usuarios tienen dificultad al hacer sus llamadas. Puede ser de interés conocer el número de intentos necesarios a fin de conseguir un enlace telefónico. Suponga que p = 0,05 es la probabilidad de conseguir un enlace durante el tiempo ocupado. Nos interesa conocer la probabilidad de que se necesiten 5 intentos para una llamada exitosa. Solución g(5, 0.05) = (0.05) (0.95) 5 – 1
= 0,0407
Media, varianza y desviación estándar de una variable aleatoria que sigue una distribución geométrica.
80 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Media
=
1 p2
2 =
Varianza
1− p p2
Desviación estándar
= 2
Ejemplo 9. Calcular la media, la varianza y la desviación estándar con los datos del problema (8). Solución: P = 0.05
a) Media
b) Varianza
=
1 = 2 p
2 =
1− p p2
c) Desviación estándar
2 =
1 0.052
1− 0.05 0.052
= 2
= 380
= 400
2
= 380
= 19.49
Distribución híper – geométrica La distribución de probabilidad de la variable aleatoria híper geométrica x, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos de los que K se denominan éxitos y N – K fracaso, es:
k N − k x n − x h(x) = N n
X = 0, 1, 2, . . . .n
Ejemplo 10. Lotes de 40 componentes cada uno se denominan aceptables si no contienen más de 3 defectuosos. El procedimiento para muestrear el lote es la selección de 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso.
81 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
a) ¿Cuál es la probabilidad de que se encuentre exactamente 1 defectuoso en la muestra si hay 3 defectuosos en todo el lote? b) ¿Cuál es la probabilidad de que no haya más de un defectuoso? c) ¿Cuál es la probabilidad de que por lo menos hayan dos defectuosos? Solución. N = 40,
a)
n = 5,
K = 3,
3 37 1 4 P(1) = = 0,30111 40 5
3 37 b) P(x < 1) = P(0) + P(1) = 0 5 + 40 5
3 37 1 4 = 0,66245 + 0,30111 = 0,96356 40 5
3 37 2 3 c) P(x > 2) = P(2) + P(3) = + 40 5
3 37 3 2 = 0,03543 + 0,00101 = 0,03644 40 5
Media, varianza y desviación estándar de una variable aleatoria que sigue una distribución híper geométrica.
Media
n.k = N
Varianza
Desviación estándar
N −n k k = n 1 − N −1 N N 2
= 2
Teorema de Chebyshev Las probabilidades de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estándar de la media es al menos 1 – 1 / k2, es decir: P(
− k X + k )
1−
1 k2
Ejemplo 11. 82 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Con respecto a los datos del ejemplo (10), calcular: a) La media, la varianza y la desviación estándar. b) Aplicare interpretar el teorema de Chebyshev.
Solución N = 40,
n = 5,
a)
=
2 = 0.5579
n.k N
=
5(3) 40
N −n k k n 1 − N −1 N N
= = 0.5579 b)
K=3
2
2
2 =
40 − 5 3 3 5 1 − 40 − 1 40 40
2
= 0,311298
= 0.311298 0.375 2(0.5579 )
= 0,375
0.375 – 1.1158, 0.375 + 1.1158
-0.7408, 1.4908 Interpretación: El teorema de Chebyshev establece que el número de componentes defectuosos que se obtienen cuando se seleccionan al azar n de un lote de N componentes de los que k son defectuosos tiene una probabilidad de al menos 1 – 1/k2 de caer en el intervalo Es decir, para k = 2, hay ¾ de probabilidad de caer entre
2
k
O sea
“Al menos ¾ de las veces los cinco componentes incluirán 1.49, es decir, menos de dos componentes defectuosos”.
La parte izquierda del intervalo no interesa, por resultar
negativo. Distribución híper – geométrica multii - variada Si N artículos se pueden dividir en las k celdas A1, A2,. . . . Ak con a1, a2,. . . .ak elementos,, respectivamente, entonces la distribución de probabilidad de las variables aleatorias
X 1,
83 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
X2, . . . . Xk, que representan el número de elementos que se seleccionan de A1, A2 . . . . Ak en una muestra aleatoria de tamaño n es: a1 a 2 a k ...... x x x f(X1, X2, . . . . Xk, a1, a2,. . . . ak, N, n) = 1 2 k N n
Ejemplo 12. Un grupo de 10 individuos se usa para un estudio biológico. El grupo contiene tres personas con sangre tipo O, cuatro con sangre tipo A y tres con sangre tipo B. ¿Cuál es la probabilidad de que una muestra de cinco, contenga una persona con sangre tipo O, dos personas con tipo A y dos personas con tipo B.
Solución.
3 4 3 . 1 2 2 = 3 = 0.21428 f(1, 2, 2; 3, 4, 3; 10; 5) = 14 10 5
84 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
La distribución binomial Introducción Un experimento a menudo consiste en pruebas repetidas, cada una con dos posibles resultados; éxito o fracaso.
Proceso de Bernoulli Propiedades: 1) El experimento consiste en n pruebas que se repiten. 2) Cada prueba produce un resultado que se puede clasificar como éxito o fracaso. 3) La probabilidad de un éxito que se denota como p permanece constante en cada prueba. 4) Las pruebas que se repiten son independientes. Distribución binomial Definición: Un experimento de Bernoulli puede tener como resultado un éxito con probabilidad py un fracaso con probabilidad q, q = 1 – p. Entonces la distribución de probabilidad de la variable aleatoria binomial X, el número de éxitos en n pruebas independientes, es: n x n− x P(x) = p q x
o también
P(x) =
n! p xqn− x x!(n − x )! x = 0, 1, 2, 3, . . . . .
n Ejemplo 13. La probabilidad de que cierta clase de componente sobreviva a una prueba de choque es 3/4.Encuentre la probabilidad de que sobrevivan exactamente 2 de los siguientes 4 componentes que se prueben. 2
4! 3 1 P(2) = 2!(4 − 2 ).! 4 4
4−2
P(2) = 27
128
P(2) = 0.2109
Ejemplo 14. La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0.4.Si se sabe que 15 personas contraen esta enfermedad, ¿cuál es la probabilidad de que sobrevivan: 85 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
a) Al menos 10 pacientes b) De 3 a 8 pacientes c) Exactamente 5.
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
9
a) P (X>10) = 1 – P(X<10) = 1 -
b P (X> 10) = 1 – 0,9662P (X>10) = 0,0338 0
b) P (3<X <8) =
8
2
0
0
b − b = 0,9050 – 0,0271 5
= b −
c) P(X = 5)
0
P (3<X <8) = 0,8779
4
b = 0,4032 – 0.2173
P (X=5) = 0,1859
0
Media, varianza y desviación estándar de la distribución binomial Media
= np Varianza 2 = n. p.q Desviación estándar = n. p.q
Ejemplo 15. Encuentre la media, la varianza y la desviación estándar de la variable aleatoria binomial para el problema de los pacientes (ejemplo 2). Después aplique el teorema de Chebyshev para el intervalo 2 Media
= np = 15(0.4) = 6 = 6
Varianza
2
= n. p.q 2 = 15(0.4).(0.6) = 3.6 2 = 3.6
Desviación estándar
= n. p.q = 3.6 = 1.897
Teorema de Chebyshev 2 6 + 2 (1.897) (6 – 3.794, 6 + 3.794)
(2.206, 9.794)
El teorema de Chebyshev afirma que el número de recuperaciones entre 15 pacientes sujetos a la enfermedad mencionada, tiene una probabilidad de al menos 3 / 4 de caer entre 3 y 9 pacientes.
86 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Distribución binomial negativa. Si pruebas independientes repetidas pueden tener como resultados un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria X, el número de la prueba en la que ocurre el k ésimo éxito es:
x − 1 b* (x, k, p) = k − 1pk q x - kx = k,
k+1, k+2. . .
Ejemplo 16. Encuentre la probabilidad de que una persona que lanza tres monedas obtenga sólo caras o sólo soles por segunda vez en el quinto lanzamiento. Solución: Al tomar los valores para X = 5, k = 2, p= ¼ se tiene: 2
1 3 b (5, 2, 1/4) = 5 −1 4 4 *
2 − 1
5− 2
= 27 = 0.1055 256
La distribución de Poisson Introducción Los experimentos que dan valores numéricos de una variable aleatoria X, el número de resultados que ocurren durante un intervalo dado o en una región específica, se llama experimento de Poisson.
El número dado puede ser de cualquier longitud, como un minuto, un día, una semana, un mes o incluso un año. Por ello un experimento de Poisson puede generar observaciones para la variable aleatoria X, que representa el número de llamadas telefónicas, por hora que recibe una oficina, el número de días que la escuela permanece cerrada debido a la lluvia durante la temporada de invierno.
La región específica podría ser un segmento de línea, un área o quizá una pieza de material. En tales casos X puede representar el número de ratas de campo por acre, el número de bacterias en un cultivo dado o el número de errores mecanografiados por página. 87 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Propiedades: 1. El número de resultados que ocurren en un intervalo o región específica es independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto. e esta forma vemos que el proceso de Poisson no tiene memoria.
2. La probabilidad de que ocurra un sólo resultado durante un intervalo muy corto o en una región pequeña, es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de resultados que ocurren fuera de este intervalo o región. 3. La probabilidad de que ocurra más de un resultado en tal intervalo corto o que caiga en tal región pequeña es insignificante.
Definición: La distribución de probabilidad de la variable aleatoria de Poisson X que representa el número de resultados que ocurren en un intervalo dado o región específica que se denota con t es:
P ( X , t ) =
e − t (t ) , x = 0, 1, 2, . . . donde es el número promedio de resultados x! x
por unidad de tiempo o región y e = 2.71828 . . . Ejemplo 17. Durante un experimento de laboratorio el número promedio de partículas radioactivas que pasan a través de un contador en un milisegundo dado es 4, ¿cuál es la probabilidad de que 6 partículas entren al contador en un milisegundo dado?
e −4 (4 ) P( X ) = 6!
6
P(X) = 0,1042
Ejemplo 18.
88 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
El número promedio de camiones tanque que llega cada día a cierta ciudad portuaria es 10.Las instalaciones en el puerto pueden manejar a lo más 15 camiones tanque por día. ¿Cuál es la probabilidad de que en un día dado los camiones se tengan que regresar? Solución 15
P ( X 15) = 1 − P ( X 15) = 1 − P P(X >15) = 1 – 0.9513 P(X>15) = 0.0487 0
Media, varianza y desviación estándar de la distribución de Poisson Media
= Varianza 2 = Desviación estándar =
Ejemplo 19. En un proceso de fabricación donde se manufacturan productos de vidrio ocurren defectos o burbujas, lo que deja ocasionalmente a la pieza indeseable para su venta. Se sabe que, en promedio, uno de cada 1,000 de estos artículos que se producen tienen una o más burbujas, ¿Cuál es la probabilidad de que una muestra aleatoria de 8,000 tenga menos de 7 artículos con burbujas? 6 6 1 = 8 P( X 7 ) = b = P = np = 8,000( 1,000 0 0
Usando la tabla encontramos que
P(X < 7) = 0,3134
89 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
La distribución normal Introducción La distribución continua de probabilidad más importante en todo el campo de la estadística, es la distribución normal. Su gráfica, que se denomina curva normal, es la curva en forma de campana, la cual describe aproximadamente muchos fenómenos que ocurren en la naturaleza, la industria y la investigación.
Las mediciones físicas en áreas como los
experimentos meteorológicos, estudios de lluvia y mediciones de partes fabricadas, a menudo se explican más que adecuadamente con una distribución normal. Una variable aleatoria continua X que tiene la distribución en forma de campana se llama variable aleatoria normal.
La ecuación matemática para la distribución de probabilidad de la variable normal, depende de dos parámetros
y
, su media y desviación estándar. La gráfica para una
distribución que presenta mayor desviación estándar, es más baja y se extiende más sobre el eje horizontal.
Propiedades: 1. La moda, que es el punto sobre el eje horizontal donde la curva es un máximo, ocurre en X =
.
2. La curva es simétrica alrededor de un eje vertical a través de la media 3. La curva tiene sus puntos de inflexión en X =
− x +
.
, es cóncava hacia abajo si
Y es cóncava hacia arriba en cualquier otro punto.
4. La curva normal se aproxima al eje horizontal de manera asintótica conforme nos alejamos de la media en ambas direcciones. 5. El área total bajo la curva y sobre el eje horizontal es igual a 1.
Áreas bajo la curva normal Desde una desviación estándar a la izquierda de la media, hasta una desviación estándar a la derecha de la media, se encuentra cerca del 68,26 % de los valores. 90 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Desde dos desviaciones estándar a la izquierda de la media, hasta dos desviaciones estándar a la derecha de la media, se encuentra cerca del 95,45 % de los valores.
Desde tres desviaciones estándar a la izquierda de la media, hasta tres desviaciones estándar a la derecha de la media, se encuentra cerca del 99,73 % de los valores.
+ 1 + 2 + 3 <
− 2 − 1
68,26 % 95,45 % 99.73 %
<
− 3
Estandarización Los valores de la variable aleatoria x, la media y la desviación estándar son grandes, sería una tarea sin fin intentar establecer tablas separadas para cada valor concebible de
y
. Afortunadamente somos capaces de transformar todas las observaciones de cualquier
variable aleatoria normal x, en un nuevo conjunto de observaciones de una variable aleatoria normal z, con media cero y desviación estándar 1. Es decir, que convertimos los valores grandes en valores más pequeños para hacer posible el uso de la tabla. Este proceso recibe el nombre de estandarización y se hace mediante la ecuación.
z=
x−
La distribución de una variable aleatoria normal con media 0 y desviación estándar 1 se llama distribución normal estándar. Uso de la tabla Supongamos que ya tenemos el valor de Z. Para buscar el área en la tabla, se tiene que ubicar en la fila que corresponde al número entero y a la primera cifra decimal de Z, y en la
91 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
columna que encabeza la segunda cifra decimal. La tabla nos proporciona el área que se encuentra por la izquierda del valor de Z.
Para encontrar un valor de Z que corresponde a una probabilidad dada, el proceso se invierte.
Ejemplo 20. Suponga que Z = 1,23 entonces debe ubicarse en la fila 1.2 y en la columna encabezada por el número 03.Ahí encontramos el valor 0,8907 es decir 89,07 %.
Si el valor de Z es un número entero, se tienen que agregar dos ceros como cifras decimales.
Ejemplo 21. Suponga que Z = 1 entonces Z = 1,00debe ubicarse en la fila 1.0 y en la columna encabezada por el número 00.Ahí encontramos el valor 0,8413 es decir 84,13 %.
Si el valor de Z es negativo, se puede calcular el área de dos maneras: •
Se busca el área en la tabla como que si fuera positivo y después restamos de 1 el área encontrada.
•
Usar una tabla propiamente para valores negativos de Z de manera similar al que se usa para valores positivos.
Ejemplo 22. Suponga que Z = - 1 entonces buscamos el área para Z = 1debe ubicarse en la fila 1.0 y en la columna encabezada por el número 00.Ahí encontramos el valor 0,8413 y después restamos 1 – 0,8413 = 0,1587
En el cálculo de áreas se pueden presentar tres casos: Caso 1: Área a la izquierda de un valor de z. Caso 2: Área comprendida entre dos valores z1 y z2. Caso 3: Área a la derecha de un valor z. Caso 1: 92 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Para el primer caso, nos quedamos con el área que X
nos muestra la tabla.
Caso 2:
Para el segundo caso, buscamos las dos áreas X1
A(Z2) y A (Z1) y después restamos A (z2) – A (z1).
X2
Caso 3:
Para el tercer caso, buscamos el área de Z, A(z)
X
y después la restamos de la unidad, es decir: 1 - A(z).
Ejemplo 23 Dada una distribución normal estándar, encuentre el área bajo la curva que yace: a) A la derecha de z = 1,84 b) Entre z1 = -1,97 y z2 = 0,86
a) A (1.84) = 0.9671
Entonces A (z > 1,84) = 1 – 0,9671 = 0,0329
b) A (z2) = A (0.86) = 0,8051
y
A (z1) =A(-1.97) = 0,0244, entonces:
A (-1.97 < Z < 0.86) = A (0.86) - A (-1.97) = 0,8051- 0,0244= 0,7807 a)
0,0329
(Caso 3)
b)
(Caso 2) 0,7807 93
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
1,84
- 1,97
0,86
Ejemplo24. Dada una distribución normal estándar, encuentre el valor de k tal que: a) P(Z > K) = 0,3015 b) P(K< Z < - 0,18) = 0,4197
Solución a) El valor de k deja por la derecha un área de 0.3015 entonces debe dejar por la izquierda un área de 1 – 0.3015 = 0.6985. Usando la tabla en sentido inverso se tiene que K = 0,52 b) El área a la izquierda de – 0.18 es igual a 0.4286, entonces el área entre dos valores es A(-0.18) – A(k) = 0.4286 – A(k) = 0.4197
Despejamos
A(k).
A(K) = 0.4286 –
0,4197 A(K) = 0,0089,
Usando la tabla en sentido inverso se tiene que K = - 2,37
Ejemplo 25. Dada una distribución normal con = 50 y = 10, encuentre la probabilidad de que X tome un valor entre 45 y 62.
z=
x−
20 30 40 50 60 70 80
z2 =
62 − 50 12 z2 = z = 1.2 A(Z 2 ) = 0.8849 10 10 2
z1 =
45 − 50 −5 z1 = z = −0.5 A(Z1 ) = 0.3085 10 10 1 94
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
A(Z2) – A(Z1) = 0.8849 – 0.3085 = 0.5764
Ejemplo 26. De acuerdo al teorema de Chebyshev la probabilidad de que una variable aleatoria toma un valor dentro de dos desviaciones estándar es al menos 3 / 4. Si la variable aleatoria tiene una distribución normal, los valores z que corresponden a
x1= − 2
y x2= + 2 se calculan así:
Z2 = Z1 =
( + 2 ) −
( − 2 ) −
= =
+ 2 − 2 = =2
− 2 − − 2 = = −2
A(2) = 0.9772
A(-2)=1–
(0.9772
)
=
0,0228
P( − 2 ) < X < (( + 2 ) = P ( - 2 < Z < 2 ) = P(Z < 2 ) – P (Z < - 2)
= 0,9772 - 0,0228 = 0,9544 Ejemplo 27. Dada una distribución normal con
= 40
y = 6, encuentre el valor de X que tiene:
a) 45% del área a la izquierda. b) 14 % del área a la derecha. Solución a) En la tabla encontramos que P (Z<- 0,13) = 0,45 por eso, el valor adecuado de z es – 0,13
z=
x−
x = Z + x = 6( −0.13) + 40 x = 39.22
b) Esta vez requerimos un valor z que deje 0.14 del área a la derecha y por ello un área de 0,86 por la izquierda.
Nuevamente usamos la tabla y encontramos que
P (Z < 1.08) = 0.86 por lo cual el valor z que se desea es 1.08
Al sustituir en la
fórmula, resulta: 95 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
x = Z +
x = 6(1.08 + 40
x = 46.48 a)
0.45
b)
0,14
40
40
Ejemplo 28. Se utilizan mediciones para rechazar todos los componentes donde cierta dimensión no está dentro de la especificación 1,50 + d.
Se sabe que esta medición se distribuye de forma
normal con media 1.50 y desviación estándar 0.2
Determine el valor d tal que las
especificaciones “cubran” 95 % de las mediciones.
z=
P (- 1,96 < Z < 1,96) = 0,95
1.96 =
(1.50 + d ) − 1.50 0. 2
x−
d = 0.2(1.96) + 1.50 − 1.50 d= 0,392
Ejemplo 29. Una empresa eléctrica fabrica focos que tienen una duración, antes de fundirse, que se distribuye normalmente con media igual a 800 horas y una desviación estándar de 40 horas. Si la empresa fabrica 900 unidades por día: a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas. b) ¿Cuántos focos tendrán una duración entre 778 y 834 horas.
Solución a) 96 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
z=
x−
778 800 834
z2 =
834 − 800 34 z2 = z = 0.85 40 40 2
z1 =
778 − 800 − 22 z1 = z1 = −0.55 40 40
A(Z2) – A(Z1)
A(Z 2 ) = 0.8023 A(Z1 ) = 0.2912
= 0.8023 – 0.2912= 0.5111
b) x = 900(0.5111) = 459.99
X = 460 unidades
Ejemplo 30. Cierta máquina fabrica resistores eléctricos que tienen una resistencia media de 40 ohmios y una desviación estándar de 2 ohmios. Suponga que la resistencia sigue una distribución normal y se puede medir con cualquier grado de precisión: a) ¿Qué porcentaje de resistores tendrán una resistencia que exceda 43 ohmios? b) Encuentre el porcentaje de resistores que exceden 43 ohmios si la resistencia se mide al ohm más cercano. Solución a) z =
43 − 40 z = 1.5 A(Z ) = 0.9332 2
P (X > 43) = 1 – P (Z < 1.5) = 1 – 0.9332 = 0.0668
6,68 %
b) Ahora asignamos una medida de 43 ohmios a todos los resistores cuyas resistencias sean mayores a 42.5 y menores que 43.5. Realmente aproximamos una distribución discreta por medio de una distribución continua normal. El área que se requiere es la región sombreada a la derecha de 43.5 al aplicar la fórmula tenemos:
z =
43.5 − 40 z = 1.75 A(Z ) = 0.9599 2
P (X > 43,5) = 1 – P (Z < 1.75) = 1 – 0.9599= 0,0401
4,01 %
EJERCICIO 97 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
A) (Variable aleatoria y distribución híper-geométrica) 1. La distribución de probabilidad de X, el número de imperfecciones por 10 metros de una tela sintética en rollos continuos de ancho uniforme, está dada por: x
0
1
2
3
4
P(x)
0.41
0.37
0.16
.0.05
0.01
a) Construya la distribución acumulada X. b) Construya el histograma de probabilidad y el polígono de distribución acumulada. c) Hallar el valor esperado, varianza y desviación estándar. d) Aplicar el teorema ce Chebishev.
2. El dueño de una casa planta seis bulbos seleccionados al azar de una caja que contiene 5 bulbos de tulipán y 4 de narciso, ¿cuál es la probabilidad de que plante dos bulbos de narciso y cuatro de tulipán?
3. Se seleccionan al azar un comité de tres personas a partir de cuatro doctores y dos enfermeras. a) Escriba una fórmula para la distribución de probabilidad de la variable aleatoria X que represente el número de doctores en el comité. b) Encuentre P( 2 < x < 3)
4. Para evitar la detección en la aduana, un viajero coloca seis tabletas de narcótico en una botella que contiene nueve píldoras de vitamina similares en apariencia. Si el oficial de la aduana selecciona tres de las tabletas al azar para su análisis ¿cuál es la probabilidad de que el viajero sea arrestado por posesión ilegal de narcóticos?
5. Se estima 4,000 de los 10,000 residentes de una ciudad que votan están en contra de un nuevo impuesto sobre ventas. Si se seleccionan al azar 15 votantes y se les pide su
98 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
opinión ¿cuál es la probabilidad de que a lo más siete estén a favor del nuevo impuesto?
6. Una fuerza de tarea gubernamental
sospecha que algunas fábricas violan los
reglamentos contra la contaminación ambiental con respecto a la descarga de cierto tipo de producto. Veinte empresas están bajo sospechas, pero no hay capacidad de inspeccionarlas a todas. Suponga que tres empresas violan los reglamentos: a) ¿Cual es la probabilidad de que la inspección de cinco empresas no encuentre ninguna violación? b) ¿Cuál es la probabilidad de que el plan anterior encuentre dos que violen el reglamento?
B) (Distribución Binomial) 7. Al probar cierta clase de neumático para camión en un terreno escabroso, se encuentra que 25 % de los camiones no completaban las pruebas sin ponchaduras. De los siguientes 15 camiones probados, encuentre la probabilidad de que: a) de tres a cinco tengan pinchaduras b) menos de cuatro tengan pinchaduras c) más de cinco tengan pinchaduras.
8. Calcular la media, la varianza y la desviación estándar del problema (1) y aplique el teorema de Chebyshev
9. Suponga que 6 de10 accidentes laborales se deben principalmente a la falta de uso de los equipos de seguridad. Encuentre la probabilidad de que entre 8 accidentes laborales 6 se deban principalmente a la falta de uso de los equipos de seguridad. a) mediante el uso de la fórmula para la distribución binomial b) b) con el uso de la tabla binomial 10. En un proceso de fabricación donde se manufacturan productos de vidrio ocurren defectos o burbujas, lo que deja ocasionalmente a la pieza indeseable para su venta.Se sabe que, en promedio, uno de cada 1,000 de estos artículos que se producen tienen 99 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
una o más burbujas, ¿cuál es la probabilidad de que una muestra aleatoria de 8,000 tenga menos de 7 artículos con burbujas? 11. La probabilidad de que una persona muera de cierta infección respiratoria es 0.002 Encuentre la probabilidad de que mueran menos de 5 de los siguientes 2,000 infectados de esta forma. Encuentre el intervalo usando el teorema de Chebyshev. 12. La probabilidad de que una persona que vive en cierta ciudad tenga un perro se estima en 0.3 Encuentre la probabilidad de que la décima persona entrevistada al azar en esta ciudad sea la quinta que tenga un perro.
C) (Distribución de Poisson) 13. Una secretaria comete dos errores por página en promedio ¿Cuál es la probabilidad de que en la siguiente página cometa: a) 4 o más errores. b) Ningún error.
14. La probabilidad de que una persona muera de cierta enfermedad respiratoria es 0.002 Encuentre la probabilidad de que mueran menos de 5 de los siguientes 2,000 afectados de esta forma?
15. La probabilidad de que un paciente se recupere de una delicada operación de corazón es 0.9, ¿cuál es la probabilidad de que exactamente 5 de los siguientes 7 pacientes intervenidos sobrevivan?
16. Se sabe que el 40% de los ratones inoculados con un suero quedan protegidos de cierta enfermedad. Si se inoculan 5 ratones, encuentre la probabilidad de que: a) Ninguno contraiga la enfermedad. b) Menos de 2 contraigan la enfermedad. c) Más de 3 contraigan la enfermedad
D) (Distribución normal)
100 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
17. Cierto tipo de batería de almacenamiento dura, en promedio, 3.0 años, con una desviación estándar de 0.5 años. Suponga que las duraciones de la batería se distribuyen normalmente, encentre la probabilidad que una batería dada dure menos de 2.3 años.
18. En un proceso industrial el diámetro de un cojinete es una parte componente importante. El comprador establece que las especificaciones en el diámetro sean 3.0 + 0.01 cm.
La implicación es que ninguna parte que caiga fuera de estas
especificaciones se aceptará. Se sabe que en el proceso el diámetro de un cojinete tiene una distribución normal con media 3.0 y una desviación estándar 0.005En promedio, ¿cuántos cojinetes se descartarán?
19. El diámetro interior del anillo de un pistón ya terminado se distribuye normalmente con una media de 10 cm. y una desviación estándar de 0.03 centímetros. a) ¿Qué proporción de anillos tendrán diámetros interiores que excedan 10.075 centímetros? b) ¿Cuál es la probabilidad de que el anillo de un pistón tenga un diámetro interior entre 9.97 y 10.03 centímetros? c) ¿Por debajo de qué valor del diámetro interior caerá el 15 % de los anillos de pistón?
20. Un ingeniero va todos los días de su casa a los lugares donde se llevan a cabo los proyectos. El tiempo promedio para un viaje de ida es de 24 minutos, con una desviación estándar de 3.8 minutos. Suponga que la distribución de los tiempos de viaje está distribuida normalmente. a) ¿cuál es la probabilidad de que un viaje tome al menos ½ hora? b) Si las oficinas de los proyectos abren a las 9.00 A:M: y él sale diario de su casa a las 8.45 A:M.¿Qué porcentaje de las veces llega tarde a su trabajo? c) Si deja su casa a las 835 A.M. y en la oficina se sirve un café entre las 8.50 y las 9.00 A.M. ¿Cuál es la probabilidad de que se pierda el café? d) Encuentre el período arriba del cual se encuentra el 15% de los traslados más lentos.
101 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
21. Una compañía paga a sus empleados un salario promedio de $ 9.25 por hora con una desviación estándar de 60 centavos.
Si los salarios se distribuyen de forma
aproximadamente normal y se pagan al centavo más próximo: a) ¿Qué porcentaje de los trabajadores reciben salarios entre $ 8.75 y $ 9.69 por hora inclusive? b) ¿el 5 % más alto de los salarios por hora de los empleados es mayor a qué cantidad?
22. La vida promedio de cierto tipo de motor pequeño es 10 años con una desviación estándar de 2 años. El fabricante reemplaza gratis todos los motores que fallen dentro del tiempo de garantía. Si está dispuesto a reemplazar sólo 3 % de lo motores que fallan, ¿de qué duración debe ser la garantía que ofrezca?. Suponga que las vidas de los motores sigue una distribución normal. Clase practica Distribución binomial El 20% de los turistas que visitan el salto dela Estanzuela de Estelí es de origen nicaragüense. Si en un día determinado llegan 50 turistas ¿cuál es la probabilidad de que a) 2 sean nicaragüenses. b) Por lo menos 4 sean nicaragüenses. c) No más de 3 sean nicaragüenses. d) Todos sean extranjeros. Distribución de Poisson 1) Una compañía de pavimentación local obtuvo un contrato con el Ayuntamiento para hacer mantenimiento a las vías de un gran Centro Turístico en Nicaragua. Las vías recientemente pavimentadas por esta compañía demostraron un promedio de dos defectos por milla, después de haber sido utilizada durante un año. Si la municipalidad sigue con esta compañía de pavimentación ¿cuál es la probabilidad de que se presenten tres defectos en cualquier milla de vía después de haber tenido tráfico durante un año? 2) Una institución de apoyo a los turistas extranjeros propone impartir clases básicas del idioma español. Para tal fin, contrata a un instructor. Se observa que la llegada de los turistas se ajusta a una distribución de Poisson con un promedio de 5.2 estudiantes 102 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
cada 20 minutos. El instructor está preocupado porque si son demasiados estudiantes los que demandan sus servicios, no podrá atenderlos a todos. Por tal razón, pide ayuda al responsable de la institución, y éste le contesta que: a) Debe calcular la probabilidad de que 4 estudiantes lleguen en un intervalo de 20 minutos, y que, si el resultado es mayor que el 20%, le apoyaría nombrando un segundo instructor. b) Debe calcular la probabilidad de que más de 4 estudiantes lleguen durante algún período de 20 minutos, y que si el resultado es mayor de 50 %, las horas de clase del instructor se aumentarían permitiendo a los estudiantes extender sus horas de estudio. c) Debe calcular la probabilidad que más de 7 estudiantes lleguen durante cualquier intervalo de 30 minutos, y que, si el resultado excede el 50%, el mismo instructor que está, ofrecerá una tutoría adicional. La distribución normal 1) Se sabe que el 10% de los turistas que visitan Nicaragua provienen de Estados Unidos.
Si en un día determinado llegan al país 200 personas ¿Cuál es la probabilidad de que procedan de ese país: a) Exactamente 12. b) Entre 18 y 25 c) Más de 30 turistas.
103 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Unidad III. Estadística inferencial Objetivos de la Unidad Objetivos Conceptuales ▪
Conocer el procedimiento para la prueba de hipótesis sobre una población, y múltiples poblaciones por el método clásico y por intervalo de confianza.
Objetivos Procedimentales ▪
Aplicar el procedimiento de prueba de hipótesis sobre una población y múltiples poblaciones en problemas de la vida cotidiana, utilizando el método clásico e intervalo de confianza.
Objetivos Actitudinales ▪
Apreciar la utilidad por la Inferencia estadística y sus aplicaciones en su entorno social.
Contenidos Conceptuales Prueba
de
hipótesis
intervalo de confianza.
Contenidos Procedimentales Contenidos Actitudinales e Aplicación
del Apreciación de la utilidad
procedimiento de prueba de por la Inferencia estadística
Distribución muestral de hipótesis
sobre
medias, teorema de límite población
y
una como herramienta para la
múltiples solución de problemas de su
central. Procedimiento para poblaciones en problemas entorno social. la
prueba
de
hipótesis. de
Intervalo de confianza.
la
vida
cotidiana,
utilizando el método clásico e intervalo de confianza. Ejercitación del teorema de límite central. Prueba de hipótesis para la media y proporción
de
una
población.
Prueba
de
hipótesis para la diferencia de media y proporciones de dos poblaciones. 104 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Muestreo Es el proceso de realizar estudios de poblaciones a partir de datos muestrales.
Conceptos básicos 1) Población: Es un conjunto de elementos de naturaleza cualquiera de los cuales se esta interesado en estudiar al menos una característica común y observable de dichos elementos en un determinado lugar y un momento dado.
La población en estudio debe estar definida sin ambigüedad de manera que no dé lugar a confusiones. Los elementos considerando que se encuentran localizados en determinado lugar o región geográfica y en un período de tiempo dado.
Ejemplo: El conjunto de todos los supermercados de Nicaragua en un momento dado. Elementos: Supermercados. Característica: Ventas mensuales, No de empleados, nombre, atención, No de cajeras, etc.
2) Muestra: Es una parte de la población que se espera sea representativa de ella. Con frecuencia, se utiliza el término muestra para hacer referencia a los datos muestrales
x 1,
x2,...xn.
Población tamaño N X x1 x2 x3
Muestra tamaño n
.
X1, X2, . . . Xn .
Datos muestrales .
Xn
105 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
3) Variable: Es una característica o fenómeno que toma diferentes valores cuando se observa en diferentes individuos. Utilizaremos símbolos tales como X, Y, Z para representar las características de los elementos. En el ejemplo de los supermercados, X puede representar las ventas mensuales.
4) Datos estadísticos: Los valores posibles de una característica X, los denotaremos por x, mientras que los valores realmente observados de esa característica X, los llamaremos datos y los denotaremos por xi donde el valor del sub-índice i nos indica que es la i-ésima observación de X.
Con frecuencia usaremos el término población para referirnos a la
totalidad de datos que podrían recopilarse en una situación dada x1, x2, x3, . . . .xN.
5) Parámetro: Es una medida que proviene de todos los datos de una población. Los parámetros son constantes que representan por lo general características de la población. Generalmente se representan por letras griegas. Por ejemplo la media poblacional es un parámetro que se define como un promedio y denota como: N
x + x 2 + x3 + ...... x N = 1 = N
X i =1
i
N N
El total poblacional es otro parámetro que se denota y define como = X i i =1
Otros ejemplos de parámetros son la varianza y la desviación estándar.
¿Por qué se muestrea? Tomar decisiones con base a información incompleta no es algo novedoso. Por ejemplo, muchos compradores prueban un poco de queso antes de adquirirlo. De un pedazo deducen el sabor de un trozo mayor.
En medicina, una muestra de sangre puede llevar a inferir que el paciente está anémico. Como el interés primordial de la Estadística es conocer parámetros, facilitaremos la inferencia acerca de los parámetros, utilizando la información de una muestra para estimar los parámetros. 106 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Una muestra de familias de un barrio, puede ser útil para estimar el número promedio de niños por familia del barrio. En la industria, una muestra de artículos puede servirnos para estimar la proporción de artículos defectuosos producidos en cierto momento. Ventajas del muestreo 1. Rapidez y bajo costo de la información requerida El muestreo es una técnica que utiliza recursos materiales económicos y humanos disponibles, para obtener en el menor tiempo, con el menor costo y con cierta exactitud aceptable información necesaria acerca de algunos parámetros.
2. Es un procedimiento práctico cuando la población es muy grande o infinita Decimos que una población es finita cuando sabemos cuantos elementos existen en ella, esto es, cuando posee un tamaño que denotaremos por N. Existen poblaciones finitas tan grandes que resulta imposible observar sus elementos en un período de tiempo razonable, por ejemplo, todas las familias de una ciudad. Otras son tan inmensas que muchos de sus elementos son inaccesibles y su tamaño puede ser desconocido, por ejemplo, todos los pequeños agricultores de un país.
También existen poblaciones infinitamente grandes, esto es, con un número ilimitado de elementos, razón por la cual le llamaremos poblaciones infinitas. Podríamos considerar que los procesos continuos de producción de algún bien generan poblaciones infinitas porque, teóricamente, podría suponerse que estos procesos operan indefinidamente, por ejemplo, el proceso de producción de chips de computadores.
3.
Evita la destrucción de toda la población
Esta situación se da cuando la medición de la característica de interés destruye al mismo elemento. Los catadores de vino pueden evaluarlo con unos cuántos sorbos sin necesidad de consumir toda la producción.
107 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
En una compañía sólo se prueba la germinación de unas cuántas semillas antes de la temporada de siembra.
Los censos, debido a la gran cantidad de recursos que requieren, se realizan en períodos retirados de tiempo. Sin embargo, su aplicación es ventajosa cuando la población es muy pequeña, o se requiere una exactitud completa.
Métodos de muestreo En todo muestreo lo deseable es básicamente obtener una muestra que sea una buena representación de la población en miniatura y que además su costo sea el menor posible, ya que a mayor representatividad de la muestra, se espera mayor precisión de las estimaciones de los parámetros.
Existen dos métodos que tratan de obtener la muestra anterior: El muestreo no probabilístico y el muestreo probabilístico.
Muestreo no probabilístico En este método no todos los elementos poblacionales tendrán posibilidad de integrar la muestra, motivo por el cual se espera poca representatividad de la muestra. Se usan el conocimiento, la experiencia y la opinión personal para identificar los elementos de la población que van a incluirse en la muestra. El conocimiento y la experiencia ayudan a aumentar la precisión de las estimaciones y la opinión personal para minimizar el costo. -La precisión de sus resultados generalmente no se puede medir en forma objetiva porque no hay ninguna ley del azar que permita medir el error del muestreo. A pesar de esta falla de objetividad los métodos de muestreo no probabilísticos son importantes en los negocios, y la investigación económica y social.
108 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Muestreo probabilístico. Es un método de muestreo en el cual cada elemento de la población tiene una probabilidad conocida (no igual a cero) de ser incluido en la muestra. Las unidades muestrales se seleccionan conforme a las leyes del azar en vez del criterio personal. La precisión de sus resultados se puede medir objetivamente porque, según veremos más adelante, los estimadores de parámetros seguirán las leyes del azar, esto es, una distribución de probabilidad conocida de la cual podremos considerar su desviación estándar con un error de muestreo esperado (promedio). Aunque el error de muestreo es de naturaleza aleatoria podremos controlarlo, es decir, hacerlo más pequeño, seleccionando el tipo de muestreo más adecuado. También controlaremos el costo del muestreo seleccionando el tipo de muestreo que logre reducir sustancialmente ese costo.
Tipos de muestreo probabilístico Algunos tipos de muestreo probabilísticos son los siguientes: Muestreo aleatorio simple, Muestreo aleatorio sistemático, Muestreo aleatorio estratificado y Muestreo aleatorio por conglomerados.
Muestreo aleatorio simple En el muestreo aleatorio simple se seleccionan las muestras mediante métodos que permitan a cada muestra posible tener igual probabilidad de ser seleccionada y a cada elemento de la población, tener igual probabilidad de quedar incluido en la muestra.
El muestreo aleatorio simple es un procedimiento práctico si: 1) La población tiene una desviación estándar
pequeña en comparación a la magnitud de
los datos y su tamaño no es muy grande.
2) Es fácil y poco costoso llegar a los elementos poblacionales. 109 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ejemplo 1. Una población consta de los números 1, 3,
5,
7,
9
a) Calcular la media de la población. b) Hallar la varianza y la desviación estándar de la población. c) ¿Cuántas muestras de tamaño 2 pueden formarse?. d) Cite las muestras. e) Construir la distribución muestral de medias. f) Determinar el valor de la media muestral, varianza muestral y la desviación muestral.
Solución N
x1 + x 2 + x 3 + ...... x N = a) = N
X i =1
i
N
=
1 + 3 + 5 + 7 + 9 25 = =5 5 5
b) (X - )
(X - )2
2
2
1–5
16
Varianza
3–5
4
5–5
0
2 =8
7–5
4
9–5
16
d)
Combinación de 5 en 2.
13
35
57
15
37
59
17
39
N
Desviación estándar Total . . . . .
c)
(x − ) =
=
40 5
= 8 = 2.82
40
nCr = 5C2 = 10
79
19
e) 110 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Muestras
Media
P(x)
X . P(x)
(X - )
( X - )2 P(x)
X
13
2
0.10
0.2
(2 - 5) = - 3
(-3) 2(0.10) = 0.9
15
3
0.10
0.3
(3 - 5) = - 2
(-2) 2(0.10) = 0.4
17
4
0.10
0.4
(4 - 5) = - 1
(-1) 2(0.10) = 0.1
19
5
0.10
0.5
(5 - 5) = 0
0 (0.10) = 0
35
4
0.10
0.4
(4 - 5) = - 1
(-1) 2(0.10) = 0.1
37
5
0.10
0.5
(5 - 5) = 0
39
6
0.10
0.6
(6 - 5) = 1
(1) 2(0.10) = 0.1
57
6
0.10
0.6
(6 - 5) = 1
(1) 2(0.10) = 0.1
59
7
0.10
0.7
(7 - 5) = 2
(2) 2(0.10) = 0.4
79
8
0.10
0.8
(8 - 5) = 3
(3) 2(0.10) = 0.9
5.00
0 (0.10)
= 0
3.0
Media muestral
x = x.P( x) x =
Varianza muestral
2 x = (x − ) .P(x ) 2 x = 3
5
2
Desviación muestral
x = 3 x = 1.7320
Muestreo aleatorio sistemático Es un procedimiento que se aplica a situaciones donde los elementos poblacionales pueden ser seleccionados con un intervalo uniforme que se mide en el orden, en el tiempo o en el espacio. Este procedimiento trata de garantizar que cada elemento poblacional tiene la misma probabilidad de integrar la muestra.
El, muestreo sistemático es un procedimiento práctico si: Se dispone de una lista de los elementos poblacionales y que además de que no son muchos, están en un orden aleatorio. (Marco muestral)
111 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Se tiene un proceso continuo de producción de algún artículo el cual consideramos que genera una población infinita, y que por lo tanto, la manera más práctica de tomar una muestra es fijar un intervalo uniforme que nos permita ir tomando artículos para el control de calidad de la producción.
Como seleccionar la muestra aleatoria. 1. Numerar los elementos poblacionales. 2. Obtener un intervalo de muestreo, utilizando la fórmula k =
N donde N es el tamaño de n
la población y n es el tamaño de la muestra.
3. Seleccionar al azar un punto de arranque r donde 1 < r < k 4. Tomar cada k – ésimo elemento a partir del punto de arranque r. r, r + k, r + 2k, - - -
Ejemplo 2. Tomar una muestra sistemática de 6 casas a partir de una manzana que comprende 78 casas. Solución: 1, 2, 3, 4 . . . . . . . 78
k=
N n
=
78 = 13 6
Para hallar el punto de arranque r se puede utilizar la tabla de números aleatorios. Se trabaja con dos dígitos ya que 13 tiene dos cifras. Iniciando en la fila 2 y la columna4 con una dirección descendiente. (Se toman las dos primeras cifras del número que nos muestra la tabla). Se encuentra el número 7. Este es el primer elemento de la muestra. Entonces los elementos de la muestra son:
7, 7 + 13, 7 + 2(13), 7 + 3(13), 7 + 4(13),
7 + 5(13) o sea: 112
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
7,
20,
33,
46,
59, 72
Ejemplo 3. A partir de una lista de 70 solicitudes de crédito tome una muestra de 8 solicitudes Usando tres dígitos y entrando en la fila 28 columnas 6 con una dirección de izquierda a derecha. Solución Se enumeran las solicitudes así: 1, 2, 3, 4, 5, 6, 7, . . . . . ,70. Intervalo de muestreo k =
N n
70 = 8.75 8
=
(k nuevo 8.75 x 100 = 875)
Utilizar la tabla de números aleatorios para seccionar un número entre 1 y 875. De acuerdo a las coordenadas dadas se encuentra el número 40027. A partir de 400 se suman consecutivamente 875 hasta obtener los ocho números. 400, 1275,
2150,
3025,
3900,
4775,
5650,
6525
Ahora cada número se divide entre 100. Con lo que se obtiene: 4.00,
12.75,
21.50,
30.25,
39.00,
47.75,
56.50,
65.25
Finalmente se suprimen las cifras decimales, resultando: 4, 12, 21, 30, 39, 47, 56, 65
(Estos son elementos que formarán la muestra).
Nota: La entrada a la tabla de números aleatorios puede hacerse de manera arbitraria y la dirección puede ser horizontal o vertical.
Estimación Se refiere a un cálculo aproximado del parámetro poblacional a partir de datos muestrales.
Precisión y exactitud de un estimador Cuando se hacen investigaciones, los datos recopilados a través de un cuestionario escrito o una entrevista personal o telefónica, lo cual da lugar a que se cometan dos tipos de errores.
113 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Errores de muestreo Estos errores ocurren debido a que sólo se hace una observación parcial de la población. El error de muestreo es la diferencia absoluta entre el resultado de la muestra y el parámetro. Em = X − Estos errores no son medibles porque los parámetros son desconocidos y aunque son aleatorios pueden ser controlados. De manera que a menor error de muestreo, mayor precisión tendrá la estimación.
Errores ajenos al muestreo Estos errores no ocurren debido al muestreo en sí, sino a otras causas, motivo por el cual este tipo de error puede ocurrir aún cuando se trate de un censo. Algunas causas pueden ser: •
Los instrumentos de medida (cuestionarios, entrevistas, etc) no son precisos, esto es, no miden lo que se pretende.
•
Los entrevistados dan respuestas incorrectas.
•
El entrevistador anota las respuestas en lugares inapropiados.
Estos errores no son medibles pero pueden ser controlados evitando las causas que los producen.
La exactitud de una estimación tiene que ver con lo que llamaremos el error total, esto es la suma del error de muestreo más el error ajeno al muestreo.
Propiedades de une estimador Insesgado: Un estimador ´de un estimador es Insesgado si tiene una distribución muestral con media de igual a lo cual denotaremos así = . Esto quiere decir que si utilizamos un estimador Insesgado para hacer una estimación particular de un parámetro, esta puede ser menor o mayor que el parámetro, pero si utilizamos muchas veces el mismo estimador, entonces tendríamos que el valor medio de todas las estimaciones serán igual al parámetro.
114 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Eficiencia: Se desea que tenga una distribución muestral con varianza lo más pequeña posible. Esto asegura una probabilidad alta de que una estimación particular se encuentre cerca del parámetro. Si se tienen dos estimadores 1 y 2 de un mismo parámetro y la varianza del estimador
1 es menor que la varianza del estimador 2 lo cual denotaremos así,
21 < 22
entonces el estimador 1 es más eficiente que el estimador 2. Estimador puntual Un estimador puntual de un parámetro es aquél que proporciona un único estimado del N
parámetro al analizar los datos muestrales. Así, la media muestral X ==
X i =1
n
i
es un
N
estimador puntual de la media poblacional ==
X i =1
i
N
Estimador por intervalos de confianza. Es aquél que define un par de variables aleatorias Li y Ls que llamaremos límite inferior y límite superior del intervalo entre los cuales diremos que hay una probabilidad de 1 -
(que llamaremos nivel de confianza) de que el parámetro se encuentre entre dichos limites; y también diremos que hay una probabilidad
(que llamaremos riesgo) de que el
parámetro no se encuentre entre dichos límites.
Intervalo de confianza para la media y el total cuando la muestra es grande (n > 30)
X Z
n
2
X Z 2
n
N −n N −1
Si la población es infinita.
Si la población es finita. 115
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
N X Z N
n
2
N −n N −1
Intervalo de confianza para el total.
Error estándar de la media X y el total t = N X El error estándar de la media se define así:
x =
x =
n
Si la población es infinita.
n
N −n N −1
Si la población es finita.
El error estándar del total N X se denota y escribe así
N X = N x
O sea:
Nx = N
n
N −n N −1
2.6.- Error máximo permitido
E = Z 2
n
Si la población es infinita
116 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
E = Z
2
E = Z N
N −n N −1
n
N −n N −1
n
2
Si la población es finita.
Error máximo permitido para el total.
N −n n puede omitirse si el cociente < 0.05 N −1 N
Nota: El factor de corrección
2.7.- Tamaño de la muestra requerido n para estimar para estimar con un error máximo permitido E un nivel de confianza de (1 -
) 100% es:
Para una población infinita. z n= 2 E
2
Para una población finita. z n0 = 2 E
2
n0
Si N > 0.05
Ejemplo 4.
n0
puede ser reducida a:
n0 N n = n + (N − 1) 0 117
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Consideremos el conjunto de todas las pequeñas industrias de un determinado artículo. Se quiere determinar la producción anual total de todas las industrias y se sabe en base a estudios anteriores que la desviación estándar poblacional de las producciones anuales es igual a 2 en miles de unidades. Con tal propósito se selecciona de un listado actualizado de 826 industrias una muestra aleatoria de 50 industrias obteniendo una ´producción anual promedio de 5.52 en miles de unidades. a) Encuentre un intervalo de confianza del 90% para la producción anual total de las industrias. b) Con una confianza del 95% calcule el valor del error máximo permitido en la estimación de la producción anual total del inciso (a). c) Si quiero estimar la producción anual promedio de las industrias con una confiabilidad del 80% de que el error máximo permitido sea de 300 unidades ¿cuál debe ser el tamaño de la muestra?
Solución: a)
826(5.52) 1.645(826) 4,559.52 372.7304 < t
o sea
4,186.79 < t < 4,932.2504
2 50
826 − 50 826 − 1
4,559.52 – 372.7304 < t <4,559.52 + 372.7304
(en miles de unidades)
b)
E = Z
2
n
N −n 2 E = 1.96(826) N −1 50
826 − 50 826 − 1
E = 444.1043
c) 118 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
n0 =
n0 =
z 2 E
2
n0 =
2
n0 = 72.8177
72.8177 = 0.088 0.05 Dado que el cociente supera el 5% se aplica 826
el factor de corrección. n = n=
1.28( 2) 0.3
72.8177(826) 72.8177 + (826 − 1)
n0 N n0 + (N − 1) n = 67 pequeñas industrias.
n = 66.99
Intervalo de confianza para la media y el total cuando la muestra es pequeña (n< 30)
Distribución t de student. Cuando la desviación estándar poblacional
sea desconocida y X tenga una distribución
normal o aproximadamente normal se tiene primero que estimar
para poder estimar
x El error estándar de la media muestral se denota y escribe así:
s n s n
Para una población infinita
N −n N −1
Para una población finita
Intervalo de confianza para la media
X t 2
s n
Si la población es infinita. Ejemplo 5. 119 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Una máquina empaca azúcar en bolsas plásticas. Se quiere estimar el peso promedio de las bolsas de azúcar sabiendo por estudios anteriores que la desviación estándar poblacional es de 0.10 libras .Del flujo de producción se toma una muestra aleatoria sistemática de 10 bolsas obteniendo los pesos en libras. 5.10, 4.90, 4.80, 5.15, 5.05, 4.95, 4.97, 4.85, 5.03, 5.00
a) Obtenga un intervalo de confianza del 80% para el peso promedio de las bolsas de azúcar. b) Identifique el error muestral promedio en la estimación del intervalo del inciso (a). c) Con la misma muestra anterior, obtenga un intervalo de confianza para el peso promedio de las bolsas de azúcar para un nivel de confianza del 97%. Compare la longitud de este intervalo con el obtenido en el inciso (a) d) Identifique el error máximo permitido con una confianza del 80% en la estimación del inciso (a) e) Se quiere estimar el peso promedio de las bolsas de azúcar con una confiabilidad de 90% de que el error máximo permitido sea de 0.0313 libras ¿Cuál debe ser el tamaño de la muestra?
Solución: Datos: n = 10,
X = 4.98,
= 0.10
a) NC 80 %
= 1 − 0.80 = 0.20
2
=
0.20 = 0.10 2
GL = n – 1 = 10 – 1 = 9 La tabla t student proporciona un valor t
2
= 1.383
120 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
X t 2
s 0.10 4.98 1.383 n 10
4.98
0.0437 <
4.98 − 0.0437 4.98 + 0.0437 4.9363 5.0237
Libras de
azúcar
b)
x =
s n
x =
0.10 = 0.0316 Libras de azúcar. 10 x
c) NC 97 %
= 1 − 0.97 = 0.03
2
=
0.03 = 0.015 2
GL = n – 1 = 10 – 1 = 9 La tabla t student proporciona un valor t
X t 2
2
= 2.574
s 0.10 4.98 2.574 4.98 n 10
4.98 − 0.08139 4.98 + 0.08139 4.8986 5.06139
0.08139<
Libras de
azúcar Se observa que la longitud de este intervalo es mayor que el obtenido en el inciso (a). Esto quiere significa que entre más confiable sea nuestra estimación, menos precisa será. d)
e)
E = 0.0437 libras de azúcar.
z n = 2 E
2
(1.645)(0.10) n= 0.0313
2
n = 27.62
n = 28 bolsas.
121 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ejercicio La población de supermercados de una ciudad se presenta en la siguiente tabla: N0 de Súper
01
02 03 04 05 06 07
08 09 10 11 12
13 14 15
Ventas
84
73 50 35 62 38 26
25 56 45 90 20
87 30 40
diarias(miles C$) a) Tome una muestra aleatoria de 3 supermercados, entrando en la fila 3 columna 4 en dirección horizontal de izquierda a derecha. (Usando muestreo aleatorio simple) b) Determinar la media muestral respecto a las ventas ¿Qué representa
?
c) ¿Cuántas muestras de tamaño 2 pueden formarse?. d) Cite las muestras. e) Construir la distribución muestral de medias. f) Determinar el valor de la media muestral, varianza muestral y la desviación muestral 1) Un auditor quiere tomar una muestra de 20 documentos de un total de 280 que tiene en su poder. Use muestreo sistemático mediante la tabla de números aleatorios entrando en la fila 16 columna 7.
2) Una empresa comercializadora de granos básicos está estudiando la posibilidad de comprar 1000 sacos de frijol. Con el fin de determinar el peso promedio de materias extrañas por saco., tomó una muestra aleatoria de 40 sacos obteniendo un promedio de 2.4 libras y una desviación estándar de 0.62 libras de materias extrañas. a) Obtenga un intervalo de confianza del 95% para el peso promedio de materias extrañas por saco. b) Construya un intervalo de confianza del 90% para el total de materias extrañas en los 1000 sacos. c) Si se quiere estimar el peso promedio de las materias extrañas por saco con una confiabilidad del 98% de que el error máximo permitido sea de
+ 0.10 libras
¿Cuál debe ser el tamaño de la muestra?
122 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
3) Los ingresos del impuesto sobre ventas en una comunidad particular se recogen cada trimestre. Los siguientes datos representan los ingresos (en miles de córdobas), cobrados durante el primer trimestre en una muestra de 9 establecimientos de menudeo en la comunidad.
16,
18,
11,
17,
13,
10,
22,
15,
16
Suponiendo que los ingresos trimestrales del impuesto sobre ventas se distribuyen aproximadamente normal. a) Establezca un intervalo de confianza del 98% para el ingreso trimestral promedio del impuesto sobre ventas para el establecimiento de menudeo. b) ¿Cuál es el error muestral? c) Si hay un total de 300 establecimientos de menudeo en esta comunidad establezca un intervalo de confianza del 95% de los ingresos totales por impuestos sobre ventas que se lograrán en este trimestre. d) Si quiere estimar el ingreso trimestral promedio del impuesto sobre ventas de los establecimientos con una confianza del 95% de que el error máximo permitido sea de C$1,000 ¿Qué tamaño de muestra se requiere?
Prueba de hipótesis Es un procedimiento que consiste en plantear hipótesis y contrastarlas para analizar las diferentes alternativas de tal manera que nos conduzcan a la toma de decisiones. Hipótesis: Es un supuesto que se hace acerca del valor de un parámetro de una población o acerca de parámetros de varias poblaciones.
Tipos de hipótesis Hipótesis nula: La hipótesis nula será generalmente la que afirma en los problemas ausencia de efecto alguno para determinada acción o tratamiento Se representa por H0.
Hipótesis alterna: Es cualquier hipótesis que es contraria a la hipótesis nula. Esto es, que hay presencia de efecto para determinada acción o tratamiento. Se representa por H1. 123 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
En el procedimiento de prueba de hipótesis pueden presentarse cuatro situaciones las que se indican en el cuadro siguiente. Alternativas
Estados de la Naturaleza H0 es verdadera
H0 es Falsa
Aceptarla H0
Decisión correcta
Error tipo II
Rechazar H0
Error tipo I
Decisión correcta
El procedimiento de prueba de hipótesis consta de cinco pasos. Paso 1.
Plantear hipótesis nula e hipótesis alternativa
Paso 2.
Seleccionar un nivel de significación, alfa (expresado en %) alfa.
Paso 3.
Identificar el estadístico de prueba, puede ser: x− Z= n Si la población es infinita y n > 30 x− Z= N −n n N − 1 Si la población es finita y n > 30
t=
x− s n
Si la población es infinita y n < 30 Pueden haber otros: Chi cuadrada, Kruskall Wallis, Kolmogorov, Signos, Kendal, Fisher, etc.
Paso 4.
Formular las reglas de decisión
124 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Paso 5.
Conclusión o toma de decisiones. Puede ser: • Aceptar la hipótesis nula o rechazar la hipótesis nula. • En caso de que se rechace la hipótesis nula, se tiene que aceptar la hipótesis alternativa.
Pruebas de una cola (o unilaterales) Por la derecha
Por la izquierda
CuandoH1 :
0
CuandoH1 :
Z Área de aceptación
0
- z Área de rechazo
Área de rechazo
Área de aceptación
Prueba de dos colas (o bilaterales) CuandoH1 :
0
− Z
Z
2
2
Área de rechazo
Área de rechazo
Área de aceptación Ejemplo 1: 125 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Suponga que cierta región del País cuenta con 200 plantaciones donde se cultiva maíz sin hacer uso de ningún abono. Por muchos años el rendimiento ha sido de 44 quintales por manzana. El MAG está tratando de convencer a los agricultores de la aplicación de un nuevo fertilizante. A manera de prueba los agricultores usaron el fertilizante en 36 plantaciones seleccionadas aleatoriamente obteniendo un rendimiento promedio de 47.30 quintales por manzana y una desviación estándar de 6.6 quintales por manzana. ¿Se debe aplicar el nuevo fertilizante a un nivel de significación del 5%? Solución
Paso 1.
H0:
H1:
> 44
= 44
Hipótesis nula Hipótesis alternativa
Es prueba de una cola pues la
hipótesis alternativa apunta hacia la derecha.
Paso 2.
Z=
Paso 3.
Paso 4.
= 0.05 x− N −n n N −1
Z = 1.645
Muestra grande (n > 30) Población finita.
(Valor crítico)
Reglas de decisión
0
Si Z < 1.645se acepta H0
A
1.645 R
Si Z > 1.645se Rechaza H0 Z=
47.30 − 44 200 − 36 6.6 36 200 − 1
Z=
3 .3 0.9986
Z = 3.30
Paso 5. Puesto que Z = 3.30 > 1.645 cae en la región de rechazo. Se rechaza la hipótesis nula H0 (que dice que el rendimiento es 44 quintales por manzana) y se acepta la hipótesis 126 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
alternativa (H1 > 44.quintales por manzana).Se concluye que el rendimiento es mayor de 44 quintales por manzana, por tanto se recomienda el uso del nuevo fertilizante. Ejemplo 2: Suponga que una empresa tiene una cantidad muy grande de cuentas por cobrar y que los saldos de esas cuentas tienen aproximadamente una distribución normal. En los libros de la empresa aparece registrado un saldo promedio de C$ 25, 850.
Un auditor, utiliza muestreo estadístico para seleccionar una muestra de 100 cuentas, donde se obtuvo un saldo promedio de C$ 27,550 y una desviación estándar de C$ 1,200 ¿Debe el auditor concluir que el saldo es distinto a C$ 25, 850 y que por lo tanto debe hacer un asiento de ajuste al valor en libros a un nivel de significancia del 2%?
Solución Paso 1.
H0:
H1:
≠ 25,850
= 25,850
Hipótesis nula Hipótesis alternativa Es prueba de dos colas pues la hipótesis
alternativa dice “distinto que”. O sea que Paso 2.
= 0.02
Z =
puede ser mayor o puede ser menor.
x−
n
Paso 3.
Paso 4. Z = 2.33
Muestra grande (n > 30) Población infinita.
(Valor crítico)
2
Reglas de decisión Si Z < - 2.33 se rechaza H0
- 2.33 R
0 A
2.33 R
Si - 2.33 < Z <2.33 se acepta H0 Si Z > 2.33 se rechaza H0 127 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Z=
27,550 − 25,850 1,200 100
1,700 Z = 120
Z = 14.1667
Paso 5. Puesto que Z = 14.1667 >2.33 cae en la región de rechazo. Se rechaza la hipótesis nula H0 (que dice que el saldo promedio es de C$ 25,850) y se acepta la hipótesis alternativa (H1 el saldo promedio es distinto que C$ 25,850) Se concluye que el auditor debe hacer un asiento de ajuste al valor en libros.
Ejemplo 3: Suponga que se tiene un proceso de producción de llenado de cajas de cereal el cual se supone que el peso neto de cereal en las cajas tiene una distribución normal y que además proporciona un peso promedio de real en las cajas de 3 libras. Puesto que este proceso está sujeto a inspecciones periódicas por parte de la Oficina local de protección a los consumidores, quienes únicamente les interesa la “falta de peso “en los productos. Se tomó una muestra aleatoria de 6 cajas obteniendo los siguientes pesos en libras:
1.85, 2.10,
1.95,
1.83, 2.18, 1.97
¿Existe suficientes evidencia para decir que el
proceso no está funcionando correctamente a un nivel de significación del 1%?
Solución. Paso 1.
Paso 2.
H0:
H1:
<2
= 0.01
t= Paso 3
= 2 libras libras
x− s n
Paso 4. t = - 3.365
El proceso está funcionando correctamente. El proceso no está funcionando correctamente.
Muestra pequeña (n < 30) población infinita.
(Valor crítico) 128
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Reglas de decisión
- 3.365
Si Z < - 3.365 se rechaza H0
R
0 A
Si Z > - 3.365 se acepta H0 G. L. = n – 1 = 6 – 1 = 5 Se busca en la tabla t student (Fila 5 columna de 0.01)
t=
1.98 − 2 0.1377 6
t = - 0.355
Paso 5. Como t = - 0.355 > - 3.365 cae en la región de aceptación. Se dice que no hay suficiente evidencia para rechazar la hipótesis nula H 0:
= 2. Se concluye que el proceso de
producción está funcionando correctamente.
Prueba para la diferencia de dos medias con muestras independientes. El estadístico de prueba es:
Z=
(x
1
− x 2 ) − ( 1 − 2 ) 2
2
S1 S + 2 n1 n2
Ejemplo 4: Una organización deportiva desea conocer si el tiempo promedio que requieren los hombres para jugar los 18 hoyos de golf es diferente al de las mujeres. Se mide el tiempo de 50 partidos para hombres y 45 para mujeres obteniendo los siguientes datos.
Hombres
n1 = 50
Mujeres
n2 = 45
X 1 = 3.5 horas
X
S1 = 0.9 horas
S2
2
= 4.9 horas = 1.5 horas
Pruebe la hipótesis al nivel de significación del 5%. 129 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Solución. Paso 1.
Paso 2.
H0:
h
H1:
h ≠ m
=
m
.
= 0.05
Paso 3. Z =
(x
1
− x 2 ) − ( 1 − 2 ) 2
2
S1 S + 2 n1 n2
Paso 4. Z = 1.96
(Valor crítico)
2
Reglas de decisión
-1.96
Si Z < - 1.96 se rechaza H0
R
0
1.96
A
R
Si - 1.96 < Z <1.96 se acepta H0 Si Z > 1.96 se rechaza H0
Z=
(x
1
− x 2 ) − ( 1 − 2 ) 2
2
Z=
(3.5 − 4.9) − (0 − 0)
S1 S + 2 n1 n2
0.9 2 1.52 + 50 45
Z = - 5.44
Paso 5. Dado que el valor de Z = - 5.44 < - 1.96 cae en la región de rechazo. Debido a que la hipótesis nula de igualdad es rechazada,
xm xh ,
la evidencia sugiere que las
mujeres toman más tiempo en promedio. Vale la pena notar también que el valor P relacionado con la prueba es virtualmente, igual a cero.
Ejemplo 5: Se está estudiando la durabilidad de dos tipos de amortiguadores de caucho para coches de bebé. De una población se tomó una muestra de 13 unidades de la cual se obtuvo una duración media de 11.3 semanas con una desviación estándar de 3.5 semanas. De otra población se tomó una muestra de 10 unidades donde se obtuvo una duración media de 7.5 semanas y una desviación estándar de 2.7 semanas.
¿Hay diferencias en las duraciones de los 130
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
amortiguadores para ambas poblaciones? Pruebe la hipótesis con un nivel de significación de 0.02
Solución: Como se trata de muestras pequeñas y las varianzas poblacionales no son iguales, los grados de libertad se calculan con la siguiente fórmula
GL =
S1 2 S 2 2 n + n 2 1 2
2
2
S1 S2 n n 1 + 2 n1 − 1 n2 − 1 2
2
GL =
3 .5 2 2 .7 2 + 10 13 2
2
3 .5 2 .7 13 10 + 13 − 1 10 − 1 2
2
2
GL =
2.793269402 GL = 20.995 0.133044315
GL = 21 Paso 1.
Paso 2.
H0:
h
H1:
h ≠ m
= 0.02
Paso 3. t =
(x
1
=
m
− x 2 ) − ( 1 − 2 ) 2
2
S1 S + 2 n1 n2 Paso 4. GL = 21
2
=
0.02 = 0.01 El valor crítico es: 2.518 (tabla t student). 2
Reglas de decisión Si t < - 2.518 se rechaza H0
-2.518 R
0
2.518
A
R
Si - 2.518 < t <2.518 se acepta H0 Si t > 2.518 se rechaza H0
131 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
t=
(x
1
− x 2 ) − ( 1 − 2 ) 2
2
t=
(11.3 − 7.5) − (0 − 0)
S1 S + 2 n1 n2
t = 2.93.9
3 . 5 2 2 .7 2 + 13 10
t = 2.94
Paso 5. Puesto que el valor de t = 2.94 > 2.518 cae en la región de rechazo. Se acepta la hipótesis alternativa Debido a que la hipótesis nula de igualdad es rechazada,
x 1 x 2 , la evidencia sugiere
que el tipo I de amortiguador de caucho para el coche de bebé presenta mayor durabilidad.
Prueba acerca de las proporciones El estadístico de prueba que se usa es: Z=
Z=
Ps − Po
Po (1 − Po ) n Ps − Po Po (1 − Po ) N − n n N −1
Si la población es infinita y n > 30
Si la población es finita y n > 30
Ps es la proporción de casos de la muestra.
Ps =
x n
Ejemplo 6: Una empresa tiene 1,500 cuentas por cobrar. En los libros de la empresa aparece registrado que sólo el 2% de los documentos no satisfacen los requisitos establecidos. Un auditor selecciona una muestra aleatoria de 300 y verifica que 12 no satisfacen los requisitos establecidos. ¿Hay evidencia suficiente para que el auditor declare a un nivel de significación del 1% que más del 2% de las cuentas no satisfacen los requisitos establecidos por la institución?. Solución Paso 1. H0: P0 = 0.02 Declarar que el 2% de las cuentas no satisfacen los requisitos. H1: P0> 0.02 Declarar que más del 2% de las cuentas no satisfacen los requisitos 132 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Paso 2.
= 0.01
Ps − Po Po (1 − Po ) N − n n N −1
Paso 3. Z =
Paso 4.
Z = 2.33
Población finita y muestra grande.
(Valor crítico)
Reglas de decisión
0
Si Z < 2.33 se acepta H0
2.33
A
R
Si Z > 2.33 se Rechaza H0
Ps =
Z=
x 12 = 0.04 Ps = 300 n 0.04 − 0.02 0.02(1 − 0.02) 1500 − 300 300 1500 − 1
Z = 2.765
Paso 5. Puesto que Z = 2.765 >2.33 cae en la región de rechazo. Se rechaza la hipótesis nula H0 (que dice que el 2% de las cuentas no satisfacen los requisitos) y se acepta la hipótesis alternativa (H1que más del 2% de las cuentas no satisfacen los requisitos)Se concluye que el auditor debe declara que más del 2% de las cuentas no satisfacen los requisitos institucionales.
Nota: El factor de corrección
N −n n puede omitirse si el cociente < 0.05 N −1 N
En este caso no es posible omitirlo puesto que
n 300 = = 0.20 0.05 N 1500 133
MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Prueba para la diferencia de dos proporciones El estadístico de prueba que se usa es: Z=
(P1 − P2 ) − ( 1 − 2 ) P1 (1 − P1 ) P2 (1 − P2 ) + n1
n2
Ejemplo 7: Un minorista desea probar la hipótesis de que la proporción de sus clientes masculinos quienes compran a crédito es igual a la proporción de mujeres que utilizan el crédito. Para tal fin, seleccionó una muestra de 100 clientes hombres y encontró que 57 compraban al crédito, mientras que una muestra de 110 clientes mujeres, 52 lo hicieron. Pruebe la hipótesis de que la proporción de hombres que compran al crédito, es la misma que la proporción de las mujeres a un nivel de significación del 1%.
Solución: Paso 1. H0: h = m . H1: h ≠ m
Paso 2.
Paso 3
Z=
= 0.01
(P1 − P2 ) − ( 1 − 2 ) P1 (1 − P1 ) P2 (1 − P2 ) + n1
Paso 4.
P1 =
Z = 2.58
57 100
n2
P1 = 0.57
P2 =
52 110
P2 = 0.473
(Valor crítico)
2
134 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
R - 2.58
A
2.58
R
Reglas de decisión Si Z <- 2.58 se rechaza H0 Si - 2.58 < Z < 2.58 se acepta H0 Si Z > 2.58 se rechaza H0
Z=
(0.57 − 0.473) − (0 − 0) 0.57(1 − 0.57) 0.473(1 − 0.473) + 100
Z=
0.097 0.002451+ 0.0022661
Z = 1.4123
110
Paso 5. Puesto que Z = 1.41 está entre - 2.58 y 2.58 cae en la región de aceptación. Se acepta a hipótesis nula H0 (que dice que la proporción de clientes masculinos es igual a la proporción de clientes femeninos que compran al crédito).
Ejercicio (7) 1) Suponga, según registros históricos de la industria de la langosta en Nicaragua, que la captura de langosta por trampa tiene una distribución normal con un promedio de 30.31 libras, sin embargo, debido a protección y conservación de estas especies por las medidas gubernamentales, este promedio se ha disminuido notablemente. Una muestra aleatoria de 10 trampas para langostas, desde que la restricción entró en vigor, proporciona los siguientes resultados: 17.4, 33.7,
37.2,
27.5,
41.7,
18.9,
39.6,
34.4,
19.6,
24.1 libras.
¿Ha disminuido la captura promedio de la langosta por trampa a un nivel de significación del1?
2) El rendimiento promedio de maíz en las plantaciones hace un tiempo era de 50 quintales por manzana con una desviación estándar de 4 quintales por manzana. Se utilizó un nuevo fertilizante a un grupo de 52 plantaciones seleccionadas al azar obteniendo un rendimiento promedio de 55 quintales por manzana. Suponiendo que 135 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
la desviación estándar de los rendimientos con el nuevo fertilizante sigue siendo la misma, ¿Se puede afirmar que ha habido un incremento significativo en el rendimiento? Use un nivel de significación del 5%.
3) Un vendedor de neumático está interesado en comprar unidades cuya duración promedio sea mayor de 15,000 millas. Una firma productora le informa que posee neumáticos que cumplen con este requisito. El vendedor selecciona una muestra aleatoria de 25 unidades y determina que la media X = 25, 000 millas y una varianza S2
= 625,000 millas2.Suponga que la duración de los neumáticos sigue una
distribución normal, ¿Habrá acuerdo entre la firma productora y el vendedor a un nivel de significación del 10?
4) El gerente de una Compañía financiera se queja de que el 7% de los pagos parciales de pestanos hechos a consumidores no se cubren a tiempo, ¿Podríamos afirmar que esa cifra es diferente, si 80 de 1,500 pagos de préstamos no se hacen a tiempo? Utilice un nivel de significación del 1%.
5) Un nuevo sistema de capacitación a los empleados de una fábrica asegura que proporciona un rendimiento promedio de 75 puntos. En una muestra aleatoria de 10 estudiantes se comprobó que las calificaciones fueron:70, 90,
60,
80,
75,
55,
65,85,
75,55. Suponga que la distribución de las calificaciones es normal.
¿Podemos decir que el nuevo sistema no alcanza el rendimiento promedio que asegura?.Use un nivel de significación del 5%.
6) Muestras de tamaño 50 y 60 revelan medias de 512 y 587 con desviaciones estándar de 125 y 145 respectivamente. A un nivel del 2% pruebe la hipótesis de que m 1 = m2.
136 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
7) A un nivel del 1% pruebe la igualdad de las medias si muestras de tamaño 10 y 8 dan medias de 36 y 49 y desviaciones estándar de 12 y 18, respectivamente. Se asume que las varianzas no son iguales.
8) Resuelva el problema anterior asumiendo ahora que las varianzas son iguales.
9) Muestras de tamaño 120 y 150 produjeron proporciones de 0.69 y 0.73 Pruebe la igualdad de proporciones de la población al nivel del 5%.
10) Dos muestras de tamaño 500 cada una se utilizaron para probar la hipótesis de que H0: 1 2 las proporciones muestrales son 14% y 11%...A un nivel del 10% ¿Cuál es su decisión?
137 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Bibliografía Alvir Videa, I. d. (2015). Dossier de Estadísica y Probabilidades . Estelí, Nicaragua . Córdoba Zamora , M. (2003). Estadística Descriptiva e Inferencial - Aplicaciones (5ta Ed ed.). Lima, Perú: MOSHERA S.R.L. Merli, G. (2015). Escalas de medición en Estadística. Sistema de Información CientíficaRed de Revistas Científicas de América Latina y el Caribe, España y Portugal, 243-246. Navarro Hudiel, S. J. (2018). Estadística (Teoría de Probabilidades y más). Estelí, Nicaragua: UNIVERSIDAD NACIONAL DE INGENIERÍA Recinto Universitario Augusto C. Sandino. Ruiz Muñoz, D. (2004). Manual de estadística. Sevilla, españa: Universidad Pablo de Olavide. Universidad Nacional Autónoma de Nicaragua UNAN MANAGUA. (2013). Programa de Asignatura Estadística y Probabilidads. Managua, Nicaragua : UNAN MANAGUA . Wackerly, D. D., Mendenhall, W., y Scheaffer, R. L. (2010). Estadística Matemática con Aplicaciones (7ma Ed ed.). México DF: Cengage Learning Editores, S.A.
138 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Solucionario de Ejercicios Propuestos Conceptos fundamentales de estadística descriptiva Pág. 11 - 13
a)
b) Cuantitativa – Continua c)
Ejercicio 1.1 Población: las personas que sufren hipertensión. Muestra: 5000 Ejercicio 1.2 Variable Nominal
Cuantitativa – Discreta Cualitativa – nominal
d) Cuantitativa – Discreta e)
Cualitativa – Nominal
f)
Cuantitativa – Continua
g) Cualitativa – Nominal h) Cuantitativa – Discreta i)
Cualitativa – Ordinales
j)
Cuantitativa – Continua
▪
Estado Civil
k) Cuantitativa – Continua
▪
Nacionalidad
l)
▪
La profesión de un grupo de personas
m) Cuantitativa – Continua
▪
Lugar de nacimiento
n) Cualitativa – Ordinal
Cualitativa – Nominal
o) Cuantitativa – Discreta Variable Ordinal
p) Cuantitativa – Discreta
▪
La nota en un examen
q) Cualitativa – Nominal
▪
Grado de escolaridad
r)
Cuantitativa – Discreta
▪
El número de carnet de los estudiantes
s)
Cuantitativa Continua
matriculados en la Universidad
t)
Cualitativa – Ordinales
Intensidad de dolor
u) Cuantitativa – Discreta
▪
v) Cualitativa – Ordinales Variable Discreta ▪
Ejercicio 1.4 Cantidad de estudiantes por aula en los distintos niveles educativos
a)
▪
Número de maestros en un aula
b) Ordinales
▪
Número de aulas de FAREM-Estelí
c)
▪
Número de teléfonos móviles por familia
d) Nominal
Variable Continua
De razón
De razón
e)
Ordinal
f)
Nominal
▪
Peso
g) Nominal
▪
Edad
h) De Intervalo
▪
La distancia de una carretera
i)
Nominal
▪
Temperatura
j)
Nominal
Ejercicio 1.3
139 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Tablas de Frecuencias
Ejercicio 1.7
Ejercicio 1.5
Se agrupan los datos en una tabla de frecuencia para posteriormente
Clase 16 - 17 18 - 19 20 - 21 22 - 23 24 - 25 26- 27 Σ
f 5 11 10 9 3 2 40
fa 5 16 26 35 38 40
fr 0.125 0.275 0.25 0.225 0.075 0.05 1
fr% 12.5 27.5 25 22.5 7.5 5 100
fra 0.125 0.4 0.65 0.875 0.95 1
fra% 12.5 40 65 87.5 95 100
Limites Reales 15.5 – 17.5 17.5 – 19.5 19.5 – 21.5 21.5 – 23.5 23.5 – 25.5 25.5 – 27.5
Xi 16.5 18.5 20.5 22.5 24.5 26.5
representarlos en el histograma.
Ejercicio 1.6 Se recogen en primer lugar los datos en una tabla de frecuencias, para posteriormente representarlos en el diagrama de barras. xi
f
0
3
1
17
2
17
3
6
4
7
Ejercicio 1.8
139 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ejercicio 1.9 a)
Ejercicio 1.12
La serie ordenada de los 9 datos es: 1, 3, 7, 14, 16, 30, 99, 120, 2,000.
La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos
Me: 60,67 Mo: 61,43 X: 60,4
cada uno. Esto es, Me = 16. Ejercicio 1.13 b) La serie ordenada de los 8 datos es: 2.2 3, 11, 29, 30, 36, 77, 300, 10,000. UNIDAD II PROBABILIDADES La mediana en este caso, puede ser cualquier número situado entre 30 y 36, ya que este dividirá a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la infinidad de valores, se elige como mediana la
Ejercicios Pág. 62 1.
semisuma de los dos valores centrales. Esto es, Me = (30 + 36) / 2 = 33 . a)
0,60
b) 0,25
Ejercicio 1.10
c)
0,34
a) es igual a 7. Esta serie de datos es unimodal b) es igual tanto a 3, como a 5. Esta serie de datos es bimodal. c) no existe. (También vale decir que cada uno de los datos es una moda). 2) 0,52 3) 0,64
5
(b) 1) 0,48
Ejercicio 1.11
x=
11. Pág. 64
f i xi
i =1
20
=
44 = 2.2. 20
4) 0,36
140 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
Ejercicios Pág. 69
32) 38/63 33) 30 rutas
Permutaciones
34) 560 560 13) 7 560
35) 0,03226
14) a) 720
b) 72
c) 144
38) a) 14/39
b) 95/112
15) 4 896. Ejercicios pág. 97
16) 103 680
Variable aleatoria y distribución híper-geométrica
Reglas de adición y de multiplicación 17) a) 1 213 056 18) a) 24
2) 5/14
b) 233 280
b) 576
c) 360
3) .
Combinaciones 19) a) 286 b) 165 c) 110
4 2 x 3 − x a) P( x, 6, 3, 4 ) = 6 3
b) 4 / 5
21) 5 775 Distribución Binomial
22) 15 23) a) 45
b) 24 c) 21.
7) a) 0,6155
c) 0,1484
= 1.677 8) R/ = 3.75 3.75 ± 2(1.677) = (0.396, 7.104) 10) 0,3134
Otros Problemas variados 24) a) 3/8
b) 0,4613
b) 19/40
12) 0,0515
26) 1/4 27) a) 0,3
b) 0,2
28) a) 2/3
b) 1/15
Distribución normal
c) 7/15
d) 8/15 17) 0,0808
29) 2/5 30) a) 0,4
b) 0,7
c) 0,7
d) 0,3
31) a) 0,6
b) 0,7
c) 0,4
d) 0
18) 4,56 % 19) a) 0,0062
b) 0,6826
c) 9,969 centímetros
141 MS.c Cliffor Jerry Herrera castrillo
Estadística y Probabilidades – II Año de Física Matemática
20) a) 0,0571 21) a) 56,99 %
b) 99,11%
c) 0,3974
d) 27,952 min
b) $ 10,23
22) 6,24 años
142 MS.c Cliffor Jerry Herrera castrillo