Estadística Y Probabilidades

Page 1


Facultad Regional Multidisciplinaria de Estelí FAREM ESTELÍ Recinto Universitario “Leonel Rugama Rugama” Departamento de Ciencias de la Educación y Humanidades 2019: Año de la Reconciliación

Estadística y Probabilidades Física Matemática II Año

Elaborado: M.Sc. Cliffor Jerry Herrera Castrillo

18 de mayo 2019


Índice Introducción _____________________________________________________________ 1 Unidad I. Estadística Descriptiva ____________________________________________ 2 Conceptos fundamentales de la estadística descriptiva ________________________ 3 Reseña histórica de la estadística ________________________________________ 3 Utilidad e importancia ________________________________________________ 4 Estadística __________________________________________________________ 4 Población y muestra __________________________________________________ 5 Población _________________________________________________________ 5 Muestra ___________________________________________________________ 6 Variable ____________________________________________________________ 6 Tipos de Variables __________________________________________________ 7 Medición y escalas de medidas __________________________________________ 8 Distribución de frecuencias _____________________________________________ 13 Procedimiento a seguir en un estudio estadístico __________________________ 13 Tabla para datos no agrupados ________________________________________ 13 Tabla para datos agrupados ___________________________________________ 14 Tipos de Gráficos _____________________________________________________ 19 Medidas de tendencia central ___________________________________________ 28 Datos no agrupados __________________________________________________ 28 Datos agrupados ____________________________________________________ 31 Formas de la distribución _______________________________________________ 34 Medidas de variabilidad o dispersión _____________________________________ 35 Datos agrupados. ____________________________________________________ 35 Medidas de posición ___________________________________________________ 39 Coeficiente de curtosis (K) ______________________________________________ 41 Unidad II. Probabilidades _________________________________________________ 49 Definiciones __________________________________________________________ 51


Probabilidades ______________________________________________________ 51 Experimento ________________________________________________________ 51 Espacio Muestral ____________________________________________________ 52 Suceso aleatorio _____________________________________________________ 53 Suceso elemental ____________________________________________________ 54 Suceso compuesto ___________________________________________________ 54 Algunas definiciones y operaciones con conjuntos _________________________ 54 Definición clásica de probabilidad (modelo clásico o a priori) _________________ 55 Tipos de probabilidad __________________________________________________ 56 Sucesos independientes _________________________________________________ 58 Sucesos dependientes __________________________________________________ 58 Probabilidad condicional _______________________________________________ 58 Regla de la multiplicación ______________________________________________ 59 Probabilidad total _____________________________________________________ 61 Regla de Bayes ________________________________________________________ 61 TECNICAS DE CONTEO ______________________________________________ 65 La distribución acumulada ____________________________________________ 77 Valor esperado ______________________________________________________ 78 Varianza ___________________________________________________________ 79 Distribución geométrica ______________________________________________ 80 Distribución híper – geométrica________________________________________ 81 Teorema de Chebyshev _______________________________________________ 82 Distribución híper – geométrica multii - variada __________________________ 83 La distribución binomial _______________________________________________ 85 Proceso de Bernoulli _________________________________________________ 85 Distribución binomial ________________________________________________ 85 Media, varianza y desviación estándar de la distribución binomial _________ 86 Distribución binomial negativa. ________________________________________ 87


La distribución de Poisson ______________________________________________ 87 Media, varianza y desviación estándar de la distribución de Poisson ________ 89 La distribución normal _________________________________________________ 90 Áreas bajo la curva normal ___________________________________________ 90 Estandarización _____________________________________________________ 91 Uso de la tabla ______________________________________________________ 91 Unidad III. Estadística inferencial _________________________________________ 104 Muestreo ___________________________________________________________ 105 Conceptos básicos __________________________________________________ 105 Ventajas del muestreo ______________________________________________ 107 1.

Rapidez y bajo costo de la información requerida __________________ 107

2.

Es un procedimiento práctico cuando la población es muy grande o infinita 107

3.

Evita la destrucción de toda la población__________________________ 107

Métodos de muestreo _______________________________________________ 108 Muestreo no probabilístico _________________________________________ 108 Muestreo probabilístico. _____________________________________________ 109 Tipos de muestreo probabilístico ______________________________________ 109 Muestreo aleatorio simple __________________________________________ 109 Muestreo aleatorio sistemático ______________________________________ 111 Estimación __________________________________________________________ 113 Precisión y exactitud de un estimador __________________________________ 113 Errores de muestreo ________________________________________________ 114 Errores ajenos al muestreo _________________________________________ 114 Propiedades de une estimador ________________________________________ 114 Estimador por intervalos de confianza._________________________________ 115 Intervalo de confianza para la media __________________________________ 119 Prueba de hipótesis

___________________________________________________ 123

Tipos de hipótesis

__________________________________________________ 123


Pruebas de una cola (o unilaterales) __________________________________ 125 BibliografĂ­a ___________________________________________________________ 138 Solucionario de Ejercicios Propuestos ______________________________________ 139


Estadística y Probabilidades – II Año de Física Matemática

Introducción La Matemática es lógica, precisa, rigurosa, abstracta, formal y bella. Representa un saber escalonado, donde cada etapa es necesaria para afrontar la siguiente. Esta ciencia fortalece el pensamiento crítico para entender mejor el entorno, desarrolla la lógica de pensamiento para la toma de decisiones. Por tanto, contribuye al desarrollo de las inteligencias, los sentimientos y la personalidad. En la carrera de Física – Matemática la asignatura de Estadística y Probabilidad tiene como asignatura precedente a Matemática General y como asignaturas consecuentes a Metodología de la Investigación e Investigación Aplicada. Su propósito es contribuir a fundamentar las técnicas estadísticas y probabilísticas utilizadas en las investigaciones de enfoque cuantitativo o positivistas. Actualmente nos encontramos con un crecimiento progresivo de ciencias interdisciplinarias, que armonizan diversas ramas del saber en una sola. Así, se habla de bioestadística, psicología matemática, etc. De manera similar con la asignatura de Estadística y Probabilidad estamos integrando los conocimientos pedagógicos adquiridos sobre la enseñanza de la Física - Matemática y las herramientas estadísticas para enfrentar los procesos de enseñanza aprendizaje de la matemática y la investigación en el campo educativo, auxiliándonos de la calculadora y un determinado paquete estadístico para la interpretación de resultados. (Universidad Nacional Autónoma de Nicaragua UNAN MANAGUA, 2013) Esperó que este módulo pueda contribuir a tu formación profesional con una concepción científica y humanista, capaz de interpretar los fenómenos sociales y naturales con un sentido crítico, reflexivo y propositivo.

1 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Unidad I. Estadística Descriptiva Objetivos de la asignatura Objetivos Conceptuales ▪

Conocer los conceptos y definiciones fundamentales de estadística descriptiva.

Objetivos Procedimentales ▪

Aplicar los conceptos y definiciones fundamentales de la estadística descriptiva en la resolución de problemas de la vida cotidiana.

Objetivos Actitudinales ▪

Valorar la importancia de la Estadística Descriptiva como instrumento para la solución de problemas de su entorno social.

Contenidos Conceptuales Conceptos

Contenidos Procedimentales Contenidos Cognitivos

fundamentales Aplicación de los conceptos Valoración

de la estadística descriptiva Reseña

histórica

estadística,

de

población

muestra.

y

definiciones importancia

la fundamentales

de

de

la

de

la

la estadística descriptiva como

y estadística descriptiva en la instrumento

para

la

Variables. resolución de problemas de solución de problemas de su

Medición

y

escalas

de la vida cotidiana.

entorno social.

medidas. Distribución de

Participación activa en la

frecuencias.

Tipos

resolución

Gráficos.

Percentiles.

Medidas central.

de

de

de

problemas

basados en la realidad.

Tendencias

Medidas

de

variabilidad.

2 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Conceptos fundamentales de la estadística descriptiva Reseña histórica de la estadística Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia de guerrera. Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas.

3 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Utilidad e importancia Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.

Estadística La palabra estadística se emplea en una gran variedad de formas. En plural se emplea como sinónimo de dato. El trabajo estadístico o la investigación estadística es un proceso que pasa generalmente por las siguientes etapas: ▪

Formulación del problema o la tarea

Diseño del experimento

Recopilación de los datos

Clasificación, tabulación y descripción de datos

Generalización o inferencia

Definición: en este documento se define estadística como, la ciencia que proporciona un conjunto de métodos, técnicas o procedimientos para: -

recopilar

-

organizar (clasificar, agrupar),

-

presentar, y

-

analizar,

datos con el fin de describirlos o realizar generalizaciones válidas. La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la estadística descriptiva y la inferencial. 4 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Se denomina estadística descriptiva, al conjunto de métodos estadísticos que se relacionan con el resumen y descripción de los datos, como tablas, graficas, y el análisis mediante algunos cálculos. Se denomina inferencia estadística al conjunto de métodos con los que se hace la generalización o inferencia sobre una población utilizando una muestra. La inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que éstas sean dadas con una medida de confiabilidad que es la probabilidad. Estas dos partes de la estadística no son mutuamente excluyentes, ya que para utilizar los métodos de la inferencia estadística, se requiere conocer los métodos de la estadística descriptiva.

Población y muestra Población Definición. En forma general, en estadística; se denomina población, a un conjunto de elementos (que consiste de personas, objetos…), que contienen una o más características observables de naturaleza cualitativa o cuantitativa que se pueden medir en ellos. A cada elemento de una población se denomina unidad elemental o unidad estadística. Por ejemplo, los empleados de una empresa en un día laborable, constituyen una población en la que cada empleado (unidad estadística), tiene muchas características a ser observadas, como por ejemplo: Género, estado civil, lugar de procedencia, grado de instrucción, etc. (características cualitativas), o número de hijos, ingresos mensuales, etc. (características cuantitativas). El resultado de medir una característica observable de una unidad elemental, se denomina dato estadístico o valor observado o simplemente observación. Por otra parte, la población; viene definida por la tarea o investigación estadística a realizarse. Y

como la

medición o conteo

de la característica especificada por la

investigación se hace a cada unidad elemental, se puede considerar a la población como la totalidad de valores

posibles de una característica particular especificada por la

investigación estadística. En este sentido la población consiste de un conjunto de datos 5 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

estadísticos que se reúnen de acuerdo con la formulación de una investigación estadística o con la definición de la población específica. Parámetro: Se denomina parámetro a una medida descriptiva que resuma una característica de la población, tal como la media (  ) o la varianza (  2 ), calculada a partir de los datos observados de toda la población. Tipos de población: Por el número de elementos que la componen, la población se clasifica en finita o infinita. La población es finita si tiene un número finito de elementos. En caso contrario la población es infinita. En la práctica una población finita con un número grande de elementos se considera como una población infinita. Muestra Después de definir la investigación estadística a realizar, se debe decidir entre investigar toda la población o sólo una parte de ella. El primer procedimiento es denominado censo y el segundo es llamado muestreo. Definición. Se denomina muestra a una parte de la población seleccionada de acuerdo con un plan o regla, con el fin de obtener información acerca de la población de la cual proviene. La muestra debe ser seleccionada de manera que sea representativa de la población. Un método de selección de muestras representativas es al azar simple, esto es, cada elemento de la población tiene la misma posibilidad de ser seleccionada para la muestra. Estadística o estadígrafo. Se denomina estadística a una medida descriptiva que resuma una característica de la muestra, tal como la media ( x ) o la varianza ( s 2 ) calculada a partir de los datos observados de una muestra aleatoria. Es importante tener en cuenta, si el análisis estadístico se está haciendo con una muestra o con una población. En ambos casos las medidas descriptivas son las mismas. Para diferenciarlos, los parámetros de la población, se representan por letras griegas.

Variable Es una característica que toma distintos valores cuando se observa en diferentes individuos.

6 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Se denomina variable estadística a una característica definida en la población por la tarea o investigación estadística, que puede tomar dos o más valores (cualidades o números). Se representa por una letra del alfabeto. Por ejemplo, en la población constituida por los empleados de la universidad, algunas variables estadísticas definidas en ésta población son: X: "Género". Valores: Masculino, Femenino Y: "estado civil". Valores: Soltero, casado, viudo, divorciado Z: "número de hijos", Valores: 0,1,2, etc. W: "ingresos mensuales", Valores: Números reales positivos. Ejemplo: El peso de un embarque, la rapidez de una impresora, el número de artículos defectuosos que se elaboran en una fábrica, la calidad de café que se produce en Nicaragua, etc. Tipos de Variables Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición existen

dos tipos de variables: Variable cualitativa Son aquellas que se ordenan en categorías debido a su carácter subjetivo y absoluto. Pueden ser de dos tipos nominales y ordinales. -

Variables nominales

Los valores no pueden ser sometidos a criterios de orden o importancia. Ejemplo: “El sexo de una persona”, La nacionalidad, etc. -

Variables ordinales

Las variables pueden tomar distintos valores ordenados siguiendo una escala estadística. Clasifica a los elementos en distintas categorías. . Ejemplo: Los estratos sociales, (baja, media alta) La satisfacción al adquirir un artículo (No me gusta, es regular, bueno, muy bueno, excelente).

7 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Variable cuantitativa Son las que sus características están expresadas en valores numéricos. Se dividen en continuas y en discretas. -

Variables continuas

Pueden adquirir cualquier valor dentro de un intervalo especificado. Resultan del proceso de medición. Ejemplo; La estatura de una persona, los ingresos mensuales de los trabajadores, el consumo de energía eléctrica en un centro de trabajo, la duración de una llamada telefónica, Etc. -

Variables discretas

Los valores de las variables son enteros y resultan del proceso del conteo. Ejemplo: El número de letras de una palabra, el número de estudiantes que asistieron hoy a clases, el número de llamadas telefónicas registradas en un teléfono celular, etc.

Medición y escalas de medidas La medición puede definirse como la asignación de números a objetos y eventos de acuerdo con ciertas reglas; la manera como se asignan esos números determina el tipo de escala de medición. Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema se transforma en explicitar a) las reglas para asignar números b) las propiedades matemáticas de las escalas resultantes c) las operaciones estadísticas aplicables a las medidas hechas con cada tipo de escala. Las escalas de medición se clasifican en cuatro grupos: escala nominal, ordinal, intervalo y escala de razón. Escala nominal. El nivel nominal de medición, describe variables de naturaleza categórica que difieren en cualidad más que en cantidad. Ante las observaciones que se realizan de la realidad, es posible asignar cada una de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta 8 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

en función de los deseos o conveniencia del investigador. Este nivel de medición es exclusivamente cualitativo y sus variables son por lo tanto cualitativas. Por ejemplo, los sujetos que son del curso de A de 2º de eso y los de B generan dos grupos. Cada sujeto se asigna a un grupo, y las variables son de tipo cualitativo (de cualidad) y no cuantitativo puesto que indica donde está cada sujeto y no "cuanto es de un curso y no de otro". En este ejemplo los números 2 y 3 pueden sustituir las letras A y B, de forma que 2 y 3 son simples etiquetas que no ofrecen una valoración numérica sino que actúan como nominativos. En esta escala hay que tener en cuenta dos condiciones: No es posible que un mismo valor o sujeto esté en dos grupos a la vez. No se puede ser de 2º y 3º a la vez. Por lo tanto este nivel exige que las categorías sean mutuamente excluyentes entre sí. Los números no tienen valor más que como nombres o etiquetas de los grupos. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número es para identificar. Un número no tiene mayor valor que otro. Un ejemplo son los números de las camisetas de los jugadores de un equipo de béisbol. El número mayor no significa que tiene el mayor atributo que el número menor, es aleatorio o de capricho personal a quien otorga el número. Para el procesamiento de datos, los nombres pueden ser remplazados por números, pero en ese caso el valor numérico de los números dados es irrelevante. Los números se usan como identificadores o nombres. La operación matemática permitida es el conteo. Ejemplos de medidas nominales son algunas de estas variables: estado marital, género, raza, credo religioso, afiliación política, lugar de nacimiento, el número de seguro social, el sexo, los números de teléfono, entre otros. Escala ordinal: Surge a partir de la operación de ordenamiento; en esta escala se habla de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto está cerca o lejos del segundo puesto. Los valores de la escala representan categorías o grupos de pertenencia, concierto orden asociado, pero no una cantidad mensurable. La escala ordinal tiene las propiedades de identidad y magnitud. Los números representan una cualidad que se está midiendo, y expresan si una observación tiene más de la cualidad medida que otra. La 9 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

distancia entre puntos de la escala no es constante: no se puede determinar la distancia entre las categorías, sólo es interpretable el orden entre sus valores. Ejemplos: situación socioeconómica, nivel educativo. Escala de intervalos. Esta escala representa magnitudes, con la propiedad de igualdad de la distancia entre puntos de escala de la misma amplitud. Aquí puede establecerse orden entre sus valores, hacerse comparaciones de igualdad, y medir la distancia existente entre cada valor de la escala. El valor cero de la escala no es absoluto, sino un cero arbitrario: no refleja ausencia de la magnitud medida, por lo que las operaciones aritméticas de multiplicación y división no son apropiadas. Cumple con las propiedades de identidad, magnitud e igual distancia. La igual distancia entre puntos de la escala significa que puede saberse cuántas unidades de más tiene una UO comparada con otra, con relación a cierta característica analizada. Por ejemplo, en la escala de temperatura centígrada puede decirse que la distancia entre 25° y 30°C es la misma que la existente entre 20° y 25° C, pero no puede afirmarse que una temperatura de 40° C equivale al doble de 20° C en cuanto a intensidad de calor se refiere, debido a la ausencia de cero absoluto. Escala de razón. Corresponde al nivel de medición más completo. Tiene las mismas propiedades que la escala intervalos, y además posee el cero ab- soluto. Aquí el valor cero no es arbitrario, pues representa la ausencia total de la magnitud que se está midiendo. Con esta escala se puede realizar cualquier operación lógica (ordenamiento, comparación) y aritmética. A iguales diferencias entre los números asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Ejemplos: longitud, peso, distancia, ingresos, precios. Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo, la velocidad; el cero significa ausencia de movimiento. Otros ejemplos de variables racionales son la edad, y otras medidas de tiempo. En otras palabras, la escala de razón comienza desde el cero y aumenta en números sucesivos iguales a cantidades del atributo que está siendo medido.

10 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Resumen Tipos de variables

Cualitativas

Cuantitativas

Nominales

Ordinales

Continuas

Discretas

No orden

Existe orden

No entero

Entero

Ejercicios Ejercicios 1.1: Determine en cada una de las siguientes situaciones: la población y la muestra. Un fabricante de medicamentos desea conocer la proporción de personas cuya hipertensión (presión alta) puede ser controlada por un nuevo producto fabricado por la compañía. Al realizar un estudio a 5000 individuos hipertensos se obtuvo que el 80 % de ellos pudo controlar su hipertensión utilizando el nuevo medicamento. Suponiendo que estas 5000 personas son representativas del grupo de pacientes hipertensos. Ejercicios 1.2: Construya variables relacionadas con su carrera, 4 nominales, 4 ordinales, 4 continuas y 4 discretas. Ejercicio 1.3: Indica qué variables son cualitativas (ordinal o nominal) y cuales cuantitativas (continuas o discretas): a) Censo anual de los nicaragüenses: b) Temperaturas en grados Celsius registradas cada hora en un observatorio: c) Tu comida favorita: d) Cuántos goles ha marcados tu equipo favorito en la última temporada: e) El color de los ojos de tus compañeros de clase: 11 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

f) Coeficiente intelectual de los alumnos de esta clase: g) Asignatura favorita: h) Cuántas acciones se han vendido hoy en la Bolsa: i) Profesiones militares (tropa, suboficiales, oficiales, jefes, generales): j) Duración del viaje en coche a ciudades de Nicaragua: k) El diámetro de las ruedas de varios coches: l) La nacionalidad de una persona: m) Número de litros de agua contenidos en un depósito: n) La calificación de un examen (suspenso, aprobado, notable, sobresaliente): o) Número de libros en un estante de librería: p) Suma de puntos tenidos en el lanzamiento de un par de dados: q) La profesión de una persona: r) Cuántos estudiantes se han matriculado en este curso: s) La superficie de un edificio: t) Puesto conseguido en una prueba deportiva (1º, 2º, 3º,…): u) Número de hijos de 50 familias: v) Medallas de una prueba deportiva (oro, plata, bronce): Ejercicio. 1.4: Indique el nivel de medición de las siguientes variables. Teniendo en cuenta que las variables se pueden clasificar en nominales, ordinales, de intervalo y razón: a) Altura física en centímetros: b) Estatus laboral (inexperto/semiexperto/experto): c) Peso físico en Kilogramos: d) Sexo: e) Calidad percibida del cuidado proporcionado (excelente/bueno/suficiente/pobre): f) Diagnóstico “sobrecarga del rol del cuidador”: g) ¿Se puede bañar sólo? h) Temperatura corporal: i) Estado civil: j) ¿Tiene alguna preferencia religiosa? (católica/protestante/judía/islámica/protestante/otra): 12 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Distribución de frecuencias Después de la recopilación de los datos, es necesario resumirlos y presentarlos en forma tal, que faciliten su comprensión y su posterior análisis y utilización. Para ello, se ordenan en cuadros numéricos y luego se representan en gráficos. Todo cuadro numérico debe tener: -

Un título adecuado para evitar confusiones y para expresar brevemente su contenido.

-

La fuente de los datos, si no son datos propios.

-

Las unidades en que se expresan los datos.

Los cuadros numéricos de una sola variable estadística se denominan distribución de frecuencias. En el procedimiento para construir distribuciones de frecuencias

nos referiremos a

muestras, mientras no se diga lo contrario. Procedimiento a seguir en un estudio estadístico Recogida de datos: Planteado el test o encuesta oportuno y recogidos los datos que correspondan, el primer análisis que realizaremos es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o Continua). Esto condicionará en gran medida su posterior tratamiento. Organización de los datos: determinado el modo de agrupamiento de las observaciones, procedemos a su recuento, construyendo la tabla de frecuencias. Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama estadístico apropiado. Análisis final: La obtención de muy diversas conclusiones respecto de la variable estudiada, se podrá realizar con auxilio de los diferentes parámetros estadísticos (de centralización, posición, dispersión, etc.) Tabla para datos no agrupados Frecuencias Frecuencia absoluta (f): Para datos no agrupados en intervalos, es el número de veces que se presenta cada valor de la variable. Si los datos se agrupan en intervalos, es el número de observaciones que pertenecen a dicho intervalo. 13 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática Frecuencia absoluta acumulada (fa): Para un cierto valor de la variable, la frecuencia absoluta acumulada nos da el número de observaciones menores o iguales que dicho valor. Frecuencia relativa (fr): Cociente entre la frecuencia absoluta y el número total de observaciones (N). Frecuencia relativa porcentual (fr%): Frecuencia relativa multiplicada por 100 (es la expresión de las frecuencias en %). Frecuencias relativas acumuladas (fra): Es la relación de la frecuencia acumulada de una clase expresada respecto al total de observaciones

Ejemplo Las puntuaciones obtenidas por un grupo en una prueba de matemáticas han sido: 15; 20; 15; 18; 22; 13; 13; 16; 15; 19; 18; 15; 16; 20; 16; 15; 18; 16; 14; 13. Construir la tabla de distribución de frecuencias

xi

Recuento

13 14 15 16 18 19 20 22 Σ

III I IIIII IIII III I II I

Frecuencia Absoluta (f) 3 1 5 4 3 1 2 1 20

Frecuencia absoluta acumulada 3 3+1=4 4+5=9 9+4=13 13+3=16 16+1=17 17+2=19 19+1=20

Frecuencia relativa 320=0,15 120=0,05 520=0,25 420=0,2 320=0,15 120=0,05 220=0,1 120=0,05 1

Frecuencia relativa porcentual 0,15x100=15 0,05x100=5 0,25x100=25 0,2x100=20 0,15x100=15 0,05x100=5 0,1x100=10 0,05x100=5 100

Frecuencia relativa acumulada

(fra%)

0,15 0,15+0,05=0,2 0,2+0,25=0,45 0,45+0,2=0,65 0,65+0,15=0,8 0,8+0,05=0,85 0,85+0,1=0,95 0,95+0,05=1

15 20 45 65 80 85 95 100

Tabla para datos agrupados Pasos para la construcción de una tabla de distribución de frecuencias 1) Ordenar los datos de menor a mayor. Se puede usar el diagrama de tallo y hojas. 2) Calcular el rango. Para esto se resta al valor mayor menos el valor menor. Es decir R = VM – Vm 3) Se determina el valor de K (número de clases o grupos que se desean) en caso de que no dispongamos de este dato se puede usar la fórmula K = 1 + 3.32 log(n). 14 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

4) Hallar el cociente

R k

5) Determinar la amplitud del intervalo de clases C.

C=

R ( TRUNCADO ) + U k

U significa las unidades decimales. Si los datos tienen cero cifras decimales, se usa u =1 Si los datos tienen una cifra decimal, se usa u = 0,1 Si los datos tienen dos cifras decimales, se usa u = 0,01

Otra manera de encontrar el valor de C es dividiendo R entre 5 y R entre 20. Después se escoge un valor entre esos dos cocientes, preferiblemente entero impar siempre y cuando sea posible. Esto es,

R R (Lo anterior se debe a que no es aconsejable hacer tablas C  5 20

con menos de 5 grupos ni mayor de 20. Cualquier cantidad de clases entre 5 y 20 es aceptable.

6) Construir la tabla de distribución de frecuencias Se toma el valor menor de los datos como el límite inferior de la primera clase. Para calcular el límite superior se aplica la fórmula

LS = Li + C -- U Nota 1: Para determinar los límites inferiores de las clases siguientes, sólo se le suma el valor de C al límite inferior anterior. De igual manera se trabaja con los límites superiores. La última clase debe contener al valor mayor de los datos. Ejemplo1. En una cooperativa de taxis de Managua se midió el rendimiento en el consumo de la gasolina en km / gal, a 40 unidades. Los resultados fueron. 45

38,4

44,3

44,2

43,6

45,3

44,5

39,8

44,2

44,4

43,2

44,0

43,8

43,8

45,5

44,5

44,6

44

45,2

38,7

44,4

44.7

44,1

44,3

43,9

44,1

45,8

42,2

41,2

40,6

42,1

45,6

44,5

39,7

40,7

42,3

45,2

43,3

44,7

38,6 15

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Aùo de Física Matemåtica

Agrupe estos datos en una tabla de distribuciĂłn de frecuencias TDF que tenga 7 clases.

Paso 1. Diagrama de tallo y hojas.

Tallo

hojas

38

4; 6; 7

39

7; 8

40

6; 7

41

2

42

1; 2; 3

43

2; 3; 6; 8; 8; 9

44

0; 0; 1; 1; 2; 2; 3; 3; 4; 4; 5; 5; 5; 6; 7; 7

45

0; 2; 2; 3; 5; 6; 8

38,4

39,8

42,1

43,3

43,9

44,1

44,3

44,5

44,7

45,3

38,6

40,6

42,2

43,6

44,0

44,2

44,4

44,5

45,0

45,5

38,7

40,7

42,3

43,8

44,0

44,2

44,4

44,6

45,2

45,6

39,7

41,2

43,2

43,8

44,1

44,3

44,5

44,7

45,2

45,8

Paso 2.

R = 45,8 – 38,4 R = 7,4

Paso 3. El valor de K= 7 clases (dato proporcionado en el ejercicio) đ?‘…

=

7,4

Paso 4.

Cociente

Paso 5.

C = 1.0 + 0.1 (ya que los datos tienen una cifra decimal u = 0.1) Resulta

đ?‘˜

7

= 1,05714286 Se trunca a una cifra decimal, queda en 1.0

C = 1.1

16 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Paso 6.

Kilómetros

por Cantidad

galón de gasolina Li

n =

f

de

vehículos

LS

f

38,4

-

39,4

3

39,5

-

40,5

2

40,6

-

41,6

3

41,7

-

42,7

3

42,8

-

43,8

5

43,9

-

44,9

17

45,0

-

46,0

7

= 40

Para la primera clase, LS = 38,4+ 1,1 - 0,1 LS = 39.4 Se completa la tabla con la información de la nota 1. (Ver página anterior)

Se procede ahora a calcular la frecuencia acumulada, frecuencia relativa, porcentaje de frecuencia relativa, porcentaje de frecuencia acumulada, marca de clases y límites reales. Frecuencia acumulada: Se encuentra sumando a la frecuencia de la clase, la frecuencia de las clases anteriores.

Frecuencia relativa: Es la proporción de casos que hay en cada clase. Se encuentra dividiendo la frecuencia de la clase entre el total de datos n. fr =

f n

Porcentaje de frecuencia relativa: Para hallar el porcentaje de frecuencia relativa, se multiplica la frecuencia relativa por 100. . O sea: %fr = fr x 100 17 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Porcentaje de frecuencia acumulada: Se puede calcular acumulando el porcentaje de la frecuencia relativa, o aplicando la expresión: fa x 100 n

%fa =,

Marca de clases: Es el punto medio de la clase. Se representa por Xc Se encuentra aplicando la fórmula

xC = Li + LS 2

Límites reales: Para encontrar los límites reales se aplican las fórmulas: Lir = Li -

U 2

Lsr = Ls +

y

U 2

Kilómetros

Cantidad

Kilómetros

por galón de

de

por galón de

gasolina

vehículos

Li

LS

fi

fa

fr

%fr

%fa

Xc

gasolina Lir

Lsr

38.4

-

39.4

3

3

0.075

7.5

7.5

38.9

38.35 - 39.45

39.5

-

40.5

2

5

0.05

5

12.5

40

39.45 - 40.55

40.6

-

41.6

3

8

0.075

7.5

20

41.1

40.55 - 41.65

41.7

-

42.7

3

11

0.075

7.5

27.5

42.2

41.65 - 42.75

42.8

-

43.8

5

16

0.125

12.5

40

43.3

42.75 - 43.85

43.9

-

44.9

17

33

0.425

42.5

82.5

44.4

43.85 - 44.95

45.0

-

46.0

7

40

0.175

17.5

100

45.5

44.95 - 46.05

1

100

n =

f

= 40

En este ejemplo, los datos tienen una cifra decimal, por eso se toma u = 0.1 Interpretación de la quinta clase: Puede observarse que hay una frecuencia de 5 vehículos que tienen un rendimiento de 42.8 a 43,8 kilómetros por galón de gasolina, esto equivale al 12,5% de las unidades en estudio. 18 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

En relación a la frecuencia acumulada, hay 16 unidades cuyo rendimiento es menor o igual a 43,8 kilómetros por galón. Dicho de otra manera, el 40%de las unidades estudiadas reflejan un rendimiento menor o igual a 43,8 kilómetros por galón.

Ejercicio 1.5 Construya una tabla de frecuencias para la edad en años cumplidos de 40 estudiantes de nuevo ingreso de la FAREM-Estelí. 21

20

19

23

22

19

16

22

24

17

19

18

20

27

20

23

18

19

17

24

18

19

21

25

23

21

22

20

17

23

22

20

19

26

18

20

18

17

22

21

Tipos de Gráficos Un gráfico (o gráfica) es el recurso de representar los datos numéricos por medio de líneas, diagramas, dibujos, etc. La representación gráfica es un importante suplemento al análisis y estudio estadístico. Los gráficos llaman la atención del lector y hacen que de un vistazo éste tenga una mayor comprensión de los datos. Un buen gráfico puede captar al lector para que a continuación lea todo el estudio. Si un estudio se compone únicamente de texto y tablas, posiblemente no todos los lectores lean el estudio.

Técnicas de representación gráfica El uso de gráficas permite al observador, tener una apreciación de manera rápida sobre los altibajos de la gráfica, para analizar luego, las causas posibles del comportamiento de la misma.

Regla de los ¾ de altura. Se aplica la ecuación Y = ¾ x 19 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Por ejemplo si el eje X mide 12 cm, entonces el eje Y mide ¾ de (12) = 9 cm.

Con los datos de la tabla de distribución de frecuencias se pueden construir:

1) Histograma de frecuencias Consiste en una serie de rectángulos continuos cuya base en el eje x está determinada por los límites reales y la altura de cada barra, es la frecuencia absoluta de la clase.

Rendimiento de la gasolina

Coop. de Taxis de Managua I semestre 2016 17

18 16

Unidades de taxi

14 12

10 7

8

5

6 4

3

2

3

3

2 0 38.35

39.45

40.55

41.65

42.75

43.85

44.95

Km / Galón

2) Polígono de frecuencias Es un diagrama formado por segmentos de recta que une los puntos de las alturas (frecuencia de cada clase) Para graficar se escriben en el eje X, las marcas de clase y en el eje Y las frecuencias.

20 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Rendimiento de la gasolina Coop. de Taxis de Managua I semestre 2016

18

17

Unidades de taxi

16 14 12

10 8

7

6 4 2

5 3

3

2

3

0

38.9

40

41.1

42.2 43.3 Km. / galón

44.4

45.5

3) Polígono de frecuencia acumulada Es un diagrama donde se ubican los límites reales superiores en el eje X y la frecuencia acumulada en el eje Y .La línea que se forma solamente crece.

Rendimiento de la gasolina Coop. de Taxis de Managua I Semestre 2016

45

Unidades de taxi

40

40

35

33

30 25 20

16

15

11

10 5 0

8 3

5

39.45 40.55 41.65 42.75 43.85 44.95 46.05 Km / galón

Los gráficos fueron construidos con el programa EXCEL

21 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Otros Gráficos En una gráfica de barras los datos de cada una de las modalidades C i se representan por una barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su frecuencia. Las barras se dibujan dejando un espacio entre ellas. Si la escala es nominal las categorías pueden ser colocadas en cualquier orden. Pero, si el nivel es ordinal las categorías deben ir ordenadas. En una gráfica circular, los datos de cada categoría C i se representan por un sector circular cuyo ángulo en el centro es igual a hi360. Si la gráfica por sectores circulares es tridimensional es denominada de pastel. Ejemplo: En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas: B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N. Construir la distribución de frecuencias. Graficar la distribución SOLUCION. La tabulación de estos datos, donde la variable cualitativa es X: Color de bebida gaseosa, es la distribución de frecuencias del cuadro 1.2. La figura 1.1 es la representación gráfica por medio de barras de la distribución de personas por el color de su bebida gaseosa preferida. .

22 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Cuadro 1.2. Distribución de personas por su color preferido de una marca de bebida gaseosa. Valores de

Frecuencias

Frecuencias

Frecuencias

X

Absolutas: f i Relativas: hi Porcentajes: pi

Negro (N)

9

0,45

45

Blanco (B)

8

0,40

40

Rojo (R)

3

0,15

15

Total

20

1,00

100

Personas 9 8 7 6 5 4 3 2 1 0

0.45 0.40

0.15

Negro

Blanco

Rojo

Fig. 1.1 Gráfica de barras

La figura 1.2 es la representación mediante gráfica de sectores circulares del cuadro 1.2. La frecuencia 45% es equivalente a 0.45  360 = 162  , la frecuencia 40% es equivalente a 0.40  360 = 144  , y la frecuencia 15% es equivalente a 0.15  360 = 54

23 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática 15% 40%

R B N 45%

Fig. 1.2 Gráfica circular Gráfica de barras agrupadas Si se trata de comparar solamente las componentes o las frecuencias en cada modalidad, se puede utilizar un gráfico de barras agrupadas. En cada modalidad se trazan tantas barras adjuntas como componentes hay. Por ejemplo, la figura 1.3 representa las frecuencias de cada componente en cada modalidad del cuadro 1.9. 30 25 20 Hombres Mujeres

15 10 5 0 1975

1980

1985

1990

Fig. 1.3. Población de una ciudad de 1975 a 1990

Gráfica de barras componentes a) Si se quiere resaltar a la vez el total y las frecuencias de cada componente en cada modalidad, entonces, conviene utilizar un gráfico de barras componentes como el de la figura 1.4. En cada modalidad se traza una barra cuyo largo es proporcional al total de sus datos. La gráfica 1.14 de barras componentes, del cuadro resume la variación de la población de una ciudad desde 1975 hasta 1990, resaltando el total y los parciales en cada modalidad.

24 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática 50 40 30

Mujeres Hombres

20 10 0 1975

1980

1985

1990

Fig. 1.4. Población de una ciudad de 1975 a 1990 b) Si se trata de destacar la importancia relativa de sus componentes, se puede utilizar un gráfico, como la figura 1.15, donde todas las barras son de igual longitud y equivalentes al 100% en cada categoría. El cuadro, tiene los mismos datos del cuadro, sólo que ahora se consideran los porcentajes o valores relativos, en vez de los valores absolutos. Cuadro. Población (en %) de una ciudad de 1975 a 1990 Año

Hombres Mujeres Total

1975

32,0

68,0

100

1980

37,5

62,5

100

1985

25,0

75,0

100

1990

40,0

60,0

100

La proporción de cada componente respecto al total en cada categoría, se representa en la figura 1.5.

25 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%

Mujeres Hombres

1975

1980

1985

1990

Fig. 1.5. Población de una ciudad de 1975 a 1990 en porcentajes Cuando se utilizan figuras de igual tamaño para reflejar la característica que se quiere representar, al gráfico estadístico, se denomina pictografía. En una pictografía el número de figuras en cada categoría o modalidad es proporcional a la frecuencia absoluta respectiva. Existe otra gran variedad de gráficas o diagramas para mostrar datos ó para mostrar relaciones entre varios grupos de datos. Aquí la imaginación del dibujante juega un papel muy importante. Ejercicio 1.6 Se realiza un estudio para conocer el número de computadoras que hay en cada vivienda del municipio de Ocotal, Nueva Segovia y se obtienen los siguientes datos: 0, 1, 2, 4, 2, 2, 0, 0, 4, 3, 1, 3, 4, 3, 4, 1, 1, 1, 2, 1, 3, 4, 2, 2, 4, 2, 2, 1, 4, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 1, 1, 3, 3, 1, 1, 2, 2, 1 Construye un diagrama de barras, con la información dada. Ejercicio 1.7 Los puntos obtenidos por los jugadores de dos equipos de baloncesto han sido los siguientes: 9 12 6 11 19 5 8 13 2 8 5 12 0 9 4 15 18 10 6 16 Construye el histograma asociado a dichos datos tomando las puntuaciones en intervalos de 5 puntos. Ejercicio 1.8 26 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

La superficie arbolada afectada por incendios forestales en España, para el período 20052014, se da en la siguiente tabla:

Representa mediante un polígono de frecuencias la superficie arbolada afectada por los incendios.

27 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Medidas de tendencia central Las medidas de tendencia central tienden a ocupar la parte central de la distribución de datos. Entre ellas tenemos la media aritmética, mediana y moda, y pueden ser calculadas tanto para datos no agrupados como para datos agrupados. Datos no agrupados •

Media aritmética:

Es el promedio de los valores de las observaciones, es decir, se suman los datos y se divide entre el número de datos. En símbolo, se escribe así: X =

x n

Ejemplo 2. Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9 X =

x n

X =

3+5+7 + 4+8+ 4+9+6+7+ 4+9 66 X = 11 11

X

=6

Mediana:

Es el puntaje central de la distribución de datos. Esto es que el 50% de los valores de la muestra se encuentra por encima del valor de la mediana y el otro 50%, se encuentra por debajo de ella.

Para calcular la mediana se busca el valor que se encuentra en el centro de los datos ordenados de menor a mayor. Si el número de datos (n) es impar, quedará un número solo en el centro. Ese valor es la mediana. Pero si (n) es par, quedarán dos valores centrales., entonces se promedian los dos valores y el resultado es el valor de la mediana.

Ejemplo 3. Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9 Primero se ordena de menor a mayor. 3, 4, 4, 4, 5, 6, 7, 7, 8, 9, 9

La mediana es

Me = 6

Ejemplo 4. 28 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

La mediana para el conjunto de datos 1, 2, 4, 6, 7, 8, 9, 10 es

6+7 Me = 6.5ya que n es 2

par. •

Moda

De una serie de datos es el valor que ocurre con mayor frecuencia. Es decir, es el dato más repetido. La moda de una serie de datos es el valor Mo , que se define como el dato que más veces se repite. La moda no siempre existe y si existe, no siempre es única. En matemática, la moda es el valor de la variable en el que existe un máximo absoluto (o dos o más máximos relativos iguales). La moda es una medida promedio que se usa cuando se quiere señalar el valor más común de una serie de datos. Por ejemplo, los comerciantes se estoquean con productos que están de moda. La moda es el promedio menos importante debido a su ambigüedad. Ejemplo5. Dado el conjunto de datos 3, 5,, 7, 4, 8, 4, 9, 6, 7, 4, 9 Se repiten tres valores el 4, el 7 y el 9. Pero el 4 se repite más veces por tanto la moda es Mo = 4.

Ejercicios Propuestos Ejercicio 1.9 Calcular la mediana para las siguientes series de datos. a) 120, 3, 14, 1, 99, 7, 30, 2,000, 16 b) 30, 77, 3, 300, 36, 11, 10,000, 29 Ejercicio 1.10 29 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Determine la moda en la siguiente serie de datos: a) 7, 9, 7, 8, 7, 4, 7, 13, 7 b) 5, 3, 4, 5, 7, 3, 5, 6, 3 c) 31, 11, 12, 19 Ejercicio 1.11 Calcular la media aritmética de la distribución del número de hijos por familia, según la tabla presentada Valores de X

frecuencias

Productos

xi

fi

fi xi

0

1

0

1

4

4

2

7

14

3

6

18

4

2

8

Total

20

44

Calcular la moda de los 45 ingresos quincenales

30 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Datos agrupados

Donde:

Lir: Es el límite inferior real •

Media

X =

 fX

n: Es el tamaño de la muestra

c

fc: Frecuencia de la clase

n

faA: Frecuencia acumulada

n   2 − fa A .C • Mediana Me = Lir +  f c     •

Moda

anterior C: Amplitud del intervalo de clase

1 : Se resta la mayor frecuencia

 1  Mo = Lir +  .C  +  2  1

menos la frecuencia de la clase anterior.

 2 : Se resta la mayor frecuencia menos la frecuencia de la clase siguiente.

Ejemplo 6. Calcular la media aritmética, mediana y moda con los datos del ejemplo (1) sobre el combustible de la cooperativa de taxis de Managua.

Lir

Lsr

fa

f

Xc

fXc

38,35

39,45

3

3

38,9

116,7

39,45

40,55

2

5

40,0

80

40,55

41,65

3

8

41,1

123,3

41,65

42,75

3

11

42,2

126,6

42,75

43,85

5

16

43,3

216,5

43,85

44,95

17

33

44,4

754,8

44,95

46,05

7

40

45,5

318,5

Total

1 736,40

31 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Aùo de Física Matemåtica

a) Media

X =

ďƒĽ fX

c

n

1 736,40 đ?‘‹Ě… = 40

X

= 43.41 kilĂłmetros por galĂłn

b) Mediana: Se encuentra en la primera clase de arriba hacia abajo cuya frecuencia acumulada es mayor o igual que la mitad de los datos de la muestra

n n 40 o sea = 2 2 2

= 20 Se encuentra en la sexta clase.

ďƒŠ 20 − 16 ďƒš .(1.1) Me = 44,10kilĂłmetros por galĂłn ďƒŤ 17 ďƒşďƒť

Me = 43,85 + ďƒŞ

c) Moda: Se encuentra en la clase que tiene la mayor frecuencia.

ď „1 : = 17 – 5 = 12

y

ď „ 2 : = 17 – 7 = 10

ďƒŠ

ď „1 ďƒš ďƒş.C ď „ + ď „ 2ďƒť ďƒŤ 1

Mo = Lir + ďƒŞ

ďƒŠ 12 ďƒš

.(1.1) = 44,45 Mo = 44,45 kilĂłmetros por galĂłn Mo = 43,85 + ďƒŞ ďƒŤ12 + 10 ďƒşďƒť Se puede concluir que el rendimiento promedio en el combustible es de 43.41 kilĂłmetros por galĂłn, que el 50% de las unidades muestreadas refleja un rendimiento menor o igual a 44.10 y el otro 50%mantiene un rendimiento superior a 44.10, kilĂłmetros por galĂłn y que el rendimiento mĂĄs repetido es de 44.45 kilĂłmetros por galĂłn.

Ejercicio 1.12 Calcular la mediana, moda y media aritmetica para la muestra de los 45 ingresos quincenales tabulados en la siguiente tabla:

32 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ingresos

Número de personas

Frec. acumuladas

Ii

fi

Fi

[26,34[

1

1

[34,42[

2

3

[42,50[

4

7

[50,58[

10

17

[58,66[

16

33

[66,74[

8

41

[74,82[

3

44

[82,90]

1

45

Total

45

Ejercicio 1.13 Calcular la media aritmética de la distribución del número de hijos por familia Valores de X

frecuencias

Productos

xi

fi

fi xi

0

1

0

1

4

4

2

7

14

3

6

18

4

2

8

Total

20

44

33 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Formas de la distribución Muchas distribuciones de variables continuas se pueden representar de manera gráfica mediante una curva en forma de campana.

Simétrica: Se dice que una distribución es simétrica, si se puede doblar a lo largo de un eje vertical de modo que los lados coincidan. En este caso la media, mediana y la moda coinciden con el eje de simetría. El sesgo es igual a cero.

X

= Me = Mo

Asimétrica Si la curva no es simétrica se dice que es sesgada, ya sea positiva o negativamente. •

Una distribución es “sesgada a la derecha” o tiene asimetría positiva, si

Mo

< Me < X

Mo < Me < X •

Una distribución es “sesgada a la izquierda” o tiene asimetría negativa, si

X < Me<

X < Me<

Mo

Mo

Respecto al problema (el caso de la gasolina) la media es menor que la mediana y menor que la moda, por tanto tiene una asimetría negativa.

34 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Medidas de variabilidad o dispersión Datos agrupados.

 f (X

2

n

a) La varianza: La varianza se calcula mediante la fórmula S2 =

u =1

c

− X)

n −1

b) Desviación estándar:

S2

Es la raíz cuadrada de la Varianza. S = c) Coeficiente de variación: Se calcula mediante la fórmula CV =

S x100 X

Es útil siempre que no será mayor del 20%.

d) Coeficiente de asimetría. Sesgo =

3( X − M e ) S

Ejemplo 7. Con los datos del problema (6), calcular: a) La varianza b) La desviación estándar c) El coeficiente de variación d) El coeficiente de asimetría.

Lir

Lsr

f

fa

Xc

fXc

( Xc- X)

( Xc- X)2

f ( Xc- X) 2

38,35

39,45

3

3

38,9

116,7

-4,51

20,3401

61,0203

39,45

40,55

2

5

40,0

80,0

-3,41

11,6281

23,2562

40,55

41,65

3

8

41,1

123,3

-2,31

5,3361

16,0083

41,65

42,75

3

11

42,2

126,6

-1,21

1,4641

4,3923

42,75

43,85

5

16

43,3

216,5

-0,11

0,0121

0,0605

43,85

44,95

17

33

44,4

754,8

0,99

0,9801

16,6617

44,95

46,05

7

40

45,5

318,5

2,09

4,3681

30,5767

Total

40

1 736,40

151,9760

35 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

 f (X

2

n

2

a) S = b) S = c) CV =

u =1

c

− X)

S2 =

n −1

S2

151.9760 39

3.8968

S=

S2 = 3.8968 S = 1.97 km. por galón.

S 1.97 x100 CV = x100 Cv = 4.54 % X 43.41

3( X − M e )

d) Sesgo =

S

Sesgo =

3(43.41 − 44.10) 1.97

Sesgo = - 1.05

Interpretación: La desviación estándar: La dispersión que presentan los datos es de 1,97 kilómetros por galón, con respecto al rendimiento promedio.

El coeficiente de variación: Representa en términos porcentuales la relación de la desviación estándar con respecto a la media, es decir, que los datos se desvían respecto a la media aritmética en un 4,54 %

Coeficiente de asimetría o Sesgo: Nos da un valor negativo lo que comprueba el análisis anterior, puesto que los datos tienen una mayor frecuencia al final de la distribución. Tiene asimetría negativa.

EJERCICIO (1)

1)

En la zona baja de Managua hay 27 pozos para suministrar agua a la ciudad Capital. Los caudales de dichos pozos se miden en galones por minuto. (GPM) y sus mediciones son las siguientes.

800

2200

1212

1200

2230

1115

1100

511

1100

1000

800

800

1000

1200

800

750

710

700

1200

600

550

450

400

380

350

1200

1000

36 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 6 clases. b) Calcular la media, mediana y moda c) Calcular la varianza y la desviación estándar d) Trazar el histograma de frecuencias.

2)

Los datos son mediciones de la intensidad solar directas (en Watts / m 2) realizados en diferentes días en una localidad.

562

869

708

775

704

775

809

856

655

806

878

909

918

558

768

870

918

940

946

661

820

898

935

952

957

693

835

905

a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 5 clases. b) Calcular la media, mediana y moda c) Calcular la varianza y la desviación estándar d) Trazar el polígono de frecuencias.

3)

Los contenidos de nicotina, en miligramos de 40 cigarrillos de cierta marca son:

1.09

1.79

2.03

1.63

1.69

0.85

1.64

1.51

1.74

1.37

1.86

2.31

1.88

2.17

1.75

1.82

1.58

1.75

0.72

1.97

1.40

1.68

2.28

1.67

2.11

1.92

2.46

1.70

2.37

1.85

1.24

2.09

1.64

1.47

1.93

1.90

1.79

2.08

2.55

1.69

a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 6 clases. b) Calcular la media, mediana y moda 37 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

c) Calcular la varianza y la desviación estándar d) Trazar el polígono de frecuencia acumulada.

4)

En la redacción de un diario, el tiempo requerido para formar la página completa fue registrada durante 50 días. El dato redondeado a la décima de un minuto más cercana se da a continuación.

20.8

22.8

21.9

22

20.7

20.9

25

22.2

22.8

20.1

25.3

20.7

22.5

21.2

23.8

20.9

22.9

23.3

23.5

19.5

23.7

20.3

23.6

19

25.1

19.5

24.1

24.2

25

21.8

21.3

21.5

23.1

19.9

24.2

24.1

19.8

23.9

22.8

22.7

19.7

24.5

23.8

20.7

23.8

24.3

21.1

20.9

21.6

22.7

a) Agrupe estos datos en una tabla de distribución de frecuencias TDF que tenga 7 clases. b) Interprete la quinta clase.

5)

Los precios en dólares de un repuesto para computadora en una ciudad son: 32

38

42

39

41

35.4

47.8

40

36.7

38.3

36.7

41.5

39.6

41.52

15.7

43.6

39.4

45.6

49.4

48

43.7

42.6

45.6

44

48.6

34.2

31.2

47.6

43.5

30.4

a) Construya una tabla de distribución de frecuencias. b) Interprete la frecuencia absoluta y acumulada de la cuarta clase. c) Interprete el porcentaje de frecuencia relativa y el porcentaje acumulado de la clase de mayor frecuencia.

38 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Medidas de posición •

Deciles: Son valores posicionales que dividen a la información en diez partes iguales. El primer decil deja 10% de la información por debajo de él y el 90% por encima de él. Los deciles se representan por Di donde i = 1, 2, 3, . . . 10

Cuartiles: Son valores posicionales que dividen a la información en cuatro partes iguales, el primer cuartil deja el 25% de la información por debajo y el 75% por encima. El segundo cuartil al igual que la mediana divide a la información en dos partes iguales. Por último, el tercer cuartil deja 75% por debajo y el 25% por encima. Los cuartiles se representan por Qi donde i= 1, 2, 3, 4.

Percentiles: Son valores posicionales que dividen a la información en cien partes iguales. Los percentiles se representan por Pi donde 1 < i < 100.

Representación gráfica

P

D1

D2

D3

D4

10%

20%

30%

40%

D5

D6

D7

D8

D9

60%

70%

80%

90%

D10

100% Q1

Q2

Q3

25%

50%

75%

 in   10 − f a A  .C Deciles Di = Lir +  f c    

 in   4 − fa A .C Cuartiles Qi = Lir +  f c    

39 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

 in  − f A a  100   .C Percentiles Pi = Lir + f c     Ejemplo 8. Con los datos de la tabla del ejemplo (7);

Lir

Lsr

f

fa

38,35

39,45

3

3

39,45

40,55

2

5

40,55

41,65

3

8

41,65

42,75

3

11

42,75

43,85

5

16

43,85

44,95

17

33

44,95

46,05

7

40

Total

40

Calcular: a) El decil 2

d) Percemtil 10

b) Cuartil 1

e) Percentil 90

c) Cuartil 3

 in   10 − f a A  .C D2 = 40.55 + a) Di = Lir +  f c    

 2(40)   10 − 5   .(1.1) 3    

D2 = 41.65

40 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

 3(40)   in  − 16 − f A a  4  4  . C  .(1.1)   b) Qi = Lir + Q3= 43.85 + f 17 c        

 in  − f A a 4   .C Q1= 41.65 + c) Qi= Lir + f c    

 1(40)   4 − 8  .(1.1) 3    

 10(40)   in  − f A a  100 − 3   100  .(1.1) .C P10 = 39.45 +  d) Pi = Lir +  f 2 c        

Q3 = 44.76

Q1 = 42.38

P10 = 40.00

 90(40)   in   100 − 33  100 − f a A  .(1.1) P90 = 45.42 .C P90 = 44.95 +  e) Pi = Lir +  f 7 c         Interpretación: El D2 significa que el 20% de los datos de la muestra, tienen un rendimiento de 41.65 km por galón o menos. El Q1indica que el 25% de los datos de la muestra tienen un rendimiento menor o igual a 42.38 km por galón. De manera similar se interpretan las otras medidas.

Coeficiente de curtosis (K) Otra manera de medir la forma de la distribución es con la curtosis, la cual nos dice qué tan puntiaguda es la gráfica de una distribución y se presenta en tres tipos: Platicúrtica: La forma geométrica es aplanada Mesocúrtica: Tiene una forma que no es ni aplanada ni puntiaguda. Leptocúrtica: La forma geométrica es puntiaguda o esbelta.

41 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Platicúrtica

Mesocúrtica

Q3 − Q1 2

Leptocúrtica

44.76 − 42.38 Q = 1.19 2

K=

Q P90 − P10

K=

1.19 K = 0,2195A Q se le conoce como rango semi intercuartil. 45.42 − 40

Q=

Q=

Ejemplo 9.La siguiente distribución de frecuencia representa el tiempo promedio en minutos que 20 clientes de un banco, llevan a cabo una transacción bancaria.

Tiempo en minutos Li

Lir

Ls

Lsr

Cantidad de

Tiempo

clientes (f) promedio 3 4

2,1

6 3 2

6,0

2 Total

20

a) Completar la tabla de distribución de frecuencias. b) Calcular la desviación estándar S e interpretarla. c) ¿Qué porcentaje de clientes realizó su transacción bancaria entre 1.95 y 5.50 minutos.

2,1 + C + C + C = 6,0 Lir = Xc -

C 2

3C = 6,0 – 2,1 = 3,9

C = 1,3

Se usa para calcular el límite inferior real. 42

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Lsr = Xc +

C 2

Se usa para calcular el límite superior real.

a) Li

Ls

Lir

Lsr

f

Xc

fa

fXc

Xc - X

(Xc - X)2

f (Xc - X)2

0,2

1,4

0,15

1,45

3

0,8

3

2,4

-2,795

7,812

23,436

1,5

2,7

1,45

2,75

4

2,1

7

8,4

-1,495

2,235

8,9401

2,8

4,0

2,75

4,05

6

3,4

13

20,4

-0,195

0,038

0,2282

4,1

5,3

4,05

5,35

3

4,7

16

14,1

1,105

1,221

3,6631

5,4

6,6

5,35

6,65

2

6

18

12

2,405

5,784

11,568

6,7

7,9

6,65

7,95

2

7,3

20

14,6

3,705

13,727

27,454

Σ

71,9

Σ

75,29

20

b) Media aritmética X =

2

La varianza S =

 fX n

 f (X

c

X =

− X)

71.9 X = 3,595 minutos 20

2

c

n −1

S 2 = 3,9626

S = 1,9906 minutos

 in   100 − f a A  .C 1.95 está en la segunda clase y 5.50 en la quinta. c) Pi = Lir +  f c      i (20)   100 − 3  .(1.3) i = 22.69 % 1,95 = 1.45 +  4      i (20)   100 − 16  .(1.3) i = 81.15 % 5.50 = 5.35 +  2     Por tanto el porcentaje es 81.15% – 22.69 % = 58.46% 43 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Interpretación Inciso (b) El tiempo promedio que los clientes se tardan en realizar sus transacciones bancarias es de 3.595 minutos con una desviación estándar de 1.99. Esto quiere decir que la variación de los tiempos que se tardan los clientes en realizar sus operaciones bancarias es de 1.99 minutos con respecto al tiempo promedio.

Inciso (c) El 58.46 % de los clientes se tardan entre 1.95 y 5.50 minutos en realizar las operaciones bancarias.

EJERCICIO (2)

1) Una compañía de computadoras recopiló datos con respecto al tiempo (en minutos) que requerían cada uno de los 40 vendedores para realizar una venta. La siguiente tabla representa la distribución de tiempo requerido por vendedor. Li

Ls

F

fr

1

10

11

20

1

21

30

4

31

40

41

50

51

60

0.375

61

70

0.225

71

80

0.075

2

5

a) Completar la tabla b) Calcular el coeficiente de asimetría c) Calcular el coeficiente de curtosis d) Interpretar la forma de la distribución.

2) Una fábrica de cremalleras manufactura 15 productos básicos. La compañía tiene registros del número de elementos de cada producto fabricado al mes con el fin de 44 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

examinar los niveles relativos de producción. A partir de los datos obtenidos, la dirección de la Compañía construyó la siguiente tabla.

Clases

frecuencia

9,700

9,899

3

9,900

10,099

8

10,100

10,299

2

10,300

10,499

0

10,500

10,699

2

a) ¿Qué nivel de producción excedió el 75% de sus productos durante ese mes? b) ¿Qué nivel de producción excedió el 90% de sus productos durante ese mes? c) Analice la forma de la distribución.

3) La responsable de la biblioteca de una Universidad ordenó un estudio del tiempo que un estudiante tiene que esperar (en minutos) para que le sea entregado el libro solicitado para consulta. Se tomó una muestra a 20 estudiantes en un día normal. Los datos fueron: 12, 16, 11, 10, 14, 3, 11, 17, 9, 18, 16, 4, 7, 14, 15, 16, 5, 6, 7, 7 a) Hallar la media aritmética, media geométrica, media armónica, mediana y moda. b) ¿Cuánto tiempo máximo se debe suponer que el 75 % de los estudiantes debe esperar para obtener su libro de consulta?

8- Gráficas para datos que representan variables ordinales o nominales. 1- Diagramas de barras Se elabora mediante la utilización de barras rectangulares de ancho igual y con la misma distancia de separación entre una y otra. Puede ser simple o compuesto.

Ejemplo 10. La tabla siguiente muestra los datos sobre las preferencias de algunos deportes como Baloncesto, fútbol, natación y atletismo, para hombre y mujeres. 45 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Hombres

%

Mujeres

%

Baloncesto

6

31.58

13

68.42

Fútbol

15

78.95

4

21.05

Natación

11

57.89

8

42.11

Atletismo

8

42.11

11

57.89

Preferencia de algunos deportes según el sexo 16

Cant. de atletas

14 12 10 8 Homres

6

mujeres

4 2 0 Baloncesto

Fútbol

Natación

Atletismo

Disciplina

46 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

2- Diagrama Circular con los datos del ejemplo 10. Preferencia por algunos deportes según el sexo Atletismo 20% Natación 28%

Baloncesto 15%

Fútbol 37%

Ejemplo 11. El Banco Central de Nicaragua registró las exportaciones en el período 2001 - 2004 (en millones de dólares)

Rubro Café Carne Mariscos Oro Azúcar

2001 103 66 76 30 49

Exportaciones 2002 2003 74 86 78 84 79 69 35 35 29 26

2004 124 110 88 47 29

.

47 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Exportaciones de Nicaragua Banco Central de Nicaragua

Fuente:

140 120 Café

MIllones $

100

Carne

80

Marisco 60

Oro

40

Azúcar

20 0

2001

2002

2003

2004

Años

48 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Unidad II. Probabilidades Objetivos de la Unidad Objetivos Conceptuales ▪

Explicar el concepto y las diferentes definiciones de probabilidad

Explicar los conceptos de variable aleatoria y función de distribución

Objetivos Procedimentales ▪

Aplicar el concepto y las diferentes definiciones de probabilidad en la resolución de ejercicios.

Aplicar el concepto de variable aleatoria y establecer su correspondiente distribución de probabilidad.

Objetivos Actitudinales ▪

Valorar la importancia de la probabilidad y sus aplicaciones en su entorno.

Ser consciente de la utilidad de las propiedades de la probabilidad para resolver diferentes situaciones relativas al entorno social.

Contenidos Conceptuales Concepto

y

Contenidos Procedimentales Contenidos Actitudinales

diferentes Aplicación del concepto y Valoración

definiciones

de de

las

diferentes importancia

de

la

de

la

probabilidad,

definiciones de probabilidad probabilidad

Variables aleatorias

en la resolución de ejercicios herramienta para la solución

Fenómenos

aleatorios, y problemas de la vida de problemas de su entorno

determinísticos, muéstrales enumeración, sucesos. posibilidad,

espacios cotidiana.

finitos

social.

y Aplicación del concepto de Concientización sobre la

eventos

o variable

aleatoria

en la importancia

Incertidumbre, resolución de ejercicios y probabilidad evolución problemas

de

la

probabilidad. Relación y Diagramación

de

la como

vida herramienta para la solución

histórica del concepto de cotidiana.

diferencia

como

de problemas de su entorno de

árbol, social.

entre principio de Multiplicación, 49

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Contenidos Conceptuales

Contenidos Procedimentales Contenidos Actitudinales

probabilidad y estadística. permutaciones,

Participación activa en las

Definición de probabilidad: combinaciones. Definición distintas subjetiva,

clásica

o

Laplace,

frecuencial

de subjetiva,

de los grandes números. Concepto aleatoria

de y

distribución. aleatorias

espacio

aprendizaje

de basada en la cooperación

probabilidad. Regla aditiva grupal

variable de

función

clásica, organizativas del proceso

o frecuencial y axiomática de enseñanza

empírica, axiomática. Ley probabilidad,

formas

Probabilidad.

de Probabilidad condicional e

Variables independencia de sucesos. discretas

y Regla

multiplicativa

de

continuas, media y varianza. probabilidad. Teorema de Distribución

Bernoulli

y Bayes

Binomial.

Experimentos probabilístico

Distribución Normal.

Binomial,

distribución

Binomial.

Distribución

Normal.

Introducción: Sin tener en cuenta la profesión que se haya elegido, en algún momento se deben tomar decisiones. Con mucha frecuencia esto tendrá que hacerse sin conocer todas las consecuencias de tales decisiones. Por ejemplo, los inversionistas deben decidir sobre la conveniencia de invertir en una acción en particular, con base a las expectativas sobre rendimientos futuros. Los empresarios, al decidir comercializar un producto, enfrentan la incertidumbre sobre la posibilidad de éxito. En la actualidad, vemos que la teoría de las probabilidades ocupa un lugar importante en asuntos de negocios. La póliza de seguros de vida, por ejemplo, se basa en tablas de mortalidad y éstas a su vez, se basan en la teoría de las probabilidades. Otras tasas de seguros tales como seguros de bienes raíces y de automóviles se determinan de manera similar. La

50 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

probabilidad también juega un papel importante en la estimación del número de unidades defectuosas en un proceso de fabricación. La probabilidad de recibir pagos sobre cuentas por cobrar, las venta potenciales de un nuevo producto, los apostadores profesionales, un evento deportivo, etc son ejemplos de aplicación de la teoría de las probabilidades.

Definiciones Probabilidades Se define probabilidades como el estudio de experimentos aleatorios o de libre determinación Experimento En estadística la palabra experimento se utiliza para describir un proceso que genera un conjunto de datos cualitativos o cuantitativos. En la mayoría de los casos, los resultados del experimento dependen del azar, por lo tanto no pueden pronosticarse con exactitud.

Experimento aleatorio Definición. Un experimento aleatorio es todo proceso que consiste de la ejecución de un acto (o prueba) una o más veces, cuyo resultado en cada prueba depende del azar y en consecuencia no se puede predecir con certeza. Ejemplos 1, son experimentos aleatorios: lanzar un dado y observar el resultado, contar objetos defectuosos producidos diariamente por cierto proceso, aplicar una encuesta para obtener opiniones, etc. Experimento no aleatorio Son aquellos en donde el resultado sí puede predecirse con toda certeza Ejemplo 2. En condiciones normales elevamos la temperatura del agua a 100 grados en la escala centígrada, de hecho sabemos que se evaporará. Ejemplo 3. Tomamos un dado y marcamos con un mismo número en todas sus caras, al lanzarlo sabemos con toda seguridad cuál número va a caer.

51 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Aùo de Física Matemåtica

Espacio Muestral DefiniciĂłn. Se denomina espacio muestral al conjunto que consiste de todos los resultados posibles de un experimento aleatorio. Este conjunto se denotarĂĄ por S. Cada resultado posible de un experimento aleatorio es un elemento del espacio muestral. A cada elemento del espacio muestral se denomina tambiĂŠn punto muestral. Esto es, el espacio muestral se describe por đ?‘† = {đ?‘Ľâ „đ?‘Ľ đ?‘’đ?‘ đ?‘˘đ?‘› đ?‘?đ?‘˘đ?‘›đ?‘Ąđ?‘œ đ?‘šđ?‘˘đ?‘’đ?‘ đ?‘Ąđ?‘&#x;đ?‘Žđ?‘™ } Si el espacio muestral tiene un nĂşmero finito de elementos es posible enlistar a todos estos, y si el nĂşmero de elementos es grande o infinito el espacio muestral se describirĂĄ mediante un enunciado o regla.

Ejemplo 4. A continuaciĂłn se dan algunos experimentos aleatorios y sus correspondientes espacios muĂŠstrales: 1) El experimento aleatorio de lanzar un dado y observar el resultado obtenido, es de una sola prueba, cuyo espacio muestral se puede escribir como el siguiente conjunto de puntos muĂŠstrales: S1 = {1, 2, 3, 4, 5, 6}. 2) El experimento aleatorio de lanzar una moneda 3 veces, consiste de 3 pruebas, cuyo espacio muestral puede escribirse como el conjunto de ternas ordenadas: S2 = {CCC, CCS, CSC, SCC, SSC, SCS, CSS, SSS}. NOTA. Los espacios muestrales de experimentos aleatorios que consisten de dos o mĂĄs pruebas sucesivas se obtienen tambiĂŠn de un diagrama tipo ĂĄrbol, como el de la figura para S2.

52 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Aùo de Física Matemåtica 3a.prueba 2a.prueba 1a.Prueba

C C

C

Puntos muestrales CCC

S

CCS

C

CSC

S C

SCC

S C S S

CSS

S

SCS

C

SSC

S

SSS

Diagrama del ĂĄrbol. 3) Si el experimento aleatorio es lanzar una moneda tantas veces como sea necesario hasta que aparezca la primera cara, su espacio muestral es el conjunto: S4 = {C, SC, SSC, SSSC,...etc.}. 4) Si el experimento aleatorio es medir la vida Ăştil (en horas) de una marca de artefacto elĂŠctrico, su espacio muestral es el conjunto: đ?‘†5 = {đ?‘Ą ∈ â„?/đ?‘Ą ≼ 0} (AquĂ­, â„? representa a los nĂşmeros reales).

ClasificaciĂłn de los espacios muestrales. Por el nĂşmero de elementos o puntos muestrales, los espacios muestrales se clasifican en: 1) Discretos finitos, consisten de un nĂşmero finito de elementos, por ejemplo, los espacios S1, S2, S3. 2) Discretos infinitos, consisten de un nĂşmero infinito numerable de elementos, por ejemplo, el espacio S4. 3) Continuos, consisten de un nĂşmero infinito no numerable de elementos, por ejemplo, los espacios S5, y S6 Suceso aleatorio Se llama suceso aleatorio a todo suceso que puede ocurrir o puede no ocurrir como resultado de la realizaciĂłn de un fenĂłmeno.

53 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Aùo de Física Matemåtica

Suceso elemental Se llama suceso elemental a aquel suceso A que no se puede expresar como suma de dos sucesos diferentes de A. Los sucesos elementales se identifican con los elementos del espacio muestral y ĂŠstos son los resultados posibles del hecho o experimento. đ?‘† = {đ?‘?, đ?‘ } Ejemplo 5. {đ?‘? }

Suceso elemental

{đ?‘ }

Suceso elemental Suceso compuesto

Es el resultado de dos o mĂĄs sucesos elementales.

Ejemplo 6. Al lanzar un dado corriente el espacio muestral, es S = 1 1,2

,2 3

4

1, 2, 3

5

6

1, 2, 3, 4, 5, 6

luego:

Son elementales: en cambio, los sucesos:

2, 3, 5 etc. Son sucesos compuestos.

Algunas definiciones y operaciones con conjuntos Conjunto universo: Comprende la totalidad de los elementos. Se representa por U. Ejemplo 7. a) El conjunto formado por las letras vocales.

U=

b) El conjunto formado por los nĂşmeros dĂ­gitos. U =

a, e, i, o, u 0, 1, 2, 3, 4, 5, 6, 7, 8, 9

Conjunto uniĂłn: Se define como el conjunto formado por los elementos que pertenezcan al primer conjunto, al segundo conjunto y a ambos. Se denota por A U B =

Conjunto

x/ x Đ„ A, x Đ„ B

y x Đ„ (A∊B)

intersecciĂłn: Se define como el conjunto formado por los elementos que

pertenecen a ambos conjuntos. Se denota por A ∊ B = x / x Đ„ A y x Đ„ B

Conjunto complemento: Se define el complemento de A como el conjunto formado por los elementos que estĂĄn en el universo pero que no estĂĄn en el conjunto A. 54 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Se denota por Ac =

x/xЄU y xЄA

Diferencia de conjuntos: La diferencia de dos conjuntos denotada por A – B se define como el conjunto formado por los elementos que pertenecen al conjunto A pero que no pertenecen al conjunto B. A–B =

x/xЄA y xЄB

Conjunto vacío: El conjunto vacío se caracteriza por la carencia de elementos. Se denota por Ø o bien por.

Ejemplo 8. Sean los conjuntos: U = 1, 3, 4, 5, 7, 8, 9

A = 1, 4, 7

B = 3, 4, 5, 8

C = 1, 7, 8

Calcular: 1) A U B,

3) (A ∩ B) - (B ∩ C)

2) A U (B – C),

4) (A U B) c,

5) Ac ∩ Bc

Solución: 1) A U B =

1, 3, 4, 5, 7, 8

2) A u (B – C) =

1, 3, 4, 5, 7

3) (A ∩ B) - (B ∩ C) = 4) (A U B)c = 5) A ∩ B′ =

4

9 3, 5, 8, 9

1, 7, 9

=

9

Definición clásica de probabilidad (modelo clásico o a priori) Si un experimento aleatorio tiene n resultados igualmente posibles (n > 0) de los cuales m son favorables a la ocurrencia de un suceso A, entonces se llama probabilidad de un suceso A al cociente m / n y se denota por P(A); es decir:

P(A) = MS.c Cliffor Jerry Herrera castrillo

m n

55


Estadística y Probabilidades – II Año de Física Matemática

m: Son casos favorables al suceso A n: Son casos posibles (o totales) del experimento. Propiedades 1-

0 ≤ P(A) ≤ 1

2-

P (S) = 1

3-

P (A U B) = P (A) + P (B)

4-

si (A ∩ B) = Ø

P (A U B) = P (A) + P (B) – P (A ∩ B)

5-

P (Ø) = 0

6-

P (Ac) = 1 - P (A)

si (A ∩ B) ≠ Ø

Tipos de probabilidad Probabilidad Objetiva: La probabilidad objetiva se divide en dos: 1) Probabilidad clásica (O A PRIORI): Esta se basa en la suposición de que los resultados de los experimentos son igualmente probables. Usando el punto de vista clásico la probabilidad de que un evento ocurra, se calcula dividiendo el número de casos favorables, entre el número de posibles resultados. Esto es: Número de casos favorables Probabilidad de un evento = ------------------------------------------Número de resultados posibles Ejemplo9.: Probabilidad de un evento =

----------------------------------------------

Se lanza un dado corriente ¿Cuál es la probabilidad de obtener un número par? Número de resultados posibles

Solución: P(par) = 3 / 6 = 1 / 2 = 0.50 o bien 50 % Otros ejemplos cásicos son: •

Lotería estatal

Juegos de cartas, etc.

2) Probabilidad empírica (MODELO A POSTERIORI): Se basan en la frecuencia relativa histórica. Esto es, la probabilidad de que un evento ocurra a lo largo del

56 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

tiempo, se determina observando el número de veces que eventos similares ocurrieron en el pasado. Número de veces que ocurrió el evento en el pasado Probabilidad de que un evento ocurra = ---------------------------------------------Número de observaciones Ejemplo 10. Un estudio de 751 administradores graduados en una Universidad, mostraron que 383 no fueron empleados en su área principal de estudio.

Como ilustración, una persona

que se especializó en contabilidad, es ahora Gerente de mercadotecnia en una empresa procesadora de tomates. ¿Cuál es la probabilidad de de que un determinado graduado de negocios, sea empleado en un área distinta a su área principal de la escuela? P(A) =

383 751

Por tanto,

P(A) = 51 %

Otros ejemplos empíricos son: •

Establecer tasas de seguros

Reportear índices de curación de varias enfermedades y condiciones, etc.

3) Probabilidad Subjetiva: La probabilidad de que un evento particular ocurra, que es asignada por un individuo, basándose en la información que tenga disponible.

Ejemplo 11. •

Apostar en eventos atléticos.

Estimar el futuro de una industria.

4) Probabilidad Conjunta: Es una probabilidad que mide la posibilidad de que dos o más eventos ocurran simultáneamente. No son mutuamente excluyentes: P (A U B) = P (A) + P (B) – P (A ∩ B)

57 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ejemplo 12. Las probabilidades de que la recepcionista de un dentista, su asistente o ambos se enfermen cierto día son 0.04, 0.07 y 0.02 respectivamente. ¿Cuál es la probabilidad de que cuando menos uno de los dos se enferme ese día? P(A U B) = 0,04 + 0,07 – 0,02 P(A U B) = 0,09 Sucesos independientes Si la ocurrencia de un suceso A no altera la probabilidad de ocurrencia de otro suceso B, se puede adoptar el término de independencia para describir esta situación y decir que A y B son independientes. Dos sucesos A y B de llaman independientes si y sólo si: P (A ∩ B) = P (A) . P (B) Sucesos dependientes Se dice que dos sucesos son dependientes si la ocurrencia de uno de ellos, afecta la ocurrencia del otro.

Probabilidad condicional Se llama probabilidad condicional o probabilidad de un suceso A condicionada por la ocurrencia de otro suceso B al cociente.

P( A / B) =

P( A  B) P(B) ≠ 0.P(A / B): Léase “Probabilidad de A dado B”. P( B)

Ejemplo 13. La probabilidad de que un vuelo de programación regular despegue a tiempo es P(D) = 0,83; la de que llegue a tiempo es P(A) = 0,82 y la de que despegue y llegue a tiempo es P (D  A) = 0,78. Encuentre la probabilidad de que un avión: a) Llegue a tiempo dado que despegó a tiempo. b) Despegue a tiempo dado que llegó a tiempo. a) P(A / D) =

P( A  D ) P(A / D) = P (D )

0,78 0,83

= 0,94

58 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

b)P(D / A) =

P (D  A) 0,78 P(D / A) = 0,82 = 0,9512 P ( A)

Ejemplo 14. Una universidad que proporciona educación para ambos sexos tiene tres carreras: ciencias, administración e ingeniería. La inscripción es la siguiente:

Ciencias

Administración

Ingeniería

Total

Hombre

250

350

200

800

Mujer

100

50

50

200

Total

350

400

250

1,000

Si se ha de seleccionar aleatoriamente un estudiante: a) ¿Cuál es la probabilidad de que estudie ciencias dado que es varón? b) ¿Cuál es la probabilidad de que sea mujer dado que es estudiante de ingeniería?

250 P(C  H ) 250 a) P(C / H) = P(C / H) = 1000 = = 0,3125 800 P (H ) 800 1000

P(M  I ) b) P(M / I) = P (I )

50 50 P(M / I) = 1000 = = 250 250 1000

0,20

Regla de la multiplicación Sean A y B dos eventos contenidos en S (espacio muestral), entonces la probabilidad de que se dé A y B es igual al producto de la probabilidad de B por la probabilidad de A dado B; es decir:

P (A ∩ B) =P(B) . P (A / B)

Ejemplo 15. Una urna contiene 5 pelotas rojas, 3 azules y 2 blancas. Si se extraen dos de ellas (primero una y después la otra) y sin remplazamiento. Hallar la probabilidad de que: 59 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

a) ambas sean rojas b) una sea roja c) la primera sea roja d) al menos una sea roja e) ninguna sea roja.

R 4/9 R

3/9

A

5/10 2/9 5/9 2/9

3/10

B R A

A 2/9 B R

2/10 5/9 3/9 B

A 1/9 B

a) P (RR) = P(R) . P(R) = (5/10) . (4/9) = 20 / 90 = 2/9 b) P (una sea roja) = P (RA) + P (RB) + P (AR) + P/BR) = (5/10) (3/9 ) + (5/10) ( 2/9 ) + (3/10) (5/9) + (2/10) (5/9) = 15/90 + 10/90 + 15/90 + 10/90 = 50/90 = 5/9

c) P (la primera es roja) = P(RR) + P/RA) + P(RB) = (5/10) (4/9) + (5/10) (3/9) + (5/10) (2/9) = 20/90 + 15/90 + 10/90 = 45/90= 1 / 2

d) P (al menos una sea roja) = P(1 roja) + P(2 rojas) = 5 / 9 + 2 / 9 = 7 / 9

e) P (ninguna sea roja) = P (AA) + P (AB) + P (BA) + P (BB) 60 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

= (3/10) (2/9) + (3/10) (2/9) + (2/10) (3/9) + (2/10) (1/9) = 6 / 90 + 6 / 90 + 6 / 90 + 2 / 90 = 20 / 90 = 2/9

Probabilidad total Si B1, B2, . . . . .Bn representa una partición de S y se B es un evento arbitrario sobre S, entonces la probabilidad total sobre A está dado por:

P(A) = P(B1) . P/A / B1) + P(B2) . P/A / B2) + . . . . . P(Bk) . P/A / Bk) Este teorema es muy útil ya que existen numerosas situaciones prácticas en las cuales P(A) no puede calcularse directamente, sin embargo con la información de que B ha ocurrido, es posible evaluar P(A / B) y por tanto, determinar a P(A) cuando se obtienen los valores de P(B). Otro resultado importante de la ley total de probabilidad es conocida como teorema de Bayes.

Regla de Bayes Si B1, B2, . . . . Bk constituye una partición del espacio de muestreo S y si A es un evento arbitrario sobre S, entonces para r = 1, 2, . . . . . k.

P (Br / A) =

P(Br )P(A / Br )

 P(B )P( A / B ) k

1

i

o bien:

i

P(Br )P (A / Br )

P(Br / A) =

P( B1 ).P( A / B1 ) + P( B2 ) P( A / B2 ) + .......... ...P( Bk ) P( A / Bk )

Ejemplo 16. Tres compañías suministran transistores NPN a un fabricante de equipo de telemetría. Supuestamente todos los transistores están hechos de acuerdo a las mismas especificaciones. Sin embargo, el fabricante ha probado durante varios años dos parámetros de calidad de los transistores. Y los registros indican la siguiente información, declarándose defectuoso a un transistor si cualquiera de los parámetros está fuera de especificación. 61 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

__________________________________________________________________ Firma

Proporción de defectuoso

Proporción suministrada por

_________________________________________________________________ 1

0,02

0,15

2

0,01

0,80

3

0,03

0,05

-------------------------------------------------------------------------------------------------------------Debido a los costos involucrados el fabricante ha cesado las pruebas, y puede considerarse de manera razonable que las fracciones de defectos y la mezcla en inventario son las mismas que durante el período en que se realizaron los registros. El director de producción selecciona aleatoriamente un transistor, lo lleva al departamento de prueba y descubre que es defectuoso. Si A es el evento de que un elemento es defectuoso, y si B es el evento de que el elemento proviene de la compañía i (i = 1, 2, 3), entonces es posible evaluar P (Bi /A). Por ejemplo, suponga que se desea determinar P(B3 / A). Entonces:

P(B3 )P( A / B3 ) P (B3/ A) = P ( B1 ).P ( A / B1 ) + P ( B2 ) P ( A / B2 ) + ( B3 ) P( A / B3 ) P (B3/ A) = P (B3/ A) =

(0.05)(0.03) (0..15)(0.02) + (0.80)(0.01) + (0.05)(0.03) 3 = 0.12 25

Ejercicio

1.- Las probabilidades de que una estación de televisión reciba 0, 1, 2, 3, 4, . . . 7 o cuando menos 8 quejas después de transmitir un programa de controversia son, respectivamente 0.02, 0.04, 0.07, 0.12, 0.15, 0.19, 0.18, 0.14 y 0.09: ¿Cuáles son las probabilidades de que después de transmitir un programa la estación reciba: a) Cuando menos 5 quejas? b) Cuando mucho 3 quejas? c) De dos a cuatro quejas?.

62 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

2.-Las probabilidades de que la utilidad de una nueva máquina de escribir se clasifique como difícil, muy difícil, promedio, fácil o muy fácil son respectivamente 0,11; 0,16; 0,35; 0,28 y 0,10. Determine las probabilidades de que la utilidad de la nueva máquina de escribir se clasifique como: a) difícil o muy difícil. b) difícil, promedio o fácil. c) fácil o muy fácil.

3.- Un artista que ha introducido una pintura al óleo grande y una pequeña a una exposición, siente que las probabilidades son respectivamente 0,15; 0,18 y 0,11 de que venderá el óleo grande, el pequeño o ambos. ¿Cuál es la probabilidad de que venderá alguna de las dos pinturas?.

4.- La probabilidad de que un conductor imprudente será multado, se le revocará la licencia o ambas son, respectivamente; 0,88; 0,60 y 0,55; ¿Cuál es la probabilidad de que será multado o de que se le revocará la licencia?.

5.- La probabilidad de que un concierto dado reciba la publicidad adecuada es 0,80; y la probabilidad de que recibirá la publicidad adecuada y también será un gran éxito es 0,76. ¿Cuál es la probabilidad de que si el concierto recibe la publicidad adecuada será un gran éxito?.

6.- La profesora de inglés piensa que la probabilidad es 0,60 de que un examen final por escrito que recibe estará bien redactado. Si la probabilidad es 0,51 de que este examen final estará bien escrito y también recibirá una buena calificación. ¿Cuál es la probabilidad de que un examen final bien escrito recibirá una buena calificación?.

7.- En dos tiros de un dado equilibrado, determine las probabilidades de obtener: a) Dos seis. b) Primero un seis y después algún otro número. 63 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

8.- Un zoólogo tiene cuatro cerdos de guinea machos y ocho hembras y elige a dos de ellos al azar para realizar un experimento; ¿cuáles son las probabilidades de que: a) ambos animalitos sean machos. b) ambos animalitos sean hembras. c) habrá uno de cada sexo.

9.- La probabilidad es 0,70 de que una rara enfermedad tropical se diagnostique correctamente. Si ésta se diagnostica en forma correcta la probabilidad es 0,90 de que el paciente se sanará. Si no, la probabilidad es 0,40 de que el paciente se sanará. Si se cura un paciente que tiene esta enfermedad, ¿cuál es la probabilidad de que se haya diagnosticado correctamente?.

10.- En una fábrica de zapatos se sabe por experiencia pasada que la probabilidad es 0,82 de que un trabajador que ha asistido a un programa de capacitación de la fábrica, cumplirá con la cuota de producción, y que la probabilidad correspondiente es 0,53 para un trabajador que no asistió al programa de capacitación. El 60 % de los trabajadores asisten al programa de capacitación de la fábrica. ¿Cuál es la probabilidad de que un trabajador que cumple con la cuota de producción habrá asistido al curso?.

11) En una ciudad se seleccionó una muestra de 500 personas para determinar diversas informaciones relacionadas con el comportamiento del consumidor. Entre las preguntas hechas se encontraba ¿Prefiere comprar productos nacionales o importados?. De 240 hombres, 140 contestaron que prefieren comprar productos importados y 80 mujeres expresaron que prefieren productos nacionales. a) Elabore una tabla de contingencias en donde las variables cualitativas son sexo y preferencias por sus productos. b) Se selecciona una persona de manera aleatoria. Determinar la probabilidad de que el entrevistado: 1) Sea hombre 2) Sea mujer 64 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

3) Prefiera comprar productos importados 4) Prefiera comprar productos nacionales

TECNICAS DE CONTEO A) Notación factorial El producto de los enteros positivos de 1 a n inclusive ocurre con mucha frecuencia en matemáticas. Este se representa por el símbolo especial n! Que se lee “n factorial”. Es decir: n! = 1 .2 .3 . . . . (n – 2) (n – 1) n = n (n – 1) ( n – 2) . . . . 3 .2 . 1 Ejemplo 17. : a) 5! = 5 .4 .3 .2 . 1 = 120

e) 1!

b) 4! =

4 .3 .2 . 1 = 24

f)

c) 3! =

3 .2 . 1 =

6

g)

d) 2! =

2.1=

2

h) 12 .11 . 10 =

0!

=

1

=

1

8! 8.7.6! = = 56 6! 6! 12.11.10.9! 12! = 9! 9!

B) Coeficientes binomiales El símbolo   donde n y r son números enteros positivos con r < n (léase “nCr” o “n r n

 

tomado r en r”) se define de la siguiente manera.

n(n − 1)(n − 2).....(n − r + 1) n   = r (r − 1).... 3.2.1 r

o

n! n   =  r  r!.(n − r ).!

Ejemplo 18.

8! 8.7.6! 8.7 56 8 = = = = 28   = 2!.(8 − 2).! 2.6! 2 2  2

65 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

10! 10.9.8.7! 10.9.8 720 10  = = = = 120   = 3!.(10 − 3).! 3.2.1.7! 3 .2 .1 6 3

C) Permutaciones Cualquier ordenamiento (o arreglo) de un conjunto de n objetos en un orden dado se denomina una permutación de los objetos tomados todos al tiempo. Cualquier ordenamiento de cualquier r < n de estos objetos en un orden determinado se denomina una permutación r (o una permutación de n objetos tomados r a la vez).

1) P(n.n) =

n!

Cuando r = n

2) P(n.r) =

n! Cuando r < n .(n − r ).!

3) P(n.r) =

n! Cuando hayan repeticiones y n = n1 + n2 + . . . . + nr. .n1 !.n 2 !....nr!

4) P(n) = (n – 1)!

Cuando se trate de un arreglo circular.

Ejemplo 19. ¿De cuántas maneras se pueden colocar 5 bolas de diferentes colores en una línea horizontal? Solución: P (5, 5) = 5! = 120 maneras.

Ejemplo 20. ¿De cuántas maneras se pueden sentar 8 personas en un banco que tiene capacidad para cuatro? Solución: P (8, 4) =

8! 8! 8.7.6.5.4! = = = 8 .7 .6 .5 = 1, 680 maneras. .(8 − 4 ).! 4! 4!

Ejemplo 21. ¿Cuántas señales diferentes se pueden hacer con 10 banderas de las cuales 4 de ellas son rojas, 3 son blancas, 2 son azules y 1 es amarilla?. Solución: P (10.4) =

3,628,800 n! 10! = = .n1 !.n 2 !....nr! .4!.3 2 !.2!.1! (24)(6)(2)(1)

=

3,628,800 =12,600 288

66 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ejemplo 22. ¿De cuántas maneras se pueden sentar a comer 5 personas alrededor de una mesa redonda?. Solución: P (5, c) = (5 - 1)! = 4! = 4 .3 .2 . 1 = 24 maneras.

D) Reglas de adición y de multiplicación Ejemplo 23. Un restaurante tiene en su menú de postres, 4 clases de ponqués, 2 clases de galletas y 3 clases de helados. Encuentre el número de formas en que una persona puede selecciona: a) Uno de los postres

Solución 4 + 2 + 3 = 9

b) Uno de cada clase de postres.

R.

Solución (4) (2) (3) = 24

9

R. 24

Ejemplo 24. Una clase está conformada por 8 estudiantes hombres y 6 estudiantes mujeres. Encuentre el número de formas en que la clase puede elegir: a) Un representante para la clase.

Solución

8 + 6 = 14

b) 2 representantes para la clase, un hombre y una mujer.

R. 14

Solución. (8) (6) R. 48

c) Un presidente y un vicepresidente. Solución (14) (13)= 182

R. 182

E) Combinaciones Supongamos que tenemos una colección de n objetos. Una combinación de estos n objetos, tomados r a la vez, es cualquier selección de r objetos donde el orden no cuenta. En otras palabras, una combinación r de un conjunto de n objetos es cualquier subconjunto de r elementos. Ejemplo 25. Encuentre el número de combinaciones de cuatro objetos a, b, c, d , tomados en grupos de a tres y compare con las permutaciones de los cuatro objetos tomados en grupos de a tres. Combinaciones

Permutaciones

abc

abc, acb, bac, bca, cab, cba

abd

abd, adb, bad, bda, dab, dba

acd

acd, adc, cad, cda, dac, dca

bcd

bcd, bdc, cbd, cdb, dbc, dcb 67

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

n La fórmula para las combinaciones es:   = r

n! r!.(n − r ).!

Ejemplo 26. Una señora tiene 11 amigos de confianza. a) ¿De cuántas maneras puede invitar 5 de ellos a comer? b) ¿De cuántas maneras si dos de ellos son casados y sólo asisten si van juntos? c) ¿De cuántas maneras si dos de ellos están disgustados y no asistirán juntos?

Solución: 11 a)   = 5

11! 11! 11.10.9.8.7.6! = = 5!.(11 − 5).! 5!.6.! 5!.6.!

=

11.10.9.8.7 55,440 = = 462 120. 120

2 9 2 9 b)     +     = 1(84) + 1(126) = 84 + 126 = 210  2   3  0 5 2 9 c)     = 2 (126) = 252 1 4   

Ejemplo 27. Una clase está conformada por 9 varones y 3 mujeres. El profesor quiere organizar un comité de cuatro personas. a) ¿De cuántas maneras puede formar el comité? b) ¿Cuántos comité tendrán exactamente 1 mujer? c) ¿Cuántos comité tendrán 1 mujer por lo menos? Solución:

12! 12  =  =  4  4!.(12 − 4 ).!

a) 

12! 12.11.10.9.8! 12.11.10.9 12.11.10.9 11,880 = = = = = 495 4!.8! 4!. 24. 24. 4!.8!

3 9 b)     = 3 (84) = 252 1 3   

3 9 3 9 3 9 c)     +     +     = 3 (84) + 3 (36) + 1 (9) = 252 + 108+ 9 = 369  1   3  2  2  3  1 

68 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

EJERCICIO Permutaciones 12) ¿Cuántos números impares de 4 cifras pueden formarse con los números dígitos (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)

13) Encuentre el número de formas cómo se pueden distribuir 9 juguetes entre 4 niños, si el más pequeño debe recibir 3 juguetes, y cada uno de los otros, dos juguetes.

14) Un grupo que debate está conformado por 3 muchachos y 3 niñas. Encuentre el número n de formas en las cuales se pueden sentar en una fila donde a) no hay restricciones, b) los muchachos y las niñas se sientan juntas, c) solamente las niñas se sientan juntas.

15) Encuentre el número n de formas en que un juez puede otorgar el primero, segundo y tercer lugares en un concurso con 18 participantes

16) Encuentre el número n de formas en que 5 libros grandes, 4 libros medianos y 3 libros pequeños se pueden colocar en una repisa de manera que todos los libros del mismo tamaño estén juntos.

Reglas de adición y de la multiplicación 17) Suponga que una clave consiste en 4 caracteres donde el primer carácter debe ser una letra del alfabeto, pero cada uno de los demás caracteres puede ser una letra o un dígito. Encuentre el número de: a) Palabras claves b) Palabras claves que empiezan con una de las cinco vocales

18) Hay 6 caminos entre A y B y 4 caminos entre B y C. Encuentre el número n de formas en que una persona puede conducir: a) Desde A hasta C a través de B, b) Viaje de ida y regreso desde A hasta C a través de B.

69 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

c) Viaje de ida y regreso desde A hasta C a través de B sin utilizar el mismo camino más de una vez.

Combinaciones 19) Un estudiante tiene que contestar 10 de 13 preguntas en un examen: a) ¿Cuántas selecciones hay? b) ¿Cuántas habrá si el estudiante debe responder las dos primeras preguntas? c) ¿Cuántas si el estudiante debe responder la primera o la segunda pregunta, pero no ambas?. 20) ¿Cuántos comités formados por 3 hombres y 2 mujeres se pueden organizar si se dispone de 5 mujeres y 8 hombres?.

21) Encuentre el número m de formas en que 12 estudiantes pueden ser repartidos en 3 equipos T1, T2, T3 de manera que cada equipo contenga 4 estudiantes.

22) Un restaurante tiene 6 postres diferentes. Encuentre el número de formas en que un cliente puede escoger 2 de los postres.

23) Una caja contiene 6 medias azules y 4 medias blancas. Encuentre el número de formas en que puede sacarse de la caja 2 medias cuando a) no hay restricciones, b) hay colores diferentes, c) las medias so del mismo color.

Otros problemas (variados) 24) La caja A contiene 5 canicas rojas y 3 canicas azules y la caja B contiene 3 rojas y 2 azules. Se saca una canica al azar de cada caja. a) Encuentre la probabilidad p de que ambas canicas sean rojas b) Encuentre la probabilidad p de que una sea roja y una sea azul

25) Un lote de producción de 100 unidades de las cuales se sabe que 20 están defectuosas. Una muestra aleatoria de 4 unidades se selecciona sin reemplazo, ¿cuál es la probabilidad de que la muestra no contenga más de 2 unidades defectuosas?. 70 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

26) Se elige al azar un punto dentro de un círculo ¿cuál es la probabilidad de que el punto esté más cerca del centro que de la circunferencia?

27) La probabilidad de que una industria estadounidense se ubique en Munich es de 0.7, de que se ubique en Bruselas es de 0.4 y de que se encuentre ya sea en Bruselas o en Munich, o en ambas, es de 0.8, ¿Cuál es la probabilidad de que la industria se ubique: a) en ambas ciudades b) en ninguna de ellas?

28) Dos hombres A y B disparan a un objetivo. Suponga que P(A) = 1/3 y P(B) = 1/5 representan sus probabilidades de tocar el objetivo. (Se supone que los eventos A y B son independientes). Encuentre la probabilidad de que: a) A no logre el objetivo

c) uno de ellos logre el objetivo

b) Ambos logren el objetivo d) Ninguno logre el objetivo

29) Hay cinco caballos en una carrera. Adriana escoge a dos de ellos y les apuesta. Encuentre la probabilidad p de que Adriana sea la ganadora. 30) Sea P(A) = 0.6

P(A  B) = 0.2

P(B) = 0.3

Hallar la probabilidad de que: a) A no ocurra

c) A o B ocurra

b) B no ocurra

d) No ocurra A ni B

31) El peso de un dado ha sido alterado de manera que los resultados produzcan la siguiente distribución de probabilidad:

Resultado

X

Probabilidad P(x)

1

2

3

4

5

6

0.1

0.3

0.2

0.1

0.1

0.2

Considere los eventos A = par 

B = 2, 3, 4, 5 

C = x < 3 

D = x > 7 

Encuentre las siguientes probabilidades: 71 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

a) P(A) b)P(B) c) P(C) d)P(D)

32) En una bolsa se han colocado 4 pelotas blancas y 3 negras, y en una segunda bolsa, 3 blancas y 5 negras. Se saca una pelota de la primera bolsa y, sin verla, se mete en la segunda. A continuación se saca una pelota de la segunda bolsa ¿Cuál es la probabilidad de que la pelota que se saque de esta última sea negra?

33) Una firma de transporte tiene un contrato para enviar carga de mercancías de la ciudad A a la ciudad B. No hay rutas directas que enlacen A con B, pero hay seis carreteras de A a X y cinco de X a B ¿Cuántas rutas en total deben considerarse?.

34) El gerente de una pequeña planta desea determinar el número de maneras en que puede asignar trabajadores al primer turno. Cuenta con 15 hombres que pueden servir como operadores del equipo de producción, 8 que pueden desempeñarse como personal de mantenimiento y 4 que pueden ser supervisores. Si el turno requiere 6 operadores, 2 trabajadores de mantenimiento y 1 supervisor. ¿De cuántas maneras puede integrarse el primer turno?.

35) En cierta universidad 20 por ciento de los hombres y 1 por ciento de las mujeres miden más de dos metros de altura. Asimismo, 40 por ciento de los estudiantes son mujeres. Si se selecciona un estudiante al azar y se observa que mide más de dos metros; ¿cuál es la probabilidad de que sea mujer?

36) En un centro de maquinaria hay cuatro máquinas automáticas para producir tornillos. Un análisis de los registros de inspección anteriores producen los siguientes datos. (Par)

Máquina

Porcentaje de producción

Porcentaje de defectuosos 72

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

1

15

4

2

30

3

3

20

5

4

35

2

Las máquinas 2 y 4 son nuevas y se les ha asignado más producción que a las máquinas 1 y 3. Suponga que la combinación de inventarios refleja los porcentajes de producción indicados: a) Si se elige un tornillo al azar del inventario ¿cuál es la probabilidad de que esté defectuoso?. b) Si se elige un tornillo y se encuentra que es defectuoso ¿Cuál es la probabilidad de que se haya producido en la máquina 3?.

37) Una empresa industrial grande utiliza tres hoteles locales para proporcionar alojamiento a sus clientes durante la noche. De pasada experiencia se sabe que al 20 % de ellos se les asigna habitación en el Ramada Inn, al 50 % en el Sheraton y al 30 % en el Lakeview Motor Lodge. Si existe una falla en el servicio de plomería en el 5 % de los cuartos del Ramada Inn, en 4 % de los cuartos del Sheraton y en 8 % de los cuartos del Lakeview Motor Lodge, ¿cuál es la probabilidad de que: a) A un cliente se le asigne un cuarto con problemas de plomería? b) A una persona con un cuarto que tenga problemas de plomería se la asigne acomodo en el Lakeview Lodge?

38) Un espacio muestral de 200 adultos se clasifica de acuerdo a su sexo y nivel de educación. Educación

Hombre

Mujer

Primaria

38

45

Secundaria 28

50

Técnica

17

22

Si se selecciona aleatoriamente una persona de este grupo, encuentre la probabilidad de que: 73 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

a) Sea hombre dado que tiene educación de nivel secundaria. b) No tenga

una función que asocia un número real con cada elemento del espacio muestral.

Una variable aleatoria es una variable cuyo valor es el resultado de un evento aleatorio. Ejemplo 1. Lance una moneda al aire tres veces y anote el número de caras que se obtiene. El espacio muestral es S = ccc, ccs, csc, css, scc, scs, ssc, sss

Suponga que la variable aleatoria está formada por el número de caras. Entonces los resultados posibles son 0 caras, 1 cara, 2 caras o 3 caras. Estos son los valores de la variable aleatoria. Ejemplo 2. Los pesos de envío de la leche en recipientes oscilan entre 10 a 25 kilogramos. Los pesos reales de los recipientes llenos de leche, en kilogramos, son los valores de la variable aleatoria “peso”.

Las variables aleatorias pueden ser discretas o continuas. Una variable aleatoria discreta puede asumir sólo ciertos valores. Con frecuencia son números enteros. Resultan principalmente del conteo.

El número de caras en el experimento de lanzamiento de la moneda es un ejemplo de una variable aleatoria discreta. Los valores de la variable se restringen sólo a ciertos números: 0, 1, 2 y 3. Ejemplo 3. El empleado de un almacén regresa tres cascos de seguridad al azar a tres empleados de un taller siderúrgico que ya los había probado. Si Smith, Jones y Brown, en ese orden reciben uno de los tres cascos. Liste los puntos muestrales para los posibles órdenes de regreso de los cascos y encuentre el valor de la variable aleatoria X que representa el número de asociaciones correctas.

74 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Solución: Si S, J y B representan los cascos de Smith, Jones y Brown, respectivamente, entonces los posibles arreglos en los que se pueden regresar los cascos y el número de asociaciones correctas son:

Espacio muestral

m

SJB

3

SBJ

1

JSB

1

JBS

0

BSJ

0

BJS

1

Una variable aleatoria continua resulta principalmente de la medición y puede tomar cualquier valor, al menos dentro de un rango dado.

Un ejemplo son los pesos del agua mineral. Los recipientes llenos de agua pueden tomar cualquier valor entre 10 y 25 Kg.

Otros ejemplos: Estatura de clientes en una tienda de ropa Ingresos de los empleados de una camaronera Tiempo transcurrido entre la llegada de cada cliente en una granja agropecuaria.

Definición: Si un espacio muestral contiene un número finito den posibilidades o una serie interminable con tantos elementos como números enteros existen, se llama espacio muestral discreto. Definición: Si un espacio muestral contiene un número infinito de posibilidades igual al número de puntos en un segmento de línea, se llama espacio muestral continuo. 75 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Distribuciones discretas de probabilidad Una variable aleatoria discreta toma cada uno de sus valores con cierta probabilidad. En el caso de lanzar una moneda tres veces, la variable X que representa el número de caras, toma el valor 2 con probabilidad de 3 , puestres de los ocho puntos muestrales igualmente posibles 8

tienen como resultado dos caras y un sol.

X P(x)

0 1 8

1 3 8

2

Σ

3

3 8

1

1 8

En el caso de los cascos (ejemplo 3), la distribución de probabilidad es: X P(x)

0 1 3

1 1 2

Σ

3 1

1 6

Ejemplo 4. Un embarque de ocho microcomputadoras similares para una tienda, contiene tres que están defectuosos. Si una escuela hace una compra al azar, de dos de estas computadoras, encuentre la distribución de probabilidad para el número de defectuosas.

La variable aleatoria puede tomar cualquiera de los números 0, 1, y 2.

 3  5   0   2      = 10 f(1) = P(X = 1) = f(0) = P(X = 0) = 28 8    2  

X P(x)

 3  5   1       1  = 15 28 8    2  

0

1

2

Σ

10 28

15 28

3 28

1 76

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

 3  5    2  0      = f(1) = P(X = 2) = 8   2   

3 28

La distribución acumulada La distribución acumulada F(x) de una variable aleatoria discreta X con distribución de probabilidad f(x) es:

F(x) = P(X< x) =

 f (t )

para

−< x <

tx

Ejemplo 5. Si una agencia de autos vende 50% de su inventario de cierto vehículo equipado con bolsas de aire, encuentre: a) Una fórmula para la distribución de probabilidad del número de autos con bolsas de aire entre los siguientes cuatro autos que venda la agencia. b) La distribución acumulada de la variable aleatoria X.

Solución a) El evento de vender x modelos con bolsas de aire y 4 – x modelos sin bolsas de aire,  4 puede ocurrir de   formas, donde x puede ser 0, 1, 2, 3, o 4. Entonces la  x

distribución de probabilidad es:

 4    x f(x) = para0, 1, 2, 3, o 4 16 b) F(0) = f(0) = 1 / 16 F(1) = f(0) + f(1) = 5 / 16 F(2) = f(0) + f(1) + f(2) = 11 / 16 F(3) = f(0) + f(1) + f(2) + f(3) = 15 / 16 77 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

F(4) = f(0) + f(1) + f(2) + f(3) + f(4) = 1

x

0

1

2

3

4

Σ

P(x)

1/16

4/16

6/16

4/16

1/16

1

F(x)

1/16

5/16

11/16

15/16

1

Histograma de probabilidad 0.40

0.38

0.35 0.30

0.25

0.25

0.25 0.20

0.15 0.10

0.06

0.06

0.05 0.00 0

1

2

3

4

Distribución acumulada discreta 16/16 12/16 8/16 4/16 0

1

2

3

4

Valor esperado El valor esperado (o media) se encuentra multiplicando cada resultado posible de la variable por su probabilidad y luego se suman esos productos.

 = E ( X ) =  ( xi ) P( xi ) 78 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Varianza La varianza de una distribución de probabilidad es la suma del cuadrado de las desviaciones de cada valor de la variable aleatoria con respecto a la media, multiplicada por sus probabilidades respectivas.

 2 =  ( xi −  ) 2  P( xi ) Ejemplo 6. La distribución de probabilidad de lanzar un dado se muestra en las primeras dos columnas de la siguiente tabla. Calcular el valor esperado (o media), varianza y desviación estándar.

(1)

(2)

(3)

(4)

Solución

P(xi)

(xi).P (xi)

1

1/6

1/6

(1-3.5) . 1/6= 1.04166

2

1/6

2/6

(2-3.5) . 1/6 = 0.37500

3

1/6

3/6

(3-3.5) . 1/6 = 0.04166

4

1/6

4/6

(4-3.5) . 1/6 = 0.04166

5

1/6

5/6

(5-3.5) . 1/6 = 0.37500

6

1/6

6/6

(6-3.5) . 1/6 =1.04166

1

21 = 3.5 6

( xi −  ) 2 P( xi )

(xi)

a) Media =  3.5= E ( X ) =

b) Varianza

2

2

2

2

2

2

Σ = 2.91664

21 6

 2 = 2.91664 79

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

 = 1.7078

c) Desviación estándar

Distribución geométrica Si pruebas independientes repetidas pueden tomar como resultado un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria X, el número de la prueba en el que ocurre el primer éxito, es:

G(x,p) = p . qx – 1 x = 1, 2, 3, . . . . Ejemplo 7. Se sabe que en cierto proceso de fabricación, en promedio, uno de cada 100 artículos está defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se inspecciona, sea el primer defectuoso que se encuentra?. Solución

p = 0.01, q = 0.99,

x = 5g(5, 0.01) = (0.0.1) (0,99) 5 – 1

= 0,0096

Ejemplo 8. En “tiempo ocupado” un conmutador telefónico está muy cerca de su capacidad, por lo que los usuarios tienen dificultad al hacer sus llamadas. Puede ser de interés conocer el número de intentos necesarios a fin de conseguir un enlace telefónico. Suponga que p = 0,05 es la probabilidad de conseguir un enlace durante el tiempo ocupado. Nos interesa conocer la probabilidad de que se necesiten 5 intentos para una llamada exitosa. Solución g(5, 0.05) = (0.05) (0.95) 5 – 1

= 0,0407

Media, varianza y desviación estándar de una variable aleatoria que sigue una distribución geométrica.

80 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Media

=

1 p2

2 =

Varianza

1− p p2

Desviación estándar

 = 2

Ejemplo 9. Calcular la media, la varianza y la desviación estándar con los datos del problema (8). Solución: P = 0.05

a) Media

b) Varianza

=

1 = 2 p

2 =

1− p p2

c) Desviación estándar

2 =

1 0.052

1− 0.05 0.052

 = 2

 = 380

= 400

2

= 380

= 19.49

Distribución híper – geométrica La distribución de probabilidad de la variable aleatoria híper geométrica x, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos de los que K se denominan éxitos y N – K fracaso, es:

 k  N − k     x  n − x   h(x) = N   n

X = 0, 1, 2, . . . .n

Ejemplo 10. Lotes de 40 componentes cada uno se denominan aceptables si no contienen más de 3 defectuosos. El procedimiento para muestrear el lote es la selección de 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso.

81 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

a) ¿Cuál es la probabilidad de que se encuentre exactamente 1 defectuoso en la muestra si hay 3 defectuosos en todo el lote? b) ¿Cuál es la probabilidad de que no haya más de un defectuoso? c) ¿Cuál es la probabilidad de que por lo menos hayan dos defectuosos? Solución. N = 40,

a)

n = 5,

K = 3,

 3  37     1 4 P(1) =    = 0,30111  40    5

 3  37     b) P(x < 1) = P(0) + P(1) =  0  5  +  40    5

 3  37      1  4  = 0,66245 + 0,30111 = 0,96356  40    5

 3  37     2 3 c) P(x > 2) = P(2) + P(3) =    +  40    5

 3  37      3  2  = 0,03543 + 0,00101 = 0,03644  40    5

Media, varianza y desviación estándar de una variable aleatoria que sigue una distribución híper geométrica.

Media

n.k = N

Varianza

Desviación estándar

N −n k  k  = n 1 −  N −1 N  N  2

 = 2

Teorema de Chebyshev Las probabilidades de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estándar de la media es al menos 1 – 1 / k2, es decir: P(

 − k  X   + k )

1−

1 k2

Ejemplo 11. 82 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Con respecto a los datos del ejemplo (10), calcular: a) La media, la varianza y la desviación estándar. b) Aplicare interpretar el teorema de Chebyshev.

Solución N = 40,

n = 5,

a)

=

2 = 0.5579

n.k N

=

5(3) 40

N −n k  k n 1 −  N −1 N  N 

= = 0.5579 b)

K=3

2

  2

 2 =

40 − 5 3  3  5 1 −  40 − 1 40  40 

2

= 0,311298

 = 0.311298 0.375  2(0.5579 )

= 0,375

0.375 – 1.1158, 0.375 + 1.1158

-0.7408, 1.4908 Interpretación: El teorema de Chebyshev establece que el número de componentes defectuosos que se obtienen cuando se seleccionan al azar n de un lote de N componentes de los que k son defectuosos tiene una probabilidad de al menos 1 – 1/k2 de caer en el intervalo Es decir, para k = 2, hay ¾ de probabilidad de caer entre

  2

  k

O sea

“Al menos ¾ de las veces los cinco componentes incluirán 1.49, es decir, menos de dos componentes defectuosos”.

La parte izquierda del intervalo no interesa, por resultar

negativo. Distribución híper – geométrica multii - variada Si N artículos se pueden dividir en las k celdas A1, A2,. . . . Ak con a1, a2,. . . .ak elementos,, respectivamente, entonces la distribución de probabilidad de las variables aleatorias

X 1,

83 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

X2, . . . . Xk, que representan el número de elementos que se seleccionan de A1, A2 . . . . Ak en una muestra aleatoria de tamaño n es:  a1  a 2   a k    ......  x x x f(X1, X2, . . . . Xk, a1, a2,. . . . ak, N, n) =  1  2   k  N   n

Ejemplo 12. Un grupo de 10 individuos se usa para un estudio biológico. El grupo contiene tres personas con sangre tipo O, cuatro con sangre tipo A y tres con sangre tipo B. ¿Cuál es la probabilidad de que una muestra de cinco, contenga una persona con sangre tipo O, dos personas con tipo A y dos personas con tipo B.

Solución.

 3  4   3    .   1  2   2  = 3 = 0.21428 f(1, 2, 2; 3, 4, 3; 10; 5) = 14 10    5

84 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

La distribución binomial Introducción Un experimento a menudo consiste en pruebas repetidas, cada una con dos posibles resultados; éxito o fracaso.

Proceso de Bernoulli Propiedades: 1) El experimento consiste en n pruebas que se repiten. 2) Cada prueba produce un resultado que se puede clasificar como éxito o fracaso. 3) La probabilidad de un éxito que se denota como p permanece constante en cada prueba. 4) Las pruebas que se repiten son independientes. Distribución binomial Definición: Un experimento de Bernoulli puede tener como resultado un éxito con probabilidad py un fracaso con probabilidad q, q = 1 – p. Entonces la distribución de probabilidad de la variable aleatoria binomial X, el número de éxitos en n pruebas independientes, es: n  x n− x P(x) =     p q  x

o también

P(x) =

n! p xqn− x x!(n − x )! x = 0, 1, 2, 3, . . . . .

n Ejemplo 13. La probabilidad de que cierta clase de componente sobreviva a una prueba de choque es 3/4.Encuentre la probabilidad de que sobrevivan exactamente 2 de los siguientes 4 componentes que se prueben. 2

4! 3 1 P(2) =     2!(4 − 2 ).!  4   4 

4−2

P(2) = 27

128

P(2) = 0.2109

Ejemplo 14. La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0.4.Si se sabe que 15 personas contraen esta enfermedad, ¿cuál es la probabilidad de que sobrevivan: 85 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

a) Al menos 10 pacientes b) De 3 a 8 pacientes c) Exactamente 5.

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

9

a) P (X>10) = 1 – P(X<10) = 1 -

 b P (X> 10) = 1 – 0,9662P (X>10) = 0,0338 0

b) P (3<X <8) =

8

2

0

0

 b −  b = 0,9050 – 0,0271 5

= b −

c) P(X = 5)

0

P (3<X <8) = 0,8779

4

 b = 0,4032 – 0.2173

P (X=5) = 0,1859

0

Media, varianza y desviación estándar de la distribución binomial Media

 = np Varianza  2 = n. p.q Desviación estándar  = n. p.q

Ejemplo 15. Encuentre la media, la varianza y la desviación estándar de la variable aleatoria binomial para el problema de los pacientes (ejemplo 2). Después aplique el teorema de Chebyshev para el intervalo   2 Media

 = np  = 15(0.4) = 6  = 6

Varianza 

2

= n. p.q  2 = 15(0.4).(0.6) = 3.6  2 = 3.6

Desviación estándar 

= n. p.q  = 3.6  = 1.897

Teorema de Chebyshev   2 6 + 2 (1.897) (6 – 3.794, 6 + 3.794)

(2.206, 9.794)

El teorema de Chebyshev afirma que el número de recuperaciones entre 15 pacientes sujetos a la enfermedad mencionada, tiene una probabilidad de al menos 3 / 4 de caer entre 3 y 9 pacientes.

86 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Distribución binomial negativa. Si pruebas independientes repetidas pueden tener como resultados un éxito con probabilidad p y un fracaso con probabilidad q = 1 – p, entonces la distribución de probabilidad de la variable aleatoria X, el número de la prueba en la que ocurre el k ésimo éxito es:

 x − 1   b* (x, k, p) =  k − 1pk q x - kx = k,

k+1, k+2. . .

Ejemplo 16. Encuentre la probabilidad de que una persona que lanza tres monedas obtenga sólo caras o sólo soles por segunda vez en el quinto lanzamiento. Solución: Al tomar los valores para X = 5, k = 2, p= ¼ se tiene: 2

1 3 b (5, 2, 1/4) =   5 −1   4   4 *

 2 − 1

5− 2

= 27 = 0.1055 256

La distribución de Poisson Introducción Los experimentos que dan valores numéricos de una variable aleatoria X, el número de resultados que ocurren durante un intervalo dado o en una región específica, se llama experimento de Poisson.

El número dado puede ser de cualquier longitud, como un minuto, un día, una semana, un mes o incluso un año. Por ello un experimento de Poisson puede generar observaciones para la variable aleatoria X, que representa el número de llamadas telefónicas, por hora que recibe una oficina, el número de días que la escuela permanece cerrada debido a la lluvia durante la temporada de invierno.

La región específica podría ser un segmento de línea, un área o quizá una pieza de material. En tales casos X puede representar el número de ratas de campo por acre, el número de bacterias en un cultivo dado o el número de errores mecanografiados por página. 87 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Propiedades: 1. El número de resultados que ocurren en un intervalo o región específica es independiente del número que ocurre en cualquier otro intervalo o región del espacio disjunto. e esta forma vemos que el proceso de Poisson no tiene memoria.

2. La probabilidad de que ocurra un sólo resultado durante un intervalo muy corto o en una región pequeña, es proporcional a la longitud del intervalo o al tamaño de la región y no depende del número de resultados que ocurren fuera de este intervalo o región. 3. La probabilidad de que ocurra más de un resultado en tal intervalo corto o que caiga en tal región pequeña es insignificante.

Definición: La distribución de probabilidad de la variable aleatoria de Poisson X que representa el número de resultados que ocurren en un intervalo dado o región específica que se denota con t es:

P ( X , t ) =

e − t (t ) , x = 0, 1, 2, . . . donde  es el número promedio de resultados x! x

por unidad de tiempo o región y e = 2.71828 . . . Ejemplo 17. Durante un experimento de laboratorio el número promedio de partículas radioactivas que pasan a través de un contador en un milisegundo dado es 4, ¿cuál es la probabilidad de que 6 partículas entren al contador en un milisegundo dado?

e −4 (4 ) P( X ) = 6!

6

P(X) = 0,1042

Ejemplo 18.

88 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

El número promedio de camiones tanque que llega cada día a cierta ciudad portuaria es 10.Las instalaciones en el puerto pueden manejar a lo más 15 camiones tanque por día. ¿Cuál es la probabilidad de que en un día dado los camiones se tengan que regresar? Solución 15

P ( X  15) = 1 − P ( X  15) = 1 −  P P(X >15) = 1 – 0.9513 P(X>15) = 0.0487 0

Media, varianza y desviación estándar de la distribución de Poisson Media

 =  Varianza  2 =  Desviación estándar  = 

Ejemplo 19. En un proceso de fabricación donde se manufacturan productos de vidrio ocurren defectos o burbujas, lo que deja ocasionalmente a la pieza indeseable para su venta. Se sabe que, en promedio, uno de cada 1,000 de estos artículos que se producen tienen una o más burbujas, ¿Cuál es la probabilidad de que una muestra aleatoria de 8,000 tenga menos de 7 artículos con burbujas? 6 6  1    = 8 P( X  7 ) =  b =  P  = np  = 8,000(   1,000  0 0

Usando la tabla encontramos que

P(X < 7) = 0,3134

89 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

La distribución normal Introducción La distribución continua de probabilidad más importante en todo el campo de la estadística, es la distribución normal. Su gráfica, que se denomina curva normal, es la curva en forma de campana, la cual describe aproximadamente muchos fenómenos que ocurren en la naturaleza, la industria y la investigación.

Las mediciones físicas en áreas como los

experimentos meteorológicos, estudios de lluvia y mediciones de partes fabricadas, a menudo se explican más que adecuadamente con una distribución normal. Una variable aleatoria continua X que tiene la distribución en forma de campana se llama variable aleatoria normal.

La ecuación matemática para la distribución de probabilidad de la variable normal, depende de dos parámetros

y

, su media y desviación estándar. La gráfica para una

distribución que presenta mayor desviación estándar, es más baja y se extiende más sobre el eje horizontal.

Propiedades: 1. La moda, que es el punto sobre el eje horizontal donde la curva es un máximo, ocurre en X =

.

2. La curva es simétrica alrededor de un eje vertical a través de la media 3. La curva tiene sus puntos de inflexión en X =

 −  x   + 

 

.

, es cóncava hacia abajo si

Y es cóncava hacia arriba en cualquier otro punto.

4. La curva normal se aproxima al eje horizontal de manera asintótica conforme nos alejamos de la media en ambas direcciones. 5. El área total bajo la curva y sobre el eje horizontal es igual a 1.

Áreas bajo la curva normal Desde una desviación estándar a la izquierda de la media, hasta una desviación estándar a la derecha de la media, se encuentra cerca del 68,26 % de los valores. 90 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Desde dos desviaciones estándar a la izquierda de la media, hasta dos desviaciones estándar a la derecha de la media, se encuentra cerca del 95,45 % de los valores.

Desde tres desviaciones estándar a la izquierda de la media, hasta tres desviaciones estándar a la derecha de la media, se encuentra cerca del 99,73 % de los valores.

 + 1  + 2  + 3 <

 − 2  − 1

68,26 % 95,45 % 99.73 %

<

 − 3

Estandarización Los valores de la variable aleatoria x, la media y la desviación estándar son grandes, sería una tarea sin fin intentar establecer tablas separadas para cada valor concebible de

y

. Afortunadamente somos capaces de transformar todas las observaciones de cualquier

variable aleatoria normal x, en un nuevo conjunto de observaciones de una variable aleatoria normal z, con media cero y desviación estándar 1. Es decir, que convertimos los valores grandes en valores más pequeños para hacer posible el uso de la tabla. Este proceso recibe el nombre de estandarización y se hace mediante la ecuación.

z=

x−

La distribución de una variable aleatoria normal con media 0 y desviación estándar 1 se llama distribución normal estándar. Uso de la tabla Supongamos que ya tenemos el valor de Z. Para buscar el área en la tabla, se tiene que ubicar en la fila que corresponde al número entero y a la primera cifra decimal de Z, y en la

91 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

columna que encabeza la segunda cifra decimal. La tabla nos proporciona el área que se encuentra por la izquierda del valor de Z.

Para encontrar un valor de Z que corresponde a una probabilidad dada, el proceso se invierte.

Ejemplo 20. Suponga que Z = 1,23 entonces debe ubicarse en la fila 1.2 y en la columna encabezada por el número 03.Ahí encontramos el valor 0,8907 es decir 89,07 %.

Si el valor de Z es un número entero, se tienen que agregar dos ceros como cifras decimales.

Ejemplo 21. Suponga que Z = 1 entonces Z = 1,00debe ubicarse en la fila 1.0 y en la columna encabezada por el número 00.Ahí encontramos el valor 0,8413 es decir 84,13 %.

Si el valor de Z es negativo, se puede calcular el área de dos maneras: •

Se busca el área en la tabla como que si fuera positivo y después restamos de 1 el área encontrada.

Usar una tabla propiamente para valores negativos de Z de manera similar al que se usa para valores positivos.

Ejemplo 22. Suponga que Z = - 1 entonces buscamos el área para Z = 1debe ubicarse en la fila 1.0 y en la columna encabezada por el número 00.Ahí encontramos el valor 0,8413 y después restamos 1 – 0,8413 = 0,1587

En el cálculo de áreas se pueden presentar tres casos: Caso 1: Área a la izquierda de un valor de z. Caso 2: Área comprendida entre dos valores z1 y z2. Caso 3: Área a la derecha de un valor z. Caso 1: 92 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Para el primer caso, nos quedamos con el área que X

nos muestra la tabla.

Caso 2:

Para el segundo caso, buscamos las dos áreas X1

A(Z2) y A (Z1) y después restamos A (z2) – A (z1).

X2

Caso 3:

Para el tercer caso, buscamos el área de Z, A(z)

X

y después la restamos de la unidad, es decir: 1 - A(z).

Ejemplo 23 Dada una distribución normal estándar, encuentre el área bajo la curva que yace: a) A la derecha de z = 1,84 b) Entre z1 = -1,97 y z2 = 0,86

a) A (1.84) = 0.9671

Entonces A (z > 1,84) = 1 – 0,9671 = 0,0329

b) A (z2) = A (0.86) = 0,8051

y

A (z1) =A(-1.97) = 0,0244, entonces:

A (-1.97 < Z < 0.86) = A (0.86) - A (-1.97) = 0,8051- 0,0244= 0,7807 a)

0,0329

(Caso 3)

b)

(Caso 2) 0,7807 93

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

1,84

- 1,97

0,86

Ejemplo24. Dada una distribución normal estándar, encuentre el valor de k tal que: a) P(Z > K) = 0,3015 b) P(K< Z < - 0,18) = 0,4197

Solución a) El valor de k deja por la derecha un área de 0.3015 entonces debe dejar por la izquierda un área de 1 – 0.3015 = 0.6985. Usando la tabla en sentido inverso se tiene que K = 0,52 b) El área a la izquierda de – 0.18 es igual a 0.4286, entonces el área entre dos valores es A(-0.18) – A(k) = 0.4286 – A(k) = 0.4197

Despejamos

A(k).

A(K) = 0.4286 –

0,4197 A(K) = 0,0089,

Usando la tabla en sentido inverso se tiene que K = - 2,37

Ejemplo 25. Dada una distribución normal con  = 50 y  = 10, encuentre la probabilidad de que X tome un valor entre 45 y 62.

z=

x−

20 30 40 50 60 70 80

z2 =

62 − 50 12 z2 = z = 1.2 A(Z 2 ) = 0.8849 10 10 2

z1 =

45 − 50 −5 z1 = z = −0.5 A(Z1 ) = 0.3085 10 10 1 94

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

A(Z2) – A(Z1) = 0.8849 – 0.3085 = 0.5764

Ejemplo 26. De acuerdo al teorema de Chebyshev la probabilidad de que una variable aleatoria toma un valor dentro de dos desviaciones estándar es al menos 3 / 4. Si la variable aleatoria tiene una distribución normal, los valores z que corresponden a

x1=  − 2

y x2=  + 2 se calculan así:

Z2 = Z1 =

( + 2 ) −  

( − 2 ) −  

= =

 + 2 −  2 = =2  

 − 2 −  − 2 = = −2  

A(2) = 0.9772

A(-2)=1–

(0.9772

)

=

0,0228

P(  − 2 ) < X < ((  + 2 ) = P ( - 2 < Z < 2 ) = P(Z < 2 ) – P (Z < - 2)

= 0,9772 - 0,0228 = 0,9544 Ejemplo 27. Dada una distribución normal con

 = 40

y  = 6, encuentre el valor de X que tiene:

a) 45% del área a la izquierda. b) 14 % del área a la derecha. Solución a) En la tabla encontramos que P (Z<- 0,13) = 0,45 por eso, el valor adecuado de z es – 0,13

z=

x−

x = Z +  x = 6( −0.13) + 40 x = 39.22

b) Esta vez requerimos un valor z que deje 0.14 del área a la derecha y por ello un área de 0,86 por la izquierda.

Nuevamente usamos la tabla y encontramos que

P (Z < 1.08) = 0.86 por lo cual el valor z que se desea es 1.08

Al sustituir en la

fórmula, resulta: 95 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

x = Z + 

x = 6(1.08 + 40

x = 46.48 a)

0.45

b)

0,14

40

40

Ejemplo 28. Se utilizan mediciones para rechazar todos los componentes donde cierta dimensión no está dentro de la especificación 1,50 + d.

Se sabe que esta medición se distribuye de forma

normal con media 1.50 y desviación estándar 0.2

Determine el valor d tal que las

especificaciones “cubran” 95 % de las mediciones.

z=

P (- 1,96 < Z < 1,96) = 0,95

1.96 =

(1.50 + d ) − 1.50 0. 2

x− 

d = 0.2(1.96) + 1.50 − 1.50 d= 0,392

Ejemplo 29. Una empresa eléctrica fabrica focos que tienen una duración, antes de fundirse, que se distribuye normalmente con media igual a 800 horas y una desviación estándar de 40 horas. Si la empresa fabrica 900 unidades por día: a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas. b) ¿Cuántos focos tendrán una duración entre 778 y 834 horas.

Solución a) 96 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

z=

x−

778 800 834

z2 =

834 − 800 34 z2 = z = 0.85 40 40 2

z1 =

778 − 800 − 22 z1 = z1 = −0.55 40 40

A(Z2) – A(Z1)

A(Z 2 ) = 0.8023 A(Z1 ) = 0.2912

= 0.8023 – 0.2912= 0.5111

b) x = 900(0.5111) = 459.99

X = 460 unidades

Ejemplo 30. Cierta máquina fabrica resistores eléctricos que tienen una resistencia media de 40 ohmios y una desviación estándar de 2 ohmios. Suponga que la resistencia sigue una distribución normal y se puede medir con cualquier grado de precisión: a) ¿Qué porcentaje de resistores tendrán una resistencia que exceda 43 ohmios? b) Encuentre el porcentaje de resistores que exceden 43 ohmios si la resistencia se mide al ohm más cercano. Solución a) z =

43 − 40 z = 1.5 A(Z ) = 0.9332 2

P (X > 43) = 1 – P (Z < 1.5) = 1 – 0.9332 = 0.0668

6,68 %

b) Ahora asignamos una medida de 43 ohmios a todos los resistores cuyas resistencias sean mayores a 42.5 y menores que 43.5. Realmente aproximamos una distribución discreta por medio de una distribución continua normal. El área que se requiere es la región sombreada a la derecha de 43.5 al aplicar la fórmula tenemos:

z =

43.5 − 40 z = 1.75 A(Z ) = 0.9599 2

P (X > 43,5) = 1 – P (Z < 1.75) = 1 – 0.9599= 0,0401

4,01 %

EJERCICIO 97 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

A) (Variable aleatoria y distribución híper-geométrica) 1. La distribución de probabilidad de X, el número de imperfecciones por 10 metros de una tela sintética en rollos continuos de ancho uniforme, está dada por: x

0

1

2

3

4

P(x)

0.41

0.37

0.16

.0.05

0.01

a) Construya la distribución acumulada X. b) Construya el histograma de probabilidad y el polígono de distribución acumulada. c) Hallar el valor esperado, varianza y desviación estándar. d) Aplicar el teorema ce Chebishev.

2. El dueño de una casa planta seis bulbos seleccionados al azar de una caja que contiene 5 bulbos de tulipán y 4 de narciso, ¿cuál es la probabilidad de que plante dos bulbos de narciso y cuatro de tulipán?

3. Se seleccionan al azar un comité de tres personas a partir de cuatro doctores y dos enfermeras. a) Escriba una fórmula para la distribución de probabilidad de la variable aleatoria X que represente el número de doctores en el comité. b) Encuentre P( 2 < x < 3)

4. Para evitar la detección en la aduana, un viajero coloca seis tabletas de narcótico en una botella que contiene nueve píldoras de vitamina similares en apariencia. Si el oficial de la aduana selecciona tres de las tabletas al azar para su análisis ¿cuál es la probabilidad de que el viajero sea arrestado por posesión ilegal de narcóticos?

5. Se estima 4,000 de los 10,000 residentes de una ciudad que votan están en contra de un nuevo impuesto sobre ventas. Si se seleccionan al azar 15 votantes y se les pide su

98 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

opinión ¿cuál es la probabilidad de que a lo más siete estén a favor del nuevo impuesto?

6. Una fuerza de tarea gubernamental

sospecha que algunas fábricas violan los

reglamentos contra la contaminación ambiental con respecto a la descarga de cierto tipo de producto. Veinte empresas están bajo sospechas, pero no hay capacidad de inspeccionarlas a todas. Suponga que tres empresas violan los reglamentos: a) ¿Cual es la probabilidad de que la inspección de cinco empresas no encuentre ninguna violación? b) ¿Cuál es la probabilidad de que el plan anterior encuentre dos que violen el reglamento?

B) (Distribución Binomial) 7. Al probar cierta clase de neumático para camión en un terreno escabroso, se encuentra que 25 % de los camiones no completaban las pruebas sin ponchaduras. De los siguientes 15 camiones probados, encuentre la probabilidad de que: a) de tres a cinco tengan pinchaduras b) menos de cuatro tengan pinchaduras c) más de cinco tengan pinchaduras.

8. Calcular la media, la varianza y la desviación estándar del problema (1) y aplique el teorema de Chebyshev

9. Suponga que 6 de10 accidentes laborales se deben principalmente a la falta de uso de los equipos de seguridad. Encuentre la probabilidad de que entre 8 accidentes laborales 6 se deban principalmente a la falta de uso de los equipos de seguridad. a) mediante el uso de la fórmula para la distribución binomial b) b) con el uso de la tabla binomial 10. En un proceso de fabricación donde se manufacturan productos de vidrio ocurren defectos o burbujas, lo que deja ocasionalmente a la pieza indeseable para su venta.Se sabe que, en promedio, uno de cada 1,000 de estos artículos que se producen tienen 99 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

una o más burbujas, ¿cuál es la probabilidad de que una muestra aleatoria de 8,000 tenga menos de 7 artículos con burbujas? 11. La probabilidad de que una persona muera de cierta infección respiratoria es 0.002 Encuentre la probabilidad de que mueran menos de 5 de los siguientes 2,000 infectados de esta forma. Encuentre el intervalo usando el teorema de Chebyshev. 12. La probabilidad de que una persona que vive en cierta ciudad tenga un perro se estima en 0.3 Encuentre la probabilidad de que la décima persona entrevistada al azar en esta ciudad sea la quinta que tenga un perro.

C) (Distribución de Poisson) 13. Una secretaria comete dos errores por página en promedio ¿Cuál es la probabilidad de que en la siguiente página cometa: a) 4 o más errores. b) Ningún error.

14. La probabilidad de que una persona muera de cierta enfermedad respiratoria es 0.002 Encuentre la probabilidad de que mueran menos de 5 de los siguientes 2,000 afectados de esta forma?

15. La probabilidad de que un paciente se recupere de una delicada operación de corazón es 0.9, ¿cuál es la probabilidad de que exactamente 5 de los siguientes 7 pacientes intervenidos sobrevivan?

16. Se sabe que el 40% de los ratones inoculados con un suero quedan protegidos de cierta enfermedad. Si se inoculan 5 ratones, encuentre la probabilidad de que: a) Ninguno contraiga la enfermedad. b) Menos de 2 contraigan la enfermedad. c) Más de 3 contraigan la enfermedad

D) (Distribución normal)

100 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

17. Cierto tipo de batería de almacenamiento dura, en promedio, 3.0 años, con una desviación estándar de 0.5 años. Suponga que las duraciones de la batería se distribuyen normalmente, encentre la probabilidad que una batería dada dure menos de 2.3 años.

18. En un proceso industrial el diámetro de un cojinete es una parte componente importante. El comprador establece que las especificaciones en el diámetro sean 3.0 + 0.01 cm.

La implicación es que ninguna parte que caiga fuera de estas

especificaciones se aceptará. Se sabe que en el proceso el diámetro de un cojinete tiene una distribución normal con media 3.0 y una desviación estándar 0.005En promedio, ¿cuántos cojinetes se descartarán?

19. El diámetro interior del anillo de un pistón ya terminado se distribuye normalmente con una media de 10 cm. y una desviación estándar de 0.03 centímetros. a) ¿Qué proporción de anillos tendrán diámetros interiores que excedan 10.075 centímetros? b) ¿Cuál es la probabilidad de que el anillo de un pistón tenga un diámetro interior entre 9.97 y 10.03 centímetros? c) ¿Por debajo de qué valor del diámetro interior caerá el 15 % de los anillos de pistón?

20. Un ingeniero va todos los días de su casa a los lugares donde se llevan a cabo los proyectos. El tiempo promedio para un viaje de ida es de 24 minutos, con una desviación estándar de 3.8 minutos. Suponga que la distribución de los tiempos de viaje está distribuida normalmente. a) ¿cuál es la probabilidad de que un viaje tome al menos ½ hora? b) Si las oficinas de los proyectos abren a las 9.00 A:M: y él sale diario de su casa a las 8.45 A:M.¿Qué porcentaje de las veces llega tarde a su trabajo? c) Si deja su casa a las 835 A.M. y en la oficina se sirve un café entre las 8.50 y las 9.00 A.M. ¿Cuál es la probabilidad de que se pierda el café? d) Encuentre el período arriba del cual se encuentra el 15% de los traslados más lentos.

101 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

21. Una compañía paga a sus empleados un salario promedio de $ 9.25 por hora con una desviación estándar de 60 centavos.

Si los salarios se distribuyen de forma

aproximadamente normal y se pagan al centavo más próximo: a) ¿Qué porcentaje de los trabajadores reciben salarios entre $ 8.75 y $ 9.69 por hora inclusive? b) ¿el 5 % más alto de los salarios por hora de los empleados es mayor a qué cantidad?

22. La vida promedio de cierto tipo de motor pequeño es 10 años con una desviación estándar de 2 años. El fabricante reemplaza gratis todos los motores que fallen dentro del tiempo de garantía. Si está dispuesto a reemplazar sólo 3 % de lo motores que fallan, ¿de qué duración debe ser la garantía que ofrezca?. Suponga que las vidas de los motores sigue una distribución normal. Clase practica Distribución binomial El 20% de los turistas que visitan el salto dela Estanzuela de Estelí es de origen nicaragüense. Si en un día determinado llegan 50 turistas ¿cuál es la probabilidad de que a) 2 sean nicaragüenses. b) Por lo menos 4 sean nicaragüenses. c) No más de 3 sean nicaragüenses. d) Todos sean extranjeros. Distribución de Poisson 1) Una compañía de pavimentación local obtuvo un contrato con el Ayuntamiento para hacer mantenimiento a las vías de un gran Centro Turístico en Nicaragua. Las vías recientemente pavimentadas por esta compañía demostraron un promedio de dos defectos por milla, después de haber sido utilizada durante un año. Si la municipalidad sigue con esta compañía de pavimentación ¿cuál es la probabilidad de que se presenten tres defectos en cualquier milla de vía después de haber tenido tráfico durante un año? 2) Una institución de apoyo a los turistas extranjeros propone impartir clases básicas del idioma español. Para tal fin, contrata a un instructor. Se observa que la llegada de los turistas se ajusta a una distribución de Poisson con un promedio de 5.2 estudiantes 102 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

cada 20 minutos. El instructor está preocupado porque si son demasiados estudiantes los que demandan sus servicios, no podrá atenderlos a todos. Por tal razón, pide ayuda al responsable de la institución, y éste le contesta que: a) Debe calcular la probabilidad de que 4 estudiantes lleguen en un intervalo de 20 minutos, y que, si el resultado es mayor que el 20%, le apoyaría nombrando un segundo instructor. b) Debe calcular la probabilidad de que más de 4 estudiantes lleguen durante algún período de 20 minutos, y que si el resultado es mayor de 50 %, las horas de clase del instructor se aumentarían permitiendo a los estudiantes extender sus horas de estudio. c) Debe calcular la probabilidad que más de 7 estudiantes lleguen durante cualquier intervalo de 30 minutos, y que, si el resultado excede el 50%, el mismo instructor que está, ofrecerá una tutoría adicional. La distribución normal 1) Se sabe que el 10% de los turistas que visitan Nicaragua provienen de Estados Unidos.

Si en un día determinado llegan al país 200 personas ¿Cuál es la probabilidad de que procedan de ese país: a) Exactamente 12. b) Entre 18 y 25 c) Más de 30 turistas.

103 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Unidad III. Estadística inferencial Objetivos de la Unidad Objetivos Conceptuales ▪

Conocer el procedimiento para la prueba de hipótesis sobre una población, y múltiples poblaciones por el método clásico y por intervalo de confianza.

Objetivos Procedimentales ▪

Aplicar el procedimiento de prueba de hipótesis sobre una población y múltiples poblaciones en problemas de la vida cotidiana, utilizando el método clásico e intervalo de confianza.

Objetivos Actitudinales ▪

Apreciar la utilidad por la Inferencia estadística y sus aplicaciones en su entorno social.

Contenidos Conceptuales Prueba

de

hipótesis

intervalo de confianza.

Contenidos Procedimentales Contenidos Actitudinales e Aplicación

del Apreciación de la utilidad

procedimiento de prueba de por la Inferencia estadística

Distribución muestral de hipótesis

sobre

medias, teorema de límite población

y

una como herramienta para la

múltiples solución de problemas de su

central. Procedimiento para poblaciones en problemas entorno social. la

prueba

de

hipótesis. de

Intervalo de confianza.

la

vida

cotidiana,

utilizando el método clásico e intervalo de confianza. Ejercitación del teorema de límite central. Prueba de hipótesis para la media y proporción

de

una

población.

Prueba

de

hipótesis para la diferencia de media y proporciones de dos poblaciones. 104 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Muestreo Es el proceso de realizar estudios de poblaciones a partir de datos muestrales.

Conceptos básicos 1) Población: Es un conjunto de elementos de naturaleza cualquiera de los cuales se esta interesado en estudiar al menos una característica común y observable de dichos elementos en un determinado lugar y un momento dado.

La población en estudio debe estar definida sin ambigüedad de manera que no dé lugar a confusiones. Los elementos considerando que se encuentran localizados en determinado lugar o región geográfica y en un período de tiempo dado.

Ejemplo: El conjunto de todos los supermercados de Nicaragua en un momento dado. Elementos: Supermercados. Característica: Ventas mensuales, No de empleados, nombre, atención, No de cajeras, etc.

2) Muestra: Es una parte de la población que se espera sea representativa de ella. Con frecuencia, se utiliza el término muestra para hacer referencia a los datos muestrales

x 1,

x2,...xn.

Población tamaño N X x1 x2 x3

Muestra tamaño n

.

X1, X2, . . . Xn .

Datos muestrales .

Xn

105 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

3) Variable: Es una característica o fenómeno que toma diferentes valores cuando se observa en diferentes individuos. Utilizaremos símbolos tales como X, Y, Z para representar las características de los elementos. En el ejemplo de los supermercados, X puede representar las ventas mensuales.

4) Datos estadísticos: Los valores posibles de una característica X, los denotaremos por x, mientras que los valores realmente observados de esa característica X, los llamaremos datos y los denotaremos por xi donde el valor del sub-índice i nos indica que es la i-ésima observación de X.

Con frecuencia usaremos el término población para referirnos a la

totalidad de datos que podrían recopilarse en una situación dada x1, x2, x3, . . . .xN.

5) Parámetro: Es una medida que proviene de todos los datos de una población. Los parámetros son constantes que representan por lo general características de la población. Generalmente se representan por letras griegas. Por ejemplo la media poblacional es un parámetro que se define como un promedio y denota como: N

x + x 2 + x3 + ...... x N = 1 = N

X i =1

i

N N

El total poblacional es otro parámetro que se denota y define como  =  X i i =1

Otros ejemplos de parámetros son la varianza y la desviación estándar.

¿Por qué se muestrea? Tomar decisiones con base a información incompleta no es algo novedoso. Por ejemplo, muchos compradores prueban un poco de queso antes de adquirirlo. De un pedazo deducen el sabor de un trozo mayor.

En medicina, una muestra de sangre puede llevar a inferir que el paciente está anémico. Como el interés primordial de la Estadística es conocer parámetros, facilitaremos la inferencia acerca de los parámetros, utilizando la información de una muestra para estimar los parámetros. 106 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Una muestra de familias de un barrio, puede ser útil para estimar el número promedio de niños por familia del barrio. En la industria, una muestra de artículos puede servirnos para estimar la proporción de artículos defectuosos producidos en cierto momento. Ventajas del muestreo 1. Rapidez y bajo costo de la información requerida El muestreo es una técnica que utiliza recursos materiales económicos y humanos disponibles, para obtener en el menor tiempo, con el menor costo y con cierta exactitud aceptable información necesaria acerca de algunos parámetros.

2. Es un procedimiento práctico cuando la población es muy grande o infinita Decimos que una población es finita cuando sabemos cuantos elementos existen en ella, esto es, cuando posee un tamaño que denotaremos por N. Existen poblaciones finitas tan grandes que resulta imposible observar sus elementos en un período de tiempo razonable, por ejemplo, todas las familias de una ciudad. Otras son tan inmensas que muchos de sus elementos son inaccesibles y su tamaño puede ser desconocido, por ejemplo, todos los pequeños agricultores de un país.

También existen poblaciones infinitamente grandes, esto es, con un número ilimitado de elementos, razón por la cual le llamaremos poblaciones infinitas. Podríamos considerar que los procesos continuos de producción de algún bien generan poblaciones infinitas porque, teóricamente, podría suponerse que estos procesos operan indefinidamente, por ejemplo, el proceso de producción de chips de computadores.

3.

Evita la destrucción de toda la población

Esta situación se da cuando la medición de la característica de interés destruye al mismo elemento. Los catadores de vino pueden evaluarlo con unos cuántos sorbos sin necesidad de consumir toda la producción.

107 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

En una compañía sólo se prueba la germinación de unas cuántas semillas antes de la temporada de siembra.

Los censos, debido a la gran cantidad de recursos que requieren, se realizan en períodos retirados de tiempo. Sin embargo, su aplicación es ventajosa cuando la población es muy pequeña, o se requiere una exactitud completa.

Métodos de muestreo En todo muestreo lo deseable es básicamente obtener una muestra que sea una buena representación de la población en miniatura y que además su costo sea el menor posible, ya que a mayor representatividad de la muestra, se espera mayor precisión de las estimaciones de los parámetros.

Existen dos métodos que tratan de obtener la muestra anterior: El muestreo no probabilístico y el muestreo probabilístico.

Muestreo no probabilístico En este método no todos los elementos poblacionales tendrán posibilidad de integrar la muestra, motivo por el cual se espera poca representatividad de la muestra. Se usan el conocimiento, la experiencia y la opinión personal para identificar los elementos de la población que van a incluirse en la muestra. El conocimiento y la experiencia ayudan a aumentar la precisión de las estimaciones y la opinión personal para minimizar el costo. -La precisión de sus resultados generalmente no se puede medir en forma objetiva porque no hay ninguna ley del azar que permita medir el error del muestreo. A pesar de esta falla de objetividad los métodos de muestreo no probabilísticos son importantes en los negocios, y la investigación económica y social.

108 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Muestreo probabilístico. Es un método de muestreo en el cual cada elemento de la población tiene una probabilidad conocida (no igual a cero) de ser incluido en la muestra. Las unidades muestrales se seleccionan conforme a las leyes del azar en vez del criterio personal. La precisión de sus resultados se puede medir objetivamente porque, según veremos más adelante, los estimadores de parámetros seguirán las leyes del azar, esto es, una distribución de probabilidad conocida de la cual podremos considerar su desviación estándar con un error de muestreo esperado (promedio). Aunque el error de muestreo es de naturaleza aleatoria podremos controlarlo, es decir, hacerlo más pequeño, seleccionando el tipo de muestreo más adecuado. También controlaremos el costo del muestreo seleccionando el tipo de muestreo que logre reducir sustancialmente ese costo.

Tipos de muestreo probabilístico Algunos tipos de muestreo probabilísticos son los siguientes: Muestreo aleatorio simple, Muestreo aleatorio sistemático, Muestreo aleatorio estratificado y Muestreo aleatorio por conglomerados.

Muestreo aleatorio simple En el muestreo aleatorio simple se seleccionan las muestras mediante métodos que permitan a cada muestra posible tener igual probabilidad de ser seleccionada y a cada elemento de la población, tener igual probabilidad de quedar incluido en la muestra.

El muestreo aleatorio simple es un procedimiento práctico si: 1) La población tiene una desviación estándar

pequeña en comparación a la magnitud de

los datos y su tamaño no es muy grande.

2) Es fácil y poco costoso llegar a los elementos poblacionales. 109 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ejemplo 1. Una población consta de los números 1, 3,

5,

7,

9

a) Calcular la media de la población. b) Hallar la varianza y la desviación estándar de la población. c) ¿Cuántas muestras de tamaño 2 pueden formarse?. d) Cite las muestras. e) Construir la distribución muestral de medias. f) Determinar el valor de la media muestral, varianza muestral y la desviación muestral.

Solución N

x1 + x 2 + x 3 + ...... x N = a)  = N

X i =1

i

N

=

1 + 3 + 5 + 7 + 9 25 = =5 5 5

b) (X -  )

(X -  )2

2

2

1–5

16

Varianza

3–5

4

5–5

0

2 =8

7–5

4

9–5

16

d)

Combinación de 5 en 2.

13

35

57

15

37

59

17

39

N

Desviación estándar Total . . . . .

c)

(x −  ) =

=

40 5

 = 8  = 2.82

40

nCr = 5C2 = 10

79

19

e) 110 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Muestras

Media

P(x)

X . P(x)

(X - )

( X -  )2 P(x)

X

13

2

0.10

0.2

(2 - 5) = - 3

(-3) 2(0.10) = 0.9

15

3

0.10

0.3

(3 - 5) = - 2

(-2) 2(0.10) = 0.4

17

4

0.10

0.4

(4 - 5) = - 1

(-1) 2(0.10) = 0.1

19

5

0.10

0.5

(5 - 5) = 0

0 (0.10) = 0

35

4

0.10

0.4

(4 - 5) = - 1

(-1) 2(0.10) = 0.1

37

5

0.10

0.5

(5 - 5) = 0

39

6

0.10

0.6

(6 - 5) = 1

(1) 2(0.10) = 0.1

57

6

0.10

0.6

(6 - 5) = 1

(1) 2(0.10) = 0.1

59

7

0.10

0.7

(7 - 5) = 2

(2) 2(0.10) = 0.4

79

8

0.10

0.8

(8 - 5) = 3

(3) 2(0.10) = 0.9

5.00

0 (0.10)

= 0

3.0

Media muestral

 x =  x.P( x)  x =

Varianza muestral

 2 x =  (x −  ) .P(x )  2 x = 3

5

2

Desviación muestral

 x = 3  x = 1.7320

Muestreo aleatorio sistemático Es un procedimiento que se aplica a situaciones donde los elementos poblacionales pueden ser seleccionados con un intervalo uniforme que se mide en el orden, en el tiempo o en el espacio. Este procedimiento trata de garantizar que cada elemento poblacional tiene la misma probabilidad de integrar la muestra.

El, muestreo sistemático es un procedimiento práctico si: Se dispone de una lista de los elementos poblacionales y que además de que no son muchos, están en un orden aleatorio. (Marco muestral)

111 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Se tiene un proceso continuo de producción de algún artículo el cual consideramos que genera una población infinita, y que por lo tanto, la manera más práctica de tomar una muestra es fijar un intervalo uniforme que nos permita ir tomando artículos para el control de calidad de la producción.

Como seleccionar la muestra aleatoria. 1. Numerar los elementos poblacionales. 2. Obtener un intervalo de muestreo, utilizando la fórmula k =

N donde N es el tamaño de n

la población y n es el tamaño de la muestra.

3. Seleccionar al azar un punto de arranque r donde 1 < r < k 4. Tomar cada k – ésimo elemento a partir del punto de arranque r. r, r + k, r + 2k, - - -

Ejemplo 2. Tomar una muestra sistemática de 6 casas a partir de una manzana que comprende 78 casas. Solución: 1, 2, 3, 4 . . . . . . . 78

k=

N n

=

78 = 13 6

Para hallar el punto de arranque r se puede utilizar la tabla de números aleatorios. Se trabaja con dos dígitos ya que 13 tiene dos cifras. Iniciando en la fila 2 y la columna4 con una dirección descendiente. (Se toman las dos primeras cifras del número que nos muestra la tabla). Se encuentra el número 7. Este es el primer elemento de la muestra. Entonces los elementos de la muestra son:

7, 7 + 13, 7 + 2(13), 7 + 3(13), 7 + 4(13),

7 + 5(13) o sea: 112

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

7,

20,

33,

46,

59, 72

Ejemplo 3. A partir de una lista de 70 solicitudes de crédito tome una muestra de 8 solicitudes Usando tres dígitos y entrando en la fila 28 columnas 6 con una dirección de izquierda a derecha. Solución Se enumeran las solicitudes así: 1, 2, 3, 4, 5, 6, 7, . . . . . ,70. Intervalo de muestreo k =

N n

70 = 8.75 8

=

(k nuevo 8.75 x 100 = 875)

Utilizar la tabla de números aleatorios para seccionar un número entre 1 y 875. De acuerdo a las coordenadas dadas se encuentra el número 40027. A partir de 400 se suman consecutivamente 875 hasta obtener los ocho números. 400, 1275,

2150,

3025,

3900,

4775,

5650,

6525

Ahora cada número se divide entre 100. Con lo que se obtiene: 4.00,

12.75,

21.50,

30.25,

39.00,

47.75,

56.50,

65.25

Finalmente se suprimen las cifras decimales, resultando: 4, 12, 21, 30, 39, 47, 56, 65

(Estos son elementos que formarán la muestra).

Nota: La entrada a la tabla de números aleatorios puede hacerse de manera arbitraria y la dirección puede ser horizontal o vertical.

Estimación Se refiere a un cálculo aproximado del parámetro poblacional a partir de datos muestrales.

Precisión y exactitud de un estimador Cuando se hacen investigaciones, los datos recopilados a través de un cuestionario escrito o una entrevista personal o telefónica, lo cual da lugar a que se cometan dos tipos de errores.

113 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Errores de muestreo Estos errores ocurren debido a que sólo se hace una observación parcial de la población. El error de muestreo es la diferencia absoluta entre el resultado de la muestra y el parámetro. Em = X −  Estos errores no son medibles porque los parámetros son desconocidos y aunque son aleatorios pueden ser controlados. De manera que a menor error de muestreo, mayor precisión tendrá la estimación.

Errores ajenos al muestreo Estos errores no ocurren debido al muestreo en sí, sino a otras causas, motivo por el cual este tipo de error puede ocurrir aún cuando se trate de un censo. Algunas causas pueden ser: •

Los instrumentos de medida (cuestionarios, entrevistas, etc) no son precisos, esto es, no miden lo que se pretende.

Los entrevistados dan respuestas incorrectas.

El entrevistador anota las respuestas en lugares inapropiados.

Estos errores no son medibles pero pueden ser controlados evitando las causas que los producen.

La exactitud de una estimación tiene que ver con lo que llamaremos el error total, esto es la suma del error de muestreo más el error ajeno al muestreo.

Propiedades de une estimador Insesgado: Un estimador   ´de un estimador  es Insesgado si  tiene una distribución muestral con media de   igual a  lo cual denotaremos así   =  . Esto quiere decir que si utilizamos un estimador Insesgado para hacer una estimación particular de un parámetro, esta puede ser menor o mayor que el parámetro, pero si utilizamos muchas veces el mismo estimador, entonces tendríamos que el valor medio de todas las estimaciones serán igual al parámetro.

114 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Eficiencia: Se desea que tenga una distribución muestral con varianza lo más pequeña posible. Esto asegura una probabilidad alta de que una estimación particular se encuentre cerca del parámetro. Si se tienen dos estimadores  1 y  2 de un mismo parámetro  y la varianza del estimador

 1 es menor que la varianza del estimador  2 lo cual denotaremos así,

 21 <  22

entonces el estimador  1 es más eficiente que el estimador  2. Estimador puntual Un estimador puntual de un parámetro es aquél que proporciona un único estimado del N

parámetro al analizar los datos muestrales. Así, la media muestral X ==

X i =1

n

i

es un

N

estimador puntual de la media poblacional  ==

X i =1

i

N

Estimador por intervalos de confianza. Es aquél que define un par de variables aleatorias Li y Ls que llamaremos límite inferior y límite superior del intervalo entre los cuales diremos que hay una probabilidad de 1 -

(que llamaremos nivel de confianza) de que el parámetro se encuentre entre dichos limites; y también diremos que hay una probabilidad

(que llamaremos riesgo) de que el

parámetro no se encuentre entre dichos límites.

Intervalo de confianza para la media y el total cuando la muestra es grande (n > 30)

X  Z

 n

2

X  Z 2

 n



N −n  N −1

Si la población es infinita.

Si la población es finita. 115

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

N X  Z N

 n

2

N −n  N −1

Intervalo de confianza para el total.

Error estándar de la media X y el total t = N X El error estándar de la media se define así:

x =

x =

 n

Si la población es infinita.

 n

N −n N −1

Si la población es finita.

El error estándar del total N X se denota y escribe así

 N X = N x

O sea:

Nx = N

 n

N −n N −1

2.6.- Error máximo permitido

E =  Z 2

 n

Si la población es infinita

116 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

E = Z

2

E = Z N

N −n N −1

n

N −n N −1

n

2

Si la población es finita.

Error máximo permitido para el total.

N −n n puede omitirse si el cociente < 0.05 N −1 N

Nota: El factor de corrección

2.7.- Tamaño de la muestra requerido n para estimar para estimar  con un error máximo permitido E un nivel de confianza de (1 -

) 100% es:

Para una población infinita.  z  n=  2  E  

    

2

Para una población finita.  z  n0 =  2  E  

    

2

n0

Si N > 0.05

Ejemplo 4.

n0

puede ser reducida a:

n0 N n = n + (N − 1) 0 117

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Consideremos el conjunto de todas las pequeñas industrias de un determinado artículo. Se quiere determinar la producción anual total de todas las industrias y se sabe en base a estudios anteriores que la desviación estándar poblacional de las producciones anuales es igual a 2 en miles de unidades. Con tal propósito se selecciona de un listado actualizado de 826 industrias una muestra aleatoria de 50 industrias obteniendo una ´producción anual promedio de 5.52 en miles de unidades. a) Encuentre un intervalo de confianza del 90% para la producción anual total de las industrias. b) Con una confianza del 95% calcule el valor del error máximo permitido en la estimación de la producción anual total del inciso (a). c) Si quiero estimar la producción anual promedio de las industrias con una confiabilidad del 80% de que el error máximo permitido sea de 300 unidades ¿cuál debe ser el tamaño de la muestra?

Solución: a)

826(5.52)  1.645(826) 4,559.52  372.7304 < t

o sea

4,186.79 < t < 4,932.2504

2 50

826 − 50  826 − 1

4,559.52 – 372.7304 < t <4,559.52 + 372.7304

(en miles de unidades)

b)

E = Z

2

n

N −n 2 E = 1.96(826) N −1 50

826 − 50 826 − 1

E = 444.1043

c) 118 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

n0 =

n0 =

 z   2  E  

    

2

n0 =

2

n0 = 72.8177

72.8177 = 0.088  0.05 Dado que el cociente supera el 5% se aplica 826

el factor de corrección. n = n=

1.28( 2)    0.3  

72.8177(826) 72.8177 + (826 − 1)

n0 N n0 + (N − 1) n = 67 pequeñas industrias.

n = 66.99

Intervalo de confianza para la media y el total cuando la muestra es pequeña (n< 30)

Distribución t de student. Cuando la desviación estándar poblacional

sea desconocida y X tenga una distribución

normal o aproximadamente normal se tiene primero que estimar

para poder estimar

x El error estándar de la media muestral se denota y escribe así:

s n s n

Para una población infinita

N −n N −1

Para una población finita

Intervalo de confianza para la media

X  t 2

s  n

Si la población es infinita. Ejemplo 5. 119 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Una máquina empaca azúcar en bolsas plásticas. Se quiere estimar el peso promedio de las bolsas de azúcar sabiendo por estudios anteriores que la desviación estándar poblacional es de 0.10 libras .Del flujo de producción se toma una muestra aleatoria sistemática de 10 bolsas obteniendo los pesos en libras. 5.10, 4.90, 4.80, 5.15, 5.05, 4.95, 4.97, 4.85, 5.03, 5.00

a) Obtenga un intervalo de confianza del 80% para el peso promedio de las bolsas de azúcar. b) Identifique el error muestral promedio en la estimación del intervalo del inciso (a). c) Con la misma muestra anterior, obtenga un intervalo de confianza para el peso promedio de las bolsas de azúcar para un nivel de confianza del 97%. Compare la longitud de este intervalo con el obtenido en el inciso (a) d) Identifique el error máximo permitido con una confianza del 80% en la estimación del inciso (a) e) Se quiere estimar el peso promedio de las bolsas de azúcar con una confiabilidad de 90% de que el error máximo permitido sea de 0.0313 libras ¿Cuál debe ser el tamaño de la muestra?

Solución: Datos: n = 10,

X = 4.98,

= 0.10

a) NC 80 %

 = 1 − 0.80 = 0.20

 2

=

0.20 = 0.10 2

GL = n – 1 = 10 – 1 = 9 La tabla t student proporciona un valor t

 2

= 1.383

120 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

X  t 2

s 0.10   4.98  1.383  n 10

4.98

0.0437 < 

4.98 − 0.0437    4.98 + 0.0437 4.9363    5.0237

Libras de

azúcar

b)

x =

s n

x =

0.10  = 0.0316 Libras de azúcar. 10 x

c) NC 97 %

 = 1 − 0.97 = 0.03

 2

=

0.03 = 0.015 2

GL = n – 1 = 10 – 1 = 9 La tabla t student proporciona un valor t

X  t 2

 2

= 2.574

s 0.10   4.98  2.574   4.98  n 10

4.98 − 0.08139    4.98 + 0.08139 4.8986    5.06139

0.08139<

Libras de

azúcar Se observa que la longitud de este intervalo es mayor que el obtenido en el inciso (a). Esto quiere significa que entre más confiable sea nuestra estimación, menos precisa será. d)

e)

E = 0.0437 libras de azúcar.

 z  n =  2  E  

    

2

 (1.645)(0.10)  n=    0.0313 

2

n = 27.62

n = 28 bolsas.

121 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ejercicio La población de supermercados de una ciudad se presenta en la siguiente tabla: N0 de Súper

01

02 03 04 05 06 07

08 09 10 11 12

13 14 15

Ventas

84

73 50 35 62 38 26

25 56 45 90 20

87 30 40

diarias(miles C$) a) Tome una muestra aleatoria de 3 supermercados, entrando en la fila 3 columna 4 en dirección horizontal de izquierda a derecha. (Usando muestreo aleatorio simple) b) Determinar la media muestral respecto a las ventas ¿Qué representa

?

c) ¿Cuántas muestras de tamaño 2 pueden formarse?. d) Cite las muestras. e) Construir la distribución muestral de medias. f) Determinar el valor de la media muestral, varianza muestral y la desviación muestral 1) Un auditor quiere tomar una muestra de 20 documentos de un total de 280 que tiene en su poder. Use muestreo sistemático mediante la tabla de números aleatorios entrando en la fila 16 columna 7.

2) Una empresa comercializadora de granos básicos está estudiando la posibilidad de comprar 1000 sacos de frijol. Con el fin de determinar el peso promedio de materias extrañas por saco., tomó una muestra aleatoria de 40 sacos obteniendo un promedio de 2.4 libras y una desviación estándar de 0.62 libras de materias extrañas. a) Obtenga un intervalo de confianza del 95% para el peso promedio de materias extrañas por saco. b) Construya un intervalo de confianza del 90% para el total de materias extrañas en los 1000 sacos. c) Si se quiere estimar el peso promedio de las materias extrañas por saco con una confiabilidad del 98% de que el error máximo permitido sea de

+ 0.10 libras

¿Cuál debe ser el tamaño de la muestra?

122 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

3) Los ingresos del impuesto sobre ventas en una comunidad particular se recogen cada trimestre. Los siguientes datos representan los ingresos (en miles de córdobas), cobrados durante el primer trimestre en una muestra de 9 establecimientos de menudeo en la comunidad.

16,

18,

11,

17,

13,

10,

22,

15,

16

Suponiendo que los ingresos trimestrales del impuesto sobre ventas se distribuyen aproximadamente normal. a) Establezca un intervalo de confianza del 98% para el ingreso trimestral promedio del impuesto sobre ventas para el establecimiento de menudeo. b) ¿Cuál es el error muestral? c) Si hay un total de 300 establecimientos de menudeo en esta comunidad establezca un intervalo de confianza del 95% de los ingresos totales por impuestos sobre ventas que se lograrán en este trimestre. d) Si quiere estimar el ingreso trimestral promedio del impuesto sobre ventas de los establecimientos con una confianza del 95% de que el error máximo permitido sea de C$1,000 ¿Qué tamaño de muestra se requiere?

Prueba de hipótesis Es un procedimiento que consiste en plantear hipótesis y contrastarlas para analizar las diferentes alternativas de tal manera que nos conduzcan a la toma de decisiones. Hipótesis: Es un supuesto que se hace acerca del valor de un parámetro de una población o acerca de parámetros de varias poblaciones.

Tipos de hipótesis Hipótesis nula: La hipótesis nula será generalmente la que afirma en los problemas ausencia de efecto alguno para determinada acción o tratamiento Se representa por H0.

Hipótesis alterna: Es cualquier hipótesis que es contraria a la hipótesis nula. Esto es, que hay presencia de efecto para determinada acción o tratamiento. Se representa por H1. 123 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

En el procedimiento de prueba de hipótesis pueden presentarse cuatro situaciones las que se indican en el cuadro siguiente. Alternativas

Estados de la Naturaleza H0 es verdadera

H0 es Falsa

Aceptarla H0

Decisión correcta

Error tipo II

Rechazar H0

Error tipo I

Decisión correcta

El procedimiento de prueba de hipótesis consta de cinco pasos. Paso 1.

Plantear hipótesis nula e hipótesis alternativa

Paso 2.

Seleccionar un nivel de significación, alfa (expresado en %) alfa.

Paso 3.

Identificar el estadístico de prueba, puede ser: x− Z=  n Si la población es infinita y n > 30 x− Z= N −n  n N − 1 Si la población es finita y n > 30

t=

x− s n

Si la población es infinita y n < 30 Pueden haber otros: Chi cuadrada, Kruskall Wallis, Kolmogorov, Signos, Kendal, Fisher, etc.

Paso 4.

Formular las reglas de decisión

124 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Paso 5.

Conclusión o toma de decisiones. Puede ser: • Aceptar la hipótesis nula o rechazar la hipótesis nula. • En caso de que se rechace la hipótesis nula, se tiene que aceptar la hipótesis alternativa.

Pruebas de una cola (o unilaterales) Por la derecha

Por la izquierda

CuandoH1 :  

0

CuandoH1 :

Z Área de aceptación

  0

- z Área de rechazo

Área de rechazo

Área de aceptación

Prueba de dos colas (o bilaterales) CuandoH1 : 

 0

− Z

Z

2

2

Área de rechazo

Área de rechazo

Área de aceptación Ejemplo 1: 125 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Suponga que cierta región del País cuenta con 200 plantaciones donde se cultiva maíz sin hacer uso de ningún abono. Por muchos años el rendimiento ha sido de 44 quintales por manzana. El MAG está tratando de convencer a los agricultores de la aplicación de un nuevo fertilizante. A manera de prueba los agricultores usaron el fertilizante en 36 plantaciones seleccionadas aleatoriamente obteniendo un rendimiento promedio de 47.30 quintales por manzana y una desviación estándar de 6.6 quintales por manzana. ¿Se debe aplicar el nuevo fertilizante a un nivel de significación del 5%? Solución

Paso 1.

H0:

H1:

 > 44

= 44

Hipótesis nula Hipótesis alternativa

Es prueba de una cola pues la

hipótesis alternativa apunta hacia la derecha.

Paso 2.

 Z=

Paso 3.

Paso 4.

= 0.05 x− N −n  n N −1

Z  = 1.645

Muestra grande (n > 30) Población finita.

(Valor crítico)

Reglas de decisión

0

Si Z < 1.645se acepta H0

A

1.645 R

Si Z > 1.645se Rechaza H0 Z=

47.30 − 44 200 − 36 6.6 36 200 − 1

Z=

3 .3 0.9986

Z = 3.30

Paso 5. Puesto que Z = 3.30 > 1.645 cae en la región de rechazo. Se rechaza la hipótesis nula H0 (que dice que el rendimiento es 44 quintales por manzana) y se acepta la hipótesis 126 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

alternativa (H1 > 44.quintales por manzana).Se concluye que el rendimiento es mayor de 44 quintales por manzana, por tanto se recomienda el uso del nuevo fertilizante. Ejemplo 2: Suponga que una empresa tiene una cantidad muy grande de cuentas por cobrar y que los saldos de esas cuentas tienen aproximadamente una distribución normal. En los libros de la empresa aparece registrado un saldo promedio de C$ 25, 850.

Un auditor, utiliza muestreo estadístico para seleccionar una muestra de 100 cuentas, donde se obtuvo un saldo promedio de C$ 27,550 y una desviación estándar de C$ 1,200 ¿Debe el auditor concluir que el saldo es distinto a C$ 25, 850 y que por lo tanto debe hacer un asiento de ajuste al valor en libros a un nivel de significancia del 2%?

Solución Paso 1.

H0:

H1:

 ≠ 25,850

= 25,850

Hipótesis nula Hipótesis alternativa Es prueba de dos colas pues la hipótesis

alternativa dice “distinto que”. O sea que Paso 2.

= 0.02

Z =

puede ser mayor o puede ser menor.

x−

n

Paso 3.

Paso 4. Z  = 2.33

Muestra grande (n > 30) Población infinita.

(Valor crítico)

2

Reglas de decisión Si Z < - 2.33 se rechaza H0

- 2.33 R

0 A

2.33 R

Si - 2.33 < Z <2.33 se acepta H0 Si Z > 2.33 se rechaza H0 127 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Z=

27,550 − 25,850 1,200 100

1,700 Z = 120

Z = 14.1667

Paso 5. Puesto que Z = 14.1667 >2.33 cae en la región de rechazo. Se rechaza la hipótesis nula H0 (que dice que el saldo promedio es de C$ 25,850) y se acepta la hipótesis alternativa (H1 el saldo promedio es distinto que C$ 25,850) Se concluye que el auditor debe hacer un asiento de ajuste al valor en libros.

Ejemplo 3: Suponga que se tiene un proceso de producción de llenado de cajas de cereal el cual se supone que el peso neto de cereal en las cajas tiene una distribución normal y que además proporciona un peso promedio de real en las cajas de 3 libras. Puesto que este proceso está sujeto a inspecciones periódicas por parte de la Oficina local de protección a los consumidores, quienes únicamente les interesa la “falta de peso “en los productos. Se tomó una muestra aleatoria de 6 cajas obteniendo los siguientes pesos en libras:

1.85, 2.10,

1.95,

1.83, 2.18, 1.97

¿Existe suficientes evidencia para decir que el

proceso no está funcionando correctamente a un nivel de significación del 1%?

Solución. Paso 1.

Paso 2.

H0:

H1:

 <2

= 0.01

t= Paso 3

= 2 libras libras

x− s n

Paso 4. t = - 3.365

El proceso está funcionando correctamente. El proceso no está funcionando correctamente.

Muestra pequeña (n < 30) población infinita.

(Valor crítico) 128

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Reglas de decisión

- 3.365

Si Z < - 3.365 se rechaza H0

R

0 A

Si Z > - 3.365 se acepta H0 G. L. = n – 1 = 6 – 1 = 5 Se busca en la tabla t student (Fila 5 columna de 0.01)

t=

1.98 − 2 0.1377 6

t = - 0.355

Paso 5. Como t = - 0.355 > - 3.365 cae en la región de aceptación. Se dice que no hay suficiente evidencia para rechazar la hipótesis nula H 0:

= 2. Se concluye que el proceso de

producción está funcionando correctamente.

Prueba para la diferencia de dos medias con muestras independientes. El estadístico de prueba es:

Z=

(x

1

− x 2 ) − ( 1 −  2 ) 2

2

S1 S + 2 n1 n2

Ejemplo 4: Una organización deportiva desea conocer si el tiempo promedio que requieren los hombres para jugar los 18 hoyos de golf es diferente al de las mujeres. Se mide el tiempo de 50 partidos para hombres y 45 para mujeres obteniendo los siguientes datos.

Hombres

n1 = 50

Mujeres

n2 = 45

X 1 = 3.5 horas

X

S1 = 0.9 horas

S2

2

= 4.9 horas = 1.5 horas

Pruebe la hipótesis al nivel de significación del 5%. 129 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Solución. Paso 1.

Paso 2.

H0:

h

H1:

h ≠  m

=

m

.

 = 0.05

Paso 3. Z =

(x

1

− x 2 ) − ( 1 −  2 ) 2

2

S1 S + 2 n1 n2

Paso 4. Z  = 1.96

(Valor crítico)

2

Reglas de decisión

-1.96

Si Z < - 1.96 se rechaza H0

R

0

1.96

A

R

Si - 1.96 < Z <1.96 se acepta H0 Si Z > 1.96 se rechaza H0

Z=

(x

1

− x 2 ) − ( 1 −  2 ) 2

2

Z=

(3.5 − 4.9) − (0 − 0)

S1 S + 2 n1 n2

0.9 2 1.52 + 50 45

Z = - 5.44

Paso 5. Dado que el valor de Z = - 5.44 < - 1.96 cae en la región de rechazo. Debido a que la hipótesis nula de igualdad es rechazada,

xm  xh ,

la evidencia sugiere que las

mujeres toman más tiempo en promedio. Vale la pena notar también que el valor P relacionado con la prueba es virtualmente, igual a cero.

Ejemplo 5: Se está estudiando la durabilidad de dos tipos de amortiguadores de caucho para coches de bebé. De una población se tomó una muestra de 13 unidades de la cual se obtuvo una duración media de 11.3 semanas con una desviación estándar de 3.5 semanas. De otra población se tomó una muestra de 10 unidades donde se obtuvo una duración media de 7.5 semanas y una desviación estándar de 2.7 semanas.

¿Hay diferencias en las duraciones de los 130

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

amortiguadores para ambas poblaciones? Pruebe la hipótesis con un nivel de significación de 0.02

Solución: Como se trata de muestras pequeñas y las varianzas poblacionales no son iguales, los grados de libertad se calculan con la siguiente fórmula

GL =

 S1 2 S 2 2     n + n  2   1 2

2

2

 S1   S2       n   n   1  + 2  n1 − 1 n2 − 1 2

2

GL =

 3 .5 2 2 .7 2    + 10   13 2

2

 3 .5   2 .7      13 10   +  13 − 1 10 − 1 2

2

2

GL =

2.793269402 GL = 20.995 0.133044315

GL = 21 Paso 1.

Paso 2.

H0:

h

H1:

h ≠  m

= 0.02

Paso 3. t =

(x

1

=

m

− x 2 ) − ( 1 −  2 ) 2

2

S1 S + 2 n1 n2 Paso 4. GL = 21

 2

=

0.02 = 0.01 El valor crítico es: 2.518 (tabla t student). 2

Reglas de decisión Si t < - 2.518 se rechaza H0

-2.518 R

0

2.518

A

R

Si - 2.518 < t <2.518 se acepta H0 Si t > 2.518 se rechaza H0

131 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

t=

(x

1

− x 2 ) − ( 1 −  2 ) 2

2

t=

(11.3 − 7.5) − (0 − 0)

S1 S + 2 n1 n2

t = 2.93.9

3 . 5 2 2 .7 2 + 13 10

t = 2.94

Paso 5. Puesto que el valor de t = 2.94 > 2.518 cae en la región de rechazo. Se acepta la hipótesis alternativa Debido a que la hipótesis nula de igualdad es rechazada,

x 1  x 2 , la evidencia sugiere

que el tipo I de amortiguador de caucho para el coche de bebé presenta mayor durabilidad.

Prueba acerca de las proporciones El estadístico de prueba que se usa es: Z=

Z=

Ps − Po

Po (1 − Po ) n Ps − Po Po (1 − Po ) N − n n N −1

Si la población es infinita y n > 30

Si la población es finita y n > 30

Ps es la proporción de casos de la muestra.

Ps =

x n

Ejemplo 6: Una empresa tiene 1,500 cuentas por cobrar. En los libros de la empresa aparece registrado que sólo el 2% de los documentos no satisfacen los requisitos establecidos. Un auditor selecciona una muestra aleatoria de 300 y verifica que 12 no satisfacen los requisitos establecidos. ¿Hay evidencia suficiente para que el auditor declare a un nivel de significación del 1% que más del 2% de las cuentas no satisfacen los requisitos establecidos por la institución?. Solución Paso 1. H0: P0 = 0.02 Declarar que el 2% de las cuentas no satisfacen los requisitos. H1: P0> 0.02 Declarar que más del 2% de las cuentas no satisfacen los requisitos 132 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Paso 2.

= 0.01

Ps − Po Po (1 − Po ) N − n n N −1

Paso 3. Z =

Paso 4.

Z  = 2.33

Población finita y muestra grande.

(Valor crítico)

Reglas de decisión

0

Si Z < 2.33 se acepta H0

2.33

A

R

Si Z > 2.33 se Rechaza H0

Ps =

Z=

x 12 = 0.04 Ps = 300 n 0.04 − 0.02 0.02(1 − 0.02) 1500 − 300 300 1500 − 1

Z = 2.765

Paso 5. Puesto que Z = 2.765 >2.33 cae en la región de rechazo. Se rechaza la hipótesis nula H0 (que dice que el 2% de las cuentas no satisfacen los requisitos) y se acepta la hipótesis alternativa (H1que más del 2% de las cuentas no satisfacen los requisitos)Se concluye que el auditor debe declara que más del 2% de las cuentas no satisfacen los requisitos institucionales.

Nota: El factor de corrección

N −n n puede omitirse si el cociente < 0.05 N −1 N

En este caso no es posible omitirlo puesto que

n 300 = = 0.20  0.05 N 1500 133

MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Prueba para la diferencia de dos proporciones El estadístico de prueba que se usa es: Z=

(P1 − P2 ) − ( 1 −  2 ) P1 (1 − P1 ) P2 (1 − P2 ) + n1

n2

Ejemplo 7: Un minorista desea probar la hipótesis de que la proporción de sus clientes masculinos quienes compran a crédito es igual a la proporción de mujeres que utilizan el crédito. Para tal fin, seleccionó una muestra de 100 clientes hombres y encontró que 57 compraban al crédito, mientras que una muestra de 110 clientes mujeres, 52 lo hicieron. Pruebe la hipótesis de que la proporción de hombres que compran al crédito, es la misma que la proporción de las mujeres a un nivel de significación del 1%.

Solución: Paso 1. H0:  h =  m . H1:  h ≠  m

Paso 2.

Paso 3

Z=

= 0.01

(P1 − P2 ) − ( 1 −  2 ) P1 (1 − P1 ) P2 (1 − P2 ) + n1

Paso 4.

P1 =

Z  = 2.58

57 100

n2

P1 = 0.57

P2 =

52 110

P2 = 0.473

(Valor crítico)

2

134 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

R - 2.58

A

2.58

R

Reglas de decisión Si Z <- 2.58 se rechaza H0 Si - 2.58 < Z < 2.58 se acepta H0 Si Z > 2.58 se rechaza H0

Z=

(0.57 − 0.473) − (0 − 0) 0.57(1 − 0.57) 0.473(1 − 0.473) + 100

Z=

0.097 0.002451+ 0.0022661

Z = 1.4123

110

Paso 5. Puesto que Z = 1.41 está entre - 2.58 y 2.58 cae en la región de aceptación. Se acepta a hipótesis nula H0 (que dice que la proporción de clientes masculinos es igual a la proporción de clientes femeninos que compran al crédito).

Ejercicio (7) 1) Suponga, según registros históricos de la industria de la langosta en Nicaragua, que la captura de langosta por trampa tiene una distribución normal con un promedio de 30.31 libras, sin embargo, debido a protección y conservación de estas especies por las medidas gubernamentales, este promedio se ha disminuido notablemente. Una muestra aleatoria de 10 trampas para langostas, desde que la restricción entró en vigor, proporciona los siguientes resultados: 17.4, 33.7,

37.2,

27.5,

41.7,

18.9,

39.6,

34.4,

19.6,

24.1 libras.

¿Ha disminuido la captura promedio de la langosta por trampa a un nivel de significación del1?

2) El rendimiento promedio de maíz en las plantaciones hace un tiempo era de 50 quintales por manzana con una desviación estándar de 4 quintales por manzana. Se utilizó un nuevo fertilizante a un grupo de 52 plantaciones seleccionadas al azar obteniendo un rendimiento promedio de 55 quintales por manzana. Suponiendo que 135 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

la desviación estándar de los rendimientos con el nuevo fertilizante sigue siendo la misma, ¿Se puede afirmar que ha habido un incremento significativo en el rendimiento? Use un nivel de significación del 5%.

3) Un vendedor de neumático está interesado en comprar unidades cuya duración promedio sea mayor de 15,000 millas. Una firma productora le informa que posee neumáticos que cumplen con este requisito. El vendedor selecciona una muestra aleatoria de 25 unidades y determina que la media X = 25, 000 millas y una varianza S2

= 625,000 millas2.Suponga que la duración de los neumáticos sigue una

distribución normal, ¿Habrá acuerdo entre la firma productora y el vendedor a un nivel de significación del 10?

4) El gerente de una Compañía financiera se queja de que el 7% de los pagos parciales de pestanos hechos a consumidores no se cubren a tiempo, ¿Podríamos afirmar que esa cifra es diferente, si 80 de 1,500 pagos de préstamos no se hacen a tiempo? Utilice un nivel de significación del 1%.

5) Un nuevo sistema de capacitación a los empleados de una fábrica asegura que proporciona un rendimiento promedio de 75 puntos. En una muestra aleatoria de 10 estudiantes se comprobó que las calificaciones fueron:70, 90,

60,

80,

75,

55,

65,85,

75,55. Suponga que la distribución de las calificaciones es normal.

¿Podemos decir que el nuevo sistema no alcanza el rendimiento promedio que asegura?.Use un nivel de significación del 5%.

6) Muestras de tamaño 50 y 60 revelan medias de 512 y 587 con desviaciones estándar de 125 y 145 respectivamente. A un nivel del 2% pruebe la hipótesis de que m 1 = m2.

136 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

7) A un nivel del 1% pruebe la igualdad de las medias si muestras de tamaño 10 y 8 dan medias de 36 y 49 y desviaciones estándar de 12 y 18, respectivamente. Se asume que las varianzas no son iguales.

8) Resuelva el problema anterior asumiendo ahora que las varianzas son iguales.

9) Muestras de tamaño 120 y 150 produjeron proporciones de 0.69 y 0.73 Pruebe la igualdad de proporciones de la población al nivel del 5%.

10) Dos muestras de tamaño 500 cada una se utilizaron para probar la hipótesis de que H0: 1   2 las proporciones muestrales son 14% y 11%...A un nivel del 10% ¿Cuál es su decisión?

137 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Bibliografía Alvir Videa, I. d. (2015). Dossier de Estadísica y Probabilidades . Estelí, Nicaragua . Córdoba Zamora , M. (2003). Estadística Descriptiva e Inferencial - Aplicaciones (5ta Ed ed.). Lima, Perú: MOSHERA S.R.L. Merli, G. (2015). Escalas de medición en Estadística. Sistema de Información CientíficaRed de Revistas Científicas de América Latina y el Caribe, España y Portugal, 243-246. Navarro Hudiel, S. J. (2018). Estadística (Teoría de Probabilidades y más). Estelí, Nicaragua: UNIVERSIDAD NACIONAL DE INGENIERÍA Recinto Universitario Augusto C. Sandino. Ruiz Muñoz, D. (2004). Manual de estadística. Sevilla, españa: Universidad Pablo de Olavide. Universidad Nacional Autónoma de Nicaragua UNAN MANAGUA. (2013). Programa de Asignatura Estadística y Probabilidads. Managua, Nicaragua : UNAN MANAGUA . Wackerly, D. D., Mendenhall, W., y Scheaffer, R. L. (2010). Estadística Matemática con Aplicaciones (7ma Ed ed.). México DF: Cengage Learning Editores, S.A.

138 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Solucionario de Ejercicios Propuestos Conceptos fundamentales de estadística descriptiva Pág. 11 - 13

a)

b) Cuantitativa – Continua c)

Ejercicio 1.1 Población: las personas que sufren hipertensión. Muestra: 5000 Ejercicio 1.2 Variable Nominal

Cuantitativa – Discreta Cualitativa – nominal

d) Cuantitativa – Discreta e)

Cualitativa – Nominal

f)

Cuantitativa – Continua

g) Cualitativa – Nominal h) Cuantitativa – Discreta i)

Cualitativa – Ordinales

j)

Cuantitativa – Continua

Estado Civil

k) Cuantitativa – Continua

Nacionalidad

l)

La profesión de un grupo de personas

m) Cuantitativa – Continua

Lugar de nacimiento

n) Cualitativa – Ordinal

Cualitativa – Nominal

o) Cuantitativa – Discreta Variable Ordinal

p) Cuantitativa – Discreta

La nota en un examen

q) Cualitativa – Nominal

Grado de escolaridad

r)

Cuantitativa – Discreta

El número de carnet de los estudiantes

s)

Cuantitativa Continua

matriculados en la Universidad

t)

Cualitativa – Ordinales

Intensidad de dolor

u) Cuantitativa – Discreta

v) Cualitativa – Ordinales Variable Discreta ▪

Ejercicio 1.4 Cantidad de estudiantes por aula en los distintos niveles educativos

a)

Número de maestros en un aula

b) Ordinales

Número de aulas de FAREM-Estelí

c)

Número de teléfonos móviles por familia

d) Nominal

Variable Continua

De razón

De razón

e)

Ordinal

f)

Nominal

Peso

g) Nominal

Edad

h) De Intervalo

La distancia de una carretera

i)

Nominal

Temperatura

j)

Nominal

Ejercicio 1.3

139 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Tablas de Frecuencias

Ejercicio 1.7

Ejercicio 1.5

Se agrupan los datos en una tabla de frecuencia para posteriormente

Clase 16 - 17 18 - 19 20 - 21 22 - 23 24 - 25 26- 27 Σ

f 5 11 10 9 3 2 40

fa 5 16 26 35 38 40

fr 0.125 0.275 0.25 0.225 0.075 0.05 1

fr% 12.5 27.5 25 22.5 7.5 5 100

fra 0.125 0.4 0.65 0.875 0.95 1

fra% 12.5 40 65 87.5 95 100

Limites Reales 15.5 – 17.5 17.5 – 19.5 19.5 – 21.5 21.5 – 23.5 23.5 – 25.5 25.5 – 27.5

Xi 16.5 18.5 20.5 22.5 24.5 26.5

representarlos en el histograma.

Ejercicio 1.6 Se recogen en primer lugar los datos en una tabla de frecuencias, para posteriormente representarlos en el diagrama de barras. xi

f

0

3

1

17

2

17

3

6

4

7

Ejercicio 1.8

139 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ejercicio 1.9 a)

Ejercicio 1.12

La serie ordenada de los 9 datos es: 1, 3, 7, 14, 16, 30, 99, 120, 2,000.

La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos

Me: 60,67 Mo: 61,43 X: 60,4

cada uno. Esto es, Me = 16. Ejercicio 1.13 b) La serie ordenada de los 8 datos es: 2.2 3, 11, 29, 30, 36, 77, 300, 10,000. UNIDAD II PROBABILIDADES La mediana en este caso, puede ser cualquier número situado entre 30 y 36, ya que este dividirá a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la infinidad de valores, se elige como mediana la

Ejercicios Pág. 62 1.

semisuma de los dos valores centrales. Esto es, Me = (30 + 36) / 2 = 33 . a)

0,60

b) 0,25

Ejercicio 1.10

c)

0,34

a) es igual a 7. Esta serie de datos es unimodal b) es igual tanto a 3, como a 5. Esta serie de datos es bimodal. c) no existe. (También vale decir que cada uno de los datos es una moda). 2) 0,52 3) 0,64

5

(b) 1) 0,48

Ejercicio 1.11

x=

11. Pág. 64

f i xi

i =1

20

=

44 = 2.2. 20

4) 0,36

140 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

Ejercicios Pág. 69

32) 38/63 33) 30 rutas

Permutaciones

34) 560 560 13) 7 560

35) 0,03226

14) a) 720

b) 72

c) 144

38) a) 14/39

b) 95/112

15) 4 896. Ejercicios pág. 97

16) 103 680

Variable aleatoria y distribución híper-geométrica

Reglas de adición y de multiplicación 17) a) 1 213 056 18) a) 24

2) 5/14

b) 233 280

b) 576

c) 360

3) .

Combinaciones 19) a) 286 b) 165 c) 110

 4  2     x  3 − x   a) P( x, 6, 3, 4 ) = 6    3

b) 4 / 5

21) 5 775 Distribución Binomial

22) 15 23) a) 45

b) 24 c) 21.

7) a) 0,6155

c) 0,1484

 = 1.677 8) R/  = 3.75 3.75 ± 2(1.677) = (0.396, 7.104) 10) 0,3134

Otros Problemas variados 24) a) 3/8

b) 0,4613

b) 19/40

12) 0,0515

26) 1/4 27) a) 0,3

b) 0,2

28) a) 2/3

b) 1/15

Distribución normal

c) 7/15

d) 8/15 17) 0,0808

29) 2/5 30) a) 0,4

b) 0,7

c) 0,7

d) 0,3

31) a) 0,6

b) 0,7

c) 0,4

d) 0

18) 4,56 % 19) a) 0,0062

b) 0,6826

c) 9,969 centímetros

141 MS.c Cliffor Jerry Herrera castrillo


Estadística y Probabilidades – II Año de Física Matemática

20) a) 0,0571 21) a) 56,99 %

b) 99,11%

c) 0,3974

d) 27,952 min

b) $ 10,23

22) 6,24 años

142 MS.c Cliffor Jerry Herrera castrillo


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.