Statistik

Page 1

Statistik Edición 13 Noviembre 2014

www.statistik.com.ve

Editorial:

PROBABIILIDAD EN ESTADÍSTICA

EXISTE ALGO LLAMADO… DISTRIBUCIÓN DE PROBABILIDAD

La posibilidad de los “eventos raros”

Revista Statistik: La forma más fácil de entender estadística.



Distribución de Probabilidad

Statistik

Nuestra edición abordará el tema de la distribución de probabilidad.

Contenido de la edición 13 - Noviembre 2014 de Statistik

Editorial: Probabilidad en Estadística Por Jhoan José Becerra

Existe algo llamado…Distribución de Probabilidad Por María Fernanda Mendoza

Son muchas “probabilidades” Por Dayana Carolina Rondón

Lo “uniforme” y el éxito-fracaso Por José Ramón Jaimes

El éxito hasta el final Por Juan Manuel Quiñones

Geométrica es… el número de intentos hasta conseguir el primer éxito Por José Antonio Santos

Existe algo más allá de geométrica… la Hipergeométrica Por José Antonio Santos

Entretenimiento Por María Fernanda Mendoza

La posibilidad de los “eventos raros” Por Juan Manuel Quiñones


Statistik Editorial G4 Grupo 4 de Estadística SAIA Coordinación y Diseño Jhoan Becerra Integrantes y Redactores Jhoan Becerra Juan Quiñones María Mendoza Dayana Rondón José Santos José Jaimes Publicidad: Dayana Rondón Entretenimiento: María Mendoza Docente Lucy Navas Distribuido en: Venezuela Institución: IUPSM Sede Mérida Información Esto ha sido a modo de evaluación para la materia de Estadística. Es para fines educativos

Probabilidad en Estadística La Probabilidad es útil para comprobar la “fiabilidad” de las Inferencias Estadísticas y para predecir el tipo y la cantidad de datos necesarios, en un determinado estudio o investigación estadística.

En nuestros días, la Estadística se

ha convertido en un método efectivo para describir con gran margen de fiabilidad: las tendencias y valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del "Experto en Estadística Aplicada" no consiste ya, sólo en reunir, tabular y graficar los datos, sino fundamentalmente en captar el proceso de interpretación de esa información. El desarrollo de la Teoría de la Probabilidad ha aumentado el alcance de las Aplicaciones de la Estadística. Muchos conjuntos de datos se pueden aproximar con gran exactitud, utilizando determinadas Distribuciones Probabilísticas; los resultados de éstas se emplean para analizar bases de datos históricos. La Probabilidad es útil para comprobar la “fiabilidad” de las Inferencias Estadísticas y para predecir el tipo y la cantidad de datos necesarios, en un determinado estudio o investigación estadística, así como regresionar y correlacionar los mismos con cierta “significancia”. La Estadística es una Ciencia de Aplicación Práctica, “Casi Universal” en todos los Campos de Investigación, donde sea necesaria la Toma de una Decisión, bajo condiciones de incertidumbre. Como lo pueden ser: Abogacía y Ciencias Jurídicas, Arquitectura y Ciencias Urbanísticas, Ciencias poíticas, control de validad, demografía, educación, en la

saludad, estadística en ingeniería, psicología, en las ciencias sociales, en deportes y hasta incluso en turismo. Es por ello que el objetivo de nuestra edición número trece (13) de Statistik quiere presentarles una colección de artículos relaciones con la distribución de probabilidades, de conocer todo su abanico de opciones y formas de presentar la probabilidad en estadística; que puede abarcar desde conocer si al lanzar una moneda, cuál será la probabilidad de caer cara o sello, además de conocer el “éxito” o “fracaso” de algunas premisas. Deseamos que esta temática sea de fácil entendimiento para usted, estimado lector. Disfrute de nuestra revista. Sinceramente, Jhoan Becerra


Existe algo llamado…

Distribución de Probabilidad Por María Fernando Mendoza

Qué se puede definir como distribución de probabilidad? Primero hacemos un recordatorio de que en la estadística tenemos como uno de sus principales objetivos el conocimiento cuantitativo de una determinada parcela de la realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio, partiendo de la premisa de que lo real es siempre más complejo y multiforme que cualquier modelo que se pueda construir. De todas formas, la formulación de modelos aceptados por las instituciones responsables y por los usuarios, permite obviar la existencia del error o distancia entre la realidad y el modelo.

Recordemos probabilidad

ahora

El primer paso para descubrir y analizar el término probabilidad es establecer su origen etimológico. En

este caso hay que subrayar que el mismo se encuentra en el latín, y más exactamente en la palabra probabilitas, que está formada por la unión del verbo probare que puede traducirse como “comprobar”, el sufijo –bilis que equivale a “posibilidad” y el también sufijo – tat- que lo que viene a indicar es una “cualidad”. Con origen en el latín probabilitas, probabilidad es una palabra que permite resaltar la característica de probable (es decir, de que algo pueda ocurrir o resultar verosímil). Se encarga de evaluar y permitir la medición de la frecuencia con la que es posible obtener un

La probabilidad, por lo tanto, puede definirse como la razón entre la cantidad de casos prósperos y la cantidad de cuestiones posibles.

cierto resultado en el marco de un procedimiento de carácter aleatorio. Ahora bien, si hablamos de la distribución de probabilidad es necesario resaltar que también es conocida como distribución teórica, es decir, es una distribución que describe cómo se espera que varíen los resultados. Dado que esta clase de distribuciones se ocupan de las expectativas, son modelos de gran utilidad para hacer inferencias y tomar decisiones en condiciones de incertidumbre. De esta manera, la distribución de probabilidad la comenzaríamos explicando con la funcionalidad que posee sus variables, iniciando con la variable aleatoria la cual es basada en asumir diferentes valores a consecuencia de los resultados de un experimento aleatorio. Por ese motivo, una forma usual de describir la distribución de probabilidad de una variable aleatoria es mediante la denominada función de densidad, en tanto que lo que se conoce como función de distribución representa las probabilidades acumuladas.


Los objetivos de distribuciones de probabilidad son: a) Introducir las distribuciones de probabilidad que más se utilizan en la toma de decisiones. b) Utilizar el concepto de valor esperado para tomar decisiones. c) Mostrar qué distribución de probabilidad utilizar, y cómo encontrar sus valores. d) Entender las limitaciones de cada una de las distribuciones de probabilidad que utilice.

Teniendo ya esta serie de conceptos claros, te invito a seguir leyendo los próximos artículos de esta edición de nuestra revista Statistik para conocer


Son muchas “probabilidades” Conozca un poco más sobre la distribución de probabilidad y su clasificación Por Dayana Carolina Rondón

Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo. Es decir, describe la probabilidad de que un evento se realice en el futuro, lo implica que se puede diseñar un escenario de acontecimientos futuros considerándolas tendencias actuales de diversos fenómenos naturales. Una distribución de probabilidades es una lista de las probabilidades de todos los resultados posibles que pudiera resultar si el experimento se hace; es decir, es la suma de todas las funciones en las que interviene la variable aleatoria “x” bajo estudio. Las distribuciones de probabilidad siempre es la suma de todas las funciones posibles, por tanto su sumatoria siempre tiene que ser igual al espacio muestral; esto es: f(x) = 1 f(x) = 100% Para saber cual es la f(x) que corresponde se deberá estudiar los tipos de distribuciones de probabilidad que podemos tener. Para esto, lo importante es definir el tipo de variable que tenemos bajo

estudio, y de aquí surge la clasificación de las distribuciones.

Por su parte dentro de las continuas encontramos:

Clasificación de las Distribuciones de Probabilidad

-

Distribuciones Discretas: Se presentan cuando nuestra variable de estudio es discreta; esto es, solo puede asumir valores enteros, sin decimales. Acá podemos encontrar: -

Uniforme discreta Binomial
 Hipergeométrica Geométrica
 Binomial Negativa Poisson

Distribuciones Continuas: Se presentan cuando nuestra variable de estudio es continua; esto es, puede asumir valores dentro de un intervalo de valores.

Distribución Uniforme Distribución Normal Distribución Lognormal Distribución Logística Distribución Beta Distribución Gamma Distribución Exponencial Distribución Ji-cuadrado Distribución t de Student - Distribución F de Snedecor Sin embargo, cabe destacar que son muchas “probabilidades” muchos modelos de distribución de probabilidad- es por ello, que es esta edición únicamente hablaremos de las distribuciones discretas. Por ello, en los próximos artículos que están a continuación de este, podrá encontrar información sobre qué define la distribución binomial, la geométrica y todas las mencionadas anteriormente.


Lo “Uniforme” y el éxito-fracaso

Por José Ramón Jaimes

En teoría de la p r o b a b i l i d a d y e s t a d í s t i c a , la distribución de probabilidad de u n a v a r i a b l e a l e a t o r i a e s una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los sucesos, cada uno de los sucesos es el rango de valores de la variable aleatoria. En este artículo se explicará que son las Distribuciones de Probabilidades Uniformes Discretas y las Distribuciones de Probabilidades Binomiales. La distribución Uniforme es el modelo (absolutamente) continuo más simple. Corresponde al caso de una variable aleatoria que sólo puede tomar valores comprendidos entre dos extremos a y b, de manera que todos los intervalos de una misma longitud (dentro de (a, b)) tienen la misma probabilidad. La Distribución Uniforme se puede aplicar para variables de tipo: ✓ Discretas ✓ Continuas

Las Distribuciones Uniformes Discretas son las más sencillas de las distribuciones discretas (Las variables discretas son aquellas que pueden tener un conjunto finito numerable. Normalmente, en los resultados que contengan números, se trabaja este tipo de variable). En teoría de probabilidad la distribución uniforme discreta es una distribución de Probabilidad la cual asume un número finito de valores con la misma probabilidad donde todos los elementos de un conjunto finito son equiprobables. Modeliza fenómenos en los que tenemos un conjunto de n sucesos posibles, cada uno de los cuales con la misma probabilidad de ocurrir.

También tenemos lo que son las Distribuciones de Probabilidades Binomiales Discretas. La distribución binomial parte de la distribución de Bernouilli: • La distribución de Bernouiili se aplica cuando se realiza una sola vez un experimento que tiene únicamente dos posibles resultados (éxito o fracaso), por lo que la variable sólo puede tomar dos

valores: el 1 y el 0 • La distribución binomial se aplica cuando se realizan un número"n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: ✓ 0: si todos los experimentos han sido fracaso ✓ n: si todos los experimentos han sido éxitos Ejemplo: se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10. Con esto podemos concluir que las distribuciones Binomiales tienen las siguientes características: ✓ Los intentos son independientes. ✓ Cada resultado del intento puede tomar únicamente dos resultados mutuamente excluyentes, que denotaremos por EXITO (E) o FRACASO (F). ✓ La probabilidad de éxito (y por lo tanto la de fracaso) es constante en cada intento.


Éxito hasta el final. Por Juan Manuel Quiñones

✓ En teoría de la probabilidad y la estadística, la distribución binomial negativa es una distribución de probabilidad discreta del número de éxitos en una secuencia de ensayos de Bernoulli antes de un número determinado de ocurra algún fallo. Supongamos que hay una secuencia de ensayos de Bernoulli independientes, cada ensayo tiene dos resultados posibles llamados "éxito" y "fracaso". En cada ensayo, la probabilidad de éxito es p y de fracaso es r. Estamos observando esta secuencia hasta que se produzca un número r predefinido de éxitos. Cuando se aplica a problemas del mundo real, los resultados de éxito y fracaso pueden o no pueden ser los resultados que comúnmente vista como el bien y el mal, respectivamente. Supongamos que hemos utilizado la distribución binomial negativa para modelar el número de días que cierta máquina funciona antes de que se rompa. En este caso, el "éxito" sería el resultado en un día cuando el equipo funcionaba correctamente, mientras que una ruptura sería un "fracaso". Si se utilizó la distribución binomial negativa para modelar el número de intentos de gol de un deportista hace antes de marcar un gol, sin embargo, cada intento fallido sería un "éxito", y marcar un gol sería "fracaso". En la distribución geométrica, la variable aleatoria estaba definida como el número de ensayos Bernoulli necesarios para obtener el primer éxito. Suponga ahora que se desea conocer el número de ensayos hasta obtener r éxitos; en este caso la variable aleatoria es denominada binomial negativa.

constante de éxito p. Se dice entonces que X tiene una distribución binomial negativa con parámetros p y r = 1, 2, 3,… f(x,p,r)= x-1Cr-1 x=r,r+1,r+r+2+….

qx-r . pr

Algunos autores denotan esta distribución como b*(x,p,r) Observe que en el caso especial donde r = 1, la variable aleatoria binomial negativa se convierte en una variable aleatoria geométrica.

Comparación entre una variable aleatoria binomial y una variable aleatoria binomial negativa.

Procedimiento: Al igual que en la distribución binomial, se identifican p y q, que son la probabilidad de éxito y de fracaso. La x simboliza el número de intentos. Una vez que se identifican los datos, se sustituyen en la formula. Se eleva q a la x - 1, y el resultado se multiplica por p. Ejemplo: Los registros de una compañía constructora de pozos, indican que la probabilidad de que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es de 0.20. a)

¿Cuál es la probabilidad de que el sexto pozo construido por esta compañía en un año dado sea el segundo en requerir reparaciones en un año?

Variable aleatoria

Predeterminado

Aleatorio

Binomial

Conteo del número de éxitos en n ensayos Bernoulli,

Número total de ensayos

Número de éxitos.

Binomial negativa

Conteo del número se ensayos necesarios para obtener r éxitos.

Número de éxitos

Número de ensayos.

La media y la varianza de una variable aleatoria binomial negativa X con parámetros p y r son:

Mx =E(x)= r/p V(x)= r.p/p2 La media y xla varianza de una variable aleatoria geométrica son:

Formula de la variable binomial negativa

b) ¿Cuál es la probabilidad de que el octavo pozo construido por esta compañía en un año dado sea el tercero en requerir reparaciones en un año? Solución: k = 6 pozos r = 2 pozos que requieren reparaciones en un año p = p(pozo requiera reparaciones en un año) = 0.20 q = p(pozo no requiera reparaciones en un año) = 0.80 p(Y = 6) = b) k = 8 pozos

La distribución binomial negativa o distribución de Pascal es una generalización de la distribución geométrica donde la variable aleatoria X es el número de ensayos Bernoulli efectuados hasta que se tienen r éxitos, con una probabilidad

p=[X=x]=q p

r = 3 pozos que requieren reparaciones en un año p = p(pozo requiera reparaciones en un año) = 0.20 q = p(pozo no requiera reparaciones en un año) = 0.80 p(Y = 8) =


La Posibilidad de “eventos raros” Por Juan Manuel Quiñones

A la distribución de Poisson se le llama distribución de los "eventos raros" pues se usa como aproximación a la binomial cuando el tamaño de muestra es grande y la proporción de éxitos es pequeña. Esos intervalos de medida pueden referirse a: Tiempo: (Segundo, minuto, hora, día, semana, etc.) Área: (Segmento de línea, pulgada cuadrada, Centímetro cuadrado, etc.). Volumen:( Litro, galón, onza, etc.) Esta distribución es una de las más importantes distribuciones de variable discreta. Sus principales aplicaciones hacen referencia a la modelización de situaciones en las que nos interesa determinar el número de hechos de cierto tipo que se pueden producir en un intervalo de tiempo o de espacio, bajo presupuestos de aleatoriedad y ciertas circunstancias restrictivas.

Criterios o propiedades 1. Se da un intervalo de medida que divide un todo de números reales y donde el conteo de ocurrencias es aleatorio. Esa división puede ser un sub-intervalo de medida.

2. El número de ocurrencias ó de resultados en el intervalo ó subintervalo de medida, es independiente de los demás intervalos ó sub-intervalos. por eso se dice que el proceso de Poisson no tiene memoria. 3. La probabilidad de que un solo resultado ocurra en un intervalo de medida muy corto ó pequeño es la misma para todos los demás intervalos de igual tamaño y es

proporcional a la longitud del mismo ó al tamaño de medida. 4. La probabilidad de que más de un resultado ocurra en un intervalo ó sub-intervalo corto es tan pequeña que se considera insignificante (cercana ó igual a cero). Para la obtención de la media y la varianza aplicaríamos la F.G.M.; derivándola sucesivamente e igualando t a cero.

Una vez obtenida la media, obtendríamos la varianza en base a:

Haciendo t = 0

Por lo que

Así se observa que media y varianza coinciden con el parámetro del modelo siendo, En cuanto a la moda del modelo tendremos que será el valor de la variable que tenga mayor probabilidad, por tanto si Mo es el valor modal se cumplirá que:

Y, en particular:

A partir de estas dos desigualdades, es muy sencillo probar que la moda tiene que verificar: De manera que la moda será la parte entera del parámetro o dicho de otra forma, la parte entera de la media. Podemos observar cómo el intervalo al que debe pertenecer la moda tiene una amplitud de una unidad, de manera que la única posibilidad de que una distribución tenga dos modas será que los extremos de este intervalo sean números naturales, o lo que es lo mismo que el parámetro sea entero, en cuyo caso las dos modas será n -1 y .


Geometríca es…

el número de intentos hasta conseguir el primer éxito

En teoría de probabilidad y estadística, la distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes: • la distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o • la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito, contenido en el conjunto {0, 1, 2, 3,…}. Cual de éstas es la que uno llama "la" distribución geométrica, es una cuestión de convención y conveniencia.

para x = 1, 2, 3,.... Equivalentemente, la probabilidad de que haya x fallos antes del primer éxito es

Para x = 0, 1, 2, 3,.... En ambos casos, la secuencia de probabilidades es una progresión geométrica. El valor esperado de una variable aleatoria X distribuida geométricamente es

Como su análoga continua, la distribución exponencial, la distribución geométrica carece de memoria. Esto significa que si intentamos repetir el experimento hasta el primer éxito, entonces, dado que el primer éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número de ensayos adicionales no depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza no tiene "memoria" de estos fallos. La distribución geométrica es de hecho la única distribución discreta sin memoria.

y dado que Y = X-1,

En ambos casos, la varianza es

De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,...} con un valor esperado dado µ, la distribución geométrica X con parámetro p = 1/µ es la de mayor entropía.

Las funciones generatrices de probabilidad de X y la de Y son, respectivamente,

Propiedades Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que x ensayos sean necesarios para obtener un éxito es


Existe algo más allá de la geometríca…

La hipergeometríca Por Jose Antonio Santos

En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x ( ) elementos de la categoría A en una muestra sin reemplazo den elementos de la población original.

Propiedades La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a

Donde es el tamaño de población, es el tamaño de la muestra extraída, es el número de elementos en la población original que pertenecen a la categoría deseada y es el número de

elementos en la muestra que pertenecen a dicha categoría. La notación hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar x elementos de un total a. El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es

y su varianza, En la fórmula anterior, definiendo y ! Se obtiene La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.


Entretenimiento Por María Fernanda Mendoza

Cine: La película más esperada este año El fenómeno mundial de Los Juegos del Hambre continúa dejando al mundo 'en llamas' con Sinsajo - Parte 1. Esta vez Katniss Everdeen (Jennifer Lawrence) se encuentra en el Distrito 13 después de haber cambiado los juegos para siempre… Pero en nuestra ciudad de Mérida algo ha sucedido que no ha sido el Cinex de Alto Prado el que ha traído la película sino Multicine las Tapias, así que si deseas ver la película ya sabes a dónde desde el 20 de Noviembre.

Para los que les gusta LEER

Título: El color de los Sueños Autor: Ruta Sepetys Editorial: Maeva Clasificación: 5 estrellas

Encuentra esta serie de palabras que hemos usado revista

BINOMIAL DISTRIBUCION ESTADISTICA GEOMETRIA POISSON PROBABILIDAD VARIABLE

NUESTRA RECOMENDACIÓN LITERARIA

Título: La isla de las Mariposas Autor: Corina Bomann Editorial: Maeva Clasificación: 4 estrellas

Título: El brillo de las Lugiérnagas Autor: Paul Pen Editorial: Plaza & Janes Clasificación: 5 estrellas


Realizado por el G4- Grupo 4 de Estadística IUPSM - Mérida


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.