TEMA 10:
ESTADÍSTICA Y PROBABILIDAD
1
INTRODUCCIÓN Objetivo: La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas). Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán objeto de nuestro estudio. Muestra: Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características de toda la población. Individuo: Es cada uno de los elementos que forman la población o la muestra. Caracteres estadísticos: pueden ser cuantitativos, si pueden medirse, o cualitativos, si no pueden medirse. Variables estadísticas: Son los distintos valores que puede tomar un carácter estadístico cuantitativo. Una variable es discreta cuando solo puede tomar valores aislados. Por ejemplo, el número de hijos. Una variable es continua cuando puede tomar todos los valores dentro de un intervalo. Por ejemplo, la estatura.
ESTADÍSTICA DESCRIPTIVA TABLAS DE FRECUENCIAS Las tablas de frecuencias sirven para ordenar y organizar los datos estadísticos. Con ellas, una masa amorfa de datos pasa a ser una colección ordenada y perfectamente inteligible. Con los datos se construye la tabla de frecuencias: - En la primera columna, la variable xi, con todos sus posibles valores - En la segunda columna, la correspondiente frecuencia, ni: número de veces que aparece cada valor.
FRECUENCIAS RELATIVAS Cuando se desea comparar varias distribuciones similares con distinto número de elementos, se debe recurrir a las frecuencias relativas.Si N es el número de individuos:
FRECUENCIAS ACUMULADAS En una distribución de frecuencias, se llama frecuencia acumulada, Ni, correspondiente al valor iésimo, xi, a la suma de la frecuencia de ese valor con todas las anteriores: Ni = n1 + n2 + … + ni
2
TABLAS CON DATOS AGRUPADOS Cuando en una distribución estadística el número de valores que toma la variable es muy grande, conviene elaborar una tabla de frecuencias agrupándolos en intervalos. Para ello: - Se localizan los valores extremos, a y b, y se halla su diferencia, r = b–a - Se decide el número de intervalos que se quiere formar, teniendo en cuenta la cantidad de datos que se poseen. El número de intervalos no debe ser inferior a 6 ni superior a 15. El punto medio de cada intervalo se llama marca de clase. Es el valor que representa a todo el intervalo para el cálculo de algunos parámetros. Cuando se elabora una tabla con datos agrupados, se pierde algo de información (pues en ella se ignora cada valor concreto, que se difumina dentro de un intervalo). A cambio, se gana en claridad y eficacia.
GRÁFICOS ESTADÍSTICOS GRAFICOS PARA VARIABLES CUALITATIVAS O CUANTITATIVAS DISCRETAS Diagrama de barras: - En el eje de las X : Se representan los valores de la variable - En el eje de las Y : Se representan los valores de la frecuencia: - Se levanta para cada valor de la X una barra que representa la frecuencia de dicho valor. Si unimos mediante una poligonal los puntos más altos de cada barra obtenemos el polígono de frecuencias.
GRAFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS SI TODOS LOS INTERVALOS TIENEN LA MISMA AMPLITUD Histograma : - En el eje de las X : Se representan los valores de la variable - En el eje de las Y : Se representan los valores de la frecuencia - Se levanta para cada valor del intervalo de la X un rectángulo de altura la frecuencia de dicho intervalo. Si unimos mediante una poligonal los puntos medios de cada uno de dichos rectángulos el polígono de frecuencias. Las barras están pegadas unas a otras.
3
DIAGRAMAS DE SECTORES
Se dibuja un círculo y los porcentajes correspondientes a cada valor.
PARÁMETROS DE CENTRALIZACIÓN Los parámetros de centralización son medidas que sintetizan los valores e indican la tendencia de los datos a agruparse sobre un valor. Se llaman de centralización porque los datos se distribuyen alrededor de ellos. Las definiciones siguientes sirven tanto para datos aislados como para datos agrupados en intervalos: - Si los datos son aislados: los xi son los valores que toma la variable - Si los datos están agrupados en intervalos: los xi son las marcas de clase.
MEDIA La media de un conjunto de datos es el resultado que se obtiene al dividir la suma de todos los datos entre el número total de ellos:
MODA La moda de una distribución es el valor que tiene mayor frecuencia. Si hay dos valores que tienen la misma frecuencia máxima, se dice que es una distribución bimodal; si hay tres, trimodal; y si hay varios, multimodal.
MEDIANA Si los individuos de una población están colocados en orden creciente según la variable que estudiamos, el que ocupa el valor central se llama individuo mediano, y su valor, la mediana: Me La mediana, Me, está situada de modo que antes de ella está el 50% de la población y, detrás, el otro 50%. Si el número de individuos es par, la median es el valor medio de los dos centrales.
PARÁMETROS DE DISPERSIÓN
4
Los parámetros de dispersión son unos valores que indican si los datos de la distribución estás más o menos cercanos a los parámetros centrales.
RANGO O RECORRIDO El recorrido es la diferencia entre el valor mayor y el menor de la distribución.
EJEMPLO CON DATOS DISCRETOS Al lanzar un dado se han obtenido los siguientes resultados: Resultado Nº de veces
1 5
2 9
3 14
4 7
5 9
6 6
Elabora la tabla estadística y calcula la media, moda, mediana, recorrido, varianza, desviación típica y coeficiente de variación.
xini
xi2 ni
1-5
5
5
14
6-14
18
36
14/50
28
15-28
42
126
7
7/50
35
29-35
28
112
5
9
9/50
44
36-44
45
225
6
6
6/50
50
45-50
36
216
174
720
xi
ni
fi
Ni
1
5
5/50
5
2
9
9/50
3
14
4
50
=
MEDIA: MODA:
3
MEDIANA: RECORRIDO:
6–1=5
5
EJEMPLO CON INTERVALOS La edad de los socios de un club de ajedrez juvenil se distribuye en los siguientes intervalos.
Edad Nº de socios
[10 , 12) 6
[12 ,14 ) 12
[14 ,16 ) 15
[16 ,18] 5
Elabora la tabla estadística y calcula la media, moda, mediana, recorrido, varianza, desviación típica y coeficiente de variación.
xini
xi2 ni
1-6
66
726
18
7-18
156
2028
15/38
33
19-33
225
3375
5/38
38
34-38
85
1445
532
7574
Intervalos
xi
ni
fi
Ni
[10 , 12)
11
6
6/38
6
[12 ,14 )
13
12
12/38
[14 ,16 )
15
15
[16 ,18 )
17
5 38
=
MEDIA: MODA:
15
MEDIANA: RECORRIDO:
17 – 11 = 6
6
PROBABILIDAD EXPERIMENTOS DETERMINISTAS Y DE AZAR Un experimento es determinista si, al realizarse en las mismas condiciones, siempre se obtiene el mismo resultado. Un experimento es aleatorio o de azar si no es posible predecir el resultado aunque se realice en las mismas condiciones.
SUCESOS El espacio muestral está formado por el conjunto de todos los resultados que se pueden presentar. Se representa con la letra E y los resultados entre llaves { } y separados por comas.
EJEMPLOS -
E spa c i o m ue st ra l de una m one da :
E = { C, X} . -
E spa c i o m ue st ra l de un da do:
E = { 1, 2, 3, 4, 5, 6} .
Un suceso elemental es cada uno de los resultados del espacio muestral. Un suceso es un conjunto de sucesos elementales. Éstos se representan con letras mayúsculas, escribiendo sus elementos entre llaves y separados por comas. El suceso contrario de un suceso A está formado por todos los sucesos elementales que no están en A. Se representa por . El suceso seguro es el que siempre se presenta, y es igual al espacio muestral. El suceso imposible es el que nunca se presenta. Se representa con el símbolo .
7
EJEMPLO
1.
Una
bol sa
c ont ie ne
bolas
bl a nc a s
y
ne gra s.
Se
e xt ra e n
suc e si va m e nt e t re s bol a s. E = { (b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b); (n, n,n)}
2. E l suce so A = { e xt ra e r t re s bola s de l m i sm o c ol or} . A = { (b,b,b); (n, n,n)}
3. E l suce so B = { e xt ra e r al m e nos una bol a bl a nc a } . B= { (b,b,b); (b,b,n); (b,n,b); (n,b,b); (b,n,n); (n,b,n); (n,n ,b)}
4. E l suce so C = { e xt ra e r una sola bol a ne gra } . C = { (b,b,n); (b,n,b); (n,b,b)}
EJEMPLO Consi de ra m os el e xpe ri me nt o que c onsi st e e n l a nza r un da do, si A = "sa c a r pa r". Ca l c ul a r
.
A = { 2, 4, 6} = { 1, 3, 5}
8
SUCESOS COMPATIBLES E INCOMPATIBLES Dos sucesos son compatibles si se pueden presentar al mimo tiempo, es decir, si Dos sucesos son incompatibles si no se pueden presentar al mimo tiempo, es decir, si
LA REGLA DE LAPLACE La probabilidad de un suceso A de un experimento aleatorio es un número entre 0 y 1, que mide la facilidad de que el suceso ocurra. Cuanto más se acerca a 1 mayor es la posibilidad de ocurrir. Cuando un experimento aleatorio es regular, es decir que todos los sucesos elementales tienen la misma probabilidad de ocurrir ó son equiprobables, para calcular la probabilidad de un suceso cualquiera A, basta contar y hacer el cociente entre el nº de sucesos elementales que componen A (casos favorables) y el nº de sucesos elementales del espacio muestral (casos posibles). Este resultado se conoce como Regla de Laplace.
9