FORMULARIO BÁSICO DE ESTADÍSTICA DESCRIPTIVA Medidas de Tendencia Central: Para datos NO agrupados .
Donde: X: Media o promedio
que ∑: Sumatoria de todos los datos
x i: Datos que se tienen
Mo: Moda (Dato que mayor frecuencia tiene es decir el más veces se repite). Mdn: Mediana (Dato que se encuentra a la mitad,
previamente n: número total de datos
1.
acomodando los datos en forma creciente, si el número de datos es par entonces los dos que quedan en medio se suman y dividen entre 2) Para formar los intervalos: Deteerminar el número de clases (renglones) Con la Regla de Sturges:
C=3.3 log ( n ) +1
(No se redondea se deja en el entero que sale)
2. Determinar el rango Xmáx – Xmín (dato mayor – dato menor) 3. Obtener la amplitud (qué tanto se va contar del límite inferior al superior)
A=
Media:
xi ∑ (¿ f i) n ¿¿
Rango No . de clases
Medidas de Tendencia Central: Para datos agrupados.(Cuando hay intervalos) Donde:
: media
∑: Sumatoria
x i : Datos (marca de clase:
L i + Ls , dado un intervalo: 2
Li−Ls )
f i : Frecuencia n: número total de datos (el que se suma de toda la frecuencia Mediana:
[ ]
n −f 2 a Mdn=Li + I fc
fi )
Mdn: Mediana
Li : Límite real inferior del renglón que si se está trabajando (cuando se hace el “8” con Los extremos de los límites). n: número total de datos
f a : frecuencia acumulada anterior al renglón que si se está trabajando f c : frecuencia del renglón que se está trabajando I: Intervalo (Diferencia en forma vertical tomando cualquier par de los intervalos) Nota: para saber con qué renglón se va a trabajar la mediana se saca la clase mediana :
n 2
y este valor se
busca es la frecuencia acumulada (donde quepa) y ese es el renglón con el que se va a trabajar. Moda:
Mo=Li+
[
]
∆1 I ∆1 +∆ 2
Mo: Moda (la clase que mayor frecuencia tiene)
Li : el “8”
Límite real inferior del renglón que si se está trabajando (cuando se hace
Los extremos de los límites).
∆1 : frecuencia mayor – frecuencia anterior ∆ 2 : frecuencia mayor – frecuencia siguiente Nota: Si la clase modal coincide con la clase mediana (es decir en el mismo renglón) el
Li
será el mismo. El
intervalo (I) no cambia es el mismo en ambos casos. Tipos de Sesgo
Sesgo +
Sesgo -
La moda es la línea más alta.
Medidas de posición Las medidas de posición son los deciles (D), cuartiles (Q) y percentiles (P).
Los deciles van de 10 en 10, los cuartiles de 25 en 25 y lo percentiles de 1 en 1. Como el total de los datos es el 100%, entonces hay 10 deciles (10%...90%), 4 cuartiles (25%, 50% y 75%) y 100 percentiles (1%...99%)
Para conocer la posición del decil, cuartil o percentil:
Q 1=
i(n+1) 4
Q: cuartil
D 1=
i(n+1) 10
i: Número del decil, cuartil o percentil (el decil se toma como un solo dígito por ejemplo
P 1=
i( n+1) 100
si el decil es 40 se toma como 4, el percentil si se toma completo, y el decil si el el 1 Corresponde al 25%, si es el 2 al 50% y si es el 3 al 75%) n: número de datos.
Una vez que se conoce la posición se ubica el renglón dónde va a “caer” con respecto a la frecuencia acumulada.
Cuartil
[
Q1=Li +
]
N o−f a I fc
Las fórmulas son idénticas a la de la mediana sólo cambia
Decil
[
N o−f a I fc
[
N o−f a I fc
D1=Li +
No
que es el valor de la posición que se
obtuvo anteriormente (con la fórmula para obtener la posición).
]
Percentil
P1=Li +
]
Medidas de Dispersión o Variabilidad (Para una muestra) Para dataos No agrupados: Varianza:
x i−¿ ¿ ¿2 ¿ ¿ ∑¿ S 2=¿
Donde:
S 2 : Varianza
x i : Dato : Media o promedio Desviación estándar: Es la raíz cuadrada de la varianza.
S= √ S2 Coeficiente de variación:
S: Desviación estándar
CV =
S (100) ❑
CV: Coeficiente de variación S: Desviación estándar : Media o promedio
Índice de Asimetría
xi −¿ ¿ ¿3 ∑ ¿3 S ¿ ¿ a3 =¿
a3 : índice de asimetría
S 3 : Desviación estándar al cubo Tipo de Sesgo:
a3 >0
a3 =0
Positivo
Simétrica
a3 <0
Negativo
Índice de Curtosis
x i−¿ ¿ ¿4 ∑ ¿4 S ¿ ¿ a 4=¿
a 4 : Índice de curtosis
S 4 : Desviación estándar a la cuarta
a 4 >3 a 4=3
a 4 <3
Las fórmulas para una población de las medidas de dispersión son exactamente iguales a las de la muestra sólo cambia:
En muestra
En población
μ
Media No. de datos
n–1
Varianza
S
Desv. Estándar
S
Por lo tanto: Varianza:
N 2
σ2 σ
Desv. Estándar
∑ ( xi −μ)
Índice de asimetría
Índice de curtosis
2
2
σ=
a 4=
σ =√ σ 2
N
[
∑(x i−μ)4 N
a3 =
[
3
∑( xi −μ) N
]
σ3
]
σ4 Regla empírica 95%
68% Margen de error
16%%&
2.5%
16%
%
μ μ+1 σ
μ−1 σ
2.5%
99%
μ−2 σ
μ
Margen de error
μ+2 σ
0.5%
0.5%
Margen de error
μ−3 σ
μ
μ+3 σ
La regla empírica sólo es para éstos valores!! Medidas de Dispersión para datos Agrupados (Con Intervalos)
Dado que hay un intervalo el dato que se toma como “X” es el de la marca de clase o sea el punto medio de cada intervalo:
mj .
Varianza: curtosis
Desv. Estándar:
Coef. De Var.
Índice de asimetría
Índice de
m j−¿ ¿ ¿ n−1 ∑¿ S2=¿
mi :
S= √ S2
marca de clase (
f i : frecuencia : media o promedio
CV =
L i + Ls ) 2
S (100) ❑
m j−¿ ¿ ¿3f i ∑ ¿3 S ¿ ¿ a3=¿
m j−¿ ¿ ¿ 4f i ∑ ¿4 S ¿ ¿ a 4=¿