Formulario básico de estadística descriptiva (1)

FORMULARIO BÁSICO DE ESTADÍSTICA DESCRIPTIVA Medidas de Tendencia Central: Para datos NO agrupados .

Donde: X: Media o promedio

que ∑: Sumatoria de todos los datos

x i: Datos que se tienen

Mo: Moda (Dato que mayor frecuencia tiene es decir el más veces se repite). Mdn: Mediana (Dato que se encuentra a la mitad,

previamente n: número total de datos

1.

acomodando los datos en forma creciente, si el número de datos es par entonces los dos que quedan en medio se suman y dividen entre 2) Para formar los intervalos: Deteerminar el número de clases (renglones) Con la Regla de Sturges:

C=3.3 log ( n ) +1

(No se redondea se deja en el entero que sale)

2. Determinar el rango Xmáx – Xmín (dato mayor – dato menor) 3. Obtener la amplitud (qué tanto se va contar del límite inferior al superior)

A=

Media:

xi ∑ (¿ f i) n ¿¿

Rango No . de clases

Medidas de Tendencia Central: Para datos agrupados.(Cuando hay intervalos) Donde:

: media

∑: Sumatoria

x i : Datos (marca de clase:

L i + Ls , dado un intervalo: 2

Li−Ls )

f i : Frecuencia n: número total de datos (el que se suma de toda la frecuencia Mediana:

[ ]

n −f 2 a Mdn=Li + I fc

fi )

Mdn: Mediana

Li : Límite real inferior del renglón que si se está trabajando (cuando se hace el “8” con Los extremos de los límites). n: número total de datos

f a : frecuencia acumulada anterior al renglón que si se está trabajando f c : frecuencia del renglón que se está trabajando I: Intervalo (Diferencia en forma vertical tomando cualquier par de los intervalos) Nota: para saber con qué renglón se va a trabajar la mediana se saca la clase mediana :

n 2

y este valor se

busca es la frecuencia acumulada (donde quepa) y ese es el renglón con el que se va a trabajar. Moda:

Mo=Li+

[

]

∆1 I ∆1 +∆ 2

Mo: Moda (la clase que mayor frecuencia tiene)

Li : el “8”

Límite real inferior del renglón que si se está trabajando (cuando se hace

Los extremos de los límites).

∆1 : frecuencia mayor – frecuencia anterior ∆ 2 : frecuencia mayor – frecuencia siguiente Nota: Si la clase modal coincide con la clase mediana (es decir en el mismo renglón) el

Li

será el mismo. El

intervalo (I) no cambia es el mismo en ambos casos. Tipos de Sesgo

Sesgo +

Sesgo -

La moda es la línea más alta.

Medidas de posición Las medidas de posición son los deciles (D), cuartiles (Q) y percentiles (P).



Los deciles van de 10 en 10, los cuartiles de 25 en 25 y lo percentiles de 1 en 1. Como el total de los datos es el 100%, entonces hay 10 deciles (10%...90%), 4 cuartiles (25%, 50% y 75%) y 100 percentiles (1%...99%)

Para conocer la posición del decil, cuartil o percentil:

Q 1=

i(n+1) 4

Q: cuartil

D 1=

i(n+1) 10

i: Número del decil, cuartil o percentil (el decil se toma como un solo dígito por ejemplo

P 1=

i( n+1) 100

si el decil es 40 se toma como 4, el percentil si se toma completo, y el decil si el el 1 Corresponde al 25%, si es el 2 al 50% y si es el 3 al 75%) n: número de datos.



Una vez que se conoce la posición se ubica el renglón dónde va a “caer” con respecto a la frecuencia acumulada.

Cuartil

[

Q1=Li +

]

N o−f a I fc

Las fórmulas son idénticas a la de la mediana sólo cambia

Decil

[

N o−f a I fc

[

N o−f a I fc

D1=Li +

No

que es el valor de la posición que se

obtuvo anteriormente (con la fórmula para obtener la posición).

]

Percentil

P1=Li +

]

Medidas de Dispersión o Variabilidad (Para una muestra) Para dataos No agrupados: Varianza:

x i−¿ ¿ ¿2 ¿ ¿ ∑¿ S 2=¿

Donde:

S 2 : Varianza

x i : Dato : Media o promedio Desviación estándar: Es la raíz cuadrada de la varianza.

S= √ S2 Coeficiente de variación:

S: Desviación estándar

CV =

S (100) ❑

CV: Coeficiente de variación S: Desviación estándar : Media o promedio

Índice de Asimetría

xi −¿ ¿ ¿3 ∑ ¿3 S ¿ ¿ a3 =¿

a3 : índice de asimetría

S 3 : Desviación estándar al cubo Tipo de Sesgo:

a3 >0

a3 =0

Positivo

Simétrica

a3 <0

Negativo

Índice de Curtosis

x i−¿ ¿ ¿4 ∑ ¿4 S ¿ ¿ a 4=¿

a 4 : Índice de curtosis

S 4 : Desviación estándar a la cuarta

a 4 >3 a 4=3

a 4 <3

Las fórmulas para una población de las medidas de dispersión son exactamente iguales a las de la muestra sólo cambia:

En muestra

En población

μ

Media No. de datos

n–1

Varianza

S

Desv. Estándar

S

Por lo tanto: Varianza:

N 2

σ2 σ

Desv. Estándar

∑ ( xi −μ)

Índice de asimetría

Índice de curtosis

2

σ=

a 4=

σ =√ σ 2

N

[

∑(x i−μ)4 N

a3 =

[

3

∑( xi −μ) N

]

σ3

]

σ4 Regla empírica 95%

68% Margen de error

16%%&

2.5%

16%

%

μ μ+1 σ

μ−1 σ

2.5%

99%

μ−2 σ

μ

Margen de error

μ+2 σ

0.5%

Margen de error

μ−3 σ 

μ

μ+3 σ

La regla empírica sólo es para éstos valores!! Medidas de Dispersión para datos Agrupados (Con Intervalos)

Dado que hay un intervalo el dato que se toma como “X” es el de la marca de clase o sea el punto medio de cada intervalo:

mj .

Varianza: curtosis

Desv. Estándar:

Coef. De Var.

Índice de asimetría

Índice de

m j−¿ ¿ ¿ n−1 ∑¿ S2=¿

mi :

S= √ S2

marca de clase (

f i : frecuencia : media o promedio

CV =

L i + Ls ) 2

S (100) ❑

m j−¿ ¿ ¿3f i ∑ ¿3 S ¿ ¿ a3=¿

m j−¿ ¿ ¿ 4f i ∑ ¿4 S ¿ ¿ a 4=¿

Turn static files into dynamic content formats.

Create a flipbook