MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
ESTADÍSTICA SUMARIA
52
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman ESTADÍSTICA SUMARIA
Las tablas y gráficas a partir de una recolección de datos son los retratos e indican la tendencia y patrones de estos. La estadística sumaria analiza los retratos que ofrece una distribución de datos, los cuales a su vez están conformados por las Medidas de Tendencia Central y Tendencia de Dispersión.
Se entiende por medidas de tendencia central a los valores que se encuentran al punto medio de una distribución conocida y se conocen como medidas de posición. Las medidas de tendencia de dispersión se refieren a la extensión de los datos en una distribución, es decir, el grado en que las observaciones se distribuyen. Por ejemplo:
a)
b)
Como puede observarse la gráfica a) tiene una mayor extensión o dispersión y la gráfica b) tiene una menor extensión o dispersión.
Sesgo: Una curva representa los puntos de datos de un conjunto de datos (polígono de frecuencia) que pueden ser simétricos o sesgados, es decir, la simetría de un conjunto de datos. Sesgo significa que los valores están concentrados en algún extremo (superior o inferior) de la escala de medición del eje horizontal. Observemos las tres siguientes gráficas:
a)
b)
c)
53
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
La gráfica a) constituye una curva Simétrica, ya que la serie de datos se distribuye de forma equitativa alrededor de los valores centrales. La gráfica b) es una curva sesgada a la derecha o positivamente sesgada, (se da cuando la curva disminuye poco a poco hacia el extremo derecho de la escala). Por último la curva c) es una curva sesgada a la izquierda o negativamente sesgada (se da cuando la forma de la curva disminuye poco a poco hacia el extremo inferior de la escala).
Curtosis: Se dice que cuando se mide la cursis de una distribución de datos lo que se está midiendo es el grado de agudeza de su curva. Por ejemplo:
a)
b)
Al observar las curvas a) y b) se puede inferir que tienen la misma posición central y también la misma dispersión sobre el eje de datos y ambas son simétricas, pero difieren entre sí solamente en que una tiene una forma (pico) más agudo que la otra, es decir tienen un grado diferente de curtosis.
Simetría: cuando una distribución de frecuencia se reparte en partes iguales hacia ambos lados de la escala de medición del eje horizontal se dice que es Simétrica.
50%
50%
Distribución Normal
Normal Estandar
Curva Normal •
Los valores son siempre positivos, es decir, crecientes de 0 a n … (0, 1, 2, …. n)
•
Los valores de X, m , m son iguales o muy cercanos
54
MANUAL DE ESTADÍSTICA •
Lic. Johane Daniel Pérez Leberman
De acuerdo con el valor de la desviación estándar, es decir, en la medida que ésta tienda a 0 o se acerque a éste valor, la curva puede tomar distinta figura, así:
a)
b)
Leptokurtica
Mesokurtica
c)
Platikurtica
Índice de Asimetría: consiste en la determinación de un coeficiente numérico (coeficiente de oblicuidad) que permite determinar la forma de una distribución. Se pueden trabajar dos formas, el índice de asimetría de Pearson y el índice de asimetría de Bowley.
a) Índice de Asimetría de Pearson: En las series simples normalmente es la mediana la que decide cual es la forma de la curva, pues es la medida que está justo al medio de la distribución. Al tomar una serie compuesta existen valores que miden la variación de los datos centrales. Al tomar la diferencia entre la mediana y la moda y dividir entre la desviación estándar resulta un coeficiente de asimetría, el cual fue propuesto por Karl Pearson para medir el grado de asimetría de una distribución.
Este propuso la diferencia de la media aritmética (promedio de la serie de datos) con la moda o la mediana dividido la desviación estándar y lo multiplico por 3 (ya que eso marca el máximo de amplitud de cualquier distribución.
55
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
De lo anterior se pueden deducir dos fórmulas:
a) S =
(
b) S =
)
Ejemplo # 1: Determinar el tipo de curva que tiene una distribución de salarios de 65 empleados de una compañía que tiene las siguientes medidas de posición:
= 611.76
a) S
=
"
=
#$$.%# &'(.( $$'.#&
= 606.39
!) = 0.1448
= 594.43 ! = 119.65
b) S
=
(
)
=
(#$$.%# #+#. ') $$'.#&
=
$#.$$ $$'.#&
!) = 0.1346
Recuerde que mientras más cerca de 0 se encuentre el valor, más simétrica será la distribución.
X 0.1346
Ejemplo # 2: Si la
a)
S =
= 79.76
"
=
= 79.06
%'.%# %%.#+ $&.#+
= 77.60 y la S = 15.60 determine el tipo de curva
=
,.$# $&.#
= b)
S = 0.1385
S =
=
(%'.%# %'.+#) $&.#+
=
S = 0.1346
b) Índice de asimetría de Bowley: Se basa en la relación que existe entre los cuartiles y la mediana.
- Si la curva es simétrica: Q3 – Q2 = Q2 – Q1 - Si la curva es positiva: Q3 – Q2 > Q2 – Q1 - Si la curva es negativa: Q3 – Q2 <Q2 – Q1
56
,.$ $&.#+
=
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
Al desarrollar la relación de los cuartiles puede establecerse la fórmula para el índice de asimetría:
S =
(Q3 − Q2) − (Q2 − Q1) = Q3 − Q2 − Q2 + Q1 = Q3 − 2Q2 + Q1 (Q3 − Q1)
!) =
33 − 232 + 31 (33 − 31)
Ocurre lo mismo si se desea trabajar con percentiles:
S =
(P90 − P50) − (P50 − P10) = 590 − P50 − P50 + P10 = P90 − 2P50 + P10 (P90 − P10)
!) =
590 − 2550 + 510 590 − 510
Ejemplo # 1: Q1 = 523.48
Q2 = 606.39
!) =
Q3 = 696.05
696.05 − 2(606.39) + 523.48 6.75 = = 0.03911 (696.05 − 523.48) 172.57
Ejemplo # 2: P10 = 58.12
P50 = 79.06
!) =
P90 = 101
101 − 2(79.06) + 58.12 1 = = 0.0233 (101 − 58.12) 42.88
Nota: El resultado es más exacto, la curva es positiva casi simétrica.
Ejemplo # 3: Q1 = 68.25
Q2 = 79.06
!) =
Q3 = 90.75
90.75 − 2(79.06) + 68.25 0.88 = = 0.039 (90.75 − 68.25) 22.50
57