Escuela de Turismo y Gastronomía
Estadística para los negocios I Gráficas para datos cuantitativos
Variables cuantitativas… Las variables cuantitativas miden una cantidad en cada unidad de observación. Si la variable puede tomar sólo un número finito o contable de valores, es una variable discreta Si la variable puede tomar un número infinito de valores correspondientes a puntos en un intervalo de recta, es una variable continua
Gráfica de barras y pastel • El gráfico de pastel (sectores) muestra la forma en que está distribuida la cantidad total medida en cada categoría. • El gráfico de barras usa la altura de cada barra para representar la cantidad de una categoría en particular
Gráfico de líneas Cuando una variable se registra en el tiempo a intervalos igualmente espaciados (semanas, meses, años), el conjunto de datos forma una serie de tiempo. Los datos de serie de tiempo suelen representarse a través de gráfico de líneas, con el tiempo en el eje horizontal La utilidad de la gráfica de líneas es tratar de distinguir un patrón de tendencia que sea probable de continuar en el futuro, y luego usar ese patrón para hacer pronósticos sobre el futuro inmediato
Histograma Un histograma es similar a una grรกfica de barras, pero se usa para graficar cantidades en lugar de datos cualitativos.
DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
Medidas de centralidad
• Moda • Mediana • Media aritmÊtica
đ?‘Ľ=
đ?‘› đ?‘–=1 đ?‘Ľđ?‘–
đ?‘›
Medidas de dispersión • Rango • Varianza: Promedio de los cuadrados de las desviaciones de las mediciones respecto a su media. • Desviación estándar
Teorema de Chevyshev Dado un nĂşmero đ?‘˜ > 1 y un conjunto de 1 đ?‘› mediciones, por lo menos [1 − 2] de đ?‘˜ las observaciones estarĂĄn dentro de las đ?‘˜ desviaciones estĂĄndar de su media
Regla empĂrica Dada una distribuciĂłn de mediciones que tiene una forma semejante a la de una campana: • El intervalo (đ?œ‡ Âą đ?œŽ)contiene aproximadamente el 68% de las mediciones • El intervalo (đ?œ‡ Âą 2đ?œŽ) contiene aproximadamente el 95% de las mediciones • El intervalo (đ?œ‡ Âą 3đ?œŽ) contiene aproximadamente el 99.7% de las mediciones
Medidas de posiciĂłn relativa • Percentiles • Cuartiles – Cuartil inferior: 0.25 *(n+1) – Segundo cuartil = mediana – Cuartil superior: 0.75*(n+1) Cuando las posiciones no son enteros, el cuartil inferior se toma como el valor a ž partes de la distancia entre las mediciones de las posiciones adyacentes. El cuartil superior, como la Âź parte de las mediciones de las posiciones que le rodean • Rango intercuartĂlico: đ?‘„3 − đ?‘„1
Puntuación � de la muestra Mide la distancia entre la observación y la media, medida en unidades de su desviación eståndar.
đ?‘Ľ − đ?‘Ľđ?‘– đ?‘ƒđ?‘˘đ?‘›đ?‘Ąđ?‘˘đ?‘Žđ?‘?đ?‘–Ăłđ?‘› đ?‘§ = đ?‘
De acuerdo con el teorema de Chevyshev y la regla empĂrica‌ • Entre el 75% y 95% de los datos se encuentran a dos desviaciones estĂĄndar de la media. ďƒ Las observaciones con puntaciones đ?‘§ mayores a 2 en valor absoluto suceden menos del 5% de las veces y son consideradas poco probables.
De acuerdo con el teorema de Chevyshev y la regla empĂrica‌ • Entre el 89% y el 99.7% de los datos estĂĄn a tres desviaciones estĂĄndar de su media. Las observaciones con puntuaciones đ?‘§ mayores a 3 en valor absoluto suceden menos del 1% de las veces y son consideradas muy improbables.
DESCRIPCIÓN DE DATOS BIVARIADOS