RETROALIMENTACIÓN MÓDULO 1 UNIDAD DE ANÁLISIS:
VARIABLE Variable independiente Una variable independiente es aquella cuyo valor no depende del de otra variable. La variable independiente en una función se suele representar por x. La variable independiente se representa en el eje de abscisas. Variable dependiente Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable. La variable dependiente en una función se suele representar por y. La variable dependiente se representa en el eje ordenadas. La variable y está en función de la variable x.
Variable cualitativa Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: o Variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo: El estado civil, o Variable cualitativa ordinal o variable cuasicuantitativa presenta modalidades no numéricas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Medallas de una prueba deportiva: oro, plata, bronce. Variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: o Variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. o Variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
TABLA DE DISTRIBUCIÓN TABLA ESTADÍSTICA
DIAGRAMA DE BARRAS
(Discreta)
PARÁMETRO - La media poblacional - La varianza - La proporción poblacional ESTADÍSTICO - La media muestral - La varianza muestral - La proporción muestral TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS Los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes: 110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110.
Paso 1. Determinamos el rango (R) de variación de los datos que se define como R = Xmax – Xmin, donde Xmax es el dato máximo y Xmin es el dato mínimo. Para el ejemplo Xmax = 140 y Xmin = 90 entonces R = 140 – 90 = 50
Paso 2. Determinamos el número de intervalos o clases k.
Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n) ; donde n es el número de datos (se recomienda que sean más de 10). Para el ejemplo se tiene n = 40 datos, sustituyendo k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28, la cual se redondea al entero siguiente, en este caso k = 7. Otra alternativa es usando la raíz cuadrada del total de datos n para este ejemplo nos queda así: k = raíz (n) = raíz √40 = 6.32 que también se redondea al entero siguiente quedando k= 7.
Paso 3. Calculamos la amplitud de clase (A), que corresponde a la cantidad de datos que van en casa clase, dividiendo el rango R entre el numero de clases k: A=R/K
A = 50 / 7 =
7,14
sustituyendo se redondea a 8.
Paso 4. Construimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma [Li, Ls].
Para formar las clases comenzaremos con los limites inferiores: · En la primer clase tomamos Li1 = Xmin ( el dato mas pequeño) · Para las demás clases el limite inferior se obtiene sumando la Xmin con la amplitud, es decir Li n = Li n –1 + A. Para nuestro ejemplo Xmin = 90 y A = 8, entonces las 7 clases quedan:
Marca de clase (Mi): corresponde al punto medio del intervalo, es una característica importante de cada clase ya que no cambia sin importar si la variable es discreta o continua, se calcula usando la fórmula: Mi = Li + Ls
Se suman los límites de clase y el resultado se divide entre dos
2 Para nuestro ejemplo obtendríamos las siguientes marcas de clase:
EJEMPLO DE DIAGRAMA DE TALLOS Y HOJAS El diagrama de tallo y hojas es un semigráfico que permite presentar la distribución de una variable cuantitativa. Consiste en separar cada dato en el último dígito (que se denomina hoja) y las cifras delanteras restantes (que forman el tallo). Tallo 163
16
hoja 3
Es especialmente útil para conjuntos de datos de tamaño medio (entre 20 y 50 elementos)