MATEMATICAS
ESTADISTICA ING. ARNALDO ANDRADE
FACULTAD DE FILOSOFIAS, LETRAS Y CIENCIAS DE LA EDUCACION Grupo 3
ÍNDICE 6.1 DEFINICIÓN DE ESTADÍSTICA .................................................................................................... 4 Conceptos de Estadística ............................................................................................................ 4 6.1.1ESTADÍSTICA DESCRIPTIVA ..................................................................................................... 6 6.1.2ESTADÍSTICA INFERENCIAL ..................................................................................................... 7 6.2CONCEPTOS BÁSICOS DE ESTADÍSTICA ...................................................................................... 8 Elemento o ente: ....................................................................................................................... 8 Población: .................................................................................................................................. 8 Muestra: .................................................................................................................................... 8 Variable: .................................................................................................................................... 8 Variables cuantitativas: .............................................................................................................. 8 Variables cualitativas o atributos: .............................................................................................. 9 6.3MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS ............................................ 9 Media: ....................................................................................................................................... 9 Mediana: ................................................................................................................................. 10 Moda: ...................................................................................................................................... 10 Media ponderada:.................................................................................................................... 10 6.4 MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS…………………………………………………….13 6.5TABLA DE DISTRIBUCION DE FRECUENCIAS. ............................................................................ 14 Tipos de frecuencias................................................................................................................. 15 Frecuencia absoluta ............................................................................................................. 15 Frecuencia absoluta acumulada ........................................................................................... 15 Frecuencia relativa ............................................................................................................... 15 Frecuencia relativa acumulada ............................................................................................. 16 6.5.1MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS ............................................. 21 Media: ..................................................................................................................................... 21 Mediana: ................................................................................................................................. 23 La Moda (Mo) .......................................................................................................................... 24 6.5.2MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS ........................................................... 25 DESVIACIÓN ESTÁNDAR ........................................................................................................... 26 COEFICIENTE DE VARIACIÓN .................................................................................................... 27 6.5.3MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS ......................................................... 30 Fórmulas Datos No Agrupados ................................................................................................. 31
2
6.5.4TABLAS DE REPRESENTACION ............................................................................................... 32 Gráficos estadísticos ................................................................................................................ 32 Gráfico de Barras ..................................................................................................................... 32 - Barras simples: ................................................................................................................... 33 - Barras dobles: .................................................................................................................... 33 - Barras múltiples: ................................................................................................................ 33 - Barras verticales: ................................................................................................................ 33 - Barras horizontales ............................................................................................................ 33 - Barras Aplicadas: ................................................................................................................ 33 Gráfico de sectores Circulares .................................................................................................. 33 Gráfico de líneas o Tendencia:.................................................................................................. 33 Histograma de frecuencias: ...................................................................................................... 34 Polígono de frecuencias: .......................................................................................................... 34
3
6.1 DEFINICIÓN DE ESTADÍSTICA Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. La
Un est udi o est adísti co co nsta de las si guientes f ases:
R ecogi da de dat os. Or gani z aci ón y r epresentaci ón de datos. A náli si s de dat os. Ob t enci ón de conclusi ones.
Conceptos de Estadística POBLACIÓ N NN
INDI VI DUO
Una pob laci ón es el conjunt o de todos los element os a los que se somet e a un estudi o est adíst i co
Un i ndi vi duo o uni dad e stadísti ca es cada uno de los elem entos que componen la pob laci ón.
4
MUESTREO
MUESTRA Una muestra es un conjunt o r epresentati vo de la pob laci ón de r ef erenci a, el númer o de i ndi vi duos de una muestra es menor que el de la pob laci ón
El mu estreo es la reuni ón de dat os que se desea e studi ar, obteni dos de una proporción reduci da y representati va de la pob laci ón.
DATO
VALOR
Un dato es cada uno de los valores que se ha ob teni do al reali z ar un estudi o estadísti co.
Un valor es cada uno de los di sti ntos r esult ados que se pueden ob t ener en un estudi o est adíst i co
5
6.1.1ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva consiste en la presentación de datos en forma
de tablas y gráficas. Ésta
comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos como tales. Los métodos estadísticos tradicionalmente se utilizan para propósitos
descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva trata de la tabulación de datos, su presentación en forma gráfica
o
ilustrativa y el cálculo de medidas descriptivas. Estas técnicas estadísticas se aplican de manera amplia en control de calidad, contabilidad, mercadotecnia, estudios de mercado, análisis deportivos, administración de instituciones, educación, política, medicina, y por aquellas personas que intervienen en la toma de decisiones
6
6.1.2ESTADÍSTICA INFERENCIAL La E st adística inferenci al o Inferencia estadística : Conjunto de conocimientos, técnicas y procedimientos que permiten sacar conclusiones sobre el comportamiento de un a o más vari ables en un a po blación, con base en información parcial recogida sobre la misma. BASADOS EN LA TEORÍA DE LA PROBABILIDAD PARA DEDUCIR (INFERIR) SE ENCARGA DE ANALIZAR Y ESTUDIAR LOS DATOS MÁS ALLÁ LOS RESULTADOS Y A PARTIR DE AHÍ CONCLUIR VALIÉNDOSE EN LAS PROBABILIDADES.
Ejemplo: Si el profesor de igual forma desea saber las calificaciones de sus estudiantes, en este caso puede optar por la estadística inferencial, al tomar todas las calificaciones de sus alumnos, analizar y sacar cuentas de cada una de ellas hasta concluir las calificaciones exactas de todo el grupo de estudiantes, pero de manera individual y más detallada. En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.
Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita.
7
6.2CONCEPTOS BÁSICOS DE ESTADÍSTICA Elemento o ente: Cualquier elemento que aporte información sobre la característica que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un ente; si estudiamos el precio de la vivienda, cada vivienda es un ente. Población: Conjunto o colección de los entes de interés. Cada ente presenta características determinadas, observables y medibles. Por ejemplo, en el elemento persona: nombre, edad, género, peso, nacionalidad, etc. Por lo tanto, la estadística se preocupa de estudiar las características de los elementos constituyentes de la población, y estudia las posibles relaciones y las regularidades que presenta la población a partir de estas características. La población se puede clasificar, según su tamaño, en dos tipos:
▪ Población finita: El número de elementos es finito. Por ejemplo: la cantidad de alumnos de una escuela.
▪ Población infinita: El número de elementos es infinito o tan grande que pueden considerarse en cantidad infinita. Por ejemplo: las estrellas de la Vía Láctea.
Muestra: La mayoría de los estudios estadísticos, no se realizan sobre la población por los altos costos en tiempo y dinero, sino sobre un subconjunto o una parte de ella denominada muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características de la población. Por ejemplo, para la población “estudiantes de las escuelas de Guayaquil”, una muestra podría ser “el conjunto de niños de una escuela en particular”. Variable: Es una característica que se asocia a los elementos de una muestra o población. Tiene la propiedad de poder ser medida u observada. Su expresión numérica es el dato. Las variables se pueden clasificar en dos tipos: Variables cuantitativas: Se expresan por medio de números y pueden ser:
▪ Discretas: Sólo se miden por medio de valores puntuales. Por ejemplo: número de materias, cantidad de médicos en un hospital;
▪ Continuas: Pueden tomar cualquier valor intermedio entre dos números, es decir, intervalos. Por ejemplo: el peso y la estatura de una persona.
8
Variables cualitativas o atributos: No se pueden expresar numéricamente, sino por medio del nombre de la característica en estudio; se pueden clasificar en:
Ordinales: Aquellas que sugieren una ordenación. Por ejemplo: nivel de estudio, posición de los ganadores de un concurso.
Nominales: Aquellas que sólo admiten una mera ordenación alfabética, pero no establecen orden por su contenido. Por ejemplo: género, estado civil, color de cabello.
Las variables también se pueden clasificar en:
Variables
unidimensionales:
Sólo recogen información característica. Por ejemplo: edad de los alumnos de una clase.
▪
sobre
una
▪ Variables bidimensionales: Recogen información sobre dos características de la población. Por ejemplo: edad y estatura de los alumnos de una clase.
▪ Variables multidimensionales: Recogen información sobre tres o más características. Por ejemplo: edad, estatura y peso de los alumnos de una clase
6.3MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media, mediana y moda. En cada caso, se ubican alrededor del punto en donde se aglomeran los datos. Media: Medida de tendencia central usualmente llamada promedio, se define como la división de la suma de todos los valores entre el número de datos.
9
Mediana: Del conjunto de datos obtenidos es el valor que al organizar los datos en orden ascendente o descenderte a la mitad o centro de los mismos. La posición que ocupa la mediana puede ser determinada mediante la siguiente fórmula: Mediana =X[(n/2) +1/2] Ejemplo: Dados los siguientes 8 datos ordenados 5,8,8,11,11,11,14,16., encuentra la mediana.
en
orden
ascendente:
Utilizando la fórmula para ubicar la posición del dato que representa la mediana indica que: Mediana = (8/2) +1/2 = 4.5 Por lo que la mediana está ubicada entre el dato 4 y 5; el valor del dato 4 es “11” y del dato 5 es “11”, por lo que, al sacar el promedio, da que la mediana de la muestra estudiada es 11. Moda: Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados. Del ejemplo anterior donde los datos recopilados son: 5,8,8,11,11,11,14,16; el dato que ocurre con mayor frecuencia es el valor 1, siendo este valor la moda. Media ponderada: es una media aritmética, en la cual se considera a cada uno de los valores de acuerdo con su importancia en el grupo.
Mediana Ponderada
En donde: X = Observación individual Q= el peso o ponderación asignada a cada observación
10
6.4MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Las m e di das
de
di s p ers i ó n n o s
i n f o rm an so bre cuán t o s e alej an del ce n t ro lo s v alo res de la di s t ri buci ó n .
La s medida s de disper sión son: Ran go o recorrid o
E l r a n g o e s l a d i f e r e n c i a e nt r e el mayor y el menor de l o s d a t o s d e u n a d i st r i b u c i ó n e s t a d í s t i ca .
Desviación media: L a desvi aci ón respecto a la medi a es la di f erenci a ent r e cad a valor de la var i ab le est adísti ca y la medi a ari tméti ca.
Di = x-x 11
L a d esvi aci ón medi a es la m edi a ari tméti ca de los va lores ab solut os de las des vi aci ones resp ecto a la medi a .
-L a d es vi aci ón medi a se representa por
Ejemplo
Calcular la d e svi aci ón medi a de la di stribuci ón:
9, 3, 8, 8, 9, 8, 9, 18
12
Desviación media para datos no agrupados
Si los dat os vi enen agr upados en una tab la de f recu enci as , la ex pr esi ón de la des vi aci ón medi a es:
Ejempl o
Calcular la d e sviación media de la distribución: xi
fi
xi · fi
|x - x |
|x - x | · f i
[10, 15)
12. 5
3
3 7. 5
9. 286
27. 858
[15, 20)
1 7. 5
5
8 7. 5
4 . 286
21. 4 3
[20, 25)
22. 5
7
157. 5
0. 714
4 . 998
[25, 30)
27. 5
4
1 10
5. 714
22. 856
[30, 35)
32. 5
2
65
1 0. 174
21. 4 28
21
4 57. 5
98. 57
13
6.5TABLA DE DISTRIBUCION DE FRECUENCIAS. La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas ordinales. La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se presentan numéricamente las características de la distribución de un conjunto de datos o muestra.
Tabla de frecuencias Construcción de la tabla de frecuencias
En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la variable en el conjunto de datos. En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y las frecuencias absolutas acumuladas. Las columnas cuarta y quinta contienen la las frecuencias relativas y las frecuencias relativas acumuladas. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.
14
Tipos de frecuencias Existen cuatro tipos de frecuencias:
Frecuencia absoluta La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está en el conjunto (X1, X2, XN). La suma de las frecuencias absolutas de todos los elementos diferentes del conjunto debe ser el número total de sujetos N. Si el conjunto tiene k números (o categorías) diferentes, entonces:
Frecuencia absoluta acumulada La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN) es la suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:
.
Frecuencia relativa La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia absoluta dividida por el número total de elementos N:
15
Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de las frecuencias relativas de todos los sujetos da 1. Supongamos que en el conjunto tenemos k números (o categorías) diferentes, entonces:
Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto por cien %).
Frecuencia relativa acumulada Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como la proporción de valores iguales o menores a Xi en el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por el número total de sujetos N:
La frecuencia relativa acumulada de cada valor siempre es mayor que la frecuencia relativa. De hecho, la frecuencia relativa acumulada de un elemento es la suma de las frecuencias relativas de los elementos menores o iguales a él, es decir:
16
Ejemplo Un profesor tiene la lista de las notas en matemĂĄticas de 30 alumnos de su clase. Las notas son las siguientes:
Notas de los 30 alumnos de una clase en matemĂĄticas. 1) Frecuencia absoluta Se realiza el recuento de la variable que se estudia (notas) para ver el nĂşmero de veces que aparece cada nota.
Una vez realizado el recuento, se representan las frecuencias absolutas de cada una de las notas (ni). Las frecuencias son: n1(3) =2, n2(4) =4, n3(5)=6, n4(6)=7, n5(7)=5, n6(8)=3, n7(9)=2 y n8(10)=1.
17
2) Frecuencia absoluta acumulada
Se calculan las frecuencias absolutas acumuladas (Ni) como la suma de las frecuencias absolutas de los valores menores o iguales a Xi:
N1(3) =n1(3)=2 N2(4)=n1(3)+n2(4)=2+4=6 N3(5)=n1(3)+n2(4)+n3(5)=2+4+6=12 N4(6)=n1(3)+n2(4)+n3(5)+n4(6)=2+4+6+7=19 N5(7)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)=2+4+6+7+5=24 N6(8)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)=2+4+6+7+5+3=27 N7(9)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)=2+4+6+7+5+3+2=29 N8(10)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)+n8(10) =2+4+6+7+5+3+2+1=30 3) Frecuencia relativa Se calcula la frecuencia relativa de cada elemento como la divisiรณn de la frecuencia absoluta entre el total de elementos N=30. f1(3) = n1(3)/N = 2/30 = 0,07 f2(4) = n2(4)/N = 4/30 = 0,13 f3(5) = n3(5)/N = 6/30 = 0,20
18
f4(6) = n4(6)/N = 7/30 = 0,23 f5(7) = n5(7)/N = 5/30 = 0,17 f6(8) = n6(8)/N = 3/30 = 0,10 f7(9) = n7(9)/N = 2/30 = 0,07 f8(10) = n8(10)/N = 1/30 = 0,03
Se pueden calcular las frecuencias relativas en porcentaje (%) multiplicĂĄndolas por 100.
4) Frecuencia relativa acumulada Para obtener la frecuencia relativa acumulada se divide la frecuencia absoluta acumulada entre el nĂşmero total de elementos (N=30). Esto da el tanto por uno de elementos iguales o menores al elemento que se estudia. Las frecuencias relativas acumuladas son las siguientes: F1(3)=f1(3)=0,07 F2(4)=f1(3)+f2(4)=0,07+0,13=0,20 F3(5)=f1(3)+f2(4)+f3(5)=0,07+0,13+0,20=0,40 F4(6)=f1(3)+f2(4)+f3(5)+f4(6)=0,07+0,13+0,20+0,23=0,63 F5(7)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)=0,07+0,13+0,20+0,23+0,17=0,80 F6(8)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8) =0,07+0,13+0,20+0,23+0,17+0,10=0,90
19
F7(9)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9) =0,07+0,13+0,20+0,23+0,17+0,10+0,07=0,97 F8(10)=f1(3)+f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)+f8(10) =0,07+0,13+0,20+0,23+0,17+0,10+0,07+0,03=1,00
Se pueden calcular las frecuencias relativas acumuladas en porcentaje (%) multiplicรกndolas por 100. 5) Tabla de frecuencias Una vez se han calculado todas las frecuencias, se construye la tabla de frecuencias. La tabla es la siguiente:
20
Tabla de frecuencias de las notas de los 30 alumnos de una clase de matemáticas. Adicionalmente, se pueden incluir dos columnas con los porcentajes de las frecuencias relativas y frecuencias relativas acumuladas. Se obtiene la siguiente tabla:
6.5.1MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS Son medidas estadísticas que se usan para describir cómo se puede resumir la localización de los datos. Ubican e identifican el punto alrededor del cual se centran los datos. Las medidas de tendencia central nos indican hacia donde se inclinan o se agrupan más los datos. Las más utilizadas son: la media, la mediana y la moda.
Media: La media o media aritmética, usualmente llamada promedio, se obtiene sumando todos los valores de los datos y divide el resultado entre la cantidad de datos. Si los datos proceden de una muestra la media se representa con una x testada (x) y si provienen de la población se representan con la letra griega miu (µ).
21
Media aritmética para datos agrupados Donde X: promedio muestral (estadístico). µ: promedio poblacional (parámetro). ∑: signo de sumatoria. N = número de datos de la población. n: número de datos de la muestra. fi: frecuencia absoluta. Xc: Marca de clase o punto medio.
La media para datos agrupados EJEMPLO Para los gastos diarios en periódicos del hotel agrupados en una tabla de frecuencia:
El promedio aritmético es:
22
Mediana: La segunda medida de tendencia central que analizaremos es la mediana, en ocasiones se le llama media posicional, porque queda exactamente en la mitad de un grupo de datos, luego de que los datos se han colocado de forma ordenada. En este caso la mitad (50%) de los datos estará por encima de la mediana y la otra mitad (50%) estará por debajo de ella. La mediana es el valor intermedio cuando los valores de los datos se han ordenado. Formula
Para identificar la clase mediana se divide n/2 y la primera clase que contenga una frecuencia acumulada mayor que n/2. n = 32, entonces n/2 = 32/2 = 16. Buscar la primera frecuencia acumulada mayor que 16, esa será la clase mediana.
23
Ahora se aplica la fórmula: Me = (6.95 + (((32/2 – 8)/9)*(0.9)) = 6.95 + (16 – 8) / 9)*(0.9) Me = (6.95 +(8/9)*(0.9)) = 6.95 +(0.88*0.9) Me = 6.95 + 0.79 Me = 7.75 ≈ 7.8
La Moda (Mo) La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia. Un grupo de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal) o más de dos modas (multimodal).
Formulas
fi es la frecuencia absoluta de la clase modal. fi-1 es la frecuencia de clase absoluta anterior a la clase modal fi+1 es la frecuencia de clase absoluta posterior a la de la clase modal. i es el intervalo de clase. La clase modal es aquella que contiene la mayor frecuencia absoluta. d1 = 9 – 4 = 4 d2 = 9 – 7 = 2 Mo = 6.95 + (4 / 4 + 2) * 0.9 = 6.95 + ( 4 / 6) * 0.9 = 6.95 + 0.66 * 0.9 Mo = 6.95 + 0.59 Mo = 7.55 ≈ 7.6
24
6.5.2MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS Las Medidas de Dispersión que se enlistaron en la sección anterior, varían un poco en la estructura de sus fórmulas, por ello es necesario integrar un nuevo formulario que sea útil para esta sección. FORMULARIO RANGO
VARIANZA
25
Recuerde que la fórmula de la Media para datos agrupados es
DESVIACIÓN ESTÁNDAR
O en este caso, la formula se puede expresar así
La cual se puede emplear cuando ya se tiene el valor numérico de la Varianza.
26
COEFICIENTE DE VARIACIÓN
EJERCICIOS: Los datos ordenados que se dan, representan las percepciones salariales diarias, de empleados en una empresa
Calcule para esta tabla el Rango, la Varianza, la Desviación Estándar y el coeficiente de Variación. CALCULO DEL RANGO Para calcular el Rango, se requiere incluir los Limites Reales de Clase. Para lograrlo se emplean las fórmulas que se utilizaron en la sección llamada ORDENAMIENTO DE DATOS, a saber
27
Observe que la Unidad de Variación es igual a 5, la cual se calcula restando el LNI de la Clase 1(95) al LNS de la Clase 2(100). Para el cálculo de los Limites Reales restamos y sumamos la mitad de la unidad de variación, o sea, 2.5, respectivamente como indican las formulas anteriores. La tabla quedaría
EL LRSMAX es igual a 177.5 y el LRIMIN es igual a 77.5, entonces el Rango es de R = 177.5 -77.5 =100 CALCULO DE LA VARIANZA Para calcular la Varianza es necesario determinar primero la media, la cual se obtiene en función del producto de las Marcas de Clase y las Frecuencias Absolutas en cada clase, como se vio en la sección anterior, por lo cual es necesario complementar la TDF con esta columna.
28
Realizando el cálculo respectivo, la tabla quedaría En esta tabla se observa que la suma de los productos de MC*Fabs=39,550, y además que N=340. Sustituyendo los valores en la fórmula de la Media quedaría
Ahora, si observamos el numerador en la fórmula de la Varianza
Nos daremos cuenta que debemos incluir nuevas columnas a la TDF, que muestren cada una de las diferencias entre cada marca de clase y la media (MCI Media) y también que muestren esta diferencia elevada al cuadrado y multiplicada por cada Frecuencia Absoluta. Enseguida se incluyen Sustituyendo en la fórmula de la Varianza los datos obtenidos
29
DESVIACIÓN ESTÁNDAR La Desviación Desandar se calcula como la raíz cuadrada de la Varianza.
COEFICIENTE DE VARIACIÓN El Coeficiente de Variación es:
6.5.3MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: - El primer cuartil: Cuando n es par:
30
Cuando n es impar:
-Para el tercer cuartil Cuando n es par:
Cuando n es impar:
Fórmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Cuando n es par:
Cuando n es impar:
Siendo A el número del décil.
31
6.5.4TABLAS DE REPRESENTACION Gráficos estadísticos Existe una gran cantidad de gráficos para la representación de datos estadísticos, entre los principales tenemos:
Gráfico de Barras El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cuantitativas o comportamientos en el tiempo, cuando el número de ítems es reducido. Para elaborarlo debemos:
Utilizar un sistema de coordenadas rectangulares y se llevan al eje de las "x" los valores que toma la variable en estudio y en el eje de las "y" se colocan las frecuencias de cada barra. Luego se construyen los rectángulos, tomando como base al eje de las abscisas, cuya altura será igual a cada una de las diferentes frecuencias que presentan las variables en estudio. La magnitud con que viene expresada la variable se observa en la longitud de las barras (rectángulos). Es importante destacar que solamente la longitud de las barras y no su anchura es lo que denota la diferencia de magnitud entre los valores de la variable. Todas las barras tienen que tener una anchura igual, separadas entre sí, preferiblemente por una longitud igual a la mitad del ancho de estas o distancias iguales entre barras. Las barras se pueden graficar tanto verticalmente como horizontalmente. Se pueden elaborar barras compuestas y barras agrupadas.
32
Este tipo de gráfico se clasifican por:
-
Barras Barras Barras Barras Barras Barras
simples: Compara valores entre categorías de una variable dobles: Compara valores entre categorías de dos variables múltiples: Compara valores entre categorías de dos o más variables. verticales: Las categorías de la variable deben ubicarse en el eje x. horizontales: Las categorías de la variable deben ubicarse en el eje y. Aplicadas: Compara entre categorías el aporte de cada valor en el total.
Gráfico de sectores Circulares Usualmente llamado gráfico de torta, debido a su forma característica de una circunferencia dividida en sectores, por medio de radios que dan la sensación de un pastel cortado en porciones. Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de ítems no es superior a 5 y se quiere resaltar uno de ellos.
Gráfico de líneas o Tendencia: Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico de líneas consiste en segmentos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo. Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un solo gráfico, el cual es el resultado de representar varias variables en un mismo plano. A este tipo de gráfico se le llama gráfico de líneas compuesto.
33
Histograma de frecuencias: El histograma es un diagrama en forma de columna, muy parecido a los gráficos de barras. Se define como un conjunto de rectángulos paralelos, en el que la base representa la clase de la distribución y su altura la magnitud que alcanza la frecuencia de la clase correspondiente. Son barras rectangulares levantadas sobre el eje de las abscisas del plano cartesiano utilizando escalas adecuadas para los valores que asume la variable en la distribución de frecuencia. Polígono de frecuencias: Se utiliza básicamente para mostrar la distribución de frecuencias de variables cuantitativas. Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo de un histograma
34
35
36