Tema 1: Inicio de la estadística. 1. ¿Qué es la estadística? La Estadística se ocupa de los mé todos y p rocedi m ien tos pa ra recoger, clasi f icar, resu m i r, ha l la r regu la r i dades y ana l iza r los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. U n estudio estadístico consta de las siguien tes fases: 1. Recogida de da tos. 2. O rgan ización y rep resen tación de da tos. 3. A ná l isis de da tos. 4. Ob tención de concl usiones.
Tipos: -Estadística descriptiva: Descr ibe, anal iza y rep resen ta u n g r upo de da tos u t i l izando mé todos n u mé r icos y g rá f icos que resu men y p resen ta n la i nfo r mación con teni da en ellos. - Estadística inferencial: A poyándose en el cálculo de p robabi l i dades y a pa r t i r de da tos m uest ra les, efect úa est i maciones, decisiones, p redicciones u ot ras genera l izaciones sobre u n conj u n to mayor de da tos.
2. Lenguaje estadístico. Población U na población es el conj u n to de todos los elemen tos a los que se somete a u n est ud io estadís t ico.
I nd ividuo U n individuo o unidad estadística es cada u no de los elemen tos que componen la población.
Muestra U na muestra es u n conj u n to rep resen ta t ivo de la población de referencia, el n ú me ro de i nd i v i d uos de u na m ues t ra es me no r que el de la población.
Muestreo E l muestreo es la re u n ión de da tos que se desea est ud iar, obten idos de u na p roporción reducida y rep resen ta t i va de la población.
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
D ato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Definición de vari able
los
Una var iable estadística es cada una de las características o cualidades que poseen individuos de una población. Tipos de variable estadísticas: Vari able cualitativa
ser
Las var iables cualitativas se refieren a car acterísticas o cual idades que no pueden medidas con números. Podemos distinguir dos tipos: Vari able cualitativa nominal
Una var iable cual itativa nomina l presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Vari able cualitativa ordina l o vari able cuasicuantitativa
Una var iable cual itativa ordina l presenta modalidades no númericas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ... Medallas de una prueba deportiva: oro, plata, bronce.
Vari able cuantitativa
Una var iable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones a r itméticas con ella. Podemos distinguir dos tipos:
Vari able discreta
Una var iable discreta es aquella que toma valores a islados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Vari able continua
Una var iable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con t res decimales.
D istr ibución de frecuencias
La distr ibución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias:
F recuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por f i . La suma de l as frecuencias absolutas es igual al número total de datos, que se representa por N .
que
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) se lee suma o sumatoria.
F recuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por n i .
La suma de las frecuencias relativas es igual a 1. F recuencia acumulada
La frecuencia acumul ada es la suma de l as frecuencias absolutas de todos los valores inferiores o igua les al valor considerado. Se representa por F i . F recuencia relativa acumulada
un
La frecuencia relativa acumul ada es el cociente entre la frecuencia acumulada de determinado valor y el nĂşmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mĂĄximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi
Recuento
fi
Fi
ni
Ni
27
I
1
1
0.032
0.032
28
II
2
3
0.065
0.097
29
6
9
0.194
0.290
30
7
16
0.226
0.516
31
8
24
0.258
0.774
32
III
3
27
0.097
0.871
33
III
3
30
0.097
0.968
34
I
1
31
0.032
1
31
1
Este tipo de tablas de frecuencias se utiliza con var iables discretas.
segunda
D istr ibución de frecuencias agrupadas
La distr ibución de frecuencias agrupadas o tabla con datos agrupados se emplea si las var i ables toman un número grande de valores o la var i able es continua . Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. L ímites de l a clase
Cada clase está delimitada por el l ímite inferior de l a clase y el l ímite superior de clase.
la
Amplitud de l a clase
La ampl itud de l a clase es la diferencia entre el l ímite superior e inferior de la clase. M a rca de clase
La ma rca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos pa r ámetros. Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. 2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer. Es conveniente que el número de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece in tervalo, se cuenta en el siguiente intervalo.
3. Presentación de los datos estadísticos (diferencia entre discretas y continuas) -Presentación tabula r: Cuando los datos estadísticos se presentan a t ravés de un conjunto de filas y de columnas que responden a un ordenamiento lógico; es de gran eso e importancia para el uso e importancia para el usuario ya que constituye la forma más exacta de presentar las informaciones. Una tabla consta de varias partes, las principales son las siguientes: T itulo: Es la parte más importante del cuadro y sirve para describir todo él contenido de este. Encabezados: Son los diferentes subtítulos que se colocan en la parte superior de cada
columna. Columna
matriz: Esla columna principal del cuadro.
Cuerpo: El cuerpo contiene todas las informaciones numéricas que aparecen en la tabla. Fuente: La fuente de los datos contenidos en la tabla indica la procedencia de estos. Notas al pie: Son usadas para hacer algunas aclaraciones sobre aspectos que aparecen en y que no han sido explicados en otras partes.
de
la tabla o cuadro
Presentación gráfica: Proporciona al lector o usuario mayor rapidez en la comprensión los datos, una gráfica es una expresión artística usada para representar un conjunto de datos. Deacuerdo al tipo de variable que vamos a representar, las principales graficas son las siguientes: H istograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón de que lo utilizamos para representar variables continuas. Polígono de frecuencias: Esta gráfica se usa para representar los puntos medios de clase en una distribución de frecuencias Gráfica de bar r as: Es un conjunto de rectángulos o barras separadas una de la otra, en razón de que se usa para representar variables discretas; las barras deben ser de igual base o ancho y separadas a igual distancia. Pueden disponerse en forma vertical y horizontal. Gráfica l ineal: Son usadas principalmente para representar datos clasificados por cantidad o tiempo; o sea, se usan para representar series de tiempo o cronológicas.
Gráfica de barra 100%y gráfica circular: se usan especialmente para representar las partes en que se divide una cantidad total. La ojiva: Esta gráfica consiste en la representación de las frecuencias acumuladas de una distribución de frecuencias. Puede construirse de dos maneras diferentes; sobre la base "menor que" o sobre la base "o más". Puede determinar el valor de la mediana de la distribución. En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema De referencia (coordenadas), permiten presentar información cuantitativa. Lautilidad Delos gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis Delos datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla. En este trabajo solo nos vamos a centrar únicamente en los gráficos como vehículo de presentación de datos, sin abordar su otra faceta como herramienta de análisis. Diferencia entre discretas y continuas: Una variable continua es una variable en los reales. Ejemplo: el tiempo (la hora). Una discreta es una variable que varia en un conjunto discreto, como por ejemplo, los Ejemplo: el numero de vestidos que tienes. 3.1. Gráficos.
enteros.
HISTOGRAMA
GRテ:ICA DE BARRAS
GRテ:ICA LINEAL 3.2. Tablas
TABLA