ESTADÍSTICA 1
.
CAPÍTULO 1 EL MÉTODO ESTADÍSTICO EN LA INTERPRETACIÓN DE LOS HECHOS ECONÓMICOS.
1.1.- LAS RAMAS DE LA ESTADÍSTICA Y SUS MÉTODOS CIENTÍFICOS. La estadística, puede considerarse como la ciencia que estudia las “regularidades” que se observan en una serie de fenómenos que pueden expresarse a través de la información numérica. En una segunda acepción la ESTADÍSTICA es un conjunto de métodos científicos que nos permiten interpretar la información numérica, elegir muestras representativas para hacer inferencias, contrastar hipótesis, estimar relaciones causa-efecto y hacer predicciones.
El conjunto de conocimientos que componen a la Estadística da origen a tres ramas claramente diferenciadas:
1.- ESTADÍSTICA DESCRIPTIVA es la que tiene sus raíces históricas más profundas, fue empleada por las sociedades humanas más primitivas. Su método científico es el deductivo ya que plantea un conjunto de datos ordenados y genéricos y va extrayendo conclusiones particulares de los mismos.
2.- CÁLCULO DE PROBABILIDADES emplea el método deductivo ya que en esencia es un razonamiento puramente matemático. Arranca con la definición de probabilidad a través de una serie de axiomas de los que se van deduciendo un conjunto de teoremas. Empezó a formalizarse a lo largo de los siglos XVI y XVII tratando de resolver problemas de juegos de azar y del mundo de la astronomía.
1
ESTADÍSTICA 1
.
3.- INFERENCIA ESTADÍSTICA emplea el método inductivo basándose en el conjunto de instrumental matemático-deductivo que le proporciona el cálculo de probabilidades. Es considerada como la estadística moderna ya que se ha desarrollado a lo largo del siglo XX como unión y confluencia de la descriptiva y el cálculo de probabilidades.
Podemos decir que las etapas de toda investigación estadística son las siguientes:
1.- Definición de los objetivos que se persiguen con la investigación.
Esta primera fase es fundamental, se definen los parámetros poblacionales que se pretenden investigar. Supongamos que deseamos conocer hogares o familias que tienen más de un automóvil en la comunidad de Madrid; la población a investigar son todos los hogares de la Comunidad y el parámetro poblacional será la proporción o porcentaje de los mismos que tienen más de un automóvil.
2.- Recogida de los datos estadísticos para llegar a conocer los parámetros poblacionales. Existen dos formas/tipos de obtener los datos estadísticos: -
ENCUESTA:
Encuesta censal. Los hogares de la Comunidad de Madrid consistiría en preguntar a todos ellos si poseen más de un automóvil. Cuando el estudió estadístico que se ejecuta es de naturaleza censal no existe ningún problema de inferencia y el método empleado será íntegramente deductivo (parte de información general para explicar algo particular). Los estudios censales son excepcionales ya que tienen un elevado coste y un período de ejecución.
Encuesta muestral. Es la que se utiliza en la investigación estadística ya que tiene las enormes ventajas de un coste económico reducido, un corto período de ejecución, en comparación con los censos, y la calidad de los datos observados puede controlarse mejor que
2
ESTADÍSTICA 1
.
en éstos al ser volúmenes más deducidos. La característica que se está investigando sólo se mide en un subconjunto de la población, y los resultados obtenidos se infieren al total poblacional. El método es inductivo ya que de lo particular de la muestra se generaliza al total de la población. Indiferencia Estadística: definición de estimadores para los parámetros poblacionales, modelos de probabilidad, niveles de confianza en las estimaciones, errores de muestreo que estamos dispuestos a admitir, tamaños de muestras, etc.
3.- Descripción y estimación de los parámetros poblacionales.
Descripción de las características poblacionales a través de tablas de frecuencias y gráficos. Método deductivo siguiendo el camino de lo general a lo particular. La investigación muestral hay que considerar dos niveles de análisis: modelización probabilística del proceso a priori que es deductivo-inductivo y el de descripción de los datos obtenidos o análisis a posteriori que es descriptivo o deductivo. Procedimiento probabilística, no tenemos estimadores que siguen una distribución o modelo de probabilidad, sino Estimadores o datos concretos que hay que describir o reducir de forma ordenada de lo general. Estadística descriptiva con su método deductivo interviene cuando tenemos un conjunto de datos a posteriori, bien provengan de una investigación censal, bien de una muestral. Las descripciones de las estimaciones deben venir acompañadas de sus niveles de confianza y de sus respectivos errores de muestreo.
1.2.- LA ESTADÍSTICA DESCRIPTIVA Y EL ESTUDIO DE LOS HECHOS ECONÓMICOS. La utilización de la Estadística en la interpretación de los hechos económicos, hay que contemplarla a través de la evolución histórica de las tres ramas: Estadística Descriptiva, Cálculo de Probabilidades e Indiferencia Estadística.
3
ESTADÍSTICA 1
.
Estadística Descriptiva. Los egipcios, griegos y romanos realizaron recuentos descriptivos de su población y riquezas. En el año 3050 antes de J.C Egipto elaboró de las pirámides un censo de población y riqueza con objeto de abordar la construcción de las pirámides. También en Egipto Ramsés II hizo un censo de tierras para establecer una política de reparto de las mismas. Los griegos y romanos efectuaban recuentos periódicos de sus recursos económicos y humanos con claros fines tributarios y militares.
En la edad media no se realizaban operaciones estadísticas de descripción económica si se exceptúan los inventarios de posesiones de la iglesia. Hay que esperar al nacimiento de las iglesias mercantiles de los franceses, alemanes y anglosajones de los siglos XVI, XVII y XVIII.
La preocupación fundamental de la escuela inglesa eran los datos demográficos. A mitad del siglo XVII, Graunt se planteó la estimación de la población inglesa que estaba sometida a grandes fluctuaciones por causa de las epidemias. Obtuvo tasas de mortalidad y de natalidad partiendo de una muestra de la población. Petty efectúa en el siglo XVII estudios descriptivos sobre demografía, de rentas y tráfico mercantiles.
En EE.UU se elaboran censos de población cada diez años desde 1790; a lo largo del siglo XIX se crean Oficinas de Estadística en los principales Estados que se dedican a elaborar estadísticas de forma periódica.
Vista la evolución histórica de la Estadística descriptiva podemos concluir con las siguientes reflexiones:
ESTADÍSTICA que proviene a su vez del latín Status. Es la ciencia que contabiliza las cosas del Estado desde los tiempos más remotos hasta nuestros días: recoge, describe y analiza información de cualquier hecho o fenómeno. Si es del mundo económico estaremos ante una Estadística Descriptiva Económica.
Es una estadística económica que no contiene incertidumbre con lo que está ausente la PROBABILIDAD como medida de aquélla.
Estadística Descriptiva o Deductiva la debe de dominar tanto el economista de empresa como el general, ya que enseña cómo debe hacer un análisis primario y
4
ESTADÍSTICA 1
.
básico de un conjunto de datos que provienen de haber efectuado una investigación censal o muestral.
1.3.- EL CÁLCULO DE PROBABILIDADES COMO HERRAMIENTA MATEMÁTICA
DE
INDEFERENCIA
ESTADÍSTICA.
LA
ESTADÍSTICA MODERNA.
La Estadística Moderna del siglo XX es el resultado de la fusión de la Descriptiva y el Cálculo de Probabilidades. El Cálculo de Probabilidades está relacionado con la resolución de problemas de juegos de azar. Las excavaciones arqueológicas han demostrado que las culturas primitivas practicaban juegos de azar cuyos resultados estaban ligados a la voluntad divina.
Los matemáticos Blas Pascal y Pierre de Fermat empiezan con su famosa correspondencia la formalización del Cálculo de Probabilidades sobre juegos de azar que les planteaba el conocido jugador Caballero de Meré.
Durante los siglos XVII, XVIII y XIX el Calculó de Probabilidades se desarrolla desconectado de la Descripción estadística de los hechos económicos si exceptuamos pequeñas interrelaciones efectuadas fundamentalmente por Quetelet a mediados del siglo XIX. Los matemáticos dedicados a los problemas de la física y la astronomía emplean un lenguaje diametralmente opuesto al utilizado por los estadísticos que describen los hechos económicos a través de sus tablas, tasas de mortalidad y natalidad, números índices, etc. A comienzos del siglo XX consolidándose a lo largo del mismo por lo que conocemos como la Inferencia Estadística aplicada a la economía, cuyo estudio requiere un conocimiento previo del cuerpo fundamental del Cálculo de Probabilidades.
5
ESTADÍSTICA 1
.
1.4.- LA INFERENCIA ESTADÍSTICA COMO MÉTODO DE ESTUDIO DE LOS HECHOS ECONÓMICOS.
La Inferencia Estadística también se empezó a desarrollar a lo largo del siglo XVIII resolviendo problemas de estimación y contraste en el mundo de la astronomía. Dentro del desarrollo de la Inferencia hay que considerar tres corrientes metodológicas que surgen de las distintas interpretaciones del concepto de probabilidad. “Inferencia Clásica” arranca con Laplace-Gauss con su problemática de las observaciones astronómicas y culmina con la estimación y contrastación de hipótesis mentalmente biológicos. Se apoya en el concepto frecuencia lista de la probabilidad obtenido de la información descriptiva muestral cuando el experimento aleatoria de la investigación se realiza en las mismas condiciones un número elevado de veces.
“Indiferencia Bayesiana” -
La esencia del enfoque bayesiano está en su famoso: teorema que combina todo tipo de información a priori sobre los distintos estados de la naturaleza con la información muestral en sentido clásico para obtener o inferir el modelo de distribución a posteriori.
“Teoría de la Decisión” -
Aprovecha la inferencia bayesiana combinada con la noción de probabilidad subjetiva aportando el concepto de función de pérdida en el que se apoya el decidor para cuantificar sus expectativas y racionalizar el tratamiento de la incertidumbre económica.
A lo largo de las siguientes décadas se ha ido implantando paulatinamente el enfoque probabilística en el estudio de los hechos económicos lo que permite confrontar los modelos teóricos con los datos estadísticos o estudiar el modelo que mejor se ajusta a los datos empíricos disponibles.
6
ESTADÍSTICA 1
.
Con la aparición de los potentes ordenadores personales existen multitud de aplicaciones de fácil manejo que permiten dar un tratamiento descriptivo a un conjunto de datos económicos en un tiempo récord. Pueden ejecutarse tratamientos multivariantes más complejos: regresión y correlación, análisis factoriales, análisis de conglomerados y análisis discriminantes.
7
ESTADÍSTICA 1
.
CAPÍTULO 2
DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES 2.1.- INTRODUCCIÓN. La Estadística Descriptiva o Deductiva que se ocupa de recopilar, organizar y analizar datos numéricos. Conceptos previos fundamentales que se emplearán constantemente en el desarrollo de esta disciplina: población, muestra, atributos, escalas de medición y variables estadísticas.
En segundo lugar, se aborda la explicación de las distintas tareas que componen las tres grandes etapas de toda investigación estadística: definición de objetivos, recogida de los datos y estimación y descripción de los parámetros poblacionales.
El tercer aspecto, se denomina análisis descriptivo primario, es la elaboración de lo que se denomina distribución de frecuencias unidimensionales, tanto en su aspecto numérico como gráfico.
En cuarta posición, se analizan de forma global las distribuciones de frecuencias a través de sus medidas de posición: medias, mediana, moda y cuantiles.
En quinto lugar, las distribuciones son los denominados momentos potenciales con relación al origen y a la media aritmética.
En sexta posición, las medidas de dispersión: recorrido, intervalos intercuartílicos, varianza, desviación típica, coeficiente de apertura, recorrido relativo, recorrido semiintercuartílico y coeficiente de variación. Le siguen la exposición de lo que se conoce como
8
ESTADÍSTICA 1
.
“medidas de forma”: asimetría y curtosis. Dos distribuciones que tengan la misma media aritmética y la misma varianza pueden diferir en la forma de sus representaciones gráficas.
Por último se abordan, las medidas de concentración o de desigualdad: índice de Gini y Curva de Lorentz. La distribución de ciertas características de contenido económico: rentas personales o familiares, salarios, beneficios, etc.
2.2.- CONCEPTOS FUNDAMENTALES. Población. Se entiende por población, universo o colectivo cualquier conjunto de personas, objetos, animales, plantas, instituciones o entes en general que son portadores de una serie de características.
Ejemplos de poblaciones:
Las personas que trabajan en la Administración Central.
Las lavadoras automáticas que se han producido en nuestro país durante 1994.
Los pinos existentes en la Comunidad de Madrid a 31 de diciembre de 1994.
Los autobuses de la E.M.T. a 30 de junio de 1995.
Las poblaciones están compuestas de elementos o individuos, deben estar definidas con absoluta precisión de forma que siempre se pueda discernir si un elemento pertenece o no pertenece a la misma. Se clasifican en finitas o infinitas según que el número de elementos que la componen sea de una clase u otra. En el mundo económico y social estaremos casi siempre ante poblaciones finitas: habitantes de una región, empresas de un sector, demandantes potenciales o reales de un producto, etc.
Muestra. Todo subconjunto representativo de la población de forma que las conclusiones sacadas en aquella se generalizan a ésta. Las poblaciones se pueden estudiar bien realizando una investigación exhaustiva de todos sus elementos y entonces diremos que estamos realizando un censo, investigando una parte o subconjunto de las mismas y entonces diremos que estamos realizando un estudio muestral.
9
ESTADÍSTICA 1
.
Atributo. Es toda característica poblacional no susceptible de ser medida numéricamente. La observación de un atributo da lugar a distintas modalidades.
El sexo de una población humana cuyas modalidades son: varón y mujer.
Los colores de un semáforo cuyas modalidades son: rojo, verde y amarillo.
La profesión de un conjunto de personas activas.
Los atributos no son susceptibles de ser medidos numéricamente, sus modalidades pueden relacionarse con lo que se denominan escalas nominales y ordinales. Las observaciones de las distintas modalidades decimos que están en una escala nominal cuando los números que le asignamos sólo se emplean para diferenciar las distintas categorías. Los colores del semáforo le asignamos los dígitos 1, 2 y 3, sólo cabe la interpretación de que el 1 = 2 = 3 sin que se pueda afirmar que uno es superior a otro y sin que se puedan ordenar. La escala nominal es la forma de medición más débil y se utiliza sólo para clasificar las distintas modalidades de un atributo. No permiten ninguna relación de orden ni operaciones aritméticas de suma, resta, multiplicación y división. La medición de las características cualitativas o atributos también admite en ciertos casos lo que se conoce como escalas ordinales.
La imagen de un determinado político podrá calificarse de: muy mala, mala, regular, buena y muy buena. Si se le asignan los dígitos 1, 2, 3, 3 y 5 no quiere decir que la imagen buena sea el doble que la mala.
Variable. Son las características poblacionales susceptibles de tomar valores numéricos a los que se les pueda aplicar lo que se conocen como escalas de intervalos y de razón o proporción. Las primeras son aquellas que permiten una unidad de medida con lo que podemos cuantificar numéricamente la distancia existente entre dos observaciones cualesquiera. El orden de esta escala es superior a las nominales y ordinales ya que además de clasificar y ordenar las mediciones permite diferenciar con exactitud unas situaciones de otras. Escalas de intervalos: salarios de una empresa, cualquier tipo de presupuesto, gastos, ventas, etc. Las escalas de proporción o razón, las cualidades de las de intervalo, se caracterizan por incorporar un punto de origen no arbitrario como puede ocurrir, con los pesos y las edades de las personas, litros de gasolina en un depósito, etc. Podemos decir que las escalas de intervalo admiten unidades de medida y un origen (cero) arbitrarios y las de razón arbitrario ya que es
10
ESTADÍSTICA 1
.
un verdadero cero o cero absoluto. En estas escalas sí se permiten las operaciones aritméticas de la suma, resta, multiplicación y división.
Las variables estadísticas pueden clasificarse de distintas maneras. Pueden ser Unidimensionales, bidimensionales o pluridimensionales. Si en el colectivo o población formado por las empresas del sector químico estudiamos sólo su volumen de producción estaremos ante una variable unidimensional. Si estudiamos la producción y el número de trabajadores de cada empresa será bidimensional. Las variables también pueden ser discretas o continuas según tomen un número finito o infinito numerable, o bien infinito no numerable de valores en un determinado intervalo de su campo de variación.
2.3.- Tareas a desarrollar en las grandes etapas de la investigación estadística. En la definición de objetivos la primera tarea es identificar las características cualitativas o cuantitativas. Debe existir una necesidad de realizar la investigación estadística explicitando qué datos son los relevantes para la toma de decisiones. El gobierno de un país puede tener necesidad de investigar a través de una muestra representativa las siguientes características:
Altas y bajas de empleados en distintos sectores económicos por tipología de contratos (fijos, eventuales, por obra, de formación, a tiempo completo, a tiempo parcial, etc).
Evolución mensual de las ventas del comercio minorista.
Evolución del transporte de mercancías por carretera.
Una empresa del transporte puede tener la necesidad de conocer:
El mercado actual de un determinado producto a través de su volumen de ventas (característica cuantitativa.
La motivación fundamental por la que se compra un artículo de una determinada marca (característica cualitativa) que se consume en los hogares.
11
ESTADÍSTICA 1
.
Directrices para una buena confección de la entrevista:
Claridad en el lenguaje utilizado. El nivel cultural de los entrevistadores es heterogéneo en la mayoría de los casos por lo que hay que emplear un lenguaje sencillo y directo evitando términos técnicos que sólo son comprensibles para los especialistas.
Precisión en las preguntas. Deben de ser concretas y cortas con objeto de obtener respuestas precisas. Un ejemplo de pregunta no concreta es ¿no piensa UD. Que fuma mucho? El término mucho es subjetivo y tiene distinto valor para distintas personas. La pregunta correcta sería. ¿Cuántos cigarrillos fuma VD. Diariamente?
No se debe influir en la respuesta. Deben evitarse juicios de valor a la hora de efectuar las preguntas que condicionan las respuestas. No sería correcto hacer preguntas del tipo ¿no piensa Vd. Que nuestra empresa da un servicio posventa de gran eficacia? La pregunta correcta sería: ¿Qué opina Vd. De nuestro servicio posventa?
Deben evitarse las preguntas indiscretas que molesten al entrevistado. Hay que tener en cuenta que determinadas preguntas pueden molestar al entrevistado con lo que podemos conseguir que se niegue a contestar a la totalidad del cuestionario, que nos den respuestas falseadas. Está demostrado que no deben de pedirse directamente los ingresos de una persona ni la edad. Es mucho más eficaz pedirles que se sitúen dentro de una escala previamente establecida. La pregunta ¿Cuáles son sus ingresos anuales? Debe de sustituirla por: Indique, por favor, dentro de qué tramo de la siguiente escala se encuentran sus ingresos anuales: menos de dos millones, entre dos y cuatro o más de cuatro.
Hay que cuidar el orden de las preguntas. Las preguntas más sencillas deben ir al comienzo del cuestionario y las más complejas o delicadas al final. Con ello se consigue un mayor grado de respuesta y colaboración por parte del entrevistado ya que una vez que se ha avanzado en la cumplimentación es más difícil que se niegue a seguir contestando aunque las preguntas sean más comprometidas.
Las preguntas de un cuestionario pueden calificarse desde múltiples aspectos. A la libertad de elección de respuesta las preguntas pueden ser:
12
ESTADÍSTICA 1
.
Abiertas: son aquellas cuya respuesta es totalmente libre para el entrevistado. A los cabezas de familia podría preguntárseles ¿qué usos les daría Vd. A los ordenadores personales de su hogar? Señales todos los que le parezcan interesantes. En esta cuestión nos encontraremos una gama variada de respuestas: hacer inventario de las existencias de productos alimenticios, hacer un presupuesto por partidas de gastos con un seguimiento semanal, hacer un listado de productos que se van agotando para reponerlos cuando vamos de compra, confeccionar un archivo con teléfonos y direcciones de nuestras amistades y proveedores, etc. En este caso el entrevistador anota literalmente las respuestas empleando las mismas palabras del entrevistado.
Cerradas: son aquéllas cuyas posibles respuestas están listadas. En entrevistado escoge una o varias respuestas de las que se le presentan. Si queremos cerrar la pregunta de los usos que se dan a los ordenadores personales en el hogar sería: ¿Qué usos daría Vd. A un PC en su hogar de todos los siguientes? Para escribir cartas, hacer un inventario de productos no perecederos, llevar la contabilidad del hogar, como pasatiempo con videojuegos.
Tipos de Muestreo: a)
Muestreo aleatorio simple: es la forma más sencilla. Los elementos de la población objeto de estudio se numeran del 1 hasta N y se seleccionan n de forma aleatoria que constituyen una muestra aleatoria sin reemplazamiento (un mismo número aleatorio sólo aparece una vez) representativa de todo el conjunto.
b)
Muestreo estratificado: es un diseño que se emplea mucho en la práctica ya que permite mejorar la fiabilidad de las estimaciones respecto al m.a.s. para un mismo tamaño n de la muestra. Nos permite obtener estimaciones para cada estrato o subpoblación en los que hemos dividido la población. La estratificación consiste en dividir la población en grupos que sean homogéneos internamente y que existan grandes diferencias entre unos y otros estratos. Se desea investigar la renta de los hogares de la Comunidad de Madrid se pueden agrupar en tres estratos o grupos: renta baja, media y alta.
13
ESTADÍSTICA 1
c)
.
Muestreo por conglomerados: Los conglomerados son agrupaciones de elementos de la población de naturaleza heterogénea. Ejemplo: de los hogares un conglomerado debe tener unidades de renta baja, media y alta de forma que si se efectúa un muestreo dentro del mismo se obtenga información de los distintos niveles que pueden alcanzar los ingresos de las unidades familiares. Varios tipos de muestreo por conglomerados: de distintos tamaños, de tamaños iguales, sin submuestreo, con submuestreo, etc.
d)
Muestreo sistemático: Es una forma muy sencilla de selección de la muestra dada en una población numerada del 1 hasta N. El procedimiento consiste en las frases siguientes: se divide el tamaño de la población N por el de la muestra n; empleando una tabla de números aleatorios se elige uno que esté comprendido dentro del cociente dado por el por el resultado anterior (si en el ejemplo el aleatorio ha sido 12, el segundo sería 12 + 20 = 32, el tercero sería 32 + 20 = 52, el cuarto 52 + 20 = 72 y el quinto elemento muestral sería 72 + 20 = 92. Este procedimiento se denomina sistemático ya que lo único que tiene aleatorio es el arranque. El inconveniente de este diseño, igual que en el muestreo aleatorio simple, es que para utilizarlo es absolutamente necesario tener numerados del 1 al N todos los elementos de la población.
e)
Muestreo polietápico o complejo: Es el que se aplica en la práctica cuando se hacen estudios sociales. Los tipos de muestreo que hemos visto anteriormente no suelen aplicarse en estado puro cuando deseamos medir características de unidades de consumo o de producción por razones de carencias de marco o por razones de coste. Por estas razones en la práctica hay que acudir al muestreo polietápico.
f)
Muestreos no probabilísticos: Los muestreos que se han comentado de forma abreviada anteriormente son todos probabilísticos. Todos tienen en común que los elementos de la población que entran a formar parte de la muestra se han obtenido por procedimientos de azar y todos tienen, antes de ser seleccionados, una determinada probabilidad de ser elegidos. Cuando en el proceso de selección existan unidades poblacionales que no tengan
14
ESTADÍSTICA 1
.
probabilidad conocida y utilizada en la selección para entrar a formar parte de la muestra, el muestreo no es probabilística.
2.4.- Construcción numérica y gráfica de las distribuciones de frecuencias unidimensionales.
La Estadística Descriptiva distribuciones de frecuencias unidimensionales. Son unidimensionales porque sólo observamos una característica (sus valores pueden representarse en el espacio de una dimensión) en los elementos de una población (investigación censal) o de una muestra (encuesta muestral). Existen dos tipos fundamentales: las de valores de la variable o datos no agrupados y las de datos agrupados en intervalos de clases.
2.4.1.- Distribuciones de frecuencias unidimensionales con los datos no agrupados.
Designemos con X la característica (una variable o un atributo) deseamos observar en los elementos de una población o de una muestra. Se observan los distintos valores o modalidades de la característica; si es una variable que admite ordenación se ordena de menor a mayor y como puede haber valores que se repitan se agrupan todos ellos. Tabulación de datos y cuando se culmina se obtiene un conjunto formado por valores ordenador de menor a mayor tienen asociados el número de veces que han aparecido (ni) que llamamos distribución de frecuencias unidimensional de datos o valores no agrupados.
Pueden darse dos tipos de distribuciones de frecuencias de datos no agrupados: no tienen valores repetidos o de frecuencias unitarias y las que tienen valores repetidos y, alguna o algunas de sus frecuencias no son unitarias.
15
ESTADÍSTICA 1
.
Llamamos distribución de frecuencias unidimensional unitaria de la característica X al conjunto de los r datos distintos y ordenados de menor a mayor (X1, X2,......,Xi,......Xr) de forma que ninguno está repetido.
Llamamos distribución de frecuencias unidimensional de la característica X al conjunto de los r datos distintos, ordenados de menor a mayor, acompañados de sus respectivas frecuencias absolutas: X1,X2,.......,Xi,......Xr n1,n2,........,ni,.......nr
Se elaboran cuando la característica X toma pocos valores pero se repiten un gran número de veces con lo que las frecuencias ya no son unitarias.
Llamamos total de datos o frecuencia total, y la denotaremos por N a la suma de todas las frecuencias absolutas ni r
i=1
Llamamos frecuencia relativa del valor de la variable Xi, al cociente entre la frecuencia absoluta de dicho valor y el número total de datos N.
Las frecuencias relativas se pueden expresar también en tantos por cien con la simple multiplicación 100. fi con lo que expresamos el porcentaje de veces que aparece el valor Xi en el conjunto de todos los datos.
16
ESTADÍSTICA 1
.
Llamamos frecuencia absoluta acumulada ascendente Ni de un determinado valor de variable ordenado (de menor a mayor) Xi al número de datos que son menores o iguales a él.
Luego la Ni contabiliza el número de observaciones que existen hasta llegar al valor Xi bajo el supuesto, que es con el que venimos trabajando, de que los valores están ordenados de menor a mayor.
Llamamos frecuencia absoluta acumulada descendente Ni de un determinado valor ordenado Xi al número de datos que son mayores que él: r
Ni↓=
nj
J=i+1
Las frecuencias relativas acumuladas tanto ascendentes como descendentes se definen de forma análoga sólo que se suman las fj en vez de las nj.
Si la variable es cualitativa, nos referimos a un atributo que toma distintas modalidades, no tiene ningún sentido el calcular frecuencias acumuladas. La tabla de frecuencias se construye de la forma siguiente: en la primera columna se describen modalidades, en la segunda se registran las frecuencias y en la tercera las relativas.
17
ESTADÍSTICA 1
.
2.4.2.- Distribuciones de frecuencias unidimensionales con los datos agrupados en intervalos de clases.
Este tipo de distribuciones se elabora cuando el número de valores que puede tomar la característica de interés es muy elevado con lo que es necesario agruparlos en intervalos de clases. Estos intervalos sólo tiene sentido en el caso de variables cuantitativas en las que se puede aplicar las escalas que llevan este nombre o las de razón.
Los intervalos pueden construirse con amplitud –diferencia entre el límite superior e inferior- constante o variable. Antes de señalar cómo se elaboran los intervalos vamos a definir lo que se conoce como recorrido o rango de la variable X en estudio que lo designamos por R:
Supuesto que los datos observados están ordenados de forma creciente como hacemos en las características cuantitativas.
La distribución agrupada de frecuencias está determinada por el conjunto de elementos (intervalos, frecuencias) siendo ni la frecuencia absoluta de datos contenidos en el intervalo (Li-1, Li)
2.4.3.- Representaciones gráficas para distribuciones de frecuencias de datos cualitativos.
En la estadística Descriptiva las representaciones gráficas tienen la ventaja de que el impacto visual nos proporciona de forma instantánea una visión global del reparto de los datos observados, pero nunca deben sustituir al estudio analítico que es el que nos proporciona las conclusiones definitivas del fenómeno objeto de estudio. Las figuras más empleadas para los datos cualitativos son el diagrama de rectángulos, diagrama de sectores o de pastel, pictogramas y cartogramas. Las dos primeras se dibujan bajo el principio de
18
ESTADÍSTICA 1
.
proporcionalidad entre las áreas de los rectángulos o sectores y las frecuencias absolutas ni de cada modalidad del atributo.
Los pictogramas consisten en reflejar las frecuencias de cada modalidad a través de dibujos artísticos cuyo tamaño también guarda proporcionalidad con las frecuencias absolutas. Por último los cartogramas son una representación por medio de un mapa que se utiliza cuando las modalidades están contenidas en áreas geográficas. Unitaria, su representación gráfica carece de interés ya que los rectángulos, los sectores o las figuras de los pictogramas tendrían todas el mismo tamaño. Diagrama de rectángulos, en donde todos los rectángulos tienen la misma base y sus áreas son proporcionales a las frecuencias absolutas ni.
Diagrama de sectores, en donde el área de cada sector es proporcional a la frecuencia de cada modalidad, casados: 50, solteros: 25, viudos: 15 y divorciados: 10.
19
ESTADÍSTICA 1
.
Pictograma, en donde el tamaño de las figuras es proporcional a las frecuencias de cada modalidad.
2.4.4.- Representaciones gráficas para distribuciones de frecuencias de datos cuantitativos.
Las representaciones gráficas de las distribuciones de frecuencias no agrupadas. No tiene ningún sentido de frecuencias no agrupadas. Ya que al ser las frecuencias absolutas todas la unidad no nos aportaría ninguna información diferenciadora respecto a los distintos valores de la variable. Se representa mediante lo que se conoce como diagrama de barras.
Las variables cuantitativas sí tienen sentido las columnas de las frecuencias acumuladas, vamos a ver sus representaciones gráficas a través de las figuras denominadas diagramas acumulativos de frecuencias. Las funciones que las representan tienen forma de escalera ascendente o descendente, según se trate de Ni↑ o Fi↑ o bien de Ni↓ o Fi↓. Se sube o se baja un peldaño al pasar de cada valor de la variable al siguiente. La altura de cada peldaño viene determinada por el valor de la frecuencia correspondiente y como siempre en el eje de abscisas están los valores de la variable y en el de ordenadas las frecuencias acumuladas que corresponden a cada valor. El diagrama acumulativo ascendente correspondiente a las columnas Ni↑ o Fi↑, para cada valor de la variable xi se determina el punto (xi, Ni↑) y desde el mismo se traza una línea paralela al eje de abscisas de trazo hasta la vertical del siguiente punto.
20
ESTADÍSTICA 1
.
El diagrama acumulativo descendente se expresa en
la función descendente viene
teóricamente desde menos infinito a la altura del total de datos N = Nr↑ para la escala de las frecuencias absolutas y de la unidad para las relativas. Cuando llega a la vertical de x1 baja aun peldaño justo hasta la definición de N1↓= N – N1↑ con lo que queda cancelado el punto (x1, N1↓). A partir de este punto la función descendente es paralela hasta encontrarse con la vertical de x2 en la que vuelve a bajar un nuevo peldaño. El proceso se repite sucesivamente hasta encontrarnos con la última vertical del máximo valor xr, en la que baja el último peldaño, pasando al valor cero más infinito.
Las representaciones gráficas de las distribuciones de frecuencias agrupadas en intervalos de clases. Se representan a través de los llamados histogramas de frecuencias. Como los valores de la variable están ahora agrupados en intervalos se levanta un rectángulo cuya base es la amplitud de aquéllos.
En la construcción de los histogramas han intervenido las frecuencias absolutas o relativas, pero sin acumular. Como estamos tratando variables cuantitativas hay que representar gráficamente las frecuencias acumuladas que en el caso de distribuciones agrupadas reciben el nombre de polígonos acumulativos de frecuencias.
2.5.- MEDIDAS DE POSICIÓN.
Cuando disponemos de una distribución de frecuencias asociada a cierta variable estadística, ésta puede ser resumida por unas medidas que dan una idea global de cómo es la distribución sin tener que recordar todos los datos con sus frecuencias absolutas o relativas.
Entre estas medidas se encuentran las de posición que sitúan la distribución entorno a dichos parámetros, dando una idea de en qué valores se distribuye la variable estadística.
21
ESTADÍSTICA 1
.
La mayoría de las medidas de posición son números que se obtienen por operaciones aritméticas una vez se han ordenado los valores de la variable. “Datos cuantitativos” si exceptuamos lo que llamaremos “moda” que sí puede obtenerse y tiene pleno sentido en el estudio de características cualitativas o atributos.
Las medias de posición trabajaremos con distribuciones de frecuencias de tipo unitario, de datos no agrupados y con datos agrupados en intervalos de clases. Estudiaremos la media aritmética, la media geométrica, la media armónica, la mediana, la moda y los cuantiles.
2.5.1.- La media aritmética.
Media aritmética de una distribución de frecuencias es uno de los más importantes en la descripción de datos al ser el más usado cuando representamos al conjunto de la distribución por una sola medida de posición central. Se debe utilizar, ya que lo exige su propia definición, cuando los datos observados son de naturaleza aditiva (rentas, salarios, beneficios, pesos, estaturas, puntos, etc) de tal forma que una suma representa el total de los recursos repartidos entre todos los elementos de la distribución. Llamamos media aritmética a la suma de todos los valores de la distribución dividida por el número total de observaciones. Para las distribuciones de tipo unitario será:
X = X1 + X2 + ... + Xr N
Para las distribuciones no unitarias tanto agrupadas como no agrupadas:
X = X1 n1 + X2 n2 + ... + Xr nr N En las no agrupadas los Xi son los valores de la variable estadística directamente observados y en las agrupadas en intervalos de clase son lo que hemos denominado marcas de clase.
22
ESTADÍSTICA 1
.
La media aritmética viene expresada en las mismas unidades de medida que los datos originales observados. En el caso de las distribuciones agrupadas en intervalos de clases la media la obtenemos utilizando las marcas de clases, ya que los valores observados son desconocidos, con lo que difiere de la que podría obtenerse si se utilizaran los valores no agrupados.
Media aritmética simple ya que al ser las frecuencias unitarias todos los valores de la variable tienen la misma importancia o peso a la hora de calcular x. Media aritmética ponderada ya que cada xi aparece ponderado o multiplicado por su respectiva frecuencia absoluta ni que al ser distinta de la unidad da distinta importancia o relevancia a cada xi. “coeficientes de ponderación” denominados wi que son distintos de ni. Coeficientes de ponderación son valores positivos que representan el número de veces que un valor de la variable es más representativo o más importante que otro en el que su correspondiente wi sea la unidad. Propiedades de la media aritmética.
1.- Si la variable estadística xi la sometemos al mismo tiempo a un cambio de origen Ot y a un cambio de escala C mediante la transformación.
2.- La suma de las desviaciones de los valores o datos a su media aritmética es cero.
3.- La suma de los cuadrados de las desviaciones de los valores observados unitarios C respecto a una constante arbitraria C es mínima cuando esa constante C coincide con la
media aritmética x. 4.- Si el total de datos u observaciones se estratifica en L grupos distintos, la media aritmética del total es una media aritmética de las distintas medias de los estratos ponderadas por el número de observaciones que tienen los mismos.
23
ESTADÍSTICA 1
.
Ventajas e inconvenientes de la media aritmética. Las ventajas que podemos señalar de la media aritmética como más relevantes son:
Es calculable en las variables de naturaleza cuantitativa.
Para su cálculo se utilizan todos los valores de la distribución.
Está perfectamente definida de forma objetiva y es única para cada distribución de frecuencias.
Tiene un claro significado ya que al ser el centro de gravedad de toda la distribución nos representa a todo el conjunto de valores observados.
Los inconvenientes hay que señalar que es una medida de posición muy sensible a los valores extremos de la distribución con lo que puede llegar a ser poco representativa del conjunto si la dispersión de los datos es muy elevada. A pesar de este inconveniente, por sus múltiples ventajas, es la medida de posición central más utilizada.
2.5.2.- La media geométrica. En muchas ocasiones los valores de distribución no son de naturaleza propiamente aditiva como ocurre en los casos de los números índices o porcentajes que representan la evolución de una característica con respecto al valor que tiene en un período o situación que llamamos base. Cuando se desea obtener promedios de magnitudes tales como tipos de interés, tasas, porcentajes, números índices, etc. La media aritmética pierde la propiedad de tener un claro significado ya que la suma de dichas magnitudes no representa un total de recursos como en las magnitudes de naturaleza aditiva. Media geométrica de una distribución de frecuencias y la denotaremos por G a la raíz n-ésima del producto de los N valores observados:
24
ESTADÍSTICA 1
.
Ventas e inconvenientes de la media geométrica. Entre las ventajas de las media geométrica podemos señalar:
Es más representativa que la media aritmética cuando la variable evoluciona de forma acumulativa con efectos multiplicativos.
Está definida de forma objetiva y es única, si existe.
Tiene en cuenta en su cálculo todos los valores de la distribución.
Los valores extremos tienen menor influencia que en la media aritmética por estar definida a través de productos en vez de sumas.
Los inconvenientes que hay que resaltar son:
Su cálculo es más complicado que en la media aritmética.
No puede calcularse si algún xi es cero ya que se anula al definirse como productos. Tampoco puede determinarse con valores negativos ya que daría lugar a que apareciesen números de naturaleza imaginaria con lo que el problema no quedaría resuelto, salvo que el radicando sea negativo y el índice de la raíz sea impar.
2.5.3.- La media armónica. Existen situaciones en las que no es adecuado el empleo de la media aritmética ni de la media geométrica ya que los datos observados no son de naturaleza aditiva ni multiplicativa. Esto ocurre en los casos en los que se desea promediar velocidades, rendimientos, productividades, etc. En los que hay que combinar una serie de conceptos tales como: “entidades de producción” (recorridos, fincas, empresas, secciones, etc.) “recursos producidos” por cada entidad. Dada una distribución de ritmos de producción x1, x2, ......., xr y las producciones de r entidades: n1, n2, ......, nr, llamamos media armónica de aquéllos a:
25
ESTADÍSTICA 1
.
Ventajas e inconvenientes de la media armónica. Entre las ventajas de la media armónica hay que destacar las siguientes:
Está definida de forma objetiva y es única.
Su cálculo es sencillo.
Intervienen todos los valores de la distribución.
Es más representativa que las otras medias en los casos de obtener promedios en velocidades, rendimientos y productividades.
Como inconvenientes hay que citar:
No debe de usarse para valores de la variable pequeños (cercanos a cero) ya que sus inversos pueden aumentar muchísimo haciendo despreciable frente a ellos la información de otros valores de xi que sean mayores.
No es posible calcularla cuando existen valores iguales a cero.
2.5.4.- La mediana. (Aritmética, geométrica y armónica) son medidas de posición central que representan al conjunto de valores observados de la distribución equilibrando los más elevados, los intermedios y los pequeños ya que en su cómputo intervienen todos ellos. El problema que tienen estas medias es que son sensibles a los valores extremos muy altos o muy bajos y cuando existe mucha dispersión son poco representativas del conjunto de observaciones. Con objeto de superar esta dificultad vamos a definir otra medida de posición central cuyo cálculo no intervienen todos los valores de la variable xi. En vez de equilibrar valores de la variable para determinar el centro de gravedad de la distribución equilibra las frecuencias observadas a ambos lados de su valor. Dada una distribución de frecuencias con los valores ordenados de menor a mayor, llamamos MEDIANA y la representamos por Me al valor de la variable que deja a su izquierda el mismo número de frecuencias que a su derecha.
26
ESTADÍSTICA 1
.
Determinar de la mediana en las distribuciones de tipo unitario.
a)
Que el número de valores de la variable sea impar: la mediana es el valor central. Si la distribución unitaria es xi: 1, 3, 9, 13, 14 la mediana es Me = 9 ya que es el valor a su izquierda los mismos datos u observaciones que a su derecha; dos datos.
b)
Que el número de valores de la variable sea par: la mediana es la media aritmética de los dos valores centrales. Si la distribución unitaria es xi: 2, 3, 4, 5, 7, 8 la media es: Me = 4 + 5 / 2 = 4,5
Que es un punto del campo de variación de la variable que deja tres observaciones por debajo de él (2, 3 y 4) y otras tres por encima (5, 7 y 8). Si la variable que se está estudiando es de naturaleza discreta y no admite decimales, la Me= 4,5 no sería admisible con lo que las medianas serían conjuntamente los dos valores centrales (4 y 5) ya que valores menores o iguales a 4 hay tres y valores iguales o superiores a 5 también hay tres.
Determinación de la mediana en distribuciones no unitarias y con los valores no agrupados en intervalos de clase.
Si la distribución de frecuencias no es unitaria hay que acudir al concepto de frecuencias acumuladas para determinar la mediana. Si de la correspondiente distribución se representan en el mismo sistema de ejes cartesianos los diagramas acumulativos ascendentes y descendentes, las abscisa del punto donde se encuentran corresponde con la mediana ya que por encima del mismo hay un 50 % de observaciones y por debajo otro 50 %. El procedimiento de determinación numérica es el siguiente: se calcula N/2 y se construye la columna de las Ni↑. A continuación se observa cuál es la primera Ni↑ que supera o iguala a N/2 distinguiéndose dos casos:
a) Si Ni↑ supera a N/2 la mediana es el xi que corresponde a ese Ni↑
27
ESTADÍSTICA 1
.
b) Si Ni↑ es igual a N/2 la mediana es la media aritmética de xi y el siguiente xi + 1. Si este resultado no fuese admisible porque la distribución es discreta y no admite decimales; la mediana sería los dos valores conjuntamente.
Determinación de la mediana en distribuciones con los datos agrupados en intervalos de clase.
En este caso no tenemos valores observados de la variable al estar incluidas en intervalos de clase. Luego la mediana la obtendremos siguiendo el método de observar la columna de frecuencias acumuladas hasta encontrar un valor de Ni↑ que supere o iguale a N/2. Gráficamente si de una distribución agrupada representamos sus polígonos acumulativos ascendentes y descendentes, donde se cortan ambas funciones su correspondiente abscisa nos daría la mediana. Observando la columna Ni↑ nos podemos encontrar con los casos:
a)
Que Ni↑ supera a N/2 el intervalo mediano será (Li – 1, Li) que corresponde a ese Ni↑ > N/2. El valor de la abscisa que se corresponde con Me tiene una ordenada de N/2.
Me = Li – 1 + d. La distancia d se adopta la hipótesis de que los valores de la variable xi que pertenecen al intervalo mediano se distribuyen de forma uniforme a lo largo del mismo. Luego podemos establecer una relación directamente proporcional entre la frecuencia absoluta del intervalo mediano (ni), su amplitud (Ci), la longitud desconocida (d) y la frecuencia que le corresponde (N/2 - Ni↑ - 1):
28
ESTADÍSTICA 1
b)
.
Que Ni↑ es igual a N/2. En este caso se toma por convenio como mediana el límite superior del intervalo mediano.
Ventajas e inconvenientes de la mediana. Como ventajas de la mediana cabe destacar:
Es la mediad más representativa en el caso de variables que sólo admiten al escala ordinal.
Es una medida de posición central sencilla de calcular.
Tiene una fácil interpretación al ser un valor de la variable en el caso de las distribuciones de frecuencias unitarias o las no unitarias no agrupadas. En el caso de las agrupadas está dentro del campo de variación del intervalo mediano.
En la mediana sólo influyen los valores centrales de la distribución y es insensible a los valores extremos. La Me puede calcularse en distribuciones en las que los valores extremos son desconocidos siempre y cuando tengamos información sobre sus frecuencias (casos de intervalos iniciales y finales de naturaleza abierta).
El único inconveniente que se le puede señalar a la mediana es que en su determinación no intervienen todos los valores de la variable. Este inconveniente se transforma en ventaja cuando son desconocidos los valores extremos o existe una enorme dispersión entre los mismos que invalidan las medias como medidas de posición central al no ser representativas del conjunto de la distribución por la enorme influencia que ejercen los mencionados valores extremos en su cálculo.
2.5.5.- La moda. Igual que la mediana es una medida de posición central que está fundamentada en las frecuencias de la distribución y no en el conjunto de los valores de la variable como ocurre con las distintas medias. La moda siempre estará definida en relación a valores de la variable asociados a sus distintas frecuencias con lo que no tiene sentido hablar de moda en las distribuciones de frecuencias de tipo unitario.
29
ESTADÍSTICA 1
.
Dada una distribución no unitaria llamamos moda absoluta, que representamos por Mo, al valor de la variable (o los valores) con mayor frecuencia absoluta. En el caso de existir dos, tres o más valores con la mayor frecuencia absoluta, la distribución se dirá que es bimodal, trimodal o multimodal. Determinación de la moda en distribuciones no unitarias y no agrupadas.
En este caso la determinación de la moda es inmediata ya que basta con observar la columna ni de frecuencias absolutas.
Dada una distribución no unitaria llamamos moda relativa a aquel valor de la variable (o los valores) cuya frecuencia absoluta no es superada por las de sus valores contiguos.
Determinación de la moda en distribuciones agrupadas en intervalos.
Al estar los valores de la variable agrupados en intervalos sólo obtendremos una aproximación al valor de la moda como ocurría con las medias y la mediana. Para determinar la moda pueden emplearse distintas hipótesis pero las más utilizadas son las siguientes:
La moda se encuentra en el intervalo que tiene mayor frecuencia absoluta dividida por su amplitud que recibe el nombre de intervalo modal.
La moda estará más cerca de aquel intervalo contiguo que tenga mayor frecuencia absoluta. Luego dentro del intervalo modal la moda se encuentra en un punto para el cual las distancias a los extremos inferior y superior del intervalo son inversamente proporcionales a las frecuencias absolutas de los intervalos adyacentes a dichos extremos.
30
ESTADÍSTICA 1
.
Teniendo en cuenta las hipótesis anteriores vamos a considerar dos casos:
a)
Que los intervalos tengan todos una amplitud constante c. Para determinar la moda se observa la columna ni de frecuencias absolutas concretando que la mayor de todas determina el intervalo modal.
b)
Que los intervalos sean de amplitud variable ci.
Ventajas e inconvenientes de la moda. La moda tiene una serie de ventajas tales como:
Es la única medida de posición central que puede obtenerse en las variables de tipo cualitativo que sólo admiten la escala nominal ya siempre podemos determinar la modalidad que más se repite en el estudio de un determinado atributo.
Es de sencillo cálculo.
Es de fácil interpretación ya que nos da directamente el valor de la variable que más se repite.
Como inconveniente hay que señalar que en su determinación no intervienen todos los valores de la distribución ni todas las frecuencias centrándose sólo en la mayor frecuencia absoluta de un determinado valor de la variable.
2.5.6.- Otras medidas de posición no centrales: los cuantiles. Las medidas que denominamos cuantiles son valores de la variable que dividen a la distribución en partes proporcionales, o sea, en intervalos que contienen el mismo número de observaciones. Es evidente que la medida de posición central que hemos llamado mediana es un cuantil ya que es un valor de la variable que la divide en dos partes iguales a la distribución.
31
ESTADÍSTICA 1
.
Llamamos cuantiles a aquellos valores de la variable que dividen a la distribución en intervalos que tienen un número de frecuencias absolutas proporcional a una constante comprendida entre 0 y 1. Los más conocidos son:
Los cuarteles (Qi) que son tres valores que dividen a la distribución en cuatro partes iguales.
Los deciles (Di) que son nueve valores que dividen a la distribución en diez partes iguales.
Los percentiles (Pi) que son noventa y nueve valores que dividen a la distribución en cien partes iguales.
Cálculo de cuantiles en distribuciones no agrupadas en intervalos de clase.
Como la mediana es un caso particular de cuantil, ya que se divide a la distribución en dos partes iguales, las reglas de cálculo que se vieron para obtener Me son válidas para obtener los distintos cuantiles.
Cálculo de cuantiles en distribuciones en intervalos. Este problema se resuelve de forma idéntica que en el caso de la mediana. Luego la fórmula de determinación es la misma sólo que en vez de una frecuencia absoluta acumulada ascendente de N/2 será en términos genéricos la de los cuantiles hasta rN/q. Para determinar el cuantil de orden r y número de intervalos iguales q, o sea Cr/q.
2.6.- MOMENTOS. Los momentos son medidas obtenidas a partir de todos los datos de una variable estadística y sus frecuencias absolutas. Estas medidas caracterizan a las distribuciones de frecuencias de tal forma que si los momentos coinciden en dos distribuciones diremos que son iguales, siendo más semejantes cuando mayor sea el número de momentos que coinciden.
32
ESTADÍSTICA 1
.
2.7.- MEDIDAS DE DISPERSIÓN.
Las medidas de dispersión tratan de medir lo más o menos esparcida que se encuentra la variable estadística entorno a una medida de posición o de tendencia central, indicándonos lo representativa que es la medida de posición. A mayor dispersión, menor representatividad de la medida de posición, y viceversa.
Las medidas de dispersión absolutas sólo tienen sentido cuando vienen acompañadas de un promedio. Las relativas permiten comparar la dispersión de distintas distribuciones.
a) Recorrido, rango o intervalo de variación: R = Xr – X1 = max (Xi) – mín (Xi) b) Intervalos intercuantílicos:
Intervalo intercuartílico,
Intervalo semiintercuartílico,
Intervalo intercuartílico relativo,
Intervalo 10 – 90 por 100,
Intervalo 7 – 93 por 100, c) Medidas de dispersión respecto a la media aritmética:
Desviación absoluta media respecto a la media.
Varianza,
Desviación típica.
Coeficiente de variación de Pearson, s/x que es la medida de dispersión relativa que más se utiliza para comparar la dispersión de distintas distribuciones.
33
ESTADÍSTICA 1
.
Propiedades de la varianza, s2.
a) La varianza siempre es positiva. b) La desviación cuadrática media de una variable estadística respecto de una constante k, se hace mínima en k = x en cuyo caso la desviación cuadrática media respecto a x es la varianza s2. c) Método abreviado de cálculo de s2. d) Cálculo de la varianza a través de los momentos respecto al origen.
2.8.- MEDIDAS DE ASIMETRÍA Y CURTOSIS.
Una distribución es simétrica si y sólo si el diagrama de barras que la representa es simétrico respecto de la recta x = x, siendo x la media aritmética. Es fácil comprobar además que si una distribución es simétrica, el momento m3 = 0, pero no al revés, es decir, de que m3 = 0 no se deduce que la distribución es simétrica.
Se han propuesto distintas medidas de asimetría para variables estadísticas; entre ellas destacamos el “coeficiente de asimetría de Fisher”:
2.9.- MEDIDAS DE CONCENTRACIÓN. El índice de concentración de Gini y la curva de Lorentz, como instrumentos válidos para analizar la mayor o menor concentración en una distribución de rentas de los individuos que las reciben. Índice de concentración de Gini.
34
ESTADÍSTICA 1
.
Para obtener el índice de Gini es conveniente construir un proceso sucesivo de cálculo obtenemos las columnas qi y pi que nos definen dicho índice. La columna xini nos da el reparto del total de recursos entre los distintos elementos de la distribución dados por las frecuencias absolutas ni. Las columnas Ni↑ y ui nos dan la evolución acumulada de recursos (ui) y de individuos que se los reparten (Ni↑). Por último, qi y pi nos representa dicha evolución expresada en porcentajes.
Si la concentración de renta es mínima, es decir, si la renta está repartida por igual entre los N individuos, xi = x = cte., lo que implica: u = Ni↑, y esto implica a su vez qi = pi, por lo que la renta está equidistribuida.
Si la concentración de renta es máxima, sólo el último individuo percibe toda la renta:
El índice de concentración de Gini puede tomar gradualmente valores de 0 a1, según pase de la equidistribución hasta el caso opuesto de concentración máxima de la renta en un solo individuo.
35
ESTADÍSTICA 1
.
CAPÍTULO 3 DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DISTRIBUCIONES BIDIMENSIONALES Son las que estudian 2 variables Hay de dos tipos: Tabla de correlación = Variables cuantitativas Tabla de contingencia = Variables cualitativas
3.2.1.- Tabla de correlación (del libro).
y x
1
2
3
ni
fi
15
2
1
18
0,18
10
30
2
32
0,32
12
30
4
46
0,46
1
2
1
4
0,04
nj
38
54
8
Nij=100
fj
0,38
0,54
0,08
Intervalos 100-150 MdeC 125 150-200 MdeC 175 200-300 MdeC 250 300-350 MdeC 325
Fij=1
36
ESTADÍSTICA 1
.
Tabla de correlación de mi amantísima, para los que no tengan calculadora para 2 Tablas –Mode 2 LR y 0
1
2
3
x
2
ni x
nijxiyj
6
2 12””” 4
24
10””””
3
5
ni x
ni x
2
x 0”
2”
4”
6”
1-3 2
3
1
0
MdeC 2 0”” 3-7
6””
4””
0””
5
10
15
0
MdeC 5 0
0
1
2
0
10
15
25 75
40
27
99
50
30
nj
2
3
2
2
y
0
1
2
3
nj y j
0
3
4
6
Y2
0
1
4
9
nj y 2
0
3
8
18
9
13
29
0” = MdeC * y = 2*0 =0 0”” = 0” * x = 0*2 = 0 12””” = ” 10”””” = ””
A partir de esta Tabla empezamos los cálculos:
x = nix/Ni = 27/9 = 3 “ y = njy/Nj = 13/9 = 1,4
Varianza x = (x2n / N) – x2 = 99/9 – 32 = 2 “ Desv. Típica = 2
= 1,4
Varianza y = (y2n / N) – y2 = 29/9 – 1,42 = 1,26 “ Desv. Típica = 1,26 Covarianza = (nijxiyj/N) – x y = 50/9 – 1,4 * 3 = 1,35
37
= 1,12
ESTADÍSTICA 1
.
Coeficiente de correlación de Pearson = Covarianza / xy = 1,35 / 1,4*1,12 = 0,86 También se conoce por r (-1<r<1), cuando más se acerca a 1 más x y 1 2 3 nx dependencia existe entre las variables, es decir si aumenta o disminuye la una, aumenta o disminuye la otra, 125 15 2 1 18 cuando r = 0 las variables son independientes y cuando 175 10 20 2 32 son <0, si una aumenta la otra disminuye y al contrario. 250
12 30 4 46
400
1
2
1 4
Cálculo de las rectas x=f(y) e y =f(x) xsobre y (x – x) = (Cov/Varianza y) (y – y)
38 54 8
ysobre x (y – y) = (Cov/Varianza x) (x – x)
Calcularemos las dos: (x – x) = (Cov/Varianza y) (y – y) “( x – 3) = 1,35 / 1,26 ( y – 1,4) “ x = 1,07y + 1,5 (y – y) = (Cov/Varianza x ) (x – x) “( y – 1,4) = 1,35 / 2 ( x – 3) “ y = 0,675x + 0,625
Distribuciones marginales de frecuencia
No son más que el sumatorio de x e y de las frecuencias de cada variable
Ejemplo: De la siguiente tabla, hallar las frecuencias marginales, la Mo de y y la x
Cálculo de las rectas x=f(y) e y =f(x) x sobre y (x – x) = (Cov/Varianza y) (y – y) y sobre x (y – y) = (Cov/Varianza x) (x – x)
También
r*(y
x sobre y (x – x) =
(x r*(x y sobre x (y – y) =( y
(x - x ) (y - y )
38
ESTADÍSTICA 1
.
Calcularemos las dos:
x
y 1
2
3 nx
125
15 2
1 18
175
10 20 2 32
250
12 30 4 46
400
1
2
(x – x) = (Cov/Varianza y) (y – y) “( x – 3) = 1,35 / 1,26 ( y – 1,4) “ x = 1,07y + 1,5 (y – y) = (Cov/Varianza x ) (x – x) “( y – 1,4) = 1,35 / 2 ( x – 3) “ y = 0,675x + 0,625
1 4
38 54 8
Distribuciones marginales de frecuencia
No son más que el sumatorio de x e y de las frecuencias de cada variable
Ejemplo: De la siguiente tabla, hallar las frecuencias marginales, la Mo de y y la x
Frecuencias marginales de x
Frecuencias marginales de y Moy = 2 x = xi ni / N = (125*18 + 175*32 + 250*46 + 400 * 4)/ 100 = 209,5
Distribuciones condicionadas de frecuencias
Llamamos variable X condicionada a que Y = yj , se representa (X (Y = yj), ala variables
estadística que toma los valores xi con frecuencia absoluta nij Ejemplo: De la tabla, obtener o o
La distribución de Y condicionada a X = 175 Moda, y, ( y r (Coef. de Pearson)
39
ESTADÍSTICA 1
.
Tabla X = 125, 175, 250, 400, si queda condicionada a que x = 175, la nueva tabla tomará la siguiente forma
X = Yj (X = x=175
n
1 2
10 20
3
2 N = 32
Mo = 2 “ x = (1*10 + 20*2 + 2*3) / 32 = 1,75 Varianza = (x2 – x2 = (108/32) – 1,752= 0,3125, luego ( = 0,56 Coef. de Pearson = ( / x = 0,56 / 1,75 ( 0,32
Dada una tabla de correlación bidimensional siempre se pueden obtener sus dos distribuciones marginales con la simple suma por filas y columnas de sus frecuencias conjuntas. Pero la inversa no es siempre cierta; o sea, dadas las distribuciones marginales no siempre puede elaborarse de modo único la distribución conjunta (X, Y)= (x y n ): i = 1,2 …, r:, j = 1,2, …, s. Veámoslo con un ejemplo: Si n1. = 6 n2.= 9
n.1= 6 y
n.2 =15
n3 .= 15
n.3 = 9
son las frecuencias marginales de la variable estadística bidimensional (X, Y) = ( ), ésta no está determinada; para ello podemos proponer dos posibles variables bidimensionales distintas con las mismas distribuciones marginales:
Esto comprueba que dadas las distribuciones marginales, no siempre se puede reconstruir la variable estadística bidimensional conjunta de modo única.
40
ESTADÍSTICA 1
.
Distribuciones condicionadas de frecuencia
Definición 3.2. Distribuciones condicionadas de frecuencias.
Puede observarse que pueden definirse tantas distribuciones de frecuencias condicionadas como valores tienen las variables X e Y ya que cada una queda determinada por la fila o la columna del correspondiente valor que condiciona. Las distribuciones condicionadas también son unidimensionales y por tanto pueden obtenerse todas las medidas de posición y dispersión de las mismas.
Momentos en las distribuciones bidimensionales
Igual que en las unidimensionales los momentos son medidas que reducen los datos de una variable estadística, que en este caso será bidimensional permitiendo tener una idea general de la distribución sin tener que enumerar todos los pares de valores ( ) con sus frecuencias absolutas . Podemos distinguir dos tipos principales de momentos: con relación al origen o con respecto a las medias.
a) Momentos respecto al origen
41
ESTADÍSTICA 1
.
b) Momentos respecto a las medias
Independencia estadística
Dos variables estadísticas X e Y son independientes entre sí cuando la variación de una de ellas no influye en la distribución de la otra condicionada por el valor que tome la primera. Por el contrario existirá independencia cuando los valores de una condicionan la distribución de los valores de la otra. Acudiendo a la definición que se dio de frecuencia relativa condicionada tenemos que:
La expresión (3.1) nos indica que la frecuencia relativa conjunta de ( ) es el producto de la frecuencia relativa de condicionada por , por la frecuencia relativa marginal cuando existe independencia estadística; o sea que el valor que condiciona influye en la distribución de la variable . Si existe independencia estadística es evidente que las frecuencias relativas de X condicionadas por los distintos valores de , serían todos iguales entre sí e iguales a la frecuencia relativa marginal de X ya que dichos valores no influyen para nada en la distribución de la variable . O sea, se cumplirá que:
O lo que es lo mismo:
42
ESTADÍSTICA 1
.
Sustituyendo en la expresión (3.1) la frecuencia relativa condicionada por la marginal la expresión (3.2), ya que estamos bajo la hipótesis de independencia estadística, tenemos que:
de
Definición 3.3. Independencia estadística
Una propiedad de interés es que si X e Y son independientes, entonces la covarianza entres ellas es nula. Veamos para ello que
pero como
, que es lo que queríamos probar.
Sin embargo, que Cov (X, Y) = 0 no implica que X e Y sean independientes. Esto puede comprobarse con un contraejemplo en que X e Y sean dependientes (o no independientes) y además
3.2.2.- Tablas de Contingencia. En los estudios socioeconómicos se analizan en muchas ocasiones variables de tipo cualitativo que sólo admiten escalas nominales y como mucho orinales (sexo, nacionalidad, profesiones, niveles de estudios, imagen de políticos, etc). Como ya se comentó en los análisis unidimensionales, en las variables cualitativas no tiene sentido la obtención de promedios si se exceptúa la moda en las de escala nominal y la mediana en las de escala ordinal. Luego en este tipo de análisis no tiene ninguna lógica la definición de momentos respecto al origen o respecto a la media. Lo que sí se puede es obtener sus respectivas tablas de frecuencias que en el caso de las bidimensionales se las denominan tablas de contingencia. Es una tabla de doble entrada como en la que en la primera columna y primera fila se expresan las modalidades de los atributos M
43
ESTADÍSTICA 1
.
y M´; en las celdillas centrales están las frecuencias absolutas conjuntas nij. La última columna y la última fila nos definen lo mismo que en las tablas de correlación las frecuencias marginales del atributo M y el M´ con las que pueden construirse las dos distribuciones marginales o unidimensionales representadas por los conjuntos. También pueden definirse las correspondientes distribuciones condicionadas de frecuencias dadas por los conjuntos. Como a las variables cualitativas no se las puede someter a las operaciones de sumas, restas y divisiones, al venir expresadas en escalas nominales u ordinales, no tiene sentido el hablar de medias marginales o condicionadas o de varianzas o desviaciones típicas. Lo que sí cabe es establecer el concepto de independencia estadística entre variables cualitativas ya que como vimos en las tablas de correlación de las variables cuantitativas, en su definición sólo intervienen determinadas propiedades de las frecuencias relativas tanto conjuntas como marginales. Luego la condición necesaria y suficiente para que los atributos M y M´ sean independientes es que la frecuencia relativa conjunta sea igual al producto de las frecuencias relativas marginales:
También se pueden elaborar tablas de contingencia combinando características cualitativas con cuantitativas: sexo con edad, hábitat donde viven las familias (rural o urbano) con niveles de renta, etc.
3.3.- DEPENDENCIA FUNCIONAL Y DEPENDENCIA ESTADÍSTICA. Es frecuente encontrase cuando se estudian conjuntamente dos características o variables que exista una relación de dependencia entre las mismas. Esta dependencia tiene dos naturalezas: dependencia funcional que es cuando existe una relación matemática exacta entre las dos variables y dependencia estadística que se caracteriza por una relación aproximada entre los dos fenómenos. La dependencia funcional se puede representar los pares de valores observados de una variable bidimensional pertenecen exactamente a la función matemática que liga a las dos variables que en este caso es una recta. Podría representar un fenómeno físico que es el espacio (Yi) que recorre un vehículo que va a una velocidad constante (b) en
44
ESTADÍSTICA 1
.
distintos períodos de tiempo (Xi). A cada valor Xi le corresponde un solo valor yi dado por la función matemática que liga a las variables. Puede darse el caso, que exista dependencia estadística, por puro azar, entre la evolución del número de accidentes de automóviles y la producción de queso manchego. De ello no podemos sacar la conclusión de que una variable determina a la otra ya que no tiene ningún sentido. Sí parece lógico formular que el nivel de gasto de los hogares está dependiendo de su renta disponible. Pero esta dependencia no es de tipo matemáticofuncional sino estadística. Si se observan un conjunto de países de valores de renta disponible y niveles de gastos nos encontraremos que para un mismo nivel de renta pueden darse distintos niveles de gastos ya que existen otra serie de características, además de la renta, que influyen en el gasto aunque sea de forma menos relevante. Este tipo de fenómenos se representan en un sistema de ejes, a través de una nube de puntos. Por ejemplo, la figura a) representa una dependencia lineal positiva (al crecer la renta disponible X también crece el consumo familiar Y). Puede observarse que en la dependencia estadística los pares de valores observados (xi, yi) ya no están alineados, con la dependencia funcional. También nos indica la nube de puntos que la relación entre x e y es de distinta naturaleza: lineal positiva representada por la figura a); lineal negativa expresada en la figura b); curvilínea según la forma de la figura c); sin ninguna relación como se indica en la figura d). Existen tres motivos fundamentales por los que una variable que vamos a llamar dependiente o endógena está influida por otra que actúa como independiente o exógena: la casualidad o el azar ha hecho que ambas variables estén relacionadas estadísticamente (por ejemplo, como se ha señalado, el número de accidentes de automóvil y la producción de queso manchego); una tercera variable está determinado a las que estamos estudiando, por último, puede existir una relación causa-efecto como el ejemplo de que los niveles de consumo están determinados fundamentalmente por la renta disponible. En los estudios estadísticos de los fenómenos socioeconómicos sólo nos deben preocupar las relaciones de causa-efecto que son las que tienen una base teórica. La regresión es una parte una parte de la Estadística Descriptiva que nos enseña a determinar la línea la que tiende la nube de puntos. Luego la Teoría de la Regresión nos permite pasar de la dependencia estadística representada en una nube de puntos a la
45
ESTADÍSTICA 1
.
dependencia funcional dada por una línea de regresión. Existen dos formas de obtener la línea de regresión: a través de los ajustes mínimo-cuadráticos. La línea de regresión de Y sobre X cuando Y es la variable dependiente o efecto, y la X es la independiente o causa. Para ello, si hay r observaciones consideramos todas distribuciones condicionadas. Hemos pasado de la nube de puntos en la que a cada valor xi le pueden corresponder varios valores de yi, a una línea de regresión en la que a cada xi le corresponde un solo valor de la ordenada que es la media aritmética de Y condicionada a dicho valor. Por idéntico procedimiento puede obtenerse la línea de regresión de X sobre Y actuando en este caso la X como dependiente y la Y como independiente. La distribuciones de frecuencias condicionadas serían: Otra forma más utilizada en la obtención de las líneas de regresión Y/X y X/Y es el denominado ajuste mínimo-cuadrático. Esta segunda versión es menos pura que la de las medias condicionadas pero es mucho más manejable ya que se obtiene una función estimada en el ajuste y no una línea de puntos como ocurre con las medias aritméticas condicionadas, ya que en la realidad siempre tendremos una serie de observaciones discretas que nos proporcionará una línea de puntos más o menos próximos, pero no una curva continua como nos proporciona el ajuste mínimo-cuadrático. Dada una distribución de frecuencias bidimensional expresada por el conjunto ¨(Xi,Yi); nij} el ajuste mínimo –cuadrático consiste en desarrollar el proceso siguiente:
Representar la nube de puntos dada por los valores observados (xi, yi) y elegir la función del tipo Yti = f(Xi, a1 a2 ........ an) que más se aproxime a dicha nube. El número de parámetros (a1, a2,.......) tiene que ser inferior al número de observaciones para que el ajuste tenga grados de libertad que es la diferencia entre el número de observaciones y el número de parámetros.
Y = ax3 + bx2 + cx + d
46
ESTADÍSTICA 1
.
Para cada Xi se define un error o residuo que es la diferencia entre la variable dependiente observada Yj y el valor teórico dado por la función:
Yti = axi3 + bxi2 + cxi + d
El método del ajuste mínimo cuadrático consiste en que la expresión de los errores o residuos cuadráticos sea un mínimo. Ecuaciones normales nos resuelve el problema pasando de la dependencia estadística a la funcional.
3.4.- REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE 3.4.1.- La regresión lineal simple Existen muchos fenómenos cuya representación gráfica, en forma de nube de puntos, nos indica a simple vista la existencia de un tipo de correlación lineal entre los datos representados. Con el fin de predecir los valores de “y” a partir de las “x” conocidas, se busca una ecuación matemática que se ajuste del modo más aproximado posible a la tendencia estadística mostrada. En este caso, la función que mejor se ajusta a la realidad es la ecuación de una recta: y a bx . El problema que se plantea es la determinación de los parámetros “ a ” y “ b ” que mejor ajusten la recta a los datos existentes. Para su determinación se utiliza el ajuste mínimo-cuadrático, cuyo desarrollo general se detalla a continuación: Ajuste mínimo-cuadrático: Sean x i , y i los pares de valores
existentes de la muestra cuya recta de regresión se quiere
determinar yti a bxi la ecuación de la recta a ajustar.
Gráfico 3.6.- Ajuste lineal mínimo-cuadrático
47
ESTADÍSTICA 1
.
El ajuste mínimo-cuadrático define la recta de modo que la suma de todos los errores ei elevados al cuadrado sea mínima, siendo ei la diferencia entre el valor real ( y i ) y el estimado a partir de la ecuación de la recta yti a bxi :
Expresión [3.5]
Con el fin de minimizar este valor, se realizan las derivadas de la expresión [3.5] respecto a las incógnitas “ a ” y “ b ”:
Llegando al siguiente sistema de ecuaciones:
Expresión [3.6]
que, dividiendo por N, queda como:
48
ESTADÍSTICA 1
.
N
siendo
a01 y i , i 1
N
a10 xi i 1
N
a11 xi y i i 1
N
a 20 xi2 i 1
De la primera ecuación del sistema [3.7] obtenemos que a a01 ba10 , y sustituyendo en la segunda, tenemos:
Resultando, finalmente, el siguiente sistema:
Expresión [3.8]
49
ESTADÍSTICA 1
.
Sustituyendo, pues, “ a ” y “ b ” en la recta y a bx :
Expresión [3.9]
Que supone la recta de regresión mínimo-cuadrática de
De modo similar, la recta de x sobre
y sobre x .
y es:
Expresión [3.10]
Ambas rectas presentan las siguientes características:
-
Las dos pasan por el punto del plano de coordenadas ( a10 , a01 ).
-
Sus pendientes son, respectivamente,
-
Ambas rectas son crecientes, o ambas son decrecientes.
-
En el caso de que las variables estadísticas x e
m11 m11 y . m 20 m02
y sean independientes, m11 sería igual a 0,
por lo que las rectas de regresión serían:
y a01
50
x a10
ESTADÍSTICA 1
.
respectivamente, es decir, paralelas a los ejes de coordenadas x e
El coeficiente de regresión lineal simple
y.
b en la expresión y a bx representa la pendiente de
la recta de regresión y determina en cuánto varía la variable dependiente o endógena cuando la independiente o exógena varía en una unidad.
En funciones económicas como la representación del consumo respecto a la renta, al coeficiente
b se le conoce en teoría económica, como la propensión marginal a consumir.
El coeficiente a , sin embargo, puede a veces tener un significado económico y a veces no.
3.4.2. Correlación lineal simple. La teoría de correlación estudia el grado de asociación entre dos variables, es decir, mide la intensidad de la dependencia de las mismas. Una vez realizado un ajuste nos interesa saber en qué medida la variable endógena o dependiente queda determinada por el modelo matemático estimado al pasar de la dependencia estadística a la funcional. El valor observado de la variable endógena yi es igual al valor teórico o estimado por la función yti más el residuo o error: [3.11]
51
ESTADÍSTICA 1
.
La variable dependiente observada tiene una determinada variabilidad o dispersión que se mide por su varianza . Los valores estimados por el modelo ajustado constituyen una serie con una determinada variabilidad denominada varianza de la variable endógena regresión, se representa como de los errores o residuos
explicada por la
. La varianza del residuo se denomina varianza residual o varianza
.
Demostración de la relación entre la varianza de la variable dependiente, la varianza explicada por la regresión y la varianza residual.
Vamos a demostrar que las tres varianzas se relacionan de la forma siguiente:
[3.12]
Si elevamos al cuadrado [3.11] y sumamos para N pares de observaciones de frecuencias unitarias:
[3.13] En el caso de ajustar una recta a una nube de puntos:
Sumando para los N valores:
Para que se cumpla la primera ecuación normal de la expresión [3.6].Veamos qué vale el siguiente sumatorio:
Para que se cumpla la segunda ecuación normal mínimo-cuadrática de la expresión. Por tanto [3.13] queda reducida a:
52
ESTADÍSTICA 1
.
[3.14] Si en la expresión [3.14] a cada valor de las tres variables se le resta su media aritmética y se divide por el toral de observaciones N, recordando que la media de los residuos es cero ya que el sumatorio de los residuos es cero, y que la medias son iguales:
Al tener en cuenta que la recta de regresión para por
:
Con lo que se demuestra la ecuación de partida [3.12] Las varianzas
y
pueden obtenerse sin necesidad de efectuar el ajuste en función de las
varianzas y covarianzas. Obteniéndose la siguiente ecuación:
[3.15] La varianza explicada se obtiene despejándola de la expresión [3.12]
[3.16]
Coeficientes de determinación y de correlación lineal simple. Basándonos en la ecuación [3.12] podemos afirmar que si no existiesen errores la varianza endógena seria igual a la varianza explicada por la regresión. Por tanto, las varianzas de la variable dependiente se deberán única y exclusivamente a las variaciones de la variable exógena, existiendo sólo una dependencia funcional o exacta. Como esto no suele ocurrir hay que definir un coeficiente de determinación. Se define como la participación de la varianza explicada por la regresión en la varianza marginal de la variable dependiente observada:
[3.17] Al estar definido por un cociente es un parámetro que no tiene unidades y permite comparar resultados entre distintas asociaciones de variables. Nos proporciona el porcentaje de causas
53
ESTADÍSTICA 1
.
comunes que tienen las dos variables relacionadas para explicar su variabilidad o evolución si se expresa en 100%. Si lo expresamos en tanto por uno indica que la varianza de y i explicado por la variable independiente xi a través de la función ajustada. Como las varianzas que definen R2 son siempre positivas el campo de variación será . Cuando las causas comunes a x e llegan al 0,75 el modelo ajustado suele aceptarse. [3.17] Es un formulación genérica y sirve para cualquier tipo de regresión. En el caso de la regresión lineal simple podemos determinar una ecuación específica más sencilla. Vamos a definir el coeficiente de correlación lineal simple:
[3.21] El coeficiente de correlación se unas para determinar el grado de dependencia lineal de la variable endógena ante los valores de la exógena. Esta dependencia puede ser según sea el signo de la covarianza Sxy: o Si la covarianza es positiva también lo es la correlación y su coeficiente tomará valores entre 0 y 1. La dependencia será mayor cuanto más se aproxime a 1. Si R=1 los valores teóricos estimados o los estimados coinciden con los observados por tanto existe una dependencia exacta o funcional. Si R=0 implica que no existiendo ninguna dependencia entre las variables de tipo lineal, aunque si puede haberla de otra naturaleza, convirtiéndose las rectas de regresión en dos paralelas a los ejes de coordenadas. o Si la covarianza es negativa R puede tomar los valores de -1 a 0. La dependencia será mayor cuanto más se aproxime a -1. Si R=-1 la correlación es perfecta existiendo una dependencia funcional pero negativa. Las rectas de regresión coincidirán en una sola que sería decreciente al tener una pendiente negativa. o Por tanto . A partir de + 0,75 la dependencia es aceptable.
Predicción. Las predicciones se efectúan utilizando la recta estimada
. La predicción será
más fiable cuanto mayores sean los coeficientes de determinación ya que menor será la varianza de los residuos. La fiabilidad de las predicciones disminuye a medida que los valores de la variable exógena se alejan de su recorrido.
3.5. Regresión y correlación lineal múltiple
Ajuste de un plano por el método mínimo-cuadrático
54
ESTADÍSTICA 1
.
Se parte de la nube de puntos tridimensionales en las que se recogen las observaciones de frecuencias unitarias. Ajustamos la ecuación de un plano a esta nube de puntos: y = b0 + b1x1 + b2x2 El sistema de ecuaciones normales surge de minimizar la expresión: S= Derivando la expresión anterior respecto al término b0 y dividiendo por N:
Los coeficientes de regresión parcial de Y/X es b1 y el de Y/X es b2 y las medias marginales de las tres características en estudio (
)
Para tomar variables tomaremos las desviaciones a sus correspondientes medias aritméticas llamando
;
;
De esta forma colocaremos generaremos una fórmula que pase por el nuevo origen. Derivando parcialmente respecto a las incógnitas b1 y b2 e igualando a cero tendremos el siguiente sistema de ecuaciones normales que junto con la expresión resuelven nuestro problema:
El sistema de dicha expresión lo podemos expresar en función de las respectivas covarianzas y varianzas marginales dividiendo por N todos sus elementos:
Mediante la Regla de Cramer se despejan la incógnitas tanto de b1 como de b2 dando como resultado:
55
ESTADÍSTICA 1
.
El problema de la multicolinealidad en el ajuste de un plano. Este problema surge sólo en la regresión múltiple cuando las variables explicativas, exógenas o independientes tienen entre sí una fuerte relación de dependencia.
Coeficientes de determinación y correlación múltiple en el ajuste de un plano. Partiendo de la igualdad:
El coeficiente de determinación múltiple será:
La varianza residual puede obtenerse la varianza explicada por la regresión
por
diferencia la
El coeficiente de correlación es la raíz cuadrada del de determinación.
Coeficientes de determinación y correlación parcial en el ajuste de un plano. Al existir más de una variable explicativa puede estudiarse la evolución conjunta o las causas comunes entre la variable dependiente yti y la primera independiente x1i, permaneciendo constante la otra explicativa x2i El coeficiente de determinación parcial
56
ESTADÍSTICA 1
.
3.5.- REGRESION Y CORRELACIÓN LINEAL MULTIPLE.
Utilizaremos nuevos conceptos:
Coeficientes de determinación. Correlación parcial. Problema de multicolinealidad.
3.5.1.- AJUSTE DE UN PLANO POR EL METODO MINIMO CUADRATICO.
Partiremos de las observaciones de frecuencias unitarias de tres características estudiadas en una población.
Si el número de observaciones tridimensionales es N, la nube de puntos la formaran las siguientes ternas:
(Y1 X
11
X 21 )(Y2 , X 12 , X 22 )(Y3 , X 13 , X 33 )(Yn , X 1n , X 2n )
Vamos a ajustar x el método mínimo-cuadrático la ecuación de un plano a esta nube de puntos:
y b0 b1 x1 b2 x2
De la ecuación:
Y b0 b1 X 1 b2 X 2
57
ESTADÍSTICA 1
.
Obtenemos que el plano pasa por el punto tridimensional ( X , X 2 , Y ) llamando centro de gravedad de la distribución. También nos sirve para obtener el término independiente de es el
b
o
Y / X 1 que es el b1 y el de Y / X 2 que
b2 y las medias marginales de las tres características en estudio ( X , X 2 , Y )
Y b1 X 1 b2 X 2
b yb ) :
Para obtener los otros coeficientes de regresión parcal será (
1
2
S Y R y1 RY 2 R12 1 R122 1
bS 1
b
2
S Y R y 2 RY 2 R12 S2 1 R122
Donde
RY 1 , RY 2 , R12 son coeficientes de correlación simple de las variables dos a dos.
El problema de la multicolinealidad en el ajuste de un planto.
Cuando las variables tienen entre sí una fuerte relación de dependencia, (cuando la dependencia entre
X 1 yX 2 fuese exacta, es decir R122 1 ) es imposible calcula los coeficientes de regresión
parcial con lo que nos llevaría a cambiar la estructura del modelo eliminando una de esas variables. Pero si la multicolinealidad no es perfecta pero elevada, por ejemplo un + 0.8 <
R2 < + 1, aunque sí
b y b ) , ya que ya no se da la indeterminación matemática, la fiabilidad
se pueden obtenerse los (
1
2
de los coeficientes de regresión parcial se ve mermada.
Coeficiente de determinación y correlación múltiple en el ajuste de un plano.
La varianza de Y es igual a la suma de la varianza explicada por
S
2 ry.12 .
58
X 1 y X 2 mas la varianza residual
ESTADÍSTICA 1
.
SY2 S yt2 .12 S ry2 12 El coeficiente de correlación múltiple puede calcularse.
R
2 y12
S yt2 .12 S y2
S y2 S ry2 .12 S y2
1
S ry2 .12 S y2
Su campo de variación es 0 R y.12 1 2
La varianza residual es la regresión de un plano con las variables expresadas en desviaciones a sus medias aritméticas.
S ry2 .12 S y2 b1.S y1 b2 .S y 2
Sustituyendo lo que vale la varianza residual en el ajuste de un plano tenemos:
R y2.12
1 ( S y2 b1 .S y1 b2 .S y 2 ) S
2 y
b1 .S y1 b2 .S y 2 S y2
Conociendo la varianza residual puede obtenerse la varianza explicada por la regresión diferenta con la
S y2
S yt2 .12 S y2 S ry2 .12 El coeficiente de correlación es la raíz cuadrada del de determinación
59
S yt2 .12
por
ESTADÍSTICA 1
2 1 S ry .12
R y .12
.
S y2
Coeficientes de determinación y correlación parcial en el ajuste de un plano
Coeficiente de determinación parcial
R
2 y .12
R
2 y .21
( R y1 R y 2 .R12 ) 2 2 (1 R12 ).(1 R y22 )
( R y 2 R y 2 .R12 ) 2 2 (1 R12 ).(1 R y21 )
Los coeficientes de correlación parcial son como siempre la raíz cuadrada de los de determinación.
Ry1 Ry 2 .R12
Ry1.2
2 1 R12 . 1 Ry22
Ry 2 Ry1.R12
Ry 2.1
2 1 R12 . 1 Ry21
Ejemplo Se han observado en 5 individuos varones sus niveles de gastos anuales habitantes que tiene la ciudad donde viven
-
y
1i
1
y los
2i
Estimar el plano de regresión de los gastos en función de los ingresos y el número de habitantes de las ciudades donde viven, comentando el problema de la multicolinealidad.
x
x
1i
1
x
y , sus ingresos x
2i
y
2
x
2
x
1i
i
2 2i
yx
1i
1
yx 1
2i
xx 1i
1
1
1
1
1
1
1
1
1
2
3
1
4
9
1
6
2
3
3
4
2
9
16
4
12
6
8
60
2i
ESTADÍSTICA 1
.
2
4
3
4
16
9
8
6
12
4
5
4
16
25
16
20
16
20
12
17
11
34
67
31
47
31
44
Medias marginales
Y
12 2.4 5
X1
17 3.4 5
X2
11 2.2 5
Varianzas marginales
1 S N 2 y
1 S N 2 1
N
2
i 1
i
N
2
y x i 1
2
Y
X1 1i
2
34 (2.4) 2 1.04 5
67 (3.4) 2 1.84 5
1 S N 2 2
N
2
i 1
2i
x
X2 2
31 (2.2) 2 1.36 5
Desviaciones típicas
S y 1.04 1.02
S1 1.84 1.36
S 21 1.36 1.17
Covarianzas N
S y1
1 N
y x
S y2
1 N
y x
i 1
1 1i
N
i 1
1 2i
X Y1 9.4 8.16 1.24 X Y2 0.92
S12
1 N
N
x i 1
1i
x2i X 1 X 2 1.32
Coeficientes de correlación lineal simple
R y1
S y1 S y .S1
1.24 0.89 1.02 1.36
Ry2
S y2 S y .S 2
61
0.77
R12
S12 0.83 S1 .S 2
ESTADÍSTICA 1
.
Estos coeficientes de correlación lineal simple solo se calculan para determinar los coeficientes de
b y b ) q son:
regresión parcial (
1
2
S y R y1 R y 2 R12 1.02 0.89 0.77 0.83 0.61 1.36 1 0.69 1 R122 1
bS 1
S y R y 2 R y1 R12 0.084 S2 1 R122
b
b
Y b1 X 1 b2 X 2 2.4 0.61 3.4 0.084 2.2 0.215
2
0
b significa que al variar x en una unidad, varia en 0.6 unid. El b de la variación y cuando la x
El coeficiente
y ti
1i
1
2
constantes los ingresos
ti
2i
permaneciendo constante x2 i , la varia en una unid. permaneciendo
x1i . Se observa una elevada multicolinealidad entre las variables
explicativas estos coeficientes son inestables con lo que su significado como propensiones marginales al gasto en relación con los ingresos o con el número de habitantes no tiene excesiva pureza.
-
Determinar la varianza explicada y la varianza residual.
S ry2 .12 S y2 b1 S y1 b2 S y 2 1.04 0.84 0.2
S yt2 .12 S y2 S ry.12 1.04 0.2 0.84
-
Obtener los coeficientes de determinación y correlación múltiples.
S yt2 .12
R y2.12
Coeficiente de correlación múltiple
R y.12 R y2.12 0.90
62
S
2 y
0.84 0.81 1.04
Coeficiente de determinación múltiple
ESTADÍSTICA 1
.
Como el coeficiente de determinación es elevado podemos decir que el grado de fiabilidad del modelo es aceptable. También ocurre con la dependencia global del gasto en relación con los ingresos y el nº de habit. que se eleva, a un 90 % si lo expresamos en porcentajes.
-
R y212
Obtener los coeficientes de determinación y correlación parcial
( R y1 R y 2 R12 ) 2 (1 R122 )(1 R y22 )
(0.89 0.77 0.83) 2 0.50 (1 0.69)(1 0.59) 2
Esto significa que al incorporar x1i la S ry 2 queda explicada en un 50 % por lo que es una variable con un fuerte sentido explicativo dentro del modelo.
R y221
( R y 2 R y1 R12 ) 2 (1 R122 )(1 R y21 )
(0.77 0.89 0.77) 2 0.10 (1 0.69)(1 0.79)
Por el contrario la incorporación de x2 i al modelo, una vez efectuada la regresión con x1i solo 2
reduce la varianza no explicada S ry 2 en un 10%. Los coeficientes de correlación parciales tienen signo positivo ya que todas las covariaciones son positivas y serán:
R y12 R y21.2 0.70 R y 2.1 R y221 0.32
3.5.2. Ajuste de un hiperplano mediante la utilización del algebra matricial En este epígrafe sólo daremos unas nociones generales en una primera aproximación al problema de la regresión lineal múltiple desde un punto de vista descriptivo. Vamos a considerar la ecuación de hiperplano con una variable endógena o dependiente (y) y k variables exógenas o explicativas (x1, x2, ..., xn):
Y=
bo
+ b1X1 + b2X2 + ... + bnXn + ε
A partir de esta expresión y teniendo en cuenta todas las observaciones muestrales de las variables, se establece un sistema de ecuaciones normales, obteniendo los productos x’x y x’y.
63
ESTADÍSTICA 1
.
En las expresiones (y=xb+e) y (y=y t +e) existen los siguientes elementos matriciales: • El vector columna de las observaciones de la endógena y de dimensiones (N x 1) ya que tiene N filas y una columna. • El vector columna de los (k + 1) coeficientes de regresi6n parcial b de orden [(k + 1) x 1] ya que tiene k + 1 filas y una columna. • El vector columna de los errores 0 residuos e de orden (N x 1) ya que tiene N filas y una columna. • La matriz de las observaciones de las k variables explicativas x de orden [N x (k + 1)] ya que tiene N filas y (k + 1) columnas. La primera columna es de unos ya que sería el factor del coeficiente constante de la ex6gena ficticia que afecta al termino independiente del hiperplano. • El vector columna de la variable end6gena estimada por el modelo 0 hiperplano de orden (N x 1) ya que es el resultado del producto xb cuyos 6rdenes son [N x (k + 1)] y [(k + 1) xI], resultando xb de orden (N x I). Estos cinco elementos matriciales intervienen en todo el proceso de la regresión en sus variadas operaciones y transformaciones como se vera a continuación. Nuestro problema consiste, como siempre, en estimar el vector de los coeficientes de regresión parcial b empleando el método de los mínimos cuadrados.Hay que minimizar la
64
ESTADĂ?STICA 1
.
suma de los cuadrados de los errores de las distintas observaciones:
65
ESTADÍSTICA 1
.
66
ESTADÍSTICA 1
.
En la expresi6n [3.51] se observa que la matriz x'x es cuadrada de orden [(k + 1) x (k + 1)] Y dividiendo por N sus elementos obtenemos los momentos de primer 0 segundo orden respecto al origen de las variables explicativas. El producto x'y origina un vector columna que dividiendo por N nos proporciona los momentos de primer orden de las end6genas respecto al origen y los de segundo orden entre esta y las explicativas. Como x'x es una matriz cuadrada podemos obtener su determinante [x'x] y si es distinto de
1
cero implica que es una matriz no singular y puede obtenerse su inversa x1 x . Premultiplicando la expresi6n [3.50] por dicha inversa y teniendo en cuenta que el producto de la inversa por la matriz dada es la unitaria, tenemos que:
x x 1
b = x1 x
1
1
[x'x] b = x1 x
x'y
1
x'y
[3.52]
La expresi6n [3.52] nos proporciona las estimaciones de los elementos del vector columna b que son los coeficientes de regresi6n parcial del hiperplano [3.42]. La interpretaci6n de estos coeficientes es la misma que se ha dado en el ajuste de un plano.
• EI problema de la multicolinealidad en el ajuste de un hiperplano Para que se pueda aplicar la expresión [3.52] no puede existir ninguna relación lineal exacta entre cualquier subconjunto de variables exógenas o explicativas. Si esto ocurre sabemos por eI algebra matricial que la matriz [x'x] será singular, 0 sea que tendrá determinante nuIo, /x'x/ = 0, lo que imposibilitara el calculo de la matriz
1
inversa x1 x y como consecuencia es imposible obtener el vector columna de los coeficientes de regresión parcial.
67
ESTADÍSTICA 1
.
68
ESTADÍSTICA 1
.
• Forma matricial del coeficiente de determinación múltiple en el ajuste de un hiperplano La bondad del ajuste la obtenemos con el cálculo del coeficiente de determinación múltiple que sigue siendo la participación de la varianza explicada por la regresión sobre la varianza total de la endógena observada. Estas varianzas se pueden obtener también empleando el cálculo matricial con los elementos del modelo. Como sabemos los valores observados del vector columna Y son iguales a los estimados por el modelo Y más el vector columna de las desviaciones 0 errores e: Y = Yt +e = xb +e
3.6. AJUSTES NO LINEALES POR MÍNIMOS CUADRADOS. A veces la nube de puntos formada por los datos observados no se corresponde a una función de carácter lineal, sino que puede tomar otras formas que representan por ejemplo polinomios de segundo o tercer grado, funciones exponenciales, hipérbolas equiláteras, etc. Los ajustes se plantean siguiendo el mismo método en estos casos (el de los mínimos cuadrados) que el usado en los casos lineales.
69
ESTADÍSTICA 1
.
Ajuste de una parábola o polinomio de segundo grado. En este caso el modelo a ajustar es: . Habría que obtener los coeficientes de la parábola que sustituyéndolos en esta expresión den lugar al modelo ajustado (el número de observaciones debería ser mayor que tres, que es el número de coeficientes a estimar). En los casos de ajuste de una hipérbola equilátera, potencial y exponencial , el método de Gauss o de mínimos cuadrados se aplica, como sigue explicado, previa transformación de las variables. Ajuste de una hipérbola equilátera La ecuación a ajustar es: . Como la endógena observada es igual a la estimada más el error, cambiando (1/x) por z, nos queda la ecuación de una recta de Y sobre Z que ya sabemos ajustar: a0 y a1 se calculan para la nueva ecuación: [a1=Covxy/varianza “z”+ ; *a0= media de “y” – a1*(media de “z”)+. Ajuste potencial. La ecuación de una función potencial es: . Esta ecuación no es lineal en los parámetros. Para poder hacer una transformación en la variable que nos permita aplicar el método de los mínimos cuadrados (como hacemos en otros casos) primero hay que transformar esta ecuación en lineal. Para ello tomamos logaritmos y los cambiamos por variables, aplicando el método cuadrático al modelo lineal simple, y sustituyendo los valores de “a” y “b” una vez resueltos en la expresión, donde a0=antilog a ; a1=b. Ajuste exponencial. La ecuación de la función exponencial es: . Se transforma en lineal (usando los logaritmos otra vez) y se opera con ellos. A la hora de la sustitución: a0=antilog a; a1=antilog b. Resolución de ejercicios. Cuando se pida ajustar datos de dos variables a alguno de los tipos anteriores, o a todos, hay que construir una tabla en la que aparezcan los nuevos valores de z= (1/x) para ajustar una hipérbola, y de z=logxi ; u=logyi para ajustar funciones potenciales y exponenciales.
3.7. ESTUDIO DE LA ASOCIACIÓN ENTRE VARIABLES CUALITATIVAS. Se puede estudiar la independencia o dependencia estadística de dos variables cualitativas. A través de una tabla de contingencia, como se vio anteriormente, la independencia estadística se dará entre dos atributos solo si: . Si esta expresión no se cumple se dirá que entre los dos atributos existe algún grado de dependencia estadística o asociación. Si de esta expresión despejamos la frecuencia absoluta conjunta *n’ij=ni*nj/N] este valor sería la frecuencia teórica que existiría si los dos atributos fuesen independientes. n ij es la frecuencia conjunta observada. La diferencia al cuadrado de estas dos variables indica el grado de asociación entre los dos atributos (Grado de contingencia).
es un primer coeficiente de asociación. Cuando existe independencia entre las dos variables vale 0
70
ESTADÍSTICA 1
.
(n’ij = nij). Cuando existe cierto grado de dependencia el resultado tomará valores positivos. Su valor dependerá de las magnitudes de frecuencias absolutas que lo componen. Este inconveniente se elimina con el Coeficiente de Contingencia de Pearson que establece un resultado que varía de cero a uno. . Cuando es 0 existe independencia. A medida que se acerca a 1 el grado de asociación es mayor. Sólo alcanzará la unidad cuando el cuadrado de contingencia sea muy grande, ya que el límite de C cuando el grado de contingencia tiende a infinito es 1.
71
ESTADÍSTICA 1
.
CAPÍTULO 4 NÚMEROS ÍNDICES 4.1. INTRODUCCION: Un número índice puede definirse como una medida estadística que nos proporciona la variación relativa de una magnitud simple o compleja a lo largo del tiempo o del espacio.
4.2. CLASIFICACIÓN DE LOS NÚMEROS ÍNDICES: - Números índices simples: surgen cuando se estudia la evolución a lo largo del tiempo de una magnitud que tiene un solo componente: Iit =
Xit Xio
X 100
Siendo: Iit = Número índice en el período t de la magnitud i Xit = Valor de la magnitud en el período t Xio = Valor de la magnitud en el período base
Los números índices simples se emplean con gran difusión en el mundo de la empresa a la hora de estudiar las producciones y ventas de los distintos artículos que fabrican y lanzan al mercado. -
Números índices complejos sin ponderar: surgen cuando se estudia la evolución de una magnitud que tiene más de un componente y a todos se les asigna la misma importancia o peso relativo. Supongamos que la magnitud compleja que nos interesa tiene N componentes (1, 2, …, …, N). En primer lugar se elaborarían los índices simples de cada componente I1t, I2t, …, Iit,…, siendo INt; siendo el índice complejo sin ponderar la media aritmética simple de todos ellos:
72
ESTADÍSTICA 1
-
.
Números índices complejos ponderados: surgen cuando a los componentes de la magnitud compleja que se está estudiando se le asigna a cada uno un determinado coeficiente de ponderación Wi. Este tipo de números índices son los que realmente se emplean en el análisis de la evolución de los fenómenos complejos de naturaleza económica: índice de precios de consumo (IPC), índice de producción industrial (IPI), etc.
-
4.3. PROPIEDADES DE LOS NÚMEROS ÍNDICES:
1ª Existencia: Todo número índice debe existir y se puede calcular para cualquier valor de la variable, tomando un valor real y distinto de cero. 2ª Identidad: Si se hacen coincidir los períodos base y de comparación el índice vale la unidad si se expresa en tantos por uno o cien si es en tantos por cien. 3ª Inversión: El producto de dos índices en los que se han invertido los períodos base y de comparación es igual a la unidad. 4ª Circular: es una generalización de la inversión 5ª Proporcionalidad: Si la magnitud vaía en proporción 1 + K, y fijado el período de comparación, el número índice también varía en la misma proporción.
Estas propiedades, que se cumplen en general para los números índices simples, no suelen cumplirse todas en el caso de los índices complejos o de varias componentes.
73
ESTADÍSTICA 1
.
4.4. ÍNDICES DE PRECIOS: Los números índices de precios se clasificarán en:
Simples (se estudia el precio de un solo producto o servicio) Números índices de precios
Sin ponderar
Sauerbeck Bradstreet-Dutot
Complejos (se refiere a un precio con varios componentes)
Laspeyres Ponderados
Paasche Edgeworth Fisher
4.4.1. Índices simples de precios: Se designa la magnitud precio del único componente del índice simple i por pi. Luego la expresión del índice simple de un precio para el período t será:
Siendo: Pit = Número índice de precios del componente i en el período t. Pit = Precio del componente i en período t. Pio = Precio del compnente i en el período base.
74
ESTADÍSTICA 1
.
4.4.2. Índices complejos de precios sin ponderar: El índice complejo se puede definir empleando dos criterios: el de la media aritmética simple o de Sauerbeck o el de la media agregativa simple o de BradstreetDutot. Tienen el inconveniente de que a todos los componentes se les da el mismo peso o ponderación cuando en los fenómenos económicos esto no ocurre. a) Índice media aritmética de índices simples o de Sauerbeck
b) Índice media agregativa simple o de Bradstreet-Dutot
El concepto de media agregativa se emplea sólo en la elaboración de números índices. En el índice de Sauerbeck se obtiene una media aritmética de índices de precios simples relativos ya que los índices simples son cocientes de precios de los períodos de comparación con el base.
4.6.- PROPIEDADES CANTIDADES.
DE LOS ÍNDICES COMPLEJOS PONDERADOS DE PRECIOS Y
En el cuadro siguiente se resume el cumplimiento de las propiedades de los diferentes índices:
Propiedades
Existencia
Identidad
Inversión
Circular
Proporcio -nalidad
Sanerbeek
Sí
Sí
No
No
Sí
Bradstreet-Dutot
Sí
Sí
Sí
Sí
Sí
Laspeyres
Sí
Sí
No
No
Sí
Paasche
Sí
Sí
No
No
Sí *
Edgeworth
Sí
Sí
Sí
No
Sí *
Fisher
Sí
Sí
Sí
No
Sí *
Índices
75
ESTADÍSTICA 1
.
1. Existencia: Todo número índice debe existir, ha de tener un valor finito distinto de cero. 2. Identidad: Si se hacen coincidir el período base y el actual, el número índice debe valer 1. 3. Inversión: Al permutar los períodos base y actual, el nuevo índice debe ser el inverso del inicial. 4. Circular: El índice entre dos períodos debe coincidir con el producto de índices de períodos intermedios. 5. Proporcionalidad: Si en el período actual todas las magnitudes sufren una variación proporcional, el número índice debe quedar afectado por esa variación. (*En los índices de Paasche, Edgeworth y Fisher se verifica pero con cierta limitación en el campo económico, para que se verifique esta propiedad en estos tres índices será necesario que las cantidades no varíen frente a los cambios de precios).
4.7.- ÍNDICES EN CADENA. Se introducen para evitar el desfase que se genera estudiando los índices a largo plazo. Se obtienen a partir de una generalización de enlaces o empalmes de índices para los cuales la base de cada índice es siempre el período de comparación del índice precedente. Ito = I1o·I21· ··· ·Itt-1
4.8.- CAMBIO DE BASE EN UNA MISMA SERIE DE NÚMEROS ÍNDICES. En una serie de número índices, puede interesarnos cambiar la base o si está muy alejada en el tiempo del período de comparación. Apoyándonos en las propiedades de inversión y circular, nos permiten obtener el coeficiente técnico que transforma la serie dada en la nueva con un período base distinto.
Se denomina coeficiente de transformación o coeficiente de enlace técnico de la serie dada en base 0 a ala nueva serie en base t’, al cociente: Iot’
Iot =
It’o
100 =
It’o
Bastará con multiplicar cada uno de los elementos de la serie original, por el cociente de transformación a la nueva base t’, es decir, por Iot’
76
ESTADÍSTICA 1
.
4.9. Renovación y enlace de series de números índices con distintas bases. Renovación de componentes y de coeficientes de ponderación en los números índices complejos. Los números índice se usan en el mundo de la economía parea representar fenómenos complejos (por ejemplo evolución IPC, índices bursátiles…). Para su elaboración es preciso tomar una serie de elecciones: componentes que formarán parte del índice con el fin de que este sea representativo de todo el conjunto, periodo base, y tipo de índice que se usará. El índice Laspeyres es el que más frecuentemente se usa, teniendo en cuenta su coste, ya que sus coeficientes de ponderación (muy costosos de determinar) están referidos al periodo base. A medida que nos alejamos de ese periodo base que se ha determinado en un principio hay que revisar de forma periódica los coeficientes y componentes, ya que las circunstancias que describe el índice pueden evolucionar, haciendo que este deje de ser representativo. Enlace o empalme de series de números índices con distinta base. Si tenemos dos índices distintos, con bases también distintas, y queremos estudiar el fenómeno comparando su evolución con una única base, tenemos que enlazarlos o empalmarlos. Para ello, aplicamos el coeficiente de enlace o empalme a la base que es más antigua (comparada con el momento base en que se quiere hacer el estudio). La definición de este coeficiente de enlace es la misma que se usa para cambiar la base dentro de una misma serie, solo que en este caso se aplica a la serie con base más antigua. Si la serie con base más antigua coincide
con el periodo de la sere más moderna, el coeficiente de enlace será:
4.10. Repercusión y participación de las variaciones de un índice. Dado un índice tipo Laspeyres, se estudiará que efecto y participación tiene la variación de uno o varios productos en el índice.
El índice Laspeyres es de la forma índice general expresados en tantos por uno.
t
, donde wi son las ponderaciones de cada índice Ii,o dentro del
En el ejemplo del índice de precios, la variación de varias magnitudes (precios), producirá cambios en el índice.
La variación del índice general será:
.
La repercusión Ri producida por la variación del componente en el índice general será:
77
.
ESTADÍSTICA 1
.
La suma de todas las repercusiones individuales
coincidirá con la variación total
del índice general: La repercusión en porcentaje de un componente en el índice general será:
. Si sumamos las variaciones porcentuales de todos los componentes nos resultará la variación porcentual del índice general La participación de cada componente, presentado en términos porcentuales en el índice es:
. Es evidente que la suma de todos Pi = 100
4.11. Indices de valor y deflactación de series económicas. Índices de valor. Para agregar a un índice de precios los bienes y servicios (que son heterogéneos), hay que homogeneizarlos por su valor. Así, los bienes se transforman para su estudio en valores económicos, sumables o agregables. Los índices nos permiten estudiar cómo evoluciona un conjunto de bienes, expresados en forma nominal o en
pesetas corrientes. Este valor nominal (relativo al del año de comparación es: , El valor en el periodo base será Vo y la fórmula es igual. El índice complejo de valor para N componentes será:
. Para estudiar la evolución de esta expresión hay que tener en cuenta la necesidad de valorar los cambios de precios y cantidades a lo largo del tiempo de forma conjunta, y ver qué influencia tienen en el índice total. Para ver la evolución a precios constantes del índice (sin que se produzcan variaciones en los precios de los componentes) hay que deflactar las series de valores. Deflactación de series económicas.
78
ESTADÍSTICA 1
.
Para comparar la evolución de precios de un conjunto de bienes hay que aislar dicha evolución de la inflación o deflación, para tener en cuenta solamente las subidas o bajadas de precios que sean debidas a una mejora de la calidad. Por eso, hay que pasar los precios a valores constantes, teniendo en cuenta un periodo base. Deflactar, por tanto, una serie es dividirla por el índice de precios que se considere más adecuado (llamado deflactor de la serie). Los más utilizados son los de Laspeyres y Paasche. El índice Laspeyres aunque se usa, no es un verdadero deflactor. Sin embargo, el índice Paarsche sí que lo es ya que al calcularlo: (serie de valores monetarios / Indice de precios = Serie de valores reales) nos da como resultado los precios constantes de un conjunto de mercancías en el año base. Según qué serie económica habrá que usar un índice u otro.
4.12. INDICE DE PRECIOS DE CONSUMO (IPC) El Índice de Precios de Consumo es el indicador general más conocido por la influencia y efecto que produce en el mundo económico, se elabora y se publica mensualmente y su objetivo es medir la evolución del nivel de precios de los bienes y servicios consumidos por todos los hogares residentes en España. Todo IPC debe de tener dos cualidades: El nivel de representatividad del IPC vendrá determinado por el grado de adaptación de este índice a la realidad económica del momento. Y la segunda cualidad se refiere a la comparabilidad temporal, lo cual quiere decir que todos los elementos que definen el IPC deben permanecer estables a lo largo del tiempo excepto, los precios que se recogen mensualmente.
4.12.1 CARACTERÍSTICAS PRINCIPALES: PERÍODO BASE: a) Es aquel cuyos precios sirven de referencia para medir la evolución de los mismos durante el período de vigencia del sistema. Además la media aritmética de los Índices mensuales para este año base se hace igual a 100. PERIODO DE REFERENCIA DE LAS PONDERACIONES: b) Es el período durante el cual se desarrolla la ECPF (Encuesta Continua de Presupuestos Familiares) que nos proporciona la información básica, sobre los gastos de las familias en bienes y servicios de consumo, para la obtención de ponderaciones. CAMPO DE CONSUMO, CESTA DE LA COMPRA Y PONDERACIONES:
79
ESTADÍSTICA 1
.
c) El campo de consumo del IPC está constituido por todos los bienes y servicios que los hogares destinan al consumo, quedando excluidos los gastos en bienes de inversión, los autoconsumos, los autosuministros y los alquileres imputados. La cesta de la compra es como el conjunto de bienes y servicios para los que se recogen los precios mensualmente, y cuya evolución representa la de todos los precios de consumo de la economía. El número total de artículos que componen esta nueva cesta de la compra es de 484 agrupados en 12 grupos, 37 subgrupos, 80 clases y 117 subclases. Se mantienen las 57 rúbricas existentes y se amplía el número de grupos especiales hasta 27. La muestra para la recogida de la información necesaria se ha diseñado teniendo en cuenta: -
Selección de municipios. Selección de zonas comerciales y establecimientos. Determinación del número de observaciones.
Gasto realiazado en las parcelas representadas por el artículo i Wi =
--------------------------------------------------------------------------------------Gasto total
La ponderaciones permanecen fijan a lo largo del periodo de vigencia del sistema de índice de precios de consumo. Un mismo artículo puede tener ponderaciones diferentes en las distintas agrupaciones geográfica-provincias, comunidades autónomas y total Nacional, según el gasto que refleja la ECPF en cado uno de estos conjuntos.
4.12.2.- Método de cálculo. Se utiliza la fórmula del “índice de Laspeyres encadenado”, precios de artículos del período corriente a los precios del año inmediatamente anterior, con periodicidad inferior a dos años se actualizarán las ponderaciones de las parcelas de información por la ECPF (Encuesta Continua de Presupuestos Familiares), que permite que el IPC (Índice de precios de consumo) se adapte a los cambios del mercado y de los hábitos de consumo en un plazo muy breve de tiempo.
80
ESTADÍSTICA 1
.
4.12.3.- Enlace de series. Coeficientes de enlace. Cuando se cambia de año de referencia (o base) en un sistema de índices de precios de consumo esto lleva consigo una ruptura en la continuidad de las series. El Instituto Nacional de Estadística introduce el coeficiente de enlace legal, de tal manera que nos permite transformar los índices de una base en índices en otra base. Los coeficientes de enlace se obtienen de forma independiente para cada una de las series de índices que tienen continuidad en la nueva base, implica que cualquier índice agregado de una serie enlazada no es resultado de la media ponderada de los índices elementales que lo componen.
a) Inclusión de precios rebajados y ofertas. Con el nuevo sistema de IPC-Base 2001 los cambios más importantes que produce es la inclusión de los precios rebajados de los artículos, esto producirá una ruptura en la serie del IPC, no pudiendo calcularse variaciones de índices de precios entre dos períodos combinando datos del
sistema
IPC-92
e
IPC-2001.
El
INE
facilita
los
datos
correspondientes a las tasas de variación.
b) Periodicidad de cambio base. Se dispone de datos anuales sobre ponderaciones obtenidas de la Encuesta Continua de Presupuestos Familiares, se puede realizar la actualización continúa de ponderaciones, el INE realizará una revisión anual de las ponderaciones y una revisión estructural cada cinco años. c) Actualización de rentas entre dos meses ambos anteriores a enero de 2002 o ambos posteriores a enero de 2002. Para actualizar rentas utilizando el IPC, es:
Renta actualizada = Renta inicial x IPC mes final / IPC mes inicial.
81
ESTADÍSTICA 1
.
d) Actualización de rentas desde meses anteriores a enero de 2002 a enero de 2002 y meses posteriores. Para ello hay que utilizar el índice de la Ley de Arrendamientos Urbanos (Índice LAU), que se obtiene multiplicando el IPC general del mes por el coeficiente LAU de ese mismo mes.
Renta actualizada = Renta inicial x Índice LAU mes final / IPC mes inicial
El IPC es el indicador de la Inflación o pérdida del poder adquisitivo de las rentas disponibles de las familias ya que sólo incluye bienes y servicios destinados al consumo final de los hogares. En el IPC no se contempla las subidas de precios de los bienes y servicios de naturaleza intermedia adquiridos por los sectores en el proceso productivo. La inflación subyacente es el IPC sin los alimentos no elaborados ni los productos energéticos.
4.13.- ÍNDICES DE PRECIOS DE CONSUMO AMORNIZADO (IPCA). Es un indicador estadístico cuyo objetivo es proporcionar una medida común de la inflación que permita realizar comparaciones internacionales. Para llegar a este índice, y a lo largo de un período transitorio, año 1996, se realizaron las modificaciones y ajustes necesarios sobre los IPC de cada país miembro de UE hasta conseguir un índice con unas características esenciales comunes a todos los países.
El IPCA de cada país cubre las parcelas que superan el uno por mil del gasto total de gasto de la cesta de la compra nacional, siendo excluidos del IPCA los servicios médicos y la enseñanza reglada.
82
ESTADÍSTICA 1
.
4.14.- OTROS ÍNDICES O INDICADORES DE COYUNTURA ELABORADOS. Además del IPC, que sin duda es el indicador más relevante ya que la subida generalizada de los precios al consumo tiene una enorme repercusión en los ámbitos socioeconómicos, existen otra serie de índices que nos completan el panorama coyuntural de nuestra economía.
a) Índice de producción Industrial (IPI). Es un índice de naturaleza cuántica que mide la evolución mensual de la actividad productiva de las ramas industriales, excluida la construcción. Mide la evolución conjunta de la cantidad, eliminando la influencia de los precios. Para su obtención se elabora una encuesta continua de periodicidad mensual dirigida a más de 9000 establecimientos. El organismo responsable de su elaboración es el INE, en donde puede encontrarse la metodología completa.
b) Índice de precios Industriales (IPRI). Completa con el anterior la panorámica coyuntural de la industria en nuestro país. Mide la evolución mensual de los precios de los productos industriales, fabricados y vendidos en el mercado interior, en el primer paso de su comercialización, es decir, de los precios de venta a salida de fábrica obtenidos por los establecimientos industriales en las transacciones que éstos efectúan, excluyendo los gastos de transporte, comercialización e IVA facturado. Para su obtención se realiza una encuesta continua de periodicidad mensual, que investiga todos los meses más de 6000 establecimientos industriales.
c) Índices de Comercio al Por Menor (ICM) El objetivo principal de estos Índices de Comercio al por Menor es conocer las características fundamentales de las empresas dedicadas al comercio al por menor en España, permitiendo medir a corto plazo, la evolución de la actividad en el sector.
83
ESTADÍSTICA 1
.
d) Índice de Precios Hoteleros (IPH) Es una medida de la evolución mensual de los precios que los empresarios hoteleros aplican a sus clientes. Para su obtención se utiliza la Encuesta de Ocupación en Alojamientos Turísticos: Establecimientos Hoteleros. Se investigan mensualmente alrededor de 8.500 establecimientos hoteleros.
e) Índices de cotización bursátil. Miden las fluctuaciones de las cotizaciones de las acciones que se registran diariamente en los diferentes mercados bursátiles, haciendo referencia a la cotización de los valores en el momento de cierre de la sesión. A partir de las cotizaciones de cada valor se elaboran índices de grupos (bancos, alimentación, construcción). Estos índices, convenientemente ponderados según el volumen, y utilizando fórmulas tipo Laspeyres nos llevan a obtener el índice general de la bolsa o un índice tipo BIES-35.
84
ESTADÍSTICA 1
.
CAPÍTULO 5 ESTUDIO CLÁSICO O DESCRIPTIVO DE LAS SERIES TEMPORALES 5.1.- INTRODUCCIÓN. Los fenómenos económicos (el consumo familiar, la inflación, los tipos de interés, el paro, etc.) a lo largo de la variable tiempo. Así como con los números índices se estudia la evolución de una magnitud en una serie de períodos de tiempo, con el estudio descriptivo de las series tratamos de hacer predicciones del fenómeno en estudio teniendo en cuenta sus características históricas o del pasado. Lo denominamos estudio clásico o descriptivo de las series temporales ya que se ha venido empleando en exclusividad desde la segunda mitad del siglo XIX hasta 1970 en que aparece un nuevo enfoque debido a los estadísticos Box y Jenkins con sus conocidos modelos univariantes de series temporales.
5.2.- CONCEPTO DE SERIE TEMPORAL Y DEFINICIÓN DE SUS COMPONENTES. Se define como serie temporal a un conjunto de datos, correspondientes a un fenómeno económico, ordenados en el tiempo. Así serán series temporales las ventas de nuestra empresa en cada uno de los últimos diez años, los costes financieros, la renta disponible de nuestros clientes potenciales, etc. Es fundamental que los datos estén ordenados en el tiempo de forma que cada observación deberá estar asociada a un determinado período. Luego en esencia una serie de tiempo es una distribución de frecuencias bidimensional (yt, t) donde la variable endógena Yt es la magnitud en estudio y la exógena o independiente es el tiempo t. Pero sólo existe una sola variable Yt que constituye lo que se conoce como modelo univariante de serie temporal que se autoexplica por su propio pasado, no existiendo ninguna variable explicativa o exógena que nos permita establecer una relación causa-efecto como se estudió en la regresión y correlación. Se estudia el pasado histórico de Yt de forma descriptiva y bajo el supuesto de que su estructura va a permanecer constante se hacen predicciones para el futuro.
En la representación gráfica de las series temporales se utilizan los ejes cartesianos de la misma forma que se vio en la regresión bidimensional. En el eje de abscisas se representa el tiempo t y
85
ESTADÍSTICA 1
.
los valores de la magnitud observada Yt en ordenadas con lo que se obtiene una serie de puntos (t,Yt) que, al unirlos nos dan un impacto gráfico de la serie del que se puede sacar unas primeras conclusiones de la evolución histórica de la magnitud.
Tendencia (T): Es una componente de la serie que refleja su evolución a largo plazo. Este plazo será distinto según sea la naturaleza de la serie, pero cuanto más períodos mejor será el análisis. Esta componente, en el conjunto de toda serie, puede ser de naturaleza estacionaria o constante, de naturaleza lineal, de naturaleza parabólica, de naturaleza exponencial, y otras posibles.
Las variaciones cíclicas (C): Es una componente de la serie que recoge las oscilaciones periódicas de amplitud superior a un año. Estas oscilaciones no son regulares y se presentan en los fenómenos económicos cuando se dan de forma alternativa etapas de prosperidad o de depresión.
Las variaciones estaciónales (E): Es una componente de la serie que recoge las oscilaciones que se producen en períodos de repetición iguales o inferiores a un año. Su nombre proviene precisamente de las estaciones climatológicas: invierno, primavera, verano y otoño. El origen de las variaciones estaciónales puede estar en factores físiconaturales como son las climatológicas o en factores culturales y de tradición: fiestas navideñas, vacaciones, horarios comerciales, etc.
Las variaciones accidentales (A): Es una componente de la serie temporal que recoge las fluctuaciones erráticas que se dan por la ocurrencia de fenómenos imprevisibles. También reciben el nombre de variaciones irregulares, residuales o erráticas. Además de los fenómenos imprevisibles o extraordinarios también existen pequeñas variaciones de origen aleatorio cuyas causas pueden ser múltiples.
Los valores observados de cualquier serie temporal son el resultado de la adición de las cuatro componentes:
Yt = T + C + E + A
86
ESTADÍSTICA 1
.
Los valores observados de cualquier serie temporal son el resultado de la multiplicación de las cuatro componentes:
Yt = T x C x E x A Los métodos que se utilizan para aislar las componentes de las series temporales están basados en algunos de los anteriores esquemas aunque no puede establecerse una generalización del problema ya que no en todas las series temporales aparecen todas las componentes. Si la serie tiene periodicidad anual está exenta de las variaciones estaciónales. Para resolver el problema de cuál debe ser el esquema o hipótesis a utilizar en cada caso, si aditiva o multiplicativa, habrá que efectuar un análisis previo de la serie por métodos gráficos o analíticos. Estos procedimientos se basan en el comportamiento de la componente estacional. Si por ejemplo se realiza una representación gráfica de la serie y se observa que las oscilaciones aumentan a lo largo de los períodos con una tendencia creciente, puede afirmarse que está actuando el esquema multiplicativo. Si las oscilaciones son regulares, no expansivas a lo largo de la serie, puede concluirse que está actuando un esquema aditivo.
5.3. DETERMINACIÓN DE LA TENDENCIA: La tendencia es una componente fundamental de la serie. Su determinación debe efectuarse cuando se disponga de una larga serie de observaciones (12 o 15 años), ya que en otro caso podrían obtener conclusiones erróneas. Refleja la evolución a largo plazo de la serie. Métodos más sencillos para tratar de aislar la tendencia: a) Método gráfico: - Se efectúa la representación gráfica de la serie observada yt. - Se unen mediante segmentos rectilíneos todos los puntos altos de la serie obteniéndose la línea poligonal de cimas. - Idem con los puntos bajos obteniéndose la línea poligonal de fondos. - Se trazan perpendiculares al eje de abscisas por los puntos de cima y de fondos. - La tendencia viene dada por la línea amortiguada que une los puntos medios de los segmentos, es decir la línea de tendencia tiene por ordenadas la media aritmética de las ordenadas de las dos líneas anteriores. b) Método de las medias móviles: Consiste en sustituir una serie temporal observada por una amortiguada o suavizada obtenida por el cálculo reiterado de valores medios y que nos representa la tendencia. Su aplicación consiste en: - Partimos de la serie temporal observada yt. - Se obtienen sucesivas medias aritméticas para cada yt con un nº de observaciones anteriores y posteriores que se ha fijado se antemano. Si el nº de observaciones utilizado es impar la media y t obtenida coincide (está centrada) con el período t. Si es par la y t no coincide con el período t (está
87
ESTADÍSTICA 1
.
descentrada) y hay que volver a calcular una media aritmética yt utilizando los yt con lo que se obtiene una serie de medidas móviles centradas con los períodos de tiempo. - La serie formada por yt según sea impar o par el número de observaciones utilizadas, nos indica la línea amortiguada de la tendencia. c) Método analítico de los números cuadrados: Expresa la tendencia a través de una función matemática que relaciona la magnitud que se está estudiando con el tiempo t que actúa como variable independiente. El ajuste se realiza por el método de mínimos cuadrados. En primer lugar conviene representar gráficamente la serie temporal observada con objeto de decidir qué tipo de función es la más adecuada: de tipo lineal, parabólico, etc.
5.4.- DETERMINACIÓN DE LAS VARIABLES ESTACIONALES
Las variables estacionales son oscilaciones de la magnitud en estudio en períodos de repetición de uno año (cuatrimestres, trimestres o meses) o inferiores.
Para analizar la evolución real de los fenómenos económicos hay que liminar la componente estacional ya que sus fluctuaciones pueden distorsionarla. A este proceso se le denomina desestacionalización de la serie observada.
Antes de determinar las variaciones estacionales hay que asegurarse de su existencia haciendo una representación gráfica de los valores observados para ver la regularidad en las oscilaciones. La estacionalidad no tiene regularidad en determinadas ocasiones variando de posición y amplitud en las oscilaciones de un período de repetición a otro.
Asimismo hay que determinar si la que actúa es la hipótesis aditiva, multiplicativa o mixta.
En los dos métodos que se explican a continuación para determinar las variaciones estacionales se establecen las hipótesis de que la estacionalidad es regular o estable en el tiempo actuando el esquema multiplicativo en el método de las medias móviles y el aditivo cuando se realiza un ajuste mínimo cuadrático para determinar los componentes a largo plazo.
a) Método de la razón a la media móvil para determinar la componente estacional en una serie temporal El fin de este método es aislar la componente estacional a base de eliminar sucesivamente las demás componentes. Se hace de la siguiente forma:
88
ESTADÍSTICA 1
-
.
Se determina la tendencia por el método de medias móviles centradas en los períodos y t , explicado en el apartado precedente.
-
Se divide (hipótesis multiplicativa) la serie observada y t por su correspondiente media móvil centrada. De esta forma, se eliminan, de forma conjunta, las componentes del largo plazo (tendencia y ciclo), TxC .
yt TxCxExA ExA TxC TxC
-
Observamos que, tras eliminar la componente mixta tendencia-ciclo de la expresión anterior, sigue quedando la componente accidental A. Para eliminar dicha componente de la serie
yu
se procede de la siguiente manera: se calculan las medias aritméticas a nivel de cada
yt estación (la media de todos los cuatrimestres, trimestres, meses, etc). Si las observaciones son trimestrales tendremos 4 medias (M1, M2, M3, M4), si son cuatrimestrales, 3 medias, 12 medias si son mensuales, etc. Estas medias nos representarán de forma aislada la importancia de la componente estacional. -
Para obtener los índices de variación estacional se calcula la media aritmética anual MA de las medias estacionales M1, M2, M3, …, que será la base de los índices de variación estacional expresados en tantos por 100, esto es:
I1
M1 M x100 , I 2 2 x100 , etc MA MA
-
Existirá el mismo número de índices que de estaciones o medias estacionales que tengan las observaciones, indicándonos la importancia de la variación estacional al pasar de un período a otro.
-
Una vez obtenidos los índices de variación estacional, puede desestacionalizarse la serie observada dividiendo cada valor de la estación por su índice correspondiente expresado en tantos por uno.
b) Método de la tendencia por ajuste mínimo cuadrático para determinar la componente estacional en una serie temporal bajo la hipótesis aditiva. De igual manera que en el método de la razón a la media móvil, el fin de este método es aislar la componente estacional a base de eliminar sucesivamente las demás componentes.
89
ESTADÍSTICA 1
.
La diferencia con el método anterior es que las componentes a largo plazo (tendencia – ciclo) se obtienen mediante un ajuste por mínimos cuadrados de las medias aritméticas anuales y t y se actúa bajo la hipótesis aditiva. Para ello, sigue los siguientes pasos:
-
Se calculan las medias anuales de los datos observados yt : y 1 , y 2 , y 3 ,... Para observaciones trimestrales estas medias se obtienen con 4 datos, si son mensuales con doce, etc. Esto en el caso de que el periodo de repetición sea el año. En otro caso, las medias se obtendrían con sus componentes.
-
y t a bt , según método estudiado anteriormente, y que nos representa la tendencia. El coeficiente angular b de la recta mide el Se ajusta una recta por mínimos cuadrados
incremento medio anual de la tendencia que influirá de distinta forma al pasar de una estación a otra. -
Con los datos observados se calculan las medias estacionales (M1, M2, M3, ...) con objeto de eliminar la componente accidental. Estas medias siguen incluyendo los componentes a largo plazo (tendencia y ciclo) por lo que deben someterse a una corrección.
-
Empleando el incremento medio anual dado por el coeficiente, se obtienen las medias estacionales corregidas de las componentes a largo plazo (M1’, M2’, M3’, ...) bajo el esquema aditivo (restando): M1’ = M1. La primera estación no está influida por la tendencia. M2’ = M2 -
1 b : Restamos, a la media sin corregir, la parte proporcional del nº estaciones
incremento anual de la tendencia. M3’ = M3 -
2b : Han pasado dos estaciones desde la primera. Por tanto, se nº estaciones
restan dos proporciones del incremento anual de la tendencia.
En resumen, para la r-ésima estación la media estacional corregida de la tendencia interestacional será M r M r '
-
(r 1) b . nº estaciones
Para obtener los índices de variación estacional se utiliza la misma sistemática que en el método de la razón a la media móvil:
I1
M 1' M 2' x 100 I x100 , etc , 2 M 'A M 'A
90
ESTADÍSTICA 1
-
.
Al igual que en el método anterior, una vez obtenidos los índices de variación estacional, puede desestacionalizarse la serie observada dividiendo cada valor de la estación por su índice correspondiente expresado en tantos por uno.
5.5.- DETERMINACIÓN DE LAS VARIABLES CÍCLICAS Las variables cíclicas son oscilaciones periódicas de larga duración. Estas oscilaciones no suelen ser regulares como las estacionales planteando su determinación dificultades de forma que se suelen tratar conjuntamente con la tendencia llamando componente extraestacional al efecto de TxC (en el marco multiplicativo) o T+C (en el aditivo).
No obstante, se puede tratar de aislar el ciclo bajo la hipótesis multiplicativa dejándolo como residuo eliminando la tendencia y la variación estacional siguiendo los siguientes pasos:
-
Estimar la tendencia. Calcular los índices de variación estacional. Desestacionalizar la serie observada. Eliminar la tendencia dividiendo el valor desestacionalizado por la serie de tendencia.
yt TxExCxA CxA TxE TxE -
Para eliminar la componente accidental A y determinar el período de los ciclos, habría que realizar un análisis armónico que no estudiamos en este nivel.
91
ESTADÍSTICA 1
.
CAPÍTULO 6 FENÓMENOS ALEATORIOS Y SUCESOS 1.
Introducción
Dentro de la Estadística podemos considerar dos grandes ramas perfectamente diferenciadas, no sólo por los objetivos que se persiguen, sino también por los métodos que se utilizan: Estadística Descriptiva o Deductiva
Inferencia Estadística o Estadística Inductiva:
2.
Se utiliza cuando la observación de la población no es exhaustiva, sino que sólo observaremos un subconjunto o muestra de la misma, de tal manera que los resultados o conclusiones obtenidos de la muestra los generalizamos a la población La muestra se toma para obtener un conocimiento o información de la población pero nunca nos proporcionará una información exacta sino que incluirá un cierto nivel de incertidumbre Lo que sí será posible, a partir de la muestra, hacer afirmaciones sobre la naturaleza de esa incertidumbre, que vendrá expresada en el lenguaje de Probabilidad, siendo por ello un concepto necesario y muy importante en la inferencia estadística, ya que nos permitirá pasar de las afirmaciones hechas con certeza a partir de la muestra a pronosticar en términos de probabilidad situaciones en la población. Según V. Barnett (1982) << la Estadística es la ciencia que estudia cómo debe emplearse la información y como dar una guía de acción en situaciones prácticas que envuelven incertidumbre >> que equivale a lo que nosotros llamaremos experimentos aleatorios.
Fenómenos Aleatorios
Un experimento es cualquier situación u operación en la cual se pueden presentar uno o varios resultados de un conjunto bien definido de posibles resultados.
92
ESTADÍSTICA 1
.
Los experimentos pueden ser de dos tipos según si, al repetirlo bajo idénticas condiciones:
Determinístico
Se obtienen siempre los mismos resultados. Ej: medir con la misma regla e idénticas condiciones la longitud de una barra.
Aleatorio
No
se
obtienen
siempre
los
mismos
resultados. Ej:
el
lanzamiento
de
una
moneda
observando la sucesión de caras y cruces que se presentan
Características de un experimento aleatorio:
1º. El experimento se puede repetir indefinidamente bajo idénticas condiciones. 2º. Cualquier modificación a las condiciones iniciales de la repetición puede modificar el resultado final del experimento. 3º. Se puede determinar el conjunto de posibles resultados del experimento, pero no se puede predecir previamente un resultado particular 4º. Si el experimento se repite un número grande de veces, entonces aparece algún modelo de regularidad estadística en los resultados obtenidos
3.
Espacio muestral
Se denomina resultado básico o elemental, comportamiento individual o punto muestral a cada uno de los posibles resultados de un experimento aleatorio. Los resultados básicos elementales serán definidos de forma que no puedan ocurrir dos simultáneamente, pero sí ocurrirá uno necesariamente.
Se denomina conjunto universal, espacio muestral o espacio de comportamiento (E) al
93
ESTADÍSTICA 1
.
conjunto de todos los resultados elementales del experimento aleatorio.
Los espacios maestrales asociados a un experimento aleatorio pueden ser de tres clases:
Espacio muestral finito
Espacio muestral infinito numerable
Cuando tiene un número finito de elementos.
Cuando tiene un número infinito numerable de elementos es decir, se puede establecer una aplicación biyectiva entre los elementos del espacio muestral (E) y la sucesión de números naturales (N).
Ejemplo:
Ejemplo:
Experimento aleatorio consistente en lanzar un dado al
Experimento aleatorio consistente en lanzar un dado
aire. El espacio muestral es E = {1,2,3,4,5,6}
hasta que sea obtenido el número 1
E = {{1}, {2,1},{3,1} ... {2,2,1},{2,3,1},...}
También se suele llamar espacio muestral discreto indistintamente a los casos finito e infinito numerable.
Espacio Muestral Continuo
Si el espacio muestral contiene un número infinito no numerable de elementos, es decir, si no se puede establecer una correspondencia biunívoca entre E y N.
Ejemplo: Experimento aleatorio consistente en tirar una bola perfecta sobre un suelo perfecto y observar la posición que ocupará esa bola sobre la superficie. E = {Toda la superficie del suelo de la habitación} Es de tipo continuo, no pudiendo establecer correspondencia alguna entre los puntos de la superficie del suelo de la habitación y la sucesión de números naturales.
94
ESTADÍSTICA 1
.
6.4.- SUCESOS. Cuando realizamos un experimento aleatorio no nos interesan, los resultados elementales del experimento aleatorio, sino que lo que nos puede interesar es algún subconjunto de esos resultados elementales, es decir un conjunto contenido en el espacio muestral. Suceso S es un subconjunto del espacio muestral, un subconjunto de resultados elementales del experimento aleatorio. Que ocurre o se presenta el suceso, cuando al realizarse el experimento aleatorio da lugar a uno de los resultados elementales pertenecientes al subconjunto que define el suceso. Podemos considerar cuatro tipos de sucesos:
a)
Suceso elemental, suceso simple o punto muestral es cada uno de los resultados posibles del experimento aleatorio; un suceso elemental consta de un solo elemento del espacio muestral E. Los sucesos elementales son subconjuntos del espacio muestral formados por un solo elemento.
b)
Suceso compuesto, es el que consta de dos o más sucesos elementales.
c)
Suceso seguro, cierto o universal, es el que consta de todos los sucesos elementales del espacio muestral E, coincide con el espacio muestral E. Se le llama seguro o cierto porque ocurre siempre, ya que al realizar el experimento aleatorio se obtendrá con seguridad uno de los posibles resultados o sucesos elementales de E, y por tanto ocurrirá E.
d)
Suceso imposible, es el que no tiene ningún elemento del espacio muestral E, y por tanto no ocurrirá nunca. Lo notaremos por Ø.
6.5.- OPERACIONES CON SUCESOS.
Con los sucesos operaremos de manera similar a como lo hacíamos con los conjuntos y las operaciones se definen de manera análoga.
95
ESTADÍSTICA 1
.
Los sucesos serán los correspondientes a un experimento aleatorio y por tanto serán subconjuntos del espacio muestral E.
Suceso contenido en otro.
Dados dos sucesos A y B de un experimento aleatorio, el suceso A está contenido en B, y lo indicaremos por A B, si cada suceso elemental perteneciente en A pertenece también a B, es decir si siempre que ocurre el suceso A, también ocurre el suceso B. Considerando el experimento aleatorio del lanzamiento de un dado, si designamos por: A = que aparezca el 2 ó el 4 = {2,4} B = que aparezca un número par = {2, 4, 6}
El suceso A B, los sucesos elementales 2 y 4 de A, también pertenecen a B.
Igualdad de sucesos.
Dados dos sucesos A y B, diremos que son iguales, si siempre que ocurre el suceso A también ocurre el suceso B, y siempre que ocurre el suceso B ocurre el suceso A, y lo indicaremos por A = B.
Unión de sucesos.
Dados dos sucesos A y B, la unión de ambos sucesos A y B, como otro suceso, que indicaremos por A B, compuesto por los resultados o sucesos elementales pertenecientes a A, o a B, o a los dos a la vez, así pues:
A B = al suceso que se presenta cuando A ó B, o ambos ocurren.
96
ESTADÍSTICA 1
.
Intersección de sucesos. Dados dos sucesos A y B, se define la intersección de ambos sucesos A y B, como otro suceso, que indicaremos por A ∩ B, compuesto por los resultados o sucesos elementales que pertenecen simultáneamente a A y a B. A ∩ B = suceso que se presenta cuando A y B ocurren a la vez.
Sucesos disjuntos, incompatibles o excluyentes. Dados dos sucesos A y B, diremos que son disjuntos, incompatibles o mutuamente excluyentes si su intersección A ∩ B = Ø, si no tienen ningún suceso elemental en común, dicho de otra manera, si al verificarse uno de los sucesos no se verifica el otro.
Sistema exhaustivo de sucesos. Si los sucesos A1, A2, A3, ......... An son tales que verifican que la unión de todos ellos A1 A2 A3 ......... An = E es igual al espacio muestral E, diremos que forman una colección o sistema exhaustivo de sucesos.
Suceso complementario o contrario. Dado un suceso A, se define el suceso complementario o contrario de A, como otro suceso que ocurre cuando no ocurre el suceso A. O bien, es el suceso constituido por los sucesos elementales del espacio muestral E que no pertenecen a A. Lo representaremos por Ā. Si consideramos el suceso A = obtener, en el lanzamiento de un dado, un número par = {2, 4, 6} El suceso complementario será: Ā = ,1, 3, 5- = obtener en el lanzamiento de un dado un número impar, Los sucesos A y Ā constituyen también un sistema completo de sucesos.
97
ESTADÍSTICA 1
.
Diferencia de sucesos. Dados dos sucesos A y B, se define la diferencia de ambos sucesos A y B que representamos por A – B, como otro suceso constituido por los sucesos elementales que pertenecen a A y no pertenecen a B.
Diferencia simétrica de sucesos. Dados dos sucesos A y B, se define la diferencia simétrica de ambos sucesos A y B, que la representaremos por A Δ B, como otro suceso constituido por los sucesos elementales que pertenecen a A, o a B pero que no pertenecen simultáneamente a ambos.
6.6.- SUCESIONES DE SUCESOS. Llamaremos sucesión de sucesos, a una familia de sucesos A1, A2, A3, .......... en la que los sucesos aparecen ordenados por el subíndice n. Sucesión creciente. Sucesión decreciente. Límite de una sucesión.
6.7.- ÁLGEBRA DE SUCESOS. Como hemos venido observando los sucesos los consideramos como conjuntos, siendo válido para los sucesos todo lo estudiado en la teoría de conjuntos, con la siguiente tabla de correspondencias. Teoría de sucesos
Teoría de conjuntos.
Suceso
Subconjunto del conjunto universal
Suceso elemental
Punto del conjunto universal
Suceso seguro o espacio muestral
Conjunto universal.
Sucesos incompatibles
Conjuntos disjuntos
Suceso contrario
Conjunto complementario.
Suceso imposible
Conjunto vacío
Unión de sucesos
Unión de conjuntos
Intersección de sucesos
Intersección de conjuntos
Un suceso A implica a B
El conjunto A está contenido en B.
98
ESTADÍSTICA 1
.
Colección de conjuntos a un conjunto cuyos elementos son conjuntos. Así pues el conjunto de las partes de E, A = P (E), que es el conjunto formado por todos los subconjuntos de E, o por todos los sucesos contenidos en el espacio muestras E, será una colección de conjuntos o sucesos.
Para llegar a la estructura de Álgebra de sucesos o Álgebra de Boole, partimos de una colección de sucesos, A = P(E), entre cuyos elementos tenemos definidas las operaciones:
-
Unión de sucesos,
-
Intersección de sucesos, y
-
Complementario de suceso.
Diremos que la colección de sucesos, A, no vacía, tiene estructura de Álgebra de Sucesos o Álgebra de Boole, si A es una clave cerrada frente a las operaciones de complementario, unión e intersección de sucesos en número finito. Estas dos condiciones son suficientes para definir el Álgebra de Sucesos, pues la condición I, nos pone de manifiesto que la operación complementaria de un suceso es cerrada, ya que si un suceso pertenece a la colección de sucesos A, también pertenece a ella su complementario. Análogamente la condición II, indica que la operación unión de sucesos es cerrada, pues si dos sucesos pertenecen a A, también pertenecerá el suceso unión. Si hacemos la extensión al caso de un número infinito numerable de sucesos, entonces nos aparece una nueva estructura algebraica que recibe el nombre Diremos que un conjunto o colección de sucesos no vacío, A = P(E), tiene estructura de algebra o Campo de Borel, si se verifican las dos condiciones siguientes: Aplicando las Leyes de Morgan también se deduce que la intersección de un número infinito numerable de sucesos pertenecientes a A, también pertenece a A.
99
ESTADÍSTICA 1
.
6.8.- Métodos de Enumeración o Conteo
Las siguientes son algunas técnicas útiles para contar el número de resultados o sucesos de un experimento aleatorio.
6.8.1. Tablas de Doble Entrada Es útil para relacionar dos pruebas, indicándonos los resultados que integran el espacio muestral, pudiendo indicar sobre la tabla determinados sucesos en los que estemos interesados. En general con m elementos a1, a2, a3,..., am y n elementos b1, b2, b3,..., bn es posible formar m x n pares (ar , bs) tales que cada par tiene al menos algún elemento diferente de cada grupo.
6.8.2. Principio de Multiplicación Sean los conjuntos C1, C2, C3,..., Ck que tienen respectivamente n1, n2, n3,..., nk k-uplas donde, en cada k-upla, el primer elemento pertenece a C1, el segundo a C2, etc. En el caso particular de que n1 = n2 = n3 = ... = nk el número posible de k-uplas sera nk . En el caso general, el número de posibles resultados será n1 x n2 x n3 x ... x nk. Este principio es de utilidad en el caso de un experimento aleatorio compuesto por otros k experimentos. 6.8.3. Diagramas de árbol Este diagrama nos permite indicar de manera sencilla el conjunto de posibles resultados en un experimento aleatorio siempre y cuando los resultados del experimento puedan obtenerse en diferentes fases sucesivas. Ej: Experimento aleatorio consistente en lanzar al aire un dado y después 3 veces consecutivas una moneda.
6.8.4. Combinaciones, Variaciones y Permutaciones Combinaciones Llamaremos combinaciones de m elementos tomados de n en n al número de subconjuntos diferentes de n elementos que se pueden formar con los m elementos del conjunto inicial
100
m ! m C m , n n n ! ( m n ) !
ESTADÍSTICA 1
.
m + n 1 ) ! ( m + n 1 C R m , n n n ! ( m 1 ) !
Combinaciones con repetición Si en los subconjuntos anteriores se pueden repetir los elementos Variaciones Llamaremos variaciones de m elementos tomados de n en n a los distintos subconjuntos diferentes de n elementos que se pueden formar
m ! V m ( m 1 ) ( m 2 ) . . . ( m m + 1 ) m , n ( m n ) !
con los m elementos, influyendo el orden en el que se toman
Variaciones con repetición
VRm,n mn
Si en los subconjuntos anteriores se pueden repetir los elementos
Permutaciones Llamaremos permutaciones de n elementos a las variaciones de n elementos tomados de n en n
Permutaciones con repetición Llamaremos permutaciones con repeticion de n elementos k-distintos que se repiten uno x1 veces, otro x2 veces, ... y el último xk veces
101
Pn n!
n ! x, ..,x 1x, 2. k P n x ! x ! ..x ! 1 2. k x x ... + x= n 1+ 2+ k
ESTADÍSTICA 1
.
CAPÍTULO 7 PROBABILIDAD 1.
Introducción
Se indicaba en el capítulo anterior que cuando un experimento aleatorio se repite un gran número de veces, los posibles resultados tienden a presentarse un número muy parecido de veces, lo cual indica que la frecuencia de aparición de cada resultado tiende a estabilizarse. El concepto o idea que generalmente se tiene del término probabilidad es adquirido de forma intuitiva, siendo suficiente para manejarlo en la vida corriente. Nos interesa ahora la medida numérica de la posibilidad de que ocurra un suceso A cuando se realiza el experimento aleatorio. A esta medida la llamaremos probabilidad del suceso A y la representaremos por p(A).
La probabilidad es una medida sobre la escala 0 a 1 de tal forma que: Al suceso imposible le corresponde el valor 0 Al suceso seguro le corresponde el valor 1 El resto de sucesos tendrán una probabilidad comprendida entre 0 y 1 El concepto de probabilidad no es único, pues se puede considerar desde distintos puntos de vista: El punto de vista objetivo Definición clásica o a priori Definición frecuentista o a posteriori El punto de vista subjetivo
2.
Definición Clásica de la Probabilidad
Sea un experimento aleatorio cuyo correspondiente espacio muestral E está formado por un número n finito de posibles resultados distintos y con la misma probabilidad de ocurrir {e1, e2, ... , en}. Si n1 resultados constituyen el subconjunto o suceso A1, n2 resultados constituyen el subconjunto o
102
ESTADÍSTICA 1
.
suceso A2 y, en general, nk resultados constituyen el subconjunto o suceso Ak de tal forma que:
n1 + n2 + ... + nk = n
Las probabilidades de los sucesos A1, A1,..., An son:
es decir, que la probabilidad de cualquier suceso A es igual al cociente entre el número de casos favorables que integran el suceso A y el número
n n n 1 2 k p ( A ) = p ( A ) = . . .p ( A ) = 1 2 k n n n
Regla de Laplace para E finitos
N º d e c a s o s f a v o r a b l e s d e A p ( A ) = N º d e c a s o s p o s i b l e s d e E
de casos posibles del espacio muestral E.
Para que se pueda aplicar la regla de Laplace es necesario que todos los sucesos elementales sean equiprobables, es decir:
p(e1) = p(e2) = ... = p(en) y por tanto p(ei)=1/n i=1,2,...,n
Siendo A={e1, e2, ... , ek} el suceso formado por k sucesos elementales siendo k n tendremos:
n
k N º c a s o s f a v o r a b l e s p ( A ) = p ( e ) j n N º c a s o s p o s i b l e s j = 1
La probabilidad verifica las siguientes condiciones:
La probabilidad de cualquier suceso es siempre un número no negativo entre 0 y 1
La probabilidad del suceso seguro E vale 1 La probabilidad del suceso inmposible es 0
103
n i p ( A ) = n n n n 0 i, n i
n 0 p ( E ) = = 1 p () = = 0 n n
ESTADÍSTICA 1
.
La probabilidad de la unión de varios sucesos incompatibles o excluyentes A1, A1,..., Ar es igual a la suma de probabilidades de cada uno de ellos
p ( A . . . A ) = p ( A ) + p ( A ) + . . . + p ( A ) 1 r 1 2 r
Esta definción clásica de probabilidad fue una de las primeras que se dieron (1900) y se atribuye a Laplace; también se conoce con el nombre de probabilidad a priori pues, para calcularla, es necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y el número de resultados o sucesos elementales que entran a formar parte del suceso.
La aplicación de la definicion clásica de probabilidad puede presentar dificultades de aplicación cuando el espacio muestral es infinito o cuando los posibles resultados de un experimento no son equiprobables. Ej: En un proceso de fabricación de piezas puede haber algunas defectuosas y si queremos determinar la probabilidad de que una pieza sea defectuosa no podemos utilizar la definición clásica pues necesitaríamos conocer previamente el resultado del proceso de fabricación. Para resolver estos casos, se hace una extensión de la definición de probabilidad, de manera que se pueda aplicar con menos restricciones, llegando así a la definición frecuentista de probabilidad. La probabilidad de la unión de varios sucesos incompatibles o excluyentes A1, A1,..., Ar es igual a la suma de probabilidades de cada uno de ellos
p(A1 ... Ar ) = p(A1 ) + p(A2 ) + ... + p(Ar )
Esta definición clásica de probabilidad fue una de las primeras que se dieron (1900) y se atribuye a Laplace; también se conoce con el nombre de probabilidad a priori pues, para calcularla, es necesario conocer, antes de realizar el experimento aleatorio, el espacio muestral y el número de resultados o sucesos elementales que entran a formar parte del suceso.
La aplicación de la definición clásica de probabilidad puede presentar dificultades de aplicación cuando el espacio muestral es infinito o cuando los posibles resultados de un experimento no son igualmente probables. Ej.: En un proceso de fabricación de piezas puede haber algunas defectuosas y si queremos determinar la probabilidad de que una pieza sea defectuosa no podemos utilizar la definición clásica pues necesitaríamos conocer previamente el resultado del proceso de fabricación. Para resolver estos casos, se hace una extensión de la definición de probabilidad, de manera que se pueda
104
ESTADÍSTICA 1
.
aplicar con menos restricciones, llegando así a la definición frecuentista de probabilidad.
7.3.- Definición Frecuentista de la Probabilidad
La definición frecuentista consiste en definir la probabilidad como el límite cuando n tiende a infinito de la proporción o frecuencia relativa del suceso.
Sea un experimento aleatorio cuyo espacio muestral es E Sea A cualquier suceso perteneciente a E Si repetimos n veces el experimento en las mismas condiciones, la frecuencia relativa del suceso A será: n(A) n
Cuando el número n de repeticiones se hace muy grande la frecuencia relativa converge hacia un valor que llamaremos probabilidad del suceso A.
n(A) n n
p(A) lim
Es imposible llegar a este límite, ya que no podemos repetir el experimento un número infinito de veces, pero si podemos repetirlo muchas veces y observar como las frecuencias relativas tienden a estabilizarse.
Esta definición frecuentista de la probabilidad se llama también probabilidad a posteriori ya que sólo podemos dar la probabilidad de un suceso después de repetir y observar un gran número de veces el experimento aleatorio correspondiente. Algunos autores las llaman probabilidades teóricas.
7.4.- Interpretación Subjetiva de la Probabilidad Tanto la definición clásica como la frecuentista se basan en las repeticiones del experimento aleatorio; pero existen muchos experimentos que no se pueden repetir bajo las mismas condiciones y por tanto no puede aplicarse la interpretación objetiva de la probabilidad.
105
ESTADÍSTICA 1
.
En esos casos es necesario acudir a un punto de vista alternativo, que no dependa de las repeticiones, sino que considere la probabilidad como un concepto subjetivo que exprese el grado de creencia o confianza individual sobre la posibilidad de que el suceso ocurra. Se trata por tanto de un juicio personal o individual y es posible por tanto que, diferentes observadores tengan distintos grados de creencia sobre los posibles resultados, igualmente válidos. Luego la probabilidad subjetiva es la evaluación personal de la probabilidad de un fenómeno aleatorio. Para el objetivista las cosas suceden de diferente forma: admite que la probabilidad es un propiedad característica de cada acontecimiento y no depende del observados, limitándose este a calcular su valor a partir de un conjunto de información impuesto por el propio acontecimiento e independiente del observador.
7.5 DEFINICION AXIOMATICA DE LA PROBABILIDAD
La definición axiomática de la probabilidad es quizás la más simple de todas las definiciones y la menos controvertida ya que está basada en un conjunto de axiomas que establecen los requisitos mínimos para dar una definición de probabilidad. La ventaja de esta definición es que permite un desarrollo riguroso y matemático de la probabilidad. Fue introducida por A. N. Kolmogorov y aceptada por estadísticos y matemáticos en general.
Definición Dado el espacio muestral E y la -Algebra A=P(E) diremos que una función p: A 0,1 es una probabilidad si satisface los siguientes axiomas de Kolmogorov:
A.1 p(A) 0 para cualquier suceso A A=P(A) A.2 p(E) = 1 A.3 Dada una sucesión numerable de sucesos incompatibles A1, A2,... A, se verifica que p(A1 A2 ... ) = p Ai = p(A1 ) + p(A2 ) + ... i=1
A la función p: A 0,1 A p = p(A) se denomina probabilidad del suceso A. La terna (E, A, p) formada por el espacio muestral E, la -Algebra A=P(E) y la probabilidad p se denomina espacio probabilístico.
106
ESTADÍSTICA 1
.
Los siguientes resultados se deducen directamente de los axiomas de probabilidad. Teorema 7.1 La probabilidad del suceso imposible es nula p( ) 0 Si para cualquier suceso A resulta que p(A)=0 diremos que A es el suceso nulo, pero esto no implica que A= Si para cualquier suceso A resulta que p(A)=1 diremos que A es el suceso casi seguro, pero esto no implica que A = E
Teorema 7.2 Para cualquier suceso A A=P(A) se verifica que: La probabilidad de su suceso complementario es p(A) 1 - p(A)
Teorema 7.3 La probabilidad P es monótona no decreciente, es decir: A,B A=P(A) con A B p(A) p(B) y además p(B - A) = p(B) - p(A)
Teorema 7.4 Para cualquier suceso A A=P(A) se verifica que: p(A) 1
Teorema 7.5 Para dos sucesos cualesquiera A,B A=P(A) se verifica que: p( AB ) = p(A) + p(B) - p( AB ) Esta propiedad es generalizable a n sucesos: n n n n p Ai = p(Ai ) - p(Ai Aj ) + p(Ai Aj Ak ) +...+(-1) n+1 p Ai i=1 i=1 i 1 i< j i< j<k
Teorema 7.6 Para dos sucesos cualesquiera A,B A=P(A) se verifica que: p( AB ) p(A) + p(B) Esta propiedad es generalizable a n sucesos:
107
ESTADÍSTICA 1
.
n p Ai p(Ai ) i=1 i=1
Teorema 7.7 Dada una sucesión creciente de sucesos A1, A2, ... , An (abreviadamente representado por { An}) se verifica que:
lim p(An ) = p( lim An ) = p An n n n=1
Teorema 7.8
Dada una sucesión decreciente de sucesos A1, A2, ... , An (abreviadamente representado por { An}) se verifica que: lim p(An ) = p( lim An ) = p An n n n=1
7.6. PROBABILIDAD CONDICIONADA.
Hasta ahora hemos introducido el concepto de probabilidad considerando que la única información sobre el experimento era el espacio muestral. Sin embargo hay situaciones en las que se incorpora información suplementaria respecto de un suceso relacionado con el experimento aleatorio, cambiando su probabilidad de ocurrencia.
El hecho de introducir más información, como puede ser la ocurrencia de otro suceso, conduce a que determinados sucesos no pueden haber ocurrido, variando el espacio de resultados y cambiando sus probabilidades.
108
ESTADÍSTICA 1
.
Definición
Dado un espacio probabilístico (E, A, p) asociado a un experimento aleatorio. Sea A un suceso tal que A A=p(A) y p(A)0 Sea B un suceso tal que B A=p(A)
Se define la probabilidad condicionada de B dado A o probabilidad de B condicionada a A como:
p ( AB ) p ( B /A )= p ( A ) , P(A) > 0 (Si P(A) =0, no tiene sentido la definición, ya que P(B/A) se
haría infinito.)
La probabilidad condicionada cumple los tres axiomas de Kolmogorov:
p ( A B ) B A = P ( E )p ( B / A ) = 0 1. p ( A )
2.
p ( A E ) p ( E /A ) = 1 p ( A )
3. Sea { Ai } una sucesión de sucesos disjuntos dos a dos, entonces: p A / A = p ( A ) i i/A i= 1 i = 1
Regla de Multiplicación de Probabilidades o Probabilidad Compuesta:
Partiendo de la definición de la Probabilidad Condicionada p(B/A) podemos escribir:
p ( A B ) = p ( A )p ( B /A )
109
ESTADÍSTICA 1
.
La definición de Probabilidad Condicionada se puede extender a cualquier nº finito de sucesos del espacio muestral.
EJEMPLOS
Suceso A : El dólar sube frente a la peseta en el mercado español antes de que nuestro mercado abra a las 9 de la mañana. Suceso B : El dólar sube en el mercado americano después de abrir.
Ambos sucesos están relacionados, pero no necesariamente siempre. Por tanto la P(B) ( que el dólar suba frente a la peseta en el mercado americano) no es igual que la probabilidad de que ocurra el suceso B.(que suba en el mercado americano después de abrir). Cuando se conoce que el dólar ha subido en el mercado español (suceso A).
Supongamos que el dólar sube frente a la peseta el 70% de los días en el mercado español y 60% de los días en ambos mercados:
P(A)=0,7 P(A∩B) =0,6
Entonces si se sabe que el dólar sube frente a la peseta en el mercado español, la probabilidad de que habiendo sucedido esto suba en el mercado americano será:
P(A∩B) = 6 =± 0,86 Esta es la probabilidad condicionada del suceso B, cuando el suceso A ha P(A)
7
ocurrido.
Ejemplo 7.4.
Una entidad bancaria pretende introducir un sistema casi automático de concesión de préstamos para autoconsumo de importe máximo 10.000 € . y para ello analiza su fichero de
110
ESTADÍSTICA 1
.
los préstamos, de características parecidas que han sido concedidos en los últimos años llegando a obtener la siguiente información.
El 5% de los préstamos que se concedieron en ese período presentaron algún problema de pago. El 70% de las peticiones de préstamo que se habían hecho en el período analizado, se informaron favorablemente, cuando no ha habido incumplimiento de pagos según se sabe en la actualidad, y se concedieron de acuerdo con los baremos exigidos en aquella época por el banco.
En la actualidad el 80% de las solicitudes de este tipo de préstamos cumplen automáticamente las condiciones fijadas por el banco, informándose favorablemente. Determinar la probabilidad de que estas peticiones que son informadas favorablemente no presenten ningún problema en el momento de la cancelación del préstamo.
Solución:
Designamos los sucesos:
A: Suceso incumplimiento en el pago, P(A) = 0,05. B: Suceso informe favorable de la solicitud, P(B) = 0,80 B/A: Suceso informe favorable cuando no ha habido incumplimiento de pago., P(B/A)=0,7 A/B: Suceso cumplimiento en el pago cuando el informe ha sido favorable.
La probabilidad que se pide es: P(A/B), la cual se obtendrá utilizando la expresión:
P(A)·P(B/A)=P(B)·P(A/B)
De donde se obtiene que:
P A · P B/ A P B
=
0,95· 0,7 = ± 0,83 0,8
111
ESTADÍSTICA 1
.
Nota: A esta fórmula le faltan los superíndices en la A, pero es que no sé como ponerlos en el “modo fórmula”.
7.6
Probabilidad condicionada.
El concepto de probabilidad considera que la única información sobre el experimento era el espacio muestral, pero hay situaciones en las que se incorpora información suplementaria respecto de un suceso. Este hecho nos lleva a que determinados resultados no pueden haber ocurrido variando el espacio de resultados y cambiando sus probabilidades.
Consideremos dos sucesos de manera que la probabilidad de que ocurra un suceso depende de si el otro ha ocurrido o no.
Ejemplo: Sea un experimento que consiste en observar si el dólar sube (aumenta de valor) frente a la peseta.
Suceso A “El dólar sube frente a la peseta en el mercado español antes de que nuestro mercado abra a las 9 de la mañana”. Suceso B “El dólar sube en el mercado americano después de abrir”.
Ambos sucesos están relacionados porque los mercados se moverán en la misma dirección muchos días pero no todos. Por lo tanto la P(B) no es igual que la probabilidad de que ocurra el suceso B cuando se conoce que ha subido en el mercado español, suceso A.
Ejemplo: Supongamos que el dólar sube frente a la peseta un 70% de los días en el mercado español y el 60% de los días en ambos mercados. P(A)= 0,7 P(A∩B)= 0,6
La probabilidad de que habiendo sucedido esto suba en el mercado americano será: P(A∩B) P(A)
‗
6 ≈ 0,86 7
112
ESTADÍSTICA 1
.
A este cociente P(A∩B) se le llama probabilidad condicionada del suceso B, P(A) cuando el suceso A ha ocurrido y se denota de la forma P(B/A)= P(A∩B) P(A)
Definición de probabilidad condicionada.
Dados un espacio probabilístico (E, A, P) asociado a un experimento aleatorio, y un suceso A ℮ A, tal que P (A)
› 0. Para cualquier suceso B ℮ A, se define la probabilidad condicionada de B dado A o
probabilidad de B condicionada a A como sigue:
P(B/A) = P(A∩B)
;
P(A)
›0
P(A)
La probabilidad condicionada cumple los tres axiomas de Kolmogorov. (Pág. 356-357).
Partiendo de la definición de la probabilidad condicionada P(B/A) podemos escribirla en forma de producto obteniendo la regla de multiplicación de probabilidades o probabilidad compuesta dada por:
P(A∩B) = P(A) ∙ P(B/A) Considerando P(A/B) = P(A∩B) ; P(B)
›0
P(B) tendríamos que: P(A∩B) = P(B) ∙ P(A/B) de donde igualando las expresiones tendremos: P(A) ∙ P(B/A) = P(B) ∙ P(A/B) Para el caso de tres sucesos A, B y C tendremos:
113
ESTADÍSTICA 1
P(A/B∩C) = P(A∩B∩C)
.
;
P(B∩C)
;
P( C )
›
0
P(B∩C)
o bien:
P(A∩B/C) = P(A∩B∩C)
›
0
P( C )
7.6. PROBABILIDAD CONDICIONADA Hasta ahora hemos definido el concepto de probabilidad considerando que la única información sobre el experimento era el espacio muestral. Pero a veces se introduce más información, lo cual hace variar el espacio de resultados y sus probabilidades. Por ejemplo, debemos observar si el dólar sube (aumenta de valor frente a la peseta). Desugnamos por A el suceso “el dólar sube frente a la peseta en el mercado español antes de que nuestro mercado abra a las nueve de la mañana” y B el suceso “el dólar sube en el mercado americano después de abrir”. Ambos sucesos A y B están relacionados, ya que los mercados se moverán en la misma direccion probablemente muchos días, pero no necesariamente todos. Por tanto la P(B) de que el dólar subirá frente a la peseta en el mercado americano no es igual a que ocurra el suceso B, cuando se conoce el suceso A. Ejemplo: El dólar sube frente a la peseta el 70% de los días en el mercado español y el 60% en ambos mercados Según los datos del enunciado sabemos las siguientes probabilidades,
P( A) 0.7 P( A B) 0.6 Entonces, si se sabe q el dólar sube, frente a la peseta, en el mercado español, la probabilidad de que habiendo sucedido esto suba en el mercado americano será:
P A B 6 0.86 P( A) 7
114
ESTADÍSTICA 1
.
Definimos probabilidad condicionada del suceso B, cuando el suceso A ha ocurrido y se denota de la forma:
P( B / A)
P A B ; P( A) 0 P( A)
La probabilidad condicionada cumple los tres axiomas de Kolmogorov: 1.
Se debe cumplir lo siguiente 0 P( B / A) 1
2.
P( E / A)
P( E A) P( A) 1 P( A) P( A)
7.7.- INDEPENDENCIA DE SUCESOS.
115