Métodos estadísticos para Economía y Empresa Rigoberto Pérez y Ana Jesús López
Octubre 2011
Índice general I.
Probabilidad
12
1. Incertidumbre y probabilidad 1.1. Definiciones de probabilidad . . . . . . . . . . . . 1.1.1. Probabilidad clásica . . . . . . . . . . . . . 1.1.2. Probabilidad frecuencial . . . . . . . . . . . 1.1.3. Probabilidad subjetiva . . . . . . . . . . . . 1.2. La probabilidad y su cuantificación . . . . . . . . . 1.3. Definición axiomática de la probabilidad . . . . . . 1.3.1. Propiedades elementales de la probabilidad 1.4. Probabilidad condicionada e independencia . . . . 1.4.1. Probabilidad condicionada . . . . . . . . . . 1.4.2. Independencia en probabilidad . . . . . . . 1.5. Probabilidad total y teorema de Bayes . . . . . . . 1.5.1. Sistema completo de sucesos . . . . . . . . 1.5.2. Teorema de la probabilidad total . . . . . . 1.5.3. Teorema de Bayes . . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . . . . . . . . .
2. Magnitudes aleatorias 2.1. Variable aleatoria. Variables discretas y continuas . . . . . . . . 2.2. Distribución de probabilidad de una variable aleatoria . . . . . 2.2.1. Función de distribución . . . . . . . . . . . . . . . . . . 2.2.2. Probabilidades de intervalos . . . . . . . . . . . . . . . 2.2.3. Función de probabilidad . . . . . . . . . . . . . . . . . . 2.2.4. Función de densidad . . . . . . . . . . . . . . . . . . . . 2.2.5. Variables aleatorias relacionadas: Cambio de variable . . 2.3. Características asociadas a variables aleatorias. Valor esperado rianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Desigualdad de Chebyshev . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . y va. . . . . . . .
3. Modelos de probabilidad 3.1. Modelo Binomial . . . . . 3.2. Distribuciones Geométrica 3.3. Modelo hipergeométrico . 3.4. Modelo Uniforme . . . . . 3.4.1. Caso discreto . . .
. . . . .
. y . . .
. . . . . . . . . . . Binomial negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
13 13 14 15 16 18 22 25 27 27 29 31 32 32 33 35 35 40 41 44 45 47 51 54 65 68 70 80 86 90 92
Índice general 3.4.2. Caso continuo . . . . . . . . . . . . . . . 3.5. Modelo Normal . . . . . . . . . . . . . . . . . 3.5.1. Modelo Normal estándar . . . . . . . . 3.5.2. Modelo Normal general . . . . . . . . . 3.6. Algunos modelos especiales de probabilidad . . 3.6.1. Sucesos raros: modelo de Poisson . . . . 3.6.2. Tiempos de espera: modelo exponencial 3.6.3. Modelos de distribución de la renta . . 3.6.3.1. Distribución logaritmo normal 3.6.3.2. Distribución de Pareto . . . . 3.6.3.3. Distribución Gamma . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
4. Vectores aleatorios y distribuciones de agregados 4.1. Vectores aleatorios. Distribuciones k-dimensionales . . . 4.1.1. Variable aleatoria bidimensional . . . . . . . . . . 4.1.1.1. Función de distribución bidimensional . 4.1.1.2. Función de probabilidad bidimensional . 4.1.1.3. Función de densidad bidimensional . . 4.1.1.4. Vectores aleatorios k-dimensionales . . . 4.2. Distribuciones marginales y condicionadas . . . . . . . . 4.2.1. Distribuciones marginales . . . . . . . . . . . . . 4.2.2. Distribuciones condicionadas . . . . . . . . . . . 4.3. Modelos probabilísticos k-dimensionales . . . . . . . . . 4.3.1. Distribución Multinomial . . . . . . . . . . . . . 4.3.2. Distribución Multihipergeométrica . . . . . . . . 4.3.3. Distribución Normal Multivariante . . . . . . . . 4.4. Variables aleatorias independientes . . . . . . . . . . . . 4.4.1. Reproductividad . . . . . . . . . . . . . . . . . . 4.5. Agregación de variables aleatorias . . . . . . . . . . . . . 4.6. Teoremas límites . . . . . . . . . . . . . . . . . . . . . . 4.6.1. Leyes de los grandes números . . . . . . . . . . . 4.6.2. Teorema central del límite . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . .
93 94 94 100 103 103 105 108 109 110 112
. . . . . . . . . . . . . . . . . . .
114 115 115 116 116 117 118 119 119 125 128 128 129 130 132 137 140 144 147 149
II. Inferencia estadística
154
5. Muestras y estimadores 5.1. Estudios muestrales. Conceptos básicos 5.1.1. Población . . . . . . . . . . . . 5.1.2. Muestras . . . . . . . . . . . . 5.1.3. Subpoblaciones o estratos . . . 5.1.4. Muestreo probabilístico . . . . 5.2. Errores y diseño de encuestas . . . . . 5.2.1. Errores de encuesta . . . . . .
155 155 155 157 158 159 162 163
6
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
Índice general . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
164 164 167 170 172 172 175 177 181 184 185 185 189 190 191 191 193 195
6. Herramientas inferenciales 6.1. Modelos probabilísticos asociados al muestreo . . . . . . . . . . . . 6.1.1. Distribución Normal . . . . . . . . . . . . . . . . . . . . . . 6.1.2. Distribución chi-cuadrado . . . . . . . . . . . . . . . . . . . 6.1.3. Distribución t de Student . . . . . . . . . . . . . . . . . . . 6.1.4. Distribución F de Snedecor . . . . . . . . . . . . . . . . . . 6.2. Procesos inferenciales y distribuciones asociadas . . . . . . . . . . . 6.2.1. Inferencias relativas a parámetros . . . . . . . . . . . . . . . 6.2.2. Inferencias sobre la media . . . . . . . . . . . . . . . . . . . 6.2.3. Inferencias sobre la varianza . . . . . . . . . . . . . . . . . 6.2.4. Inferencias sobre proporciones . . . . . . . . . . . . . . . . . 6.2.5. Inferencias sobre la diferencia de medias . . . . . . . . . . . 6.2.5.1. Diferencia de medias con datos pareados . . . . . . 6.2.5.2. Diferencia de medias con muestras independientes 6.2.6. Inferencias sobre la razón de varianzas . . . . . . . . . . . . 6.2.7. Inferencias sobre otras características . . . . . . . . . . . . . 6.2.8. Inferencias genéricas sobre poblaciones . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
197 197 198 199 207 209 215 216 218 221 222 223 224 225 229 230 231
. . . . . .
234 235 239 239 242 243 244
5.3. 5.4.
5.5.
5.6.
5.2.2. Acuracidad y precisión . . . . . . . . . 5.2.3. Diseño de encuestas y selección muestral Estadísticos y estimadores . . . . . . . . . . . 5.3.1. Función de verosimilitud . . . . . . . . Propiedades de los estimadores . . . . . . . . . 5.4.1. Ausencia de sesgo . . . . . . . . . . . . 5.4.2. Eficiencia . . . . . . . . . . . . . . . . . 5.4.3. Mínima varianza . . . . . . . . . . . . . 5.4.4. Suficiencia . . . . . . . . . . . . . . . . 5.4.5. Consistencia . . . . . . . . . . . . . . . . Métodos de obtención de estimadores . . . . . . 5.5.1. Método de la máxima verosimilitud . . 5.5.2. Método de los momentos . . . . . . . . . 5.5.3. Método de los mínimos cuadrados . . . Algunos estimadores habituales . . . . . . . . . 5.6.1. Parámetro media poblacional µ . . . . . 5.6.2. Parámetro varianza poblacional σ 2 . . . 5.6.3. Parámetro proporción poblacional p . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
7. Estimación 7.1. Estimación puntual y por intervalos . . . . . . . . . . 7.2. Intervalos de confianza. Construcción y características 7.2.1. Construcción de intervalos de confianza . . . . 7.2.2. Precisión de los intervalos . . . . . . . . . . . . 7.2.2.1. Información sobre la población . . . . 7.2.2.2. Información muestral . . . . . . . . .
7
. . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
Índice general 7.2.3. Nivel de confianza: Interpretación . . . . . . . . . . . . . . . . 7.3. Algunos intervalos de confianza particulares . . . . . . . . . . . . . . 7.3.1. Intervalos de confianza para la esperanza . . . . . . . . . . . . 7.3.2. Intervalos de confianza para la varianza . . . . . . . . . . . . 7.3.3. Intervalos de confianza para la proporción . . . . . . . . . . . 7.3.4. Intervalos de confianza para combinaciones lineales de medias 7.3.5. Intervalos de confianza para la razón de varianzas . . . . . . . 7.3.6. Intervalos de confianza para la mediana . . . . . . . . . . . . 7.4. Determinación del tamaño muestral . . . . . . . . . . . . . . . . . . . 7.4.1. Tamaño de muestra en intervalos para la esperanza . . . . . . 7.4.2. Tamaño de muestra en intervalos para la proporción . . . . .
. . . . . . . . . . .
245 246 246 249 250 251 252 253 253 254 255
8. Contraste de hipótesis 256 8.1. Conceptos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 8.1.1. Contraste de hipótesis e intervalos de confianza . . . . . . . . . 257 8.1.2. Contrastes de significación . . . . . . . . . . . . . . . . . . . . 259 8.2. Metodología del contraste de hipótesis . . . . . . . . . . . . . . . . . . 264 8.2.1. Enunciado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 8.2.2. Desarrollo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 8.2.3. Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270 8.3. Contrastes de hipótesis básicas . . . . . . . . . . . . . . . . . . . . . . 272 8.3.1. Hipótesis de m.a.s. . . . . . . . . . . . . . . . . . . . . . . . . . 272 8.3.1.1. Test de rachas . . . . . . . . . . . . . . . . . . . . . . 273 8.3.1.2. Test de rangos . . . . . . . . . . . . . . . . . . . . . . 275 8.3.1.3. Consecuencias del incumplimiento del supuesto de m.a.s.276 8.3.2. Contrastes de bondad de ajuste. Test de normalidad . . . . . . 276 8.3.2.1. Test de Bondad de Ajuste . . . . . . . . . . . . . . . . 277 8.3.2.2. Test de Kolmogorov-Smirnov . . . . . . . . . . . . . . 280 8.3.2.3. Test de normalidad de Jarque-Bera . . . . . . . . . . 282 8.4. Algunos contrastes paramétricos . . . . . . . . . . . . . . . . . . . . . 283 8.4.1. Contrastes sobre la media . . . . . . . . . . . . . . . . . . . . . 285 8.4.1.1. Extensión a poblaciones desconocidas . . . . . . . . . 288 8.4.2. Contrastes sobre la varianza . . . . . . . . . . . . . . . . . . . 289 8.4.3. Contrastes sobre la proporción . . . . . . . . . . . . . . . . . . 291 8.4.4. Contrastes sobre medias de dos poblaciones . . . . . . . . . . . 292 8.4.5. Contrastes sobre varianzas de dos poblaciones . . . . . . . . . . 294 8.5. Algunos contrastes no paramétricos . . . . . . . . . . . . . . . . . . . . 295 8.5.1. Contrastes del modelo poblacional . . . . . . . . . . . . . . . . 295 8.5.2. Contrastes de independencia de dos poblaciones . . . . . . . . . 296 8.5.3. Contrastes de homogeneidad de poblaciones clasificadas según varias categorías . . . . . . . . . . . . . . . . . . . . . . . . . . 298 8.5.3.1. Prueba exacta de Fisher . . . . . . . . . . . . . . . . . 298 8.5.3.2. Contraste χ2 de homogeneidad entre poblaciones . . . 300
8
Índice general 8.5.4. Contrastes de identidad de la población a partir de muestras independientes . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5.4.1. Test de Mann-Whitney (M-W) . . . . . . . . . . . . 8.5.4.2. Test de Wald-Wolfowitz . . . . . . . . . . . . . . . . 8.5.4.3. Test de Kolmogorov-Smirnov para dos muestras . . . 8.5.4.4. Prueba de Kruskal-Wallis para r muestras . . . . . . . 8.5.5. Contrastes de cambios sucesivos sobre una población . . . . . . 8.5.5.1. Test de McNemar . . . . . . . . . . . . . . . . . . . . 8.5.5.2. Prueba Q de Cochran . . . . . . . . . . . . . . . . . . 8.6. Anexo: Diseño de contrastes óptimos . . . . . . . . . . . . . . . . . . .
302 302 304 304 304 305 305 306 307
III. Introducción a la Econometría
317
9. Modelos econométricos. El modelo lineal simple 9.1. Los modelos econométricos . . . . . . . . . . . . . . . . . . 9.2. El modelo de regresión lineal simple . . . . . . . . . . . . . 9.3. Estimación de los parámetros de regresión . . . . . . . . . . 9.3.1. Estimación mínimo cuadrática . . . . . . . . . . . . 9.3.2. Estimación máximo verosímil . . . . . . . . . . . . . 9.3.3. Características y propiedades de los estimadores . . 9.3.4. Construcción de las discrepancias tipificadas . . . . 9.3.5. Obtención de intervalos de confianza . . . . . . . . . 9.4. Contrastes asociados a un modelo. Evaluación de la bondad 9.5. Predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . .
318 318 321 322 323 325 326 328 329 330 334
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
10.El modelo lineal múltiple 10.1. Estimación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.1.1. Estimadores mínimo cuadráticos y máximo verosímiles . . . . . 10.1.2. Propiedades y características de los estimadores . . . . . . . . . 10.2. Contrastes y análisis de la bondad del modelo . . . . . . . . . . . . . . 10.2.1. Contrastes individuales . . . . . . . . . . . . . . . . . . . . . . 10.2.2. Contrastes globales de significación . . . . . . . . . . . . . . . . 10.2.3. Bondad del modelo. Coeficientes de determinación . . . . . . . 10.2.4. Contrastes relativos a subconjuntos de parámetros . . . . . . . 10.2.5. Predicción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.3. Modelos con variables cualitativas . . . . . . . . . . . . . . . . . . . . . 10.3.1. Variables explicativas cualitativas. . . . . . . . . . . . . . . . . 10.3.2. Variables cualitativas dependientes. Introducción a los modelos logit y probit . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10.4. Alteración de supuestos del modelo lineal . . . . . . . . . . . . . . . . 10.4.1. Errores de especificación . . . . . . . . . . . . . . . . . . . . . . 10.4.1.1. Forma funcional del modelo . . . . . . . . . . . . . . .
9
337 338 340 341 344 344 345 346 349 350 354 354 359 363 364 364
Índice general 10.4.1.2. Omisión de variables explicativas relevantes e inclusión de variables irrelevantes . . . . . . . . . . . . . . . . 10.4.1.3. Test de especificación RESET de Ramsey . . . . . . . 10.4.2. Alteración de las hipótesis sobre la perturbación . . . . . . . . 10.4.2.1. Perturbaciones de media no nula . . . . . . . . . . . 10.4.2.2. Matriz de varianzas-covarianzas no escalar . . . . . . 10.4.2.3. Heteroscedasticidad. Detección y soluciones . . . . . . 10.4.2.4. Autocorrelación. Contraste de Durbin-Watson . . . . 10.4.2.5. No normalidad . . . . . . . . . . . . . . . . . . . . . 10.4.3. Alteración de las hipótesis estructurales . . . . . . . . . . . . . 10.4.3.1. Regresores estocásticos . . . . . . . . . . . . . . . . . 10.4.3.2. Matrices X de rango no pleno . . . . . . . . . . . . . 10.4.3.3. Multicolinealidad . . . . . . . . . . . . . . . . . . . . 10.4.3.4. Cambio estructural . . . . . . . . . . . . . . . . . . .
365 367 368 368 368 372 375 379 380 380 381 382 384
Bibliografía
386
Index
390
10