regresión lineal múltiple
Regresión de componentes principales para combatir la colinealidad en la regresión lineal múltiple
Enric Ruiz Morillas Laboratorio Repsol C.I. Tarragona
Introducción
Así, los valores de las variables regresoras transformadas son:
E
n un artículo anterior [1] se analizó el efecto negativo que tiene sobre un modelo de regresión la existencia de relaciones entre las variables regresoras (colinealidad). En este artículo se observará cómo el método de regresión de componentes principales (PCR, por sus siglas en inglés) combate la colinealidad; para lo cual se aplicará a un ejemplo.
Forma canónica del modelo de regresión
donde el siguiente parámetro es la unidad de longitud de la variable j:
y los valores de la variable respuesta transformados son:
Vimos en [1] que, de forma general, una variable respuesta puede estar relacionada con un número k de variables regresoras mediante la siguiente expresión: donde:
en la que los coeficientes de regresión se estiman a partir de n conjuntos de datos, de manera que n > k, que podemos disponer en forma matricial:
Estas operaciones nos permiten transformar la matriz X en la matriz W:
donde: y podemos expresar el modelo de regresión del siguiente modo: donde: También vimos que, para evaluar el grado de dependencia existente entre las variables regresoras es útil centrar los valores de cada variable con respecto a su valor medio y escalarlas en las denominadas unidades de longitud.
técnicas de LABORATORIO
164
Nº 470 ABRIL 2022