MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman
ANALISIS DE REGRESIÓN LINEAL MÚLTIPLE
72
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman ANALISIS DE REGRESIÓN LINEAL MÚLTIPLE
Como se ha mencionado en el tema anterior es posible realizar una proyección haciendo uso de más de dos variables independientes para estimar la variable dependiente y, de esa forma, intentar aumentar la precisión de la estimación. A éste proceso se le conoce como regresión lineal múltiple, se basa en las mismas suposiciones y procedimientos que en la regresión lineal simple.
Tome como ejemplo a un fabricante de artículos de plástico, el cual desea interrelacionar el número de unidades vendidas con la publicidad, de hecho es posible crear una ecuación que permita estimar las dos variables de interés. La principal ventaja de éste procedimiento es que permite utilizar más información consiste en determinar la relación existente entre dos o más variables independientes y una dependiente.
En la regresión simple se utiliza “X” como símbolo para la variable independiente y “Y” para la variable dependiente, de dicha cuenta será necesario seguir utilizando la misma simbología. Ahora bien, como existirá más de una variable independiente se hace menester agregar subíndices a la variable “X” para diferenciar en los procesos, así: X , X , X … X y a la variable dependiente se le seguirá llamando con la literal “Y”. Basado en que hay por lo menos dos o más variables independientes, la ecuación de la línea recta recibe ciertas modificaciones, es decir que se extiende, quedando de la siguiente forma: =
+
+
Para muestra realicemos un ejemplo aplicativo: Una institución educativa sometió a los alumnos de una clase a un examen de aptitudes para determinar la capacidad de investigación bibliográfica que éstos poseen; para lograr el objetivo del examen, cada alumno debía investigar ciertas horas en la biblioteca y ciertas horas investigar en internet, los resultados fueron los siguientes:
Horas Biblioteca
Horas Internet
Nota examen
45
16
29
42
14
24
44
15
27
45
13
25
43
13
26
46
14
28
73
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman 44
16
30
45
16
28
44
15
28
43
15
27
Para dar inicio a cualquier proceso de proyección se hace necesario determinar las variables constantes “a”, “ ” y “ ” para ello puede utilizarse el criterio de los mínimos cuadrados. Con los datos que se tienen se pueden aplicar las siguientes tres ecuaciones:
=
+
+
=
+
=
+
+ +
El primer paso es crear una tabla donde se concentre de forma ordenada la información, la misma debe contener los elementos necesarios que le den vida a las tres fórmulas antes descritas y de esa cuenta iniciar el proceso de resolución.
Y 45
16
29
1,305
464
720
2,025
256
42
14
24
1,008
336
588
1,764
196
44
15
27
1,188
405
660
1,936
225
45
13
25
1,125
325
585
2,025
169
43
13
26
1,118
338
559
1,849
169
46
14
28
1,288
392
644
2,116
196
44
16
30
1,320
480
704
1,936
256
45
16
28
1,260
448
720
2,025
256
44
15
28
1,232
420
660
1,936
225
43
15
27
1,161
405
645
1,849
225
441
147
272
12,005
4,013
6,485
19,461
2,173
Sustituyendo valores en las fórmulas se tendría: 272 = 10 + 441
+ 147
12,005 = 441 + 19,461
74
+ 6,485
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman 4,013 = 147 + 6,485
+ 2,173
Para despejar este sistema de ecuaciones simultaneas, puede utilizar cualquiera de los métodos matemáticos generalmente aceptados (igualación, sustitución y suma y resta). Para el caso que nos compete se sugiere utilizar el método de las sumas y restas. 272 = 10 + 441
+ 147
12,005 = 441 + 19,461
+ 6,485
119,952 = 4,410 + 194,481
− 120,050 = −4,410 − 194,610 − 98 = −129
441
4,013 = 147 + 6,485
− 64,850
+ 6,485
+ 2,173
1,764,735 = 64,827 + 2,860,767
− 1,769,733 = −64,827 − 2,859,885 − 4,998 = 882
10
+ 64,827
− 23
12,005 = 441 + 19,461
-
− 4,998 = 882
-
− 958,293
− 23
882
− 4,998
− 86,436 = −113,778
− 20,286
− 644,742 = 113,778
441
+ 953,295
− 4,998
− 98 = −129
147
− 644,742
− 731,178 = −665,028 −731,178 = − 665,028
= 1.0995
− 98 = −129
− 98 = −129
− 98 = −129
− 23
− 23(1.0995) − 25.2885
− 98 + 25.2885 = −129 − 72.7115 = −129
− 72.7115 = −129
75
= 0.5637
129
MANUAL DE ESTADÍSTICA
Lic. Johane Daniel Pérez Leberman 272 = 10 + 441
+ 147
272 = 10 + 441(0.5637) + 147(1.0995) 272 = 10 + 248.5917 + 161.6265 272 − 248.5917 − 161.6265 = 10 − 138.2182 = 10 −138.2182 = = −13.82 10
=
+
+
= −13.82 + 0.5637
+ 1.0995
De ésta forma quedaría la ecuación para proyecciones en la regresión lineal múltiple, ahora bien, determine ¿Qué nota hubiera obtenido un alumno que dedicara 47 horas a investigación en biblioteca y 17 horas de investigación en internet?
= −13.82 + 0.5637(47) + 1.0995(17) = −13.82 + 26.4939 + 18.6915 = 31.37
Si el estudiante hubiera investigado 47 horas en biblioteca y 17 horas en internet la nota obtenida sería de 31.37 puntos.
76