Regresión lineal múltiple

Page 1

MANUAL DE ESTADÍSTICA

Lic. Johane Daniel Pérez Leberman

ANALISIS DE REGRESIÓN LINEAL MÚLTIPLE

72


MANUAL DE ESTADÍSTICA

Lic. Johane Daniel Pérez Leberman ANALISIS DE REGRESIÓN LINEAL MÚLTIPLE

Como se ha mencionado en el tema anterior es posible realizar una proyección haciendo uso de más de dos variables independientes para estimar la variable dependiente y, de esa forma, intentar aumentar la precisión de la estimación. A éste proceso se le conoce como regresión lineal múltiple, se basa en las mismas suposiciones y procedimientos que en la regresión lineal simple.

Tome como ejemplo a un fabricante de artículos de plástico, el cual desea interrelacionar el número de unidades vendidas con la publicidad, de hecho es posible crear una ecuación que permita estimar las dos variables de interés. La principal ventaja de éste procedimiento es que permite utilizar más información consiste en determinar la relación existente entre dos o más variables independientes y una dependiente.

En la regresión simple se utiliza “X” como símbolo para la variable independiente y “Y” para la variable dependiente, de dicha cuenta será necesario seguir utilizando la misma simbología. Ahora bien, como existirá más de una variable independiente se hace menester agregar subíndices a la variable “X” para diferenciar en los procesos, así: X , X , X … X y a la variable dependiente se le seguirá llamando con la literal “Y”. Basado en que hay por lo menos dos o más variables independientes, la ecuación de la línea recta recibe ciertas modificaciones, es decir que se extiende, quedando de la siguiente forma: =

+

+

Para muestra realicemos un ejemplo aplicativo: Una institución educativa sometió a los alumnos de una clase a un examen de aptitudes para determinar la capacidad de investigación bibliográfica que éstos poseen; para lograr el objetivo del examen, cada alumno debía investigar ciertas horas en la biblioteca y ciertas horas investigar en internet, los resultados fueron los siguientes:

Horas Biblioteca

Horas Internet

Nota examen

45

16

29

42

14

24

44

15

27

45

13

25

43

13

26

46

14

28

73


MANUAL DE ESTADÍSTICA

Lic. Johane Daniel Pérez Leberman 44

16

30

45

16

28

44

15

28

43

15

27

Para dar inicio a cualquier proceso de proyección se hace necesario determinar las variables constantes “a”, “ ” y “ ” para ello puede utilizarse el criterio de los mínimos cuadrados. Con los datos que se tienen se pueden aplicar las siguientes tres ecuaciones:

=

+

+

=

+

=

+

+ +

El primer paso es crear una tabla donde se concentre de forma ordenada la información, la misma debe contener los elementos necesarios que le den vida a las tres fórmulas antes descritas y de esa cuenta iniciar el proceso de resolución.

Y 45

16

29

1,305

464

720

2,025

256

42

14

24

1,008

336

588

1,764

196

44

15

27

1,188

405

660

1,936

225

45

13

25

1,125

325

585

2,025

169

43

13

26

1,118

338

559

1,849

169

46

14

28

1,288

392

644

2,116

196

44

16

30

1,320

480

704

1,936

256

45

16

28

1,260

448

720

2,025

256

44

15

28

1,232

420

660

1,936

225

43

15

27

1,161

405

645

1,849

225

441

147

272

12,005

4,013

6,485

19,461

2,173

Sustituyendo valores en las fórmulas se tendría: 272 = 10 + 441

+ 147

12,005 = 441 + 19,461

74

+ 6,485


MANUAL DE ESTADÍSTICA

Lic. Johane Daniel Pérez Leberman 4,013 = 147 + 6,485

+ 2,173

Para despejar este sistema de ecuaciones simultaneas, puede utilizar cualquiera de los métodos matemáticos generalmente aceptados (igualación, sustitución y suma y resta). Para el caso que nos compete se sugiere utilizar el método de las sumas y restas. 272 = 10 + 441

+ 147

12,005 = 441 + 19,461

+ 6,485

119,952 = 4,410 + 194,481

− 120,050 = −4,410 − 194,610 − 98 = −129

441

4,013 = 147 + 6,485

− 64,850

+ 6,485

+ 2,173

1,764,735 = 64,827 + 2,860,767

− 1,769,733 = −64,827 − 2,859,885 − 4,998 = 882

10

+ 64,827

− 23

12,005 = 441 + 19,461

-

− 4,998 = 882

-

− 958,293

− 23

882

− 4,998

− 86,436 = −113,778

− 20,286

− 644,742 = 113,778

441

+ 953,295

− 4,998

− 98 = −129

147

− 644,742

− 731,178 = −665,028 −731,178 = − 665,028

= 1.0995

− 98 = −129

− 98 = −129

− 98 = −129

− 23

− 23(1.0995) − 25.2885

− 98 + 25.2885 = −129 − 72.7115 = −129

− 72.7115 = −129

75

= 0.5637

129


MANUAL DE ESTADÍSTICA

Lic. Johane Daniel Pérez Leberman 272 = 10 + 441

+ 147

272 = 10 + 441(0.5637) + 147(1.0995) 272 = 10 + 248.5917 + 161.6265 272 − 248.5917 − 161.6265 = 10 − 138.2182 = 10 −138.2182 = = −13.82 10

=

+

+

= −13.82 + 0.5637

+ 1.0995

De ésta forma quedaría la ecuación para proyecciones en la regresión lineal múltiple, ahora bien, determine ¿Qué nota hubiera obtenido un alumno que dedicara 47 horas a investigación en biblioteca y 17 horas de investigación en internet?

= −13.82 + 0.5637(47) + 1.0995(17) = −13.82 + 26.4939 + 18.6915 = 31.37

Si el estudiante hubiera investigado 47 horas en biblioteca y 17 horas en internet la nota obtenida sería de 31.37 puntos.

76


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.