Investigaci贸n de Mercados II Unidad 1. Introducci贸n al An谩lisis Multivariante
MAP. Laura Medina Barboza
I. Introducción Los efectos del progreso tecnológicos, han extendido la capacidad de manipular datos, permitiendo la elaboración de investigaciones más sustantivas. Las limitaciones metodológicas no son ya un asunto crítico debido a la incorporación de la estadística tanto descriptiva como inferencial. Las técnicas de análisis multivariante están siendo aplicadas no sólo al análisis de los mercados si no también a la Industria, la administración y los centros de investigación de ámbito universitario. Las aproximaciones donde se consideraban consumidores homogéneos y caracterizados por un reducido número de variables demográficas y psicográficas en un mercado con múltiples restricciones (legales, económicas, competitivas, tecnológicas,etc.) son ahora cosa del pasado; mediante técnicas de análisis multivariante se han examinado adecuadamente las relaciones múltiples de este tipo para llegar a una comprensión de la toma de decisiones más completa y realista.
Toda la estadística teórica del análisis multivariante actual fue desarrollada mucho antes de la aparición de las computadoras, pero solo cuando se masificó el uso de la computadora los investigadores tuvieron los recursos necesarios para aplicarla al campo de la mercadotecnia; actualmente los programas como SPSS, SAS y DYANE, facilitan la aplicación de dichas técnicas. El análisis multivariante complementa la investigación cuantitativa; puede analizar las interrelaciones entre muchas variables de forma simultánea ya sea para identificar patrones de similitud o relaciones entre las variables, estimando su importancia relativa, prediciendo o explicando un comportamiento. El propósito de cualquier técnica de análisis multivariante es generalizar las observaciones de la muestra al conjunto de la población que supone un intento por saber los datos ausentes de las observaciones que no están en la muestra.
II. Definición del AM Se refiere a todos los métodos estadísticos que analizan
simultáneamente medidas múltiples de cada individuo u objeto sometido a investigación. Análisis de varias variables en una única relación o un
conjunto de relaciones. El propósito del análisis multivariante es medir, explicar, y
predecir el grado de relación de los valores teóricos (combinaciones ponderadas de variables). Por tanto el valor reside en los múltiples valores teóricos (combinaciones múltiples de variables) y no sólo en el número de variables u observaciones.
III. Conceptos básicos del AM El valor teórico de la variable Escala de medida Escalas no métricas Escalas métricas Error de medida y medidas multivariantes Validez y fiabilidad Significación estadística
a) El valor teórico Es la combinación lineal de variables compuesta a partir de
ponderaciones empíricas aplicadas a un conjunto de variables determinadas por el investigador. El investigador especifica las variables, mientras que las
ponderaciones son objeto específico de determinación por parte de la técnica multivariante, por ejemplo, un valor teórico de n variables ponderadas (X1 a Xn) puede expresarse matemáticamente así: Valor teórico: w1X1+w2X2+w3X3….+wnXn Donde: Xn = variable observada wn = ponderación determinada por la técnica multivariante.
El resultado es un valor único que representa una
combinación de todo el conjunto de variables que mejor se adaptan al objeto del análisis multivariante específico.
a) El valor teórico … El valor teórico (vt) se determina de forma diferente en cada
técnica multivariante:
En regresión múltiple el valor teórico se determina de tal forma que guarde la mejor correlación con la variable que se está prediciendo.
En el análisis discriminante, el valor teórico se forma de tal manera que produzca resultados para cada observación que diferencien de forma máxima entre grupo de observaciones.
En el análisis factorial, los valores teóricos se forman para representar mejor las estructuras subyacentes o la dimensionalidad de las variables tal y como se representan en sus intercorrelaciones.
En cada caso, el valor teórico capta el carácter multivariante
del análisis. Por tanto, el valor teórico es el objetivo central de cada técnica.
b) Escala de medida El análisis de los datos implica la separación, identificación y medida de la variación en un conjunto de variables, tanto entre ellas mismas como entre una variable Dependiente y uno o más independientes. La medida es importante dado que el investigador no puede separar o identificar una variación a menos que pueda ser mesurable. La medida representará con precisión el concepto de nuestro interés.
Datos no métricos
Nominales Ordinales
Datos métricos
Intervalares Racionales
b) Escalas de medida… Escalas nominales Asigna números que se usan para etiquetar o identificar sujetos u objetos. Las escalas nominales, proporcionan el número de ocurrencias en cada clase o categoría de la variable que se esta estudiando . Por tanto, los números o símbolos asignados a los objetos no tienen más significado cuantitativo que indicar la presencia o ausencia del atributo o características bajo investigación. Por ejemplo: Sexo, religión, partido político etc. Pudiendo asignar números a cada categoría, por ejemplo, 2 para mujeres y 1 para hombres.
Escalas ordinales Representan un nivel superior de precisión de la medida. Las variables pueden ser ordenadas o clasificadas con escalas ordinales en relación a la cantidad del atributo poseído. Cada subclase puede ser comparada con otra en términos de una relación de “mayor que” o “menor que”. Por ejemplo: Los diferentes niveles de satisfacción del consumidor individual con diferentes productos nuevos puede ilustrarse en una escala ordinal como muy satisfecho, satisfecho, no satisfecho, muy insatisfecho. Los números utilizados en escalas ordinales como éstas no son cuantitativos, dado que indican sólo posiciones relativas en series ordenadas.
b) Escala de medida … Las escalas de intervalos y de razón proporcionan el
nivel más alto de medida de precisión permitiendo realizar casi todas las operaciones matemáticas. La única diferencia real entre las escalas de intervalo y la razón es que las de intervalo tiene un punto cero arbitrario (0 = no significa ausencia de), mientras que las de razón tiene un cero absoluto. SPSS no hace ninguna diferencia con respecto a estas escalas y las denomina “Escala” en su medición.
b) Escala de medida … Entender la diferencia entre las escalas de medición permite al investigador:
1 Determinar
qué técnica multivariante es la más conveniente para los datos; esta consideración puede realizarse tanto para las variables dependientes como las independientes.
2 Desechar variables, de tal forma de que no se estén utilizando datos no métricos como si fueran métricos y así cambiar la aplicación de una técnica multivariante.
c) Error de media y medidas multivariantes El error de medida es el
grado en que los valores observados son representativos de los valores “verdaderos”. Todas las variables usadas en las técnicas multivariantes tienen algún grado de error de medida, sobre todo aquellas que provienen de una muestra. Las fuentes de error de
medida más comunes son:
Entrada de datos o imprecisión en la
medición. Por ejemplo, imponiendo escalas de puntuación de siete con puntos a la actitud de medida cuando el investigador sabe que los encuestados sólo pueden responder con precisión a una puntuación de tres puntos) Incapacidad de los encuestados para
proporcionar información precisa. Por ejemplo, las respuestas al ingreso de una economía familiar pueden ser razonablemente precisa pero rara vez lo son completamente. Imprecisión de la pregunta. Por ejemplo, en algunos casos el encuestado no es capaz de dar una respuesta, como en los casos de fertilidad o problemas de salud.
d) Validez y fiabilidad Todas las investigaciones tienen errores de medida; los cuales pueden reducirse mediante el uso adecuado de conceptos como la validez y la fiabilidad:
Fiabilidad. Es el grado en que la variable observada mide el valor “verdadero” y está “libre de error”; por tanto es lo opuesto al error de medida.
Validez. Es el grado en que
la medida representa con precisión lo que se supone que representa. Por ejemplo: Si se desea medir la mezcla de marketing lo más apropiado es: Desarrollar mediciones multivariantes o escalas sumadas, es decir, utilizar variables precio, producto, promoción y plaza como indicadores Utilizar una medida compuesta, dónde diversas variables se unen en una sola para representar un concepto.
e) Significación estadística En teoría …
En la práctica…
Todas las técnicas multivariantes, excepto el análisis cluster y el multidimensional, se basan en la inferencia estadística de los valores de una población entre variables de una muestra escogida aleatoriamente de esa población. Si estamos realizando un censo de toda la población, entonces la inferencia estadística no es necesaria, porque cualquier diferencia o relación por pequeña que sea es “verdad” y existe. Pero casi nunca se realiza un censo; por tanto, el investigador está obligado a deducir inferencias de una muestra. Para interpretar las inferencias estadísticas, el investigador debe especificar los niveles aceptables de error estadístico.
El nivel de significancia es comúnmente representado por el símbolo griego (alpha). Son comunes los niveles de significativicad del 5%, 1% y 0.1%. Si un contraste de hipótesis proporciona un valor P inferior a , la hipótesis nula es rechazada. Tal resultado es denominado como 'estadísticamente significativo'. Cuanto menor sea el nivel de significancia, más fuerte será la evidencia de que un hecho no se debe a una mera coincidencia (al azar).
e) Significación estadística… El nivel de significación de un test es un concepto estadístico asociado a la verificación de una hipótesis. En pocas palabras, se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula cuando ésta es verdadera (decisión conocida como error de Tipo I, o "falso positivo"). La decisión se toma a menudo utilizando el valor P (o p-value): si el valor P es inferior al nivel de significación, entonces la hipótesis nula es rechazada. Cuanto menor sea el valor P, más significativo será el resultado.
Figura 1. Significancia Estadística Realidad H : Cierta
H : Aceptar
1-
H : Falsa
Error tipo II
H : No aceptar
Error Tipo I
Decisión estadística
1- Potencia
e) Significación estadística…
Error de Tipo I, también conocido como alfa ( ). Esta es la probabilidad de rechazar la hipótesis nula cuando es cierta, o expresado en términos más sencillos, la posibilidad de que la prueba muestre significación estadística cuando la en realidad no esté presente. Error de Tipo II o beta ( ). Es la probabilidad de fallar en rechazar la hipótesis nula cuando realmente es falsa. Una probabilidad más interesante es 1- denominado la potencia del test de inferencia estadística. Potencia es la probabilidad de rechazar correctamente la hipótesis nula cuando debe de ser rechazada. Por tanto, la potencia es la probabilidad de que la inferencia estadística se indique cuando se esté presente.
Aunque la especificación alfa establece el nivel de significación estadística aceptable, es el nivel de potencia el que dicta la probabilidad de “éxito” en la búsqueda de las diferencias si es que realmente existen.
Los tipos de error Tipo I y Tipo II están inversamente relacionados, y a medida que el error tipo I se hace más restrictivo (se acerca a cero), el error de tipo II aumenta. Al disminuir el error de Tipo I también se reduce el poder de la prueba estadística. Por tanto, el analista tiene que conseguir un equilibrio entre el nivel de alfa y la potencia resultante.
e) Significación estadística… La potencia no es solo una función de alfa, está determinada por los siguientes factores:
Efecto Tamaño.- La probabilidad de conseguir significación estadística se basa no solo en consideraciones estadísticas sino también en la magnitud real del efecto que nos interesa (ejem. Correlación entre variables, diferencia de medidas entre dos grupos) en la población, denominado efecto tamaño. Los efectos de tamaño se miden en términos estandarizados para facilitar la comparación. Las diferencias respecto de la mediad se determinan en términos de desviaciones estándar, así que un efecto tamaño de 0,5 indica que la diferencia de la medida es la mitad de la desviación estándar. Para las correlaciones , el efecto tamaño se basa en la correlación efectiva entre las variables
El tamaño de la muestra.- Para cualquier nivel de alfa dado, el aumento de la muestra siempre produce una mayor potencia del test estadístico. Pero aumentar el tamaño de la muestra puede producir “demasiada” potencia. Por este hecho, entendemos que al aumentar el tamaño de la muestra, se observará que efectos cada cez más y más pequeños srán significativos, hasta que para muestras grandes casi cualquier efecto es significativo. El investigador debe tener siempre presente que el tamaó de la miuestra puede afectar a la prueba estadística tanto por hacerlo insensible (para miestras muy pequeñas) o demasiado sensibles (para muestras muy grandes).
Tabla 1. Niveles de potencia comparados Tamaño muestral
Niveles de potencia para la comparación entre dos medidas: variaciones por el tamaño de la muestra, el nivel de significación y el efecto tamaño
Alfa ( )=0,05 Efecto tamaño (ET)
Alfa ( )= 0,01 Efecto tamaño (ET)
Pequeño (0,2)
Moderado (0,5)
Pequeño (0,2)
Moderado (0,5)
20
0,095
0,338
0,025
0,144
40
0,143
0,598
0,045
0,349
60
0,192
0,775
0,067
0,549
80
0,242
0,882
0,092
0,709
100
0,290
0,940
0,120
0,823
150
0,411
0,990
0,201
0,959
200
0,516
0,998
0,284
0,992
Fuente: Solo Power Analysis, BMDP Statistical Software, Inc
III. Principales tipos de AM Métodos multivariados ¿Las variables dependen unas de otras?
Métodos de dependencia No. de variables dependie ntes Múltiples relaciones de Variables dependientes E independientes
Métrica
Varias variables dependientes en una relación única
Una variable dependiente en una relación única
¿Cuál es la escala de medida de las variables dependientes?
Métrica
Métodos interdependientes Es la estructura de Relaciones entre:
Variables
Casos/Encuestados
¿Cuál es la escala de medida de las variables dependientes?
¿Cómo son los atributos?
métrico
No métrica
Métrica
Objetos
No métrico
¿Cuál es la escala de medida de las variables independientes? No métrica
Modelo de Ecuaciones estructurales
Análisis De correlación Canónica
Análisis Multivariante de variables
No métrica Análisis De correlación Canónica Con variables ficticias
Regresión múltiple Análisis Conjunto
Análisis discriminante Modelo de probabilidad lineal
Análisis Factorial
Análisis cluster
Análisis multidimensional
Análisis De correspondencias
Métodos de dependencia Dependencia ¿Cuantas variables están Prediciendo o explicando?
Múltiples relaciones de Variables dependientes E independientes
Varias variables dependientes en una relación única ¿Cuál es la escala de medida de las variables dependientes?
Una variable dependiente en una relación única
¿Cuál es la escala de medida de las variables dependientes?
métrica ¿Cuál es la escala de medida de las variables independientes?
Métrica Modelo de Ecuaciones estructurales
Análisis De correlación Canónica
No métrica No métrica Análisis Multivariante de variables
Análisis De correlación Canónica Con variables ficticias
Métrica Regresión múltiple Análisis Conjunto
No métrica Análisis discriminante Modelo de probabilidad lineal
Métodos de interdependencia Interdependencia Es la estructura de Relaciones entre:
Objetos Variables
Casos/Encuestados
¿Cómo son los atributos?
métrico Análisis Factorial
Análisis cluster
Análisis multidimensional
No métrico Análisis De correspondencias
III. Clasificación …
Esta clasificación se basa en tres juicios que el analista debe hacer sobre el objeto de investigar y la naturaleza de los datos: • • •
¿Pueden dividirse las variables en dependientes o independientes basándose la clasificación en alguna teoría? Si puede hacerse, ¿cuántas de estas variables son tratadas como dependientes en un análisis simple? ¿Cómo son las variables medidas?
La selección de la técnica multivariante apropiada depende de las respuestas a estas tres cuestiones. • Análisis de dependencia: una variable o conjunto de variables es identificado como la variable dependiente y que va a ser explicada por otras variables conocidas como variables independientes . • Análisis de interdependencia: ninguna variable o grupo de variables es definido como independiente o dependiente. Más bien, el procedimiento implica el análisis de todas las variables del conjunto simultáneamente. (como en el análisis factorial).
IV. Guías para analizar e interpretar un estudio multivariado
La fuerza del análisis multivariante reside en sus medios para clasificar una variedad de posibles alternativas y encontrar aquellas que tienen significación estadística.
La significación práctica se refiere a la pregunta ¿y para qué?. Para cualquier aplicación en la gestión, los resultados deben tener un efecto demostrable que justifique la acción. En el terreno académico el investigador debe de fijarse no solo en la significación estadística de los resultados sino también en sus implicaciones teóricas y sustantivas, que en muchas ocasiones se deducen de su significación práctica.
El tamaño muestral afecta a todos los resultados: muestras pequeñas dan como resultados 1)muy poca potencia estadística de la prueba para identificar de forma realista resultados significativos o 2) fácilmente un “sobreaprovechamiento” de los datos de tal forma que sean artificialmente buenos porque se ajustan muy bien a la muestra, aunque no sean generalizables. Para muestras grandes, pueden hacer a los test estadísticos altamente sensibles se debe asegurar la significación práctica debido al aumento de la potencia estadística como consecuencia del tamaño muestral.
IV. Guías para analizar e interpretar un estudio multivariado
La influencia de atípicos, violaciones de los supuestos y la perdida de datos puede agravarse a través de varias variables y tener efectos sustancialmente diferentes. Procurar la parsimonia del modelo.- Buscar el grado en que un modelo logra la calidad del ajuste para cada coeficiente estimado. El objetivo no es minimizar el número de coeficientes o maximizar el ajuste si no maximizar la cantidad de ajuste por coeficiente estimado y evitar “sobreajustar”, el modelo con coeficientes adicionales que sólo consigan pequeñas ganancias en el ajuste del modelo. Evitar el error de especificación es evitar omitir una variable predictor crítica. Así como intentar evitar insertar variables indiscriminadamente; debido a que aumentan la capacidad del análisis para ajustar la muestra de datos pero a costa de sobre ajustar datos y hacerlos menos generalizables para la población. En segundo lugar, las variables irrelevantes no sesgan típicamente las estimaciones de las variables relevantes, pero pueden enmascarar los efectos verdaderos debido a la multicolineadad. Está representa el grado en el que cualquier efecto de una variable puede ser prevista o explicada por las otras variables del análisis. A medida que aumenta la multicolinealidad , la capacidad para definir el efecto de cualquier variable disminuye.
Atender a los errores.- Es necesario realizar varios análisis para poder responder a la pregunta ¿adónde podemos ir desde aquí?. La mejor respuesta es mirar los errores en la predicción, tanto si son los residuos del análisis de regresión, la ausencia de clasificación de observaciones en el análisis descriminante o las atípicos del cluster . El detectar los errores de predicción sirven como punto de partida para poder diagnosticar la validez de los resultados y como una indicación de las relaciones que quedan si explicar. Validar los resultados.- Estos se realizan de la siguiente manera 1) División de la muestra y el uso de una subsmuestra para estimar el modelo y usar una segunda submuestra para estimar la precisión predictiva. 2) Empleo de un análisis de “bootstrapping” o 3) Conseguir una muestra distinta para asegurar que los resultados son apropiados para otras muestras. Hay que recordar que el objetivo no es encontrar el mejor “ajuse” sólo para la muestra sino desarrollar el modelo que mejor describa la población en su conjunto.
Bootstrapping.- Forma de repetir la muestra en la que se extraen varias muestras De los datos originales con sustituciones para la estimación del modelo. Las Estimaciones de los parámetros y los errores estándar no se calculan bajo supuestos Estadísticos, sino a partir de observaciones empíricas.
V. El proceso para diseñar un modelo de un análisis multivariado 1 Definición del problema de investigación objetivos y técnica multivariante conveniente 2 Desarrollo del proyecto de análisis 3 Evaluación de los supuestos básicos de la técnica multivariante 4 Estimación del modelo multivariante y valoración del ajuste del modelo 5 Interpretación del valor teórico 6 Validación del modelo multivariante 7 Diagramación de flujos de decisiones
Paso 1: Definir el problema de investigación objetivos y técnica multivariante conveniente Para cualquiera de los dos
Se puede proponer una relación de dependencia: especificar los conceptos dependientes e independeintes (nótese que se define un concepto más que una variable) Se puede proponer una relación de interdependencia, se deberían determinar las dimensiones de la estructura o similitud.
objetivos, el investigador identifica primero las ideas o temas de interés en lugar de fijarse en las medidas a utilizar. Con ello se minimiza la posibilidad de que conceptos relevantes se vean omitidos en el esfuerzo por desarrollar medidas y definir los detalles del diseño Con los objetivos y el modelo conceptual especificados, el analista sólo tiene que elegir la técnica multivariante apropiada, basada en las características de medición de las variables dependientes e independientes. Se pueden especificar las variables antes del estudio; se pueden definir después de recoger los datos.
Paso 2: Desarrollo del proyecto de análisis El investigador debe
desarrollar un plan de análisis específico que dirija el conjunto de supuestos que subyacen en la aplicación de la técnica. Los supuestos van desde la consideraciones generales de tamaños de muestra mínimos o deseados, pasando por los tipos de variables permitidas o requeridas (métricas versus no métricas) y métodos de estimación, a supuestos tales como el tipo de medida de asociación usada en el análisis multidimensional.
Esto con el objetivo de que los
supuestos resuelven los detalles específicos y finalizan la formulación del modelo y los requisitos del esfuerzo de recogida de datos.
Paso 3: Evaluación de los supuestos básicos de la técnica multivariante
Se trata de analizar los supuestos
subyacentes, tanto estadísticos como conceptuales, que afectan sustancialmente a su capacidad para representar relaciones multivariantes, entre ellos: linealidad, Independencia de los términos de error, e Igualdad de las varianzas en una relación de dependencia.
Paso 4: Estimación del modelo multivariante y valoración del ajuste del modelo Se procede a la estimación efectiva del modelo
multivariante y a una valoración global del ajuste del modelo. En el proceso de estimación, el analista puede optar por distintas opciones para elegir las características específicas de los datos o maximizar el ajuste de los datos. Una vez hecho esto se evalúa el ajuste para averiguar si consiguen niveles aceptables sobre los criterios estadísticos, identifica las relaciones propuestas y consigue la significación práctica.
Paso 5: Interpretar el valor teórico
Una vez que se tiene un nivel aceptable del modelo al interpretar
el valor teórico se revela la naturaleza de las relaciones multivariantes. La interpretación de los efectos para variables individuales se realiza examinando los coeficientes estimados (ponderaciones) para cada variable en el valor teórico (por ejemplo, ponderaciones de regresión, cargas de los factores o utilidades conjuntas). La interpretación puede conducir a re-especificaciones adicionales de las variables y/o formulación del modelo, donde el modelo se estima de nuevo y se interpreta una vez más. El objetivo es identificar la evidencia empírica de las relaciones multivariantes de los datos muestrales que pueden generalizarse para el total de la población.
Paso 6: Validación del modelo multivariante El investigador debe de
someter a los resultados a un conjunto final de diagnósticos que aseguran el grado de generalidad de los resultados por los métodos de validación disponibles. Los intentos de validar el modelo se dirigen directamente hacia la demostración de la generalidad de los resultados al conjunto de la población.
Ambos diagnósticos añaden
poco a la interpretación de los resultados pero sirven para asegurar los resultados más descriptivos de los datos y su generalización al conjunto de la población.
Paso 6: Diagramación de flujos de decisiones El diagrama de flujos de decisiones proporciona al investigador
un método simplificado pero sistemático para la aplicación de la aproximación organizada al diseño de modelos multivariantes cuando se aplica cualquier técnica multivariante. La primera sección (pasos 1 a 3)se refiere a los temas abordados con la preparación para la propia estimación de modelos (es decir, los objetivos de investigación, consideraciones para el diseño de la investigación y ensayo para las suposiciones). La segunda acción del diagrama de flujos de decisiones (los pasos 4 a 6) se refiere a las cuestiones pertinentes a un modelo de estimación, interpretación y validación.
VI. Bases de datos Es necesario tener una comprensión básica de los
datos y las relaciones entre las variables. En los datos ausentes prescindibles, el investigador hace prescindibles estos datos ausentes usando una muestra probabilística de los encuestados seleccionados y así el investigador puede especificar que los procesos de datos ausentes causantes de las observaciones omitidas sean aleatorios y que los datos ausentes pueden explicarse como un error muestral en los procedimientos estadísticos.
Repasando lo aprendido Explicar qué es el análisis multivariante y cuándo es
apropiada su aplicación Definir y comentar las técnicas concretas incluidas en el análisis multivariante Determinar qué técnica multivariante es la indicada para un problema de investigación especifico. Explicar la naturaleza de las escalas de medida y su relación con las técnicas multivariantes Describir los aspectos conceptuales y estadísticos propios del análisis multivariante.
Glosario
Análisis cluster: técnica multivariante cuyo objetivo es agrupar a los encuestados o los casos con perfiles similares sobre una serie de características definidas. Similar al análisis factorial Q. Análisis de dependencia: grupo de técnicas estadísticas caracterizadas por considerar una variable o un conjunto de ellas como dependientes y el resto como independientes. El objetivo es predecir la(s) variable(s) dependiente(s). Un ejemplo lo constituye el análisis de regresión. Análisis de interdependencia.-Grupo de técnicas estadísticas en que las variables no se dividen en dependientes e independientes (por ejemplo análisis factorial),sino que se consideran como un único conjunto. Análisis de la varianza (ANOVA) técnica estadística empleada para determinar si las muestras provienen de poblaciones con medidas iguales. Él análisis univariante de la varianza utiliza una variable dependiente, mientras que el análisis multivariante de la varianza compara muestras basadas en dos o más variables dependientes. Análisis exploratorio.- Análisis que define posibles relaciones sólo de la forma más general y a continuación deja a las técnicas multivariantes la estimación de la(s) relación(es). –un ejemplo de esto es es análisis de regresión múltiple por etapas, en el método consiste en añadir variables predictor hastga que se cumpla algún criterio. Análisis factorial común.- Modelo factorial en el que los factores se basan en una matriz de correlación reducida. Es decir, se insertan las varianzas compartidas en el diagonal de la matriz de correlación, y los factores extraídos se basan solamente en la varianza común, con la exclusión de las varianzas específicas y de error. Análisis factorial “Q”.- Forma grupos de encuestados o casos basados en su similitud a una serie de características Análisis factorial “R”.- Analiza relaciones entre variables para identificar grupos de variables que forman dimensiones latentes (factores) Análisis multivariante.- Análisis de varias variables en una única relación o en un conjunto de relaciones. Análisis univaraiante de la varianza (ANOVA).- Técnica estadística que sirve para determinar, sobre la base de una medida dependiente, si las muestras provienen de poblaciones con igual media.
Bootstrapping.- Forma de repetir la muestra en la que se extraen varias muestras de los datos originales con sustituciones para la estimación del modelo. Las estimaciones de los parámetros y los errores estándar no se calculan bajo supuestos estadísticos, sino a partir de observaciones empíricas. Cargas de los factores.- Una correlación ente las variables originales y los factores, y la clave para entender la naturaleza de un factor específico. Las cargas de los factores al cuadrado indican qué porcentaje de la varianza en una variable original se atribuye a un factor. Colinealidad.- Expresión de la relación entre dos (colinealidad) o más (multicolinelidad variables interdependientes. Se dice que dos variables predictor exhiben una completa colinealidad si su coeficiente de correlación es 1 y una completa falta de colinealidad si su coeficiente de correlación es 0. La multicolinealidad aparece cuando una única variable predictor está altamente correlacionada con un conjunto de otras variables independientes. Un caso extremo de la colinealidad/multicolinealidad es la singularidad, en la que se puede predecir una variable independientemente perfectamente (es decir, correlación de 1,0) por otra variable independiente (de más de uno).