TEMA 1 CONCEPTOS BÁSICOS DE ANÁLISIS DE DATOS (I) Prof. Enrique Sanchis
CONTENIDOS • Tipos de variables y escalas de medida
• Introducción al muestreo
TIPOS DE VARIABLE Y ESCALAS DE MEDIDA
• Se llama medición al proceso de atribuir números a las características que presentan los elementos de una población y/o una muestra. • La asignación de números a las características se hace siguiendo unas reglas. • Por su parte las características a medir se llaman variables, mientras que las distintas modalidades de cada variable dan lugar al rango de valores.
Ejemplo: conocer características alumnos • Entre las características a conocer tenemos el sexo de los alumnos. • Variable: sexo. Dos modalidades: hombre/mujer • Medir consistirá en este caso en numerar a hombres y mujeres. Por ejemplo: mujer= 1 y hombre= 2 • Regla: dar un número distinto a cada modalidad.
Ejemplo: Medir el grado de motivación hacia la carrera “¿Cuál es el grado de motivación que tienes por cursar esta carrera?”
• Escala graduada: • • • • •
“Nada” = 1 “Poco” = 2 “Regular” = 3 “Mucho” = 4 “Muchísimo” = 5
• Aquí las reglas seguidas son dar a cada anclaje un número, pero no se dan de cualquier forma, sino dando un orden de menor a mayor.
Ejemplo: conocimiento en matemáticas • Examen con 20 preguntas de matemáticas con tres alternativas de respuesta (sólo 1 correcta). • Se decide dar notas desde 0 (ningún acierto) hasta 10 (todos correctos). • Además hay que realizar alguna fórmula para corregir la posibilidad de acertar por simple azar de entre las tres respuestas posibles.
Ejemplo: conocer características alumnos
• Todos estos son ejemplos de características para medir, que dan lugar en este caso a tres variables, “sexo”, “motivación” y “conocimiento de matemáticas”, con su rango de valores posibles (1-2; 1-5 y 1-20, respectivamente).
• Las variables pueden clasificarse de acuerdo a diversos criterios.
Figura 3 Tipos de variables en funci贸n de criterios clasificatorios Nominal Por escala de medida
Ordinal
Intervalo
Razon
Tipos de variables
Cualitativa Por criterio estadistico
Cuasicuantitativa
Cuantitativa
Por estatus en la investigacion
Independiente/predictor
Dependiente/criterio
Tipos de variables por escala de medida: • Stevens (1951, 1957) planteó que las variables podían tener distinto estatus métrico, y planteó cuatro posibles escalas de medida: • • • •
Nominal Ordinal Intervalo Razón
Tipos de variables por escala de medida: • Nominal: Aquellas variables que en verdad no tienen número natural, sino que responden a cualidades distintas. Ej.: sexo (hombre o mujer). • Ordinal: Se pueden ordenar las distintas modalidades, pero no es seguro que entre una modalidad y otra haya exactamente la misma distancia “real”. Ej.: si se pregunta ¿cuánto te gusta hacer deporte? Y las opciones son Nada, algo y mucho. No es seguro que para pasar de nada a algo haya la misma distancia que de algo a mucho.
Tipos de variables por escala de medida: • Intervalo: Cuando no sólo hay orden sino que los número que tienen misma distancia entre ellos mantienen esa distancia en la realidad también. Ejemplo: Medimos la altura en cm y un sujeto tiene 170 cm y otro 190cm, es evidente que se diferencian 20 cm entre sí. Otros dos sujetos de 140cm y 160 cm están en otro punto d la escala, pero siguen teniendo la misma distancia entre ellos que los dos primeros. • Razón: Cuando se cumple las condiciones de la escala de intervalo, pero además el cero es absoluto (existe en realidad, al menos potencialmente).
Figura 3 Tipos de variables en funci贸n de criterios clasificatorios Nominal Por escala de medida
Ordinal
Intervalo
Razon
Tipos de variables
Cualitativa Por criterio estadistico
Cuasicuantitativa
Cuantitativa
Por estatus en la investigacion
Independiente/predictor
Dependiente/criterio
Tipos de variables por criterio estadístico: • Categóricas o cualitativas: se corresponden con las nominales. Ej.: sexo (hombre o mujer). • Cuasicuantitativas o semi-cuantitativas: solamente cuenta el orden. Ej.: las posiciones de llegada de una carrera (1º, 2º, 3º…). • Cuantitativas: el número tiene significado en sí mismo y representa relaciones cuantitativas razonablemente claras. Ej.: edad (24, 32, 56…).
Figura 3 Tipos de variables en funci贸n de criterios clasificatorios Nominal Por escala de medida
Ordinal
Intervalo
Razon
Tipos de variables
Cualitativa Por criterio estadistico
Cuasicuantitativa
Cuantitativa
Por estatus en la investigacion
Independiente/predictor
Dependiente/criterio
Tipos de variables por estatus en la investigación: • Por otra parte, las variables se pueden distinguir por el estatus que tienen en la investigación, por el papel que juegan. • Aunque no son los únicos papeles, ya que otros son posibles, los más importantes son los de variables independientes y dependientes.
Tipos de variables por estatus en la investigación: • Variable independiente o predictora: es la que en una investigación dada se asume que produce un efecto o es capaz de predecir a otra. Ejemplo: Se puede pensar que la variable peso levantado en un banco de pesas tienen un efecto sobre el desarrollo muscular. En este caso la variable independiente será el peso levantado. • Variable dependiente o criterio: es la que se ve afectada en una investigación dada. Ejemplo: Si queremos explicar el peso de una muestra de personas, entonces la variable dependiente es precisamente el peso, y habrá que buscar en la investigación qué variables independientes pueden explicarlo, como la ingesta de calorías o el ejercicio físico realizado.
Tipos de variables por estatus en la investigación: • Evidentemente lo que en una investigación puede ser variable independiente, en otra puede ser dependiente y viceversa. • Por ejemplo, la ingesta de calorías por día puede ser una variable independiente que explique el peso, pero en otros casos podemos querer explicar precisamente esa ingesta de calorías (se transforma en dependiente), en función de, por ejemplo, el poder adquisitivo.
• Una vez se han medido a uno o varios individuos en una o varias variables, entonces se obtienen observaciones. • Cada observación siempre ha de quedar representada por un único número, es por tanto una medición. • Las observaciones pueden, a su vez, dividirse en dependientes e independientes.
• Si las observaciones vienen de muestreos aleatorios, se puede decir que a largo plazo son representativas de la población. • Por el contrario si el muestreo no es aleatorio, esto no puede asegurarse.
INTRODUCCIÓN AL MUESTREO
Introducción al muestreo: • Población: todo el conjunto de objetos de interés (finitos o infinitos). • Muestra: Subconjunto de los elementos de una población. Objetivo: Poder describir la población de partida. Para ello, la muestra debe ser representativa de su correspondiente población. Muestreo: procedimiento de extracción de la muestra.
Introducción al muestreo: • El muestreo debe permitirnos analizar críticamente qué tipo de muestra necesitamos, en base a los objetivos de la investigación y los recursos disponibles. • Nos debe responder a tres preguntas: ¿Necesitamos una muestra? ¿Qué tipo de muestreo vamos a realizar? ¿Qué tamaño de muestra es necesario para cierto margen de error?
Población: • La población objetivo es el grupo ideal de objetos/sujetos que serán sometidos al diseño de encuesta. • Es el total de personas o cosas sobre la que queremos, en principio, analizar sus puntuaciones en una serie de variables.
Población: • En muchas ocasiones, definir la población objetivo parece muy sencillo. • Por ejemplo, un psicólogo deportivo puede estar interesado en la relación entre motivación y rendimiento en pruebas de atletismo en la actualidad. Tal interés, en principio, parece demandar una población objetivo de todos los atletas del mundo. Pero claro, esto nos lleva a importantes cuestiones: ¿de todas las edades? ¿de todo el mundo? Etcétera, lo que puede hacer que la población objetivo definida como “ideal” sea muy grande, infinita o prácticamente infinita.
Ejemplo: • Supongamos que los encuestadores han sido contratados por una empresa de 10.000 empleados con el objetivo de saber la satisfacción laboral de éstos, y sus relaciones con ciertas variables organizacionales, entonces la población objetivo es claramente el número total de empleados. • Sin embargo, si esa misma empresa desea saber la satisfacción de las empleadas con niños menores de tres años con la carga de trabajo, entonces solamente las que están en esa situación, del total de diez mil empleados, es la población objetivo.
Situaciones en las que resulta conveniente recoger muestras, frente a medir la población:
• Cuando la población es tan grande que no es posible, para las posibilidades de la investigación, medir a todos. • Cuando la población es suficientemente uniforme como para que cualquier muestra bien extraída sea una buena representación de ésta. • Cuando el proceso de encuesta (la medición) de los elementos es destructivo.
Tipos de muestreo: • ¿Cómo conseguir muestras? • Los principales tipos de muestreo pueden dividirse, con matizaciones, en dos, probabilístico y no probabilístico.
Tipos de muestreo: Figura 5. Tipos de muestreo Muestreo aleatorio simple PROBABILÍSTICO
Muestreo estratificado Muestreo por conglomerados o áreas
Muestreo sistemático SEMIPROBABILÍSTICO
Semiprobabilístico inferior Semiprobabilístico superior
Muestreo intencional u opinático NO PROBABILÍSTICO Muestreo sin norma
Muestreo probabilístico: • Es el único científicamente válido. • La probabilidad de selección de cada miembro es conocida. • Los tipos de muestreos probabilísticos más utilizados son: Muestreo aleatorio simple Muestreo estratificado Muestreo por conglomerados o áreas
Muestreo no probabilístico: • Aquel en que la probabilidad de selección de cada elemento del marco no es conocida, ni calculable. • La selección para la muestra se basa en algo más que el azar. • Existen diversos tipos de muestreo no probabilístico. (Azorín y Sánchez-Crespo, 1986): Muestreo sin norma Muestreo intencional u opinático
Muestreo semi-probabilístico: • Aquellos tipos de muestreo que sí presentan características probabilísticas, pero no son totalmente probabilísticos. • Mosteller y Tukey (1954): Muestreo semiprobabilístico superior Muestreo semiprobabilístico inferior (por cuotas) Muestreo sistemático
EJEMPLOS
• • • • • • • • • • •
Sexo Religión Número de hijos ROM Altura Peso Tipo de universidad (pública, privada, etc) Color de ojos Marca de móvil Equipo de fútbol del que se es socio Repeticiones de un ejercicio de fuerza
• • • • • • • • • • •
Sexo: variable cualitativa (nominal) Religión: variable cualitativa (nominal) Número de hijos: variable cuantitativa discreta ROM: cuantitativa continua Altura: cuantitativa continua Peso: cuantitativa continua Tipo de universidad: cualitativa (nominal) Color de ojos: cualitativa (nominal) Marca móvil: cualitativa (nominal) Equipo de fútbol: cualitativa (nominal) Repeticiones: cuantitativa discreta
• • • • • • •
Autoestima Dolor Estilos de música Marcas de los 100 metros libres Número de goles de un equipo Canal de televisión Emisora de radio
• • • •
Autoestima: cualitativa (ordinal) Dolor: cualitativa (ordinal) Estilos de música: cualitativa (nominal) Marcas de los 100 metros libres: cuantitativa continua • Número de goles de un equipo: cuantitativa discreta • Canal de televisión: cualitativa (nominal/ordinal) • Emisora de radio: cualitativa (nominal/ordinal)