Instituto de Ciencias Sociales y Humanidades - UAEH
Introducci贸n a SPSS L.I. Alejandro Serv铆n G贸mez Computaci贸n II
Curso básico de SPSS
L.I. Alejandro Servín Gómez
COMENZANDO A TRABAJAR CON SPSS
Los campos de aplicación de la estadística son muy diferentes, pero los métodos son los mismos, dando lugar a la estandarización y automatización de las técnicas estadísticas, con una gran variedad de programas informáticos que se diferencian entre sí por variados aspectos (entornos de trabajo, capacidad, costos, etc.). Entre esta gama de software se encuentra el SPSS, el cual es una potente herramienta para realizar análisis estadísticos, tiene más de tres décadas de existencia, fue elaborado por Hull y Nie y quizás sea el programa informático de estadística con mayor difusión a nivel mundial. Aprender a manejar el SPSS tiene muchas ventajas. La primordial es la seguridad y confianza que brinda el tener esta herramienta que efectúa los cálculos más complejos en el mundo de la estadística de manera eficiente y eficaz, y con un mínimo de esfuerzos. Posiblemente esta sea la razón por la cual este programa es muy utilizado en el mundo académico y laboral. Es una de las herramientas más utilizadas en investigación comercial y en otros muchos campos de investigación de las ciencias sociales. Es necesario aclarar que a pesar de la facilidad que resulta el poder realizar cálculos con gran facilidad con los modernos programas informáticos, es imprescindible que el investigador mantenga el control de la situación en todo momento, y sea él quien se convierta en el tomador de decisiones; ya que el software lo único que hace es obedecer una orden, pero no manifiesta en ningún momento si el diseño de nuestro estudio es el adecuado, si la técnica es la idónea, etc., ya que presionar un botón o dar un clic es muy sencillo, por lo que debemos estar siempre alertas al momento de realizar nuestro análisis estadístico. Para el desarrollo de éste curso introductorio al SPSS (Statistical Package for the Social Sciences) , utilizaremos la versión 15 en español para windows.
2
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Al comenzar una sesión de trabajo con el SPSS aparece una ventana de apariencia similar a una hoja de Excel, que es el Editor de Datos, tal y como se muestra en la Figura 1 . Esta es la ventana principal del SPSS, pero no la única. Para irnos familiarizando con las diversas funciones del programa, estudiaremos en un primer momento las diversas ventanas y menús con que cuenta el SPSS, profundizando posteriormente en cada uno de ellos y utilizando ejercicios prácticos para una mejor compresión de la temática.
En la Fig. 1 observamos en el encabezado el título principal del archivo en el cual se está trabajando, en este caso “Sin título”, porque se iniciará con la creación de una base de datos. En la siguiente línea se tiene la barra del menú con las opciones de archivo, edición, ver, datos, transformar, analizar, gráficos, utilidades, ventaja, y ayuda (?) . Luego tenemos la barra de herramientas (ver figura 2), con cada uno de sus íconos.
3
Curso básico de SPSS
L.I. Alejandro Servín Gómez
En su orden, de izquierda a derecha, cada icono indica la siguiente acción:
Abrir archivo Guardar archivo Imprimir Recuperar cuadro de diálogo Deshacer Rehacer Ir a gráfico Ir a caso Variables Buscar Insertar casos Insertar variable Segmentar archivo Ponderar casos Seleccionar casos Etiquetas de valor Usar conjuntos
La línea siguiente a la Barra de Herramientas (como se observa en la Figura 1.3, en el círculo en rojo), indica el valor o atributo de la variable en esa celda (fila y columna). Y el círculo en azul muestra las solapas de vista de datos (valores en la base de datos) y vista de variables (codificaciones realizadas para cada una de las variables) para el fichero en el que se está trabajando en ese instante.
4
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Ahora veamos cada una de las opciones y subopciones que se encuentran en la barra de menú principal. En la Figura 4 se observa la primera opción del menú, Archivo , que incluye:
Nuevo. Crea nuevos ficheros o bases de datos, sintaxis, resultados o de procesos Abrir. Abre ficheros o bases de datos existentes, sintaxis, resultados, de procesos u otros); Abrir base de datos. Nueva consulta, editar consulta o ejecutar consulta Leer datos de texto. P uede transformar archivos de texto a tablas Guardar. Guarda el archivo actual Guardar Como. Guarda el archivo actual con otro nombre y en otro directorio si así se quiere Mostrar información de datos. Muestra los archivos de datos posibles Hacer caché de datos. Crea memoria para los datos que se están introduciendo Imprimir Imprime la operación actual. Presentación preliminar. Se visualiza en pantalla completa la tarea actual, tal y como se imprimirá Cambiar servidor. Se tiene la posibilidad de cambiar de servidor al que nos encontramos conectados. Detener procesador. Interrumpe el procesamiento y análisis de datos en el SPSS Datos usados recientemente Muestra un listado de los datos utilizados mas recientemente Archivos usados recientemente Muestra los archivos que se han utilizado recientemente Salir Opción para salir del SPSS.
5
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Luego tenemos la opción de Edición (Figura 5), que presenta la siguientes subopciones:
6
Curso básico de SPSS
L.I. Alejandro Servín Gómez
En esta opción tenemos las siguientes subopciones: Deshacer Definir valor de casilla Deshace la última acción. Muy útil para rectificar. Rehacer Definir valor de casilla Rehace la última acción deshecha Cortar Corta la selección para almacenarla en el portapapeles Copiar Copia la selección para almacenarla en el portapapeles Pegar Pega el contenido del portapapeles en la ubicación en donde se encuentre el cursor Pegar variables Pega la variable del portapapeles en donde se encuentre ubicado el cursor Eliminar Borra la selección Buscar Realiza la búsqueda de datos que se especifiquen Opciones Presenta opciones de tablas, gráficos, procesos, etc.
La Figura 6 muestra la opción Ver , y cuenta con las siguientes subopciones: Barra de estado (con esta opción se activa y desactiva la barra de estado); Barras de herramientas (activa y desactiva las barras de herramientas); Fuentes Con esta opción se cambia el tamaño y estilos de las fuentes. Textos por ejemplo Cuadrícula Con ésta opción se activa y desactiva la cuadrícula del editor de datos Etiquetas de valor Sitúa etiquetas de valor en las variables seleccionadas 7
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Variables Con esta opción se activa el visor de variables en el editor de datos) La Figura 7 presenta la opción Datos , que es una de las opciones que mayor uso tienen cuando se trata de realizar análisis con el SPSS. Entre las subopciones tenemos las siguientes: Definir propiedades de variables (etiqueta los valores de las variables y define otras propiedades después de explorar datos);Copiar propiedades de datos (permite copiar sobre el archivo de datos de trabajo, las propiedades de un conjunto de datos y de las variables seleccionadas); Definir fechas (Definir fechas genera variables de fecha que se pueden utilizar para establecer la periodicidad de una serie temporal y para etiquetar los resultados de los análisis de series temporales); Insertar variable (permite insertar una variable en el editor); Insertar caso (permite insertar un caso en el editor); Ir a caso (permite situarse en un caso determinado); Ordenar casos (permite ordenar casos según criterios preestablecidos); Transponer(transpone filas por columnas en el editor de datos); Reestructurar (reestructura los datos de varias variables – columnas- en un único caso y convertirlos en grupos de casos relacionados –filasy viceversa);Fundir archivos (permite mezclar archivos por casos o por variables); Agregar (permite agregar variables a un archivo); Diseño ortogonal (admite diseñar y mostrar diseños factoriales ortogonales); Segmentar archivo (admite segmentar archivos según ciertos criterios); Seleccionar casos (admite la elección de uno o varios casos); Ponderar casos (permite la ponderación de casos).
La Figura 8 muestra la opción Transformar , y contiene las siguientes subopciones: Calcular (realiza cálculos); Semilla de aleatorización (fija la semilla para el cálculo de números aleatorios); Contar apariciones (encuentra frecuencias absolutas de valores); Recodificar (recodifica los valores de una variable); Categorizar variables (convierte variables cuantitativas a 8
Curso básico de SPSS
L.I. Alejandro Servín Gómez
cualitativas); Asignar rangos a casos(crea nuevas variables que contienen rangos); Recodificación automática (convierte los valores numéricos y de cadena en valores enteros consecutivos); Crear serie temporal (crea una variable tipo serie de tiempo); Reemplazar valores perdidos (Reemplazar valores perdidos creando nuevas variables); Ejecutar transformaciones pendientes (realizar transformaciones en espera).
La opción Analizar en la barra del menú básico contiene las siguientes subopciones (ver figura 9): Informes, Estadísticos descriptivos, Tablas, Comparar medias, Modelo lineal general, Modelos mixtos, Correlaciones, Regresión, Loglineal, Reducción de datos, Escalas, Pruebas no paramétricas, Series temporales, Supervivencia y Respuestas múltiples.
9
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Considero ésta opción del menú (Analizar) como una de las más importantes dentro del SPSS, motivo por el cual se estudiarán cada una de sus subopciones por separado. La Figura 10 muestra la subopción Informes , el cual abarca los siguientes ítems: Cubos OLAP (del inglés On-Line Analytic Processing -Procesamiento analítico interactivo-, calcula totales, medias y otros estadísticos univariados para variables de resumen continuas dentro de las categorías de una o más variables categóricas de agrupación); Resúmenes de casos (calcula estadísticos de subgrupo para las variables dentro de las categorías de una o más variables de agrupación); Informe de estadísticos en filas(genera informes en los cuales se presentan distintos estadísticos de resumen en filas); Informe de estadísticos en columnas (genera informes de resumen en los que diversos estadísticos de resumen aparecen en columnas distintas). Figura 10.
La figura 11 presenta la subopción de Estadísticos descriptivos, que contienen los siguientes ítems:Frecuencias (muestra estadísticos y representaciones gráficas que resultan útiles para describir muchos tipos de variables, y es un buen procedimiento para la inspección inicial de datos); Descriptivos (presenta estadísticos de resumen univariados para varias variables en una única tabla y calcula valores tipificados, denominados generalmente como puntuaciones “Z”); Explorar (genera estadísticos de resumen y representaciones gráficas, bien para todos los casos o bien de forma separada para grupos de casos); Tablas de contingencia (crea tablas de clasificación doble y múltiple y, además, proporciona una serie de pruebas y medidas de asociación para las tablas de doble clasificación); Razón (brinda una amplia lista de estadísticos de resumen para describir la razón entre dos variables de escala, por ej. mediana, moda, desviación típica, máximos y mínimos, y otros muy usuales en investigación).
10
Curso básico de SPSS
L.I. Alejandro Servín Gómez
A continuación tenemos la figura 12, que muestra la subopción de Tablas, con la cual usted puede realizar todo tipo de análisis y mostrarlos de diversas maneras, siempre en formato de tablas. Los ítems que se incluyen acá son: Tablas personalizadas (el investigador selecciona las variables y las medidas de resumen que aparecerán en la tabla); Conjuntos de respuestas múltiples (se utiliza para agrupar frecuencias de respuestas por indicadores y variables); Tablas básicas (genera tablas con calidad de publicación que muestran estadísticos de clasificación cruzada y de subgrupo); Tablas generales (se pueden generar tablas que muestren diferentes estadísticos para distintas variables, variables de respuestas múltiples, anidación y apilación mixta o totales complejos); Tablas de respuestas múltiples(produce tablas de frecuencia y de contingencia básicas en las que una o más variables es un conjunto de respuestas múltiples); Tablas de frecuencias (permite generar tablas especiales que contengan varias variables con los mismos valores).
Comparar medias (Figura 13), que contiene en orden respectivo: Medias (calcula medias de subgrupo y estadísticos univariados relacionados para variables dependientes dentro de las categorías de una o más variables independientes); Prueba T para una muestra (contrasta si la media de una sola variable difiere de una constante especificada); Prueba T para muestras independientes (compara las medias de dos grupos de casos); Prueba T para muestras relacionadas (compara las medias de dos variables de un solo grupo); ANOVA de un factor (este procedimiento genera un análisis de varianza de un factor para una variable dependiente cuantitativa respecto a una única variable de factor -variable independiente-).
11
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 14 presenta la opción de Modelo lineal general, que incluye los siguientes apartados:Univariante (proporciona un análisis de regresión y un análisis de varianza para una variable dependiente mediante uno o más factores o variables); Multivariante (proporciona un análisis de regresión y un análisis de varianza para variables dependientes múltiples por una o más covariables o variables de factor); Medidas repetidas (analiza grupos de variables dependientes relacionadas que representan diferentes medidas del mismo atributo); Componentes de la varianza (se emplea para modelos de efectos mixtos, estima la contribución de cada efecto aleatorio a la varianza de la variable dependiente).
Posterior al Modelo lineal general, los siguientes apartados son: Modelos mixtos (en este cuadro de diálogo le facilita al investigador seleccionar variables que definen sujetos y observaciones repetidas, y elegir una estructura de covarianzas para los residuos) y Correlaciones (incluye correlaciones parciales, bivariadas y distancias). La figura 15 presenta la subopción de Regresión, que incluye los siguientes apartados: Lineal (estima los coeficientes de un modelo lineal, con una o más variables independientes, que mejor prediga el valor de la variable dependiente); Estimación curvilínea (genera estadísticos de estimación curvilínea por regresión y gráficos relacionados para varios modelos diferentes de estimación curvilínea por regresión); Logística binaria (es de mucha utilidad para los casos en los que se desea predecir la presencia o ausencia de una característica o resultado según los valores de un conjunto de variables predictoras); Logística multinomial (es útil en aquellas situaciones en las que el investigador desee poder clasificar a los sujetos según los valores de un conjunto de variables predictoras); Ordinal(permite dar forma a la dependencia de una respuesta ordinal politómica sobre un conjunto de predictores, que pueden ser factores o covariables); Probit (mide la relación entre la intensidad de un estímulo y la proporción de casos que presentan una cierta respuesta a dicho estímulo); No lineal (es un método para encontrar un modelo no lineal para la relación entre la variable dependiente y un conjunto de variables independientes); Estimación ponderada (permite calcular los coeficientes de un modelo de regresión lineal mediante mínimos cuadrados ponderados -MCP, WLS-, de forma que se les dé mayor ponderación a las observaciones más precisas -es decir, aquéllas con menos variabilidad- al determinar los coeficientes de regresión); Mínimos 12
Curso básico de SPSS
L.I. Alejandro Servín Gómez
cuadrados en dos fases (utiliza variables instrumentales que no estén correlacionadas con los términos de error para calcular los valores estimados de los predictores problemáticos); Escalamiento óptimo (amplía la aproximación típica mediante un escalamiento de las variables nominales, ordinales y numéricas simultáneamente).
Después de Regresión, tenemos la opción Loglineal analiza las frecuencias de las observaciones incluidas en cada categoría de la clasificación cruzada de una tabla de contingencia, e incluye los apartados de General, Logit y Selección del modelo . En la figura 16 se tiene la subopción de Clasificar, que es una de las subopciones que mayor uso tiene cuando de realizar análisis de conglomerados se trata. Cuenta con los siguientes ítems:Conglomerados en dos fases (es una herramienta de exploración que descubre las agrupaciones naturales -o conglomerados- de un conjunto de datos que, de otra manera, no sería posible detectar);Conglomerado de K medias (con este procedimiento se intenta identificar grupos de casos relativamente homogéneos basándose en las características seleccionadas y utilizando un algoritmo que puede gestionar un gran número de casos); Conglomerados jerárquicos (combina los conglomerados basándose en las características seleccionadas y los clasifica en orden de jerarquía);Discriminante (este análisis resulta útil para las situaciones en las que se desea construir un modelo predictivo para pronosticar el grupo de pertenencia de un caso a partir de las características observadas de cada uno de ellos).
13
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Otra opción interesante es la de Reducción de datos, que se observa en la figura 17, con los siguientes apartados: Análisis factorial (identifica variables subyacentes, o factores, que expliquen la configuración de las correlaciones dentro de un conjunto de variables observadas); Análisis de correspondencias (describe las relaciones existentes entre dos variables nominales, recogidas en una tabla de correspondencias, sobre un espacio de pocas dimensiones, mientras que al mismo tiempo se describen las relaciones entre las categorías de cada variable); Escalamiento óptimo (permite realizar escalados de las variables, cual se tratara de un mapa).
La figura 18 presenta la opción Escalas , con los siguientes ítems: Análisis de fiabilidad (permite estudiar las propiedades de las escalas de medición y de los elementos que las constituyen);Escalamiento multidimensional (trata de encontrar la estructura de un conjunto de medidas de distancia entre objetos o casos); Escalamiento multidimensional -PROXSCAL- (su propósito es encontrar la estructura existente en un conjunto de medidas de proximidades entre objetos).
Continuando con nuestro caminar por el SPSS, la siguiente subopción la componen las Pruebas no paramétricas , figura 19, entre las que se tienen las siguientes: Chi-cuadrado (tabula una variable en categorías y calcula un estadístico de chi-cuadrado); Binomial (compara las frecuencias observadas de las dos categorías de una variable dicotómica con las frecuencias esperadas en una distribución binomial con un parámetro de probabilidad especificado. Por defecto, el parámetro de probabilidad para ambos grupos es 0,5); Rachas (contrasta si es aleatorio el orden de aparición de dos valores de una variable); K-S de 1 muestra (Prueba de Kolmogorov-Smirnov para una muestra compara la función de distribución acumulada observada de una variable con una distribución teórica determinada, que puede ser la normal, la uniforme, la de Poisson o la 14
Curso básico de SPSS
L.I. Alejandro Servín Gómez
exponencial); 2 muestras independientes (compara dos grupos de casos existentes en una variable); K muestras independientes (realiza pruebas para varias muestras independientes compara dos o más grupos de casos respecto a una variable); 2 muestras relacionadas (compara las distribuciones de dos variables); K muestras relacionadas (compara las distribuciones de dos o más variables).
La figura 20 presenta las Series temporales, contiene los siguientes ítems: Suavizado exponencial(suaviza componentes irregulares de datos de series temporales, para ello hace uso de una variedad de modelos que incorporan diferentes supuestos acerca de la tendencia y la estacionalidad); Autorregresión(estima un modelo de regresión lineal con errores autorregresivos de primer orden); ARIMA (estima modelos Arima -Modelo Autorregresivo Integrado de Media Móvil- univariados estacionales y no estacionales, también conocidos como modelos "Box-Jenkins"); Descomposición estacional (estima factores estacionales multiplicativos o aditivos para las series temporales).
La figura 21 nos muestra la opción Supervivencia, que contiene los siguientes apartados: Tablas de mortalidad (se utiliza en situaciones en las se desea examinar la distribución de un período entre dos eventos, como por ejemplo, la duración del empleo); Kaplan-Meier (se basa en la estimación de las probabilidades condicionales en cada punto temporal cuando tiene lugar un evento y en tomar el límite del producto de esas probabilidades para estimar la tasa de supervivencia en cada punto temporal); Regresión de Cox (es un método para crear modelos para datos de tiempos de espera hasta un evento con casos 15
Curso básico de SPSS
L.I. Alejandro Servín Gómez
censurados presentes); Cox con covariable dependiente del tiempo (denominado también modelo de regresión de Cox extendido, el cual permite especificar las covariables dependientes del tiempo).
Finalmente, en la opción de Análisis tenemos como una última subopción Respuestas múltiples , que está integrada por las siguientes funciones: Definir conjuntos (agrupa variables elementales en conjuntos de categorías múltiples y de dicotomías múltiples, para los que se pueden obtener tablas de frecuencias y tablas de contingencia); Frecuencias ; Tablas de contingencia. La figura 22 presenta en forma desglosada todas las subopciones que contiene la opción de Gráficos . Esta opción nos permite realizar un sinfín de gráficas, de todo tipo, forma, en segunda o en tercera dimensión, como los clásicos de barras, histogramas, de dispersión, líneas o curvas, o los poco conocidos diagramas de caja. En esta opción usted tiene mucha versatilidad al momento de diseñar los gráficos para la presentación de de resultados en su investigación.
16
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 23 presenta la opción de Utilidades dentro de la Barra del Menú Principal, y esta contiene las siguientes funciones: Variables (muestra información sobre la definición de la variable seleccionada actualmente); Información del archivo (muestra en un listado las variables de las cuales se compone el archivo); Definir conjuntos (crea subconjuntos de variables que se muestran en las listas de origen de los cuadros de diálogo); Usar conjuntos (restringe las variables mostradas en las listas de origen de los cuadros de diálogo a los conjuntos seleccionados que haya definido); Ejecutar proceso (busca y ejecuta un archivo seleccionado, por ejemplo, una base de datos); Editor de menús (se puede personalizar los menús utilizando este editor).
17
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 24 muestra la opción de Ventana , que muestra las ventanas que se encuentran activas en ese instante, tales como los archivos o bases de datos en las que nos encontremos trabajando actualmente, se observarán activas en ésta opción.
En la figura 28 se observa la forma de realizar una Búsqueda en la opción de Ayuda. Lo único que usted debe hacer es colocar una palabra clave, tal y como señala el círculo color rojo. Luego, al obtener el listado de temas relacionados, usted debe elegir cual es el tema que quiere estudiar, y puede dar doble clic sobre el tema escogido o simplemente dar un clic en la opción de "mostrar tema".
18
Curso básico de SPSS
L.I. Alejandro Servín Gómez
En la figura 29 se observan los Favoritos en la opción de Ayuda . Acá se tiene la libertad de agregar temas que a nos parezcan de interés y se añaden a mis Favoritos. El círculo en color azul muestra el tema que el investigador desea añadir, le da clic en el botón "agregar" y el círculo en color rojo muestra la lista de temas que hasta el momento se han agregado a los temas favoritos.
19
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 30 brinda detalles del Asesor estadístico con que cuenta la opción de Ayuda del SPSS. Este asesor es de gran utilidad para irnos familiarizando con las funciones básicas del SPSS, pero hay que tomar en cuenta que este asesor no es un sustituto del analista de datos, de manera que hay que tener algunas ideas claras para poder sacarle provecho.
20
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 31 muestra la denominada ayuda contextual , la cual es un sistema rápido para obtener ayuda rápida que brinda información concreta sobre aspectos relacionados con la parte específica del programa desde la que se solicita la ayuda. Por ejemplo, el primer recuadro de la figura es el diálogo deFrecuencias y el siguiente es la Ayuda que el SPSS brinda sobre éste tema.
21
Curso básico de SPSS
L.I. Alejandro Servín Gómez
22
Curso básico de SPSS
L.I. Alejandro Servín Gómez
ARCHIVO DE DATOS UNA NUEVA BASE DE DATOS Para irnos familiarizando aún más con nuestro programa SPSS, vamos a proceder a crear una nueva base de datos. Al cargar o abrir el programa SPSS surge un recuadro como lo muestra la figura 35(a), entonces, para crear nuestra propia base de datos damos un clic en la opción “ introducir datos ” y luego clic en “ aceptar ”. Lo primero que debemos notar es que para ingresar valores ó datos en el SPSS, las filas representan sujetos o casos , en tanto que las columnas constituyen lascaracterísticas o atributos de cada sujeto en una determinada variable. Esto se observa claramente en la figura 35(b).
23
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Ahora, el siguiente paso es ir a la vista de variables para designar nuestra primera variable de la investigación. Como ejemplo tomaremos dos variables, la primera el “género” y la segunda la “edad” . La figura 36 presenta dónde nos encontramos situados en este momento. En la figura 36(a) se observa que se ha escrito el nombre de la primera variable “género”, y se darán cuenta ustedes que al presionar la tecla de “enter”, aparecen de inmediato valores en las otras casillas, lo que se ve en la figura 36(b).
24
Curso básico de SPSS
L.I. Alejandro Servín Gómez
25
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Muy bien, ahora enfoquémonos en cada una de las columnas que aparecen en la Vista de variables , para analizar cada una de sus propiedades. Una vez colocado el nombre de la variable , se nos presenta el Tipo de variable que se trate, especifica los tipos de datos de cada variable. Por defecto se asume que todas las variables nuevas son numéricas. En nuestro caso, dejaremos la variable género como de tipo cadena (alfanumérica), con una anchura de 8 caracteres (figura 37).
Uno de los puntos muy importantes y que debe ponérsele mucho énfasis es la etiqueta , ya que así aparecerá la variable en nuestras tablas de análisis. Continuando con el ejemplo anterior, seguiremos trabajando con el nombre de “género” y así etiquetaremos la variable. En algunos casos, cuando el nombre sea muy extenso, es recomendable utilizar abreviaturas que identifiquen cada una de las variables, como por ejemplo: “latino” (Latinoamericano), “estud” (estudiante), “cirplast” (Cirujano Plástico), etc. La figura 38 nos muestra como se va transformando hasta ahora nuestra base de datos.
26
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Ahora pasamos a la opción de Valores , que es donde combinamos números con palabras, que nos servirá para identificar características o atributos con un simple número y viceversa. Para comenzar, damos un clic en la casilla en donde aparece hasta el momento “ninguno” en valores, como se observa en la figura 39, y aparece el recuadro de “etiquetas de valor”.
Cuando tenemos el recuadro, lo que debemos hacer es codificar nombres con números, asociando de esta forma un número para una característica o atributo del sujeto. Entonces, para nuestro caso de la variable “género”, se designará de la siguiente forma:
Número 1 para “femenino”, y Número 2 para “masculino”.
Una vez hecho esto, se pulsa en el botón “añadir” para que agregue las nuevas etiquetas de valor. La figura 39(a) muestra este proceso.
27
Curso básico de SPSS
L.I. Alejandro Servín Gómez
28
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Ahora seguimos con la opción de perdidos . Acá se definen valores de los datos especificados como perdidos por el usuario. A menudo es útil para saber por qué se pierde información. Por ejemplo, puede desear distinguir los datos perdidos porque un entrevistado se niega a responder, o datos perdidos porque la pregunta no afectaba a dicho entrevistado, etc. Los valores de datos especificados como perdidos por el usuario aparecen marcados para un tratamiento especial y se excluyen de la mayoría de los cálculos. Para nuestra base de datos ejemplo, asumiremos que no se tienen valores perdidos. Las últimas opciones son Alineación y Medida (Figura 41). La “alineación” tiene que ver con la forma en que se ordena el concepto dentro de la casilla (izquierda, centro, derecha), y la “medida” cataloga a la variable como Nominal (cuando no se tiene ningún orden especificado o el orden no interesa) , Ordinal (cuando existe una ordenación de mayor a menor, o viceversa) o Escala (denominadas por algunos autores también como de “razón”, e indican que entre un atributo y otro existe la misma diferencia o distancia, dependiendo el caso) . Para nuestro ejemplo, la variable “ género ” queda catalogada con medida nominal, ya que no tiene un ordenamiento específico.
Ahora ya hemos completado la codificación de nuestra variable género . Procedemos a realizar lo mismo pero para la variable edad , de esta forma
29
Curso básico de SPSS
L.I. Alejandro Servín Gómez
haremos un repaso de todo el procedimiento, y que nos servirá para nuestro aprendizaje. Con respecto a la variable edad , tendrá un tratamiento un poco diferente, ya que podemos reclasificarla para un mejor análisis, de la siguiente manera:
Joven, de 20 años o menos (X £ 20) Adulto, mayor de veinte años y menor de 50 (20 < X < 50). Persona mayor, de 50 años o más (X ³ 50).
Entonces, comenzamos colocando el nombre a nuestra variable, tal cual se muestra en la figura 42.
Ahora ingresaremos el tipo de la variable, que quedará como “numérica” para la edad (Figura 43).
30
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Las columnas de Anchura y Decimales no se cambiarán, dejaremos las casillas tal cual. EnEtiqueta digitaremos la palabra “edad”, que así identificaremos nuestra variable (Figura 44).
Para la asignación de valores a la variable edad , lo realizaremos basándonos en la clasificación anterior y con la siguiente codificación:
1, para los “jóvenes” (menores de 20 años) 2, para las personas “adultas” (de 20 años a 50 años) 3, para las personas “mayores” (mayores de 50 años).
31
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Las figuras 45 muestran cómo realizaría la asignación de valores e ingreso de los mismos.
32
Curso básico de SPSS
L.I. Alejandro Servín Gómez
33
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Finalizada la operación de asignar valores a la variable edad , ahora nos concentraremos en la “medida” que se le asignará. De momento, las otras columnas quedarán con los valores por defecto, a saber: perdidos, columnas y alineación. Si observan detenidamente la figura 46, notarán (como ya se dijo antes) que existen tres tipos demedida . En la variable “género” la medida no era muy importante, pero en la actual variable (edad) si es prioritario el asignarle un tipo de medida que nos ayude en la tipificación de la variable. Para este ejemplo, la variable edad tendrá una medida de carácter “ordinal”.
34
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Para aquellos amigos lectores que se estén preguntando del porqué debe elegirse una determinada medida, ya sea Escala, Ordinal o Nominal, les diremos que esto nos será de gran utilidad para realizar análisis estadísticos mucho más profundos, que no son el fin principal de este curso introductorio, pero que se estudiarán en el Curso Avanzado de SPSS, que próximamente podrán ustedes ver publicado en el web site de AulaFacil.com Como ya tenemos codificadas las variables, ahora procedemos a ingresar los valores de nuestra nueva base de datos, y para ello simplemente hay que dar clic en la pestaña “vista de datos” como se observa en la figura 47, siendo ahí en donde ingresaremos los datos recolectados.
35
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Figura 47
Encontrándonos ahora en la “vista de datos”, ingresamos los datos de 5 personas, que presentan estas características: • Mujer, 17 años de edad. • Hombre, 19 años de edad. • Hombre, 52 años de edad. • Mujer, 24 años de edad. 36
Curso básico de SPSS
L.I. Alejandro Servín Gómez
• Hombre, 33 años de edad. Con esta información, ingresamos los datos tal y como se muestran en la figura 48.
Ahora bien, con los valores ingresados, el SPSS tiene una función para ver los atributos de las variables en lugar de simples números, para ello solo tenemos que ir a la opción de “etiquetas de valor” y dar clic, tal y como se observa en la figura 49(a).
37
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 49(b) muestra además, otra opción interesante dentro del visor de datos cuando tenemos activada la función de “ etiquetas de valor ”. Si a cualquiera de los atributos le damos un clic con el botón izquierdo del ratón, se despliega una ventana donde nos muestra las diversas opciones que se tienen para dicha variable. Por ejemplo, en la figura se observa que se ha dado clic en la variable
38
Curso básico de SPSS
L.I. Alejandro Servín Gómez
“edad” a uno de los atributos, adultos , pero nos presenta el listado completo que se tiene en dicho atributo (Jóvenes, Adultos, Personas mayores). Figura 49(b)
39
Curso básico de SPSS
L.I. Alejandro Servín Gómez
ANALISIS DE DATOS
Para llevar a cabo en análisis de datos en SPSS, se utiliza la función Analizar del menú principal, tal y como lo muestra la figura 50. Continuando con nuestro ejemplo, realizaremos el análisis de nuestra mini base de datos, haremos uso de la función “ Analizar ”, luego elegiremos “ Estadísticos descriptivos ” y ahí seleccionaremos “ Frecuencias ”, dando un clic en esta ultima opción. Todo esto se ilustra en la figura 50.
40
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Al dar clic en “Frecuencias”, aparece el recuadro que se observa en la figura 51. Ahí tenemos las opciones de “Estadísticos”, “Gráficos” y “Formato”.
La primera opción que seleccionamos es “Estadísticos”, como puede verse en la figura 51(a). LosEstadísticos se encuentran clasificados en cuatro grandes áreas: Valores percentiles (Cuartiles, Puntos de corte, Percentiles); Tendencia central (Media, Mediana, Moda, Suma); Dispersión (Desviación típica, Varianza, Ampitur, Mínimo, Máximo, E. T. Media); Distribución (Asimetría, Curtosis). Nosotros seleccionaremos con un simple “clic” aquellos estadísticos sean de interés para el propósito de nuestra investigación. La figura 51(a) muestra algunos indicadores que se han elegido y luego de la selección, basta dar un “clic” en el botón “ Continuar ”.
41
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Cuando ya hemos elegido las opciones estadísticas para nuestro análisis, seguimos con el siguiente botón de Frecuencias , que es Gráficos , lo que se observa en la figura 51(b).
42
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Finalmente, en la figura 51(c) se muestra como elegir el formato para nuestra tabla de análisis, ya sea ordenando los valores en forma ascendente o descendente, comparando variables, etc.
43
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Ahora procederemos a elegir las variables que deseamos analizar. En la figura 52 hemos seleccionado las dos variables de nuestro estudio: “Género” y “Edad”.
44
Curso básico de SPSS
L.I. Alejandro Servín Gómez
El Visor del SPSS muestra los resultados finales, e incluye tablas, gráficos, estadísticas, etc., dependiendo de las indicaciones que nosotros le hayamos incluido. La Figura 53 presenta la pantalla del visor de resultados.
45
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Las figuras 53(a), 53(b) y 53(c) presentan todos los resultados obtenidos en el visor de resultados del SPSS, de las dos variables con sus respectivos estadísticos y gráficos.
46
Curso básico de SPSS
L.I. Alejandro Servín Gómez
47
Curso básico de SPSS
L.I. Alejandro Servín Gómez
48
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Cuando tenemos los resultados, podemos copiar alguna tabla o gráfico que nos interese, y pegarlo en otra aplicación, por ejemplo, en Word. El procedimiento para realizar esto es muy sencillo, y se vislumbra en la figura 54. Ubicamos el puntero del ratón sobre la tabla o gráfico que deseamos copiar, damos clic con el botón derecho y se despliega un menú, entonces elegimos la opción copiar (o cortar) y con esto nos queda guardada la tabla o el gráfico en el portapapeles, para pegarlo donde deseemos.
49
Curso básico de SPSS
L.I. Alejandro Servín Gómez
50
Curso básico de SPSS
L.I. Alejandro Servín Gómez
TABULACIÓN CRUZADA DE DATOS
Las tablas que se han presentado hasta el momento presentan tabulaciones sencillas, es decir, en donde solo se analizan las variables con sus atributos o características, pero cuando de investigación se trata, deben realizarse análisis más profundos, y la tabulación cruzada de datos nos ofrece profundizar más al comparar dos o más variables entre sí. Para realizar una tabulación cruzada en el SPSS, debemos ir a la Barra de Menú Principal, en la opción de “Estadísticos descriptivos”, y ahí elegimos la opción de “Tablas de contingencia”, como se muestra en la figura 55. Al pulsar en la opción “Tablas de contingencia” se obtienen las figuras 55(a) y 55(b), donde se observa el proceso para tratar las variables a analizar en forma cruzada.
51
Curso básico de SPSS
L.I. Alejandro Servín Gómez
52
Curso básico de SPSS
L.I. Alejandro Servín Gómez
53
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 56 surge al dar un clic en el botón “Estadísticos” en la “Tabla de contingencia”. En la opción deEstadísticos se pueden calcular muchos indicadores, dependiendo de las características propias de las variables que estemos estudiando, de tal forma que podemos: calcular el Chi-cuadrado, Correlaciones,Variables Nominales (Coeficiente de contingencia, Phi y V de Cramer, Lambda, Coeficiente de incertidumbre), Variables Ordinales (Gamma, d de Somers, Tau-b de Kendall, Tau-c de Kendall), Nominal por Intervalo (coeficiente Eta), índice de Kappa, Coeficiente de Riesgo, Coeficiente de McNemar), y los Estadísticos de Cochran y de Mantel-Haenszel. Al seleccionar los coeficientes que deseemos, el paso siguiente es dar un “clic” en el botón de Continuar , con lo que se guardan todos los cambios realizados y se pasa ala siguiente etapa.
54
Curso básico de SPSS
L.I. Alejandro Servín Gómez
También tenemos la opción de elegir los datos que queremos en las casillas de nuestra tabulación cruzada, como se ve en la figura 57. Al dar un clic en el botón de Casillas , aparece un recuadro con las siguientes opciones: Frecuencias (Observadas, Esperadas); Porcentajes (Fila, Columna, Total) y Residuos (No tipificados, Tipificados, Tipificados corregidos). Para seleccionar las opciones presentadas, simplemente debemos dar un “clic” a las casillas que nos interese que aparezcan en nuestra tabla, y cuando hayamos terminado, entonces basta dar un clic al botón Continuar.
La última opción dentro de la Tabla de Contingencia es el Formato , y nos da a elegir si los datos de nuestra tabla los queremos ordenados en forma ascendente o descendente. Luego pulsamos en el botón “continuar”, tal y como lo muestra la figura 58.
55
Curso básico de SPSS
L.I. Alejandro Servín Gómez
Ahora que ya hemos realizado todas las operaciones, y colocado las opciones que deseamos para nuestra tabla cruzada, falta activar dos opciones más: la primera, si queremos que se nos muestren los gráficos de barras agrupadas, y la segunda, si deseamos que en el visor de resultados se supriman las tablas. Luego de esto, el siguiente paso es pulsar en el botón de “ Aceptar ”, y con eso ya estamos listos para observar los resultados en el visor. Todo esto que se ha comentado se observa detenidamente en la figura 59.
56
Curso básico de SPSS
L.I. Alejandro Servín Gómez
57
Curso básico de SPSS
L.I. Alejandro Servín Gómez
En la figura 60(a) se observa el visor de resultados, tal y como aparece en el SPSS después de realizar el procedimiento arriba descrito. Presenta un resumen de los casos, la tabla de contingencia, los indicadores estadísticos que se solicitaron, y brevemente realiza comentarios o anotaciones sobre cada caso.
Las figuras 60(b) y 60(c) también muestran los resultados del visor del SPSS. En la figura 60 (b) se presenta la tabla de contingencia entre las variables que nosotros seleccionamos, género y edad , así como las pruebas del estadístico Chi-cuadrado . Si nos fijamos detenidamente, la tabla de contingencia muestra mucha más información de la que nos brindaría una simple tabulación cruzada, por lo que para nosotros cuando realicemos una investigación, resulta primordial realizar “cruces de variables”, de las principales variables que tengamos en nuestro estudio, a través de las tablas de contingencia. 58
Curso básico de SPSS
L.I. Alejandro Servín Gómez
La figura 60(c) presenta el resto de medidas estadísticas de nuestra investigación. Como la muestra es demasiado pequeña (N=5), tomaremos el análisis de los coeficientes estadísticos solo como un ejemplo.
59
Curso básico de SPSS
L.I. Alejandro Servín Gómez
60
Curso básico de SPSS
L.I. Alejandro Servín Gómez
ABRIR Y GUARDAR INFORMACIÓN EN SPSS
Para quienes estemos acostumbrados a trabajar en programas como Excel, Word, etc., no tendremos ninguna dificultad en abrir un fichero de datos en el SPSS, ya que se hace de la misma manera. La forma más sencilla es ir al botón “abrir” de la barra de herramientas, y se abre un recuadro tal cual se observa en la figura 61. Además de abrir archivos con extensión *.sav (que es la extensión propia del SPSS), tenemos las opciones de abrir archivos de texto, Lotus, Excel, y otros más, 61
Curso básico de SPSS
L.I. Alejandro Servín Gómez
lo que muestra lo multifacético que es este programa para trabajar con bases de datos. En la figura 62 se ha elegido para abrir un archivo de Excel, y lo único que falta es dar clic en el botón de “abrir” para cargar el archivo, pero en la vista de datos del SPSS.
La figura 63 nos muestra el proceso que debe seguirse para guardar información en el SPSS. En primera instancia, nos vamos al menú Archivo , y se nos despliega un menú, en el cual recomiendo se elija la opción de Guardar como , y aparece un recuadro en donde nos pide la ubicación en la que deseamos guardar el archivo (disco C, disco A, Memoria flash, etc.), y además nos solicita que le indiquemos en que formato o extensión deseamos guardar el archivo (Excel, Lotus, etc.). Una vez realizado esto, el siguiente paso es pulsar en el botón de Guardar del recuadro, y nuestro archivo ya se encuentra salvado.
62
Curso básico de SPSS
L.I. Alejandro Servín Gómez
63