Diseño y análisis en investigación

from Diseño y análisis en investigación Carlos Ochoa

Diseño y análisis en investigación

una organización. No obstante, tal y como comentamos al hablar de las hojas de cálculo, si la magnitud de la información es pequeña y la recogida de datos ocasional, podríamos optar por introducir la BD directamente en el programa estadístico.

La última de las opciones que se mencionaron son las aplicaciones online, como la utilidad de formularios de Google. Para algunas encuestas sencillas y ocasionales puede ser una buena opción. Existen otras herramientas online, especializadas y potentes, que no vamos a entrar a analizar en este libro.

Organización de la base de datos: ordenación y grupos de variables (tablas) relacionados

Como anteriormente hemos comentado, uno de los grupos de variables de toda BD son las variables índice. Los datos son almacenados habitualmente en el orden en que se introducen, pero este orden no suele ser el más útil para la edición de datos. Aunque los gestores de BD permiten ordenar los registros y hacer búsquedas empleando cualquier variable, lo habitual es que las BD se presenten en forma ordenada, empleando variables índice (por ejemplo: historia, nombre, número del registro en el estudio, etc.). Estas variables serán empleadas también para relacionar grupos de variables de las BD.

En función de la cantidad de información que manejemos (número de registros y/o número de variables), tendremos que decidir si conviene introducir todas las variables en una sola tabla o en varias tablas relacionadas. Por ejemplo, si tenemos datos generales de un paciente y datos repetidos de consultas sucesivas, puede interesar crear tablas separadas para introducir dicha información, que aparecerá asociada, empleando como vínculo alguna de las variables índice. Los gestores de BD nos permiten distribuir la información en varios ficheros o tablas sin que lo apreciemos, gracias a la utilización de tablas o formularios que presentan los datos adecuadamente combinados. Su principal ventaja radica en un óptimo aprovechamiento y organización del espacio. Por el contrario, un fichero único, con todas las variables, puede tener un importante número de campos vacíos, que aumentan innecesariamente el tamaño y entorpecen las tareas de búsqueda. No obstante, fusionar la información en una tabla única puede ser necesario a la hora de realizar el análisis estadístico, por lo que en bases de datos que se construyan para un análisis estadístico circunstancial no convendrá fraccionar los ficheros. Una vez diseñados los grupos de variables o tablas y la forma de relacionarlas, tendremos que llevar a cabo la creación física de la BD. En una hoja de cálculo bastaría con poner los nombres en la primera fila y debajo los valores para cada paciente o unidad de análisis. Sin embargo, en los gestores de BD y en los programas de estadística debemos ceñirnos a unos tipos de campos específicos en función de las características de cada variable.

Se debe crear una tabla para cada grupo de variables, accediendo a la vista específica (“vista diseño” en Access; “vista de variables” en SPSS). Para cada variable debemos indicar al programa su nombre y tipo de variable (numérica, texto, etc.). También debemos indicar el tamaño del campo (número de espacios disponibles para texto, números enteros y decimales disponibles, etc.), el formato (formato de fecha, tipo de caracteres), los valores permitidos o reglas de validación (comprobar que el valor se encuentra en un rango), la lista de valores para las variables codificadas y el valor o valores para los datos perdidos.

Aunque los programas actuales permiten asignar a las variables nombres sin restricciones, conviene evitar nombres de variable largos, con espacios en blanco o con caracteres especiales (ñ, guiones, acentos, puntos, etc.). Cuando se exportan datos entre programas (por ejemplo: de Access o Excel a SPSS), los nombres de variable complejos pueden originar errores o ser modificados automáticamente. Se recomienda emplear subrayados bajos “_” para separar palabras empleadas en el nombre de las variables (por ejemplo: número_historia). Una regla útil es empezar el nombre de la variable con una letra asociada al apartado del cuestionario de recogida de datos donde está la variable y un número correlativo, seguido de una descripción del contenido de la variable con abreviaturas (por ejemplo: para introducir la variable “peso al ingreso”, que ocupará el tercer lugar de las variables demográficas de una BD, podemos usar el nombre de variable “D_3_Peso_Ing”).

Una vez asignado el nombre de la variable, debemos indicar el tipo y otras características de los campos (variables). En la tabla 4.3 se presentan los tipos de campos disponibles y su correspondencia entre un gestor de BD (Access) y un paquete estadístico (SPSS).

Tabla 4.3 Tipos de campos en Access y SPSS

Access SPSS

Texto: Debe indicarse el tamaño (número de caracteres). Cadena: Debe indicarse el tamaño (número de caracteres).

Número*: Debe especificarse el tamaño eligiendo entre: Byte, Decimal, Entero, Simple y Doble. Se recomienda Byte para variables codificadas y Simple para variables numéricas.

Fecha/hora: Se recomienda fecha corta (dd/mm/aaaa) para fechas.

Sí/No: No se recomienda su uso.

Autonumeración: Útil como número de registro automático.

Numérico: Debe indicarse el tamaño de cifras enteras y decimales disponibles.

Fecha: Se recomienda dd.mm.aaaa; A diferencia de otros programas la unidad de fechas son segundos.

Otros: Objeto, Memo (texto flexible), Moneda, Hipervínculo. Otros: Notación, Puntos, Coma, Moneda personalizada.

* Byte: enteros entre 0 y 255; Entero: enteros entre -32.768 y 32.767; El requisito de almacenamiento es 2 bytes; Entero largo: enteros entre -2.147.483.648 y 2.147.483.647; Simple: valores numéricos de punto flotante (con decimales) entre -3,4 x 1038 y 3,4 x 1038; Doble: valores numéricos de punto flotante (con decimales) entre -1,797 x 10308 y 1,797 x 10308; Decimal: valores numéricos entre -9,999 x 1027 y 9,999 x 1027

Diseño y análisis en investigación

Next Article