TECNOLOGÍA DE LA INFORMACIÓN Y LA COMUNICACIÓN
Bloque Nº: 4 Organización de la Información Archivos – Registros – Campos 4to año Secundaria Prof. César Manuel Giménez
Instituto Superior “Nuestra Señora de la Misericordia” I-29
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
BLOQUE 4: ORGANIZACIÓN DE LA INFORMACIÓN INTRODUCCIÓN El almacenamiento y manejo de grandes cantidades de datos se hace necesario en cualquier empresa para el logro de sus objetivos. Por ejemplo, se necesitan los datos de los empleados, de los clientes, de los proveedores, de los productos almacenados, etc. El proceso de sistematización de la información está compuesto por un proceso continuo que se origina en datos, constituidos por nombres, fechas, lugares, cantidades, notas, documentos, descripciones, noticias, resultados y demás representaciones que se recogen del ambiente externo o entorno y del ambiente interno, como resultado de las actividades y de las transacciones de la organización. Usualmente estos datos se organizan por medio de fichas almacenadas en un archivador (armario o fichero). Esta organización recibe el nombre de ARCHIVO. Así, por ejemplo, en un archivo de clientes cada ficha contiene todos los datos correspondientes a un cliente determinado. Cuando se necesita consultar o modificar los datos de un cliente concreto es preciso realizar toda la operación en forma manual. Luego de la recolección de datos, estos son ordenados conforme a determinados criterios: cronológico, geográfico, por su origen, por su tipo, por su importe, por su clase, constituyendo la base de datos. A continuación son sometidos a un proceso de registro en libros, fichas, tarjetas, computadoras, conforme a determinados criterios (Almacenamiento). Finalmente los datos son procesados, es decir, son transformados por medio de un conjunto de operaciones, para producir información. Con el uso de la computadora se ha automatizado el almacenamiento y manejo de estos archivos, dando lugar a lo que denominamos archivo electrónico de datos. Las ventajas obtenidas se derivan de las propiedades de la computadora: Gran capacidad de almacenamiento en un reducido espacio. Rapidez en el proceso de los datos. Precisión de los resultados obtenidos del proceso Para el almacenamiento de los datos se utilizan soportes informáticos generalmente de tipo magnético como son los discos y las cintas, y para el tratamiento de los datos grabados en estos soportes se emplean programas o aplicaciones. En un sistema informático se procesan generalmente datos contenidos en archivos, pero debemos tener en cuenta que existen otros tipos de archivos, ya que cualquier información permanente que se almacena en una computadora de cualquier forma, se considera igualmente un archivo. Por ejemplo, un archivo fuente contendrá un programa fuente, un archivo objeto un programa ya compilado, un archivo de texto un informe escrito, un archivo gráfico un dibujo, etc. En lo sucesivo limitaremos nuestro estudio a los archivos de datos, consistentes en un conjunto de datos que contienen informaciones relativas a un mismo tema.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 40 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
SISTEMAS DE INFORMACIÓN COMPUTARIZADOS Conceptualmente, un sistema de información no requiere el Procesamiento Electrónico de Datos (PED). No obstante, los avances de la tecnología hacen casi imprescindible su utilización y la necesidad de operar en tiempos reales (es decir, en el mismo momento en que suceden los hechos) hace que la tecnología informática resulte insustituible para que el sistema de información tenga eficacia. Es habitual asociar el término sistema de información con una adecuada informatización de diversas funciones y/o procedimientos administrativos en una organización (empleo de computadoras para realizar tareas en una organización) . Sin embargo, si bien ambos conceptos se encuentran relacionados, no son, en modo alguno, sinónimos. En efecto, si una empresa realiza una progresiva informatización de su contabilidad, y luego hace lo mismo con la gestión comercial o la de producción, y así sucesivamente con otras partes de la empresa, ello no supone que la misma haya implantado un sistema de información. Una adecuada informatización es, sin duda alguna, una condición necesaria pero no suficiente para el establecimiento de un Sistema de Información, ya que para que éste se lleve a cabo debe completarse una integración que relacione a todas las informaciones generadas por las diversas aplicaciones efectuadas a las distintas funciones de la empresa, y permita mejorar los procesos para la toma de decisiones de la dirección, coordinando las informaciones generadas en distintos ámbitos de la empresa. Cuando el sistema sea capaz de aportar información, como resultado de esa integración, para ser utilizada por los responsables y combinada con toda información externa, estaremos en presencia de un Sistema de Información. El proceso eficaz de los datos para generar información es vital en la operación de las empresas y de otras organizaciones.
DATOS Los datos son números, letras o símbolos que describen objetos, condiciones o situaciones. Son el conjunto básico de hechos referentes a una persona, cosa o transacción de interés para distintos objetivos, entre los cuales se encuentra la toma de decisiones. Desde el punto de vista de la computación, los datos se representan como pulsos electrónicos a través de la combinación de circuitos. En resumen, un dato es el nombre de una persona, el número de una cuenta bancaria, un porcentaje, etc. O sea que pueden ser: 1. 2. 3. 4.
Datos alfabéticos (formados por las letras de la A a la Z) Datos numéricos (formados por los números del 0 al 9) Datos alfanuméricos (Formados por una combinación de los anteriores) Datos simbólicos o de caracteres especiales (%, $. #, @, &, etc.)
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 41 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
ELEMENTOS Y CARACTERÍSTICAS DE LOS DATOS Los datos constan de los siguientes elementos y características: ELEMENTOS DE LOS DATOS IDENTIFICADOR TAMAÑO TIPO Ejemplo:
Permite distinguirlo de los restantes elementos. Define la cantidad de caracteres (letras, números, signos, espacios) que se pueden utilizar para definir su valor o contenido. Describe si el elemento esta constituido por caracteres alfabéticos, numéricos, alfanuméricos o caracteres especiales.
para el dato: Martín González
IDENTIFICADOR EMP Es el número de espacios que se disponen para describir el dato. Por ejemplo: 15 TAMAÑO caracteres. TIPO Alfabético Las características anteriores determinan la longitud de un dato y son importantes cuando se trata de su procesamiento electrónico, pues representa el espacio que ocupan dentro del sistema. CONCEPTOS Y DEFINICIONES Archivo electrónico de datos: es una estructura de datos que reside en memoria secundaria. Es un conjunto de informaciones estructuradas en unidades de acceso denominadas registros, todos del mismo tipo (referidos a elementos de la misma naturaleza), de igual estructura y en número indeterminado. Bloque (registro físico): Corresponde a la cantidad de información que se transfiere en cada operación de acceso (lectura o escritura). En general, un bloque puede contener uno o más registros, pero también puede ocurrir que un registro ocupe más de un bloque. El registro físico es un grupo de registros lógicos bloqueados, denominándose factor de bloqueo al número de registros lógicos que contiene cada registro físico. Registro (registro lógico): es cada uno de los componentes del archivo. Contiene el conjunto de informaciones que se tratan de manera unitaria. Está constituido por uno o más elementos denominados campos, que pueden ser de diferentes tipos y que a su vez pueden estar compuestos por subcampos. Los datos almacenados en los campos de un registro deben pertenecer al mismo elemento u objeto. Campo: es el lugar destinado a contener un dato. Las características del campo deben coincidir con las del dato. El campo debe tener un identificador que lo distinga de los demás campos, ser de un tipo determinado (alfabético, numérico, etc.) y tener un tamaño específico. Para poder seleccionar un registro del conjunto que compone el archivo, se necesita un dato identificativo que lo distinga de los demás. Al campo que contiene el dato que identifica al registro se lo denomina campo clave. Algunos archivos pueden no tener campo clave en sus registros.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 42 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
Si un archivo contiene la información de un conjunto de individuos u objetos, sus registros contienen la información de cada uno de ellos y los campos los diferentes datos que la componen. Por ejemplo, en el archivo de empleados de una empresa, cada registro contiene la información de un empleado y los campos contienen su nombre, dirección, fecha de ingreso, etc.
ESQUEMA LÓGICO DE UN ARCHIVO Bloque (Factor de bloqueo = 3)
Registro 1
Registro 2
Registro 3
Campo Campo Campo 1 2 3
Subcampo Subcampo 1 2 Campo 2
DESCRIPCIÓN DE LOS ELEMENTOS COMPONENTES DE UN ARCHIVO Campo clave
Registro lógico Campo
Archivo
Registro físico o bloque
Las filas representan registros lógicos (9 registros) Las columnas representan un mismo campo (7 campos)
Ejemplo de registro: REGISTRO DE EMPLEADO NDNI
Nombre
2198365 Luís Ortiz Rubio
Dirección
Localidad
Departamento
Ps. Olmos 168
Corrientes
Producción
CatLaboral Técnico Auxiliar
Registro
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 43 -
FIngreso 150588
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
El registro anterior esta formado por 7 campos. Cada campo tiene su identificación, es de un tipo determinado y puede almacenar una cantidad determinada de caracteres. La identificación de un campo permite distinguirlo de los restantes campos. Identificadores de campo
Representa al dato
Datos
NDNI Nombre Dirección Localidad Departamento CatLaboral FIngreso
Número de documento del empleado Nombre y Apellido del empleado Domicilio del empleado Localidad a la que pertenece el domicilio Área o sección donde trabaja el empleado Categoría laboral del empleado Fecha de ingreso del empleado a la empresa
2198365 Luís Ortiz Rubio Ps. Olmos 168 Corrientes Producción Técnico Auxiliar 150588
El tipo de campo describe si el contenido del mismo está constituido por caracteres alfabéticos, numéricos, una combinación de estos (alfanuméricos) o símbolos especiales. El tamaño de un campo es la cantidad de caracteres que puede almacenar, incluidos los espacios. Todos los registros de un archivo deben ser de igual tamaño, por lo tanto el programador o quien diseñe la estructura del archivo debe prever que cada campo tenga el tamaño suficiente como para poder almacenar correctamente los posibles datos que puedan surgir. La descripción del registro del esquema sería la siguiente: Identificador del campo
Tipo de campo
Tamaño del campo
NDNI Nombre Dirección Localidad Departamento CatLaboral FIngreso
Numérico Alfabético Alfanumérico Alfabético Alfabético Alfabético Numérico
8 caracteres 20 caracteres 22 caracteres 15 caracteres 13 caracteres 17 caracteres 6 caracteres
De la descripción anterior se puede obtener el tamaño que tiene cada registro sumando el tamaño de los campos. Tamaño del registro = 8 + 20 + 22 + 15 + 13 + 17 + 6 = 101 caracteres Conociendo cuantos registros componen el archivo podemos determinar el tamaño del archivo. Tamaño del archivo = tamaño del registro X cantidad de registros Si nuestro archivo contiene 12 registros el tamaño del mismo sería: 101 X 12 = 1.212 caracteres
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 44 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
CODIFICACIÓN DE DATOS Es la técnica mediante la cual se remplaza un dato determinado por un código que lo representa. Se suele emplear esta técnica cuando se necesita establecer relaciones con otros archivos o cuando la codificación favorece la reducción del espacio de almacenamiento. Es aconsejable emplear la codificación para aquellos datos que se presenten en forma repetida en los distintos registros y que tengan un número limitado de variaciones. Ejemplo: El dato SEXO tiene dos variaciones posibles: FEMENINO y MASCULINO FEMENINO se forma con 8 caracteres y MASCULINO con 9 caracteres.
Empleando la codificación de datos podemos asignarle un código a cada variación que solo se represente con unos pocos caracteres. En este caso podemos asignarle como código a FEMENINO la letra F y a MASCULINO la letra M. La codificación se representa de la siguiente manera:
SEXO
Para almacenar este dato necesitamos que el campo que lo va a contener tenga un tamaño de por lo menos 9 caracteres. DATO
CÓDIGO
Femenino
F
Masculino
M
En consecuencia, solo necesitamos para almacenar el dato SEXO que el campo que lo va a contener tenga un tamaño de 1 caracter. De esta manera ahorramos espacio de almacenamiento, en este caso 8 caracteres en un registro. Veamos cuanto espacio ahorramos en el archivo descripto en la página anterior si codificamos, por ejemplo, el dato LOCALIDAD: ARCHIVO ORIGINAL SIN CODIFICACIÓN DE DATOS Identificador del Tipo de campo campo Número de DNI Numérico Empleado Alfabético Dirección Alfanumérico Localidad Alfabético Departamento Alfabético Categoría Laboral Alfabético Fecha de Ingreso Numérico
Tamaño del campo 8 caracteres 20 caracteres 22 caracteres 15 caracteres 13 caracteres 17 caracteres 6 caracteres
ARCHIVO MODIFICADO CODIFICACIÓN DEL DATO LOCALIDAD Identificador del Tipo de campo campo Número de DNI Numérico Empleado Alfabético Dirección Alfanumérico Localidad Alfabético Departamento Alfabético Categoría Laboral Alfabético Fecha de Ingreso Numérico
Tamaño del campo 8 caracteres 20 caracteres 22 caracteres 3 caracteres 13 caracteres 17 caracteres 6 caracteres
Cantidad de campos Cantidad de registros Tamaño del registro
7 campos 12 registros 101 caracteres
Cantidad de campos Cantidad de registros Tamaño del registro
7 campos 12 registros 89 caracteres
Tamaño del archivo
1.212 caracteres
Tamaño del archivo
1.068 caracteres
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 45 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
El campo LOCALIDAD del archivo original dispone de 15 caracteres para almacenar ese dato. Codificando ese dato, asignándole un código de 3 caracteres, ahorramos 12 caracteres De la descripción anterior podemos calcular cual es el espacio que se ahorra en cada registro y cual es el espacio que se ahorra en el archivo. Espacio de registro ahorrado = tamaño del registro original – tamaño del registro modificado Espacio de registro ahorrado = 101 caracteres – 89 caracteres = 12 caracteres Espacio de archivo ahorrado = tamaño del archivo original – tamaño del archivo modificado Espacio de archivo ahorrado = 1.212 caracteres – 1.068 caracteres = 144 caracteres Si un archivo contiene datos codificados, siempre se debe almacenar la LOCALIDADES tabla de códigos junto con el archivo. DATO CÓDIGO En el caso anterior la tabla de localidades sería la siguiente:
Buenos Aires Corrientes Paraná ............. Rosario Tandil
L01 L02 L03 ........... L16 L17
FORMATO DE ALMACENAMIENTO Es la descripción que explica la forma en la que almacenará el dato en el campo. Todos los campos almacenan los datos empleando un formato, pero existen campos que almacenan datos empleando un formato particular que permite entender a que se refiere cada carácter que compone dicho dato. Estos formatos particulares deben estar indicados en la descripción del registro. El empleo de formatos particulares se realiza muchas veces para no almacenar caracteres innecesarios o redundantes que ocuparían espacio de almacenamiento del archivo. La visualización o impresión de los datos con formatos particulares se realiza a través de una máscara, la cual no ocupa espacio en el almacenamiento, por no formar parte del registro almacenado. Un ejemplo de formato se puede ver por ejemplo con lo que sucede con el dato fecha, el cual se puede almacenar de diferentes maneras: De manera alfanumérica: 23 de abril de 1980 De manera especial: 23/04/1980 ; 23/04/80 ; 04-23-1980 ; etc. Los formatos relacionados para estos datos serían: Para [23 de abril de 1980], no es apropiado utilizar un formato, ya que para ello los distintos elementos que componen el dato (día, mes y año) se deberían componer con la misma cantidad de caracteres, lo cual no ocurre con el mes, que tiene una longitud en caracteres no fija. Para [23/04/1980] el formato que se debe aplicar es DDMMAAAA, lo que indica que los dos primeros caracteres corresponden al día, el tercero y cuarto al mes y del quinto al octavo el año; eliminando de esta manera el almacenamiento de las barras o guiones de separación, transformando de esta manera al dato en numérico.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 46 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
MÁSCARA DE PRESENTACIÓN Es la descripción de la ubicación de los caracteres que componen el dato en una plantilla de establece la distribución de estos caracteres para que sean visualizados o impresos correctamente. Por lo general en las máscaras se emplean caracteres simbólicos o especiales, aunque en algunos casos se pueden usar caracteres numéricos y/o alfabéticos. Por ejemplo, si el dato fecha se almacena de la siguiente manera: [23041980] y ese dato se necesita visualizar como 23/04/1980, la mascara a utilizar sería: ##/##/#### Cada carácter numeral (#) que se distribuye en la máscara hace referencia a un carácter numérico que compone el dato almacenado y la inclusión de la barra entre los caracteres # hace que la fecha se visualice como 23/04/1980. Por ejemplo, para visualizar un dato que corresponde a un importe monetario almacenado como [35725], la máscara apropiada sería: $ ###,## En este caso se separan los caracteres numéricos mediante el carácter coma (,) para que se componga el valor entero y los centavos del importe monetario, agregando delante de la máscara el signo pesos ($) seguido de un espacio, para que el dato se presente como $ 357,25 En general, las máscaras se emplean mayormente con datos numéricos, pero en caso de utilizarlas con datos alfabéticos y/o alfanuméricos, el carácter que hace referencia a un carácter alfabético es el signo de cierre de interrogación (?)
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 47 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
CARACTERÍSTICAS DE LOS ARCHIVOS ELECTRÓNICOS DE DATOS Las principales características que diferencian esta estructura de datos de las restantes son las siguientes: Residencia en soportes de información externos, también denominados memorias secundarias o auxiliares, como son las cintas y discos magnéticos. Independencia respecto de los programas, lo que significa que la vida del archivo no está limitada por la vida del programa que lo creó y también que en diferentes momentos pueden hacer uso del mismo archivo diferentes programas. Permanencia de las informaciones almacenadas, es decir, la información contenida en un archivo no desaparece cuando se desconecta la computadora, a diferencia de todas las informaciones almacenadas en la memoria central. Gran capacidad de almacenamiento, siendo esta capacidad teóricamente ilimitada; por el contrario, las estructuras de datos que residen en la memoria central tienen limitado su tamaño por la capacidad de ésta.
CLASIFICACIÓN DE LOS ARCHIVOS DE DATOS SEGÚN SU USO Los archivos se clasifican, según la utilización que se hace de los mismos, en tres grupos: Archivos permanentes. Contienen información que varía poco a lo largo del tiempo. Este grupo se subdivide en tres tipos de archivos: 1. Archivos constantes. Su información permanece prácticamente inamovible, utilizándose principalmente como archivos de consulta. Un archivo de este tipo puede ser el de la red del subte de una ciudad, que contiene la descripción, características, número de estaciones, número de trenes, etc., de cada línea. 2. Archivos de situación. También denominados archivos maestros, contienen la información que refleja el estado o situación de una empresa, entidad o algún aspecto de ella en un determinado momento. Estos archivos se actualizan periódicamente para adaptarlos a cada nueva situación. Un ejemplo es el archivo de personal con contrato temporal en una empresa o también el archivo de existencias en un almacén. 3. Archivos históricos. Se obtienen de los anteriores (constantes y de situación) cuando se dejan fuera de uso para futuros estudios estadísticos o consultas. Será un archivo histórico el que contenga la información de libros, adquiridos por una biblioteca, durante la década de los setenta. Archivos de movimientos. En ellos se almacena la información que se utiliza para actualizar los archivos maestros. Sus registros denominados movimientos o transacciones son de tres clases: altas, bajas y modificaciones. Una vez realizado el proceso de actualización de un archivo maestro por medio de un archivo de movimientos, éste pierde su validez y podemos deshacernos de él. Un archivo de este tipo, para actualizar el antes mencionado de personal contratado, es el que refleja las nuevas contrataciones, finalizaciones de contratos y modificaciones de los mismos, producidas en la empresa durante el mes actual. Archivos de maniobra o trabajo. Tienen una vida limitada, normalmente igual a la duración de la ejecución de un programa, utilizándose como auxiliares de los anteriores. Por ejemplo, si se desea una lista alfabética de los nombres del personal contratado, se hará por medio de un archivo de maniobra en el que se almacene esta información a partir del archivo de personal; posteriormente se ordenará alfabéticamente el archivo y se sacará a partir de él el correspondiente listado. Este archivo puede desaparecer una vez se tenga la lista impresa.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 48 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
ORGANIZACIÓN DE ARCHIVOS (Formas de almacenamiento) Al diseñar un archivo, dependiendo del uso que se va a hacer del mismo y del soporte utilizado, se pueden elegir diferentes maneras de organizar sus registros, siendo las principales organizaciones las siguientes: Secuencial Directa o aleatoria Secuencial indexada Organización secuencial Es aquella en la cual los registros ocupan posiciones consecutivas de memoria y que sólo se puede acceder a ellos de uno en uno a partir del primero. En un archivo secuencial, no se pueden hacer operaciones de escritura cuando se está leyendo, ni operaciones de lectura cuando se está escribiendo. Por otro lado, para actualizarlos es preciso crear nuevos archivos donde se copien los antiguos junto con las actualizaciones. Esquema lógico de un archivo secuencial
Registro 1
Registro 2
Registro 3 Cabeza lectora / grabadora
Organización directa o aleatoria Las informaciones se colocan y se acceden aleatoriamente mediante su posición, es decir, indicando el lugar relativo que ocupan dentro del conjunto de posiciones posibles. En esta organización se pueden leer y escribir registros, en cualquier orden y en cualquier lugar. Presenta el inconveniente de que es tarea del programador establecer la relación entre la posición que ocupa un registro y su contenido; además, puede desaprovecharse parte del espacio destinado al archivo, ya que pueden quedar huecos libres entre unos registros y otros. Su principal ventaja es la rapidez de acceso a un registro cualquiera, puesto que no es preciso pasar por los registros anteriores. Esquema lógico de un archivo directo Posiciones 1
Registro 2
2
3
4
Registro 1
5
Registro 3 Cabeza lectora / grabadora
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 49 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
Organización secuencial indexada Un archivo con esta organización consta de tres áreas: Área de índices Área primaria Área de excedentes (overflow) El área primaria contendrá los registros de datos, clasificados en orden ascendente por su campo clave. El área de índices es un archivo secuencial creado por el sistema, en el que cada registro establece una división (segmento) en el área primaria, y contiene la dirección de comienzo del segmento y la clave más alta del mismo. De esta manera, el sistema accede de forma directa a un segmento del área primaria a partir del área de índices, de forma similar a la búsqueda de un capítulo de un libro a partir de su índice. Por último, se reserva un espacio llamado área de excedentes, para añadir nuevos registros que no pueden ser colocados en el área primaria cuando se produce una actualización del archivo. Esta organización presenta la ventaja de un rápido acceso y, además, el sistema se encarga de relacionar la posición de cada registro con su contenido por medio del área de índices. También es trabajo del sistema la gestión de las áreas de índices y excedentes. Los inconvenientes que presenta son la necesidad de espacio adicional para el área de índices y el desaprovechamiento de espacio que resulta al quedar huecos intermedios libres después de sucesivas actualizaciones.
Esquema lógico de un archivo secuencial indexado
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 50 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
ANEXO BLOQUE NRO. 4 Esquema lógico de un ARCHIVO DE DATOS CAMPO1
CAMPO2
CAMPO3
CAMPO4
CAMPO5
CAMPO6
CAMPO7
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Reg Nº 1 Reg Nº 2
Reg Nº 4
ARCHIVO
Reg Nº 3
Reg Nº n
El archivo está vacío, no contiene datos. La estructura del archivo existe, está creada, por lo tanto ocupa espacio de almacenamiento. Cada registro del archivo tiene la misma estructura, es decir: Todos tienen 7 campos distribuidos en el mismo orden Todos los campos del mismo orden almacenan el mismo tipo de dato (alfabético, numérico, alfanumérico, o especial) Suponiendo lo siguiente: El campo CAMPO1 tiene un tamaño de 4 caracteres y es de tipo numérico El campo CAMPO2 tiene un tamaño de 15 caracteres y es de tipo alfabético El campo CAMPO3 tiene un tamaño de 2 caracteres y es de tipo numérico El campo CAMPO4 tiene un tamaño de 22 caracteres y es de tipo alfanumérico El campo CAMPO5 tiene un tamaño de 8 caracteres y es de tipo especial El campo CAMPO6 tiene un tamaño de 6 caracteres y es de tipo alfabético El campo CAMPO7 tiene un tamaño de 12 caracteres y es de tipo alfabético Podemos determinar que cada registro del archivo ocupa un espacio de 69 caracteres (es la suma del tamaño que ocupa cada campo). Si tuviera que almacenar los datos correspondientes a 250 registros, aunque algunos campos quedaran en blanco, el tamaño del archivo ocuparía un espacio de 17250 caracteres (es el producto del tamaño del registro por la cantidad de registros). No necesito conocer que datos se almacenan, sólo saber cuantos registros son los almacenados.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 51 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
Para poder describir el registro de un archivo (es decir, cualquiera de los registros que compone el archivo) necesito poder determinar los siguientes elementos:
Dato a almacenar Identificador del campo donde se almacenará el dato Tipo de dato que se almacenará en el campo Formato de almacenamiento Máscara de presentación (visualización o impresión) Tamaño del campo (espacio reservado para el campo, para que contenga el dato) Referencia a tabla de codificación.
Con esto puedo averiguar lo siguiente: Tamaño del registro (o de los registros, ya que todo tienen la misma estructura) Y si además conozco la cantidad de registros que componen el archivo puedo determinar lo siguiente: Tamaño del archivo Importante: los identificadores de campo se forman con una secuencia de caracteres con las siguientes restricciones: Deben empezar con un carácter alfabético Puede contener solamente caracteres alfabéticos y/o numéricos. No puede contener espacios en blanco ni signos. La cantidad de caracteres a utilizar es variable, dependiendo de la necesidad.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 52 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
TRABAJO PRÁCTICO Nº 4 1) Según el siguiente diseño de registro de un archivo de 1540 registros, determinar: a) b) c) d)
Cantidad de campos del registro Tamaño del registro (en caracteres) Tamaño del archivo en registros Tamaño del archivo en caracteres
Identificación del campo NUSR
Descripción del registro Tipo de dato que almacena Numérico
Tamaño en caracteres 5
ANUSR
Alfabético
25
TUSR
Alfabético
10
FALTA
Especial
8
ESTD
Alfabético
8
IDEQP
Alfanumérico
7
2) Se codificaron algunos datos en los registros del archivo anterior. Determinar, según la nueva tabla de descripción del registro, lo siguiente: a)
Los campos que se codificaron y el nuevo tamaño que tienen b) El nuevo tamaño del registro (en caracteres) c) El tamaño del archivo en registros d) El nuevo tamaño del archivo en caracteres e) La cantidad de espacio ahorrado (en caracteres) en el registro f) La cantidad de espacio ahorrado (en caracteres) en el archivo
Identificación del campo NUSR
Descripción del registro Tipo de dato que almacena Numérico
Tamaño en caracteres 5
ANUSR
Alfabético
25
TUSR
Alfabético
2
FALTA
Especial
8
ESTD
Alfabético
3
IDEQP
Alfanumérico
7
STK
UBIC
3) Determinar según el siguiente archivo la descripción del registro: MTRL T
O
R
N
I
C
L
A
V
O
A
R
A
N
D
E
T
A
R
U
G
O
M
E
N
S
U
L
A
C
A
Ñ
O
3
M
M
E
M
B
A
N
A
C
A
J
A
1
0
X
1
C
A
B
L
E
1
.
5
L
A
M
P
A
R
A
6
0
W
L
A
M
P
A
R
A
4
0
W
C
A
B
L
E
T
O
R
T
E
R
P
A
S
A
C
O
N
E
C
L
L
A
V
E
L
L
MDD
L
O
A
3
0
1
R
X
0
1
0
M
0
M
3
I
C
M
A
MRC
3
3
M
E
T
A
L
2
5
T
E
C
N
O
2
0
M
E
T
A
L
3
6
P
L
A
S
T
T
E
C
N
O
T
E
C
N
O
C
C
O
O
P
L
A
S
T
E
T
A
L
C
O
P
H
I
L
I
P
S
O
S
R
A
M
P
H
I
L
I
P
L
A
S
T
E
C
N
O
P
H
I
L
I
5
9
V
E
N
T
A
S
7
4
9
V
E
N
T
A
S
5
2
5
V
E
N
T
A
S
4
9
3
V
E
N
T
A
S
4
8
D
E
P
O
1
2
D
E
P
O
6
7
D
E
P
O
5
5
D
E
P
O
3
M
T
4
P
S
9
7
V
E
N
T
A
S
2
1
4
V
E
N
T
A
S
3
4
6
V
E
N
T
A
S
4
5
V
E
N
T
A
S
5
7
V
E
N
T
A
S
3
9
D
E
P
O
2 P
S
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 53 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
4) Determinar con los datos del punto anterior: a) b) c) d)
Cantidad de campos del registro Tamaño del registro (en caracteres) Tamaño del archivo en registros Tamaño del archivo en caracteres
5) Codificar los campos MRC y UBIC del archivo del punto 3) (construir las tablas de códigos), realizar la nueva descripción del registro, almacenar los datos en el archivo y determinar: a) b) c) d) e) f)
Los campos que se codificaron y el nuevo tamaño que tienen El nuevo tamaño del registro (en caracteres) El tamaño del archivo en registros El nuevo tamaño del archivo en caracteres La cantidad de espacio ahorrado (en caracteres) en el registro La cantidad de espacio ahorrado (en caracteres) en el archivo
6) Los registros del archivo del punto 3) están almacenados en bloques (bloqueados). El factor de bloqueo del archivo es 2 (dos). Determinar lo siguiente: a) b) c) d) e) f)
Cantidad de registros (registros lógicos) almacenados en el archivo. Cantidad de bloques (registros físicos) almacenados en el archivo. Cantidad de registros (registros lógicos) que contiene cada bloque (registro físico) Cantidad de operaciones de lectura necesarias para procesar todos los registros del archivo. Si el archivo no estuviera bloqueado, ¿Cuántas operaciones de lectura serían necesarias para procesar todos los registros? Con el bloqueo de registros, ¿Se modificó el tamaño del archivo? ¿Se modificó el tamaño del registro? ¿Cambiaron los datos almacenados? ¿Qué es lo que cambia o se produce?
7) Si tuviera que determinar lo mismo del punto anterior, pero con el archivo del punto 5), ¿Qué respuestas obtendría? 8) Se dispone de un archivo de datos almacenado en fichas (tarjetas de cartulina) con los datos correspondientes a los socios de un club deportivo. Se desea almacenar el archivo en forma electrónica, para lo cual se necesita lo siguiente:
Diseñar la estructura del archivo electrónico para que contenga la información de todos los socios. El tamaño del registro no debe exceder de 90 caracteres, para no sobrepasar el espacio de almacenamiento disponible. La estructura se refleja en el diseño del registro. Para el diseño se debe tener en cuenta la siguiente información:
El archivo contiene 2150 fichas, una por cada socio.
Las fichas contienen los siguientes datos de los socios: NÚMERO DE SOCIO CATEGORÍA APELLIDO Y NOMBRES TIPO Y NÚMERO DE DOCUMENTO SEXO AÑO DE NACIMIENTO ESTADO CIVIL DOMICILIO (CALLE Y NÚMERO) – TELÉFONO (CARACTERÍSTICA Y NÚMERO) DEPORTE QUE PRACTICA FECHA DE INGRESO
El número de credencial del socio más nuevo es el 45025
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 54 -
Tecnología de la Información y la Comunicación – 4to año Secundaria Prof. César Manuel Giménez
Bloque 4 Organización de la Información
Los tipos de documentos son: DOCUMENTO NACIONAL DE IDENTIDAD LIBRETA CIVICA LIBRETA DE ENROLAMIENTO CEDULA DE POLICIA PROVINCIAL CEDULA DE POLICIA FEDERAL PASAPORTE
Las categorías son: MENOR – INFANTIL – JUVENIL – CADETE – MAYOR
El estado civil puede ser: SOLTERO/A – CASADO/A – DIVORCIADO/A – VIUDO/A
Los deportes que se practican en el club son: FÚTBOL – BÁSQUET – VOLEY – NATACIÓN – TENIS
DISEÑO DEL REGISTRO: (realizar las consignas en el orden indicado) a)
Completar una tabla, como el modelo que figura al pie, que describa la estructura del registro, indicando los datos del socio que componen el registro según los datos de las fichas. El registro no necesariamente debe tener la misma estructura de las fichas, pero debe contener los mismos datos. Se pueden dividir los datos, por ejemplo: APELLIDO Y NOMBRE.
b) Asignar un identificador al campo que contendrá a cada dato. El identificador debe comenzar con una letra, puede incluir letras y números y no puede contener espacios en blanco o signos. c)
Indicar que tipo de dato almacena cada campo y si corresponde determinar el formato y/o máscara del dato.
d) Codificar todos los campos posibles. Construir las tablas de códigos. Indicar en el diseño del registro que campo está codificado. e)
Establecer el tamaño adecuado para cada campo. La suma del tamaño de todos los campos (tamaño del registro) no puede superar el límite impuesto.
f)
Determinar la cantidad de campos, el tamaño del registro, la cantidad de registros y el espacio que se necesita para almacenar el archivo electrónico. DESCRIPCIÓN DEL REGISTRO
DATOS DEL SOCIO
IDENTIFICADOR DEL CAMPO
TIPO DE DATO
FORMATO (*)
MÁSCARA (*)
TAMAÑO DEL CAMPO
(*) Solamente en los campos que corresponda.
Instituto Superior “Nuestra Señora de la Misericordia”· I-29 Página - 55 -
CODIFICADO (*) (colocar una X)