Almacenes de Bases de Datos Durante años, Las compañías han acumulado y administrado enormes cantidades de datos de todos los tipos imaginables. Debido a que Los datos son en realidad Lo que da vida a una corporación, puede considerar al sistema de almacenamiento de datos de una corporación como su corazón. Mientras más grande y fuerte sea el sistema, más información podrá controlar y operará de manera más efectiva. Las compañías grandes y medianas están tomando nuevos enfoques en el almacenamiento y administración de sus conjuntos enormes de datos. En la parte de almacenamiento se ubican los almacenes de datos, un conjunto masivo de información corporativa que a menudo se almacena en gigabytes o terabytes de datos. Crear un almacén de datos es mucho más complicado que simplemente depositar todo tipo de datos en un lugar de almacenamiento. Las compañías deben considerar distintos factores, como los siguientes antes de invertir en una estructura de almacén de datos: » Espacio de almacenamiento. Uno de los esquemas de almacenamiento masivo más popular está basado en un conjunto redundante de discos independientes (RAID, por sus siglas en inglés). RAID es un sistema de almacenamiento que enlaza cualquier cantidad de unidades de disco de manera que actúa como un solo disco. En este sistema, la información se escribe en dos o más discos de manera simultánea para mejorar la velocidad y confiabilidad y asegurar que los datos estén disponibles para los usuarios todo el tiempo. Los sistemas RAID de gran escala ofrecen muchos terabytes de almacenamiento y un acceso y tiempos de transferencia de datos increíblemente rápidos. » Esquema de procesamiento. Generalmente, se utilizan dos tecnologías para controlar los almacenes de datos: el multiprocesamiento simétrico (SMP, por sus siglas en inglés) y el procesamiento paralelo masivo (MPP, por sus siglas en inglés). Mediante el uso de controladores RAID especiales, este tipo de sistemas pueden recuperar datos rápidamente, comprobar si existen errores y recuperar una copia de respaldo de los datos cuando es necesario. » Estrategia de respaldo. Las capacidades RAID están basadas en tres técnicas básicas: (1) espejo, (2) distribución y (3) distribución con paridad. En un sistema de espejo, los datos se escriben en dos o más discos de forma simultánea, proporcionando una copia completa de toda la información en una unidad en caso de que La otra unidad falle. La distribución proporciona al usuario una respuesta rápida al distribuir los datos en varios discos. Sin embargo, la distri
bución no proporciona un respaldo cuando uno de Los discos falla. La distribución con paridad ofrece la velocidad de la distribución con la confiabilidad del sistema de espejo; en este caso, el sistema almacena la información de paridad que se puede utilizar para reconstruir los datos cuando una unidad de disco falla.
» Velocidad. Los sistemas de almacén de datos más nuevo no sólo incorporan unidades de disco enormes sino que interconectan a las unidades con líneas de fibra óptica en lugar de buses basados en cables estándar. Las líneas de fibra óptica utilizan rayos de Luz pulsante para transmitir datos y funcionan muchas veces más rápido que las tecnologías de bus de datos estándar. Los grandes almacenes de datos ofrecen los requisitos de datos a decenas de miles de usuarios de una organización grande. También se utilizan para almacenar y proporcionar soporte a miles o millones de transacciones por día en sitios Web activos, por ejemplo, los sitios Web populares de venta al público y de subastas electrónicas.