Dispositivos de almacenamiento de datos
Al igual que con los pantalones vaqueros de campana, las bases de datos de hardware asistida se encuentran en el camino de regreso. Microsoft, Oracle y Netezza están de moda en los seminarios de bases de datos de todo el mundo. A mediados de la década de 1980, los vendedores Britton Lee y Teradata (que finalmente se fusionó) estaban de moda.
Ellos proporcionaron máquinas dedicados que optimizan el procesamiento de base de datos - las primeras máquinas utilizadas por los consumidores de datos pesados, incluyendo muchas de las compañías de bienes de consumo envasados.
El objetivo de estas cajas era dedicar todos los aspectos de una computadora para la obtención de datos para los usuarios más rápido. Esta máquina dedicada incluyó a las operaciones de base de datos, memoria, CPU y disco de consulta centrada. Con el tiempo, estos productos se movieron fuera de moda, y los sistemas de gestión de bases de datos se han migrado a una arquitectura de gestión en cualquier caja más abierta.
Ahora están de vuelta!
LA aparato de almacenamiento de datos es un conjunto integrado de servidores, almacenamiento, sistema operativo, DBMS, y el software específicamente pre-instalada y pre-optimizado para el almacenamiento de datos. Dispositivos de almacenamiento de datos proporcionan soluciones para el mediano a gran volumen de mercado de almacenamiento de datos, que ofrece un rendimiento de bajo costo en los volúmenes de datos en el terabyte a petabyte gama (que es una gran cantidad de datos!).
La mayoría de los proveedores de dispositivos de almacenamiento de datos utilizan masivamente procesamiento (MPP) arquitecturas paralelas para proporcionar un alto rendimiento de la consulta y la escalabilidad de la plataforma. Arquitecturas MPP consisten en procesadores independientes o servidores que ejecutan en paralelo.
La mayoría de las arquitecturas MPP implementar un Arquitectura nada común, en el que cada servidor es autosuficiente y controla su propia memoria y disco. Arquitecturas nada compartidas tienen un historial probado de alta escalabilidad y poca contención.
La mayoría de los dispositivos de almacenamiento de datos se distribuyen los datos en unidades de almacenamiento en disco dedicados conectados a cada servidor en el aparato. Esta distribución permite que los aparatos para resolver una consulta relacional mediante el escaneo de los datos en cada servidor en paralelo. El enfoque de divide y vencerás ofrece un alto rendimiento y escala linealmente al agregar nuevos servidores en la arquitectura.
Y, desde la perspectiva de los precios, la mayoría de los vendedores en este campo están intentando una estrategia de plug-and-play. Por ejemplo, Netezza normalmente vende un nuevo usuario su producto como con Teradata para menos que el coste de mantenimiento de Teradata compatible con el enchufe. Este precio hace que los productos muy atractivos, dándoles una tasa de adopción cada vez mayor.