Fundamentos de la infraestructura de datos grande
Big Data es todo acerca de la alta velocidad, grandes volúmenes, y una amplia variedad de datos, por lo que la infraestructura física, literalmente "hacer o deshacer" la implementación. La mayoría de las implementaciones de datos grandes deben ser altamente disponible, por lo que las redes, servidores y almacenamiento físico deben ser resistentes y redundante.
Resistencia y redundancia están interrelacionados. Una infraestructura, o un sistema, es resistente a la insuficiencia o cambia cuando suficientes recursos redundantes están en su lugar listo para entrar en acción. Resiliencia ayuda a eliminar los puntos únicos de fallo en su infraestructura. Por ejemplo, si sólo existe una conexión de red entre su empresa y la Internet, usted no tiene la redundancia de la red y la infraestructura no es elástica con respecto a una caída de la red.
En los grandes centros de datos con los requisitos de continuidad del negocio, la mayoría de la redundancia es en su lugar y se puede aprovechar para crear un entorno de datos grande. En las nuevas implementaciones, los diseñadores tienen la responsabilidad de asignar el despliegue a las necesidades de la empresa en base a los costos y el rendimiento.