Capa de 0 de la pila de datos grande: la infraestructura física redundante
En el nivel más bajo de la pila de datos grande es la infraestructura física. Podría Su empresa ya tiene un centro de datos o las inversiones realizadas en infraestructuras físicas, por lo que vamos a querer encontrar una manera de utilizar los activos existentes.
Conteúdo
Implementaciones de datos grandes tienen requisitos muy específicos sobre todos los elementos de la arquitectura de referencia, por lo que tienen que examinar estos requisitos de forma capa por capa para asegurar que su aplicación se realice y la escala de acuerdo a las demandas de su negocio.
Una lista priorizada de los principios de grandes datos debe incluir declaraciones sobre lo siguiente:
Actuación: ¿Cómo receptivo es lo que necesita el sistema para que sea? Rendimiento, también llamado latencia, a menudo se mide extremo a extremo, basado en una sola transacción o solicitud de consulta.
Disponibilidad: ¿Necesita una garantía de operatividad del 100 por ciento de servicio? ¿Por cuánto tiempo puede esperar su empresa en el caso de una interrupción del servicio o el fracaso?
Escalabilidad: ¿Qué tan grande no tiene por qué ser su infraestructura? ¿Cuánto espacio en disco que se necesita hoy y en el futuro? ¿Cuánta potencia de cálculo se puede pedir? Por lo general, usted necesita decidir lo que necesita y luego añadir un poco más de la escala de desafíos inesperados.
Flexibilidad: ¿Qué tan rápido se puede añadir más recursos a la infraestructura? ¿Qué tan rápido puede su infraestructura de recuperarse de los fracasos?
Costo: ¿Qué se puede pagar? Debido a que la infraestructura es un conjunto de componentes, es posible que pueda comprar el " mejor " la creación de redes y decidir para ahorrar dinero en el almacenamiento. Es necesario establecer los requisitos para cada una de estas áreas en el contexto de un presupuesto global y luego hacer compensaciones en caso necesario.
Como dato importante se trata de alta velocidad, de gran volumen y variedad de alta los datos, la infraestructura física, literalmente, " hacer o deshacer " la implementación. Implementaciones de datos más grandes tienen que ser altamente disponible, por lo que las redes, servidores y almacenamiento físico deben ser a la vez resistente y redundante. Resistencia y redundancia están interrelacionados.
Una infraestructura, o un sistema, es resistente a la falla o cambia cuando suficientes recursos redundantes están en su lugar, listos para entrar en acción. La redundancia asegura que un fallo de funcionamiento tales no causará una interrupción. Resiliencia ayuda a eliminar los puntos únicos de fallo en su infraestructura.
En los grandes centros de datos con los requisitos de continuidad del negocio, la mayoría de la redundancia es en su lugar y se puede aprovechar para crear un entorno de datos grande. En las nuevas implementaciones, los diseñadores tienen la responsabilidad de asignar el despliegue a las necesidades de la empresa en base a los costos y el rendimiento.
Esto significa que la complejidad técnica y operativa se enmascara detrás de una colección de servicios, cada uno con términos específicos para el rendimiento, la disponibilidad, recuperación, y así sucesivamente. Estos términos se describen en los acuerdos de nivel de servicio (SLA) y por lo general se negocian entre el proveedor de servicios y el cliente, con sanciones por incumplimiento.
En efecto, esto crea un centro de datos virtual. Incluso con este enfoque, usted debe saber lo que se necesita para generar y ejecutar un despliegue de grandes datos para que pueda hacer las selecciones más apropiadas de las ofertas de servicios disponibles. A pesar de tener un SLA, su organización aún tiene la responsabilidad última de rendimiento.
Grandes redes de datos redundantes Física
Las redes deben ser redundante y deben tener la capacidad suficiente para acomodar el volumen previsto y la velocidad de los datos entrantes y salientes, además de la " lo normal " el tráfico de red experimentado por el negocio. A medida que comience a hacer grandes datos sean una parte integral de su estrategia de computación, es razonable esperar que el volumen y la velocidad para aumentar.
Diseñadores de infraestructura deben planear para estos aumentos previstos y tratar de crear implementaciones físicas que son " elástica ". Como el tráfico de red fluye y refluye, también lo hace el conjunto de los activos físicos asociados con la implementación. Su infraestructura debe ofrecer capacidades de monitoreo para que los operadores puedan reaccionar cuando se requieren más recursos para hacer frente a los cambios en las cargas de trabajo.
Administrar el hardware grandes datos: Almacenamiento y servidores
Del mismo modo, el hardware (almacenamiento y servidor) activos debe tener la velocidad y la capacidad suficiente para manejar todas las funciones de datos grandes esperados. Es de poca utilidad para tener una red de alta velocidad con los servidores lentos porque los servidores más probable es convertirse en un cuello de botella. Sin embargo, un conjunto muy rápido de servidores de almacenamiento y computación puede superar el rendimiento de red variable. Por supuesto, nada funcionará correctamente si el rendimiento de la red es deficiente o poco confiable.
Operaciones de infraestructura de datos grandes
Otra consideración de diseño importante es la gestión de las operaciones de infraestructura. Los mayores niveles de rendimiento y flexibilidad estarán presentes sólo en un entorno bien administrado. Los administradores de centros de datos necesitan ser capaces de anticipar y prevenir fallas catastróficas de manera que la integridad de los datos, y por extensión los procesos de negocio, se mantiene. Las organizaciones de TI a menudo pasan por alto y por lo tanto invierten poco en esta área.