10 recursos Hadoop dignos de un marcador

Los siguientes son diez recursos Hadoop fabulosos que son dignos de crear un marcador en su navegador. Estos recursos ayudan a crear un plan de aprendizaje permanente para Hadoop.

Conteúdo

Sistema nervioso central: apache.org
Twitter este
Universidad hortonworks
Universidad cloudera
Bigdatauniversity.com
Planeta big data blog agregador
El foro de quora hadoop
El hub de ibm big data
Conferencias no se puede perder
Los papeles de google que lo empezó todo

Sistema nervioso central: Apache.org

La Apache Software Foundation (ASF) es la comunidad central de los proyectos de software de código abierto. No cualquier proyecto puede ser un proyecto de Apache - muchos procesos de consenso impulsado por convertir una pieza de software de sus diseños iniciales y código beta (su incubadora estado) para el software de pleno derecho, generalmente disponibles.

La ASF no es justo donde se gestionan proyectos como Hadoop - es donde " vivir y respirar ". Hoy en día, hay cientos de proyectos de Apache. Con esto en mente, usted debe marcar la página Hadoop como uno de sus recursos para el aprendizaje del apoyo principal. Este sitio es importante porque se puede acceder al código fuente allí.

Twitter este

Twitter no es el lugar para aprender Hadoop per se - después de todo, no se puede dominar fácilmente la programación MapReduce en las lecciones que abarcan sólo 140 caracteres. Sea como fuere, un buen número de grandes gurús de datos están en Twitter, y expresar opiniones y puntos a los recursos que pueden hacer que un usuario inteligente Hadoop.

Un número de listas de top-factor de influencia en la cubierta paisaje Twitter Hadoop y datos grandes, y esa es la mejor manera de encontrar estas personalidades Hadoop y agregarlos a sus listas de Twitter.

Universidad Hortonworks

Universidad Hortonworks ofrece capacitación Hadoop y certificaciones. El sitio ofrece cursos de Hadoop construidas tanto para los profesionales de administrador o desarrollador con la opción de un programa de certificación riguroso. Hortonworks emplea a algunos de los expertos más profundos y más notables de Hadoop en el mundo, por lo que están seguros de experiencia detrás de la calidad de cursos.

Universidad Cloudera

Universidad Cloudera es similar en su modelo de negocio y la carta a la Universidad Hortonworks, proporcionando una serie de vías que van desde texto tradicional de vídeo de aprendizaje. Cloudera es un elemento destacado en el mundo de Hadoop. (Doug Cutting, el " padre " de Hadoop es su arquitecto jefe.) El sitio ofrece un amplio conjunto de cursos, y más, que se basa en la distribución de Cloudera Hadoop (CDH).

BigDataUniversity.com

BigDataUniversity.com (el caso no importa cuando se introduce la URL en su navegador) es un recurso fantástico para aprender sobre - usted lo adivinó - Big Data. Por supuesto, los grandes datos no es sólo Hadoop, por lo que se puede encontrar más recursos de Hadoop en este sitio. Esta universidad cuenta con más de 100.000 estudiantes matriculados y que aprenden sobre Hadoop y datos grandes cada día.

planeta Big Data Blog Agregador

Es genial cuando el nombre de un sitio que dice exactamente lo que hace - como el planeta Big Data Blog Agregador: Es un agregador de blogs sobre Big Data, Hadoop, y otros temas relacionados en el planeta (bueno, en el planeta Tierra de todos modos).

Ambos grandes nombres y no hay nombres aparecen en el sitio, pero eso es útil: Aunque no es, sin duda, el compromiso de Hadoop por Cloudera, Hortonworks, IBM y otros, a menudo es refrescante y valiosa para conseguir la exposición a los pensamientos y opiniones de las bases, los profesionales no afiliados por comunidades no atados a un proveedor específico en su hoja de ruta de aprendizaje.

El foro de Quora Hadoop

El foro Quora Hadoop es la piedra angular para cualquiera que quiera saber más sobre Hadoop, o datos sobre grandes en general, para el caso.

Como en cualquier foro, la gama de preguntas y respuestas que usted puede encontrar en este sitio es vertiginosa, pero todo lo que conduce a lo que estás buscando: el conocimiento. El sitio tiene vínculos con Hadoop y para sus componentes individuales - por ejemplo, cuenta con foros específicos para MapReduce, HDFS, Cerdo, HBase, y más.

El sitio también se ha asociado Hadoop Foros-por ejemplo, Cloudera y Hortonworks tienen grupos de discusión específicos para sus distribuciones - un testimonio de lo popular que es este foro.

El Hub de IBM Big Data

El IBM Big Data Hub es un excelente lugar para aprender sobre Hadoop y su ecosistema. A pesar de ser de propiedad y operado por IBM, el contenido de este sitio no está siempre ligada a los productos de IBM.

El IBM Big Data Hub ofrece a cualquier visitante con conocimientos suficientes para saciar la sed de nadie para grandes datos. Usted encontrará todo tipo de blogs, vídeos, artículos de los analistas, casos de uso, infografías, presentaciones y más. Es verdaderamente un tesoro de recursos de datos grandes.

Conferencias no se puede perder

Hay muchas conferencias Hadoop, y conferencias de datos aún más grandes - la Cumbre de Hadoop y Strata Hadoop Mundial como las conferencias por excelencia que no debe perderse. Normalmente, un proveedor de distribución copatrocinadores estas conferencias. Por ejemplo, Yahoo! y Hortonworks patrocinan la Cumbre Hadoop, Cloudera y es el co-patrocinador del Strata Hadoop Mundial.

Tanto Strata Hadoop Mundial y la Cumbre Hadoop son el lugares de reunión de las mentes más brillantes de Hadoop en la Business- estas conferencias atraen a una amplia gama de profesionales de Hadoop-interesadas, incluidos los tomadores de decisiones, arquitectos, desarrolladores, analistas, y mucho más.

Los papeles de Google que lo empezó todo

Lo que ahora se conoce como Hadoop tiene su génesis en una serie de artículos escritos por empleados de Google que se centran en el problema de la indexación de la Web.

Si bien el proyecto Apache Nutch (una tecnología de código abierto para el rastreo de la web) se estaba convirtiendo su enfoque en la ampliación hacia el exterior con el fin de indexar un mayor volumen de datos de la web, Google publicó un artículo, " El Google File System " (Octubre de 2003), que influyó en gran medida Doug Cutting y su Nutch co-fundador, Mike Cafarella. Poco después, Google dio a conocer su papel " MapReduce: Tratamiento de datos simplificado de Grandes Clusters " (Diciembre de 2004).

En conjunto, el concepto de un sistema de archivos distribuido y un marco de procesamiento en paralelo a gran escala fueron tomadas por corte y Cafarella desarrollar Hadoop. Por supuesto, el corte comercializado este trabajo, mientras que en Yahoo !, y el resto, como dicen, es historia.

Sobre el autor

Hadapt y hadoop

A finales del año 2010, Hadapt se formó como una puesta en marcha por dos estudiantes de la Universidad de Yale y profesor asistente de ciencias de la computación. Profesor Daniel Abadi y Kamil Bajda-Pawlikowski, estudiante de doctorado del…

Hadoop y colmena

Para hacer el cuento largo, Colmena ofrece Hadoop con un puente hacia el mundo RDBMS y proporciona un dialecto SQL conocida como Hive Query Language (HiveQL), que se puede utilizar para realizar tareas tipo SQL. Esa es la gran noticia, pero hay más…

Hadoop distribuido sistema de archivos (HDFS) federación

La solución a la expansión de grupos de Hadoop indefinidamente es federar el NameNode. Antes de Hadoop 2 entró en escena, racimos de Hadoop tuvieron que vivir con el hecho de que NameNode coloca límites al grado en que podrían escalar. Pocos…

Cerdo Hadoop y latín de cerdo para los grandes datos

El poder y la flexibilidad de Hadoop para grandes datos son inmediatamente visibles para los desarrolladores de software principalmente porque el ecosistema Hadoop fue construido por los desarrolladores, para los desarrolladores. Sin embargo, no…

Hadoop Sqoop para grandes datos

Sqoop (SQL-a-Hadoop) es una herramienta de datos grande que ofrece la capacidad de extraer datos de los almacenes de datos no Hadoop, transformar los datos en una forma utilizable por Hadoop, y luego cargar los datos en HDFS. Este proceso se llama…

¿Cómo elegir una arquitectura de clúster Hadoop

Hadoop está diseñado para ser desplegado en un gran grupo de ordenadores conectados en red, con nodos maestros (que albergan los servicios que controlan el almacenamiento de Hadoop y procesamiento) y nodos esclavos (donde se almacena o trata los…

Modos locales y distribuidas de guiones de cerdos en ejecución en hadoop

Antes de que pueda ejecutar su primer script Cerdo en Hadoop, es necesario tener una manija en cómo los programas de cerdo pueden ser empaquetados con el servidor de cerdo.Cerdo tiene dos modos de ejecutar secuencias de comandos:Modo local: Todos…

Administrar los recursos de datos grandes y aplicaciones con hilo hadoop

Planificación de tareas y seguimiento de los grandes datos son partes integrales de Hadoop MapReduce y se pueden usar para administrar los recursos y aplicaciones. Las primeras versiones de Hadoop apoyaron un sistema de seguimiento de trabajos y…

La gestión de grandes datos con Hadoop HDFS y MapReduce:

Hadoop, un marco de software de código abierto, utiliza HDFS (el sistema de archivos distribuido Hadoop) y MapReduce para analizar grandes volúmenes de datos en clústeres de hardware que la mercancía es, en un entorno de computación…

Hawq Pivotal y hadoop

En 2010, EMC y VMware, los líderes del mercado en la entrega de TI como un servicio a través de la computación en nube, adquirieron Greenplum Corporation, las personas que habían llevado con éxito el producto Greenplum MPP Data Warehouse (DW)…

Ejecución de aplicaciones antes hadoop 2

Debido a que muchos despliegues de Hadoop existentes todavía no están utilizando embargo, otro negociador de recursos (HILO), tomar un rápido vistazo a cómo Hadoop logró su procesamiento de datos antes de los días de Hadoop 2. Concéntrese en…

Ejecución de modelos estadísticos en MapReduce de Hadoop

La conversión de modelos estadísticos para funcionar en paralelo es una tarea difícil. En el paradigma tradicional para la programación en paralelo, de acceso a memoria se regula mediante el uso de hilos - subprocesos creados por el sistema…

maniqui-es.com » Computadoras y software » Big Data » Gestión de datos » 10 recursos Hadoop dignos de un marcador