10 recursos Hadoop dignos de un marcador
Los siguientes son diez recursos Hadoop fabulosos que son dignos de crear un marcador en su navegador. Estos recursos ayudan a crear un plan de aprendizaje permanente para Hadoop.
Conteúdo
Sistema nervioso central: Apache.org
La Apache Software Foundation (ASF) es la comunidad central de los proyectos de software de código abierto. No cualquier proyecto puede ser un proyecto de Apache - muchos procesos de consenso impulsado por convertir una pieza de software de sus diseños iniciales y código beta (su incubadora estado) para el software de pleno derecho, generalmente disponibles.
La ASF no es justo donde se gestionan proyectos como Hadoop - es donde " vivir y respirar ". Hoy en día, hay cientos de proyectos de Apache. Con esto en mente, usted debe marcar la página Hadoop como uno de sus recursos para el aprendizaje del apoyo principal. Este sitio es importante porque se puede acceder al código fuente allí.
Twitter este
Twitter no es el lugar para aprender Hadoop per se - después de todo, no se puede dominar fácilmente la programación MapReduce en las lecciones que abarcan sólo 140 caracteres. Sea como fuere, un buen número de grandes gurús de datos están en Twitter, y expresar opiniones y puntos a los recursos que pueden hacer que un usuario inteligente Hadoop.
Un número de listas de top-factor de influencia en la cubierta paisaje Twitter Hadoop y datos grandes, y esa es la mejor manera de encontrar estas personalidades Hadoop y agregarlos a sus listas de Twitter.
Universidad Hortonworks
Universidad Hortonworks ofrece capacitación Hadoop y certificaciones. El sitio ofrece cursos de Hadoop construidas tanto para los profesionales de administrador o desarrollador con la opción de un programa de certificación riguroso. Hortonworks emplea a algunos de los expertos más profundos y más notables de Hadoop en el mundo, por lo que están seguros de experiencia detrás de la calidad de cursos.
Universidad Cloudera
Universidad Cloudera es similar en su modelo de negocio y la carta a la Universidad Hortonworks, proporcionando una serie de vías que van desde texto tradicional de vídeo de aprendizaje. Cloudera es un elemento destacado en el mundo de Hadoop. (Doug Cutting, el " padre " de Hadoop es su arquitecto jefe.) El sitio ofrece un amplio conjunto de cursos, y más, que se basa en la distribución de Cloudera Hadoop (CDH).
BigDataUniversity.com
BigDataUniversity.com (el caso no importa cuando se introduce la URL en su navegador) es un recurso fantástico para aprender sobre - usted lo adivinó - Big Data. Por supuesto, los grandes datos no es sólo Hadoop, por lo que se puede encontrar más recursos de Hadoop en este sitio. Esta universidad cuenta con más de 100.000 estudiantes matriculados y que aprenden sobre Hadoop y datos grandes cada día.
planeta Big Data Blog Agregador
Es genial cuando el nombre de un sitio que dice exactamente lo que hace - como el planeta Big Data Blog Agregador: Es un agregador de blogs sobre Big Data, Hadoop, y otros temas relacionados en el planeta (bueno, en el planeta Tierra de todos modos).
Ambos grandes nombres y no hay nombres aparecen en el sitio, pero eso es útil: Aunque no es, sin duda, el compromiso de Hadoop por Cloudera, Hortonworks, IBM y otros, a menudo es refrescante y valiosa para conseguir la exposición a los pensamientos y opiniones de las bases, los profesionales no afiliados por comunidades no atados a un proveedor específico en su hoja de ruta de aprendizaje.
El foro de Quora Hadoop
El foro Quora Hadoop es la piedra angular para cualquiera que quiera saber más sobre Hadoop, o datos sobre grandes en general, para el caso.
Como en cualquier foro, la gama de preguntas y respuestas que usted puede encontrar en este sitio es vertiginosa, pero todo lo que conduce a lo que estás buscando: el conocimiento. El sitio tiene vínculos con Hadoop y para sus componentes individuales - por ejemplo, cuenta con foros específicos para MapReduce, HDFS, Cerdo, HBase, y más.
El sitio también se ha asociado Hadoop Foros-por ejemplo, Cloudera y Hortonworks tienen grupos de discusión específicos para sus distribuciones - un testimonio de lo popular que es este foro.
El Hub de IBM Big Data
El IBM Big Data Hub es un excelente lugar para aprender sobre Hadoop y su ecosistema. A pesar de ser de propiedad y operado por IBM, el contenido de este sitio no está siempre ligada a los productos de IBM.
El IBM Big Data Hub ofrece a cualquier visitante con conocimientos suficientes para saciar la sed de nadie para grandes datos. Usted encontrará todo tipo de blogs, vídeos, artículos de los analistas, casos de uso, infografías, presentaciones y más. Es verdaderamente un tesoro de recursos de datos grandes.
Conferencias no se puede perder
Hay muchas conferencias Hadoop, y conferencias de datos aún más grandes - la Cumbre de Hadoop y Strata Hadoop Mundial como las conferencias por excelencia que no debe perderse. Normalmente, un proveedor de distribución copatrocinadores estas conferencias. Por ejemplo, Yahoo! y Hortonworks patrocinan la Cumbre Hadoop, Cloudera y es el co-patrocinador del Strata Hadoop Mundial.
Tanto Strata Hadoop Mundial y la Cumbre Hadoop son el lugares de reunión de las mentes más brillantes de Hadoop en la Business- estas conferencias atraen a una amplia gama de profesionales de Hadoop-interesadas, incluidos los tomadores de decisiones, arquitectos, desarrolladores, analistas, y mucho más.
Los papeles de Google que lo empezó todo
Lo que ahora se conoce como Hadoop tiene su génesis en una serie de artículos escritos por empleados de Google que se centran en el problema de la indexación de la Web.
Si bien el proyecto Apache Nutch (una tecnología de código abierto para el rastreo de la web) se estaba convirtiendo su enfoque en la ampliación hacia el exterior con el fin de indexar un mayor volumen de datos de la web, Google publicó un artículo, " El Google File System " (Octubre de 2003), que influyó en gran medida Doug Cutting y su Nutch co-fundador, Mike Cafarella. Poco después, Google dio a conocer su papel " MapReduce: Tratamiento de datos simplificado de Grandes Clusters " (Diciembre de 2004).
En conjunto, el concepto de un sistema de archivos distribuido y un marco de procesamiento en paralelo a gran escala fueron tomadas por corte y Cafarella desarrollar Hadoop. Por supuesto, el corte comercializado este trabajo, mientras que en Yahoo !, y el resto, como dicen, es historia.