10 recursos de Hadoop dignos de un marcador

A continuación se presentan diez recursos de Hadoop terribles que son dignos de crear un marcador en su navegador. Estos recursos le ayudan a crear un plan de aprendizaje permanente para Hadoop.

Sistema nervioso central: Apache.org

los Apache Software Foundation (ASF) es la comunidad central para proyectos de software de código abierto. No cualquier proyecto puede ser un proyecto de Apache - muchos procesos de consenso impulsado por convertir una pieza de software desde sus primeros diseños y código beta (su incubadora de estado) a un software completo, generalmente disponibles.

La ASF es no sólo donde se gestionan proyectos como Hadoop - “viven y respiran” que es donde Hoy en día, hay cientos de proyectos de Apache. Con esto en mente, usted debe marcar la página Apache Hadoop como uno de sus recursos para el aprendizaje del apoyo principal. Este sitio es importante porque se puede acceder al código fuente allí.

tuitea esto

Twitter no es el lugar para aprender por sí Hadoop - después de todo, no se puede dominar fácilmente la programación MapReduce en las lecciones que abarcan sólo 140 caracteres. Sea como fuere, un buen número de grandes gurús de datos están en Twitter, y expresar opiniones y puntos a los recursos que pueden hacer que un usuario inteligente Hadoop.

Un número de listas de top-factor de influencia en la cobertura del paisaje Twitter Hadoop y grandes volúmenes de datos, y esa es la mejor manera de encontrar estas personalidades Hadoop y agregarlos a sus listas de Twitter.

Universidad Hortonworks

Universidad Hortonworks Hadoop ofrece capacitación y certificaciones. El sitio ofrece cursos de Hadoop construidos ya sea para los practicantes de administrador o desarrollador con la opción de un riguroso programa de certificación. Hortonworks emplea a algunos de los expertos más profundos y más notables de Hadoop en el mundo, por lo que usted tiene la garantía de calidad de la experiencia detrás del material didáctico.

Universidad cloudera

Universidad cloudera es similar en su modelo de negocio y de alquiler a la Universidad Hortonworks, proporcionando una serie de vías que van desde texto tradicional de aprendizaje de vídeo. Cloudera es un elemento importante en el mundo de Hadoop. (Doug Cutting, el “padre” de Hadoop es su principal arquitecto.) El sitio ofrece un amplio conjunto de cursos, y más, que se basa en la distribución de Cloudera Hadoop (CDH).

BigDataUniversity.com

BigDataUniversity.com (El caso no importa cuando se introduce la URL en su navegador) es un recurso fantástico para aprender acerca de - usted lo adivinó - grandes volúmenes de datos. Por supuesto, los grandes datos no es sólo Hadoop, por lo que encontrará más de los recursos de Hadoop en este sitio. Esta universidad cuenta con más de 100.000 estudiantes matriculados y aprender sobre Hadoop y grandes volúmenes de datos cada día.

Blog planeta Big Data agregador

Es muy bueno cuando el nombre de un sitio que dice exactamente lo que hace - como el planeta Gran Blog de datos agregador: Es un agregador de blogs sobre grandes volúmenes de datos, Hadoop, y otros temas relacionados en el planeta (bueno, en el planeta Tierra de todos modos).

Ambos nombres grandes y no hay nombres aparecen en el sitio, pero eso es muy útil: Aunque no hay duda compromiso con Hadoop por Cloudera, Hortonworks, IBM y otros, a menudo es refrescante y valiosa para conseguir la exposición a los pensamientos y opiniones de base, los profesionales no afiliados por comunidades no atados a un proveedor específico en su hoja de ruta de aprendizaje.

foro de Apache Hadoop de Quora

los foro quora Apache Hadoop es la piedra angular para cualquiera que quiera saber más acerca de Hadoop, o alrededor de grandes volúmenes de datos en general, para el caso.

Video: Descubre las ventajas del BIG DATA con T-Systems

Al igual que en cualquier foro, la gama de preguntas y respuestas se pueden encontrar en este sitio es vertiginoso, pero todo lo que conduce a lo que estás buscando: el conocimiento. El sitio tiene enlaces a Hadoop y para sus componentes individuales - por ejemplo, tiene foros específicos para MapReduce, HDFS, cerdo, HBase, y mucho más.

El sitio también se ha asociado Hadoop Foros-por ejemplo, Cloudera y Hortonworks tienen grupos de discusión específicos para sus distribuciones - un testimonio de la popularidad de este foro es.

El concentrador de IBM Big Data

los Hub de IBM Big Data es un excelente lugar para aprender sobre Hadoop y su ecosistema. A pesar de ser de propiedad y operado por IBM, el contenido de este sitio no siempre está vinculada con los productos de IBM.

The Big Data Hub de IBM ofrece a cualquier visitante con conocimientos suficientes para calmar la sed de nadie para grandes volúmenes de datos. Usted encontrará todo tipo de blogs, vídeos, artículos de analistas, casos de uso, infografías, presentaciones y más. Es verdaderamente un tesoro de recursos de datos grandes.

Las conferencias no se puede perder

Hay muchas conferencias de Hadoop, y aún más grandes conferencias de datos - la Cumbre hadoop y Strata Hadoop Mundial como las conferencias por excelencia no se puede perder. Normalmente, un proveedor de distribución copatrocinadores estas conferencias. Por ejemplo, Yahoo! y Hortonworks patrocinan la Cumbre Hadoop, y Cloudera es el co-patrocinador del Mundial Strata Hadoop.

Ambos estratos Hadoop Mundial y la Cumbre son Hadoop el lugares de reunión de las mentes más brillantes en el Hadoop Business- estas conferencias atraen a una amplia gama de profesionales Hadoop-interesadas, incluidos los tomadores de decisiones, arquitectos, desarrolladores, analistas, y mucho más.

Los documentos de Google que lo empezó todo

Lo que ahora se conoce como Hadoop tiene su origen en una serie de artículos escritos por empleados de Google que se centraron en el problema de la indexación de la Web.

Video: aula 4819 java seIII MacOs Apple MacBookPro importando projetos das aulas e testando

Si bien el proyecto Apache Nutch (una tecnología de código abierto para el rastreo de la web) se estaba convirtiendo su enfoque en la ampliación hacia el exterior con el fin de indexar un mayor volumen de datos de la web, Google publicó un artículo, “El sistema de archivos de Google”(Octubre de 2003), lo que influyó en su Doug Cutting y Nutch co-fundador, Mike Cafarella. Poco después, Google dio a conocer su papel “MapReduce: simplificado de Proceso de Datos en grandes racimos”(Diciembre de 2004).

En conjunto, el concepto de un sistema de archivos distribuido y un marco de procesamiento en paralelo a gran escala fueron tomadas por el corte y Cafarella para desarrollar Apache Hadoop. Por supuesto, el corte comercializado este trabajo, mientras que en Yahoo !, y el resto, como dicen, es historia.