10 Ressources Hadoop Digne d'un Signet - Les nuls

Vous trouverez ci-dessous dix ressources Hadoop dignes de créer un signet dans votre navigateur. Ces ressources vous aident à créer un plan d'apprentissage permanent pour Hadoop.

Système nerveux central: Apache. org

Apache Software Foundation (ASF) est la communauté centrale pour les projets de logiciels open source. Pas n'importe quel projet peut être un projet Apache - de nombreux processus axés sur le consensus convertissent un logiciel de ses conceptions initiales et de son code bêta (son statut incubateur ) à un logiciel complet et généralement disponible.

L'ASF n'est pas seulement là où des projets comme Hadoop sont gérés - c'est là qu'ils «vivent et respirent». "Aujourd'hui, il y a des centaines de projets Apache. Dans cet esprit, vous devriez ajouter la page Apache Hadoop à vos favoris comme l'une de vos ressources d'apprentissage principales. Ce site est important car vous pouvez y accéder le code source.

Tweeter ce

Twitter n'est pas l'endroit pour apprendre Hadoop en soi - après tout, vous ne maîtrisez pas facilement la programmation de MapReduce dans des leçons qui ne couvrent que 140 caractères. Quoi qu'il en soit, un certain nombre de grands gourous de données sont sur Twitter, et ils expriment des opinions et pointent vers des ressources qui peuvent faire de vous un utilisateur Hadoop plus intelligent.

Un certain nombre de listes d'influenceurs de premier plan dans le paysage Twitter couvrent Hadoop et Big Data, et c'est le meilleur moyen de trouver ces personnalités Hadoop et de les ajouter à vos listes Twitter.

Hortonworks University

Hortonworks University offre des formations et des certifications Hadoop. Le site propose des cours Hadoop conçus pour les administrateurs ou les développeurs, avec l'option d'un programme de certification rigoureux. Hortonworks emploie certains des experts Hadoop les plus profonds et les plus reconnus dans le monde, vous êtes donc assuré d'une expertise de qualité derrière le didacticiel.

Université Cloudera

L'Université Cloudera est similaire à son modèle d'affaires et à sa charte à l'Université Hortonworks, offrant un certain nombre de possibilités d'apprentissage allant du texte traditionnel à la vidéo. Cloudera est un incontournable dans le monde Hadoop. (Doug Cutting, le "père" de Hadoop est son architecte en chef.) Le site offre un vaste ensemble de cours, et plus, qui sont basés sur la Distribution Cloudera pour Hadoop (CDH).

BigDataUniversity. com

BigDataUniversity. com (le cas n'a pas d'importance lorsque vous entrez l'URL dans votre navigateur) est une ressource fantastique pour apprendre - vous l'avez deviné - des données volumineuses. Bien entendu, le Big Data n'est pas seulement Hadoop, donc vous trouverez plus de ressources Hadoop sur ce site.Cette université compte plus de 100 000 étudiants inscrits et se renseignant sur Hadoop et le Big Data tous les jours.

planète Big Data Blog Aggregator

C'est génial quand le nom d'un site vous dit exactement ce qu'il fait - comme la planète Big Data Blog Aggregator: C'est un agrégateur de blogs sur le Big Data, Hadoop, et d'autres sujets connexes sur le planète (enfin, sur la planète Terre de toute façon).

Tant les grands noms que les non-noms apparaissent sur le site, mais c'est utile: Bien qu'il y ait sans aucun doute un engagement envers Hadoop de Cloudera, Hortonworks, IBM et d'autres, il est souvent rafraîchissant et précieux d'être exposé aux pensées et opinions de les racines, les praticiens non affiliés par des communautés non liées à un fournisseur spécifique dans votre feuille de route d'apprentissage.

Forum Apache Hadoop de Quora

Le forum Quora Apache Hadoop est la pierre angulaire de tous ceux qui veulent en savoir plus sur Hadoop ou sur le big data en général.

Comme dans n'importe quel forum, la gamme de questions et réponses que vous pouvez trouver sur ce site est vertigineuse, mais elles vous mènent toutes à ce que vous cherchez: la connaissance. Le site a des liens avec Hadoop et ses composants individuels - par exemple, il a des forums spécifiques pour MapReduce, HDFS, Pig, HBase, et plus encore.

Le site a également des forums Hadoop associés; par exemple, Cloudera et Hortonworks ont des groupes de discussion spécifiques pour leurs distributions - un témoignage de la popularité de ce forum.

IBM Big Data Hub

IBM Big Data Hub est un excellent endroit pour s'informer sur Hadoop et son écosystème. Bien que détenu et exploité par IBM, le contenu de ce site n'est pas toujours lié aux produits IBM.

Le IBM Big Data Hub fournit à tout visiteur suffisamment de connaissances pour étancher la soif de Big Data. Vous trouverez toutes sortes de blogs, de vidéos, d'articles d'analystes, de cas d'utilisation, d'infographies, de présentations et plus encore. C'est vraiment un trésor de ressources de données volumineuses.

Des conférences à ne pas manquer

Il y a beaucoup de conférences Hadoop, et encore plus de grandes conférences de données - le Hadoop Summit et le Strata Hadoop World sont des conférences incontournables à ne pas manquer. Généralement, un fournisseur de distribution co-sponsorise ces conférences. Par exemple, Yahoo! et Hortonworks sponsorise le Hadoop Summit, et Cloudera est le co-sponsor de Strata Hadoop World.

Strata Hadoop World et le Hadoop Summit sont les lieux de rassemblement des esprits Hadoop les plus brillants de l'industrie; ces conférences attirent un large éventail de professionnels intéressés par Hadoop, y compris des décideurs, des architectes, des développeurs, des analystes, et plus encore.

Les articles de Google qui ont commencé tout

Ce qui est maintenant connu sous le nom de Hadoop trouve son origine dans un certain nombre d'articles écrits par des employés de Google qui se concentraient sur le problème de l'indexation du Web.

Alors que le projet Apache Nutch (une technologie open source pour explorer le Web) mettait l'accent sur l'extension vers l'extérieur afin d'indexer des volumes plus élevés de données Web, Google a publié un article intitulé "The Google File System" (octobre 2003), qui a grandement influencé Doug Cutting et son cofondateur Nutch, Mike Cafarella.Peu de temps après, Google a publié son article "MapReduce: traitement de données simplifié sur les grandes grappes" (Décembre 2004).

Ensemble, le concept d'un système de fichiers distribué et un cadre de traitement parallèle à grande échelle ont été utilisés par Cutting et Cafarella pour développer Apache Hadoop. Bien sûr, Cutting a commercialisé ce travail chez Yahoo!, Et le reste, comme on dit, c'est de l'histoire.