Retour aux formations Big Data
Voir le catalogue de formation

Rechercher

Les formations BIG DATA

Les autres formations EMGS

ADMINISTRER LA PLATEFORME HADOOP 2.X HORTONWORKS – NIVEAU AVANCÉ

0jours
21 heures de cours
0
Tarif Inter-entreprise*/Hors taxes

*Pour obtenir le tarif « Intra-entreprise », merci de nous contacter.

Description

Cette formation est destinée aux administrateurs de plateforme HDP qui souhaiteraient approfondir leurs connaissances. Le focus est mis sur la haute disponibilité des divers outils, la gouvernance de la donnée, les réglages avancés de la plateforme ainsi que l’automatisation de déploiement de celle-ci.

Objectifs pédagogiques

  • Mettre en place une gestion avancée du stockage sur HDFS
  • Piloter une gestion avancée de l’utilisation des ressources avec YARN et Slider
  • Réaliser un paramétrage avancé des outils de développement
  • Assurer une gouvernance de la donnée avec Falcon et Oozie
  • Automatiser le déploiement avec Ambari Blueprint

Publics

  • Administrateur et architecte de la plateforme HDP cherchant à approfondir et à développer leurs compétences.

Pré-requis

  • Avoir suivi la formation « Administrer la plateforme Hadoop 2.X Hortonworks 1 » (HWADM) serait un plus.
  • Expérience en ligne de commande.
  • Expérience en administration de la HDP.

Méthode pédagogique

Formation avec apports théoriques, échanges sur les contextes des participants et retours d’expérience pratique du formateur, complétés de travaux pratiques et de mises en situation. Cette formation prépare à la certification éditeur Hortonworks.

Programme

Jour 1

  • Compatibilités de version
  • Les prérequis à la montée de version
  • Installer la nouvelle version
  • Mise en pratique : « Faire une montée de version HDP »
  • Les différents stockages physiques supportés
  • Stockage asymétrique
  • Politique de stockage de la donnée
  • Configurer ses politiques
  • Mise en pratique : « Configurer les politiques de stockage HDFS »
  • Monter une gateway NFS
  • Comment scaler son gateway ?
  • Authentification des utilisateurs
  • Installation de la gateway
  • Mise en pratique : « Configurer la gateway NFS »
  • Qu’est-ce que le cache centralisé ?
  • Mécanique interne du cache
  • Utilisation du cache
  • Gestion du cache
  • Mise en pratique : « Configurer le cache centralisé HDFS »
  • Trade-off de la compression
  • Quel niveau de compression pour vos données ?
  • Codecs et sérialisation

Jour 2

  • Principes de base et application
  • Gestion des labels
  • Activer et configurer les labels
  • Mise en pratique : « Configurer et tester les labels de nœuds YARN »
  • Quels usages pour Slider ?
  • L’intégration avec YARN
  • Slider pour les développeurs
  • Déployer une application Slider
  • Mise en pratique : « Déployer HBase avec Slider »
  • Configurer le LDAP avec Ambari
  • Synchronisation des utilisateurs
  • Mise en pratique : « Intégrer un LDAP avec Ambari
  • Vers des requêtes Hive interactive
  • Améliorer Hive avec Tez
  • L’architecture de Hive
  • Les prérequis pour la HA
  • Installer et configurer la HA
  • Mise en pratique : « Configurer la HA Hive »
  • Retour sur les possibilités offertes
  • L’architecture d’Oozie
  • Déploiement de jobs sur Oozie
  • Mise en pratique : « Gestion de workflow avec Oozie »

Jour 3

  • Prérequis à la HA
  • Architecture HA pour Oozie
  • Configurer la HA
  • Mise en pratique : « Configurer la HA Oozie »
  • Les challenges de la gouvernance de la donnée
  • Le cycle de vie de la donnée
  • Lineage de la donnée
  • Architecture Falcon
  • Déploiement de Falcon
  • Les entités Falcon
  • Mirroring avec Falcon
  • Mise en pratique : « Configurer les entités et le mirroring Falcon »
  • Déploiement de cluster à la volée grâce aux blueprints
  • Capturer les blueprints
  • Déploiement de template de création
  • Les fichiers de configuration logique
  • Les templates de création pour les noeuds
  • Les bonnes pratiques pour le déploiement avec les blueprints
  • Mise en pratique : « Déploiement de cluster et ajouts de nœuds avec les blueprints Ambari »

Prochaines sessions

  • Contactez-nous pour les prochaines sessions.

Contactez-nous

Aides financières

Demande d’informations

    Votre nom (obligatoire)

    Votre prénom (obligatoire)

    Votre entreprise

    Votre fonction

    Votre email (obligatoire)

    Votre téléphone

    Formations

    Votre message