Rechercher

Les formations BIG DATA

Les autres formations EMGS

ANALYSE DE DONNEES POUR HADOOP 2.X HORTONWORKS AVEC PIG, HIVE ET SPARK

0jours
28 heures de cours
0
Tarif Inter-entreprise*/Hors taxes

*Pour obtenir le tarif « Intra-entreprise », merci de nous contacter.

Description

Cette formation présente les grands outils de l’écosystème Hadoop en se focalisant plus spécifiquement sur Pig et Hive. Le principal objectif est le développement de compétences de data analyst orientées accès et traitement des données sans nécessairement avoir un fort background technique.

Objectifs pédagogiques

– Identifier et définir les différents composants de l’écosystème Hadoop
– Appréhender l’architecture de Hadoop 2.X
– Expérimenter les outils d’exploration et d’analyse avancée de données

Publics

  • Analyste, statisticien, développeur

Pré-requis

Connaissances de base en scripting (SQL, Python, R) ou en programmation.

Méthode pédagogique

Formation mêlant des apports théoriques à de nombreux travaux pratiques sous forme d’exercices d’application et d’analyse de uses cases métier complétés des retours d’expérience du formateur.

Programme

Jour 1

• L’architecture de Hadoop 2.X

• The Hortonworks Data Platform (HDP)

• Architecture fonctionnelle de HDFS
| Exercice d’interaction en ligne de commande avec HDFS
• Prise en main de l’outil Flume

• Prise en main de l’outil Sqoop
| Application de ces deux outils d’import et d’export des données

• Architecture et fonctionnement général de MapReduce
| Exemples d’utilisation d’un job MapReduce

Jour 2

• Types et mots-clés dans Pig
| Exploration de données avec Pig
• Mots-clés et fonctionnalités avancées dans Pig

• Jointures dans Pig

• Astuces d’optimisation de scripts Pig
| Analyse de cas d’usages métier divers avec Pig

Jour 3

• Types et mots-clés dans Hive

• Concept de table et base de données dans Hive

• Présentation et explication des types de jointures
| Démonstration de jointures
| Analyse de cas d’usages métier

• Fonctionnement et utilisation de HCatalog
| Démonstration du fonctionnement de HCatalog

Jour 4

• Les vues dans Hive

• Les différents formats de stockage des tables Hive

• Optimisation de scripts Hive
| Illustration des fonctions avancées

• Architecture de Yarn
| Démonstration d’une application Yarn
• Workflow et coordinateur Oozie

• Actions possibles avec Oozie

Prochaines sessions

  • Contactez-nous pour les prochaines sessions.

Contactez-nous

Aides financières

Demande d’informations

    Votre nom (obligatoire)

    Votre prénom (obligatoire)

    Votre entreprise

    Votre fonction

    Votre email (obligatoire)

    Votre téléphone

    Formations

    Votre message