Rechercher
Les formations BIG DATA
Les autres formations EMGS
DÉVELOPPER DES APPLICATIONS POUR APACHE SPARK AVEC PYTHON OU SCALA
*Pour obtenir le tarif « Intra-entreprise », merci de nous contacter.
Description
Spark est né en 2009 dans le laboratoire AMPLab de l’université de Berkeley. Ce framework offre un modèle de programmation plus simple que celui du MapReduce d’Hadoop et surtout plus rapide avec des temps d’exécution jusqu’à 100 fois plus courts. Avec Spark, les développeurs peuvent écrire simplement des applications distribuées complexes qui permettent de prendre des meilleures décisions plus rapidement et des actions en temps réel, appliquées à une grande variété de cas d’utilisations, d’architecture et de secteurs d’activités.
Cette formation s’adresse aux développeurs qui souhaitent créer et déployer des applications Big Data complètes et uniques en combinant batchs, le streaming et analyses interactives sur l’ensemble des données.
Objectifs pédagogiques
- Identifier et définir les différents composants de l’écosystème Hadoop
- Appréhender le fonctionnement de Spark
- Développer des applications avec Apache Spark
- Optimiser une application Spark
- Utiliser Spark SQL et les dataframes
- Faire de l’analyse en temps réel avec Spark streaming
- Découvrir MLLib pour du machine learning sur Spark
- Explorer, manipuler et visualiser votre donnée avec Zeppelin
Publics
Pré-requis
- Connaissances de base en programmation ou en scripting (Python/Scala)
- Expérience basique en ligne de commande
- Aucune connaissance sur Hadoop n’est requise
- Connaissances en SQL et conception d’application temps réel utiles mais non obligatoire
Méthode pédagogique
Programme
Jour 1
Jour 2
Jour 3
Jour 4
Prochaines sessions