Objectifs
Le volume de données stocké et traité révolutionne aujourd’hui les technologies de stockage des données.
Les objectifs sont de connaître les évolutions technologiques tout en maîtrisant les contraintes techniques, les performances et les caractéristiques. Le stagiaire apprendra les techniques de déploiement d’un système Big Data.
Contenu
Introduction
- Principes de distribution du stockage et des calculs
- Utilisation de MapReduce
Hadoop
- Fonctionnement d’un cluster
- Hue et outils d’administration
- Déploiement de cluster
- Cloud computing
Hive
- Fonctionnement et formats
- Création de bases et requêtes
Spark
- Fonctionnement du moteur de calcul distribué
- Traitement des données en flux et temps réel
- Bibliothèques
Modalités pédagogiques
Afin de permettre aux étudiants d’acquérir des compétences opérationnelles en entreprise, cette formation associe des connaissances notionnelles (exposés théoriques) avec des savoir-faire pratiques (applications, cas concrets, travaux pratiques).
3 jours
Certifications
Certification Data Analyst
> Voir la formation
Certification Data Scientist
> Voir la formation