Objectifs

Le volume de données stocké et traité révolutionne aujourd’hui les technologies de stockage des données.

Les objectifs sont de connaître les évolutions technologiques tout en maîtrisant les contraintes techniques, les performances et les caractéristiques. Le stagiaire apprendra les techniques de déploiement d’un système Big Data.

Contenu

Introduction

  • Principes de distribution du stockage et des calculs
  • Utilisation de MapReduce

Hadoop

  • Fonctionnement d’un cluster
  • Hue et outils d’administration
  • Déploiement de cluster
  • Cloud computing

Hive

  • Fonctionnement et formats
  • Création de bases et requêtes

Spark

  • Fonctionnement du moteur de calcul distribué
  • Traitement des données en flux et temps réel
  • Bibliothèques

Modalités pédagogiques

Afin de permettre aux étudiants d’acquérir des compétences opérationnelles en entreprise, cette formation associe des connaissances notionnelles (exposés théoriques) avec des savoir-faire pratiques (applications, cas concrets, travaux pratiques).

3 jours

Fiche formation

Certifications

Certification Data Analyst
> Voir la formation

Certification Data Scientist
> Voir la formation