Objectifs

Le python est un des langages incontournables pour la Data Science. Il est facilement intégrable dans des architectures existantes et dispose de nombreux atouts.

Les objectifs sont de se familiariser avec Python au sens large : environnement, outils de développement, fonctionnement et astuces d’experts. Acquérir les connaissances du langage pour traiter, visualiser et analyser des données.

Contenu

Introduction à Python

  • Environnements de développement et notebooks
  • Structure et organisation d’un programme
  • Point complet sur les données simples et complexes

Le langage

  • Structures de contrôle
  • Accès aux fichiers
  • Classes, modules et fonctions

Manipulation des données

  • Lecture / écriture avec différentes sources de données (csv, Excel, bases de données, …)
  • Filtrage, sorties, sélection
  • Calculs, agrégations, jointures et transformation des données
  • Utilisation de la librairie Pandas

Visualisation des données

  • DataViz générale
  • Types de graphiques
  • Utilisation de la librairie Matplotlib et Seaborn

Analyse statistique

  • Technique d’apprentissage et d’analyse
  • Gestion des apprentissages et des tests
  • Technique d’évaluation des modèles
  • Utilisation de Scikit-learn
  • Introduction à Spark avec PySpark

Modalités pédagogiques

Afin de permettre aux étudiants d’acquérir des compétences opérationnelles en entreprise, cette formation associe des connaissances notionnelles (exposés théoriques) avec des savoir-faire pratiques (applications, cas concrets, travaux pratiques).

3 jours

Prix net : 1 770 € (Non soumis à la TVA)

Niveau : intermédiaire

Fiche formation

Certifications

Certification Data Analyst
> Voir la formation

Certification Data Scientist
> Voir la formation