Objectifs
Le python est un des langages incontournables pour la Data Science. Il est facilement intégrable dans des architectures existantes et dispose de nombreux atouts.
Les objectifs sont de se familiariser avec Python au sens large : environnement, outils de développement, fonctionnement et astuces d’experts. Acquérir les connaissances du langage pour traiter, visualiser et analyser des données.
Contenu
Introduction à Python
- Environnements de développement et notebooks
- Structure et organisation d’un programme
- Point complet sur les données simples et complexes
Le langage
- Structures de contrôle
- Accès aux fichiers
- Classes, modules et fonctions
Manipulation des données
- Lecture / écriture avec différentes sources de données (csv, Excel, bases de données, …)
- Filtrage, sorties, sélection
- Calculs, agrégations, jointures et transformation des données
- Utilisation de la librairie Pandas
Visualisation des données
- DataViz générale
- Types de graphiques
- Utilisation de la librairie Matplotlib et Seaborn
Analyse statistique
- Technique d’apprentissage et d’analyse
- Gestion des apprentissages et des tests
- Technique d’évaluation des modèles
- Utilisation de Scikit-learn
- Introduction à Spark avec PySpark
Modalités pédagogiques
Afin de permettre aux étudiants d’acquérir des compétences opérationnelles en entreprise, cette formation associe des connaissances notionnelles (exposés théoriques) avec des savoir-faire pratiques (applications, cas concrets, travaux pratiques).
3 jours
Prix net : 1 770 € (Non soumis à la TVA)
Niveau : intermédiaire
Certifications
Certification Data Analyst
> Voir la formation
Certification Data Scientist
> Voir la formation