Objectifs

Le Scraping est le fait de récupérer de façon automatisée des données structurées ou semi-structurées depuis une page Web ou une interface. Cette technique est largement répandue dans les entreprises.

Les objectifs sont de maîtriser les bases du traitement de données afin de mettre en œuvre une technique d’acquisition de données automatisée.

Contenu

Introduction

  • Législation
  • OpenData et licences
  • Propriété des données

API

  • Principe de l’API
  • Requêtes avec R et Python

Web

  • Principe du scraping
  • Structure des pages Web
  • Exemples avec R et Python

Outils

  • Scrapy
  • PhantomJS
  • BM

Avancé

  • Proxy et authentification
  • Gestion des erreurs
  • Ajax

Modalités pédagogiques

Afin de permettre aux étudiants d’acquérir des compétences opérationnelles en entreprise, cette formation associe des connaissances notionnelles (exposés théoriques) avec des savoir-faire pratiques (applications, cas concrets, travaux pratiques).

3 jours

Prix net : 1 770 € (Non soumis à la TVA)

Niveau : Intermédiaire

Fiche formation

Certification

Certification Data Analyst
> Voir la formation

Certification Data Scientist
> Voir la formation