Extraire et exploiter des données du web (pages web, réseaux sociaux, twitter) avec les outils de webscrapping et de visualisation

Informations sur la session
Thème: 
Traiter : réseaux et outils, outils et techniques de gestion documentaire, traitement, analyse, indexation et cartographie de l'information
Publics prioritaires: 
Enseignant du supérieur, chercheur Doctorant Professionnels de l’information
Formateur: 
Sami BEN AMOR
Reponsable de la formation: 
Alexandre SERRES
Tags: 
données
webscraping
données web
datavisualisation

Objectifs


  • Apprendre les techniques d’extraction des contenus web à l’aide de solutions logiciels ou de scripts

  • Mise en œuvre des processus automatisés d’acquisition des données web

  • Acquérir les notions de base de la datavisualisation

Programme

La journée se déroulera autour de trois notions complémentaires :



1- Savoir lire les données  :




  • Pour l’extraction : identifier les formats des données web, distinguer les données structurées, semi-structurées ou encore non structurées. Identifier les problèmes juridiques liés à l’extraction des données

  • Pour l’exploitation : identifier les standards des formats de données exploitables et évolutifs



2- Savoir extraire des données :




  • Etudier des solutions pour récupérer les données et l’automatisation du processus :

    • Issues d’une page web

    • Des réseaux sociaux (facebook, twitter, instagram,…)

    • Des plateformes de services en ligne (ebay, …)



  • Automatiser le processus de récupération des données Pendant cette phase, pour chaque type de données, nous mettrons en place un exemple concret d’extraction.



3- Savoir utiliser les outils de visualisation des données

Prérequis

Connaissance du web

Durée

6 heures

Prix

250 €

Prochaine session

Rappel : les stages sont gratuits pour tous les personnels d’établissements d’enseignement supérieur et de recherche, ainsi que pour les doctorants.