samedi 30 août 2014

Journalisme de données (MOOC)

Journalisme de données (MOOC)

Accessible sur la plate-forme Canvas, ce cours s’intitule Faire du journalisme avec des données : premiers pas, compétences et outils et fait partie de l’initiative European Journalism Center. Il a pour but de fournir des concepts, des techniques et des compétences pour travailler efficacement avec des données et produire des histoires captivantes.

Présentation


Le cours se divise en cinq modules, chacun d’eux ayant une durée d’une semaine, et environ une heure de contenu vidéo. Chaque vidéo est suivie d’un court questionnaire et d’une section de points de discussion, une courte liste de questions auxquelles répondre dans le forum. Elles nécessitent parfois un peu de recherche, et aident en cela à creuser un peu plus le sujet que la simple vérification de connaissances ou de compréhension du quiz, puisque nous devons y penser et trouver une réponse qui ne nous ait pas été explicitement montrée auparavant. Elles ont aussi le mérite de provoquer une discussion entre les participants et de montrer d’autres points de vue. Le bagage des participants est assez varié, ce cours n’ayant pas de pré-requis, et même si la plupart des participants sont journalistes, la vision de chaque personne apporte un nouvel éclairage sur le sujet.

Le cours est donné en anglais, les vidéos pouvant être sous-titrées en français, anglais, espagnol, japonais et coréen.

Le questionnaire de l’examen final, avec ses 22 questions, donne lieu à un Certificat de réussite de l’EJC lorsque la note obtenue est de 70% ou plus. Les questions proposées après chaque vidéo ne sont là que pour valider la compréhension de leur contenu.

Pour donner un ordre d’idée, il y avait 23 715 participants inscrits à ce cours entre le 19 mai et le 31 juillet 2014.

Contenu


Les cinq modules sont présentés par des professionnels reconnus de la discipline :
  • Le journalisme de données en salle de rédaction : ce qu’est le journalisme de données, à l’intérieur d’une équipe de données, comment obtenir une histoire, et analyse de rentabilité du journalisme de données. Il est présenté par Simon Rogers, éditeur de données, twitteur et ancien rédacteur en chef du Datablog récompensé du journal The Guardian.
  • Trouver des données pour appuyer des histoires : mise en place d’agences de presse de données, stratégies de recherche avancée, introduction au scraping, lois sur les données et sources de données. Ce module est présenté par Paul Bradshaw, responsable du Master of Arts de journalisme en ligne à l’université de Birmingham, et professeur invité à l’École de journalisme de l’université de la City de Londres.
  • Trouver des idées d’histoire par l’analyse des données : mathématiques et statistiques en salle de rédaction, tri et filtre de données dans un tableur, création de nouvelles variables avec des fonctions, résumé de données à l’aide de tableaux croisés. Ce module est présenté par Steve Doig, titulaire de la chaire Knight de journalisme à l’École de journalisme Walter Cronkite, de la chaire Communication de masse de l’université d’état de l’Arizona, et récipiendaire du prix Pulitzer. Il explique des maths simples comme les variations en pourcentage et les taux, la moyenne, la médiane, le mode, les valeurs aberrantes, la distribution normale, l’amplitude, les quartiles et l’écart-type, toutes les mathématiques utiles pour faire raconter une histoire aux chiffres, puis il passe à la création de variable et aux fonctions dans les tableurs jusqu’aux tableaux croisés.
  • Négocier avec des données en désordre : correction d’un formatage inadéquat, fautes d’orthographe, valeurs invalides et doublons, techniques de nettoyage avancées. Ce module est présenté par Nicolas Kayser-Bril, co-fondateur et responsable de la start-up de journalisme de données Journalism++.
  • Raconter des histoires avec de la visualisation : les principes de la visualisation de données, choisir les meilleures formes graphiques, l’art de l’aperçu, la pratique sur Adobe Illustrator. Ce module est présenté par Alberto Cairo, professeur de pratique professionnelle à l’université de Miami.

Notes et remarques


  • Il y a énormément de données qui flottent autour de nous sur la toile, une grande partie d’entre-elles libérées par des initiatives gouvernementales de libération de données comme data.gouv.fr en France, d’autres par d’autres moyens (WikiLeaks, OpenCorporate), et d’autres encore par des lois de liberté de l’information. Mais cette énorme quantité de données a besoin d’être interprétée et présentée d’une manière telle qu’elle puisse être comprise et servir un but. C’est là que le journalisme de données est important, puisqu’il extrait un sens à partir de ces données et permet d’en tirer des histoires. Le journalisme de données englobe un ensemble diversifié de connaissances : il combine le journalisme, le design et la programmation (certains vont même plus loin en l’appelant journalisme javascript, ce qui réduit son champ d’application à son aspect technique).
  • L’outil de scraping de Google sous forme de tableur accessible sur Google Drive nous aide à extraire des données d’une page web sans la connaissance technique nécessaire à la programmation d’un scraper (si les données sont présentées sous forme de liste ou de table).
  • Trouver une histoire et la visualiser sont les deux faces d’une même médaille lorsque l’on parle de journalisme de données, exactement comme trouver une histoire et la raconter avec du texte et des images dans le journalisme classique. Le seul risque du journalisme de données est de mettre la visualisation avant l’histoire, ce qui revient à montrer de beaux objets interactifs sans utilité.
  • La page de données du Texas Tribune montre des visualisations de données publiques. Cette section du site compte pour 45% à 55% du trafic total du site web. Cet exemple est très intéressant : il montre que fournir à vos visiteurs des données visuelles qui leur parlent, même si celles-ci sont accessibles gratuitement ailleurs, apporte une véritable valeur ajoutée. Ils les consultent, les utilisent et les partagent, ce qui répond à vos buts journalistiques d’information du public (d’une façon engageante), et aux buts de votre site d’acquérir du trafic par le levier des réseaux sociaux.
  • Les questionnaires sur les tableurs de Steve Doig offrent des questions très pratiques, puisque nous devons utiliser notre propre logiciel de tableur pour y répondre (par exemple OpenOffice Calc), dans une approche d’apprentissage par la pratique.
  • Alberto Cairo, en plus d’être l’auteur de The Functional Art: An introduction to information graphics and visualization, publie un blog très informatif sur la visualisation de données.
  • Quelques sites de visualisation et d’infographie pour trouver des idées : FlowingData, Information aesthetics, Cool Infographics.
  • Beaucoup de visualisations sont belles, et même fonctionnelles, mais pas particulièrement éclairantes. Elles doivent aider les utilisateurs à mieux comprendre les données. Les données doivent être mises en contexte pour raconter une histoire, pour révéler quelque-chose. Au bout du compte, les visualisations devraient aussi être instructives, elles devraient changer le point de vue des utilisateurs sur les faits qu’elles représentent.
  • Dans une visualisation interactive, il est non seulement approprié de représenter les données plus d’une fois, mais la plupart du temps même nécessaire. Nous devons donner aux utilisateurs des opportunités de répondre à des questions différentes et leur fournir différentes vues sur les données.
  • L’insight est la découverte de vérités non triviales, complexes, profondes, inattendues ou pertinentes sur le jeu de données.
  • Une couche d’annotation, en donnant des aperçus sur l’ensemble de données, en mettant les données en contexte et en soulignant les points pertinents, aide les utilisateurs à entrer dans la visualisation.
  • L’illumination constitue l’étape suivante : le sens de changer profondément l’esprit des lecteurs pour le meilleur.

Lecture suggérée


Guide du datajournalisme

Guide du datajournalisme, par Jonathan Gray, Lucy Chambers, Liliana Bounegru et Nicolas Kayser-Bril (2013)


Data journalism (MOOC) (en anglais)
Periodismo de datos (MOOC) (en espagnol)
Jornalismo de dados (MOOC) (en portugais)

Aucun commentaire:

Enregistrer un commentaire