Retrouvez le compte rendu de cette journée d’étude réalisée dans le cadre du projet Sacred.

 
Compte rendu

Penser l’écosystème des données. Les enjeux scientifiques et politiques des données numériques

 
Jeudi 14 février 2013, 9h à 17h45, ISCC

Accueil > Soutien à la recherche > Pilotage d’appels à projets CNRS > Manifestations

 

Compte rendu

Introduite par Laurence Monnoyer-Smith (UTC, laboratoire COSTEC), responsable du séminaire approche communicationnelle des recherches sur les données (SACRED), la journée d’étude organisée à l’Institut des sciences de la communication du CNRS le 14 février 2013, a permis de réunir des intervenants issus de disciplines diverses, des sciences informatiques aux sciences de l’information et de la communication, en passant par l’histoire, la géographie, le droit ou encore les sciences politiques, autour du thème de l’écosystème des données. Confirmant l’importance de saisir ces phénomènes, certes distincts mais également de plus en plus complémentaires que sont d’une part le développement des grandes masses de données, de l’autre celui de l’ouverture des données, suivant une perspective interdisciplinaire, cette journée s’inscrivait, comme l’a rappelé Laurence Monnoyer-Smith, dans le cadre des projet exploratoires en sciences de la communication soutenus par le CNRS. Elle avait été précédée de deux séminaires interrogeant les ruptures et continuités, les outils et méthodes en jeu lorsqu’il est question d’un écosystème des données complexe, qui invite à interroger ses conditions de production, d’exploitation, d’analyse, ses répercussions sur les disciplines, mais aussi plus largement sociétales.

Voir les comptes rendus de ces deux séances :

Vendredi 30 novembre 2012, Les enjeux des digital methods pour la recherche en SHS, avec Bernhard Rieder, Université d’Amsterdam (intervenant) et David Berry, Swansea University (discutant).

Jeudi 20 décembre 2012, Datadriven science : ruptures et continuités, avec Bruno J. Strasser, Université de Genève et Yale University (intervenant) et Guillaume Carnino, Université de technologie de Compiègne (discutant).

La reconfiguration des acteurs, les complexes interactions et transactions en jeu dans la question des données, en amont et en aval de leur analyse mais aussi au cours de celle-ci, ont été éclairées dès le début de la matinée par la présentation de la conférencière invitée, Noortje Marres (Goldsmith, University of London). En s’intéressant aux interfaces, aux contraintes pesant sur l’extraction et l’utilisation de données dans la recherche en sciences humaines et sociales, aux outils, disponibles ou à inventer, plus qu’aux données brutes, elle a balayé un vaste champ de problématiques, auxquelles les interventions qui ont suivi ont donné un large écho. Ainsi les interventions de Primavera de Filippi ou Camille Domange (Cersa) ont-elles contribué à poser les aspects juridiques de l’ouverture des données, ont souligné l’auto-complexification du droit, les nouvelles opportunités de dissémination mais aussi les conditions et les limites à la réappropriation des données ouvertes. L’intervention en début d’après-midi d’Henri Verdier, directeur d’Etalab (Service du Premier ministre chargé de l’ouverture des données publiques et du développement de la plateforme française Open Data) a insisté sur la transformation des pratiques et positions de l’État dans ce domaine et le souhait de voir la recherche contribuer à éclairer, aider, accompagner cette action voulue au sommet de l’État.

Si les données ouvertes peuvent contribuer à la volonté de créer davantage de transparence, de confiance mais aussi des formes de pratiques citoyennes qui alimenteraient ce que l’on qualifie dans les pays d’anglo-saxons d’open governement, plusieurs interventions ont témoigné de ce que les données présentes en ligne, l’ouverture des données publiques et l’open government ne sont pas forcément synonymes et ont analysé des enjeux de pouvoir réels ou à venir au cœur du traitement des données, ses dimensions éthiques, politiques, sociaux. Ainsi Peter Mechant (iMinds/UGent) a-t-il montré les risques d’un fossé entre ceux qui ont et n’ont pas la maîtrise de l’outil dans le cas des APIs, ou encore la question de l’articulation entre le monde public et privé autour de ces interfaces spécifiques. François Allard (Paris 4) a quant à lui analysé les limites de la transparence et les enjeux du passage de celle-ci à la gouvernance des données par des acteurs qui ont saisi l’enjeu stratégique qu’est le traitement de l’information. Il s’est appuyé sur le cas de la circulation des données environnementales dans l’espace public. Afin de ne pas voir l’idéologie prendre le pas sur la réalité des pratiques et enjeux de l’ouverture des données, Amandine Brugière et Sarah Labelle, respectivement de la Fondation internet nouvelle génération (Fing) et de l’université Paris 13, ont souligné l’importance de ne pas céder à une « fétichisation » de la donnée et interrogé la nécessité de dispositifs de médiation, des « infolabs » sur le modèle des « fablabs ». La question de la médiation est évidemment inséparable de celle des compétences nécessaires pour le traitement des données et la présentation par Mokrane Bouzeghoub (directeur adjoint scientifique Informatique de l’INS2I/CNRS, professeur à l’université de Versailles, PRISM) des perspectives et volumes en jeu dans le domaine des masses de données et des actions portées par le défi Mastodons (à travers quelques exemples comme le projet phénotypage et séquençage haut débit, étude du comportement des plantes et de différents génomes/ ARESOS : analyse de grands réseaux socio-sémantiques/ le projet Petasky : observation astronomique grand champ), dans le cadre des grands défis du CNRS soutenus par la Mission pour l’interdisciplinarité, a permis de se rendre pleinement compte de la nécessité d’une approche interdisciplinaire et systémique de la question. Si les échelles investies dans le domaine des masses de données sont inconnues jusqu’alors en termes de volumes, c’est également d’autres échelles dont il a été question dans plusieurs interventions : les échelles politiques, territoriales, géographiques impliquées dans la question des données ouvertes ont aussi donné lieu à des réflexions fécondes, que ce soient celles qui invitent aux comparaisons internationales, à l’instar de la présentation de Romain Badouard (Mines ParisTech), comparant les politiques françaises et états-unienne, celle de Pierre Gautreau (Paris 1) qui nous a permis de voir le cas des systèmes d’intervention environnementaux en Amérique Latine ou celui des collectivités territoriales confrontées à l’ouverture des données publiques dans le cas du papier de Jerôme Denis et Samuel Goeta (Telecom ParisTech) « Ouvrir les coulisses de l’Open Data : pour une ethnographie des pratiques de libération de données ». Leur présentation avait en outre l’intérêt d’articuler des réflexions théoriques sur les Science Technology and Society et la pratique d’un terrain qui porte son attention sur des acteurs qui sont au cœur de l’action, notamment des acteurs publics des systèmes d’information, des producteurs de données publiques, etc. Enfin, plusieurs chercheurs ont pensé ces différents aspects dans la lignée de la présentation de Noortje Marres en proposant des pistes de réflexion sur les outils, la méthodologie et l’épistémologie, à l’instar de Peter Mechant dans le cas de l’analyse de Twitter, de David Moats (Goldsmith, University of London) dans celui des controverses socio-techniques qui peuvent être suivies en ligne, de Mokrane Bouzeghoub qui a souligné la diversité des données, leur hétérogénéité, posé le problème des attributs et celui de la sémantique des données. C’est autour de la question de la décontextualisation et de l’entextualisation des données, des facteurs à prendre en compte dans chaque acte de communication tels le contexte du message, le contact, le code, etc. que Michael Castelle (University of Chicago) a démontré à quel point ces éléments doivent être reconstruits, pensés et analysés.

La conclusion de la journée par Valérie Schafer (ISCC/CNRS) et Stéphanie Wojcik (Céditec), outre qu’elle a repris rapidement quelques enjeux et apports principaux de la journée, s’est tournée vers la suite ; la volonté de prolonger cette journée par une publication d’un dossier spécial de revue, d’ores et déjà prévu, celle d’approfondir la question de la place des citoyens (comme cela pourra être le cas à l’occasion du colloque international Regards critiques sur la participation politique en ligne organisé par le réseau DEL les 19 et 20 juin prochains à Paris), dans cet écosystème complexe... mais aussi fragile comme l’a montré la journée, loin d’être stabilisé et qui est traversé d’imaginaires, utopies, tensions, pressions, promesses et limites qu’il convient d’explorer encore plus avant.

Comité scientifique

  • David Berry (Swansea University, College of Arts and Humanities)
  • Mélanie Dulong de Rosnay (CNRS, ISCC)
  • Clément Mabi (UTC, Costech)
  • Jean-Christophe Plantin (UTC, Costech)
  • Bernhard Rieder (University of Amsterdam, Media studies department)
  • Valérie Schafer (CNRS, ISCC)
  • Laurence Monnoyer-Smith (UTC, Costech)
  • Bruno J. Strasser (Université de Genève & Yale University)
  • Stéphanie Wojcik (UPEC, Céditec)

Programme

Matinée
Animateur : Jean-Christophe Plantin (UTC)

9h – Accueil

9h10 à 9h20
Ouverture de la journée par Pascal Dayez-Burgeon (directeur adjoint de l’ISCC)

9h20 à 9h30
Introduction de la journée par Laurence Monnoyer-Smith (UTC)

9h30 à 10h30
Conférencière invitée, Noortje Marres (Goldsmith, University of London)
Tooling up or tooling down ? On issue mapping and other interface methods

10h30 à 12h30
Première session – Les données numériques et la recherche en SHS
Présidence : Valérie Schafer (CNRS, ISCC)

  • Primavera de Filippi et Danielle Bourcier (Paris 2)
    La double face de l’Open Data
  • Amandine Brugière (FING) et Sarah Labelle (Paris 13)
    Expérimenter de nouveaux dispositifs de médiation autour de la donnée : « l’Infolab »
  • Discussion
  • Peter Mechant (iMinds/UGent), Cédric Courtois (iMinds/UGent), Pieter Verdegem (UGent)
    Using APIs in Social Scientific Analysis of Big Data : Methodological and Ethical Challenges
  • David Moats (Goldsmith, University of London)
    Digital Devices and Digital Informants - Between Ethnography and Digital Methods
  • Discussion

12h30 à 13h45 – Pause déjeuner

Après-midi
Animateur : Clément Mabi (UTC)

13h45 à 14h15

  • Mokrane Bouzeghoub (Directeur adjoint scientifique Informatique de l’INS2I/CNRS, professeur à l’université de Versailles, PRISM)
    • Une approche interdisciplinaire des grandes masses de données : le cas du Défi Mastodons

14h15 à 15h30
Deuxième session – Les enjeux de l’ouverture des données
Présidence : Laurence Monnoyer-Smith (UTC)

  • Romain Badouard (Mines ParisTech)
    Open Government : les technologies de l’ouverture en question
  • Jerôme Denis, Samuel Goeta (Telecom ParisTech)
    Ouvrir les coulisses de l’Open Data : pour une ethnographie des pratiques de libération de données
  • Camille Domange (CERSA-CNRS/université Panthéon-Assas)
    La « data », moteur de croissance de l’économie numérique de demain
  • Discussion

15h30 à 15h45 – Pause

15h45 à 17h30
Troisième session – L’ouverture des données, participation citoyenne et
écosystèmes locaux

Présidence : Stéphanie Wojcik (Céditec)

  • Yuwei Lin (Salford University)
    Democracy or Technocracy : Opportunities and Challenges Introduced by the Open Data Movement
  • Michael Castelle (University of Chicago)
    Recontextualization and Rationalization in Open Data
  • Discussion
  • Pierre Gautreau (Paris 1)
    Les systèmes d’information environnementale à l’épreuve de l’accès libre
  • François Allard (Paris 4)
    Les limites de la « transparence » des données : une étude comparative des stratégies d’ouverture des données de l’Autorité européenne de sécurité alimentaire (EFSA) et de l’Agence fédérale américaine des produits alimentaires et médicamenteux (FDA)
  • Discussion

17h30 à 17h45
Conclusion de la journée
Laurence Monnoyer-Smith (UTC), Valérie Schafer (ISCC/CNRS), Stéphanie Wojcik (Céditec)

Programme (pdf)

Informations pratiques

Inscription obligatoire auprès de Clément Mabi et Jean-Christophe Plantin

Jeudi 14 février 2013, 9h à 17h45

Institut des sciences de la communication du CNRS
20 rue Berbier-du-Mets, Paris 13e
Métro 7 ou bus 27, 47, 83, 91, « Les Gobelins »