Journée du 29 mai 2012 : synthèse des interventions et des débats
La journée du 29 mai a été l’occasion pour des personnes d’horizons différents de se rencontrer : chercheurs et professionnels de l’IST qui travaillent à la mise en œuvre de réservoirs de données, décideurs européens et nationaux, qui ont la charge de mettre en place la politique, de créer un environnement favorable pour soutenir ces initiatives, les rendre pérennes et motiver d’autres communautés pour qu’elles s’engagent dans cette voie.
Hétérogénéité des données, diversité des situations mais des points communs
Exploiter des masses de données
Que ce soit pour les maladies rares, les données environnementales, celles de la modélisation du climat, celles issues du séquençage, les données de la recherche en ethnologie, les corpus textuels, des défis sont à relever : collecter, stocker, enrichir (métadonnées, annotations, identifiants auteur…), donner accès, partager. L’interopérabilité des données d’un même domaine ou interdomaine est un facteur-clé pour l’accès et le partage.
Un autre élément essentiel : la qualité des données qui doit passer par une validation mais dont les modalités restent à définir.
Partager les données
Si l’ensemble des intervenants reconnait le bienfondé de l’accès libre aux données, certains émettent des réserves quant à la cible et le délai de mise à disposition. Oui pour partager les données avec la communauté des chercheurs, mais certains chercheurs à l’origine des données demandent à pouvoir les exploiter pendant au moins un an. Pour l’ouverture au public, il faut respecter certaines conditions, variables selon les domaines. Un moyen est de donner accès seulement à une partie des données.
Organiser les initiatives
La diversité des domaines engendre de la diversité dans les pratiques des chercheurs. Malgré tout, il faut mutualiser les ressources pour éviter de refaire ce qui a déjà été réalisé et favoriser les coopérations. La plateforme Corpus IR en est un exemple. Elle a comme mission de consolider et de mettre en place des plateformes de coopération pour la production d’ensembles documentaires en SHS.
Pérenniser les infrastructures
Les volumes de données produits impliquent des capacités de stockage et un réseau à haut débit pour leur transfert. Les infrastructures doivent avoir les ressources humaines et financières nécessaires pour les mettre en œuvre et pour assurer leur pérennisation.
Bénéficier de professionnels
Le processus de curation, qui permet de rendre exploitables et accessibles des données brutes, nécessite la maitrise de savoir-faire et la connaissance des normes notamment pour les métadonnées.
Reconnaitre la contribution des chercheurs
Le dépôt de données est un acte consommateur de temps qui n’est pas pris en compte dans la procédure d’évaluation des chercheurs. On peut voir cette non-reconnaissance comme un frein au dépôt, un second étant la gestion des droits.
Tous ces aspects sont abordés dans le rapport « A Surfboard for Riding the Wave », publié par le Knowledge Exchange (KE). Il y est question de formation au métier de curateur, d’infrastructure, de financement et de diverses actions à mener pour une meilleure prise en compte des données dans le processus de recherche. |
Gérer les droits
La question de la gestion des droits a été abordée lors des différentes communications et lors de la table-ronde.
Comme les idées, les données ne sont pas protégeables juridiquement. Le KE a conduit une étude, dans quatre pays européens, pour savoir si le cadre légal pouvait être un obstacle au partage des données de la recherche. Le régime de protection est différent d’un pays à l’autre avec une couverture par la loi sur le droit d’auteur (Royaume-Uni), par des règles particulières (Danemark et Pays-Bas) ou par la directive européenne sur les bases de données qui est applicable dans tous les pays de l’Union européenne. Cette diversité des régimes de protection entraine une insécurité pour les chercheurs s’ils veulent partager et réutiliser des données.
Une réflexion est à mener pour savoir quel statut juridique appliqué aux données. Le KE recommande la création de codes de conduite plutôt que l’adoption de licences, l’harmonisation des droits d’auteur en Europe et la clarification du rôle des intérêts privés pour éviter tout monopole.
Mettre en place une politique même si hétérogénéité des données et diversité des situations
Selon Neelie Kroes, «Open Science means optimal sharing of research results and tools such as publications, research data, software, educational resources and infrastructures across institutional, disciplinary and national boundaries.»
Le High level Expert Group on Scientific Data a publié le rapport «Riding the wave», commandité par la Commission européenne, pour identifier les bénéfices et les coûts du développement d’une infrastructure pour les données scientifiques. Le groupe propose une liste d’actions à destination des différentes institutions de l’Union européenne. Elles servent de base à la Commission pour élaborer sa feuille de route Horizon 2020. |
Pour construire une science ouverte, des décisions sont à prendre dans différents champs.
Des infrastructures à financer
Dans cette journée, les infrastructures ont été un thème récurrent. Elles sont incontournables pour accueillir et rendre partageables les données. Mais, elles ont un coût financier et humain. Les instances nationales et européennes ont leur rôle à jouer, car il est nécessaire que les financements soient durables, allant au-delà de la durée des recherches dont les données sont le produit. Jusqu’à présent, le coût de la production des données, l’archivage pérenne et l’entretien des bases de données ne sont pas inclus dans le budget des recherches.
Des métiers à valoriser
Déposer des données, oui mais pas à n’importe quelles conditions. Il faut des personnels compétents et formés au métier de curateur.
Des chercheurs à convaincre
Il faut sensibiliser les chercheurs aux données.
L’acte de déposer est à valoriser en en tenant compte dans l’évaluation des chercheurs.
Des accès à encadrer
La question de l’accès interroge le droit et l’éthique. Toutes les données ne peuvent être diffusées, partagées sans qu’auparavant un cadre clair ait été établi concernant le détenteur des droits, la législation à appliquer. C’est également un enjeu pour l’éthique et les comités mis en place dans les organismes doivent s’en emparer pour déterminer des règles de conduite.
Le sujet de l’accès gratuit ou payant est aussi à traiter, sachant que la particularité de chaque domaine scientifique est à prendre en compte.
Il ressort des échanges qu’une réflexion est à mener à un niveau national en lien avec les travaux de la Commission européenne. Un cadre est à construire — pourquoi pas dans le projet de la Bibliothèque scientifique numérique — pour que les établissements, notamment les Alliances, échangent pour aboutir à une politique nationale.
Accéder à la présentation de Carlos Morais Pires de la Commission européenne
«data: an infrastructure for science»