Focus sur : les données de la recherche : Questions - Réponses

Formation pour les étudiants, enseignants et chercheurs
Focus sur : les données de la recherche : Questions - Réponses

Les données de la recherche

Données de la recherche (Research data) : « enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider des résultats de recherche. » (OCDE, 2007).
 

Qu'est-ce que l'ouverture des données (Open Data) ? L'ouverture des données (Open data) donne la liberté d’utiliser, de modifier et de redistribuer librement les données, plus particulièrement celles financées sur fonds publics. Elle a pour objectif la diffusion libre, gratuite et universelle, via internet, des données d’origine publique ou privée.
Quelles données préserver ? La préservation des données est une étape délicate. Leur sauvegarde sur le long terme génère un coût non négligeable d’où l’importance d’évaluer en amont celles qui pourront avoir un intérêt scientifique ou historique dans l’avenir. The Natural Environment Research Council (UK NERC) a établi une liste de critères de sélection des données autour de l’intérêt scientifique des données, des conditions de reproductibilité… NERC Data Value Checklist : http://www.nerc.ac.uk/research/sites/data/policy/data-value-checklist/
Où déposer mes données ? Dans un entrepôt de données (Data repository) certifié* dans lequel vos données seront accessibles :
  • institutionnel : University of Edinburgh (Royaume-Uni); Open Data LMU (Allemagne); …
  • thématique, disciplinaire : GenBank ; SeaDataNet ; PANGAEA ; …
  • pluridisciplinaire : Zenodo (public) ; OpenAIRE+ ; Dryad (privé); …
* L’entrepôt de confiance (trusted repository) répond aux critères de qualité exigés pour obtenir une certification (format des données, qualité des métadonnées, conditions d'accès et de réutilisation, identifiant pérenne, archivage à long terme, ...).
Comment protéger mes données ?

Avant de rendre public un jeu de données, il faut lui attribuer une licence de diffusion fixant les conditions de son utilisation : droits d’utilisation et de modification, droits de réutilisation commerciale et non commerciale, obligations éventuelles comme la mention de la source des données ou le partage à l’identique. Les principales licences utilisées pour la publication des jeux de données sont les suivantes :
Les licences Creative Commons :

  • licence CC-BY 4.0 (Creative Commons Attribution 4.0 International)
  • licence CC0 (Creative Commons Public Domain Dedication)

Les licences de l’Open Knowledge Foundation (OKF)

  • licence ODC-BY (Open Data Commons Attribution License)
  • licence ODC-ODbL (Open Data Commons Open Database License)
  • licence PDDL (Public domain dedication and license)

La licence ouverte (LO) : https://www.etalab.gouv.fr/licence-ouverte-open-licence

Et si mes données sont déjà déposées dans les réseaux sociaux académiques (ResearchGate, Academia, …) ?
  • Redéposer vos données dans un entrepôt de confiance (institutionnel ou autre…)
  • Dans un deuxième temps, supprimer ou demander la suppression de ce jeu de données du réseau social, et faire le lien du réseau social vers l'entrepôt.

Rappel : Tout ce que vous déposez sur ResearchGate ou Academia devient la propriété du réseau

 

    Visualisation

    Agenda