Introduction
Ce que l’on nomme « science ouverte » est le fruit d’une politique, initialement portée par l’Union européenne1, d’ouverture de la production scientifique. Elle s’appuie sur l’opportunité que représente la mutation numérique pour encourager la diffusion la plus large possible des résultats, des méthodes ou des produits scientifiques. Reprise par certaines instances internationales (Unesco, 2021), cette politique s’est traduite en France par l’adoption de règles légales, suivies de l’affirmation d’un cadre général, le Plan national pour la science ouverte (PNSO) [Ministère de l’Enseignement supérieur et de la Recherche, 2018, 2021]. Les règles résultent de deux lois principales. La première est la loi de programmation de la recherche du 22 juillet 20132 qui prévoit que « la recherche publique a pour objectifs : […] c) Le partage et la diffusion des connaissances scientifiques en donnant priorité aux formats libres d’accès ; […] e) L’organisation de l’accès libre aux données scientifiques ». La seconde est la loi pour une République numérique du 7 octobre 20163 dont l’article 30 contient le principe de l’ouverture de l’accès aux publications scientifiques, ainsi que celui de l’ouverture de l’accès aux données de la recherche4. Sur le plan européen, le règlement « Horizon Europe » définit la science ouverte comme « une approche du processus scientifique fondée sur le travail et des outils coopératifs ouverts et diffusant des connaissances5 », comprenant les deux éléments suivants : l’accès ouvert aux publications scientifiques résultant de la recherche financée au titre du programme Horizon Europe et l’accès ouvert aux données de la recherche, y compris celles sur lesquelles s’appuient ces publications scientifiques, conformément au principe selon lequel les données de la recherche doivent être « aussi ouvertes que possible, aussi fermées que nécessaire6 ». Formulé par le règlement pour encadrer la gestion des projets de recherche financés par des fonds européens, le principe de science ouverte fut ensuite repris, pour ce qui concerne les seules données de la recherche, par la directive (UE) 2019/1024 dans le cadre du dispositif légal relatif à l’ouverture des données publiques7.
Au-delà de la démocratisation de l’accès aux connaissances, c’est un effort d’innovation que les pouvoirs publics entendent encourager et soutenir. Concernant les données de la recherche tout d’abord, la politique d’innovation de l’Union européenne repose sur l’idée qu’ouvrir les données de la recherche permettra de favoriser la mutualisation, le croisement et l’appariement des données pour produire de nouvelles connaissances et des innovations fondées sur l’utilisation de systèmes d’intelligence artificielle (Robin, 2022a). La science ouverte doit permettre de favoriser la réutilisation éventuelle par les pairs et/ou par le public (entreprises, associations, professions libérales, etc.) de ces données, afin que puissent être créées des solutions innovantes, éventuellement fondées sur des technologies d’intelligence artificielle (Robin, 2022a). C’est en effet en considération des potentialités de réutilisation que les données de la recherche doivent être techniquement conçues dès le départ comme des « données ouvertes » (open by design ou open by default)8. Concernant les publications scientifiques ensuite, il a été observé que les pouvoirs publics contribuaient à l’économie de l’édition scientifique à plusieurs endroits du processus de recherche scientifique : par la rémunération des chercheurs9, par le paiement des frais de traitement éditorial des articles (Article Processing Charges ou APC) et par l’abonnement aux revues et aux catalogues des éditeurs scientifiques. De même, la forte concentration du marché de l’édition scientifique autour de grands groupes éditoriaux proposant des bouquets de revues incontournables pour les chercheurs10, la transformation du rôle de l’éditeur dont la prestation purement éditoriale se réduit en même temps que croît sa fonction de distributeur via des plateformes multiservices11, le développement de la technologie numérique dans la diffusion d’informations ouvrant de nouvelles voies de publication pour les établissements publics de recherche, mais surtout l’augmentation des coûts d’abonnement aux revues scientifiques supportés par les établissements (Monvoisin, 2012)12 ont fait souffler un vent de contestation important au début des années 2000, à l’initiative des documentalistes et bibliothécaires qui ont activement encouragé les chercheurs à publier leurs productions (articles, ouvrages, mémoires et thèses) via Internet. C’est officiellement à travers les déclarations des « trois B » (Budapest, 200213 ; Bethesda, 200314 ; Berlin, 200315), suivies par l’Appel de Jussieu pour la science ouverte et la bibliodiversité de 2017, que se sont dessinées les véritables injonctions de mettre la ressource scientifique en accès libre et ouvert, et que la recommandation de la Commission européenne de 2012, ainsi que les dispositions de la loi pour une République numérique ont été entérinées.
L’étude de la science ouverte oblige dès lors à considérer, de façon réflexive, l’ensemble des processus de production scientifique, de même que l’environnement socio-économique dans lequel les recherches sont menées. S’agissant du processus de production scientifique, la perspective de mise à disposition des données de la recherche suppose, par exemple, généralement que les données aient été collectées, structurées, traitées, conservées, sécurisées, et ainsi gérées par les chercheurs, selon des règles qui permettent ensuite à d’autres de les réutiliser. Cela impose ensuite de vérifier, sur le plan juridique par exemple, si la mise à disposition des données peut être réalisée sans qu’elle porte atteinte aux droits des personnes (droit des données à caractère personnel par exemple) ou aux droits sur les biens (droit de la propriété intellectuelle par exemple)16. L’étude de la science ouverte appliquée à la recherche sur le droit revient à s’interroger non seulement sur les pratiques et techniques de production scientifique (en et) sur le droit17, mais aussi sur les modalités de diffusion des productions scientifiques elles-mêmes, pour en mesurer le degré d’accessibilité et donc vérifier leur conformité aux règles de science ouverte18.
La présente étude se propose non pas d’analyser le processus de production et de diffusion scientifique en tant que tel, ni même l’environnement socio-économique de la recherche juridique – que seules des recherches en sociologie, en anthropologie ou en sciences de l’information et de la communication pourraient analyser en profondeur et dans toute leur complexité –, mais de présenter le droit positif de la science ouverte en tant qu’il s’applique aussi à la recherche (en et) sur le droit. Cette réflexion supposera donc, en tant que de besoin, une observation des pratiques de recherche en droit. Par exemple, l’on peut constater qu’une grande partie des ressources utilisées pour la recherche sur le droit est puisée dans le fonds commun de la documentation qui contient l’expression des sources du droit au sens large, c’est-à-dire les normes, règles et solutions, mais aussi toute la documentation y afférent constituée des ressources émanant de toutes les institutions publiques et participant à la publication, à la présentation et à l’évaluation des règles, normes et solutions19. L’ensemble de cette documentation, constituée des sources et ressources du droit, est mis à disposition du public afin d’assurer le fonctionnement d’un État de droit fondé sur des principes démocratiques. Doté d’une valeur constitutionnelle20, le principe d’accès au droit commande de même que l’ensemble de ces documents doit, en effet, pouvoir être rendu accessible aux justiciables, c’est-à-dire à celles et ceux qui doivent la respecter et/ou qui peuvent s’en prévaloir, assistés ou représentés par les professionnels du droit. La recherche sur le droit présente de fait une singularité quant au matériau utilisé : l’accès au droit permet, dans le même temps, l’accès aux ressources nécessaires à la recherche sur le droit manifestant une congruence entre le principe de science ouverte et le principe d’accès au droit. L’accès à la documentation juridique publique se trouve également assuré par les règles encadrant la diffusion des documents administratifs et des données publiques, contenues dans le Code des relations entre le public et l’administration (CRPA)21. Procédant à l’ouverture des données publiques, ces règles ont pour objectif de répondre à la demande, contemporaine de la révolution numérique, d’accéder à toutes les données produites par l’administration. La mise à disposition massive des décisions de justice par exemple, à certaines conditions néanmoins22, permettrait certainement de procéder à l’analyse à grande échelle des données de la justice dans un but scientifique ou dans l’objectif commercial poursuivi par les entreprises (au sens large)23 de produire et d’offrir des services innovants. Fruit d’une évolution législative importante, la politique d’ouverture des données publiques croise, sans se confondre avec elle, celle de l’accès au droit. L’accès à certaines ressources juridiques pour la recherche sur le droit s’avère donc être le résultat de l’application des règles relatives à l’accès au droit et à l’ouverture des données publiques, mais non de celle des règles relatives à la science ouverte.
De nombreuses autres ressources nécessaires aux recherches sur le droit appartiennent cependant au domaine privé. Il en est ainsi des documents contenant des informations couvertes par le secret, comme le secret professionnel ou encore le secret des affaires. Or, l’étude des contrats d’affaires, en particulier, peut s’avérer être une source précieuse d’enseignements, non seulement sur les pratiques du droit que l’étude de la jurisprudence ne permet pas, à elle seule, de mettre au jour puisque ne concernant que des situations contentieuses, mais aussi sur les éventuelles stratégies d’adaptation des comportements en regard de l’évolution du droit positif24. Ainsi en est-il également de la présentation des résultats scientifiques produits par la doctrine et ce, quelle que soit la forme d’expression scientifique, écrite ou orale, utilisée. Bien que souvent produites par des agents de l’État, ces ressources sont soumises, comme dans de nombreux autres domaines scientifiques, à des droits de propriété intellectuelle et, en particulier, au droit d’auteur lorsqu’il s’agit, par exemple, d’écrits scientifiques, de conférences ou encore de bases de données. Comme c’est le cas dans d’autres domaines scientifiques où la recherche se nourrit des connaissances scientifiques antérieurement produites, la question de l’accès aux ressources qui alimentent la réflexion scientifique entrecroise donc celle de l’économie du processus de diffusion des productions scientifiques juridiques elles-mêmes. Aussi, en droit comme dans d’autres disciplines, les modalités et conditions de la diffusion des ressources produites au cours d’activités de recherche menées par les juristes conditionnent-elles l’accès à ces mêmes ressources pour la production de nouvelles connaissances scientifiques.
Deux notions structurent les règles propres à la science ouverte. La première, la notion de « données de la recherche », est de loin la plus difficile à appréhender. La notion de donnée elle-même, tout d’abord, s’avère à la fois fuyante et totalisante. Fuyante, tout d’abord, en ce qu’elle n’emporte pas l’application d’un régime juridique particulier. Si les données ont été, en tant qu’objets de droit, appréhendées par différents dispositifs légaux en particulier depuis la fin des années 199025, la notion n’a, pendant longtemps, fait l’objet d’aucune définition légale. Ce n’est que tout récemment, à l’aune de l’adoption du Règlement européen sur la gouvernance des données, que les données ont été définies de manière très large comme « toute représentation numérique d’actes, de faits ou d’informations et toute compilation de ces actes, faits ou informations, notamment sous la forme d’enregistrements sonores, visuels ou audiovisuels »26. Totalisante ensuite, dans la mesure où elle peut, sur le plan technique, englober tout type d’information dès lors que celle-ci a été formatée pour en faciliter le traitement27. Une donnée peut donc consister en n’importe quelle information et contenir un message d’une certaine complexité28. L’adoption progressive de règles de plus en plus nombreuses ayant pour objet les « données29 », doublée des effets induits par la révolution numérique, a eu pour effet, collatéral mais important, de transformer tout type de ressource informationnelle en « donnée », obligeant alors à rebours à requalifier ces ressources afin de les distinguer entre elles et d’identifier les différents statuts dont elles relèvent30. S’agissant de la notion de « données de la recherche », elle est, quant à elle, définie par la directive (UE) 2019/1024, comme
« des documents se présentant sous forme numérique, autres que des publications scientifiques, qui sont recueillis ou produits au cours d’activités de recherche scientifique et utilisés comme éléments probants dans le processus de recherche, ou dont la communauté scientifique admet communément qu’ils sont nécessaires pour valider des conclusions et résultats de la recherche31 ».
Cette définition qui a déjà fait l’objet d’amples commentaires par ailleurs (Robin, 2022a, n° 11)32, exclut les publications scientifiques – seconde notion qui soutient l’édifice législatif de la science ouverte – du champ d’application de la directive. Cette exclusion pourrait sembler ne pas converger avec la conception retenue par le législateur européen de la science ouverte qui commande l’ouverture tant des données de la recherche que des écrits scientifiques. La contradiction n’est cependant qu’apparente. De fait, si le champ d’application de la directive (UE) 2019/1024 embrasse tous les documents détenus par les organismes du secteur public des États membres et par certaines entreprises publiques33, il exclut cependant les documents détenus par des organismes exerçant une activité de recherche et des organisations finançant une activité de recherche, y compris des organisations créées pour le transfert des résultats de recherche34, ce qui permet, entre autres choses, d’écarter les écrits scientifiques. Cette exclusion qui, à défaut de transposition de la directive, n’a jamais été reprise dans la loi française, tient compte du fait que les productions de la recherche sont le fruit d’une expression libre et personnelle35. Parce qu’elles sont en effet, et avant tout, des œuvres de l’esprit susceptibles d’être protégées par le droit d’auteur, les publications scientifiques, ne sont soumises ni au régime juridique des documents administratifs, ni au régime juridique des données de la recherche dont il convient par conséquent de les distinguer.
Compte tenu de ce qui précède, nous aborderons la question à travers ces deux objets que sont les données de la recherche, d’un côté, et les écrits scientifiques36, de l’autre. Bien que particulièrement restrictive37, cette dichotomie fonde cependant désormais les analyses relatives à la mise en œuvre de la science ouverte, ces objets étant les seuls visés par les textes38. Les écrits scientifiques et les données de la recherche seront, en outre, envisagés indifféremment sous l’angle de leur utilisation et de leur production. En effet, les règles relatives à la science ouverte concernent les productions scientifiques tant dans leur faculté à être produites par les chercheurs que dans celle à être utilisées par d’autres conformément au schéma circulaire du « cycle de vie des données » qui exprime l’action publique en matière de science ouverte39. Et, dans la mesure où, comme on l’a dit, les règles relatives à l’ouverture de la science reposent sur le principe de l’ouverture de l’accès à la science, seront abordées, dans un premier temps, l’ouverture de l’accès aux écrits scientifiques utilisés ou produits lors d’une activité de recherche juridique (1) et, dans un second temps, l’ouverture de l’accès aux données utilisées ou produites lors d’une activité de recherche juridique (2).
1. L’ouverture de l’accès aux écrits scientifiques utilisés ou produits lors d’une activité de recherche juridique
L’accès aux écrits scientifiques issus de la recherche juridique est assuré par les éditeurs privés ou publics (presses universitaires) qui les publient en leur qualité de cessionnaires des chercheurs (1.1). L’accès aux références et données associés aux écrits scientifiques est, en outre, limité en raison de la logique concurrentielle qui structure le marché de l’édition scientifique (1.2).
1.1. L’accès aux écrits scientifiques assuré par les éditeurs scientifiques
Majoritairement déployée dans le secteur privé, l’édition scientifique permet, même s’il existe des exceptions, d’assurer un accès restreint, c’est-à-dire non ouvert, aux écrits scientifiques (1.1.1). Cette logique concurrentielle a pour effet de limiter l’accès aux données accompagnant les écrits scientifiques (1.1.2).
1.1.1. L’accès restreint aux écrits scientifiques
Consacrée par les décrets révolutionnaires, la protection des écrits scientifiques a été affirmée tant par les conventions internationales40 que par la loi du 11 mars 195741. Malgré la référence légale aux seuls « écrits scientifiques », il faut considérer que les œuvres scientifiques protégeables par le droit d’auteur ne sont pas cantonnées à un genre d’expression particulier, mais trouvent à se déployer sous de nombreuses formes d’expression (écrits, entretiens, dessins, schémas, photos, vidéos, sites Internet, bases de données, conférences, cours…). Ainsi, les œuvres scientifiques peuvent-elles être exprimées à l’oral (conférences, colloques, etc.)42 ou à l’écrit (littérature) ou encore sous la forme graphique ou photographique. L’écriture algorithmique peut en revanche être, à coup sûr, exclue du giron du droit d’auteur, seuls les logiciels étant admis à s’y loger. La reconnaissance d’un droit d’auteur sur une œuvre de l’esprit permet d’attribuer des droits à une ou plusieurs personnes, c’est-à-dire de désigner l’auteur ou les coauteurs, ce qui n’est pas toujours chose aisée dans certains champs scientifiques où les signatures figurant sur un même écrit scientifique peuvent être nombreuses (Pontille, 2016 ; Robin, 2022a).
Que l’œuvre soit le résultat du travail d’un ou de plusieurs auteurs, l’attribution des droits est réalisée par la loi aux auteurs personnes physiques43, sauf qualification de l’œuvre scientifique d’œuvre collective44. Comme tous les auteurs, les chercheurs, auteurs d’écrits scientifiques, disposent en tout état de cause des droits moraux et patrimoniaux reconnus par la loi45. À ce titre, ils sont en mesure de revendiquer l’attribution (paternité) de leurs œuvres mais aussi le respect de leur intégrité46 et de décider souverainement de leur divulgation47. Au titre du droit d’exploitation, les auteurs, qui ont par ailleurs la faculté de céder leurs droits à titre gratuit, peuvent demander à être rémunérés en contrepartie de la cession de leurs droits au profit d’un exploitant. Dans le domaine de l’édition scientifique, il s’agit donc pour le chercheur de céder ses droits, à titre gratuit ou à titre onéreux, afin d’autoriser l’éditeur à éditer l’écrit scientifique, c’est-à-dire à en assurer la mise en forme, la fabrication, la publication, la promotion et la distribution48. En pratique, cette cession est généralement consentie à titre exclusif, pour la durée du monopole légal d’exploitation (soixante-dix ans post mortem) et pour le monde entier. Il faut enfin mentionner que le statut d’agents publics des auteurs d’écrits scientifiques n’est pas un obstacle à l’exercice de leurs droits. En effet, si les fonctionnaires sont, de manière générale, soumis à des dispositions dérogatoires emportant cession de plein droit de leurs droits au profit de l’État49, tel n’est pas le cas des chercheurs qui peuvent être considérés comme des « agents auteurs d’œuvres dont la divulgation n’est soumise, en vertu de leur statut ou des règles qui régissent leurs fonctions, à aucun contrôle préalable de l’autorité hiérarchique », en raison de leur indépendance50 et de la liberté d’expression qui caractérise l’exercice de leurs fonctions d’enseignement et de recherche (Cornu, Mallet-Poujol, 2005 ; Vivant, 2005 ; Cornu, 2006 ; Dreyfus, 2006)51.
Ainsi, du fait de la nature juridique du droit d’auteur qui est, à juste titre selon nous, considéré comme un droit de propriété individuelle (Robin, Chatry, 2022)52, les chercheurs, auteurs d’écrits scientifiques, sont engagés individuellement dans les relations contractuelles avec les éditeurs. L’économie de l’édition scientifique53 repose donc tout entière sur le fait que le droit d’auteur est attribué aux chercheurs eux-mêmes54. Afin de remplir leur mission de diffusion des connaissances scientifiques55, sur la base de laquelle leur travail est évalué (bibliométrie), les chercheurs ont une obligation de publier et, de préférence, dans les revues ayant acquis une forte notoriété. Leur capacité de négociation des conditions de cession de leurs droits s’avère donc de manière générale peu élevée, même si elle l’est davantage pour les chercheurs relevant de la recherche en droit (juristes)56. Dans ce contexte, le principe d’une gestion collective des droits sur les écrits scientifiques pourrait d’ailleurs s’avérer une piste intéressante (Boutron, Tremolière, 2023). En leur qualité d’ayants droit des chercheurs, les éditeurs scientifiques sont parvenus à constituer des portefeuilles importants de titres de droit d’auteur, qu’ils peuvent exploiter sur un marché composé non seulement des bibliothèques universitaires et des fonds dédiés à la recherche, mais aussi de nombreux professionnels (magistrats, avocats, entreprises, associations). Grâce au droit d’auteur, les éditeurs parviennent donc à assurer l’accès aux ressources produites par les chercheurs. Ce n’est cependant pas d’un accès ouvert qu’il s’agit, mais d’un accès restreint puisque conditionné au paiement d’un prix, du moins si l’on s’appuie sur la conception retenue par le législateur européen qui dispose qu’un accès ouvert s’entend comme « la pratique consistant à fournir gratuitement l’accès en ligne à des résultats de recherche à l’utilisateur final, sans restriction sur l’utilisation et la réutilisation au-delà de la possibilité d’exiger l’indication de l’auteur57 ». Il faut également constater que, si certaines revues ont fait le choix d’une diffusion gratuite58, ce n’est généralement que grâce au soutien apporté par un financement public et à l’absence de rémunération, là encore, des chercheurs au titre de leur droit d’auteur. Dit autrement, le choix d’un accès ouvert généralisé des écrits scientifiques ne pourrait être le fait que de la puissance publique, qu’il s’agisse de l’évaluation, de la publication et de la diffusion des productions scientifiques59.
1.1.2. L’accès limité aux données associées aux écrits scientifiques
Cessionnaires du droit d’auteur des chercheurs, les éditeurs scientifiques détiennent un nombre toujours plus important60 de droits sur les ressources scientifiques. Sur un plan technique, ces ressources sont considérées comme des données et les références qui les accompagnent, comme des métadonnées. Ensemble, elles constituent aujourd’hui l’essentiel de la valeur ajoutée du capital des groupes d’édition. La constitution de vastes bases de données61 permet de fait aux éditeurs d’offrir, grâce à la technologie numérique, des fonctionnalités intéressantes pour les utilisateurs par le croisement des données dont ils disposent grâce à la création d’hyperliens et au développement de systèmes d’intelligence artificielle (accès aux décisions, articles ou encyclopédies ou à la chronologie d’une affaire jugée à différents degrés de juridiction). L’accès à ces fonctionnalités permet ainsi aux abonnés de travailler dans un confort inédit grâce à une navigation, sinon fluide, du moins rapide, d’une ressource à l’autre. La logique monopolistique et concurrentielle de l’édition scientifique produit toutefois une limite en ce qu’elle ne permet pas d’accéder directement, par la technique de l’hyperlien, aux contenus édités par les sociétés d’édition concurrentes. Seules les données correspondant à des ressources éditées par l’éditeur publiant l’écrit scientifique s’avèrent en effet directement accessibles. Pour les autres, seules les métadonnées sont communiquées (auteur, titre, source, date), obligeant les utilisateurs à reconstituer la base de données des sources utilisées par le premier chercheur pour vérifier les références et éventuellement les réutiliser, en se reportant aux autres catalogues dans l’espoir que son établissement de rattachement y soit abonné. La publication d’un écrit scientifique issue d’une recherche scientifique publique sur le droit ne permet donc pas d’accéder à l’ensemble des données (jeux de données) issues d’un même travail et référencées dans un même document. Outre le fait que toutes les revues juridiques ne figurent pas dans les catalogues des universités malgré la participation des universitaires à ces revues62, on voit poindre la possibilité d’une inégalité de services rendus au public entre les différents établissements quant à l’accès à la documentation, que ce soit pour les chercheurs ou pour les étudiants. Pour l’ensemble de ces raisons, l’accès aux écrits scientifiques tel qu’assuré par les éditeurs ne peut être considéré comme produisant les effets escomptés par la politique publique de science ouverte, c’est-à-dire assurer un accès ouvert et direct à toutes les données collectées ou utilisées à l’occasion d’une production scientifique en droit et rassemblées sur un document à l’occasion de la publication d’un écrit scientifique.
1.2. L’accès aux écrits scientifiques renforcé par la science ouverte
Le principe de l’ouverture de l’accès aux écrits scientifiques est encadré par des dispositions légales d’ordre public (1.2.1). Des recommandations ont en outre été émises préconisant, de façon plus radicale, une diffusion immédiate des écrits en accès ouvert (1.2.2).
1.2.1 La consécration légale d’une dérogation d’ordre public
La publication des travaux des chercheurs passe, en droit comme dans de nombreux autres domaines scientifiques, par le prisme quasi exclusif63 de l’exploitation économique des ressources par les éditeurs, y compris lorsque l’édition est le fait des presses universitaires. L’accès à ces travaux est donc conditionné par l’abonnement aux revues ou l’achat des ouvrages en version papier ou électronique (via des plateformes comme Cairn et Open Edition par exemple). L’économie de l’édition ayant donné lieu, comme on l’a vu précédemment, à des bouleversements, elle est aujourd’hui remise en cause, et les solutions d’autoarchivage sont vivement recommandées aux chercheurs64. Ces recommandations institutionnelles ont été accompagnées en France, comme dans d’autres pays (Robin, 2022a, n° 563-564), de l’adoption de dispositions autorisant les chercheurs, auteurs d’écrits scientifiques, à déroger au principe de liberté contractuelle et à la force obligatoire des contrats, en leur offrant, malgré l’exclusivité du contrat d’édition, la faculté de diffuser leurs articles sur d’autres supports (blogs, archives ouvertes, etc.)65. La loi prévoit en effet que les écrits scientifiques qui sont le fruit de recherches financées majoritairement par des fonds publics, publiés dans des revues périodiques, peuvent être mis à disposition en format ouvert dans leur version finale acceptée par l’éditeur (avant mise en page par celui-ci), soit immédiatement si l’éditeur propose déjà une mise à disposition ouverte, soit après un certain temps (durée d’embargo de douze mois en droit), à condition que la mise à disposition soit gratuite, qu’elle n’emporte pas une exploitation commerciale de l’écrit et que l’ensemble des coauteurs y aient, le cas échéant, consenti. La liberté alors accordée aux chercheurs répond aux préoccupations économiques et sociales qui sont à l’origine du débat : les résultats issus d’une recherche publique doivent être mis au service de l’ensemble de la société, ce qui implique une plus large diffusion que celle qui résulte d’une diffusion jusqu’ici contrainte par l’exclusivité imposée par les revues scientifiques (Cornu, 2016). S’il est clairement facultatif, le procédé est cependant devenu obligatoire en pratique, du moins dans le cadre de certains appels à projets (de type ANR) pour lesquels la diffusion en accès ouvert est devenue une condition de financement.
Afin de consolider la règle, le législateur a pris soin enfin d’affirmer le caractère d’ordre public des dispositions66. Il s’agit d’empêcher le chercheur, auteur d’écrits scientifiques, considéré ici comme « partie faible », de renoncer par contrat aux prérogatives dont il dispose en vertu de la loi67. L’étude d’impact de la loi pour une République numérique mentionne que
« une atteinte est portée à la liberté contractuelle des auteurs et des éditeurs, le caractère d’ordre public empêchant l’auteur ou son établissement de renoncer au bénéfice du droit qui lui est conféré en ce qui concerne les publications et de céder à l’éditeur des licences tendant à limiter la réutilisation des données de la recherche68 ».
Les contrats d’édition ne peuvent donc avoir pour effet de limiter les conditions de publication des écrits scientifiques et de réutilisation des données au-delà du seuil autorisé (durée d’embargo, à des fins non commerciales, version finale du manuscrit, etc.). Le caractère d’ordre public de la règle devrait permettre, en tant que loi de police, de faire rayonner les règles tant à l’égard des éditeurs scientifiques établis sur le territoire national qu’à l’égard de ceux établis hors de celui-ci (Robin, 2022a, n° 588).
1.2.2. La recommandation d’une diffusion immédiate du manuscrit
Le Plan national pour la science ouverte (PNSO) préconise par ailleurs la mise en œuvre de la « stratégie de non-cession des droits sur les publications scientifiques » (Ministère de l’Enseignement supérieur et de la Recherche, 2023). Cette stratégie consiste dans le fait de rendre immédiatement accessible un article dans une archive ouverte de type HAL et ce, malgré la publication de l’article par un éditeur. Cette recommandation reprend les conditions applicables aux projets de recherche financés par des fonds européens en vertu du programme « Horizon Europe »69 dont l’article 39, 3°, prévoit que :
« Les bénéficiaires veillent à ce que l’accès ouvert aux publications scientifiques s’applique dans les conditions établies dans la convention de subvention. En particulier, les bénéficiaires veillent à conserver, ou à ce que les auteurs conservent, suffisamment de droits de propriété intellectuelle pour se conformer à leurs obligations en matière d’accès ouvert. »
Elle est également portée par la cOAlition S, regroupement international de 28 organisations de financement de la recherche dont font partie l’Agence nationale de la recherche (ANR) et la Commission européenne. S’agissant spécifiquement des publications financées sur fonds publics, la cOAlition S prévoit une ouverture généralisée70 :
« Après le 1er janvier 2021, les publications scientifiques sur les résultats de la recherche financée sur fonds publics accordés par des agences de recherche ou des organismes de financement nationaux ou européens, doivent être publiées dans des revues ou sur des plateformes en accès libre. »
Fruit de cette coalition, le Plan S prévoit, de façon radicale, que les articles de recherche issus des projets que ces organisations financent soient disponibles en accès ouvert et sous licence libre dès la date de publication. Aussi est-il recommandé à l’auteur, qui renonce alors de facto à exercer ses prérogatives patrimoniales71, d’avertir l’éditeur qu’une licence libre, généralement une licence Creative Commons de type CC-BY, sera appliquée au manuscrit et à toutes les versions successives jusqu’au « manuscrit auteur accepté » (MAA) pour publication après relecture par les pairs. Cette dernière version du manuscrit pourrait alors être diffusée immédiatement dans une archive ouverte72. Juridiquement respectueuse du droit d’auteur, cette stratégie, qui replace l’auteur au centre de l’exercice de ses prérogatives, s’autorise, d’une part, de ce qu’en pratique les chercheurs auront le plus souvent consenti une cession de leurs droits à titre gratuit, et d’autre part, du principe selon lequel l’éditeur n’est titulaire d’un droit que sur la mise en page de l’écrit scientifique et non sur les versions antérieures. Comme pour toutes les publications empruntant la « voie diamant » (Bernault, 2016), elle pose néanmoins à terme la question du financement des publications scientifiques, mais également celle de la qualité de l’évaluation des publications sur les plateformes de libre accès. Ces écueils ont été relevés comme pouvant nuire à l’indépendance, à la liberté d’expression du chercheur, à la qualité du travail d’édition, ainsi qu’à la « bibliodiversité » (Boutron, Tremolière, 2023 ; Henriet, Darcos, Ouzoulias, 2022).
2. L’ouverture de l’accès aux données utilisées ou produites lors d’une activité de recherche juridique
Les données de la recherche sur le droit sont constituées d’éléments tout à fait disparates qu’il est possible de ranger en deux catégories, en tant qu’elles peuvent être qualifiées soit de données publiques, soit de données privatives73. Les premières sont celles qui sont utilisées pour la recherche sur le droit et qui répondent aux définitions relevant du dispositif de l’ouverture des données publiques (2.1). Les secondes, qui constituent également un corpus important des ressources utilisées pour la recherche sur le droit, sont ainsi dénommées en ce que, sans être des objets de propriété à proprement parler, elles sont, à différents titres, réservées privativement (2.2).
2.1. L’accès aux données publiques
Parce qu’elles sont produites dans le cadre des organismes du secteur public, c’est-à-dire des administrations, de nombreuses données utilisées pour les besoins de la recherche sur le droit sont des données publiques (2.1.1). En tant que telles, elles devraient également répondre à la définition juridique de données ouvertes (2.1.2).
2.1.1. Les données utilisées et produites lors d’une recherche juridique, des données publiques
Les données utilisées pour la recherche, des données publiques par nature. La notion de « données publiques » n’est pas, à proprement parler, définie par les textes. Cela n’est pas surprenant dans la mesure où c’est la notion de « document » – moins fuyante que celle de « donnée » – qui structure tout l’édifice de l’ouverture des données publiques. Le document, objet des obligations de diffusion et de réutilisation, est défini en droit de l’Union comme « a) tout contenu quel que soit son support (papier ou forme électronique, enregistrement sonore, visuel ou audiovisuel) ; ou b) toute partie de ce contenu74 ». Plus synthétique que son homologue française75, la définition comprend cependant le document comme un contenu là où l’on pouvait plutôt l’envisager comme un contenant, ou tout au moins comme un support76. Le document peut donc être considéré comme le contenu qui peut lui-même être le tout mais aussi l’une de ses plus petites parties, c’est-à-dire une donnée77. Parmi les documents exclus du champ d’application de la directive78 figurent les documents sur lesquels des tiers détiennent des droits de propriété intellectuelle et les documents contenant des données sensibles protégées par des dispositions légales nationales particulières (dont la protection de la sécurité nationale, le secret des données statistiques, le secret d’affaires, les secrets professionnels) et les documents contenant des données à caractère personnel. Les documents détenus par les organismes publics sont régis par le principe général énoncé par la directive qui est celui de la réutilisation gratuite des documents concernés, que cette réutilisation soit faite à des fins commerciales ou non commerciales79. Cette obligation d’autoriser la réutilisation ne peut cependant concerner que des documents existants au sens où ils ne sont pas à produire80.
Les ressources utilisées pour les recherches sur le droit peuvent généralement être qualifiées de documents administratifs et, en tant que tels, leur réutilisation gratuite par les chercheurs est autorisée. La mise à disposition des décisions de justice, par exemple, résulte ainsi non pas du fait qu’il s’agirait de données de la recherche dont il faudrait assurer l’ouverture, mais du fait qu’elles constituent avant tout des documents administratifs produits ou reçus par les juridictions de l’ordre administratif et judiciaire en tant qu’elles sont des administrations. L’ouverture de ces décisions n’est donc pas le résultat de la mise en œuvre des règles relatives à la science ouverte. Bien que leur mise à disposition soit soumise à des contraintes particulières81, elles subissent le même sort que tous les autres documents rendus publics par l’administration ou ceux conservés au sein des services d’archives sous réserve de leur classement82. Il faut gager que l’ouverture des décisions de justice aura pour effet à terme de compléter la base de données publique Légifrance qui ne représente pour l’heure qu’une partie des décisions rendues par les juridictions françaises. De même, au titre des documents administratifs répondant à l’obligation de diffusion figurent les algorithmes83, définis comme « l’étude de la résolution de problèmes par la mise en œuvre de suites d’opérations élémentaires selon un processus défini aboutissant à une solution84 ». Ils peuvent constituer des ressources utiles pour les recherches sur le droit, notamment lorsqu’il s’agit de comprendre comment les règles légales ou réglementaires ont été implémentées dans le code informatique pour faire produire à un système d’intelligence artificielle une décision individuelle par exemple85.
Les données utilisées ou produites lors d’une recherche, des données publiques par destination. Les données de la recherche ne sont pas des données publiques par nature. Leur intégration dans la directive (UE) 2019/1024 ne résulte pas d’une définition commune qui engloberait tous les documents publics, y compris les données de la recherche. La notion qui bénéficie ainsi d’une autonomie conceptuelle86 subit également l’application d’un régime juridique particulier. Ce statut juridique exceptionnel s’explique sur le fond par le fait qu’elles sont le fruit d’un écosystème particulier, celui de la recherche scientifique, et qu’elles sont détenues par des établissements qui, s’ils exercent bien une mission de service public (recherche scientifique), développent aussi toutefois une activité industrielle et commerciale (valorisation). La définition légale exprime l’idée que les données de la recherche n’acquièrent ce statut qu’à partir du moment où elles sont utilisées ou produites au cours d’activités de recherche. L’expression semble judicieuse à condition de définir l’activité scientifique sur la base du critère intellectuel et moral (et non institutionnel ou organique) qui caractérise, à notre sens, la démarche scientifique (Robin, 2022a, n° 12). La définition légale européenne des données de la recherche retient par ailleurs une acception restrictive de la notion. Outre le fait que la définition exclut les publications scientifiques de la notion de données, le champ d’application des dispositions est cantonné aux données « utilisées comme éléments probants dans le processus de recherche, ou dont la communauté scientifique admet communément qu’ils sont nécessaires pour valider des conclusions et résultats de la recherche », c’est-à-dire aux données qui permettent d’administrer la preuve scientifique afin de vérifier le sérieux et l’objectivité des résultats produits à partir de l’analyse des données, ce qui exclut de la définition un grand nombre de données (données brutes, données intermédiaires, etc.). L’exclusion est justifiée par l’objectif poursuivi par le législateur européen d’encourager la réutilisation des données87, nécessitant concomitamment, pour répondre à la « crise de reproductibilité » que traversent certaines disciplines scientifiques, de rappeler et d’imposer le respect des règles relatives à l’intégrité scientifique (Robin, 2022a)88.
Ainsi, dès lors que des ressources utilisées ou produites lors d’une activité de recherche juridique peuvent être qualifiées de données de la recherche au sens de la directive, elles doivent obéir au principe de science ouverte énoncé par l’article 10 de la directive89. Les États doivent donc encourager la mise à disposition des données de la recherche en adoptant les politiques et en prenant les mesures nécessaires à l’échelon national afin de rendre librement accessibles les données résultant de la recherche financée au moyen de fonds publics. En outre, les données de la recherche ne sont soumises au principe d’ouverture et de libre réutilisation qu’à la double condition qu’elles soient issues d’une recherche financée au moyen de fonds publics et que les chercheurs les aient rendues publiques par l’intermédiaire d’une archive ouverte institutionnelle ou thématique. Dès lors qu’elles sont mises en accès libre, les données de la recherche sont considérées comme librement réutilisables à des fins commerciales ou non commerciales. La règle de l’article 10 ménage cependant les intérêts des tiers impliqués dans le processus de production et de diffusion scientifique. La mise à disposition des données doit de fait être réalisée en tenant compte des intérêts commerciaux légitimes, des activités de transmission des connaissances et des droits de propriété intellectuelle. Dans la recherche sur le droit, seule la documentation publique échappe à ces contraintes pour des raisons qui, comme on l’a vu, ne tiennent pas à l’application des règles de science ouverte mais de celle des règles relatives à l’accès au droit ou à l’ouverture des données publiques. Toutefois, l’application des règles de science ouverte peut s’avérer pertinente y compris sur des ressources issues de la documentation publique. La mise à disposition via une archive ouverte de décisions difficiles à trouver ou obtenues grâce à une demande particulière auprès d’un conseil (avocat) ou d’une juridiction pourrait utilement servir les intérêts des chercheurs eux-mêmes, et aurait ainsi pour effet de transformer la ressource en une donnée ouverte.
2.1.2. Les données utilisées ou produites lors d’une activité de recherche juridique, des données ouvertes ?
La directive (UE) 2019/1024 conditionne l’ouverture des données publiques, mais aussi des données de la recherche, au fait qu’elles soient ouvertes.90 En tant que données de la recherche, ou en tant que données publiques, les ressources utilisées ou produites lors d’une activité de recherche doivent donc être formatées et stockées dans des conditions qui en permettent la conservation en même temps que la mise à disposition, et constituer ce que l’on appelle des « données ouvertes ». Le législateur européen définit la notion de format ouvert comme un « format de fichier indépendant des plateformes utilisées et mis à disposition du public sans restriction empêchant la réutilisation des documents ». Pour ce qui concerne les données de la recherche en particulier, la directive précise qu’elles doivent être formatées selon les standards FAIR91. Selon les préconisations de la Commission européenne (2018, p. 19), également reprises par la Research Data Alliance (RDA)92, les données doivent, pour être FAIR93 sur le plan technique, répondre à certaines exigences94 (Wilkinson et al., 2016). Le respect de la norme FAIR peut être facilité par la rédaction d’un plan de gestion de données (PGD) dès le commencement d’un projet de recherche. Souvent imposé lors d’une demande de financement public national ou européen, l’établissement d’un PGD doit en principe permettre aux chercheurs d’adopter une attitude réflexive sur la gestion de leurs données, d’adopter les bonnes pratiques dans ce domaine et d’encourager par conséquent la diffusion de données réutilisables. De ce point de vue, le PGD joue en quelque sorte le rôle des registres en matière de gestion des données personnelles imposés par la loi dans une démarche de mise en conformité interne (compliance). De la même manière que leurs homologues, ils doivent être tenus à jour régulièrement pendant toute la vie du projet de recherche, voire au-delà, permettant d’assurer une gestion raisonnée et responsable des données de la recherche publique. Bien que les modèles de PGD soient nombreux et variés (Hodson, Molloy, 2014), ils sont généralement tous structurés suivant le cycle de vie des données.
Afin que les données de la recherche sur le droit puissent être diffusées ou partagées en format ouvert, encore faudrait-il qu’elles aient été organisées et classées de manière structurée en « jeux de données ». Plusieurs solutions, sur le plan technique, permettent aujourd’hui aux chercheurs de conserver mais aussi de partager ou de diffuser leurs jeux de données, comme les infrastructures de données (ou infrastructures de recherche selon les cas) ou encore les entrepôts de données (Robin, 2022a). De nombreux entrepôts institutionnels se sont développés à travers le monde afin de proposer un service de dépôt, d’archivage pérenne et un service d’assistance et d’accompagnement à la gestion des données (Catherine, 2020 ; Schöpfel, Rebouillat, 2021). Ainsi en est-il de la plateforme HAL qui offre désormais la possibilité d’archiver les jeux de données sous forme de « data paper » (Reymonet, 2017)95, ou encore l’entrepôt Zenodo96, l’outil de gestion de ressources Zotero97, etc. Quel que soit l’outil utilisé, les données doivent être décrites et documentées à l’aide des métadonnées. Dans le domaine de la recherche sur le droit, les jeux de données seraient donc constitués de l’ensemble des références traditionnelles des ressources utilisées dans la recherche sur le droit évoquées plus haut : références légales et réglementaires, références jurisprudentielles, articles de doctrine, rapports et autres documents des autorités publiques, etc. Si ces données sont déjà généralement très clairement identifiées et décrites dans le document présentant les résultats d’une recherche, soit en notes infrapaginales, soit en fin de document dans les tables alphabétiques de références bibliographiques, l’on pourrait toutefois imaginer, d’une part, que ces références soient publiées indépendamment du document de référence ou de la publication elle-même et, d’autre part, qu’elles contiennent outre les références, c’est-à-dire les métadonnées, le contenu des ressources lui-même, sous réserve des droits des personnes titulaires des droits d’auteur (auteurs ou éditeurs) sur les ressources. La diffusion de jeux de données structurés par le biais des entrepôts de données ne préjuge pas cependant du périmètre de leur ouverture. Si de nombreux entrepôts recommandent l’ouverture maximale par l’utilisation des licences permissives de type Creative Commons (généralement CC-BY 4.0), il n’est pas interdit de paramétrer l’accès aux données de manière, par exemple, que les droits des tiers soient préservés.
2.2. L’accès aux données privatives pour la recherche juridique
Par données privatives, il convient d’entendre toutes les bases de données réservées par un droit de propriété intellectuelle et, en particulier, par le droit sui generis des bases de données (2.2.1), et toutes les informations couvertes par le secret comme l’ensemble des pratiques, usages et savoir-faire déployés par les praticiens du droit (2.2.2)98.
2.2.1. Les bases de données couvertes par un droit de propriété intellectuelle
Si les éditeurs détiennent, en tant qu’ayants droit des auteurs des droits d’auteur sur les écrits scientifiques, ils détiennent également, mais cette fois en tant que producteurs de bases de données, un droit sui generis sur les bases de données (systèmes d’information ou infrastructures) qu’ils conçoivent pour organiser l’accès aux ressources produites par la recherche sur le droit. Ce droit leur permet de monnayer, par exemple, l’utilisation de leurs bases de données lors d’opérations de fouille et d’exploration réalisées à des fins scientifiques. Ces données constituées des écrits scientifiques, sur lesquelles les sociétés d’édition capitalisent aujourd’hui, sont des données qu’il est en effet possible de collecter et d’analyser massivement afin d’en tirer des conclusions propres à nourrir l’activité scientifique des chercheurs, mais aussi l’activité économique d’acteurs privés. La consécration de l’exception légale de fouille de textes et de données 99, qui vient précisément répondre aux besoins générés par l’analyse massive de données, est assortie de plusieurs conditions dont l’une oblige les utilisateurs des bases de données à bénéficier d’un accès licite aux bases de données explorées100. Cette condition de licéité, qui figure également dans l’exception légale de copie privée depuis 2011101, permet de s’assurer que l’utilisation des données ne peut être mise en œuvre à partir d’un corpus auquel il aurait été accédé de manière illicite, c’est-à-dire sans autorisation des titulaires de droits. La notion de licéité de l’accès doit s’entendre, selon la directive, comme couvrant l’accès à des contenus fondé sur une politique de libre accès ou en vertu d’arrangements contractuels entre, d’une part, les titulaires de droits et, d’autre part, les organismes de recherche, comme des abonnements, ou en vertu d’autres voies légales. Ainsi, la constitution d’une base de données comme ISTEX102 a-t-elle nécessité de la part du consortium qui en est à l’origine103 de négocier l’accès aux données détenues par les éditeurs scientifiques avant de pouvoir l’ouvrir aux chercheurs pour qu’ils puissent y réaliser des fouilles (Bensamoun, Bouquerel, 2020 ; Robin, 2022a, n° 186 et suiv. ; Robin, 2022b). Il s’agira enfin d’observer que les bases de données conçues par le CNRS qui propulse les archives ouvertes HAL devraient pouvoir également être considérées comme couvertes par un droit sui generis des bases de données détenu par l’organisme de recherche. La titularité des droits du CNRS sur la base de données HAL ne devrait cependant avoir aucune incidence sur l’utilisation qui peut en être faite dans la mesure où le CRPA interdit aux administrations, au sens de l’article L. 300-2 du même code, de se prévaloir du droit sui generis sur les bases de données pour faire obstacle à l’application du principe de réutilisation des données qu’elles contiennent104.
Afin d’éviter que les chercheurs soient empêchés par les éditeurs, par le jeu des contrats de cession de droits dont l’objet peut être, outre l’article scientifique lui-même, les données associées à la recherche, le législateur français (depuis 2016105) et le législateur européen (depuis 2019106) ont adopté un principe de libre réutilisation des données de la recherche (Robin, 2022a). Selon ce principe107, et sur le fondement de l’article L. 533-4, II, du Code de la recherche, dès lors que les données de la recherche ont été majoritairement financées par des fonds publics, qu’elles ne sont pas protégées par un droit spécifique ou une réglementation particulière et qu’elles ont été rendues publiques par le chercheur, l’établissement ou l’organisme de recherche, leur réutilisation est libre, sans que l’éditeur de l’article scientifique auquel les données sont associées ne puisse en limiter la réutilisation dans le cadre de la publication108. Le texte ne limite pas la réutilisation à des fins non commerciales, ce qui laisse ouverte la possibilité de procéder à une exploitation commerciale des données de la recherche dès lors qu’elles ont été rendues publiques, interprétation confortée par le texte européen qui prévoit que les données peuvent être réutilisées à des fins commerciales ou non commerciales conformément au régime juridique qui prévaut en matière de données publiques et prévu aux chapitres III et IV de la directive elle-même. Concernant la mise à disposition des données, le texte français ne désigne aucun outil pour l’opération de publication, là où le texte européen vise, quant à lui, les archives ouvertes institutionnelles ou thématiques. Les chercheurs et les établissements ou organismes publics peuvent donc décider, au cas par cas, quelles données ouvrir et à quelles conditions. Lorsqu’elles consistent en des références légales ou jurisprudentielles, c’est-à-dire en des données publiques, la plus-value d’une diffusion supplémentaire par les chercheurs peut sembler a priori peu élevée. Il faut cependant nuancer cette affirmation car la diffusion par un chercheur des décisions de juridictions étrangères, par exemple, peut être précieuse pour d’autres chercheurs. De même, la diffusion de textes anciens ou oubliés, mais exhumés à l’occasion d’une recherche, constitue un atout important pour la recherche scientifique. Par ailleurs, compte tenu du fait que l’accès à l’ensemble des décisions de jurisprudence n’est encore pas assuré de façon exhaustive par Légifrance, imposant alors le recours à la base de données privée JurisData (accessible sur abonnement), la publication de nombreuses décisions par les chercheurs eux-mêmes pourrait s’avérer très utile à la communauté scientifique.
2.2.2. Les pratiques, usages et savoir-faire couverts par le secret
Sur le plan juridique, les données privatives utiles à la recherche sur le droit peuvent également consister en des modèles d’affaires, par exemple, conçus par les acteurs économiques et, en particulier, les contrats dont l’étude peut s’avérer une source précieuse d’enseignements, non seulement sur les pratiques du droit que l’étude de la jurisprudence ne permet pas, à elle seule, de mettre au jour puisque ne concernant que des situations contentieuses, mais aussi sur les éventuelles stratégies soit de contournement de la loi, soit d’adaptation des comportements. L’étude des pratiques, usages et savoir-faire déployés en droit s’avère d’autant plus intéressante que ces usages constituent précisément une source du droit à laquelle le législateur ou les juges réfèrent régulièrement. Si ces usages sont souvent recensés dans des codes ou chartes, un certain nombre d’entre eux propres à un secteur économique en particulier restent cependant encore non documentés (Mousseron, 2023)109. En outre, les savoir-faire, qui prennent la forme de contrats ou de modèles d’affaires sont généralement soumis au secret d’affaires auquel les principes de science ouverte ne dérogent pas110. Le déploiement du commerce électronique a cependant pour effet de produire un très grand nombre de contrats, conditions générales d’utilisation (CGU), dont l’analyse peut, en raison de leur diffusion (imposée par la loi111), être entreprise de façon systématique112. L’accès aux CGU n’équivaut pas aux modèles d’affaires mais peut, à coup sûr, révéler les choix et stratégies d’une entreprise. Leur étude s’avère donc éclairante, notamment dans le cadre d’une recherche empirique en droit des contrats, en droit de la consommation, en droit du marché et de la concurrence, etc.
Par ailleurs, un mouvement se dessine aujourd’hui dans le sens d’une ouverture, ou plus exactement, d’un partage de données privées, c’est-à-dire de données détenues par les acteurs économiques et partagées, en accès restreint, avec des institutions publiques, des particuliers ou d’autres acteurs économiques dans des conditions susceptibles de préserver la confidentialité ou les droits des personnes. Tout d’abord, la directive (UE) 2019/1024 a inclus certaines entreprises publiques qui agissent dans des secteurs indirectement concurrentiels dans le périmètre des personnes concernées par les obligations d’ouverture des données113, dès lors qu’elles exercent des activités dans les domaines définis et visés par la directive 2014/25/UE, qu’elles agissent en qualité d’opérateurs de services publics conformément à l’article 2 du règlement n° 1370/2007, qu’elles relèvent de certains secteurs (transports aériens, armateurs). La même directive encourage également la mise à disposition de données spécifiques de forte valeur, c’est-à-dire de données susceptibles de générer des avantages socio-économiques ou environnementaux importants et des services innovants, notamment pour les PME, et susceptibles d’être appariées à d’autres ensembles de données114. Ensuite, le partage de données privées entre les administrations et les opérateurs privés ou entre opérateurs privés est aujourd’hui encouragé par les règlements européens successifs que sont le Règlement sur la gouvernance des données115, le Règlement sur les données116 ou encore la proposition de règlement sectoriel sur l’espace européen des données de santé117, qui ont pour objet d’améliorer les conditions du partage des données dans le marché intérieur. L’accès à ces données peut s’avérer utile aux recherches menées en droit dans la mesure où elles permettent, par exemple, de comprendre la régulation interne des entreprises ou encore l’intégration normes comme la norme ISO 26000 en matière de responsabilité sociétale des entreprises (RSE). L’accès à ces données, qui peuvent être partagées à des conditions restrictives118, s’avère surtout intéressant pour les recherches menées dans d’autres disciplines (économie ou gestion, en particulier) dont les résultats peuvent ensuite utilement nourrir les analyses menées par les juristes.
Conclusion
La science ouverte interroge, de façon inédite, l’ensemble du processus de production scientifique. Se poser la question de l’application de la science ouverte à la recherche sur le droit invite donc à une réflexion d’ordre épistémologique. Si elle est intimement mêlée à l’ouverture des données publiques et au principe d’accès au droit, l’application de la science ouverte à la recherche (en et) sur le droit ne se réduit cependant pas à cette seule dimension en raison de la pluralité des ressources utilisées dans la discipline. L’analyse de la production scientifique en droit au prisme de la science ouverte montre surtout les potentialités non encore explorées de la constitution de corpus de données propres à un travail de recherche auquel il serait possible d’accéder directement et indépendamment de la présentation des résultats dans l’écrit scientifique. Un tel accès pourrait s’avérer précieux pour la vérification de la validité de certains résultats scientifiques obtenus et pour le gain de temps procuré pour d’autres recherches. Cet accès pourrait également s’avérer utile aux entreprises et cabinets de conseil souhaitant se saisir des données compilées et diffusées via une archive ouverte. Analyser la production scientifique (en et) sur le droit à travers la notion de « données » change en tout état de cause la perspective. La numérisation des ressources et leur compilation au sein des catalogues des éditeurs ou au sein d’archives ouvertes produisent un effet de massification réduisant par exemple lesdits écrits scientifiques en données dont l’exploration peut s’avérer à terme intéressante, ne serait-ce que pour observer les tendances, récurrences et biais de la recherche en droit. Tel est également l’objectif poursuivi par la science ouverte, justifiant ainsi que l’ouverture soit considérée comme le principe et la fermeture comme l’exception. Enfin, comme on l’observe d’ores et déjà dans les disciplines scientifiques pionnières en matière d’ouverture des données, la mise en œuvre de la science ouverte induit des changements dans les pratiques scientifiques, puisqu’elle implique de concevoir, dès le début du processus de recherche, la manière dont les données seront formatées, structurées, conservées et mises à disposition conformément au principe de l’ouverture « par défaut », dans la perspective qu’elles soient réutilisées un jour par d’autres.