La métaphore a cela de commode qu’elle encapsule certaines des exigences les plus complexes du travail d’écriture ; attirer le lecteur, attiser et conserver son attention pour, finalement, le marquer durablement. L’entreprise n’est pourtant pas si aisée quand, comme la nôtre, elle ne relève pas de l’évidence puisqu’enfin, qu’est-ce que Sisyphe et les Danaïdes peuvent avoir à faire avec les sources du droit et, plus encore, avec l’open data des décisions de justice ? Tâchons d’élucider cette interrogation et, pour ce faire, procédons par étapes.
L’open data des décisions de justice est autant un mouvement politico-économique qu’une (petite) révolution de l’univers juridique français. Défini comme le processus devant conduire à la mise à disposition gratuite et dans un format électronique de l’ensemble des décisions des juridictions administratives et judiciaires, ce mouvement a été enclenché par la loi pour une République numérique de 20161, en rupture totale avec les politiques de diffusion des sources jurisprudentielles du droit construites sur un principe de sélection des décisions2. Si la rupture conceptuelle était déjà totale en 2016, la rupture pratique ne s’est pas faite aussi franchement puisqu’il a fallu voir ce principe d’open data réitéré deux ans plus tard3, attendre quelque quatre ans pour en voir les actes d’application adoptés4 et encore un an avant qu’il ne commence à se concrétiser, de sorte que la diffusion gratuite en ligne de l’intégralité des décisions de justice française n’a véritablement démarré que le 30 septembre 2021 et ne s’achèvera, si le calendrier est tenu, que le 31 décembre 20255. À l’heure où ces lignes sont écrites, ce sont l’intégralité des arrêts et décisions des juridictions administratives ainsi que l’intégralité des arrêts de cassation et d’appel en matières civile, commerciale et sociale qui sont diffusées sur les bases de données créées par chaque juridiction suprême (« Judilibre » pour la Cour de cassation, « Open Data Justice administrative » pour le Conseil d’État6). L’année 2024 a ainsi été le théâtre du lancement de la mise à disposition expérimentale des décisions de certains tribunaux judiciaires7 et la montée en puissance de l’Observatoire des litiges judiciaires (OJL) annoncée par la Cour de cassation en fin d’année 20238.
Or, l’intégralité des décisions de justice rendues par les juridictions françaises devant être mise à disposition du public ne représentait en 20199 rien de moins que 268 000 décisions et arrêts côté juridiction administrative10 et un peu plus de trois millions côté juridiction judiciaire11. L’ensemble est déjà vertigineux en lui-même et il l’est d’autant plus lorsqu’on confronte ces chiffres à la quantité de décisions et d’arrêts jusqu’ici diffusés sur Légifrance – ainsi, pour la même année, ce sont seulement 16 0000 décisions et arrêts d’une part et 9 000 d’autre part qui ont été mis à disposition, soit 6 % de la production annuelle de la juridiction administrative et 0,3 % de celle de la juridiction judiciaire. L’explosion, et donc la révolution, de la diffusion des sources juridictionnelles du droit est donc évidente. Le contenu de ce qui est diffusé n’est pas moins révolutionnaire. Si l’on s’arrête sur la composition des 16 000 arrêts et décisions des juridictions administratives et des 9 000 arrêts et décisions des juridictions judiciaires diffusés pour l’année 2019, la répartition reflète plus ou moins l’organisation hiérarchie des juridictions françaises : les arrêts de la juridiction suprême sont les plus nombreux pour la juridiction judiciaire (8 049 arrêts de la Cour de Cassation, 2 670 arrêts du Conseil d’État), tandis que ce sont les arrêts d’appel qui sont les plus nombreux pour la juridiction administrative (13 316 arrêts de cours administratives d’appel, 1 133 arrêts de cours d’appel) et que, finalement, on ne dénombre que quelques rares décisions de première instance (neuf décisions du seul tribunal de grande instance de Paris et aucune décision de tribunal administratif). Si le décalage est visible à l’œil nu : l’équilibre est renversé. Alors que les arrêts des cours suprêmes ne représentent que 4 % et 0,8 % de la production annuelle de chaque ordre, ils représentent 50,3 % et 89 % des arrêts diffusés12.
À tout cela on peut objecter que ce n’est rien que du très connu. Mais c’est là, précisément, que réside la révolution proposée. Depuis que la diffusion en ligne des décisions de justice a été consacrée en tant que service public13, le principe de sélectivité basé sur la notion d’intérêt juridique et sur la hiérarchie des juridictions n’a jamais été sérieusement remis en cause, et cela alors même que des mouvements doctrinaux ont constamment plaidé pour une diffusion plus large de ces décisions14. À cet égard, c’est bien malgré ces plaidoyers que le statu quo n’a jamais été véritablement perturbé, de sorte que, jusqu’à présent, l’essentiel du discours doctrinal français s’intéressant aux décisions de justice s’est toujours concentré sur des arrêts des juridictions suprêmes. Avec des nuances importantes, l’affirmation vaut à la fois pour le discours privatiste et pour le discours administrativiste15.
Ces éléments de contexte éclairent notre métaphore : c’est dans cette masse de décisions de justice bientôt accessible que se logent nos Danaïdes ou, plutôt, l’eau de leur tonneau percé. Après tout, les millions de décisions de justice rendues annuellement commencent à être accessibles et le prétexte matériel anciennement opposé à leur stockage ne tient plus : les serveurs des juridictions suprêmes et de la Chancellerie vont recevoir ces décisions, vont les stocker et ne vont, virtuellement, jamais se remplir. Face à ces masses de décision, cependant, demeure une doctrine académique française qui n’a jamais demandé et n’a jamais voulu cet open data16. Et voilà notre Sisyphe, parce que cette absence de demande a aussi impliqué une absence de réflexion doctrinale préalable. Les sept années qui nous séparent de l’annonce de l’open data des décisions de justice n’ont pas suffi pour qu’un statut clair soit attribué à ces millions de décisions ou pour que des méthodes d’analyse soient conceptualisées pour s’en saisir. C’est pourtant là une des questions fondamentales que pose l’open data : comment faire pour donner un sens aux décisions bientôt accessibles ? Les méthodes habituelles de commentaire construites sur la base classique de la rédaction des arrêts de cassation sont au surplus calibrées pour saisir des singularités et non des régularités : un arrêt est commenté parce qu’il est particulièrement intéressant. C’est dans cet office que la doctrine académique française prend des allures de Sisyphe ; chaque commentaire d’arrêt ajoute à l’édifice cohérent qui tout à la fois précède et résulte du travail d’ordonnancement mené par les auteurs qui composent cette doctrine. L’ensemble est harmonieux, si ce n’est dans le fond du propos, au moins dans sa forme, et son objet, symétrique et expurgé des contingences extra-juridiques qui n’apparaissent de toute façon plus au stade de la cassation.
Or c’est précisément cette unicité d’objet propre à l’analyse « classique », « dogmatique » des décisions de justice qu’interroge l’open data et, avec elle, l’unicité plus générale de la représentation du phénomène juridique qui irrigue le discours doctrinal français et qu’il entretient en retour – et voilà l’existentialisme de la figure sisyphéenne17. Quand bien même cet open data ne fait l’objet, à ce stade, que d’une assimilation très spécifique et localisée18, il renouvelle néanmoins des questions centenaires et en génère de nouvelles qui, dans tous les cas, remettent en cause une partie des fondements du travail doctrinal tel qu’il se déploie en France depuis plus d’un siècle.
Notre métaphore expliquée, c’est à ces questions et, plus globalement, à la réception de l’open data des décisions de justice au sein du discours doctrinal français depuis 2016 que cet article sera consacré. Parce que c’est encore la doctrine elle-même qui parle le mieux des tensions qui la traversent, c’est au sein de ses écrits et de ce qui est dit, écrit du phénomène de l’open data que nous en rechercherons les traces et les marqueurs. Dans cette optique qui était aussi celle de notre recherche doctorale, nous avons réuni un corpus de 426 contributions écrites19 dont le point commun était de se pencher, d’une manière ou d’une autre, sur les effets de cet open data sur la pratique et la compréhension du droit20. Si nous renvoyons donc à notre thèse pour une présentation précise et exhaustive des choix méthodologiques opérés (Bordère, 2023), nous pouvons néanmoins ici en indiquer les plus importants. Ce corpus a ainsi été soumis à un certain nombre de tests et d’outils d’analyse qui sont à rapprocher des techniques d’analyse de discours, et qui incluent des relevés systématiques d’items argumentatifs ainsi que l’établissement de statistiques descriptives à leur sujet. Il a par ailleurs fait l’objet d’une division en « sous-discours » permettant d’isoler les contributions rédigées par des auteurs émanant du milieu académique (le sous-discours académique) de celles rédigées par des auteurs dits praticiens21 (le sous-discours praticien). Si nous ne traiterons, dans le cadre de cet article, que le premier sous-discours, nous ferons une rapide référence au second vis-à-vis d’un item argumentatif à la mobilisation spécifique. Finalement, nous admettons sans difficultés que notre perspective collective et semi-quantitative arase nécessairement des irrégularités et des individualités22 dont nous avons conscience ; pour autant, c’est aussi cette perspective qui a permis de mettre en lumière les récurrences et la circularité de ce discours dont participent les tensions qui seront ici analysées.
Nous en proposerons d’abord un panorama (1) afin de circonscrire ces tensions de nature fondamentalement épistémologiques et, pour certaines, presque existentielles. Il nous reviendra alors de dépasser ces tensions (2) et d’en rechercher le ou les remède(s) au sein même la doctrine française.
1. Un discours doctrinal parcouru de tensions épistémologiques
L’analyse du corpus d’écrits doctrinaux réuni dans le cadre de la présente étude fait ressortir deux récurrences ordonnées autour de deux items argumentatifs : celui de l’argument tiré d’une « factualisation » du droit enclenchée par l’open data des décisions de justice23 et celui de l’exploitation du champ lexical de la masse et de la quantité24. La mobilisation du premier de ces deux items est d’autant plus intéressante qu’elle est trois fois plus importante au sein du sous-discours académique qu’elle ne l’est au sein du sous-discours praticien. Parce que cet écart est statistiquement significatif25, on ne peut pas l’attribuer seulement au hasard des écrits et des auteurs ; au contraire, il est possible de faire le lien entre la profession des auteurs (ici, universitaires au sens large26) et la mobilisation de cet argument. En d’autres termes, cet item est de nature spécifiquement académique.
Ces deux items se déploient sur deux terrains : celui du droit au sens strict, donc le discours juridique, et celui du discours sur le droit, et donc le discours méta-juridique. Le premier terrain n’est pas celui qui nous intéresse ici, mais il se déploie à partir de l’idée que l’open data et son exploitation par des algorithmes provoqueraient « une transformation de fond, jusque dans la fonction du jugement et de production du droit » (Lemaire, 2019, p. 298) et créeraient de nouvelles « normes issues du nombre » (Buat-Ménard, Giambiasi, 2017, p. 1487) au bénéfice d’une « nouvelle légalité numérique » (Meneceur, 2020, p. 111). Plus souvent, cela dit, ce ne sont pas tant les règles et normes juridiques qui seraient « factualisées » que leur analyse et leur compréhension qui seraient « modifiées » (Huttner, 2020, § 10), « altérées » (Canivet, 2018, p. 41) par un open data qui privilégierait l’analyse des faits à l’analyse du droit (Torricelli-Chrifi, 2019, p. 299-300).
Cet effet est pointé du doigt par le discours à cause, tout d’abord, de ce que rend accessible l’open data. Parce qu’il abandonne un principe de sélectivité qualitative, il présente le risque de « noyer » la production juridictionnelle considérée jusqu’ici comme présentant un « intérêt juridique » (Renaudie, 2019, p. 79) – c’est-à-dire la jurisprudence au sens traditionnel, qualitatif du terme27. Nous renvoyons à nos chiffres introductifs et aux déséquilibres qui marquaient jusqu’à aujourd’hui les rapports entre production et diffusion. Ainsi, non seulement l’ensemble des décisions de justice deviendrait une « masse brute et informe » (Cadiet, 2018, p. 17) au sein de laquelle toute hiérarchie serait, au minimum, jugée superflue (Deumier, 2018, p. 55) et, au maximum, arasée et nivelée (Malabat, 2019, p. 108-109), mais le contenu de cette masse serait lui-même « factualisé ». Si l’on veut suivre la logique des start-up qui l’exploitent et considérer l’open data comme un ensemble de données, il faut admettre que la masse de décisions du fond en son sein emporte avec elle une masse de données factuelles28 qui n’avait jusqu’ici jamais été stockée au sein des bases de données publiques. S’il s’agit déjà là d’une « factualisation » de la logique de diffusion des décisions de justice, elle entraînerait aussi et surtout une « factualisation » de leur analyse : le juriste accédant à cet open data serait incité à prendre en compte ces données de fait dans sa lecture des décisions, éventuellement au-delà des données de droit (Ferey, 2018, p. 79), voire à considérer que « les données juridiques n’ont aucune spécificité particulière » (Garapon, Lassègue, 2021, p. 108) par rapport à « tous les facteurs extra-juridiques […] qui entourent l’événement qu’est le prononcé d’une décision de justice » (Godefroy, Lebaron, Lévy-Véhel, 2019, p. 13). Si ces éléments relèvent indéniablement de la structuration et de la composition de l’ensemble diffusé, c’est le ton des craintes exprimées à leur égard qui surprend et interroge. Outre la remise en cause du modèle sélectif de diffusion des décisions de justice, qu’y a-t-il à craindre d’un accès nouveau à ces décisions du fond ? Qu’y a-t-il à craindre de l’idée que l’analyse de ces décisions se modèle à leurs contours ? Les mots ont un sens, de fait : si le gisement de données est nouveau, ce n’est pas le cas des données qu’il contient.
Il faut en effet s’accorder sur un constat : s’il est évident que l’existence de ces décisions du fond n’a jamais été ignorée, ces dernières faisaient jusqu’ici l’objet d’un silence ou d’un global désintérêt. Ces décisions n’étaient pas diffusées parce qu’elles ne manifestaient aucun intérêt juridique contrairement, donc, à certains arrêts des juridictions suprêmes. Il n’y avait donc que peu de choses à y trouver, en tout cas si on y cherchait les éléments susceptibles d’articuler une analyse de décisions de justice tournée vers l’analyse de singularités jurisprudentielles29 et pas de régularités ou d’évolutions sur le temps long. En réduisant la diffusion (et donc la connaissance) des décisions de justice à une petite somme d’arrêts soigneusement choisis et en délimitant tout aussi soigneusement l’espace d’analyse du phénomène juridique, le système de publication des décisions de justice a contribué à confirmer l’idée que l’intérêt du juriste doit se porter sur les arrêts des cours suprêmes puisque ce sont les seules qui sont dignes d’être connues et, donc, traitées. Ce faisant, et au détriment de plus de 90 % de la production juridictionnelle, ce système s’est assuré de sa perpétuation – en tout cas jusqu’à aujourd’hui, puis c’est précisément cette mécanique que l’open data vient gripper.
L’open data franchit donc des barrières qui n’avaient jamais été levées depuis le début de la diffusion des décisions de justice et, à plus forte raison, depuis le début de leur diffusion en ligne. Ce faisant, il contribue à dévoiler l’ampleur de ce qui n’est pas saisi par le discours doctrinal classique et, partant, par la pensée juridique classique. De là, une succession de questions vertigineuses se pose : que faire de ces décisions une fois qu’elles seront accessibles ? faut-il en faire quelque chose ? Si c’est le cas et s’il s’agit de les traiter dans leur spécificité, c’est au risque de « factualiser », « massifier » leur analyse. Faut-il donc ne rien en faire, et continuer sur la lancée centenaire consistant à les laisser de côté ? Laisser ces millions de décisions sans traitement doctrinal, pourtant, c’est risquer d’abandonner l’analyse de toute une portion du phénomène juridique à d’autres que la recherche juridique – aux sciences sociales, tout d’abord, mais aussi potentiellement aux algorithmes des start-up qui ont réclamé cet open data pour alimenter des outils ensuite proposés aux praticiens avides d’informations directement mobilisables. On ne peut mieux faire que de laisser parler une des autrices de ce discours :
« De quoi et comment le droit sera-t-il façonné demain ? et nous ? qu’allons-nous être amenés à faire et à devenir ? n’aurions-nous pas raté le train de cette innovation ? allons-nous laisser aux experts du numérique le soin de nous révéler ce qu’est notre droit et le potentiel de réflexion qu’il offre ? » (Rouyère, 2019, p. 225)
Dit autrement, le dilemme que présente l’open data des décisions de justice à la doctrine académique est celui-ci : continuer de remplir son office ainsi qu’elle le fait traditionnellement, et ainsi se désintéresser d’un open data qui, dans cette perspective, ne lui apporte rien ou si peu ; ou altérer cet office, changer d’objet d’étude, d’outils d’analyse, de démarche épistémologique… et ainsi d’identité.
2. Un paysage doctrinal à la croisée des chemins
De même que ce sont les auteurs de ce discours qui en expriment le mieux les tensions, ce sont aussi eux qui y répondent avec le plus de pertinence. Ainsi, à cette angoisse face au risque de marginalisation ou de perte d’autonomie du discours doctrinal français, il est répondu ceci :
« Les hommes et les femmes du droit doivent défendre leur utilité, non par corporatisme ou conservatisme frileux, mais parce que le rôle qu’ils jouent contribue à la préservation de l’État de droit […]. Nous devons d’abord balayer devant notre porte et cesser de colporter un discours déconnecté de la réalité ; admettre la part d’irrationnel et d’imparfait dans la production et l’application du droit. Pour cela, il faut que les juristes eux-mêmes fassent leur deuil d’une présentation idéelle du droit. » (Bénabou, 2020, p. 724-725)
Cet appel n’est pas pertinent seulement en raison de la mise en œuvre de l’open data des décisions de justice, tant s’en faut, mais il n’en est rendu que plus pressant. Tant que les moyens techniques et technologiques ne permettaient pas de prendre la mesure de la réduction du champ de l’analyse doctrinale, l’appel à une appréhension moins idéelle et idéale du droit pouvait ne résonner qu’au sein des mouvements doctrinaux qui entendent exploiter ces décisions de justice. À cet égard, si la situation demeurera à peu près inchangée jusqu’à ce que les décisions de première instance soient effectivement rendues accessibles, elle n’en reste pas moins destinée à s’inverser.
Mais comment faire le deuil ici réclamé ? Les pistes, de fait, ne manquent pas. S’il est encore et toujours possible de rappeler que nos disciplines voisines exploitent déjà des outils et des techniques d’analyse destinés à structurer et à donner du sens à des masses de données, il n’est pas forcément nécessaire de s’exiler hors des bornes disciplinaires du droit pour trouver des offres d’analyse de ces décisions de justice.
À moyen terme, l’open data ne fait que réaliser le projet porté par l’informatique juridique des années 1970 à 1990. Lorsque Pierre Catala, parmi d’autres chercheurs, défendait les travaux de son Institut de recherche et d’études pour le traitement de l’information juridique (IRETIJ, aujourd’hui disparu30), il le faisait en plaidant pour l’étude de « phénomènes globaux, naguère inaperçus », faits « par-dessus tout de l’immense domaine du contentieux échappant au contrôle de la Cour de cassation » (Catala, 1994, p. 250). C’est pour alimenter cette étude des phénomènes juridiques souterrains qu’ont été construites les bases de données mécaniques, puis informatisées qui alimentent toujours aujourd’hui celles de LexisNexis31 – même si ces bases comme celles des autres structures de recherche de l’époque ne visaient pas l’exhaustivité et continuaient de lui préférer une sélectivité appliquée à l’ensemble des décisions de justice32. En dehors de ce mouvement doctrinal un peu oublié33, la sociologie juridique des mêmes années ne cherchait pas autre chose quand elle se donnait pour objectif l’« étude de la réalité sociale pleine du droit, en partant de ses expressions sensibles et extérieurement observables » (Gurvitch, 1986, p. 344), de « phénomènes juridiques » à la fois en tant que « phénomènes collectifs, sociaux » et « individuels » (Carbonnier, 2001, p. 415). Parmi ces phénomènes, les décisions des juges du fond encore profondément méconnues constituaient un terrain de choix – au travers, donc, des premières bases de données. C’est grâce à elle que l’on pouvait espérer « comprendre l’importance des jugements de fait et à travers eux ce qu’est la trame d’histoire vécue dans la vie juridique d’un peuple » puisque « sinon on ne la connaît pas, car les recueils du droit sont biaisés » (Terré, 1992, p. 160).
Au-delà de ces travaux doctrinaux passés, on doit surtout rappeler qu’il existe déjà des pôles et des équipes de recherche spécialisés dans l’analyse des décisions de justice du fond, qui exploitent y compris des méthodes empiriques. Ces pôles tirent parfois cette spécialisation de leur propre histoire34, mais ils sont aussi et surtout le fait d’initiatives récentes : c’est par exemple le cas du projet de recherche sur la Standardisation de la réparation du dommage corporel (SRDC) mené au sein de la Faculté de droit de Chambéry depuis 201535, qui a conduit à la création de la revue Jurimétrie en 202136, du projet Justice algorithmique des élections (JADE) mené à Grenoble depuis 202237 ou du projet approche empirique du droit de l’environnement (AEDE) mené à Toulouse depuis 202238.
Si l’on peut se réjouir de ces initiatives et leur tendance croissante à s’articuler les unes aux autres, il faut néanmoins admettre plusieurs choses. La première, c’est que toutes ces démarches et, plus généralement, celle consistant à se saisir et à analyser les décisions de justice du fond pour ce qu’elles ont de spécifique, commandent un travail de remise en perspective de l’analyse des sources juridictionnelles comme du phénomène juridique dans son ensemble. Les tensions perceptibles au sein du discours relatif à l’open data des décisions de justice sont précisément liées à cette mise en perspective : questionner la manière d’analyser le droit revient, insensiblement, à questionner ceux qui sont le mieux placés pour le faire. C’est d’autant plus vrai que, pour se saisir d’un objet aussi composite et massif que cet open data, une montée en compétences extra-juridiques est sans doute nécessaire et c’est déjà là un obstacle quand la plupart des juristes, même chercheurs, restent formés aux seules techniques et méthodes du droit en droit, centrées sur l’analyse sélective de décisions jugées intéressantes pour les règles qu’elles énoncent. Plus généralement, et c’est une seconde chose à admettre, l’histoire des approches alternatives du droit ne prête guère à l’optimisme. Si l’on considère que la manière de définir les bornes du phénomène juridictionnel à traiter, les modalités de son analyse et les résultats produits font partie intégrante du style de pensée sur lequel repose le collectif de pensée doctrinal français, alors c’est plutôt à la mesure que nous encourage une histoire faite de résistance à la contradiction (Fleck, 2008, p. 55 et suiv.). Il n’est pas acquis que l’open data remette en cause le paysage doctrinal français et il est encore discutable que cette remise en cause soit souhaitable. S’il est certain qu’il fournit des données d’autant plus accessibles aux mouvements, projets et initiatives qui promeuvent une compréhension et une appréhension du droit plus proche de sa pratique (ici contentieuse) et qu’ainsi il peut encourager des chercheurs à monter dans le train de ces travaux et à encourager leur développement, il ne faut pas oublier que ce n’est pas la première fois que ce type de train passe. Ce n’est pas non plus la première fois qu’il enclenche une crise quasi existentielle, sans finalement vraiment révolutionner le discours doctrinal français une fois passé39.
Si la doctrine académique française est un Sisyphe, peut-être faut-il donc l’imaginer heureuse, quoi qu’il arrive. Il serait en effet fautif de voir, derrière cette doctrine au singulier, l’illusion d’une doctrine unique. Sans pour autant en compter autant que d’auteurs, sans doute faut-il en imaginer au moins deux : celle qui continuera l’étude de ses objets coutumiers à l’aide de ses outils traditionnels et qui en tirera des conclusions toujours renouvelées, même si toujours un peu habituelles ; et celle qui, poussée à la curiosité, l’audace ou la révolution par ces nouveaux objets, cherchera à construire les voies, forcément étroites, nécessaires à leur analyse. Nous laissons celle-ci au bas de sa montagne, et au commencement de sa lutte (Camus, 2000, p. 168).