Avons-nous besoin de moteurs de réponse pour la recherche juridique ?

Avons nous besoin de moteurs de réponse pour la recherche juridique ?

Cet article est une collaboration avec les animateurs du Lab Juriconnexion, Emilie Viard et Mohamed Aït Sidi Hammou. Je les remercie chaleureusement pour avoir partagé nos réflexions et expériences.

Je remercie également vivement Pascal Alix, Emmanuel Barthe, Christophe Deschamps, Bénédicte Baudot Soubrane et Carole Guefucci, dont la lecture des articles a nourri mon travail.

Il est inspiré et développé à partir d’une interview que j’ai donnée à Elodie Teissèdre pour l’Augmented Law Institute de l’EDHEC en Novembre 2025.

Les positions exprimées ici sont personnelles et n’engagent pas l’entreprise pour laquelle je travaille.

Ces derniers mois, on voit apparaître dans la littérature professionnelle et dans la communication des éditeurs juridiques l’expression « Moteur de réponses ». Cette expression suggère que l’IA apporte aux moteurs de recherche une efficacité que le big data juridique commençait à mettre en péril. Que faire en effet des « + de 500 résultats » que l’on obtient lorsque l’on recherche de la jurisprudence ou de la doctrine sur une notion juridique ?

Qu’à cela ne tienne ! On a bientôt affirmé que l’IA allait mettre un terme à cette profusion confuse pour l’ordonner en réponses prêtes à l’emploi.

Mais est-ce bien la solution qu’attendent les professionnels du droit qui interrogent des bases de données pour nourrir leur réflexion ?

Quels sont les critères de sélection des informations sur lesquelles s’appuient les réponses des IA ? Quels « raisonnements » étayent ces réponses ?

Une très brève histoire des bases de données juridiques.

Depuis les années 90, la pratique professionnelle des documentalistes et bibliothécaires juridiques s’est profondément transformée, d’abord par l’émergence de sources d’informations en ligne privées, avec des bases de données des éditeurs juridiques évoluant de fonds cloisonnés (documents parlementaires et textes législatifs et règlementaires d’une part, jurisprudence par ailleurs, et doctrine d’une autre part) vers des plateformes web mutualisées. Les listes de réponses mêlent désormais les documents en réponse mais proposent néanmoins des filtres en différentes catégories : jurisprudence, textes législatifs et réglementaires, encyclopédies et ouvrages doctrinaux, revues qui apportent des commentaires doctrinaux, et des filtres de dates. Ces filtres se sont affinés ces dernières années pour permettre de sélectionner des juridictions ou des autorités administratives précises.

Le développement du web 2.0, le web sémantique, a constitué une nouvelle étape d’évolution de nos outils de travail. Les éditeurs juridiques nous ont alors proposé des moteurs de recherche améliorés par la suggestion de termes de recherche, par des flexions qui permettent la recherche de termes de la même famille sans avoir à expressément saisir ces termes dans la question posée.

Et cette décennie 2020 apporte un nouveau tournant majeur avec l’irruption d’outils d’IA d’abord algorithmiques puis conversationnels, et actuellement agentiques, qui chamboulent l’appréhension de l’information, tant professionnelle et privée.

L’irruption de l’IA dans le monde de l’édition juridique.

Dès 2023, les éditeurs juridiques ont communiqué sur leur manière de s’approprier l’IA, soit en proposant rapidement des outils en construction, soit en partageant avec leurs auteurs et leurs clients des réflexions.

La convergence entre ouverture des fonds de jurisprudence dès 2018 [1] – du big data par excellence ! – et l’émergence de l’IA conversationnelle ont bouleversé le marché de l’édition juridique française.

Lefebvre Dalloz a été pionnier avec les travaux de Sumi Saint-Auguste, sa directrice de la prospective, et Michael Benesty, alors directeur du développement IA chez Dalloz, qui ont permis la création de Gen-IA-L for Search. Lexis Nexis a également proposé rapidement des outils, avec un retour d’expérience des pratiques américaines du groupe. Lexbase s’est distingué en proposant un « shazam du droit » selon les termes de Fabien Girard, son président, et de Fabrizio Papa Techera, qui a longtemps guidé les développements d’outils d’IA, permettant d’identifier 5 arrêts se rapprochant d’une situation concrète décrite dans un échange de prompts. Puis Lamy Liaisons et Lextenso ont aussi présenté leurs solutions.

Avec l’ouverture des fonds de jurisprudence, des start-up ont joué leur carte, parfois en franchissant les lignes du cadre juridique comme en a témoigné le contentieux, qui a opposé de 2019 à 2025, plusieurs éditeurs à Doctrine. Ordalie et Pappers ont aussi joué le rôle d’outsiders de talent. Et le monde des start-up juridiques est en pleine expansion avec des solutions diverses et innovantes.

Les sites publics ne sont pas en reste avec l’usage de l’IA par la Cour de cassation pour la pseudonymisation des décisions de l’ordre judiciaire publiées dans Judilibre [2], ou des évolutions sur legifrance.gouv.fr ou service-public.fr pour mieux appréhender les besoins des citoyens.

Par ailleurs, nos traditionnelles interrogations sur le fondement des opérateurs booléens – ET OU SAUF – et des opérateurs de proximité semblent de plus en plus supplantées, au profit de prompts, de questions en langage naturel, qu’il faut savoir contextualiser, dérouler étape par étape, en y développant les notions implicites, voire multiplier pour contrôler la cohérence des réponses de l’outil d’IA utilisé en l’interrogeant sur différents angles.

Dans leurs réflexions croisées sur la pertinence publiées dans le blog de Carole Guelfucci, Serendipidoc, en février 2026, Carole Guelfucci et Bénédicte Baudot-Soubrane [3] soulignent que si l’on peut tirer parti de l’usage concomitant de la recherche booléenne et des moteurs de recherche enrichis de fonctionnalités IA, il n’en reste pas moins que « la vraie limite des propositions de « pertinence » par une IAG, est donc que les critères ne sont ni identifiables, ni vérifiables, ni modifiables, parce qu’ils sont générés « à la volée » sur une base probabiliste et corrélative – même si certains éléments de pondération dans les IAG s’affinent au fil du temps. »

Et si les IA, algorithmiques, conversationnelles et agentiques [4], s’avèrent de puissants outils pour appréhender et traiter du big data juridique – sous condition que celui-ci soit organisé en corpus structurés – il n’en demeure pas moins que le droit traite de situations aux forts enjeux humains : application d’une peine en cas d’infraction, recrutement de salariés, exercice d’un droit selon des critères évalués à partir d’une situation personnelle.

Toutes ces situations, encadrées de règles essentielles, constitutives de la démocratie et du principe d’égalité des citoyens devant la loi, faisaient jusqu’à présent l’objet d’une analyse humaine. La tentation est grande d’y mêler des outils d’IA, notamment en matière de recrutement. Et le résultat est parfois discriminatoire ou faussé, comme le souligne un article de Caroline Talbot dans le Monde du 6 avril 2026 [5], qui décrit une action de groupe menée aux Etats-Unis à l’encontre de l’éditeur du logiciel RH WorkDay, qui opérait des collectes de données personnelles, sans information ni autorisation des intéressés, et utilisées pour discriminer des candidats.

Il est essentiel de se rappeler que le mot « Intelligence » dans l’expression « Intelligence artificielle » est utilisé dans un sens anglo-saxon visant un rapprochement d’informations pour en tirer des observations et non au sens français de capacité cognitive de compréhension.

Ainsi, malgré leur entrainement, et leur « fine tuning », les IA maitrisent-elles les formes de raisonnements juridiques, inhérents au droit écrit : a contrario ou a fortiori, in concreto ou in abstrato, inductif ou déductif ? Dès octobre 2023, le Professeur Dupichot soulignait dans une table ronde du salon parisien Transfodroit [6], que les IA entrainées plutôt dans un contexte de Common Law à l’origine, notamment pour OpenAI, le plus puissant des LLM qui a été utilisé par la plupart des éditeurs juridiques en France, étaient familiarisées avec le raisonnement inductif – partir de nombreux précédents pour en induire une règle – plutôt que déductif, se fondant sur la recherche de la règle applicable à une situation de fait après une opération intellectuelle de qualification juridique.

Chercher et veiller avec de l’IA ?

Face à la profusion de nouvelles fonctionnalités et de nouveaux produits liés à l’IA, les documentalistes juridiques ont renforcé leur rôle d’expert et de médiateur entre éditeurs et praticiens du droit, qu’ils soient avocats, magistrats, enseignants ou juristes. Nous testons, évaluons l’apport et l’adéquation aux besoins concrets des solutions proposées par les éditeurs.

Dans ce contexte, se former et mener une veille pour comprendre les différentes formes d’IA existantes et celles qui se développent : algorithmique, conversationnelle, agentique telle que la présente Bruno Deffains [7] et ainsi appréhender leurs enjeux juridiques devient indispensable pour la pratique du droit, quel qu’en soit le cadre, à l’université, en cabinet, en juridiction ou en entreprise. Car chaque stade de développement de l’IA soulève de nouvelles questions juridiques, une forme de fonctionnement avec un degré d’intervention et de contrôle humain différent, donc une appréhension de la responsabilité des utilisateurs de ces formes d’IA différente.

Et si l’IA agentique se révélait également être un outil pour automatiser notre veille dans un monde où les masses d’informations à traiter sont hors d’atteinte des « human skills » ou simplement des capacités cognitives humaines ?

Christophe Deschamps, formateur en veille informationnelle et fin observateur de l’évolution de nos pratiques métier, décrit ainsi dans un article du 18 février 2026 l’apport de l’IA agentique à la veille [8] :

« L’IA agentique ne se contente plus en effet de produire un résumé quand on le lui demande, elle peut identifier un besoin, planifier une stratégie de recherche, aller chercher l’information dans plusieurs sources, et mettre à jour une base de connaissances, le tout de manière autonome. Nous n’en sommes qu’aux premières implémentations, mais la trajectoire est claire. »

Christophe Deschamps y décrit un processus qui tend à créer nos « jumeaux numériques » de veille, soit des agents qui tracent nos requêtes, prompts et alertes, ainsi que nos habitudes de consultations quotidiennes d’informations, pour les mémoriser et les traduire en actions de veille.

Il y explique le MCP (Model Context Protocol), un nouveau standard des producteurs d’IA, qui permet de récupérer les contenus structurés sur lesquels les IA sont entrainés de manière dynamique, sans reconfiguration par intervention humaine.

Ce dispositif très puissant, inauguré fin 2024 par Anthropic, la société créatrice de Claude, est désormais adopté par OpenAI, Microsoft et Google, et aussi par un éditeur juridique français comme Lexbase [9] et une legal tech comme Pappers [10].

Ce dispositif pourrait conduire à associer des contenus de données juridiques publiques, incontournables dans le travail des métiers du droit quels qu’ils soient, et des données juridiques internes (contrats, cours, présentations, notes thématiques, webinaires…) créant ainsi de fortes synergies pour les utilisateurs de solutions d’IA internes.

Cela représente également une formidable opportunité de développer des RAG (Retrieval Augmented Generation ou Génération augmentée par récupération) propres à une structure qu’elle soit publique ou privée, et également de développer des solutions souveraines. Dans le contexte géopolitique très troublé que nous connaissons, cette possibilité de développer des fonds de données souverains, c’est-à-dire des fonds de données qui soient stockés et régis par les lois des pays dans lesquels ils sont créés et utilisés, serait une carte maîtresse pour ces dispositifs de MCP.

Conclusion.

Comme souvent en ce qui concerne l’IA, il est périlleux de tirer des conclusions définitives sur des outils et des techniques en évolution permanente. Les évolutions sur ces derniers mois des outils avec le MCP et les agents et combinaison d’agents d’IA le montrent.

L’IA est devenue, de manière évidente, une composante des outils des avocats, magistrats, juristes et documentalistes juridiques.

Mais il est essentiel de souligner qu’une recherche juridique n’est pas seulement une recherche d’éléments d’information. C’est également le déroulement d’un raisonnement juridique que l’on traduit en questions, et dont on articule les éléments de réponses. Cela peut être une seule question ou plusieurs questions successives.

Traduire ces questions successives dans un ou plusieurs prompts pourrait sembler une nette amélioration de l’outil de recherche d’informations juridiques, surtout si l’outil d’IA s’appuie sur un corpus de données structurées dans un MCP.

Toutefois, la présentation des résultats en texte prérédigé, même si les sources y sont citées, ne permet pas le contrôle du cheminement de « raisonnement » de l’outil d’IA, essentielle dans la pratique du droit…sans compter que l’IA continue à faire de sérieux contresens dans la « lecture » des décisions de justice, ainsi que l’a montré une étude américaine sur les allégations de « non-hallucination » des bases de données juridiques nord-américaines, publiée il y a un an [11].

Aussi, le bon protocole d’usage de l’IA par des professionnels du droit, quels que soient leurs métiers, passe par des recherches sur des outils classiques de références académiques, par l’interaction de réflexions et de vérifications humaines et de traitement par l’IA, et pas exclusivement par l’usage d’outils d’IA, comme l’explique très clairement l’avocat et enseignant Pascal Alix dans une publication toute récente [12].

La raison d’être de editionsefe.fr est de trouver en ligne des communiqués autour de Edition Juridique et les présenter en s’assurant de répondre au mieux aux interrogations des gens. Le site editionsefe.fr vous propose de lire cet article autour du sujet « Edition Juridique ». Cette chronique se veut reproduite du mieux possible. Vous avez la possibilité d’envoyer un message aux coordonnées fournies sur le site dans le but d’indiquer des explications sur ce texte sur le thème « Edition Juridique ». Dans peu de temps, nous publierons d’autres informations pertinentes autour du sujet « Edition Juridique ». Cela dit, visitez régulièrement notre site.