Votre IA semble sûre d’elle, mais ça ne veut pas dire qu’elle a raison.

Votre IA semble sûre d’elle, mais ça ne veut pas dire qu’elle a raison.

Vous avez probablement déjà vécu ceci : vous posez une question à une IA, elle vous répond de façon claire, assurée et bien structurée, et vous réalisez plus tard qu’elle a tort. Aucune hésitation, aucune nuance, juste une erreur, livrée comme si elle en était parfaitement certaine. Si vous insistez un peu, elle vous dira qu’elle a halluciné.

Tu as tout à fait raison


Ce n’est pas un hasard, et vous n’êtes pas le seul à qui ça arrive. C’est une conséquence directe de la façon dont l’IA est conçue aujourd’hui. Ce qui est troublant, c’est que l’IA ne vous donne aucun signal lorsqu’elle franchit la ligne entre la réalité et la fiction. Le ton reste calme, le style demeure soigné, les formules restent engageantes, et le résultat est le même, qu’elle ait raison ou qu’elle invente.

Pourquoi est-ce important ?


Vous ne travaillez peut-être pas en droit ni en médecine. Mais vous utilisez sans doute l’IA pour rédiger des courriels, effectuer des recherches avant un achat, aider vos enfants dans leurs devoirs ou vous familiariser avec un sujet que vous ne maîtrisez pas. Chaque fois, vous tenez pour acquis que la réponse est fiable.

Le hic, c’est qu’une IA peu fiable n’a pas l’air peu fiable. Il n’y a aucun avertissement, aucune mise en garde, aucun changement de ton lorsqu’elle passe d’un fait réel à un fait inventé. L’assurance reste constante. C’est exactement ce qui rend l’erreur si facile à manquer, et si difficile à repérer par soi-même.

Pourquoi cela se produit-il ?


La raison est plus simple qu’on pourrait le croire. L’IA d’aujourd’hui est entraînée à imiter les humains et à plaire. Elle n’est pas entraînée à dire la vérité mais à faire sembler d'avoir raison. Lorsqu’on lui pose une question, elle ne cherche pas la réponse, elle prédit, mot après mot, ce que serait une réponse humaine convaincante.

La plupart du temps, la réponse la plus convaincante est véridique. Alors ça fonctionne. Mais quand l’IA ne sait pas, elle ne se tait pas et ne dit pas « je ne suis pas sûre » ; elle produit quelque chose qui semble tout aussi convaincant, car c’est la seule chose pour laquelle elle a été conçue. Elle n’a aucun moyen de distinguer ses vraies réponses de celles qu’elle invente, parce que personne n’a jamais appris à votre IA à faire la différence.

Cela explique aussi quelque chose de surprenant : les modèles plus récents et plus puissants ne deviennent pas automatiquement plus dignes de confiance. Pour mieux « parler comme un humain », ils apprennent à s’exprimer correctement, même lorsqu’ils commettent des erreurs.
 

Plus qu’une bizarrerie propre aux robots conversationnels


Ce phénomène apparaît dans les outils sérieux sur lesquels les gens comptent, pas seulement dans les conversations anodines. Des chercheurs de Stanford ont testé les outils de recherche d’IA qu’utilisent quotidiennement les avocats, ceux vendus par LexisNexis et Thomson Reuters et présentés comme pratiquement sans erreur. Ces outils ont donné des réponses incorrectes ou non fondées entre 17 % et 33 % du temps. L’étude a été révisée par les pairs et publiée dans une grande revue juridique.

En médecine, une équipe du Mount Sinai a mené une expérience révélatrice. Elle a glissé un détail fictif, un symptôme inventé ou un test de laboratoire inexistant, dans des descriptions de patients par ailleurs normales. Elle a ensuite demandé leur avis aux grands modèles d’IA. Au lieu de repérer l’erreur, les modèles l’ont reprise dans environ deux tiers des cas, développant leur argumentaire avec assurance sur quelque chose qui n’avait jamais été vrai. Ces travaux ont été publiés dans Communications Medicine, une publication révisée par les pairs de la famille des revues de Nature Portfolio.

Et dans le magasinage de tous les jours, des chercheurs de l’UC San Diego se sont penchés sur les outils d’IA qui résument les avis des clients. Dans plus du quart des cas, les résumés modifiaient discrètement le ton général, faisant paraître les produits meilleurs ou pires que ce que disaient les avis. Lors d’un test avec des participants, le comportement des consommateurs a changé : ils étaient 32 % plus susceptibles de vouloir acheter un produit après avoir lu le résumé de l’IA qu’après avoir lu les avis réels.

Ce ne sont pas des questions pièges conçues pour déjouer l’IA. Ce sont des tâches ordinaires, et le même schéma se répète chaque fois.

Corriger le problème ne le résout pas forcément
 

Corriger le problème


L’approche habituelle de l’industrie consiste à bâtir le système le plus performant possible, après quoi les entreprises ajoutent des mesures de sécurité : vérification des faits, scores de confiance, révision humaine et filtres.

Ces mesures aident et permettre de détecter certaines erreurs. Mais elles ne changent rien au comportement fondamental des modèles. Au fond, l’IA reste conçue pour paraître convaincante, et les correctifs sont ajoutés après coup. Un nombre croissant de chercheurs affirme que la fiabilité ne peut pas être « ajoutée ». Elle doit être intégrée dès la conception.

Une autre façon de développer l’IA


C’est l’idée derrière le travail mené chez LoiZéro : la sécurité intégrée dès la conception (« safe-by-design »). Plutôt que de bâtir un système d’abord brillant et fiable ensuite, pourquoi ne pas le rendre fiable dès le départ ?

L’IA-Chercheur, développée chez LoiZéro, repose sur deux principes simples qui confèrent au modèle fiabilité et honnêteté.

- Elle évalue les informations en fonction de leur source
La grande majorité des IA considèrent presque tous les contenus qu’elles trouvent comme véridiques, qu’ils proviennent d’une étude rigoureuse ou d’une publication aléatoire sur Internet. L’IA-Chercheur remonte à la source et évalue les preuves, au lieu de simplement répéter une déclaration ou une idée qu’elle a vu le plus souvent.

- Elle ne cherche pas à vous plaire 
La plupart des IA apprennent en fonction de l'appréciation que les gens portent à leurs réponses, et finissent peu à peu à vous dire ce que vous voulez entendre. L’IA-Chercheur ne bénéficie d’aucune réponse de ce type. Sa seule mission est d'être précise, de comprendre le monde, et non de vous séduire. L'objectif est de créer un système véritablement intelligent, mais qui n'a aucune raison de manipuler, de flatter ou de poursuivre des intentions cachées.

Rien de tout cela n’est que de la théorie : LawZéro publie déjà des recherches et est en cours de développer un modèle. L’idée est simple : l’IA peut être à la fois performante et fiable, et il vaut la peine de bien faire les choses avant que nous en venions tous, sans nous en rendre compte, à dépendre d’une IA qui ne l’est pas.

Sources:

Legal research tools study — Stanford RegLab, Journal of Empirical Legal Studies (2025): https://onlinelibrary.wiley.com/doi/full/10.1111/jels.12413

Medical hallucination study — Mount Sinai, Communications Medicine (2025): 
https://www.nature.com/articles/s43856-025-01021-3

Review-summary study — UC San Diego, IJCNLP-AACL (2025): https://aclanthology.org/2025.ijcnlp-long.155/