La sécurité issue de l'honnêteté chez un prédicteur d'IA désintéressé (Safety from Honesty in a Disinterested AI Predictor)

Voir le PDF

Yoshua Bengio¹,²,³, Oliver Richardson¹,²,³, Tomáš Gavenčiak⁶,⁷, Michael Cohen⁴, Rory Svarc⁶, Damiano Fornasiere¹,³, Gaël Gendron¹, David Hyland⁸, Aton Kamanda¹, Adam Oberman¹,⁵, Francis Rhys Ward¹, Anna Gavenčiak⁶, Jacob Livingston Slosser⁶,⁹, Vincent Mai¹, Iulian Serban¹, Joumana Ghosn¹

¹LawZero, ²Université de Montréal, ³Mila, ⁴University of California, Berkeley, ⁵McGill University, ⁶Arb Research, ⁷Center for Theoretical Study, Charles University in Prague, ⁸University of Oxford, ⁹Sapien Institute

02 07 2026

Ce contenu scientifique est présentement disponible uniquement en anglais.

La sécurité issue de l'honnêteté chez un prédicteur d'IA désintéressé (Safety from Honesty in a Disinterested AI Predictor)

Vous souhaitez rejoindre notre équipe?

Écrivez-nous