Les modèles de langage détectent les pertes de données et le bruit gaussien appliqués à leurs activations

Damiano Fornasiere*, Mirko Bronzi*, Spencer Kitts*, Alessandro Palmas, Yoshua Bengio†, Oliver Richardson†

Ce contenu scientifique est présentement disponible uniquement en anglais.