Source : [[The Alignment Problem]]
MOC : [[Intelligence artificielle]]
Auteur : [[Brian Christian]]
Date : 2025-01-28
***
L'imitation reste un moyen très utilisé aujourd'hui pour apprendre quelque chose à un modèle. Exemple en robotique où il faut des jeux de data gigantesques pour reproduire la complexité d'un mouvement articulé. L'imitation est très efficiente, en revanche le problème est que le modèle n'apprend pas à faire face aux situations qui sortent des sentiers battus. Il n'apprend notamment pas à corriger le tir et à se remettre d'éventuelles erreurs.