Source : [[The Alignment Problem]]
MOC : [[Intelligence artificielle]]
Auteur : [[Brian Christian]]
Date : 2025-01-28
***
Tiré du très bon livre de Daniel Kahneman. En gros on a une pensée à deux vitesse. Pensée rapide : autopilote, réflexes, pas de décision conscience. Pensée lente : lourde charge cognitive, réflexion profonde. Eh bien, cela se réflète aussi dans le fonctionnement de certains modèles. Par exemple sur un jeu d'échecs, le modèle peut avoir une intuition de la qualité d'une position (% de chances de remporter la partie) et savoir immédiatement s'il y a un bon coup évident (une tactique) à jouer. C'est le "système 1" ou la pensée rapide. En parallèle, le modèle réfléchit aux différents coups *probables à* venir et à leur Q-Value, c'est le "système 2" ou pensée lente.