New research shows AI models deceive humans more effectively after RLHF
NNeeww rreesseeaarrcchh sshhoowwss AAII mmooddeellss ddeecceeiivvee hhuummaannss mmoorree eeffffeeccttiivveellyy aafftteerr RRLLHHFF