Ellen Hoffman | Media Lab – Jay van Zyl @ ecosystem.Ai

Study: Some language reward models exhibit political bias

Ellen Hoffman | Media Lab December 10, 2024 December 10, 2024

Research from the MIT Center for Constructive Communication finds this effect occurs even when reward models are trained on factual data.