DIAMOND (DIffusion as a Model of Environment Dreams): A Reinforcement Learning Agent Trained in a Diffusion World Model – MarkTechPost
DDIIAAMMOONNDD ((DDIIffffuussiioonn aass aa MMooddeell ooff EEnnvviirroonnmmeenntt DDrreeaammss)):: AA RReeiinnffoorrcceemmeenntt LLeeaarrnniinngg AAggeenntt TTrraaiinneedd iinn aa DDiiffffuussiioonn WWoorrlldd MMooddeell  MMaarrkkTTeecchhPPoosstt