DeepMind科学家Jon Richens在ICML 2025上发表的论文指出,任何能够泛化到多步目标导向任务的智能体,必然已经学习了其环境的预测模型。这个模型可以从智能体的策略中提取出来;而要提升智能体的性能,或让其完成更复杂的目标任务,就必须学习更精确的世界模型。(36氪)
DeepMind科学家Jon Richens在ICML 2025上发表的论文指出,任何能够泛化到多步目标导向任务的智能体,必然已经学习了其环境的预测模型。这个模型可以从智能体的策略中提取出来;而要提升智能体的性能,或让其完成更复杂的目标任务,就必须学习更精确的世界模型。(36氪)