记者获悉,人工智能领域新型研发机构智源研究院正式发布原生多模态世界模型Emu3。据介绍,该模型实现了视频、图像、文本三种模态的统一理解与生成。Emu3采用了基于下一个token预测的多模态技术范式,释放其在大规模训练和推理上的潜力。(科创板日报)