【英俊的车车报道】2025年6月6日,第七届“北京智源大会”在中关村展示中心开幕。
北京智源大会是智源研究院主办的“AI内行学术盛会”,以“全球视野、思想碰撞、前沿引领”为特色,汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。2025北京智源大会邀请到了图灵奖得主、深度学习代表人物Yoshua Bengio,图灵奖得主、强化学习之父Richard S. Sutton,图灵奖得主Joseph Sifakis、姚期智,Google、DeepMind、Meta、Mila、Physical Intelligence、MIT、斯坦福、UC Berkeley、Linux基金会等国际明星机构与技术团队代表,华为、百度、字节跳动、腾讯、阿里等互联网大厂以及智谱、宇树科技、生数科技、面壁等30余位AI公司创始人、CEO,同时,大会还汇聚了100余位全球青年科学家、200余位人工智能顶尖学者和产业专家,围绕多模态、深度推理、下一代AI路径、Agent智能体、具身智能、AI4S、AI产业、AI安全、AI开源展开精彩演讲和前瞻性对话。
开幕式由智源研究院理事长黄铁军主持
智源研究院院长王仲远做2025研究进展报告,发布智源研究院在大模型前沿技术路径的探索成果
在2025北京智源大会上,继“悟道”系列大模型之后,智源研究院推出“悟界”系列大模型,其中,“悟道”的“道”代表智源对大语言模型系统化方法和路径的探索,“悟界”的“界”代表虚实世界边界的不断突破。“悟界”系列大模型承载的是智源对人工智能从数字世界迈向物理世界的技术趋势的判断。
“悟界”大模型系列,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型见微Brainμ、跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0以及全原子微观生命模型OpenComplex2。
Emu3作为原生多模态统一架构让大模型具备理解和推理世界的能力,Brainμ基于Emu3架构,引入脑信号这一新的模态数据,实现了单一模型完成多种神经科学任务的大一统。多模态与脑科学模型未来可成为人机交互具身场景下的基础模型。RoboOS 2.0与RoboBrain 2.0在初代版本基础上,原有性能大幅提升,并新增多机协作规划与物理常识驱动的空间推理能力。OpenComplex2可在原子分辨率层面捕捉分子相互作用及平衡构象,探索微观构象波动与宏观生物功能的跨尺度关联。
智源作为非营利科研机构,一直坚持开源开放的原则,智源打造的覆盖模型、算法、数据、评测、系统的大模型开源技术体系FlagOpen,截至目前,已开源约200个模型和160个数据集,其中,模型全球总下载量超6.4亿次,开源数据集下载量近113万次,开源项目代码下载量超140万次,为人工智能技术普惠与开源社区繁荣做出持续贡献。
其中,开源、统一的 AI 系统软件栈 FlagOS进一步升级,新增统一编译器FlagTree、统一通信库FlagCX、自动发版平台工具FlagRelease等重要板块,全面覆盖统一生态技术需求;实现对11家国内外厂商的18款异构AI硬件的统一支持;FlagGems的算子平均性能已优于国际主流算子,并行训推框架FlagScale与人工优化相比,实现了最高23%的自动并行加速。升级后的FlagOS已支持DeepSeek、通义千问等更多开源大模型实现跨硬件平台运行,为开发者提供更多选择,推动 AI 技术的普及和多元发展。
本届智源大会,设置了智源研究院AI科研成果互动体验展台,带来了从具身智能到脑科学、数字心脏等领域的最新应用。此次“悟界”系列大模型中的脑科学多模态通用基础模型见微Brainμ以及跨本体具身大小脑协作框架RoboOS 2.0与具身大脑RoboBrain 2.0也进行了现场展示。
在具身智能展区,基于RoboOS 2.0以及RoboBrain 2.0的不同构型的机器人(单臂、轮式双臂、人形)带来了丰富的技能展示,包括餐饮互动,机器人接受到语音指令后,完成汉堡制作和倒饮料的动作,以及抓娃娃的游戏和家居物品收纳。此外,基于智源自主研发的多模态具身大模型的机器人,融合了视觉、听觉、思考、语音交互等能力,带来了“心有灵犀”的互动小游戏,机器人可对看见的物品进行详细描述,互动者依据信息线索猜出对应的物品名称。智源与银河通用联合研发的具身大模型机器人Galbot,展示了商超场景下的落地应用能力。
在脑科学多模态通用基础模型展区,展示了Brainμ在脑科学基础应用与临床应用上的实际案例以及AI+脑科学未来基础研究与临床应用的新范式。同时,通过与脑机接口设备结合,Brainμ可根据采集的脑信号数据进行信号解析与感觉刺激重建,利用多模态大模型的能力在消费级便携式脑电设备上实现了接近医用级设备数据采集的稳定解析能力,Brainμ模型展现了降低脑机接口应用在消费级设备的门槛的能力,可以为便携式脑机接口的应用拓展空间。
基于2024年研发的全球首个数字孪生心脏,智源推出了全球首个高速跨尺度心脏药物安全性评价平台,构建了跨尺度药物-心脏作用模型,覆盖从亚细胞(离子通道),到细胞、组织、器官与人体,可以全尺度评测药物对心脏电活动的影响,评测药物心脏毒性,将全尺度药物毒性仿真时间由近90天减少到一天之内,为药物仿真平台实际应用提供坚实支撑。
在数字心脏展区,可通过裸眼3D透明心脏以及VR互动沉浸体验基于医学影像重建的心脏三维结构,通过操控笔可精准完成心脏模型的旋转、拉伸与层析切片操作。未来,将实现对心脏电生理过程的动态仿真交互,为精准医疗与个性化干预提供技术支撑。在裸眼3D提供宏观交互的同时,也进一步构建了基于虚拟现实的沉浸式系统,实现对心脏内部结构的深度探索与术式模拟。佩戴VR头显,可沉浸式进入心脏内部,进行类内窥镜式的结构观察。通过手柄精准定位,用户可选定刺激区域,模拟电生理手术中的干预操作。该系统为心脏术前智能规划提供了高度可视化与交互性的研究平台,为数字孪生心脏在临床应用中的落地奠定了坚实基础。
基于心冲击信号(Ballistocardiograph,BCG)研发的无感智能坐垫系统,可对多项生理指标进行高精度实时监测与智能分析。落座后,系统通过内嵌的高灵敏度传感模块,精准捕捉由心脏搏动引发的微弱体动信号,并同步完成心动周期识别。在完成有效数据采集后,系统调用信号分析算法,进入健康状态评估阶段,计算心率、心率变异性、呼吸频率等指标。根据这些指标,可对疲劳程度、精神压力、情绪状态进行量化评估,并辅助识别房颤等心律异常状态,在个人健康管理、智能家居与智能医疗决策中具有广泛的应用前景。
大会期间,智源研究院与北京大学第一医院签署战略合作协议,本着优势互补、资源共享、协同创新的原则,充分发挥双方在人工智能技术研发与工程落地的多元能力以及临床诊疗、教学科研与医学数据资源的专业优势,共同在“智慧医学系统”领域开展深入、系统、持续的战略合作。
此外,大会上还宣布了智源研究院与香港投资管理有限公司建立战略合作框架,共建世界级跨区域合作的人工智能生态圈。智源与港投的合作将加速人才、技术、资本的飞轮效应,构建内地、香港、国际的人才循环体系,汇聚全球人工智能青年人才、支持人工智能创新创业、加速人工智能产业全球化。
从“悟道”到“悟界”,智源研究院始终走在技术路线探索的前沿,积极构建开源开放的技术生态,未来,智源研究院将持续解构物理世界与智能本质的深层关联,在通用人工智能的征途中刻下新的坐标。