打开APP
专访普林斯顿王梦迪:让AI加速一切工程创新|甲子光年
甲子光年
2024-09-12 14:46:27

用生成AI加速探索,用控制和强化学习的方式更巧妙地试错。

作者|田思奇‍‍

编辑|王博

近300年的历史里,普林斯顿大学凭借深厚的文理和政商积累,培养了多位诺贝尔奖得主和美联储主席。不过在大约十年前,普林斯顿大学进一步洞察到工程学科的巨大潜力。计算机、人工智能与更广泛的工程学科,正在这里交汇成一股推动社会发展的全新力量。

2024年夏天,普林斯顿的AI雄心迎来新的里程碑——AI加速创新中心(AI for Accelerating Invention)正式成立,简称为AI平方(AI²),由电气与计算机工程系兼统计与机器学习中心教授王梦迪和计算机系教授Ryan Adams担任联合主任。

“我们中心的目标,并不只是单纯地加速研发进程,更重要的是实现从0到1的创新。”王梦迪的话语中透露出坚定与自信。她指出,通过人工智能技术,无论是芯片设计、药物研发,还是可控核聚变,以及今年大热的具身智能和人形机器人领域,都将迎来前所未有的突破。“人工智能不再是单一学科的专属。”

年仅35岁的王梦迪,现任普林斯顿大学AI for Accelerating Invention创始人,普林斯顿电子工程系、计算机系、生物工程研究院教授,她的学术经历至今仍在教育圈传为佳话:14岁从北京八中少年班考上清华自动化系,24岁获得麻省理工学院博士学位,29岁成为普林斯顿当年最年轻的tenure(终身教职)获得者。

今年4月,王梦迪团队在《自然-机器智能》期刊上发表了世界首个解码mRNA非翻译区域序列的大模型;7月,王梦迪获得美国自动控制委员会颁发的Donald Eckman奖。这是控制领域的最高奖项之一,每年仅颁发给一位获奖者。

在过往众多有意义的瞬间中,最让王梦迪高兴的是,在AI for Accelerating Invention的开幕活动当天,她组里的在读博士学生黄凯旋也获得了AI领域博士生能拿到的最高荣誉:谷歌机器学习博士奖学金。“我自己一直在具有很大自由度的环境里成长,所以也希望给予学生足够的支持与自由,让他们成为具有独立思考能力的研究者。”

在刚刚完成普林斯顿开学迎新活动后的一个上午,王梦迪接受了「甲子光年」的专访,详细介绍了AI在工程“设计” (Design)“模拟” (Simulation)“制造” (Manufacturing)“控制” (Control) 等环节的应用。同时她描述了自己所认为的,最有可能实现突破的年轻AI研究者的模样。

以下为全部采访内容,经过编辑整理。

1.用AI撬动其他高精尖领域

甲子光年:先请你介绍一下普林斯顿大学的AIfor Accelerating Invention。看到你在朋友圈说,这个中心首次举行正式活动的那天是你这半年最高兴的一天。它的成立背景是什么?

王梦迪:两年前,ChatGPT的出现给人们带来了极大的震撼。过去大家通常将人工智能视为一个独立的学科。近一两年来,包括普林斯顿在内的一些学校迅速认识到人工智能不仅仅是一个学科或研究方向,它像工业革命和互联网革命一样,正形成一股巨大的浪潮,把各个方向都裹挟进去。在这样的背景下,普林斯顿大学开始思考如何推进人工智能的发展。

许多传统的常青藤高校逐渐意识到,在人文政治学科外,工程学科拥有更大的推动社会变革的力量。普林斯顿大学很早就深刻地理解了这点,从10年前就开始布局,全面转向工程学科,这是更大的背景。

甲子光年AIfor Accelerating Invention的成立过程和愿景是什么?

王梦迪:我们AI科研工作者的抱负不仅限于当前的单一方向,比如单独的语言模型或计算机视觉。我们致力于探索如何最大限度地利用人工智能技术,撬动其他最高精尖的,以工程学科为主的高端科技的未来发展。这不仅是我们中心的目标,也是普林斯顿大学在把握科学发展方向的总体战略。在招聘新的年轻教授时,我们也会从这一角度出发,这可以算是工学院乃至全校的战略性规划。

经过一系列的思考和布局,从我们中心最初的想法到最终成立,整个过程大约持续了两三年时间。在最近半年到一年的时间里,我们完成了大量具体的工作,包括规划中心的发展方向,寻找并组织对中心工作感兴趣的校内教师。去年,我也参与了新泽西州在AI领域的州级布局(New Jersey AI Hub)讨论,并且与学校的基金以及负责资金筹集的部门沟通,以便他们了解我们的计划并协助外部融资。

中心正式成立是在今年夏天7月,首次正式活动在8月29日举行。我们邀请了大约10位普林斯顿大学不同领域的顶尖科学家,分享他们工作中最有趣的部分,以及AI可能带来突破的领域。这次活动是AI for Accelerating Invention正式的第一次活动。

甲子光年:在普林斯顿介绍AI研究的网页上还有另外两大研究中心: Language and Intelligence和Natural and Artificial Minds。它们和AI for Accelerating Invention是并列的吗?

王梦迪:是的, Language and Intelligence就是专注于大语言模型的研究中心,由Sanjeev Arora牵头,另一个Natural and Artificial Minds是神经科学和AI的交叉研究中心,由Tom Griffiths牵头。普林斯顿有非常强势的神经科学积累,所以也希望通过深度学习框架做一些探索,同时找寻更新的机遇。

甲子光年:筹备中心的3年里,最大的挑战是什么?

王梦迪:我不认为存在特别具体的执行层面的困难,但主要挑战可能来自于寻找不同背景的支持者,包括学校的领导、新泽西州内的支持、捐赠者、跨学科的合作者等,每个人对人工智能都有不同的理解。

可能在两年前,大多数人还不关注人工智能这个概念,只当作是一个普通的科研方向。即使在一年前,更多人开始注意到人工智能,但对于可以做哪些事,是否要跟进这个浪潮,大家都还没有明确的想法。近两年人工智能的发展迅速,确实起到了非常有力的科普作用。大家已经逐步完成思想和认知上的对齐过程。

甲子光年AI是如何在工科的各个环节上发挥作用的?

王梦迪:所有工科的四件事:设计、模拟、制造和控制。在设计方面,AI可以应用于各种设计任务,例如芯片设计,蛋白质设计,CAD设计图的生成。在模拟环节,AI能够进行复杂的模拟工作,如核聚变反应堆中等离子体的状态轨迹模拟,同时在VR、机器人、游戏和视频生成等领域,你可以都把它理解成泛化的模拟,这也是AI能做的事情。

制造是第三个环节,其中AI可以协助解决多机器人协同作业的问题,这涉及多智能体强化学习。再比如3D打印技术将设计和制造紧密结合,AI在此过程中还可以提高制造精度,实现前所未有的制造质量。

最后是控制环节,比如复杂的机器人系统、车队系统或大规模电网系统的实时协同运作。如何利用多元输入信息,如天气数据、环境数据,来提高控制系统效率,这些都是工业控制问题的重要问题,也是AI技术可能产生突破的方向。

甲子光年:所以不再严格按照学科划分AI可以做什么,而是按照不同的任务。

王梦迪:我们希望找到不依赖具体学科的拆解方法。每个研究课题或具体的任务可能面临的问题本身和所需数据都与其特定学科紧密相关。但我想强调的是,解决他们的AI技术本身并不局限于某个具体学科。人工智能技术本质上旨在解决一些普遍存在的问题。这些通用的解决方案可以被定制化,适应特定问题的需求。

甲子光年:可以简单说AI的作用是在上述四个环节里加速一切吗?除了加速还有什么别的作用?

王梦迪:肯定不仅仅是加速。比如在设计新材料、药物或蛋白质等领域,传统方法可能无法实现某些设计目标。因此,人工智能在设计方面的重要性不仅在于加速过程,更在于其能够创造出传统设计方法无法达到的新颖性,以及实现传统设计无法达到的效率。以核聚变控制为例,传统的控制技术无法满足可控核聚变所需的精确度,而人工智能的方法能够达到这一要求。在许多领域,人工智能的应用可能代表着从无到有,从0到1的突破,而不仅仅是从有到优的改进。

2.可解释性是政治正确诉求

甲子光年:可以再介绍一下你上半年和团队发布的有关mRNA的大模型吗?

王梦迪:我们训练了一个mRNA语言模型,可以解码mRNA序列中最神秘的非翻译区域,并预测其调制功能。这个模型可应用于生成更好的mRNA序列设计。在疫苗开发方面,mRNA疫苗的核心是其编码序列,这个序列控制着药物的表达。具体来说,编码序列决定了药物在多大程度上能够被转录并翻译成蛋白质,而蛋白质在细胞内发挥免疫治疗作用。

对于mRNA疫苗而言,最关键的优化指标是控制蛋白质翻译过程的效率。在我们的研究中,我们利用跨物种的mRNA语言模型生成了全新的mRNA设计,并和生物学家、制药专家合作,在实验室合成了我们设计的序列,通过湿实验闭环验证了我们生成的mRNA序列在效果上显著优于当时最好的mRNA疫苗,效率提高了30%—40%。

甲子光年:除了生物,你目前还感兴趣哪些领域?

王梦迪:AI本身就是通用的技术,其实从技术层面来讲,不同学科的应用差别不大。

我们最近也和合作伙伴在做芯片设计的工作。原来要是通过模拟软件手工调出一个板子,需要几个月或半年的时间。但我们训练了一个模型,完全不需要任何额外的人工,每生成一个新的设计只要几分钟。还有一个有趣的方向是把控制论、强化学习和大语言模型结合,通过对解码过程的精确控制来实现大模型效率的提高,以及inference加速。

甲子光年:加入普林斯顿十年来,你的研究方向发生过什么主要变化吗?是在什么情况下发生的?

王梦迪:我自己的科研方向确实经历了巨大的变化。最初,我们的研究是从机器学习方法的数学理论出发,专注于研究如何加速算法和提高算法利用数据的效率。早期的工作注重统计和优化理论,随后我们转向了强化学习领域,强化学习本质是自动控制学科在人工智能领域的延伸,也即“AIfor control”。在这个领域,有许多奠基性的理论和方法,我们团队也参与了贡献。我最近获得的奖项就是在控制强化学习方向的工作得到了认可。

随着时间的推移,我开始越来越多地接触人工智能在其他交叉学科中的应用。从个人和我们团队开始酝酿这些想法到逐步实现已经有几年时间,但直到最近,我们的一些工作才开始被更多人所看到。

甲子光年:你最早是做的用数学和一些控制原理去提高强化学习的效率,可以展开说说吗?

王梦迪:对,比如我们关注一个强化学习问题,如果用深度学习来近似其价值函数或者策略函数,那这个问题的算法复杂度是多少?样本复杂度是多少?在信息论的理论层面,我们会提出一个复杂度极限,也即数学上的下界;在算法层面,我们要设计出实用的算法,并且验证其复杂度能够逼近数学上的极限下界。这不仅是一个纯粹的理论问题,还对实际的算法设计提供指导。 

另外一个重要的问题是,研究model-based 强化学习方法和model-free 强化学习的优异。我们提出了一个方法,叫做value-targeted regression, 可以理解成model-based和model-free算法之间的折中方案,这个方法能够最有效地利用关于系统和环境的先验知识(比如model family),由像model-free算法一样简捷实用,并且达到理论上最优的复杂度。这个工作后来给DeepMind发布的游戏智能体Muzero提供了理论框架。

甲子光年:到了人工智能时代,我们应该如何重新认识控制论这个学科?

王梦迪:控制技术在大模型上的应用主要是为了让模型更好地与人类价值观对齐,让它在生成内容时能够更加高效和准确。目前,OpenAI提出的Strawberry和Q-star等概念,都是通过强化学习技术将大语言模型与特定的目标函数对齐。这些方法的基础都是控制理论。对齐和控制是目前研究的热点。因为scaling law的局限性越来越大,我们已经很难通过简单的规模扩张来提升模型性能。

我们可以将token by token的生成视为一个控制过程,无论是进行微调还是进行额外的自适应解码,都可以理解为我们引入了反馈和控制机制,并寻找最优的Q*和最优策略。这也是我们团队的研究方向之一。在各种会议分享的时候,我经常强调这些技术的本质是将大模型的生成问题视为一个控制问题来解决。

甲子光年:好像越来越多人不看好scaling law了。

王梦迪:哈哈,前几天还在和一位投资人朋友聊天,说到是不是scaling law要靠强化学习或者说控制来拯救了。现在的难点在于,仅仅用机械的方式是堆数据和调模型参数已经不够用了,用控制和强化学习方法可以帮助模型更巧妙地试错。强化学习之所以能让AlphaGo解决围棋问题,不在于它收集了围棋所有的可能性,那会有3的361次方种可能性;而是通过巧妙的方式不断试错。如何解决scaling law的困难,肯定也需要巧妙地做探索(exploration)的方式。这就是OpenAI、谷歌这些公司正在开发的训练方法。

甲子光年:你如何看待深度神经网络可解释性偏弱的问题?你有没有关注今年OpenAI,Anthropic等公司或团队发表最新的可解释性研究?

王梦迪:科研界对大模型的可解释性的理解在不断加深。比如一个很有趣的可解释方法是在大模型里加一层稀疏自编码器(sparse autoencoder),每一个激活对应一个语意的解释,这最早是2023年Anthropic在技术博客里提到的。Open AI, 谷歌 Gemini也都推出了自己的可解释性模型。

这个研究方向的短期实际价值,更多在于满足美国政治正确和监管的需求。从试图理解它的理论角度来讲,我会更感兴趣帮助理解它的工具。许多理论计算机学者都在做打开大模型黑箱的工作,这个领域其实有很多进展。我个人觉得它不是一个黑箱,而是理解得越来越深刻,越来越透明的系统。

3.具身智能到了该火的时候

甲子光年:作为研究控制论和强化学习出身的学者,你会把自己归类为人工智能行为主义这一派别吗?你怎么看符号主义和连接主义?

王梦迪:这些我没怎么听过,可能我们太nerdy了,不太讨论这些。控制论本身已经是很具体的学科,或者说学派。

甲子光年:控制论作为一种经典理论,有没有在当下热门的人工智能讨论方向里被忽视?

王梦迪:完全没有。其实现在具身智能本质也是控制的一种,大模型的对齐本质也是控制。这个学科的价值会被更进一步挖掘,并且在这个时代大放异彩。人工智能领域的非常多优秀学者也是控制自动化出身。

甲子光年:你如何看待今年以来具身智能和人形机器人的热潮?

王梦迪:这个领域到了它该火的时候,因为各方面技术都相对成熟了,并且机器人基础模型(foundation model)这个概念已经出现,可以把不同场景,不同本体的数据整合在一起做出来foundation model。你可以把它理解成具有一个整体的大脑,然后把它应用在不同的本体中。我觉得机器人foundation model会触发当年的“ImageNet时刻”。对于机器人和具身智能领域来讲,目前是万事俱备。

甲子光年:机器人领域目前比较困难的挑战是什么?

王梦迪:我觉得是AI学科的挑战在于人,还需要培养更多厉害的年轻人,有跨学科的思维。目前还处于人才不断向这个领域聚拢的阶段。另外就是如何把数据有规则地整合起来,这件事情已经在发生,但还没有到关键节点(critical point)。

甲子光年:有些声音说将来我们不需要很多训练数据了,数据不再重要了。你如何看待这种观点?

王梦迪:纵观近几年的人工智能发展,哪一项不是由数据突破带来的。AI的研究正在从模型为中心(model-centric)变成了数据为中心(data-centric)。越来越多业内人士同意的观点是,数据可能比模型本身要重要。不过“数据为中心”相对于人工智能发展史也只是一个阶段,相比于数据,如何推理如何寻找更好的底层架构也是重要的问题。

甲子光年:说起培养年轻人,你在庆祝AIfor Accelerating Invention成立的当天也在为学生拿到谷歌的奖学金感到高兴。这两件事,包括过往20年一些重大的节点,其中对你最有意义的是哪个瞬间?

王梦迪:我最开心的还是学生拿奖,学术发了好的论文,或者他们做到了什么有意义的事情。每个人都有自己的职业道路,工作努力会给自己带来成就感,但更高级的满足来自于影响到自己以外的更多人,尤其是让我的学生有成绩,拿到世界级的认可,这对我来讲是新的维度。

甲子光年:能感受到你对学生有很多关注和爱护。这是不是受到自己求学时老师的影响?这位老师会不会让你觉得自己也要成为像他一样的老师?

王梦迪:我的导师Dimitri P.Bertsekas是控制论的奠基人之一。我是他的最后一个PhD学生,可能是这个原因,他对我非常宽松,甚至他自己都说对我过于hands-off了。我一直在有很大自由度的环境里长大,跟PhD导师的关系也是亦师亦友。所以我对自己的团队也不是那种要求打卡上班的严格管理者。我也期望营造内紧外松,鼓励每个人发展自己的学术环境,这是我希望自己跟学生的关系能达到的境界。

甲子光年:你现在是一个什么风格的导师,或者说你希望自己成为一个什么样的导师?

王梦迪:我希望尽可能提供学生他们需要的资源,让他们做自己想做的事情。我也希望学生们不一定要非常教条地做一个我制定的方向,而是逐渐形成自己的领导力。希望我的学生在毕业的时候每个人都能成为独立在这个领域领导研究的人。

这里也打个广告,我们AI for Accelerating Invention正在招博士后,会给予很大的投入和自由度,可以领导自己感兴趣的AI领域或者AI交叉学科方向,感兴趣的读者可以邮件联系我。

甲子光年:在开学,你会对计算机和AI领域的年轻学子有哪些期待?

王梦迪:我心目中最理想的年轻学者,可能他最好同时对模型的数学本质有较深刻的理解,同时愿意动手、愿意尝试解决新问题。如果一个年轻人能从抽象本质到具体动手都游刃有余,这样的人最有可能在未来进一步推动这个领域发展。

对于更年轻的学生,可能他们还没有特别多科研经验,这个那个都做过一点。我希望他们在变成更成熟的科研工作者的道路上,一是要保持好奇心,多关注科研进展,不要拘泥于具体的子方向,而是更宏观地关注领域里的不同进展,甚至跨学科的进展;二是要敢为人先,因为所有进展都是最有创造力的年轻人推动的,所以年轻人敢去做非常重要。

(封面图和文中图片由受访者提供)

END.

免责声明:本文由顶端号作者上传发布,仅代表作者观点,顶端新闻仅提供信息发布平台。如文章内容涉及侵权或其他问题,请30日内与本平台联系,反映情况属实我们将第一时间删除。
热评
暂无评论,去APP抢占沙发吧