生成式AI正在改变整个世界，聊天机器人只是其中的小儿科—

人工智能革命的影响将不再仅限于聊天机器人，从研究新型塑料食菌、创新的癌症疗法，到自主辅助机器人以及自动驾驶汽车，生成式人工智能技术正以各种方式重塑我们的生活，相比之下，会说话的机器人似乎只是其中微不足道的一环。

我们往往将当前的人工智能等同于能写作、能交流、能编程及能拍照的计算机，但实际上，这些功能大多建立在一种名为“Transformer”的底层技术之上。然而，这种基于注意力机制的神经网络架构的应用范围远不止于此。

两年前，Transformer为OpenAI推出ChatGPT奠定了基础。如今，众多公司正积极探索如何以新颖的方式利用这一创新技术。例如，Waymo正利用它开发自动驾驶出租车，而生物学初创公司EvolutionaryScale则用它设计全新的蛋白质分子。

01 从文本翻译到通用学习者

现代人工智能素来擅长识别信息模式，但以往的局限限制了其更多潜能的发挥。以语言为例，过去的人工智能系统往往只能逐个处理单词，并根据单词出现的顺序进行预测，这大大削弱了它们理解单词深层含义的能力。

2017年，谷歌研究人员在一篇开创性的论文中聚焦于语言翻译。他们发现，如果人工智能系统能够一次性处理整篇文章，并能够结合上下文进行阅读，那么翻译质量将大幅提升。

非营利性机构艾伦人工智能研究所的人工智能研究科学家蒂姆·德特默斯（Tim Dettmers）解释道，Transformer的工作原理在于探索每条输入信息与接收信息之间的关联性。

EvolutionaryScale设计出了功能类似水母发光蛋白的蛋白质，其序列完全由人工智能创造，自然界中前所未见

凭借这种深度的上下文理解能力，基于Transformer的人工智能系统不仅能识别模式，还能预测未来，甚至创造新的信息。这种能力不仅限于文字，同样适用于其他数据。

EvolutionaryScale首席科学家亚历山大·里夫斯（Alexander Rives）表示：“这些模型在某种程度上正在揭示数据的潜在结构。”

EvolutionaryScale正在利用公开的蛋白质序列数据及相关知识训练其人工智能。无需人类工程师介入，其人工智能就能发现分子构建块之间的关系，来创造全新的蛋白质。

EvolutionaryScale已设计出一种概念验证分子——一种功能与水母发光蛋白相似的蛋白质，但其序列完全由人工智能创造，自然界尚未发现。

该公司的终极目标是帮助各类企业——从制药商到合成化学公司——生产出前所未见的物质，如携带可以消化塑料的新型酶的细菌或针对个人特定癌症的新疗法。

02 从聊天机器人到真变形金刚

卡罗尔·豪斯曼（Karol Hausman）致力于打造通用人工智能系统，该系统能够为任意机器人提供动力。他表示：“我们的目标是构建一个模型，这个模型能够控制任何机器人执行各类任务。”

豪斯曼创立的Physical Intelligence公司虽然成立不足一年，但他们从研究与ChatGPT同源的大型语言模型变体出发，这些模型如今已进化到能够处理图像，而这正是豪斯曼机器人技术的核心所在。

在最近的演示中，Physical Intelligence的一对机器人手臂成功完成了机器人领域最具挑战性的任务之一——叠衣服。由于衣物形态多变，需要极高的灵活性和精确度来处理，机器人专家难以预先编写动作序列，来指导机器人如何移动肢体以抓取和折叠衣物。

Physical Intelligence的系统却能轻松应对这一挑战，它能够从烘干机中取出衣物并整齐地折叠好，这一切都得益于一个无需人类干预便能自我学习的系统。该系统仅需大量数据作为输入，便能完成任务。这次演示以及其他类似演示的出色表现，使得该公司在本月早些时候成功从包括杰夫·贝索斯（Jeff Bezos）和OpenAI在内的投资者那里筹集到了4亿美元的资金。

麻省理工学院的研究人员拍摄了一段机械手臂给名叫Momo的狗喂食的视频，并用这些视频训练了另一个人工智能机器人来执行相同的任务

今年10月，麻省理工学院的研究人员宣布，他们正在探索一种基于Transformer的类似技术，旨在创造出一个能够从多种来源获取海量数据、并在各种环境中灵活运作的机器人大脑。例如，他们拍摄了多部普通机械臂将狗粮倒入碗中喂食的视频，并用这些视频来训练另一个人工智能机器人执行相同的任务。

03 机器人，你可以开我的车

与机器人技术领域类似，研究自动驾驶汽车的研究人员和公司也在探索基于Transformer的“视觉语言模型”的应用。这种模型不仅能够处理和关联语言信息，还能处理和关联图像信息。总部位于加州的Nuro、伦敦的Wayve，以及谷歌母公司旗下的Waymo，都在积极采用这类模型。

这与自动驾驶领域之前采用的方法截然不同。以往的方法往往是结合人类编写的指令和老式的人工智能技术来处理传感器数据，从而识别道路上的物体。而新的基于Transformer的模型则提供了一条捷径，使自动驾驶系统能够轻松获取以往难以获得的世界通用知识。

例如，Waymo的研究人员在最新的一篇论文中，展示了如何利用谷歌自家的商业人工智能系统Gemini，使他们的自动驾驶系统能够识别并应对那些它未曾接受训练的物体，比如过马路的狗。

Wayve是众多利用新人工智能技术帮助自动驾驶汽车应对意外情况的公司之一

04 一个真正的帮手，并非完全取代人类

艾伦人工智能研究所的科学家蒂姆·德特默斯指出，尽管这些系统功能强大，但仍存在局限性和不可预测性，因此无法完全取代人类。

以EvolutionaryScale的人工智能为例，它虽然能为人类在实验室中提供新的分子合成建议，但实际的合成与测试工作仍需人类来完成。同样，基于Transformer的驾驶模型，也还远未达到可以完全自动驾驶的可靠程度。

此外，它们的智能水平受限于所接受的训练数据。像OpenAI这样的大语言模型已经开始受到互联网上可用有用数据枯竭的限制。对于机器人或自动驾驶汽车来说，要通过这种方式学习，就需要大量关于它们在现实世界中运行时会遇到什么情况的数据，这也是目前各家公司竞相获取此类数据的原因之一。

这些限制在Physical Intelligence的机器人身上体现得尤为明显。它们的系统已经学会了叠衣服，但要在不同家庭中应用，还需要针对每个家庭的具体情况重新学习这个过程。这将耗费工程师大量时间，同时训练模型也要充足的资金支持。

对此，该公司首席执行官豪斯曼表示：“我想明确一点，虽然我们对自己的成就感到自豪，但我们仍处于起步阶段。”

本文来自“腾讯科技”，编译：金鹿，36氪经授权发布。