作者|周一笑
邮箱|zhouyixiao@pingwest.com
在具身智能的浪潮将所有人推向台前时,有一家公司选择先在水下潜行。
“原来藏在水下,现在浮出水面。”地瓜机器人在成立一周年的节点上,如此形容自己的状态。
这片赛道从不缺少喧嚣。一边是各类人形、四足机器人努力在聚光灯下做出更惊艳的动作,争夺着资本和大众的眼球;另一边,则是地瓜机器人这样的公司,选择向后一步,去解决更基础、也同样棘手的“修路”问题。
它并非凭空出世。一年前,这个团队正式从地平线机器人中分拆,带着自动驾驶芯片设计与算法基因。在其成立一周年,并刚刚宣布完成一笔由高瓴、五源等知名机构参投的1亿美元A轮融资之后,地瓜机器人用一场发布会,更清晰地展示了它的解题思路。
在发布现场上,地瓜机器人描绘了他们眼中的行业图景:陪伴机器人等新兴品类不断涌现,未来将有成百上千家企业投身其中,市场竞争激烈且高度碎片化;与此同时,具身智能的技术路线尚未收敛,“分层决策”(大小脑)与“端到端”两大流派将长期并存。
正是在这样的背景下,地瓜再次明确了自己的位置:不做具体的机器人,而是成为机器人时代的“母生态”与“基础设施提供商”,为所有开发者提供从芯片、操作系统、算法到云平台的软硬件基础设施。地瓜机器人主打低功耗和高性价比的RDK X系列(如X3、X5)及核心的旭日®芯片,已为其生态打下基础:芯片出货量超过500万片,并积累了近10万名生态圈开发者。
这个蓝图的最新一块拼图,是这次发布的主角:RDK S100。
这并非地瓜的第一款RDK(Robotics Developer Kit),而S系列,代表“Superpower”,是地瓜面向具身智能领域提供的更大算力平台。
它的核心,是“大小脑”的异构设计。在一颗SoC上,地瓜集成了三个核心计算单元,并从功能上将它们协同为“大脑”与“小脑”:
大脑:由6核CPU(负责复杂的逻辑调度)与最新一代自研“纳什”架构BPU(负责AI推理)共同组成。这颗BPU专为CNN和Transformer优化,提供了80 TOPS(S100)和128 TOPS(S100P)两种算力选项。
小脑:由4个Cortex-R52+核心组成的MCU,独立负责高实时、高可靠性的运动控制。部分核心甚至可以运行在锁步模式(Lock-Step)下,为机器人提供功能安全保障。
地瓜强调,这套方案在算法与芯片的联合调优上效果显著。例如,通过BPU对运动控制(Locomotion)算法的加速,相比纯CPU推理提效超过100倍;而在前沿算法层面,其提出的高效Manipulation模型,通过对Diffusion Policy操作策略进行加速,也将推理效率提升了10倍以上。
硬件之外,软件生态的配套是地瓜叙事的重点。官方的ModelZoo算法仓库提供了超过110种优化好的模型;全新的工具链旨在简化开发者自有算法的迁移与调优;而“闪连”Type-C接口和RDK Studio开发环境,则让开发者“一根线就能搞定开发”,降低了上手门槛。
据介绍,这款新发布的RDK S100在正式亮相前,已经与超过20家具身智能领域头部客户建立了合作,并获得了超过50家合作伙伴展开测评。
现场演示环节展示了RDK S100在不同机器人上的应用,地瓜机器人在宇树G1人形机器人上,部署了ASAP框架以实现全身运动控制;在睿尔曼半人形双臂机器人上,结合语音与视觉模型执行抓取及导航任务;在求之科技AIRBOT机械臂上,则以“大脑”进行环境感知,“小脑”控制抓取动作,完成了桌面自动收纳。
最终,所有的技术和设计都指向了市场。RDK S100标准版(12GB内存+80TOPS算力)以2799元的市场价和2499元的首发优惠价入市。
这一价格几乎只有英伟达同等算力水平方案的一半。地瓜表示,能做到这一点离不开脱胎于地平线带来的内部资源复用,加上成熟的产业链经验,使其能有效控制SoC成本。这一切连同来自逐际动力、VITA机器人等合作伙伴的站台,共同构成了地瓜“浮出水面”后,向整个行业发出的信号。
在这次发布会之前,我们得到了一次与地瓜机器人开发者生态副总裁胡春旭交流的机会。在近一个小时的对话中,他详细阐述了地瓜如何看待行业碎片化、技术路径选择以及生态构建的底层逻辑。
以下是经过编辑的实录:
如何成为机器人时代的Wintel?
硅星人:机器人市场高度碎片化,地瓜机器人为何有信心做一个通用的底层平台?
胡春旭: 高度碎片化,确实是现在整个机器人行业很大的一个问题。从我们角度出发,我们在说机器人时代的Wintel也好,软件开发里面的CUDA也好,核心都是底层的一套平台。我们看重的是,未来五年、十年之后,机器人行业一定是有上千家,甚至上万家的公司来做各种各样不同的业务的。
虽然现在业务很碎片化,但是越往底层去挖,整个平台化会越加标准化。这是在任何一个生态的大行业里都必然存在的现象,比如过去的手机时代、电脑时代,虽然手机的品类千差万别,但里面的核心芯片无非就几家。对机器人来讲,我们认为未来也是一样。
所以,在这个逻辑之上,对于地瓜机器人来讲,问题在于怎么样让未来上千上万家公司,首选地瓜机器人的芯片或者平台来做他的机器人。越是早期,越是建立标准、建立生态核心壁垒的很重要的时间节点。我们让所有的开发者脑海中第一个印象他要做机器人就一定要选地瓜机器人,不管是硬件、软件还是我们的平台,都是加速开发机器人的一个核心手段。
硅星人:很多开发者担心被平台“绑定”。地瓜如何平衡开放性与生态壁垒?
胡春旭:我们是这么来看待的,它一定存在两面性。首先生态长期来看一定是一个企业的重要壁垒,如果五年、十年之后,地瓜机器人真的成为了奋斗目标的机器人母生态,那一定是我们最核心的一个壁垒。自然而然,开发者从我们的生态往外迁,一定会存在门槛,这是一个公司做生态的必然。
但从现阶段来讲,作为后来者,我们必须要去充分开放我们的生态,让很多开发者快速地在里面把事情做起来。比如我们会让平台保持足够的开源,让平台足够好用。
另外一个很重要的点在于,之所以考虑要迁出生态,是因为这个生态可能存在很多问题,比如它已经很难支撑公司去做持续的盈利,或者很难带来价值。所以如果一个生态能够蓬勃发展,我认为这些开发者、企业,不会有迁出去的想法,因为这里可以带来更多价值。我们想建的生态,就是让大家一起持续成长、持续产生价值的生态。
硅星人:地瓜与高校的合作似乎非常深入,具体是如何做的?你们希望解决什么问题?
胡春旭: 我们认为人才是中国机器人产业很重要的核心价值之一,所以地瓜对人才培养非常关注。我们看到的一个问题是,高校里计算机、自动化、机械专业很多,但专门的机器人专业很少,而且随着技术发展,学校跟社会脱节的速度越来越快。我们希望把行业里的经验,通过教材、内容、比赛的方式,让学生能跟上行业发展的速度。
具体来说,我们和国内超过200家高校有实质性合作。比如和上海交通大学合作了三本机器人相关教材,都是基于我们的RDK去写的;我们在全国有四到五项全国性的赛事,以赛促学;同时,我们和大概15家国内高校有联合挂牌的机器人实验室,提供设备和方案,让学生能周期性地来做实验。整个逻辑,就是希望培养出更多的复合型机器人人才,当他们成长起来,无论是去大公司还是自己创业,都会带着我们生态的基因,这是我们人才培养的逻辑。
硅星人:有了我们的开发板之后,社区和高校的开发者们有没有做出一些让您印象深刻的项目?
胡春旭: 这个太多了。比如去年我们发布RDK X5后组织了一个创客营,有一个组就基于RDK X5做了一台自动驾驶自行车。这个项目之前稚晖君做过,我们的开发者把它复现了,还加入了基于我们双目相机识别跑道边界线的新功能,能完整地在学校400米操场上跑一圈,非常有创意。
还有一个开发者团队,复现了国外一个叫OpenDuck的开源项目,做了一个像小鸭子一样的双足机器人,也是基于RDK X5。做完之后,他把所有东西,包括3D图纸、代码、物料链接,全部都开源分享出来了,这是一个很典型的、完整的开源项目。类似的还有很多,比如做自动化轮椅的、做导盲犬的。现在在B站上搜我们的产品关键词,能找到几百个视频,绝大部分都是开发者做的;在GitHub上也有500多个相关的开源项目。
为什么是“大小脑”?
硅星人:为什么地瓜现阶段主推“大小脑”架构?这和业界热议的端到端模型是什么关系?
胡春旭:这回到了整个具身机器人行业发展的技术路径。宏观上来看,分成两大类别,第一类是完全的端到端,第二类是分层的模型结合。端到端最大的优势是泛化性最好,但它最大的挑战在于数据。分层结构刚好相反,对数据要求没那么多,但泛化性存在问题。
在我们看来,这不是非此即彼的选择。如果类比自动驾驶,把机器人也分成L1到L5,我们大概也处于L2到L3之间过渡的期间。如果要实现L5,完全的AGI水平,那一定是一个端到端的效果。但是在从L2到L3过渡期间,大家更多会关注怎么样快速把机器人落地。这时候,我们认为分层架构是更加合适短期内做落地的。
所以我们的大小脑平台RDK S100,就是使用大小脑这种方式去配合分层的技术路径,满足机器人企业快速落地的需求。当然,我们认为未来一定不是只有这一款产品。未来一定会有更高的算力芯片,比如明年年初我们就会出500T以上算力的套件。当算力更大,数据问题有更多解决方案之后,端到端的路径也一定会快速发展。所以我们未来的大算力套件就会支持端到端的方式。
这两种技术路径一定是并存的,一定不是替代关系。我们会通过不同产品的平台来支撑不同技术路径,从而支撑不同的业务场景落地。
硅星人:数据和算法是机器人开发的两大难题,地瓜如何帮助开发者,尤其是小团队解决这些问题?
胡春旭: 大家都在面临数据的问题,大概的解决办法有两大类。
第一大类是没有数据,就去产生数据。我们内部会做一个云平台,核心功能就是去产生数据。比如一个国内公司做海外业务,没有海外的数据,没问题,我们通过云平台,基于大模型输入一些prompt,就可以产生一千张、一万张甚至更多的数据来支持他做训练。我们也会有大模型的方式来做自动化标注。整个过程提供一套完整的工具链。
第二种方式,是通过尽量小的数据让模型泛化程度更高。比如抓取,市面上主流的方式叫GraspNet,我们算法团队会对这个模型做充分的优化、改造,做完之后能够跑到非常高的效率,同时我们把结果通过开源的方式分享出去。这样开发者就不用再从头做训练、数据采集了,只需要基于我们的模型,把它当成一个Foundation Model,结合他的业务场景做一些调优。我们在ModelZoo里面现在提供了100多种类似这样的模型。
市场与未来
硅星人:在众多机器人形态中,您判断哪些会最先规模化落地?
胡春旭: 我们会把市面上的机器人分成大概三大类别。第一类是比较传统的,比如扫地机器人、工业机械臂,它们已经是体量最大的。第二类是“新形态机器人”,比如割草机器人、泳池机器人、家用娱乐机器人,它们在某些细分场景解决核心问题。第三类就是偏具身的,包括人形、四足等。
从我个人判断,一定是“新形态机器人”的落地会更快。比如割草机器人,去年全球出货量已经到了几十万的体量。相比之下,纯双足人形,它的目标是一个比较偏通用的机器人,技术迭代周期会长很多,我们认为至少是五到十年,甚至更长时间。在具身这个大的类别里面,我认为比较快能落地的是四足、机械臂(包括半人形)。机械臂本身是被传统行业充分验证过的形态,现在正从工业走向消费,比如做咖啡、做冰淇淋,更多是找到一个精准的业务场景。
硅星人:当算力不再是瓶颈时,一个机器人计算平台的核心竞争力会是什么?
胡春旭:核心竞争力很多情况下一定不是一个单点,而是一个相对比较全面的。但在我看来,有几个点很重要。
第一个是效率。我们很关注这一点。怎么样在一定算力情况之下,充分地发挥它的功耗跟性能的综合效果,这关乎到未来产品落地的成本和性能。同时,我们提供各种各样的工具链,目的就是让开发者“多、快、好、省”地把东西做出来。有开发者用我们的RDK X5去控制逐际动力的点足机器人,本来项目是用英伟达的平台做的,迁移到我们RDK上只用了一个小时就完成了搭建,这就是效率。
除了效率,另一个就是生态。要快速做出一个产品,一定不是只有“脑子”就结束了,它需要全产业链的支持。在我们的生态里面,开发者可以快速找到合伙人、招聘到熟悉我们平台的人才,也可以快速对接到方案商、服务商,甚至获得资本的支持。这些都是我们的核心竞争力。
结语
RDK S100的发布背后是地瓜机器人的市场卡位,在整个行业向着宏大目标迈进时,它选择优先成为那个“为淘金者提供铲子和牛仔裤”的基础设施供应商。
追求具身智能的道路漫长且昂贵,是选择自上而下、重金投入,直指最终的端到端通用模型;还是选择自下而上,通过提供极具性价比和开发效率的工具,先聚拢最广泛的开发者,解决当下机器人商业化的实际问题,从而建立一个难以逾越的生态壁垒?地瓜机器人用一款2499元的算控一体开发套件,给出了自己的答案。这个关于机器人时代“Wintel”的故事能否走通,将是未来几年机器人行业值得关注的一条主线。
点个“爱心”,再走吧