打开APP
揭秘火山引擎:如何从无名小卒,成为云计算新贵?
光锥智能
2025-06-17 20:53:11

文|白 鸽

编|王一粟

AI,已经成为火山引擎突破云计算市场格局的一张王牌。

2020年6月,字节跳动正式推出火山引擎,2个月后,谭待离开百度,选择加入火山引擎。

今年,是谭待执掌火山引擎的第五年,也或许是其最开心,且最从容的一年。

“刚开始面试火山引擎的时候,一些有经验的朋友跟我说‘字节肯定做不起来’。”谭待说道,这也是压力最大的阶段,但“现在他们会跟我说,火山做得还挺好。”

火山引擎总裁谭待

字节跳动做云计算,比同行晚了10年,在中国公有云市场的排名中,也是列属于other系列。也正因此,对于字节跳动做云计算,很多人并不看好。

但现如今的火山引擎,不管是在字节跳动内部,还是在外部行业,都开始支棱起来了。

2025年的火山引擎Force原动力大会(春季),比以往来得更晚一些,但却是历年以来参与人数最多的一次,整个国家会议中心二期的场馆中,每个展厅都坐满了来参会的人。

同时,字节跳动CEO梁汝波的首次公开站台,也给了火山引擎,并表示:“做好火山引擎,对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。”

从外部市场来讲,火山引擎官方数据显示,去年12月,豆包大模型的日均Tokens调用量是4万亿,今年3月份达到12.7万亿。

截至5月底,豆包大模型日均Tokens使用量超过16.4万亿,较去年5月刚发布时增长了137倍。

另外,据IDC报告显示,2024年火山引擎在中国公有云大模型服务调用量上稳居第一,市场份额46.4%,紧随其后的则是百度智能云和阿里云。

对此,谭待表示,这部分的调用量统计则主要来自外部,而非豆包、即梦等字节内部消耗。

火山引擎的发展达到了前所未有的速度。这一切,得益于火山引擎对AI的押注。

不过,谭待也坦言:“AI带来了一个新赛道,我们可以很快做到第一,但在IaaS等公有云市场的存量赛道中,火山引擎还需要一点点往上走。”

去年,火山引擎营收破百亿,今年预期营收到200多亿,而早在2021年,谭待对火山引擎未来的营收预期是1000亿。这也就意味着,火山引擎的万里长征,才刚刚走出第一步。

“我们今年的目标还是很激进的。”谭待说道,“毕竟现阶段行业对AI的需求明确清晰而庞大。”

打赢云计算排位赛不只靠价格战

在火山引擎之前,谭待曾任百度搜索、网盘和基础架构首席架构师、T11级别技术专家,甚至有坊间传言,他还曾向百度智能云总裁沈抖汇报过工作。

谭待接管火山引擎后,对其技术架构进行了更新和升级。不过,相比于技术体系,彼时的谭待承受的压力,主要来自市场拓展。

据弗若斯特沙利文数据显示,2021年上半年,中国公有云市场格局基本已定,排名前五厂商占据了总体83.8%的市场份额,阿里云、华为云、腾讯云三分天下,运营商云中的天翼云排名第四,彼时火山引擎还只是边缘玩家。

也正是这一年,谭待给火山引擎设立了,未来8-10年要实现营收1000亿的目标。

彼时谭待为火山引擎开拓的市场增长空间,则来自多云市场趋势的发展。

但于火山引擎来说,多云策略的应用只是使其获得了参与这场游戏的资格,却并未使其在这个竞争激烈的市场中获得优势,更不用说改变整个市场格局,甚至也始终未成为中国第四朵云。

不过,在刚开始成立的前三年,火山引擎一边在拼命追赶基础设施的建设,一边努力寻找差异化,试图在高度成熟和内容的行业中,杀出一片天空。

机会总是留给有准备的人。

2023年初,AI大模型爆发,这给火山引擎带来了新的增长引擎。

面对一个新鲜事物,所有的新老玩家,几乎都处于同一起跑线上。这对原本起步晚的火山引擎,已经很好了。

“这几年AI快速普及,我觉得还是挺幸运。”谭待直言,“AI公司的需求不小,但要求很高。很多公司选择火山,不是因为我们有卡,而是因为我们能够稳定地把模型训练出来。”

早期火山引擎的方舟平台,也是集成多种主流大模型,为客户提供模型训练、部署等服务。

不过,自去年5月火山引擎发布字节自研基座大模型豆包之后,火山引擎在对外推动AI落地的进程中,更多是以豆包大模型为主。

同时,以豆包为基础,火山引擎率先开启大模型价格战,让大模型定价进入厘时代。

而用价格换规模,符合互联网大厂过往的一贯打法。这一行为,也一度引发谭待和前领导沈抖之间的隔空骂战。紧随火山引擎之后,中国云厂商纷纷开打大模型价格战。

价格战带动了Token消耗,也就带动了云上算力的销售。对云厂商们来说,水面之上,打的是AI和价格战,水面之下,做的却依然是算力的生意。

今年,火山引擎的价格战依然继续,但此次不再是粗暴的一刀切,而是根据影响模型成本最关键的输入输出长度来定价,具体来说:

输入区间在32k-128k范围,豆包1.6价格是输入1.2元每百万Tokens,输出16元每百万Tokens;在输入区间128K-256K范围内,豆包1.6价格是输入2.4元,输出24元。对于绝大部分企业使用集中的0-32K范围,通过技术优化,豆包1.6价格是每百万Tokens 输入0.8元,输出8元。

“对于Agent而言,其需要处理很多复杂任务,对Tokens的消耗量非常巨大。”谭待对光锥智能说道,“因此我们这次创新做了区间定价,能集中把企业用最多的区间成本降低63%,相当于只需要以前三分之一的价格,就可以获得同等模型能力。”

但此次火山引擎对豆包1.6的定价,并未像去年一样,与行业定价拉开很大的差距,“低价只是刚开始对我们有帮助,现在大家的定价都差不多。”谭待也直言道。

低价在短期内能够吸引一些用户体验,但对于B端企业用户来说,更加注重模型的最终落地效果,对产品的容错率非常低。

也正因此,对火山引擎来说,围绕豆包大模型构建ToB服务体系,带来两个好处:

一是豆包大模型源于字节跳动内部研发,尽管其不一定是行业目前最强的基座大模型,但火山引擎更懂它的优点,让客户最终的体验更好。

“豆包很灵活,语言大模型能力也比较成熟,整体客户体验感比较好。”一位AI玩具代工厂的相关负责人对光锥智能说道,“我们也同步测了国内外其他主流大模型产品,但整体下来,还是豆包这一套体验比较好,响应速度也比较快。”

事实上,在抢占市场中,字节跳动不惜下血本,除掀起大模型降价,还免费给很多硬件公司装上大模型。“我们在市场开拓期,会免费给客户接入豆包大模型,还会做一对一的调试和服务。”一位字节跳动旗下的智能体平台扣子的研发人员对光锥智能表示。

此次大会上火山引擎发布的豆包1.6版本,在深度思考推理能力上也已经有了更大的提升。

如针对高考全国新一卷数学单科测评,豆包成绩144分,全国第一。高考前火山引擎团队针对海淀区模拟全卷进行测评,豆包1.6相对去年表现,理科成绩显著提升154分,文科则提升90分。

另外,更为重要的一点是,字节的 C 端产品有大量用户,会大规模调用模型,能帮火山引擎做好服务,同时也会有很多用户拿着C端的产品Case过来,希望火山能够将其落地在业务中。

“所以我们有一个优势,C端豆包APP用户非常多,在这个过程中,就总结了很多如何做好复杂Agent的最佳实践,并通过火山引擎对外提供服务。”谭待说道。

价格低、模型效果好,还有大量C端用户与B端协同,这让火山引擎在短短一年之内,就登顶了中国公有云大模型调用量榜首,完成了千亿营收目标中,万里长城的第一步。

火山引擎,怎么搞定AI客户?

细节决定成败。

除了上面这些战略级的打法,我们在与火山引擎多个客户的沟通中,还发现了一些细节的秘密。

上个月,瑞幸咖啡在小程序界面中上线了一个基于豆包大模型打造的AI点单智能体,而就这个智能体的上线,瑞幸咖啡与豆包的合作也经历了一段波折。

瑞幸小程序AI点单智能体

“这个智能体研发时间还是蛮久的,前期直接对接的豆包,它们日活很多,流量很大,所以最开始压测就没过。”瑞幸咖啡相关负责人对光锥智能说道,“后来是火山进场,帮助豆包解决了这些问题,和我们一起对整个架构重新做了优化。”

所谓的压测,是指对大语言模型进行压力测试,以评估其在高负载条件下的性能和稳定性。

众所周知,像瑞幸咖啡这种依赖线上小程序点单的店铺,往往会有高峰波谷时间段,其需要满足在高峰时期,瞬时流量对大模型的稳定性要求。

显然,在火山引擎进场之前,豆包对瑞幸咖啡的轻量化交付并未实现。

不过,相比于瑞幸咖啡这种存在高峰波谷的需求,AI玩具就不需要以很重的方式,去做产品集成开发。

而这种轻量化交付,也能够给豆包带来比较高的调用量。

“我们直接跟豆包签订的合作,目前这个产品已经销售了几十万单。”上述AI玩具生成商相关负责人说道,“虽然具体使用豆包Token的量还没测算出来,但(销售)反馈说我们这两个月,尤其是端午节后,AI玩具的消费整体比较多。”

除了新消费、AI玩具硬件等行业,火山引擎在汽车、金融、教育等行业落地也非常快。

其中,在消费电子行业,全球Top10手机厂商有9家和火山引擎深度合作;汽车行业中,豆包大模型助力了八成主流汽车进行AI升级;金融行业中,火山引擎已服务华泰证券、国信证券等数十家券商和基金公司,招商银行、浦发、民生等70%的系统重要性银行;教育行业中,火山引擎已与北京大学、浙江大学、南开大学等超五成985高校达成合作。

值得一提的是,今年以来,火山引擎的汽车行业大客户数量明显增加,本次大会BBA代表宝马和奔驰、荣威、极氪都为其站台,集成豆包大模型打造了智能座舱的极氪009光辉也现场展示。

在4月份上海车展官宣合作的上汽荣威,宣布双方将推动AI模型上车、AI大数据全面赋能汽车,打造“更懂消费者”的荣威AI汽车。

对汽车行业客户而言,火山引擎除了嵌入豆包大模型的能力外,还会嵌入字节跳动的内容资源。

比如极氪的智能座舱接入了抖音集团所有互联网平台,包括抖音视频、本地生活等。“这样可以为用户快速提升整个座舱的感知体验。”极氪智能座舱高级总监李程峻说。

除了这些传统各行各业的企业外,火山引擎也注意到了一些新兴企业。

“AI时代诞生了很多优秀的创业公司,这些公司虽然人员少,但却基于AI所诞生,一个人可以做很多事,所以能够持续迭代,功能研发也很快,每天Token消耗也很多。”谭待说道。

新生的AI创业公司,正在逐渐成为云厂商的“绩优股”客户。

目前,谈到AI时代的落地,更是离不开Agent(智能体)。

“Agent能够自主感知,规划和反思,完成复杂任务,软件也是第一次从被动的工具,变成主动的执行者。”谭待说道。

“当前主体已发生变化,云原生体系是为Web、APP等最佳实践设计,但当AI时代主体变为Agent,就需要设计新的技术栈。”谭待说道。

如Agent落地不仅需要更强更好的模型,还需要有更好的Prompt Pilot,让模型能力强化并解决更特定的任务;Agent所需要处理的数据,也不是结构化或非结构化的数据,而是要有各种各样更原始的多模态数据,所以需要为其构建多模态数据湖。

未来,Agent之间也会互相沟通,协同工作,Agent之间的防护、安全就非常重要,需要构建针对Agent之间的安全防护体系,如火山引擎最新推出的AICC密态计算和大模型应用防火墙等。

火山引擎围绕Agent在企业中的落地,已经形成了一套AI云原生的体系化技术能力和产品,逐渐沉淀在PaaS层的工具链上。

在云原生时代,火山引擎由于起步较晚,一直在补基础工具链的课;但在AI原生时代,火山引擎的AI工具链上的建设,却一直处在第一梯队,这将是AI落地到千行百业的底气。

“最重要的还是建立机制,客户想用好大模型,需要做好 prompt、模型要精巧、有合适的 RAG 知识库。我们会组建专门的服务团队,和行业线团队做匹配去服务他们。”谭待说道。

留在牌桌上

“云计算市场还是规模决定一切,最终牌桌上一定有火山。”谭待说道。

目前来看,火山引擎虽然已经杀入行业前五,但整体中国公有云市场格局并未发生很大的变化,阿里云、华为云、腾讯云依然占据着庞大的市场。

在AI云市场中,各云厂商也都在加码,百度智能云对AI云市场虎视眈眈,阿里云更是要投资3800亿元构建AI云基础设施。那么,火山引擎凭什么留在牌桌上?

在光锥智能看来,火山引擎留在牌桌上的筹码主要来自两方面:

一是基于豆包大模型构建的垂直优化能力。

谭待说:“那些很复杂的 Agent ,让它做好复杂任务,不仅模型要优化,背后的服务也得优化,还要准备好调优的环境等等。我们能提供的最大价值,是垂直优化的能力。”

一个则是价格战,这里的价格战,不单单只是对大模型Token的调用定价,而是在整个面向B端服务时,采用的新型商业化模式。

比如其打造的智能客服Agent,在面向企业端落地时,以往可能是按照项目制或服务费的形式收取费用,但火山引擎智能客服Agent则是按照实际服务量收取费用。

简单来说,智能客户Agent一天帮助客户回复了多少条信息,火山引擎就收取多少费用。

“前期我们主要收一次企业要在系统中做业务办理和系统对接的费用,后续都是按照量去服务收费。”火山引擎智能Agent产品相关负责人对光锥智能说道。

而想要保证智能客服Agent每天所回复100条信息都是有效信息,会有一些观测指标。如教育行业中的客服,包括班主任、指导老师等,会持续跟家长沟通学习的进度、课本知识产品使用等,通过人机协同模式,可以看到到课率、完课率是否下降。如果没有下降,就可以认定智能客服Agent能够对标达到真人服务的标准。

不过,该产品负责人并未直接透露每条信息具体的收费标准,但也明确表示,该产品的目标客户群体,更倾向于拥有上千人力规模的企业,存在真正降本增效的痛点。而这种收费模式的智能客服Agent产品,“每年能够至少为其降低一半的成本。”

对于很多云厂商来说,现阶段大模型带来的正向收益并不多,更多还是以售卖底层云算力资源为主。

而于火山引擎而言,“模型现在带来的业绩增长,以及这一块产品收入的增速,是在所有产品中最快的,远超其他产品,且毛利也是最好的。”谭待向光锥智能说道。

在内卷加剧的市场中,火山引擎选择重点押注AI新赛道,再以低价“野蛮突围”。未来,它能否真正挺进前三,还需时间验证。

不过,谭待的信心非常充足:“马拉松刚跑了500米”,未来市场空间最少会扩大 100 倍,火山会持续保持国内 AI 第一,在传统云服务的存量市场持续增大。

免责声明:本文由顶端号作者上传发布,仅代表作者观点,顶端新闻仅提供信息发布平台。如文章内容涉及侵权或其他问题,请30日内与本平台联系,反映情况属实我们将第一时间删除。
热评
暂无评论,去APP抢占沙发吧