谷歌AI平台全球第一 火山引擎中国第一


这是火山引擎成立五年来首次闯入Gartner魔力象限,标志着它开始能和国际AI云平台同台竞技


文|吴俊宇

编辑|谢丽容


2025年是AI应用落地和爆发之年,如何帮助开发者低成本、高效率开发AI应用,正在成为云计算厂商的重要命题。

美国东部时间11月17日,全球知名的IT市场调研和咨询机构Gartner发布了2025年度全球《AI应用开发平台魔力象限》(Magic Quadrant AI Application Development Platforms)。

报告显示,字节跳动旗下云与AI服务平台火山引擎入选其中。它的AI应用开发平台(主要是“火山方舟”这一产品)落地能力位居中国第一、全球第五。

领导者象限(可以理解为第一梯队)包括谷歌、亚马逊、微软等国际厂商。中国厂商都在挑战者象限(可以理解为第二梯队),包括火山引擎、阿里云、腾讯云。

谷歌AI平台全球第一 火山引擎中国第一

火山引擎2020年成立,2021年6月开始对外服务,是中国市场一家年轻的云厂商。我们了解到,火山引擎2024年营收规模超过110亿元,营收增速远超60%,增速超过中国市场大部分云厂商。2025年,火山引擎营收目标超过200亿元,和第一梯队的差距快速缩小(文章详见《火山引擎攻势凶猛,用AI把云重做一遍》)。

借助生成式AI(人工智能)带来的追赶机会,火山引擎2025年开始进入国际主流市场调研机构(如Gartner、IDC、Omdia、Frost&Sullivan等)的视野,并在多个市场报告排名位居前列。

Gartner为全球90多个国家和地区的14000家企业提供数字化转型咨询服务。它每年针对各个技术领域推出魔力象限(Magic Quadrant)、技术成熟度曲线(Hype Cycle)等洞察。

Gartner的魔力象限会对各个技术领域(如云、数据库、AI应用开发平台等)中的全球重点厂商进行评估。根据各个厂商的落地能力(Ability to Execute)和战略完整性 (Completeness of Vision),将其分成领导者(Leaders)、挑战者(Challengers)、远见者(Visionaries)、特定领域者(Niche Players)四大象限。

这是火山引擎成立五年来首次闯入Gartner魔力象限,标志着它开始能和国际AI云平台同台竞技。

谷歌AI平台全球第一 火山引擎中国第一

含金量几何?


2025年,AI云正在成为各个云厂商竞逐的下一个技术焦点。

AI云市场的话语权争夺也因此日益激烈。仅在2025年,各大国际市场调研机构至少公布了九份有关中国AI云市场的调研报告(文章详见《中国AI云市场,究竟谁是“第一”?》)。

在诸多报告中,Gartner魔力象限的含金量很高。Gartner以独立客观著称,其调研结果难以被厂商影响和干预。

为保证分析师的独立研究,Gartner给研究和销售团队设置了严格的防火墙。厂商(如亚马逊、微软、谷歌等)可以付费订阅获取研究成果、参加咨询会议,但无法干预自己的市场排名。

更重要的是,它的调研方法重视一线工程师和开发者的真实反馈。用户反馈是影响排名的核心因素。这让Gartner的洞察被全球CIO(首席信息官)、CTO(首席技术官)当作重要参考。

近二三十年,全球500强企业在进行IT招标采购时,常常把Gartner魔力象限作为入围名单的第一道筛选工具。

Gartner魔力象限分成两个坐标。横轴是战略完整性,纵轴是落地能力。纵轴越靠上,横轴越靠右,排名通常越高。

战略完整性,主要评估厂商对市场的理解、产品路线图、创新能力和商业模式等。这部分调研,会通过厂商高管访谈、调查问卷进行定性。

落地能力,主要评估产品的实际功能、可扩展性、客户体验、运营能力和客户反馈等。Gartner会要求厂商提供典型客户的访谈名单,被访谈对象不是高管,而是一线工程师和开发者。Gartner还会进行大量匿名调研和访谈以验证真实性。

谷歌AI平台全球第一 火山引擎中国第一

此次Gartner《AI应用开发平台魔力象限》中,领导者象限包括谷歌、微软、亚马逊、IBM,挑战者象限包括火山引擎、阿里云、腾讯云、Palantir(全球知名的数据治理分析企业)、LangChain(全球知名的大模型开源框架),远见者象限包括OpenAI,特定领域者象限是CoreWeave(一家英伟达投资的独立云厂商)。

我们了解到,此次参与Gartner测试的产品,以各家MaaS(Model as a Service,模型即服务)平台为主。其中包括谷歌的Vertex AI、微软的Azure AI Foundry、亚马逊的Bedrock和SageMaker。这些都是全球开发者广泛使用的AI应用开发工具。中国企业中,火山引擎参与评估的产品,是火山方舟。

在严格的调研方法和激烈的国际竞争下,火山引擎的AI应用开发落地能力跻身中国第一、全球第五,说明中国乃至全球市场,它正在成为一朵更具影响力的AI云。

Gartner报告评价称,火山引擎提供了标准化产品功能以及灵活的定价方案。在公共云环境中,用户可以选择按用量计费的模式。在私有云环境,可以购买订阅许可证或永久许可证。该公司主要通过直销渠道进行产品销售。平均而言,交易能在几周内完成。该公司也非常重视客户的满意度,致力于项目顺利交付、成功上线以及持续使用。

谷歌AI平台全球第一 火山引擎中国第一

为何能入局?


我们了解到,火山引擎在Gartner魔力象限位居前列,一个重要原因是,它的模型能力、工程能力、开发者体验有优势。这吸引了一批创新企业和前沿开发者。

字节跳动的豆包大模型目前覆盖了语言、音频、图片、视频等领域,并达到了行业领先水平。今年9月,豆包1.6版本实现了VLM(视觉模型)与Auto Thinking(自动切换思考能力)的融合。简单理解,它能更像人类的思考模式,能让AI应用的能力上限进一步提升。

截至今年9月,豆包大模型日均Token调用量从2024年5月的1200亿增长至今年9月的30万亿,18个月增长了253倍。

谷歌AI平台全球第一 火山引擎中国第一

火山引擎的基础设施,长期面临字节跳动内部业务的严苛考验。抖音、豆包等“国民产品”带来了超高并发、超低延迟和极端成本的挑战,这不断逼迫火山引擎的技术往前走。

火山引擎的一位技术人士曾对我们表示,以豆包App(应用程序)为例,它的用户体验和文字吞吐效率(如TTFT首字延迟速度、TPOT每秒吐字速度等指标)直接相关。这对背后提供技术支撑的火山引擎MaaS平台要求很严苛。这些技术指标也是一线开发者真正关心的。

今年初DeepSeek爆发后,几乎所有云厂商都上架了DeepSeek-R1。在同一张“试卷”上,DeepSeek-R1推理速度更快,意味着基础设施效率更高。

AI基础设施创业公司TensorChord今年3月28日的基准评测显示,火山引擎吞吐效率更高,相邻Token平均间隔时长更短。火山引擎的每秒Tokens(词元,AI推理算力计量单位,一个Token可以是单词、标点、数字、符号等)输出量甚至是一些厂商的2.6倍。

谷歌AI平台全球第一 火山引擎中国第一

中国移动市场调研机构QuestMobile 2025年9月数据显示,豆包APP月活跃用户是1.7亿人,目前还是免费的。对字节跳动来说,豆包用户每次对话,都要消耗宝贵的算力资源。那么,要如何尽量降低算力成本?

这要求火山引擎像“榨油”一样,把每一张芯片都压榨出更多Token(文章详见《为榨干每一张GPU价值,火山引擎又进化了》)。

在基础设施层,字节跳动庞大的内部业务(如抖音、豆包、今日头条),可以平摊算力成本。字节跳动技术团队会将所有芯片资源变成一个统一的弹性资源池。技术团队会针对内部、外部业务需求“削峰填谷”,进行高效、合理、市场化的调度,提高算力利用率。

还有一种当下流行的做法是,通过多种技术手段,提升大模型的“记忆力”(上下文缓存Context Cache,通常被称为KV Cache)。这可以让模型在每次对话中都能记起上次对话的内容,无需重复传输并计算庞大的历史上下文。好处是,它能减少Token消耗量,进而节省算力成本。

火山引擎的一位算法负责人今年6月曾对我们表示,火山引擎推理算力毛利率高于行业平均水平。以Doubao-1.5-pro API((应用程序接口))为例,它的毛利率至少在50%以上。

由于对Token成本有更好的控制能力,2024年5月火山引擎在国内率先将Token价格降低90%以上。这倒逼其他云厂商跟进降价,一些厂商的推理算力甚至一度被打到负毛利。

低延迟和低成本只是一方面,对开发者来说,降低AI应用开发门槛,还需要一系列便捷的AI开发工具与API。

一个AI应用背后往往是多模型支撑的,开发者需要根据成本、效果随时切换不同的模型。为此,火山引擎提供了智能路由模式,允许开发者同时调用豆包、DeepSeek等多种模型,自动选择效果更优、成本更低的模型。

今年3月,OpenAI最早上线了Response API(响应式API)功能。这是一个专门为Agent设计的接口。在国内,火山引擎6月率先跟进了这一功能。响应式API是专为Agent的多轮复杂任务设计的。它可以让Agent有更好的“记忆力”。在多轮调用中,这可以消耗更少的Token,节省算力成本。开发者可以把更多精力关注于应用本身。

谷歌AI平台全球第一 火山引擎中国第一

低成本、高效率、更易用,这让火山引擎吸引了一批创新企业和前沿开发者。火山引擎在中国Token市场份额不断扩大(文章详见《Token市场占据半壁江山,火山引擎在打什么牌?》)。

国际市场调研机构IDC 9月19日公布的《中国大模型公有云服务市场分析(2025H1)》报告显示,火山引擎在大模型公有云服务市场(即通过MaaS模型平台调用Token市场)位居国内第一,2025上半年市场份额49.2%,接近半壁江山。在IDC 4月报告中,火山引擎2024年在该市场份额是46.4%。

谷歌AI平台全球第一 火山引擎中国第一

差距在哪里?


在Gartner这份魔力象限,中国云厂商如火山引擎、阿里云、腾讯云都在挑战者象限,领导者象限全是国际云厂商——亚马逊、微软、谷歌。

那么,中国云厂商和国际云厂商的差距在哪里?

一位中国云厂商大模型技术负责人对我们表示,芯片性能、模型能力,以及技术标准的定义能力,这些都是中国企业有待提升的地方。

中国企业无法合规获取全球最顶尖的芯片。这导致基础设施的规模、性能和国际企业有差距,模型能力也稍逊一筹。

另一个重要因素是,中国企业的技术标准定义能力还不足。2024年以来,亚马逊投资的大模型创业公司Anthropic提出了MCP(模型上下文协议,也可认为是AI应用的接口)协议,谷歌提出了A2A(Agent to Agent,智能体到智能体)协议等应用拓展标准。这些协议由于使用广泛,正在成为事实上的行业标准。因此,中国企业选择追随使用这些技术标准。

如何缩小差距,实现弯道超车?一种观点是,既然AI云才是未来,云计算公司的战略、产研、销售都要围绕MaaS重新设计。

原因是,传统云计算(以CPU为核心的云计算),正在朝着AI云(以GPU为核心的云计算)转型。MaaS,也就是模型平台,在AI云的技术架构中的重要性正在提升。

MaaS是使用Token的重要入口,Token消耗量又在以百倍速度增长。虽然通过MaaS调用Token,目前在中国算力市场还不是最主流的方案,但创新企业和前沿开发者的需求,通常比IT市场大盘跑得更快。这些领先需求会随着技术成熟,逐渐变成主流。这就像云计算,15年前只是少数互联网企业尝鲜使用,今天却成为主流技术。

国家数据局今年8月数据显示,2024年初中国日均Token消耗量1000亿。截至2025年6月底,中国日均Token消耗量已经突破30万亿。一年半时间增长了300多倍。

我们从多家中国云厂商相关人士处了解到,2024年中国各个云厂商的Token调用收入普遍只有千万元、数亿元,总和不超过10亿元,但它正在以10倍以上的速度成长。

上述中国云厂商大模型平台负责人的看法是,传统云计算必须快速向AI云转型,销售、产研团队都围绕MaaS重新设计目标。

我们了解到,字节跳动上下笃信AI的价值。一位火山引擎人士说,这是“植根于公司诞生之初的文化基因”。

大模型浪潮来临,火山引擎内部共识是,AI云才是云计算的最终形态。基于这个战略思考,火山引擎销售、产研团队都在围绕MaaS重新设计目标。

火山引擎管理层的判断是,未来三至五年,MaaS将成为火山引擎的主要营收来源。因此,在销售团队的考核、复盘中,MaaS收入被认为是首要目标。原因是,通过MaaS调用Token,是更先进、健康的算力消费形式。火山引擎MaaS业务毛利率,是传统云计算GPU租赁模式的数倍。因此火山引擎的销售、市场资源优先向MaaS倾斜。

火山引擎的产研团队也在围绕MaaS提升工程能力。一位中国云厂商大模型业务负责人的看法是,传统云计算通常围绕着服务器稳定性、资源租赁进行产研,资源也必须分散到IaaS(基础设施)、PaaS(平台软件)、SaaS(应用软件)等成百上千条产品线。但AI云更强调算力的灵活调度、模型能力的直接输出,MaaS平台功能的完整、易用程度对开发者更重要。

一个被云计算行业人士广泛认同的观点是——AI云转型需要坚定的战略。如果战略不坚定,产研、销售都容易“船大难掉头”。因为新旧业务会不断拉扯销售、产研资源。

一位中国云厂商技术人士对我们解释,在传统云计算营收中,MaaS收入只是零头。极端情况下,同样的算力,客户按Token付费成本可能仅为租赁GPU服务器的十分之一。销售团队容易缺乏动力销售MaaS产品,更愿意通过GPU租赁销售算力。产研团队也容易把新AI需求“打补丁”的方式嫁接到旧的技术架构中,这会让开发者体验不够友好。

一位中国云厂商高管今年9月曾对我们表示,AI云是一个长达5年-10年的长期趋势。国际云厂商的AI转型速度很快。中国云厂商必须把目标瞄准亚马逊AWS、微软Azure、谷歌GCP这几家国际云巨头。中国云厂商必须在更激烈的国际竞争中打磨技术、扩大收入。

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com