9月17日,国际数据公司(IDC)公布的《中国大模型公有云服务市场分析,2025H1》报告指出,2025年上半年,中国公有云上大模型调用量达536.7万亿Tokens。其中,火山引擎以49.2%的市场份额位居中国市场第一,阿里云、百度智能云分别占比27%、17%,位列第二、第三位。
(统计口径:各大云厂商对外部客户提供的大模型公有云服务调用量,不包含自有业务调用。如火山引擎统计,不包括抖音APP、豆包APP、即梦APP等字节跳动一方产品调用量。)
今年,随着推理模型、多模态模型能力的进一步提升,模型调用的商业模式逐渐成熟。IDC指出,相比2024全年114万亿Tokens的市场规模,仅2025年上半年就实现了近400%的增长。市场增长的驱动力一方面来源于原有的泛互联网、企业级的应用场景的扩展以及客户群体下沉,另一方面来源于不断丰富的模型体系。
市场持续快速增长的同时,2025年上半年,火山引擎凭借49.2%的份额依然稳居市场第一,且份额占比有所提高。此前,IDC公布2024年大模型公有云调用量,火山引擎以46.4%的市场份额位居中国市场第一。
中国公有云大模型调用量月度环比增长,2025H1中国大模型公有云服务市场按照Tokens计算的调用量达5367270亿次。
IDC预测,未来中国生成式AI软件将持续高速增长,在基础模型持续创新、模型开发应用工具链不断完善以及智能体的爆发下,该市场规模2028年将达到482.4亿元人民币,未来仍将有数百倍增长空间。
Agent应用爆发前,火山引擎多模态和深度推理大模型需求高涨
IDC报告指出,AI应用将是未来驱动模型调用的最核心因素,尤其是智能体的爆发。其中,多模态和深度推理大模型成为最主要的迁移力。
在多模态模型的需求上,近75%的组织已经评估了采用多模态基础模型和单模态基础模型的应用程序,预计多模态模型将提供更丰富、更细致入微的功能。 使用多模态基础模型构建的应用程序可以处理和整合多种类型的数据,这些数据更丰富、更能感知上下文,从而大大提高准确性、效率和用户体验。
这也是各大云厂商在今年发力的重点:火山引擎、阿里云、腾讯云等大模型云厂商在语音、图像、视频等多模态领域迅速迭代。其中,火山引擎豆包大模型家族自2024年推出以来,多模态模型效果持续领先。
今年,火山引擎相继推出豆包大模型1.6、豆包·视频生成模型Seedance pro、豆包·实时语音模型、豆包·图像创作模型Seedream 4.0等,其中多个大模型登顶Artificial Analysis、LMArena竞技场。这些多模态大模型有效加速了AI应用落地。
Seedream 4.0位居Artificial Analysis 文生图榜单第一
Seedream 4.0位居Artificial Analysis 图像编辑榜单第一
*截至 2025年9月
Seedream 4.0位居LMArena文生图榜单第一
Seedream 4.0位居LMArena图像编辑榜单第二
*截至 2025年9月
同时,今年2月DeepSeek-R1,加速了国内市场,从模型训练向推理服务迁移。
随着市场迅速向推理服务迁移,推理Tokens量级变大,企业也越来越重视资源效率、管理运营成本和可持续发展。
IDC指出,火山引擎为用户提供了丰富的大模型以及完善的工具链,通过更优性能的推理服务,其MaaS平台火山方舟2025H1按照Tokens计算的调用量实现了398.2%倍增长,增长的驱动力一方面来源于客群的扩展,另一方面来源于Agent应用。
面向Agent应用,火山引擎提供了极致服务,能做到模型的API在吞吐、并发、首字延迟、平均延迟、成本优化、资源保障、安全可信这些客户可感知指标上,均为行业领先。同时,火山引擎还提供了先进技术,在算子层(算法优化)、系统层(PD分离)对模型进行了深度优化,包括:PD分离架构、KV-Cache缓存加速、自研推理加速引擎 xLLM、自研 vRDMA 网络等。
除了模型本身,IDC认为,Agent广泛渗透需要全栈技术的重构。AI时代,技术主体正在从Web、APP逐渐变成Agent,这意味着开发范式将发生重大变化。
在承接最多市场需求的推动下,火山引擎率先推出以大模型为核心、以生产级可用的复杂Agent为负载的AI云原生架构,帮助开发者屏蔽底层硬件差异和开发复杂性,直接从云端获得高质量、低成本的 Tokens,加速企业Agent落地和业务创新。
AI+泛互联网深度融合,各行业加速AI渗透
随着模型能力的持续提升、以复杂Agent为核心的AI云原生基础设施进一步完善,新场景正在被不断解锁。此前,火山引擎在今年6月Force大会上透露Tokens消耗快速增长背后,AI工具的Tokens消耗在快速增长,5个月增长了4.4倍。
其中AI搜索增长10倍,AI 编程增长了8.4倍。视觉理解模型则是另一个助推器。比如,K12的在线教育,由于VLM模型能力不断提升,Tokens消耗5个月增长了12倍,而新出现的智能巡检,视频检索等数个场景也快速实现日均百亿tokens的突破。
IDC报告指出,预计大模型服务市场仍有百倍以上空间,用户群体正在从泛互到传统企业渗透。在行业里,大模型的应用不断深化。
在消费电子行业,企业将大模型应用在语音助手,创作工具,效率提升等诸多场景,全球Top10手机厂商有9家和火山引擎深度合作。
在汽车行业,大模型覆盖了从智能座舱,到智能营销,到自动驾驶标注等全流程场景,豆包大模型助力奔驰、宝马、奥迪、特斯拉、蔚来等八成主流汽车AI升级。
在金融行业,火山引擎为客户提供智能展业、投顾、投研等大模型应用方案,已服务华泰证券、国信证券等数十家券商和基金公司,招商银行、浦发、民生等70%的系统重要性银行。
在教育行业,火山引擎面向教学服务、科研辅助、师生服务和管理辅助等场景,提供大模型解决方案,已与北京大学、浙江大学、南开大学等超五成985高校达成合作,持续推动高等教育智能化转型。