智谱推出GLM-5.1高速版：400 tokens/s 30秒生存成复杂网页代码

业界

2026

05/22

10:40

凤凰网科技

5月22日，智谱宣布面向部分企业客户推出GLM-5.1高速版API“GLM-5.1-highspeed”，模型输出速度达到400 tokens/s。智谱称，这一速度刷新了当前全球大模型厂商API的速度上限。

该模型基于旗舰级GLM-5.1能力开发，打破了此前“高速模型几乎总是轻量级模型”的行业惯例，首次在国产大模型中实现旗舰级能力与极致低延迟的兼顾。

高速版由智谱GLM团队与TileRT团队联合打造，通过推理引擎、调度系统与底层基础设施的系统级优化实现。据演示，在长程任务中，模型可在30秒内完成复杂网页的代码生成；在Agent Swarm场景下，可瞬间调度50个不同人格并行回答。

该API适用于AI编程、实时交互、商业决策、实时语音等对延迟敏感的场景，目前已向智谱MaaS平台部分企业客户开放。

【来源：凤凰网科技】

THE END

广告、内容合作请点击这里寻求合作

智谱技术

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

12月23日，智谱AI正式上线并开源GLM-4.7模型。新版本主要针对编程场景进行优化，提升了代码生成、任务规划与工具调用能力。

业界

9 月 2 日消息，智谱宣布自 9 月 1 日起推出 Claude Code 开发者专属套餐「GLM Coding Plan」—— 每月 20~100 元，适用于智谱最新旗舰模型 GLM-4.5 及 GLM-4.5-Air。

业界

10 月 14 日消息，智谱技术团队今天宣布开源文生图模型 CogView3 及 CogView3-Plus-3B ，该系列模型的能力已经上线“智谱清言”App。

业界