2025WAIC丨腾讯云副总裁吴运声:把AI变成全新生产力

互联网
2025
07/27
22:27
分享
评论

“腾讯将通过扎实的底层模型、好用的平台工具、广泛的应用生态,让AI建得起、跑得稳、用得好,让每个人、每个企业,都能用上真正好用的AI。”

7月27日,在2025世界人工智能大会腾讯论坛上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示。

腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声

在技术演进层面,吴运声指出,当前大多数AI系统仍处于“短期记忆”阶段,尚难支撑复杂、高维的业务场景。要实现AI的实用性跃迁,需突破三个关键方向:

第一,具备“长期记忆”能力,能够处理长链任务、跨对话记忆关键信息,并根据上下文动态进化,打通任务链条,实现真正意义上的任务执行闭环;

第二,迈向“全模态交互”,融合语言、图像等多模态输入输出,推动AI从理解语言走向理解世界,从“能答”跃升为“能动”;

第三,构建“多智能体协同”架构,通过任务拆解、容错补位等机制,构成自组织、自进化的“AI团队”,全面提升系统的鲁棒性与可靠性。

在模型迭代方面,腾讯混元大模型持续“小步快跑”,推进技术性能与工程能力双重突破。腾讯最新发布的TurboS,是业界首个落地的超大规模混合线性MoE模型,以“性能强、推理快、成本低”的优势稳居全球权威榜单前列。在生成领域,混元模型不仅能极速生成高清图像,更具备领先的3D建模能力,已广泛应用于AI设计智能体Lovart、3D打印平台MakerWorld,模型社区下载量已超过230万次。

在平台工具与生态建设上,腾讯形成了覆盖B端与C端的“双平台”智能体体系。面向企业用户,腾讯云智能体开发平台支持多Agent协同、任务流编排和多形态部署,具备强大的系统集成与业务适配能力。本次升级新增了零代码多Agent协同机制、千万行级表格问答支持以及智能工作流动态调整功能,已应用于如QQ浏览器QBot的全自动任务执行系统,以及与邯郸公积金中心共建的“数字柜台”,后者已实现政务处理效率提升80%。

面向个人创作者,腾讯元器平台聚焦公众号智能体的构建与生态拓展,打通腾讯文档、微信支付MCP等资源,支持一键同步知识库、自动分发等功能。育儿类账号“童爸育儿”通过元器平台构建AI分身,7×24小时自动答疑,准确率超过95%,已累计服务6万多个家庭。

“AI不仅服务产业,更承载着科技向善的信念。”吴运声表示,腾讯也正持续拓展AI在科研与文化等领域的边界探索。

在科技领域,腾讯联合科研团队打造了全球首个甲骨文多模态数据集,并应用AI能力辅助文物修复。在天文科研中,AI探星计划已协助发现45颗新脉冲星,推动AI与基础科学研究的深入结合,努力实现技术与文明的良性互动,为可持续未来打开更多可能。

面向未来,腾讯也在推动智能体技术的人才培育与应用创新。7月27日,腾讯云正式启动首届黑客松Agent应用创新挑战赛,面向学生、企业与个人开发者,鼓励通过零代码或低代码方式,探索多元智能体应用场景,激发更广泛的AI创新力。

以下为演讲全文:

各位嘉宾、媒体朋友们,大家好,欢迎来到腾讯论坛!

我是腾讯的吴运声。今天,我想和大家聊一聊大模型等核心技术的发展趋势,分享我们在打造“更好用的AI”方面的一些思考与实践。

我将从技术演进、模型迭代、平台工具和场景落地四个维度展开。

过去几年,大模型技术突飞猛进,但今天的大多数AI仍停留在“短期记忆”阶段——对话一长就断,换话题就忘,系统提示词一旦写死,能力就被锁死。

我们认为,真正能落地复杂业务的AI,必须具备“长期记忆”:它要能处理长链任务,跑得稳、记得住;要能跨对话,记住用户关键信息;还要能根据任务动态加载、替换、甚至自创工具,实现自我进化。

同时,传统的“图文问答”已难以满足用户日益增长的真实需求。

目前来看,我们正在迈向全模态交互系统,它能融合语言、图像、语音、动作等多模态输入输出,让用户所见即所得,所说即所动。

更重要的是,它还得感知变化、执行动作,把自然语言转化为数字人演示或机器人操作,真正打通AI与现实世界的最后一公里。

这是从“能答”到“能动”的关键跃迁。

另外,我们也发现,在面对复杂任务场景,单一智能体的能力也越来越难以支撑。  

我们正逐步走向“多智能体协同”架构:不同Agent分工协作、并行执行,构建一个自组织、自进化的“AI团队”。

平台需要具备任务拆解、执行重排、Agent容错补位等机制,真正实现系统级协同,支撑企业级复杂任务,提升稳定性、可解释性和可靠性。

在这样的技术趋势下,今年以来,腾讯混元大模型持续迭代、小步快跑。年初发布的旗舰模型TurboS,率先实现混合线性注意力机制与MoE架构的融合,是业内首个落地的超大规模混合线性MoE模型,性能强、推理快、成本低,长期稳居全球权威榜单前列。

基于TurboS,混元T1进一步提升推理与代码生成能力,已在多个高难任务中展现国内领先水平。以此为基座,混元家族不断拓展:比如端到端语音模型Voice、多模态理解模型Vision相继推出。尤其在多模态理解上,今年连续发布多款模型,在LMArena Vision全球大模型权威榜单中获得国内榜首,在中文能力上稳居全球第一梯队。

混元在多模态生成方面同样领先,不仅能极速生成高清图像,还具备人物一致性可控的视频生成和全球领先的3D建模能力。其3D模型已被AI设计智能体Lovart、3D打印平台MakerWorld广泛调用,展现出强大的产品价值与技术潜力。

目前,混元模型已在腾讯内部大规模落地,为响应产业和开发者需求,今年我们将全系中小规模模型全面开源。相较于千亿级模型,这些轻量模型更适合在算力受限环境下部署,能提供高性能、低成本的推理体验。比如刚刚开源的混元A13B,仅百亿参数,就实现媲美千亿模型的能力,开源三天登上Hugging Face趋势榜第二。  

在多模态生成方面,混元也持续开放文生图、视频、3D等领先能力,提供接近商用水平的开源模型,图像和视频衍生模型超千个,3D模型社区下载量超过230万。

今天,我们正式发布并开源业界首个3D世界生成模型——混元3D世界模型1.0。用户只需要输入一句话或一张图,几分钟内即能生成可360°漫游、可编辑的虚拟世界,输出标准化3D资产,兼容主流引擎,大幅缩短内容生产周期。

此外,面向端侧的0.5B到7B系列小模型、混元Large-Vision、GameCraft等,也将在近期陆续开源,助力开发者高效构建AI原生应用。

基于混元大模型强大的通用能力,并结合腾讯云智能体开发平台、腾讯元器以及具身智能开放平台等多元化平台能力,目前我们已经构建了覆盖丰富场景的应用生态,持续推动AI从“能用”向“好用”迈进。

例如,我们推出了以元宝为代表的一系列AI原生产品,真正实现了AI与用户生活和工作场景的深度融合。同时,微信、QQ浏览器等超级应用借助AI赋能,全面提升了用户体验与工作效率。

此外,我们还针对办公、教育、生活等多样化场景,推出了CodeBuddy、旅游规划Agent等智能体产品,深度嵌入生产生活流程,成为用户贴身的智能助手与可靠伙伴。

在平台工具支撑方面,目前我们已经构建了一套统一的智能体平台底座,支持ToB和ToC两个方向的智能体开发,实现能力共享、协同演进。

ToB侧,我们依托腾讯云智能体开发平台,服务企业级复杂场景。平台支持多Agent协同、任务流编排,同时提供企业所需的云资源连接、安全运维和专属技术服务,适配公有云、私有云和混合云的多形态部署需求。

ToC侧,我们基于“腾讯元器”,面向普通开发者,提供简单易用的AI应用构建工具。开发者可以在熟悉的生态中,结合公众号、微信支付MCP、C端渠道分发等能力,快速上线专属智能体。  

这两套产品虽面向不同人群,但底层共享同一个平台能力栈,实现了开发、运行、分发的一体化协同。同时,我们构建了覆盖全平台的流量支持机制。无论是企业打造SaaS级AI助手,还是开发者推出C端爆款应用,都能在腾讯获得可持续的流量与运营支持。

近期,工信部国家工业信息安全发展研究中心、及旗下赛昇实验室也对市面上的智能体平台进行了比较全面的技术评测。

结果显示,腾讯云智能体开发平台在多项核心能力上都比较领先。例如,在构建自规划自决策的Agent领域,核心能力全面领先;在工作流搭建中“端到端、意图识别、参数提取”等准确率领先;企业通过RAG为大模型接入知识库时很关注的“无关知识拒答准确率”,也处于领先位置。

今天,腾讯云智能体开发平台也迎来了全新升级,重点体现在三大核心能力的提升:

在Multi-Agent能力方面,我们首创了零代码配置的多Agent协同机制,用户只需通过简单的转交关系配置,即可实现模型驱动的自动协作,构建“多专家”智能体体系,显著减轻单体Agent的负担。

针对知识问答场景,我们提供了知识库Agent的最佳实践。平台支持多步检索、多智能体协作处理复杂问题,实现“易用性”和“复杂适配能力”的高度统一,帮助企业快速部署高质量的知识问答系统。

在RAG能力上,平台经过大量企业实战场景的打磨,具备扎实领先的产品能力。企业可用极小投入,快速完成知识更新和问答系统落地。

此次升级还进一步扩展了知识源对接能力,支持连接主流数据库,实现千万行级表格问答;也支持接入腾讯文档,直接导入在线文档进行知识问答。  

在工作流方面,我们引入具备全局视角的智能Agent,不仅能动态感知用户意图,还能实现智能的节点回退与路径调整,使多轮交互更加自然、灵活、智能。

在腾讯内部,目前腾讯云智能体开发平台已经应用于问答系统、办公提效、知识管理、客服辅助等多个业务场景。

比如,QQ浏览器基于该平台打造的QBot,能够帮助用户自动执行任务,从检索、验证到整理,全程无需人工干预,真正做到“所想即所得”。

对外服务方面,我们与邯郸公积金中心合作打造的“数字柜台”,是AI政务落地的标杆案例之一。

客户通过智能体自动解析政策、串联流程、进行身份核验与审批,整个业务效率提升80%,AI答复准确率超82%,实现无纸化、自动化、高准确的政务服务体验。

介绍完腾讯云智能体开发平台,我也和大家再分享下腾讯元器带来的关键升级,这次产品升级主要聚焦三个方向:

第一,全面提升公众号智能体的生产力。通过Multi-Agent协同、MCP接入和矩阵号一键发布,智能体将更高效地完成复杂任务,从创作到管理全面提效。  

第二,深入打通腾讯生态能力。用户可一键将公众号内容转为知识库,腾讯文档作为“内容外脑”自然接入,同时基于微信支付MCP能力,帮助开发者真正跑通“创作—服务—变现”的商业闭环。

第三,拓展C端流量分发新通道。除即将上线的应用宝AI专区外,我们也将开放更多场景化入口,为优质智能体提供精准流量扶持。

自腾讯元器推出公众号智能体以来,我们见证了知识创作者从内容输出迈向智能服务的跨越。其中,儿童健康科普博主「童爸育儿」的故事非常典型。

这个博主拥有百万粉丝和70多个社群,过去每天花4小时回复私信、评论,创作时间被严重压缩。直到他尝试使用腾讯元器——完全不懂技术的他,仅用10分钟,就将5年积累的2000多篇文章一键导入知识库,构建了属于自己的「数字分身」。

这个智能体被接入公众号后台、菜单栏和文章入口,7×24小时自动答疑,回答准确率超过95%,比他自己翻找资料还高效。如今已累计服务6万家庭,解答超40万个育儿问题。

更重要的是,借助微信支付MCP能力,读者还能为专业内容打赏,实现从“免费输出”到“价值闭环”的突破。

从面向B端用户的腾讯云智能体开发平台,到面向C端的腾讯元器,目前我们的双智能体平台已经广泛落地,助力更多客户、用户完成业务升级、需求实现。

AI不仅仅服务产业,也承载着我们对科技向善的信念。一直以来,腾讯也在基于AI能力,去做一些包括科学、文化等相关领域的探索。

比如,我们构建了全球首个甲骨文多模态数据集,即将推出具备文字补全和形体还原能力的甲骨文智能体,助力中华文明的数字化保护;我们还在用AI辅助文物修复,相关API已开放,帮助考古更高效、更精细。

在AI探星项目中,我们协助科研团队发现45颗新脉冲星,效率是全球平均的两倍,并观测到多个快速射电脉冲事件,为探索宇宙打开新窗口。

最后,为了推动智能体技术的应用创新与人才培养,腾讯云今天也正式启动黑客松·Agent应用创新挑战赛。

本次大赛将依托腾讯云智能体开发平台与腾讯元器,鼓励开发者以零代码或低代码方式,结合RAG、多Agent协同、Workflow等技术,探索多元智能体应用场景。  

大赛面向学生、企业和个人开发者,奖励丰厚,欢迎大家扫码参与,一起激发智能体的更多可能。

以上就是我今天分享的全部内容。

我们希望,通过扎实的底层模型、好用的平台工具、广泛的应用生态,让AI真正建得起、跑得稳、用得好,让每个人、每个企业,都能用上好用的AI。

谢谢大家。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3