NVIDIA NIM 微服务和 AI Blueprint 助力开发者和发烧友在 PC 上构建 AI 智能体和创意工作流
拉斯维加斯—CES—2025 年 1 月 6 日— NVIDIA 今日发布能在 NVIDIA RTX™ AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。
这些基础模型以 NVIDIA NIM™ 微服务的形式提供,由全新 GeForce RTX™ 50 系列 GPU 加速,提供最高可达 2375 AI TOPS 和 32GB 显存。基于 NVIDIA Blackwell 架构的 RTX 50 系列 GPU是首批支持 FP4 计算精度的消费级 GPU。与上一代产品相比,AI 推理性能提升 2 倍,并让生成式 AI 模型在本地以更小的显存占用空间运行。
长期以来,GeForce™ 一直是 AI 开发者的重要平台。早在 2012 年,首个由 GPU 加速的深度学习网络 AlexNet 就是在GeForce GTX 580 上进行训练的。在去年发表的 AI 研究论文中,超过 30% 都提及了对 GeForce RTX 的使用。
现如今,在生成式 AI 和 RTX AI PC 的助力下,任何人都能成为开发者。借助 AnythingLLM、 ComfyUI 和 LangFlow 等新一代低代码和无代码工具,发烧友能够通过简单的图形用户界面 (GUI) 在复杂的工作流中使用 AI 模型。
连接到这些 GUI 的 NIM 微服务使获取和部署最新生成式 AI 模型轻而易举。NVIDIA AI Blueprint
基于 NIM 微服务构建,旨在为数字人、内容创作等应用提供易于使用的预配置参考工作流。
为满足 AI 开发者和发烧友日益增长的需求,领先 PC 制造商和系统集成商即将推出搭载 GeForce RTX 50 系列 GPU 且支持 NIM 的 RTX AI PC。
NVIDIA 创始人兼首席执行官黄仁勋表示,“AI 正在以光速发展,从感知式 AI 到生成式 AI,再到如今的代理式 AI。NIM 微服务和 AI Blueprint 为 PC 开发者和发烧友探索 AI 提供了基础模块。”
NIM 提供迅捷 AI 体验
基础模型,即使用海量原始数据训练而成的神经网络,是生成式 AI 的基础模块。
NVIDIA 将发布一系列来自包括 Black Forest Labs、Meta、Mistral 和 Stability AI 等顶尖模型开发者的适用于 RTX AI PC 的 NVIDIA NIM 微服务。涵盖大语言模型 (LLM) 、视觉语言模型、图像生成、语音、检索增强生成 (RAG) 的嵌入模型、PDF 提取和计算机视觉等应用场景。
Black Forest Labs 首席执行官 Robin Rombach 表示,“支持 FP4 计算精度的 GeForce RTX 50系列 GPU 将使一大批此前仅适用于大型数据中心的模型得以在 PC 上运行。把 Flux 打造成 NVIDIA NIM 微服务,让更多用户以更快的速度部署和体验 AI,同时提供超乎想象的性能。”
NVIDIA 今天还宣布推出 Llama Nemotron,这是一系列开放许可的基础模型,能够在各类代理式任务中提供极高的精度。Llama Nemotron Nano 模型将作为面向 RTX AI PC 和工作站的 NIM微服务提供,在指令遵循、工具调用、聊天、代码和数学等代理式 AI 任务方面表现出众。
NIM 微服务包含在 PC 上运行 AI 所需的关键组件,并针对 NVIDIA GPU 的部署进行优化,无论
GPU 在 RTX PC 、工作站,还是在云端。
开发者和发烧友将能快速下载这些 NIM 微服务,并可在带有适用于 Linux 的 Windows 子系统
(WSL) 的 Windows 11 PC 上设置和运行。
微软副总裁,Windows 业务负责人 Pavan Davuluri 表示:“AI 正在快速驱动 Windows 11 PC 创新,适用于 Linux 的 Windows 子系统 (WSL) 和 Windows Copilot Runtime 为 Windows 11 上的 AI 开发提供出色的跨平台环境。NVIDIA NIM 微服务为 Windows PC 提供优化,为开发者和 发烧友提供可立即集成到其 Windows 应用中的 AI 模型,从而进一步加速 Windows 用户的 AI 功能部署。”
运行在 RTX AI PC 上的 NIM 微服务将兼容先进 AI 开发和智能体框架,包括 AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow 和 LM Studio。开发者可以通过行业标准端点,将基于上述框架构建的应用和工作流连接到运行 NIM 微服务的 AI 模型,无论在云端、数据中心、工作站还是 PC 上,都可通过统一的接口使用最新技 术。
发烧友还可通过即将发布的 NVIDIA ChatRTX 技术 Demo 体验一系列 NIM 微服务。
让代理式 AI 拥有拟人表情
为了向 RTX 发烧友和开发者展示使用 NIM 微服务构建 AI 智能体和助手的方法,NVIDIA 今天首 度公开 Project R2X。这是一款具有视觉能力的 PC 虚拟形象,它可以让用户需要的信息触手可及、协助用户使用桌面应用、进行视频会议、阅读和总结文档等。
该虚拟形象采用全新生成式 AI 算法 NVIDIA RTX Neural Faces 渲染而成,这种算法可利用完全生成的像素来增强传统光栅化渲染。然后,面部通过基于扩散原理的全新 NVIDIA Audio2Face™- 3D 模型驱动动画,该模型可改善唇部和舌头动作。R2X 可以通过 CrewAI、Flowise AI 和 LangFlow 等开发者框架连接到 OpenAI 的 GPT 4o 或 xAI 的 Grok 等云端 AI 服务,以及 NIM 微服务和 AI Blueprint,如 PDF 检索器或其他 LLM。注册以关注 Project R2X 的更新。
AI Blueprint 即将登陆 PC
NIM 微服务还可通过 AI Blueprint(可在 RTX PC 上本地运行的参考 AI 工作流)供 PC 用户使 用。借助这些蓝图,开发者能够基于 PDF 文档创建播客、生成由 3D 场景引导的令人惊艳的图像等。
将 PDF 转换为播客的蓝图可从 PDF 中提取文本、图像和表格,创建可供用户编辑的播客脚本。它还能根据此脚本,使用蓝图中提供的语音或基于用户的语音样本生成完整的音频录音。此外,用户还能与 AI 播客主持人进行实时对话,了解有关特定主题的更多信息。
该蓝图利用像 Mistral-Nemo-12B-Instruct 这样的 NIM 微服务来处理语言,借助 NVIDIA Riva
进行文本转语音和自动语音识别,以及使用 NeMo Retriever 微服务集合进行 PDF 提取。
使用由 3D 引导的生成式 AI Blueprint,艺术家能对图像生成进行更精细的控制。虽然 AI 可以通过简单的文本提示生成令人惊叹的图像,但仅使用文字控制图像的内容极具挑战。有了上述蓝 图,创作者可以借助使用 Blender 等 3D 渲染器布置简单的 3D 物体来引导 AI 图像生成。艺术家可手动或使用 AI 生成创建 3D 资产,将其放置在场景中,并设置 3D viewport 相机。由 Flux NIM 微服务提供支持的预打包工作流将可以通过插件 (例如 Blender 中由开发者 ACGGit 开发的 ComfyUI-BlenderAI-node )使用当前布景生成与 3D 场景相匹配的高质量图像。
NVIDIA NIM 微服务和 AI Blueprint 将从 2 月起开始提供,首发支持的硬件包含 GeForce RTX 50 系列、GeForce RTX 4090 和 4080 以及 NVIDIA RTX 6000 和 5000 GPU ,未来还会陆续提供对其他 GPU 的支持。宏碁、华硕、戴尔、惠普、联想、微星、雷蛇将推出支持 NIM 的 RTX AI PC。
关注 NVIDIA CES 动向,了解 NIM 微服务、AI Blueprint 以及支持 NIM 的RTX AI PC 如何加速生成式 AI。
关于 NVIDIA
NVIDIA (NASDAQ: NVDA) 是加速计算领域的全球领导者。
# # #
该新闻稿所含若干陈述包括(但不限于)有关以下各项的陈述:NVIDIA 产品、服务和技术的优势、影响、性能,包括 NVIDIA RTX AI PCs, GeForce RTX 50 Series GPUs, NVIDIA Blackwell architecture, GeForce GTX 580, Project R2X, NVIDIA ACE and NIM microservices, NVIDIA AI Blueprints, NVIDIA Project DIGITS, NVIDIA Grace Blackwell platform, Llama Nemotron, NVIDIA ChatRTX, NVIDIA RTX Neural Faces, NVIDIA Audio2Face-3D model, Mistral- Nemo-12B-Instruct for language, NVIDIA Riva, NeMo Retriever,FLUX NIM microservice, GeForce RTX 4090 and 4080, and NVIDIA RTX 6000 and 5000 professional GPUs third parties using or adopting NVIDIA’s products and technologies, and the benefits and impact thereof; and AI advancing at light speed, from perception AI to generative AI and now agentic AI 均属前瞻性陈述,受制于可能导致结果与预期有重大差异的风险和不确定因素。可 能导致实际结果产生重大差异的重要因素包括:全球经济状况;我们依靠第三方来制造、组装、包装和测试我们的产品;技术发展和竞争的影响;新产品和技术的开发或者现有产品升级;我们产品或合作伙伴产品的市场认可度;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和接口变化;我们产品或技术在集成到系统中时发生的意外性能损失; NVIDIA 向美国证券交易委员会(SEC)提交最新报告中不时详述的其他因素,这些报告包括(但不限于)采用 10-K 表
的年度报告和采用 10-Q 表的季度报告。向SEC 提交的报告的副本均在 NVIDIA 的官方网站上发布,并可免费下载。以上前瞻性陈述并非未来表现的保证,仅以本协议日期为准;除法律要求外,NVIDIA 不承担更新以上前瞻性陈述以反映未来事件或情况的任何义务。
© 2025 NVIDIA Corporation 保留一切权利。NVIDIA,NVIDIA 商标 NVIDIA, the NVIDIA logo, ConnectX, CUDA, DGX, Project DIGITS, NGC, NVIDIA Grace, NVIDIA NeMo, NVIDIA NIM, NVIDIA RAPIDS and NVLink 均为 NVIDIA
Corporation 在美国和/或其他国家的商标和/或注册商标。其他公司和产品名称可能是与其相关的各家公司的商标。功能、价格、可用性和规格如有更改,恕不另行通知。