NVIDIA RTX 加速 PC 端 4K AI 视频生成,LTX-2 与 ComfyUI全面升级

互联网
2026
01/06
16:25
分享
评论

ComfyUI、LTX-2、Llama.cpp、Ollama、Hyperlink 等迎来全面 RTX 加速,解锁 AI PC 上的视频、图像与文本生成应用场景

2025 年是 PC 端 AI 发展的突破之年。

PC 级小语言模型 (SLM) 的准确率相比 2024 年提高近 2 倍,显著缩小与前沿云端大语言模型 (LLM) 之间的差距。AI PC 开发工具,如 Ollama、ComfyUI、llama.cpp、Unsloth 等日趋成熟,受欢迎程度同比翻倍,下载 PC 级模型的用户数量也较 2024 年增长 10 倍。

上述进展将推动生成式 AI 在 2026 年全面走向大众 PC 创作者、游戏玩家和生产力用户。

在 CES 上,NVIDIA 宣布为 GeForce RTX、NVIDIA RTX PRO 以及 NVIDIA DGX Spark 设备推出一系列 AI 升级,为 PC 上部署生成式 AI 解锁性能,降低显存需求,包括:

• 通过 PyTorch-CUDA 优化以及在 ComfyUI 中原生支持 NVFP4 / FP8 精度,视频和图像生成式 AI 性能至高提升3倍,显存占用至多降低 60%。

• 在 ComfyUI 中集成 RTX 视频超分辨率(RTX VSR),加速 4K 视频生成。

• 为 Lightricks 业界领先的 LTX-2 音视频生成模型开源权重版本做出优化,推出 NVIDIA NVFP8 量化模型。

• 为由 Blender 中的 3D 场景生成 4K AI 视频提供了一个 AI Blueprint,实现对输出结果的精确控制。

• 通过加速 Ollama 和 llama.cpp,将小语言模型 (SLM) 推理性能至高提升 35%。

• 为 Nexa.ai 的 Hyperlink 全新视频搜索功能提供 RTX 加速。

这些改进让用户能够在无缝运行先进的视频、图像和语言 AI 工作流的同时享受本地 RTX AI PC 带来的隐私性、安全性和低延迟优势。

 RTX PC 上实现 倍加速的 4K 视频生

生成式 AI 能够制作出令人惊艳的视频内容,但仅依靠提示词的在线工具往往难以精准控制其生成效果。而尝试生成 4K 视频几乎是不可能的,因为大多数模型体量过大,难以载入个人 PC 的显存。

1月6日,NVIDIA 推出了一套由 RTX 加速的视频生成工作流,使创作者能够更精准地控制生成结果,同时还能以 3 倍速度生成视频并将其提升至 4K 分辨率 – 仅需占用一小部分显存。

这套视频工作流支持现代创作者从分镜脚本出发,生成照片级写实画面的关键帧,并最终生成高质量的 4K 视频。整个流程由三大 AI Blueprint 模块构成,艺术家可根据需求灵活组合和调整:

• 3D 物体生成器:用于创建场景所需的资产。

• 3D 引导的图像生成器:用户可在 Blender 中搭建场景,并据此生成照片级写实的关键帧。

• 视频生成器:根据用户设定的起始与结束关键帧来生成动画视频,并借助 NVIDIA RTX Video 技术将视频升级至 4K。

这一视频生成工作流由 Lightricks 的全新 LTX-2 模型实现,该模型于1月6日正式发布并开放下载。

LTX-2在本地 AI 视频创作取得重要里程碑,其生成效果可与领先的云端模型媲美,能生成长达 20 秒且视觉保真度极高的 4K 视频。模型内置音频功能、支持多关键帧,并通过可控低秩适配增强的高级条件控制功能,使创作者无需依赖云端,即可获得电影级的画质与精细控制。

这套工作流在底层由 ComfyUI 驱动。过去数月,NVIDIA 与 ComfyUI 团队紧密合作,使其在 NVIDIA GPU 上的性能提升了 40%,最新版本增加了对 NVFP4 与 NVFP8 的支持,在 RTX 50 系列 GPU 上采用 NVFP4 格式可实现 3 倍的性能提升、显存占用降低 60%;采用 NVFP8 格式则可实现2倍的性能提升、显存占用降低 40%。

目前,NVFP4 和 NVFP8 Checkpoints 现已在 ComfyUI 中直接开放给部分热门模型,包括 Lightricks 的 LTX-2、Black Forest Labs 的 FLUX.1 与 FLUX.2,以及阿里巴巴的 Qwen-Image 和 Z-Image。用户可在 ComfyUI 中直接下载,后续还将支持更多模型。

在视频生成完成后,用户可通过 ComfyUI 中全新的 RTX Video 节点,在数秒内将视频放大至 4K分辨率。该图像放大 (Upscaler) 功能可实时运行,锐化画面边缘并消除压缩伪影,输出清晰的画面。RTX Video 将于下个月正式登陆 ComfyUI。

为了帮助用户突破 GPU 显存限制,NVIDIA 与 ComfyUI 团队合作,进一步优化了其 weight streaming 功能。启用该功能后,当显存不足时,ComfyUI 可调用系统内存,从而在主流 RTX GPU 上运行更大规模的模型与更复杂的多阶段节点图。

这套视频生成工作流将于下个月开放下载,而 LTX-2 视频模型的开源权重以及 ComfyUI 的 RTX 相关更新现已上线。

全新的 PC 文件与视频搜索方

几十年来,PC 上的文件搜索方式几乎没有发生变化,仍主要依赖文件名和零散的元数据。这种方式让用户想要找到一年前的某个特定文档变得异常困难。

Hyperlink 是由 Nexa.ai 推出的本地搜索智能体。它可以将 RTX PC 变为一个可搜索的知识库,支持以自然语言提问,并在结果中提供可追溯的引用来源。它能够扫描并索引文档、PPT、PDF 以及图像,让搜索不再依靠猜测文件名,而是基于内容和需求本身。所有数据均在本地处理并保存在用户的 PC 上,以确保隐私与安全。此外,Hyperlink 还支持 RTX 加速,在 RTX 5090 GPU 上,索引文本和图像文件的速度约为 每 GB 30 秒,查询响应时间仅3秒。相比之下,使用 CPU 索引文件每 GB 则需要约1小时,查询响应时间长达90秒。

在 CES 2026 上,Nexa.ai 发布了 Hyperlink 的全新测试版本,新增对视频内容的支持,使用户可以在本地视频中搜索物体、动作以及语音内容。这一功能可以帮助视频创作者快速查找所需的 B-roll 素材,或让游戏玩家找到自己赢得比赛的精彩瞬间,与好友分享。

体验 Hyperlink 的私有测试版本,请前往 Nexa.ai 官网注册。访问权限将从本月起陆续开放。

小语言模型 (SLM) 性能提升高达 35%

NVIDIA 携手开源社区,基于 llama.cpp 与 Ollama,为 RTX GPU 和 NVIDIA DGX Spark 桌面级超级计算机上的小语言模型带来了显著的性能提升。最新优化对混合专家模型 (MoE) 尤为有利,其中包括 NVIDIA 近期发布的 Nemotron 3 系列开放模型。

在过去四个月中,小语言模型的推理性能在 llama.cpp 上提升了 35%,在 Ollama 上提升了 30%。Ollama 的相关更新现已发布,而 llama.cpp 则已提供了用户体验升级,可显著加快大语言模型的加载速度。

这些性能提升将在 LM Studio 的下一次更新中实现,并将很快应用于各种智能体应用,例如全新的 MSI AI Robot 应用。MSI AI Robot 同样受益于 llama.cpp 的优化,使用户能够更便捷地控制 MSI 设备设置,并在即将发布的版本中整合最新性能的升级。

NVIDIA Broadcast 2.1 将虚拟补光带给更多 PC 

NVIDIA Broadcast 应用 AI 特效提升麦克风和摄像头的质量,成为直播和视频会议的理想之选。

2.1 版本对虚拟补光效果进行了性能优化。它不仅支持 RTX 3060 及以上 GPU,还能适应更多光照环境,提供更广的色温调节,并使用更新的 HDRi 基础贴图,实现常见于专业直播的双主灯效果。查看链接下载 NVIDIA Broadcast 的更新版本。

热门直播平台Bilibili即将集成更新后的虚拟补光效果。此次更新将使更多 GeForce RTX 用户能够在直播中获得更优质的面部补光效果。对 NVIDIA Broadcast 特效感兴趣的开发者可查看最新版本的软件开发工具包 (SDK)。

DGX Spark:将居家创意工作室升级为 AI 超级工作

随着每个月越来越多更强大的 AI 模型不断登陆 PC 端,开发者对更高性能、更灵活的本地 AI 环境的需求持续增长。DGX Spark 是一款紧凑型 AI 超级计算机,可放置在桌面上,与主力台式机或笔记本电脑无缝配合,使用户能够与现有 PC 共同进行实验、原型设计以及运行高级的 AI 工作负载。

Spark 非常适合希望测试大语言模型、原型化智能体工作流的开发者,或希望在工作流中并行生成创作素材的艺术家,这样他们的主力 PC 仍能继续进行编辑工作。

在 CES 2026 上,NVIDIA 发布了 Spark 的重大 AI 性能更新,使其相较于不到三个月前首次发布时,最高可获得高达 2.6 倍的性能提升。

NVIDIA还推出了全新的 DGX Spark Playbooks,包括用于推测解码以及使用两个 DGX Spark 模块微调模型的示例方案。

NVIDIA RTX AI PC的相关信息请关注微博、抖音及哔哩哔哩官方账号。

软件产品信息请查看声明。

关于NVIDIA

NVIDIA 是加速计算领域的全球领导者。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3