3月20日消息,英伟达最新发布Llama Nemotron系列开放推理AI模型,支持“智能体AI”系统,可独立推理、规划并执行多步骤任务,适用于机器人、自动化和决策优化等场景,显著降低推理成本,助力企业实现AI自主化升级。
Llama Nemotron系列开放推理AI模型共有Nano、Super和Ultra三种规模,IT之家援引博文简单介绍如下:
Nano:专为PC和边缘设备设计,提供高精度推理。
Super:单GPU部署,兼顾顶级准确率与处理速度。
Ultra:多GPU服务器优化,确保复杂任务的最高精度。
三种不同规模适用于不同部署环境,可按需激活深度推理模式,简化任务时节省算力,降低推理成本。Llama Nemotron系列开放推理AI模型还通过NVIDIA NIM微服务,支持从数据中心到边缘计算的全场景应用。
英伟达还介绍了Cosmos Nemotron新成员,这是专注视觉语言模型(VLM),可解析图像、视频及传感器数据,扩展NVIDIA此前的Cosmos World Foundation Model(WFM)平台能力,主要应用于自动驾驶、工业机器人等需多模态推理的领域,实现“文本+视觉”协同决策。
【来源:IT之家】