亚马逊推出Nova Act:可操控网页浏览器的AI智能体

业界
2025
04/01
10:51
IT之家
分享
评论

4月1日消息,亚马逊于当地时间周一正式发布了其通用人工智能智能体(AI agent)——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的Nova Act软件开发工具包(SDK),旨在帮助开发者利用Nova Act构建智能体应用原型。

据IT之家了解,Nova Act由亚马逊新近在旧金山成立的AGI(通用人工智能)实验室研发,该技术未来也将为备受期待的生成式AI增强版语音助手Alexa+提供关键功能支持。不过,亚马逊方面表示,今日起开放的版本为“研究预览版”,功能尚待完善。

开发者可以通过新设立的专属网站nova.amazon.com获取Nova Act工具包,该网站同时也是亚马逊展示其旗下各类Nova基础模型的平台。

Nova Act的推出标志着亚马逊正式加入AI智能体技术的竞争行列,意在凭借自研的通用AI智能体技术,与OpenAI的Operator和Anthropic的Computer Use等产品展开竞争。当前,多家领先科技公司普遍认为,能够代替用户浏览网页、执行任务的AI智能体将极大提升现有AI聊天机器人的实用性。尽管亚马逊并非首家开发此类技术的公司,但凭借其庞大的Alexa用户基础,Nova Act未来可能拥有最广泛的应用潜力。

亚马逊介绍称,开发者使用Nova Act SDK,将能够为用户自动化处理一些基础性网络操作,例如从餐饮品牌Sweetgreen订购沙拉或是在线上预订餐厅晚餐。该工具包提供了一系列工具,使AI智能体能够浏览网页、填写表单、在日历上选择日期等。

在性能方面,亚马逊声称,在公司内部的多项测试中,Nova Act的表现优于来自OpenAI和Anthropic的同类智能体。以衡量AI智能体与屏幕文本交互能力的ScreenSpot Web Text测试为例,Nova Act得分高达94%,超过了OpenAI的 CUA(88%)和Anthropic的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亚马逊并未公布Nova Act在如WebVoyager等行业更常用的智能体评估基准上的测试结果。

Nova Act是亚马逊上述AGI实验室对外发布的首个公开产品。该实验室由前OpenAI研究员David Luan 和 Pieter Abbeel共同领导。这两位专家在去年被亚马逊聘用以主导其AI智能体研发工作之前,分别创立了AI初创公司Adept和Covariant。

对于一个以AGI为目标的实验室为何会开发订购沙拉的AI智能体,Luan在接受TechCrunch采访时解释道,他将智能体视为构建超智能AI系统的关键一步。他将AGI定义为“一个能够帮助你在计算机上完成人类所能做的任何事情的AI系统”。Luan还表示,其团队设计的Nova Act SDK旨在可靠地自动化执行简短、简单的任务,并为开发者提供了精确定义何时需要人类介入智能体工作流程的工具。他希望借此帮助开发者创建更可靠的智能体应用,即使这些应用不一定是完全自主运行的。

目前,来自OpenAI、谷歌和Anthropic等公司的早期AI智能体普遍面临跨不同领域应用时可靠性不足的重大挑战。根据TechCrunch等媒体的测试,这些系统往往运行缓慢,难以长时间独立工作,且容易犯下人类通常不会犯的错误。亚马逊是否已经找到了克服这些难题的有效方法,还是其Nova Act智能体也将受困于同样的缺陷,市场将拭目以待。

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
亚马逊 AI
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3