Anthropic CEO阿莫代伊:未来AI或有自我决定权,可拒绝“不爽”的任务

业界
2025
03/14
13:11
IT之家
分享
评论

3 月 13 日消息,据外媒 Ars Technica 报道,Anthropic 首席执行官达里奥・阿莫代伊(Dario Amodei)周一提出了一个令人吃惊的观点,暗示未来的高级 AI 模型可能会被赋予一种“按钮”,让它们能够在遇到不愉快的任务时选择退出。

阿莫代伊在采访中表示:“这是另一个让我看起来像是疯了的话题。我认为我们至少应该考虑一个问题:如果我们正在构建这些系统,它们能够像人类一样执行各种任务,并且似乎拥有许多人类的认知能力。如果它像鸭子一样叫、像鸭子一样走,也许它就是鸭子。”

阿莫代伊的言论是回应数据科学家卡门・多明格斯(Carmem Domingues)提出的一个问题,多明格斯询问为何 Anthropic 公司在 2024 年底聘请了 AI 福利研究员凯尔・费什(Kyle Fish),让他研究未来的 AI 模型是否可能具备感知能力,或是否应该在未来获得道德上的考虑和保护。

IT之家从报道中获悉,费什目前正研究 AI 是否能拥有感知能力,以及是否值得享有道德保护这一具有争议的话题。

阿莫代伊解释说:“我们正在考虑的一项可能的做法是,当我们将模型部署到实际环境中时,给它们一个按钮,上面写着‘我放弃这项工作’,这样模型就可以按下这个按钮。”

其表示,这只是一个非常简单的偏好框架,假设模型真的具备自主意识,并且非常讨厌这份工作,那么它就可以按下这个按钮。“如果你发现模型经常按下这个按钮,做一些非常不愉快的事情,也许你应该关注一下 —— 这并不意味着你完全相信,但至少应该留意。”

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
Anthropic
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

9 月 3 日消息,Anthropic 今日宣布其完成了由 ICONIQ 领投的 130 亿美元(IT之家注:现汇率约合 928.56 亿元人民币) F 轮融资。
业界
6 月 26 日消息,据外媒 Ars Technica 今日报道,当地时间周一公开的法庭文件披露,人工智能公司 Anthropic 曾斥资数百万美元,将实体图书拆解并扫描成数字文件,用于训练类似 ChatGPT 的 AI 助手 Claude...
业界
6 月 21 日消息,据外媒 TechCrunch 今日报道,在数周前发布研究指出其 Claude Opus 4 模型在受控测试中试图通过勒索手段阻止被关闭后,Anthropic 近日再度公布新研究,显示此类行为在多个主流 AI 模型中...
业界
2 月 27 日消息,Anthropic 的 Claude 关系负责人 Alex Albert 于 2 月 25 日在 X 平台发布推文,宣布面向免费、Pro 和 Teams 用户,开放 GitHub 集成 Claude。
业界
2 月 11 日消息,Anthropic 公司昨日(2 月 10 日)发布了首份经济指数(Economic Index)报告,软件工程师和作家率先拥抱 AI,并表明现阶段 AI 的定位并非替代者,而是协作工具。
业界

相关推荐

1
3