斯坦福大学、华盛顿大学研究：1000个AI智能体预测人类行为，准确率最高可达85%

业界

2024

11/25

09:52

IT之家

11 月 25 日消息，据 The Decoder 今日报道，斯坦福大学、华盛顿大学和 Google DeepMind 的研究人员联合开发了一种 AI 智能体（AI Agent，也称“AI 代理”），能够在社会实验中逼真地模拟人类行为。

研究指出，这类模拟系统可以作为一个虚拟实验室，帮助验证经济学、社会学、组织学和政治科学中的理论。研究团队通过对 1000 多名具有代表性的美国人（覆盖多种年龄、性别、教育背景和政治立场）进行访谈，建立了这些 AI 智能体模型。

系统运行方式是将详细的访谈记录与 GPT-4o 模型结合。当用户向智能体提问时，系统会加载访谈记录并让 AI 模仿受访者的回答。为生成这些记录，研究团队对每位受访者进行了长达两小时的访谈，并通过 OpenAI 的 Whisper 技术将对话转录成文本。

研究团队设计了多个测试，评估 AI 对人类行为的预测能力，涵盖《通用社会调查》、大五人格评估以及若干行为经济学实验。

结果显示，基于访谈数据的 AI 在预测社会调查（GSS）问题时，准确率高达 85%，远超单纯依赖人口统计信息的 AI 智能体。

研究团队在五项社会科学实验中测试了人类与 AI 的表现，其中四项研究显示，AI 的结果与人类高度一致。相关系数高达 0.98，表明 AI 对人类行为有极强的模拟能力。

与传统的人口统计法相比，访谈驱动的 AI 显示出显著的优势，尤其是在处理不同种族群体和政治观点的预测时更加准确，同时也能有效减少人口统计类别之间的偏差。

研究团队已将包含 1000 个 AI 模型的数据集开放至 GitHub，并建立了两层访问机制。综合性数据对研究人员完全开放，而个别参与者的详细数据则需经过特殊审批。

【来源：IT之家】

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

9 月 17 日消息，纽约邮报 9 月 12 日发布博文，报道称在印度航空 AI171 航班空难造成 241 人遇难后，两位印度工程师推出“重生计划”（Project REBIRTH）原型机，号称是全球首个 AI 驱动的飞机坠机生存系...

业界

9月16日，脉脉最新发布的《2025年AI人才流动报告》显示，今年1-7月，平台AI新发岗位量同比增长超10倍，简历投递量同比增长11倍。

业界

北京时间9月16日，彭博社周一发文称，一度隐退的阿里创始人马云“强势回归”，在公司战略决策中的作用越来越大。

业界

北京时间9月10日，据科技网站TheVerge报道，苹果备受期待的秋季发布会带来了关于AirPods、Apple Watch、iPhone等多项硬件的更新消息。

业界

9 月 7 日消息，上月初，彭博社曾报道苹果正在开发一款自研生成式 AI 搜索产品，并为此组建了全新的“答案、知识与信息”团队。

业界