谷歌新规引担忧:消息称外包人员被迫评估自己不擅长的Gemini回复

业界
2024
12/19
12:33
IT之家
分享
评论

12 月 19 日消息,据 TechCrunch 报道,谷歌针对其大型语言模型 Gemini 回复的外包评估流程进行了一项调整,引发了外界对其在敏感领域信息准确性的担忧。这项调整要求外包评估员不得再像以往那样,因自身专业知识不足而跳过某些特定的评估任务,这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。

为了改进 Gemini,谷歌与其外包公司日立旗下的 GlobalLogic 合作,由后者雇佣的合同工负责评估人工智能生成的回复,评估标准包括“真实性”等因素。此前,如果评估员认为某个问题超出了自身专业领域,例如一个关于心脏病学的专业问题,而评估员本身并无相关科学背景,他们可以选择“跳过”该回应,从而避免评估针对该提示(prompt)的人工智能回复。

然而,上周 GlobalLogic 宣布了一项来自谷歌的变更:评估员不得再以缺乏专业知识为由跳过任何提示。内部通信显示,此前的指导方针是:“如果您没有评估此提示所需的关键专业知识(例如编码、数学),请跳过此任务。”而新的指导方针则改为:“您不应跳过需要特定领域知识的提示。”取而代之的是,评估员需要“评估您理解的提示部分”,并注明自己缺乏相关领域知识。

这项变更引发了人们对 Gemini 在某些主题上准确性的担忧,因为现在评估员有时需要评估一些他们完全不熟悉的、高度专业的技术性人工智能回复,例如关于罕见疾病的问题。一位合同工在内部通信中表示:“我原以为跳过的目的是通过将其交给更专业的人来提高准确性?”

根据新的指导方针,评估员现在只能在两种情况下跳过提示:一是提示或回复“完全缺失信息”,二是提示包含需要特殊同意书才能评估的有害内容。

这项新规的实施,意味着一些对专业性要求极高的领域,例如医疗健康等,将由缺乏相关背景知识的评估员进行评估,这无疑增加了 Gemini 输出不准确信息的风险。外界担忧,此举可能会对用户造成误导,尤其是在涉及健康等重要问题时,不准确的信息可能会带来严重后果。

截至IT之家发稿时,谷歌尚未回应相关报道。

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
谷歌Gemini
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

10 月 31 日消息,自动驾驶公司 Waymo 长期以来一直将与谷歌 DeepMind 的联系及其数十年的 AI 研究视为其在自动驾驶领域超越竞争对手的战略优势。
业界
7 月 31 日消息,消息源 @i冰宇宙 昨日(7 月 30 日)在 X 平台发布推文,只写道“16GB yes!”,但从上下推文来判断,应该是指三星 Galaxy S25 Ultra 手机将会配备 16GB 的内存。
业界
6月11日消息,在2024年度WWDC全球开发者大会上,苹果软件工程高级副总裁Craig Fedrighi确认了与OpenAI旗下的ChatGPT达成合作的计划,并透露了未来与更多第三方AI模型合作的意向。
业界
5 月 30 日消息,谷歌在 I / O 2024 开发者大会上,宣布将 Gemini 1.5 Pro 上下文窗口增加至 200 万个tokens,那么 Gemini 1.5 Pro 性能究竟有多强悍?
业界
5月15日消息,在今天凌晨举行的I/O开发者大会上,谷歌表示即将推出Android 15,并且还剧透了一些新功能。
业界

相关推荐

1
3