OpenAI寻求合作伙伴生成用于训练AI模型的数据集

业界
2023
11/10
11:06
IT之家
分享
评论

11 月 10 日消息,OpenAI 发文宣布,将与组织合作生成用于训练 AI 模型的公共 / 私有数据集,数据合作伙伴关系旨在“让更多组织能够帮助引导 AI 的未来”并“从更有用的模型中受益”。

IT之家从博客获悉,OpenAI 称:“为了最终使 AI 变得更加安全且造福于全人类,我们希望 AI 模型能够深入理解所有主题、行业、文化和语言,这需要尽可能广泛的训练数据集。”

作为数据合作伙伴计划的一部分,OpenAI 表示,它将收集“反映人类社会”且目前不易在线访问的“大规模”数据集。虽然该公司计划跨多种模式开展工作,包括图像、音频和视频,但它特别寻求跨不同语言、主题和格式“表达人类意图”(例如长篇写作或对话)的数据。

OpenAI 表示,如有必要,它将与组织合作,结合使用光学字符识别和自动语音识别工具,对训练数据进行数字化,并在必要时删除敏感或个人信息。

OpenAI 希望创建两种类型的数据集:一个可供任何人在 AI 模型训练中使用的公开开源数据集,以及一组用于训练专有 AI 模型的私有数据集。

OpenAI 表示,私有集适用于希望保持数据私密性但希望 OpenAI 的模型更好地理解其领域的组织;到目前为止,OpenAI 与冰岛政府和 Miðeind ehf 合作,提高了 GPT-4 说冰岛语的能力,并与自由法律项目合作,提高其模型对法律文件的理解。

【来源:IT之家

THE END
广告、内容合作请点击这里 寻求合作
OpenAI
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

11月9日消息,根据网络状况监测网站的数据显示,大概从北京时间周三晚22点左右开始,出现大量网友报告OpenAI的ChatGPT和API无法使用。
业界
11月7日讯 当地时间周一,人工智能行业龙头OpenAI的历史首届开发者大会揭幕。
业界
10月28日消息,据知情人士透露,谷歌已经同意在此前投资的基础上,再向OpenAI竞争对手Anthropic至多投资20亿美元。
业界
10月27日消息,美国当地时间周四,人工智能研究公司OpenAI宣布组建新团队,以评估和减轻与人工智能相关的“灾难性风险”。
业界
10月25日消息,当人工智能初创公司OpenAI在2019年从非营利组织转变为“利润上限(caped-profit)”公司时,硅谷风险投资家维诺德·科斯拉(Vinod Khosla)大胆地迈出了第一步。
业界

相关推荐

1
3