OpenAI展示语音生成“武器库”：太强大以至于无法推广

业界

2024

03/30

13:24

财联社

当地时间周五（3月29日），美国人工智能研究公司OpenAI在官网首次分享了名为“Voice Engine”（语音引擎）的预览。

据介绍，通过输入文本和15秒音频样本，Voice Engine便可以生成一个与音频中说话者非常相似的自然语音。新闻稿强调，生成的自然语音具有丰富的情感和逼真的声音。

OpenAI称，公司在2022年底就启动了Voice Engine的研发工作，并将它用作一些其他功能的预设语音。由于合成语音可能会被滥用，公司只在小范围内与开发人员分享了该模型，未来可能不会广泛推出这一功能。

新闻稿写道，儿童教育技术公司Age of Learning正在使用这个模型来生成一些预先编写好的内容，并且还结合GPT-4 创建实时的响应来与学生互动。

在案例中，OpenAI放出了一段英语男声和西班牙语女声的样本音频，并用两段音频各生成了讲解知识的语音。

另外，数字人视频生成初创公司HeyGen也采用了这项技术。HeyGen可以根据内容创建定制的数字人化身，而Voice Engine可以将样本的声音转换成多种其他语言，来帮助产品营销到销售演示。

新闻稿提到，在转换语言时，Voice Engine会保留原始说话者的母语口音，例如样本中的人使用的是法语，那么生成的英语将带有法国口音。本周早些时候，有消息称HeyGen正在进行新一轮融资，投前估值达到4.4亿美元。

除此以外，OpenAI还展示了生成较小语系和孤立语系声音的能力，以帮助落后地区的社区卫生工作者；同时还与神经科学研究所探索AI在临床环境中的应用，比如帮助语言障碍者等用途。

“太强大了导致无法推广”

OpenAI写道，“我们认识到，生成声音的功能存在严重风险，这一点在大选年尤为突出。我们正在与来自政府、媒体、娱乐、教育等领域的国际合作伙伴合作，以确保我们在建设过程中吸收他们的反馈。 ”

OpenAI产品负责人Jeff Harris告诉媒体，“如果你能正确地设置音频，基本上就能生成人类口径的声音，这是一种相当令人印象深刻的技术。”但Harris提到，准确模仿人类语音的能力确实存在安全隐患。

今年1月，美国就出现“AI拜登”事件，由AI生成的“假拜登”在电话中用逼真的声音鼓励可能支持民主党的5000位选民在新罕布什尔州初选中不要投票。本月早些时候，拜登呼吁国会通过立法来监管AI，包括禁止“AI语音模仿”等。

在测试计划中，OpenAI要求其合作伙伴遵守其制定的使用政策：在使用语音样本之前要征得声音主人的同意，并明确告诉听众声音是AI生成的。该公司还在安装一种听不见的音频水印，以区分音频是否是由其工具创建的。

OpenAI写道，“无论我们最终是否会广泛部署这项技术，让全球各地的人们了解这个发展方向都是非常重要的。”

【来源：财联社】

THE END

广告、内容合作请点击这里寻求合作

OpenAI

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

相关热点

OpenAI正开发ChatGPT“儿童版”，平衡青少年安全、

9 月 17 日消息，OpenAI 昨晚发布公告，阐述了其在青少年安全、用户自由与隐私保护三个原则之间的取舍与决策。

业界

编程能力大幅提升，OpenAI发布gpt-5-codex新模型

9 月 16 日消息，OpenAI 今日凌晨宣布推出全新的 GPT-5-Codex，并已在其 AI 编程助手 Codex 中上线。这是一个专门为 Agent 编程而优化的 GPT-5 新版本。

业界

OpenAI董事长：AI行业身处泡沫中，许多人会损失惨重

北京时间9月15日，OpenAI董事长布雷特·泰勒(Bret Taylor)表示，行业正处于AI泡沫中，许多人会损失惨重。

业界

关键投资者放行，OpenAI就重组与微软达成协议

北京时间9月12日，据路透社报道，微软与OpenAI周四表示，他们已就双方关系的新条款签署了一项非约束性协议。

业界

前Open AI研究员姚顺雨上亿薪资入职腾讯？官方回应

9月12日，近日有传闻称，OpenAI研究员姚顺雨上亿薪资入职腾讯。对此，鹅厂黑板报发文辟谣称该传闻不实。

业界

OpenAI展示语音生成“武器库”：太强大以至于无法推广

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们