构建开放的AI生态:京东AI联合相芯科技打造3D虚拟主播

互联网
2019
07/23
15:34
分享
评论

近日,京东AI联合生态合作伙伴相芯科技打造了3D虚拟主播,基于计算机3D图形学、语音内容识别以及深度学习技术,对真人主播声音、唇形、表情动作等特征进行提取,利用NeuHub京东人工智能开放平台的语音合成、语音识别和多轮对话能力,经深度学习和训练,让虚拟主播也具备了和真人主播一样的实时播报能力,并且实现了双语播报。

目前该技术已在NeuHub京东人工智能开放平台正式上线,这项新技术目前适用于新闻资讯播报、广电虚拟演播室、融媒体平台内容生产中心、新媒体、直播网站虚拟网红、智能客服虚拟形象升级等多种场景之中。

 

随着互联网技术的飞速发展,网络视频、手机视频成为主流的内容形式,真人直播、主持人等职业成为求职市场上的“香饽饽”。然而真人主播、主持人、人工客服等培养培训成本很高,工作强度大,还有档期的限制,AI虚拟主播技术的诞生,有效地解决了这些问题,大大地提高了视频的应用范围和工作效率。

京东AI和相芯科技联合打造的3D虚拟主播技术则可以让静态主持人图片“活”过来,并根据输入的文本信息自动形成播报视频。有了播报内容文本,就有了“主播”,通过在线云端语音合成引擎合成,达到让“主播“实时说话的效果,进而生成相应的播报视频。

据悉,该产品具备几大特征。首先是强大的定制能力,包含语音和形象定制,提供高自然度、有感情、个性化的语音合成服务,支持中英文双语,并可以定制个性化语音库;结合相芯科技在CG形象方面的驱动技术及模型积累,可根据个人形象(照片)或者地方文化名人形象(画像),定制真人或卡通形象,满足不同场景需求。

语音驱动口型匹配。通过AI语音动画技术智能识别语音或文本,自动匹配口型,叠加表情信息,辅助动作脚本设计,持续实时驱动3D虚拟形象。这就意味着该技术的适配性更高,不会受到播报内容文本的限制,大大提升了该技术的使用性。

人脸关键点检测,实现表情实时驱动。通过摄像头捕捉真人表情,智能检测人脸区域并标记特征点(眼、口、鼻、眉、面部轮廓等),不断对人脸特征和表情进行自适应,同步至3D虚拟形象面部,驱动3D虚拟形象动画;支持47种面部表情,及10种舌头动作,灵动逼真。

 

NeuHub京东人工智能开放平台从建立之初就本着开放共赢的心态积极引入生态合作伙伴共同实现人工智能技术在各产业的落地。针对不同类型的合作伙伴,京东AI发布了AI生态合作伙伴炼金计划,旨在连接AI创业伙伴、地方政府和品牌企业,深入场景,融合产品携手生态伙伴,成就AI价值。炼金计划包含服务提供类、渠道合作类及集成创新类合作伙伴,京东AI为三类伙伴提供全渠道的品牌催化、技术催化及业务催化,与合作伙伴携手创造有温度的AI。截至日前,NeuHub京东人工智能开放平台生态已吸纳超过300家优秀的合作伙伴,并与超过10家合作伙伴深度合作进行联合产品打造。

作为产业开发者和生态伙伴,相芯科技仅是京东人工智能开放平台NeuHub的一个缩影。未来将会有更多的产业开发者,调用NeuHub平台的AI能力,结各自产业痛点,引发AI+产业的化学反应。同时,产业开发者在产业应用过程中的成果和实践又可以反哺AI技术的迭代、更新。京东AI助力更多人成为产业开发者,让产业加上AI的能力,扶持更多的千亿产业领军企业,推动社会文明进步。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3