在降低数字人定制门槛的道路上,讯飞智作按下了加速键。2024 年 10 月 24 日,讯飞智作首发超拟人数字人,仅需一张照片就能实现数字人定制。此次超拟人数字人嵌入至讯飞智作小程序上,无需打开电脑登录,在人人拥有手机的年代,再次降低用户路径,让每人拥有自己的超拟人数字人成为可能。
作为科大讯飞旗下一款 AIGC 内容生产平台,讯飞智作自诞生以来就一直为用户提供「AI 配音」「数字人视频播报」「声音定制」「形象定制」等服务,致力于提高各种场景下音视频内容生产效率。而此次首发超拟人数字人,更是讯飞智作在 AI 领域的进一步跃升。
基于大模型的多模态交互技术的创新与升级,讯飞智作首发超拟人数字人让个性化数字人的打造有了更多选择。数字人定制不再是调用提前录制模版资源的「预制菜」,而是由一张照片就能驱动的新突破。
在此次技术提升下,一张照片驱动数字人不仅没有让超拟人数字人表现力降低,反而借助情感贯穿的多模态交互能力,提升其表情与肢体的表现能力。大模型的多模态交互技术统一了文本、语音和表情,实现跨模态的语义一致性。也就是说,超拟人数字人的情感表达更加真实连贯,数字人的口唇不仅能够高度同步,表情和动作上也会随之变化表现,更贴近真人的情感表达。
于此同时,超拟人数字人还与此前的「一句话声音复刻」功能做了有机结合。借助大模型语音合成技术,用户在定制专属的超拟人数字人声音时仅需根据提示朗读文本,讯飞智作便会快速学习你的音色、韵律以及说话习惯,短短几秒钟便能复刻出其高质量的专属音频。不仅如此,讯飞智作还实现了跨语种复刻的能力。
讯飞智作小程序「声音复刻」功能页面
在当下大模型竞争的白热化阶段,讯飞智作选择将视角转向注重真实场景落地的技术优化。超拟人数字人这一技术的实现,让数字人普及 N 种场景成为可能,成为促进千行百业智能化转型的重要动力。
在传统的教培场景下,数字人定制多服务于教师职能。如大学老师借助数字人定制服务让每个人都拥有自己的云课堂,定制 2D 高仿真的虚拟数字人再通过合成课件 PPT、素材、场景、视频完善课程教学。而此次超拟人数字人进一步提升教师应用场景的便捷性,无需录制长段的绿幕视频,仅需一张照片,讯飞智作便可自动生成属于教师的超拟人数字人。除了大学教师,在中小学教育场景下,利用超拟人数字人来进行赛课无疑也是一种高效且吸引的手段。
在自媒体场景下,超拟人数字人的应用前景尤为广阔。通过一张照片即可生成超拟人数字人,让口播博主不再困顿于视频场景的繁琐布置、口播录制反复修改等问题。仅需一张优质的照片,输入想要表达的文案,即可生成优质的出镜视频。
讯飞智作小程序超拟人数字人定制页面
讯飞智作首发超拟人数字人作为一种全新的数字人定制通路,不仅升级新增了多模态、超拟人、个性化等特性,还全方位丰富了数字人的「交互」。仅需一张照片生成的超拟人数字人为各行各业带来了前所未有的创新和变革,相信未来能为企业和用户提供更加优质和便捷的服务。
讯飞智作小程序超拟人数字人部分公版形象
当下,讯飞智作小程序上在首发超拟人数字人后也在不断优化,持续增加更多公版形象。期待讯飞智作继续推出更多针对不同行业和领域的数字人技术,引领 AIGC 内容革命。