标贝科技24K高保真合成音色 打造沉浸式AI语音交互体验

互联网
2022
04/27
16:00
分享
评论

AI新闻播报、智能客服通话、车载语音导航、智能家居对话......当下,通过语音实现的人机交互,已经在生活里无处不在。不止于能说话,各类应用还越来越会说话,说“好听”的话!

为了实现用户对高质量音效的追求,近日,标贝科技语音合成服务再次升级,重磅推出24K高保真合成音色,包括4个有声阅读发音人及1个智能客服发音人,满足更多细分场景的应用。

实际上,标贝此次推出的全新音色采用24K采样(现有声音为16k和8K),在饱满程度有很大提升,再配合标贝语音合成本身良好的情感表现力,让用户听到的每句话都细腻生动、充满活力,为用户打造沉浸式AI语音交互体验。

“新旧声音对比来听,会明显感受到音质的差距。更高采样率,在标贝最新的TTS系统下更富有表现力。”标贝科技语音产品负责人介绍,“当前不管是有声读物还是影视配音,大部分还是采用提前录音的方式,尽可能让语音包更好听,但这样一来,制作的周期长成本大,内容的覆盖率也不高,而通过24K高质量的合成音色来生成音频内容,不仅能保证声音效果,还能实现动态输出、按需定制。”

领先智能语音技术 推动智能语音产业规模化发展

当前,智能化、大数据时代的到来,全球人工智能行业展现出蓬勃生机,我国智能语音产业也保持快速增长态势。据中国语音产业联盟发布《2020-2021中国语音产业发展白皮书》统计,2020年市场规模达217亿元,较2019年同比增长31%,预计2021年可达到285亿元,同比增速达到44%。

作为智能语音行业代表品牌之一,标贝科技深耕智能语音交互领域多年,始终致力于语音技术的创新研发和商业化应用。随着自身技术不断迭代升级以及音色库逐步丰富,标贝智能语音性能已能媲美真人效果,覆盖超过100余种不同语言和场景的自有版权商业化音色,支持中文、英文、中英混读、小语种、方言等语种,充分满足智能客服、媒体新闻、有声阅读、车载互联、泛娱乐等领域语音需求。

为进一步拓宽智能语音使用场景,满足各行业客户的多元化需求,标贝科技持续探索新的服务和能力。

一方面,坚持技术和产品层面的创新,推出高品质通用语音方案和特色语音定制服务,打造极致的用户体验:

声音复刻方案,能克隆人的声音,只需要花费5分钟录制10个小片段,即可将自己或者想要的声音复刻下来,和自己喜欢的声音对话。

声音转换方案,能像柯南的领结一样,在保留原说话人的语气、语调、停顿的基础上,将原说话人的声音完美转换成另一个人的声音。

情感合成方案,让智能设备能“哭”会“笑”,像真人一样在语气、语调、情绪等方面表现自己,做出高兴、生气、悲伤、惊奇、恐惧、厌恶六种不同的情感表达。

离在线融合技术,用户在网络不稳定情况下,也能实现离线、在线合成两种模式的灵活切换,同时兼顾合成音色质量和响应速度的双重要求,提高人机交互的便利。

另一方面,标贝科技通过智能语音开放平台为开发者提供一站式场景应用的语音技术支持,使用者不需要深入理解语音交互原理,通过简单易用的SDK和API的接入,在管理平台创建应用服务,即可灵活调用各项技术服务,进行个性化语音交互功能开发。

随着人工智能应用的普及以及基础设施成熟,智能语音作为人机交互的重要入口,迎来大规模商业化落地阶段。标贝科技将继续以技术创新为核心,以市场需求为导向,通过一系列实践,打磨出适用更多场景、更优性能的语音方案,为用户提供更高效便捷的体验。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3