数字阅读时代,有声阅读的工业化、智能化生产是趋势,书籍的动效、听书的音色等细节都影响着用户对于数字阅读的交互感受。华为阅读作为一款人性化的数字阅读App,在HarmonyOS NEXT上提供了8款媲美真人的听书音色,给用户带来犹如真人阅读的情感化感受。近日,华为阅读升级了精品音色3.0,筛选40万+小时的高质量数据训练,从韵律、情感化、风格化等层面,为用户带来高度拟人化、具有共情能力和风格切换能力的声音。
40万+小时大数据底座,充分激发精品音色优势
华为阅读“精品女声”音色的音源,是中国传媒大学视听技术与智能控制系统文化和旅游部重点实验室研究员、中国传媒大学播音主持艺术学院副教授王宇红。此次为华为阅读提供的精品声创新,源于实验室研发的“艺术+技术情感体系”。通过破解智能语音交互过程中的多种拟态情境,该重点实验室精心录制了为机器输入大量高质量语料的数据集,再通过人工智能合成技术将机械声音比人声差的情感加上,让机械声音也有了人性化的温度。
华为阅读刚刚升级的精品音色3.0采用TTS技术,即Text-to-Speech文字转语音技术,以华为的语音大模型底座为核心基础架构,构建和优化TTS技术,融合实验室研发的“艺术+技术情感体系”,筛选40万+小时的大数据训练打底,专家演绎数据强化,形成一套对人类语音的音色、语调、韵律等的精准建模。精品音色3.0将王宇红副教授作为专业演播员的音色细节以技术手段充分保留和还原,带来韵律丰富、重点突出、识别力强和能展现丰富场境、多种情绪态度的逼真音色、提高信息传递的效率。华为阅读与中国传媒大学视听技术与智能控制系统文化和旅游部重点实验室的强强联合,为用户带来身临其境聆听国家级水平播音的听书体验。
华为阅读精品音色3.0引领数字阅读情感化趋势
王宇红副教授在为华为阅读录制精品声音时,结合了自身30年的媒体教学、播音实践工作经验,遵循数字化时代应该发挥有声语言本身的个性化优势原则,兼顾了数字化智能语音的“传播语境拟态化”、“音色特征通用性”、“感官体验交流感”、“阅读内容通识性”的特点。录制时吐字清晰、发音标准、语气语调丰富多样,将演播者对文字语言的理解、感受转化为有助于建构读者心理体验的停连、重音、语气、节奏,同时兼顾在声音传达里建立与用户的面对面、心贴心的“交流感”,让精品声音通过华为阅读的技术能力转化为听书音色后,可以适配不同的读物需求和听书场景。无论是开车时需要的送达感、抗干扰性;睡觉前需要的松弛感、伴随性;儿童读物需要的亲切感、启智性……都能为华为阅读用户带来了高度拟人化、具有共情能力和风格切换能力的声音。
目前华为阅读已经上线精品音色3.0,华为用户升级HarmonyOS NEXT后,即刻就能在华为阅读体验来自中国传媒大学播音老师的专业音色。作为一款综合类阅读应用,华为阅读在不断开拓数字阅读市场的同时,也将与更多专业机构、专业人士合作,探索更多人性化交互体验。