近期,喜马拉雅音频智能创作平台“音剪AI”全面升级,在底层模型、音频制作功能等方面实现多重突破,并发布支持外部Agent调用的“AudiobookLM Skill”。无论是工作室、版权方等专业生产者,还是在校生、播客主播等个人创作者,都可上手体验,将个人创意变为有声作品。

底层模型与制作功能双升级,人人都可进行有声内容创作
新一代“音剪AI”实现从底层模型到音频制作功能的多项升级。其核心音频生成模型——喜马拉雅音频大模型,现已升级至Audiobook-a2版本,相比此前版本,当前版本在长篇章与长音频内容生成过程中,更少出现错读、漏读、异常停顿、声音跑偏等问题,可更稳定地承接有声书、多人播客、故事化内容等连续叙事场景。除音频内容生成外,还可进一步衔接画本、角色分析、后期合成等下游环节。据悉,喜马拉雅音频大模型早在2024年便通过了国家备案,是全国首个通过国家网信办备案的音频生成大模型。
其次,新增“智能后期”与“音色分配”功能。“智能后期”功能可围绕文本内容自动识别场景氛围与情绪变化,智能匹配音效、背景音乐及表演提示。例如,当文中描写“倾盆大雨”时,音剪AI会自动匹配急促、密集的暴雨音效;出现武侠或动作类剧情时,系统则会自动添加“刀”、“剑”等击打音效。同时支持创作者自主上传音乐素材并建立个性化音乐库,根据创作习惯匹配常用的风格和素材,帮助提升后期制作效率。“音色分配”功能则可基于文本内容辅助梳理不同角色的性格特征与叙事身份,为旁白与各种角色推荐合适音色,帮助创作者省去前期反复筛选与试音的时间。
此外,“音剪AI”推出“人生留声机”玩法,以轻量化内容创作满足大众表达、记忆留存的需要。用户进入玩法页面后,可在“AI采访员”的引导下,通过语音讲述或文字形式回答问题,生成专属人生回忆录。例如,在“行至此地·地点故事”主题下,用户可能会被问到“有没有一个地方,是您一想到就会浮现出画面的”。跟随引导完成后续问答后,系统会梳理采访内容并自动生成故事文案、合成音频,将个人记忆转化为可被聆听的数字作品,成品更可一键上传至喜马拉雅平台。
全面升级后的喜马拉雅音频智能创作平台“音剪AI”面向广大公众开放。不仅工作室、版权方等专业生产者可以系统性调用全链路创作工具开展团队协作,在校生、作家、播客主播等个人创作者也可以上手体验。
Skill版本同步发布,一句话调用有声内容创作全链路
喜马拉雅音频智能创作平台“音剪AI”也发布了外部Agent可调用的Skill版本——“AudiobookLM Skill”,适配WorkBuddy、Claude、Codex、OpenClaw、ChatGPT等AI助手。创作者无需手动操作复杂流程、反复切换平台,即可通过外部AI助手快速调用“音剪AI”平台功能,协助完成文稿整理、章节导入、角色识别、整章合成、混音及发布上架等有声内容创作全链路流程。用户可通过“音剪AI”官网-服务中心-帮助中心获取Skill安装指南。
除创作赋能外,喜马拉雅也持续通过技术创新优化用户体验。2025年3月,喜马拉雅自主研发的“小雅”智能语音助手上线并在此后完成多轮技术迭代与功能升级,陆续推出AI搜索、AI听中问、AI荐书等功能,持续优化用户语音交互体验。2026年5月,“小雅Skill”上线,使用户无需反复切换App便可通过AI Agent调用喜马拉雅平台内音频搜索、个性推荐、内容总结等服务,满足更多AI陪伴场景下的内容消费需求。
