喜马拉雅“音剪AI”全面升级，底层模型焕新更适配长篇章内容生产场景

互联网

2026

07/02

14:25

近期，喜马拉雅音频智能创作平台“音剪AI”全面升级，在底层模型、音频制作功能等方面实现多重突破，并发布支持外部Agent调用的“AudiobookLM Skill”。无论是工作室、版权方等专业生产者，还是在校生、播客主播等个人创作者，都可上手体验，将个人创意变为有声作品。

底层模型与制作功能双升级，人人都可进行有声内容创作

新一代“音剪AI”实现从底层模型到音频制作功能的多项升级。其核心音频生成模型——喜马拉雅音频大模型，现已升级至Audiobook-a2版本，相比此前版本，当前版本在长篇章与长音频内容生成过程中，更少出现错读、漏读、异常停顿、声音跑偏等问题，可更稳定地承接有声书、多人播客、故事化内容等连续叙事场景。除音频内容生成外，还可进一步衔接画本、角色分析、后期合成等下游环节。据悉，喜马拉雅音频大模型早在2024年便通过了国家备案，是全国首个通过国家网信办备案的音频生成大模型。

其次，新增“智能后期”与“音色分配”功能。“智能后期”功能可围绕文本内容自动识别场景氛围与情绪变化，智能匹配音效、背景音乐及表演提示。例如，当文中描写“倾盆大雨”时，音剪AI会自动匹配急促、密集的暴雨音效；出现武侠或动作类剧情时，系统则会自动添加“刀”、“剑”等击打音效。同时支持创作者自主上传音乐素材并建立个性化音乐库，根据创作习惯匹配常用的风格和素材，帮助提升后期制作效率。“音色分配”功能则可基于文本内容辅助梳理不同角色的性格特征与叙事身份，为旁白与各种角色推荐合适音色，帮助创作者省去前期反复筛选与试音的时间。

此外，“音剪AI”推出“人生留声机”玩法，以轻量化内容创作满足大众表达、记忆留存的需要。用户进入玩法页面后，可在“AI采访员”的引导下，通过语音讲述或文字形式回答问题，生成专属人生回忆录。例如，在“行至此地·地点故事”主题下，用户可能会被问到“有没有一个地方，是您一想到就会浮现出画面的”。跟随引导完成后续问答后，系统会梳理采访内容并自动生成故事文案、合成音频，将个人记忆转化为可被聆听的数字作品，成品更可一键上传至喜马拉雅平台。

全面升级后的喜马拉雅音频智能创作平台“音剪AI”面向广大公众开放。不仅工作室、版权方等专业生产者可以系统性调用全链路创作工具开展团队协作，在校生、作家、播客主播等个人创作者也可以上手体验。

Skill版本同步发布，一句话调用有声内容创作全链路

喜马拉雅音频智能创作平台“音剪AI”也发布了外部Agent可调用的Skill版本——“AudiobookLM Skill”，适配WorkBuddy、Claude、Codex、OpenClaw、ChatGPT等AI助手。创作者无需手动操作复杂流程、反复切换平台，即可通过外部AI助手快速调用“音剪AI”平台功能，协助完成文稿整理、章节导入、角色识别、整章合成、混音及发布上架等有声内容创作全链路流程。用户可通过“音剪AI”官网-服务中心-帮助中心获取Skill安装指南。

除创作赋能外，喜马拉雅也持续通过技术创新优化用户体验。2025年3月，喜马拉雅自主研发的“小雅”智能语音助手上线并在此后完成多轮技术迭代与功能升级，陆续推出AI搜索、AI听中问、AI荐书等功能，持续优化用户语音交互体验。2026年5月，“小雅Skill”上线，使用户无需反复切换App便可通过AI Agent调用喜马拉雅平台内音频搜索、个性推荐、内容总结等服务，满足更多AI陪伴场景下的内容消费需求。

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

喜马拉雅“音剪AI”全面升级，底层模型焕新更适配长篇章内容生产场景

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们