声网Conversational AI Agents获CSDN、大模型之家、赛迪网奖项

互联网
2025
01/06
17:25
分享
评论

新年开门红!在刚结束的CSDN 2024中国开发者影响力年度评选中,声网Conversational AI Agents 获选创新产品与解决方案。在同期举办的大模型之家2024年度奖项评选中,该解决方案也位列优秀应用方案榜单

此外,声网 Conversational AI Agents 解决方案成功入选由中国电子信息产业研究院旗下赛迪网与《数字经济杂志共同发起的《2024年度软件和信息技术创新服务案例集》。

声网 Conversational AI Agents 是一套实时多模态对话式 AI 解决方案,该方案以语音为核心,支持视频扩展,实现文本/音频/图像/视频的组合输入&输出,具备500ms超低延时、对话更自然拟真、框架灵活可拓展等一系列特性,帮助开发者与企业快速构建适配自己业务场景的 AI 实时语音对话服务。

支持智能打断,AI语音对话延迟低至 500ms  

超低延时语音对话是声网 Conversational AI Agents 解决方案的一大核心优势,通过在客户端进行低延迟的音频采集和播放,借助声网自研的 SD-RTN 实时传输网络实现全球范围的低延时 RTC 传输,语音对话延迟低至 500ms,并进一步通过更快速的 LLM 推理首字耗时、低延迟流式 TTS、同机部署等一系列技术手段,保证对话的实时性与流畅性,达到近似人与人之间日常对话停顿与间隔。

在真实的语音对话中,打断对方并提出新疑问是很常见的现象,而在 GenAI 场景,能否支持随时打断也成为衡量大模型智能化的重要指标。声网自研的 AI VAD 技术,适应人类对话的停顿、语气和对话节奏,支持 AI 对话过程中随时打断。

领先的音频处理  AI 对话更“听得清”

在人与人音视频通话的过程中,经常会遭遇环境噪音,影响沟通效率。在 GenAI 场景中,环境噪音同样无法避免。声网的解决方案具备业界领先的音频3A能力,即使在嘈杂的环境中,也能通过 AI 噪声抑制、背景人声过滤、音乐检测/过滤等算法,确保人与 AI 的对话不受环境干扰,始终保持顺畅,AI 也更听得清人说的话。

灵活可扩展的 AI Agent架构

支持快速接入AI Agent 作为大模型的应用框架,其重要性不言而喻。而开发者经常会根据自身的喜好或者业务场景选择不同的组件搭配 AI Agent。对此,声网的解决方案采用了灵活可扩展的 AI Agent架构,兼容市场主流的 ASR、LLM 和 TTS 技术,并具备工作流编排能力,帮助开发者与企业根据特定需求定制和扩展 AI 驱动的实时互动体验。同时,这套方案支持 API 快速调用,提供开箱即用的场景化 Demo,最快 3h 即可实现方案快速验证,并提供端到端 SDK,同样适用于针对目标场景化业务开发,寻求整套技术方案的客户。

声网已与国内外多家 AI厂商展开了合作,借助 Conversational AI Agents 帮助客户实现了对话式AI 在智能助手、虚拟陪伴、口语陪练、语音客服、同声传译、智能硬件等多个场景的落地。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3