北京时间8月19日,声网母公司Agora, Inc. 公布了2025年第二季度财报。财报显示,第二季度Agora, Inc. 总营收3426万美元,同比增长11.0%(不含去年三季度起已终止的低毛利业务)。公司指引三季度收入区间为3400-3600万美元,同比去年三季度增长7.6%-13.9%。
在美国通用会计准则(GAAP)下,Agora, Inc. 第二季度净利润为146万美元(合人民币1050万元),继2024年Q4同比扭亏为盈后,已连续三个季度实现GAAP盈利,且利润额超过一季度3倍以上。
对此,Agora, Inc. 创始人兼CEO赵斌表示,“我们欣然宣布,公司连续三个季度实现美国通用会计准则(GAAP)下的盈利。利润率的持续提升得益于稳健的收入增长与运营效率的不断优化。
自今年三月推出对话式AI引擎产品以来,我们已携手客户在多个场景下开发语音对话智能体。目前,部分客户的智能体方案已在呼叫中心和AI陪伴硬件等场景落地应用。
基于这一良好发展势头,我们将继续深度融合垂直场景专业知识与特点,并进一步提升产品性能与体验。 我们日益坚定地相信,我们的技术将驱动客服、教育和智能硬件等广泛行业的智能化转型。”
在现金储备方面,截至2025年6月30日,Agora, Inc. 现金、现金等价物、银行存款及银行理财产品为3.77亿美元。
对话式 AI 引擎全新升级,支持声纹识别、数字人、视觉理解
7月26-29日,声网亮相2025世界人工智能大会(WAIC),正式发布新版对话式AI引擎,该版本新增声纹识别、数字人与视觉理解三项功能,实现对话式AI音视频交互体验的全新升级。
· 声纹识别:选择性注意力锁定新增声纹识别功能,该功能赋予AI精准识别用户声纹特征的能力,有效区分不同说话者。用户只需在对话初期大声、清晰地说话,即可提升AI对声音的锁定效果。声纹识别不仅可以智能屏蔽95%的环境人声、噪声,让AI对话更准确、高效,同时也适用于多人与AI对话的场景,实现更加多元化的对话式AI响应与服务。
· 数字人交互:支持商汤等市场主流的数字人方案,通过集成高度拟真、表情动作自然的数字人,用户可与屏幕中的高度拟人化的数字形象进行实时、生动的对话互动,增强交互的临场感与情感连接,且有多个数字人形象供选择,适用于虚拟客服、教育陪伴、娱乐社交等多种场景。
· 视觉理解:新增的视觉理解能力为AI加上“眼睛”,一方面支持实时视频,能够解析摄像头捕捉的画面信息,结合语音指令,AI能“看懂”用户手势、环境物体或特定视觉线索,实现“所见即所言”的智能反馈;另一方面,支持拍照与图片上传识别,AI会解答图片中的关键信息,可适用于教育场景的拍照识题与作业批改,智能助手场景的识物、翻译、分析等。在对话式AI中加入视觉理解,将为人机对话协作开辟更广阔的空间。
对话式AI正从基础的互动问答向深度理解、情感共鸣和情境感知演进。声网对话式 AI引擎具备的声纹识别、数字人和视觉理解等能力,成为构建下一代自然、沉浸式人机交互基础设施的重要一步。
此外,本季度声网还发布了全球首个AI模型评测平台(对话式)。该平台针对对话式 AI 场景下,级联大模型中的ASR+LLM+TTS 延迟数据提供主流供应商的横向测评,更直观的展示声网对话式AI引擎适配各主流模型的实时性能数据。同时,平台还提供了“竞技场”功能,开发者可自由选择ASR、LLM、TTS的主流供应商进行对比,根据性能延迟的数据表现,选择更适配自身业务的模型供应商。
助力AI智能助手、AI陪伴机器人等多元场景落地
随着不断地技术创新和体验升级,声网进一步加速了对话式AI能力在各行业场景的落地。本季度,声网在AI智能助手、AI陪伴机器人、多模态AI智能体创作等多个场景中,都实现了客户应用案例落地。
星野是依托MiniMax先进的多模态AIGC技术,构建的自由创造与分享AI智能体的创作平台。基于MiniMax在文本、声音、视觉模型下的先进能力,以及声网对话式 AI 技术,星野平台中的用户与AI智能体可实现秒回、清晰、流畅的实时语音对话,再搭配超拟人的AI音色,让AI交互更接近人类的真实对话,成为用户娱乐、工作、学习中的AI伙伴。
MiniMax Chat是基于MiniMax最新自研多模态大语言模型打造的AI助手,在声网助力下,语音对话体验成为MiniMax Chat亮点功能之一,响应速度快、AI秒回,即使在弱网、嘈杂环境下,也能清晰、流畅对话。基于MiniMax出色的新一代语音大模型,AI的声音逼真、语气自然,能流畅处理多语种混合输出,并提供调节语速和更换声音等功能。
智谱清言是基于智谱GLM系列模型开发的AI助手,结合智谱出色的音视频理解模型和情感语音模型,清言能够看到和理解用户所处环境,更好地提供问答、翻译、导游、作业辅导等功能。在声网对话式AI技术的助力下,智谱清言的视频通话延迟更低,对话更流畅。
赋之科技推出的EBO Air 2 Plus探索了全新AI玩法,通过声网对话式AI引擎,让用户可与多个大模型助手展开对话,支持6大角色,20+音色,无论知识问答、互动聊天、还是情感陪伴都能一键与 AI 实现自然、流畅的真实互动体验。
Miko3是一款STEAM智能教育机器人,通过声网提供的对话式AI技术,Miko3机器人不仅可以与孩子进行自然、流畅的对话,还能准确识别儿童的情绪并快速给予相应的反馈,成为贴心的情感陪伴者。
从高效生产力工具到暖心情感陪伴,声网对话式AI能力正深度渗透智能硬件、教育、社交等多元领域,持续释放行业价值与增长潜力。未来,声网将深耕场景创新与技术迭代,不断打磨人与智能体的实时互动体验,以更自然、沉浸的交互能力,助力AI真正融入千行百业的实践场景。