火山引擎 "Data + AI" 双轮驱动,打造面向 Agent 的企业数据新基建

互联网
2026
06/12
11:44
分享
评论

当 AI 从“可用”走向“好用”,企业对大数据的期待,也正在被重新定义。IDC 预测,到 2029 年,全球范围内非结构化数据占比将达到 80% 以上;与此同时,Agent 正在从“被使用的工具”,逐步演变为“主动消费数据的角色”。数据的形态在变,使用数据的方式也在变——这意味着企业的数据底座,必须跟上一个全新的时代节拍。

近日,由火山引擎与 NVIDIA 联合主办的“2026 火山引擎 Data + AI 行业领航者智创沙龙”在西双版纳成功举办。来自数据平台、AI 基础设施、具身智能、多模态大模型、艺术教育等不同领域的领航者齐聚一堂,围绕 Agentic 时代的数据底座、多模态数据湖、高质量数据集与垂类大模型建设等核心议题展开深度交流,共同探讨企业智能化转型的下一站。

Data Agent:从 "可用走向 "好用",让智能真正流入业务

过去一年,“Data Agent”几乎成为数据领域热度最高的关键词之一。然而,当热度退去,企业关心的核心问题正在回归本质:Data Agent 究竟如何真正解决数据之难?

火山引擎数智平台副总经理徐冰泉在沙龙现场提出,数据之难,从来不止于数据本身。它牵涉到数据生产、治理、分析与消费的完整链路,也牵涉到企业内部流程、组织与决策习惯。

他强调,Data Agent 的务实路径是“80% 准确 + 快速迭代”,并推动企业数据应用从 BI(确定性保障)、ChatBI(效率提升)向 Data Agent(洞察创造)持续演进。火山引擎 Data Agent 构建了从 L1(响应式执行)到 L4(自主式决策)的能力阶梯,其核心价值公式,在于模型能力、工程可靠性与领域知识密度的深度融合。

Agentic 数据底座:让数据成为智能体的 "第一资源"

Agent 的规模化落地,离不开强大的数据底座。火山引擎数智产品总监王彦辉指出,Agentic 时代下,数据不再只是被查询的对象,而是被 Agent 主动调用、主动消费的资源。这对底层架构提出了完全不同的要求:从存储格式到查询引擎,从元数据管理到任务调度,都需要面向“机器消费数据”这一全新范式重新设计。

为此,火山引擎推出了以 LAS Processing Agent 为核心的多模态数据湖解决方案,旨在构建处理与推理一体化的 AI 时代数据新基建。该方案在关键技术上实现了全面革新:

湖存储: 引入新一代多模存储格式Lance,原生支持多模态数据,提供高性能随机访问和零成本加列能力,解决AI场景下大字段和高频打标难题。

湖处理: 采用Daft、Ray等新一代多模态处理引擎,原生支持CPU与GPU异构计算,火山引擎还与Daft创始团队Eventual.Inc携手共建Daft中文社区。

湖管理: 拥抱开源Apache Gravitino,构建开放的AI MetaLake;并推出“AI算子广场”,提供超200种预训练算子,覆盖文档解析、图像OCR、音视频处理等,实现全链路自动化。

技术能力的尽头,往往回到一个朴素的问题——数据的质量。火山引擎高质量数据集业务负责人陶景林在分享中提出,“场景牵引 · 数据筑基 · 模型升级 · 智能落地”,正在成为垂类业务实现智能闭环的一条清晰路径。围绕这条路径,火山引擎持续投入高质量数据集建设,为不同行业的模型迭代与智能体数据消费,提供稳定、可信的数据供给。

展望未来,火山引擎数智平台将持续深耕 Daft、Ray、Lance 等新一代技术社区,强化多模态数据管理,数据应用能力,进一步迈向全面的 Agent 驱动。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3