火山引擎 "Data + AI" 双轮驱动，打造面向 Agent 的企业数据新基建

互联网

2026

06/12

11:44

当 AI 从“可用”走向“好用”，企业对大数据的期待，也正在被重新定义。IDC 预测，到 2029 年，全球范围内非结构化数据占比将达到 80% 以上；与此同时，Agent 正在从“被使用的工具”，逐步演变为“主动消费数据的角色”。数据的形态在变，使用数据的方式也在变——这意味着企业的数据底座，必须跟上一个全新的时代节拍。

近日，由火山引擎与 NVIDIA 联合主办的“2026 火山引擎 Data + AI 行业领航者智创沙龙”在西双版纳成功举办。来自数据平台、AI 基础设施、具身智能、多模态大模型、艺术教育等不同领域的领航者齐聚一堂，围绕 Agentic 时代的数据底座、多模态数据湖、高质量数据集与垂类大模型建设等核心议题展开深度交流，共同探讨企业智能化转型的下一站。

Data Agent：从 "可用" 走向 "好用"，让智能真正流入业务

过去一年，“Data Agent”几乎成为数据领域热度最高的关键词之一。然而，当热度退去，企业关心的核心问题正在回归本质：Data Agent 究竟如何真正解决数据之难？

火山引擎数智平台副总经理徐冰泉在沙龙现场提出，数据之难，从来不止于数据本身。它牵涉到数据生产、治理、分析与消费的完整链路，也牵涉到企业内部流程、组织与决策习惯。

他强调，Data Agent 的务实路径是“80% 准确 + 快速迭代”，并推动企业数据应用从 BI（确定性保障）、ChatBI（效率提升）向 Data Agent（洞察创造）持续演进。火山引擎 Data Agent 构建了从 L1（响应式执行）到 L4（自主式决策）的能力阶梯，其核心价值公式，在于模型能力、工程可靠性与领域知识密度的深度融合。

Agentic 数据底座：让数据成为智能体的 "第一资源"

Agent 的规模化落地，离不开强大的数据底座。火山引擎数智产品总监王彦辉指出，Agentic 时代下，数据不再只是被查询的对象，而是被 Agent 主动调用、主动消费的资源。这对底层架构提出了完全不同的要求：从存储格式到查询引擎，从元数据管理到任务调度，都需要面向“机器消费数据”这一全新范式重新设计。

为此，火山引擎推出了以 LAS Processing Agent 为核心的多模态数据湖解决方案，旨在构建处理与推理一体化的 AI 时代数据新基建。该方案在关键技术上实现了全面革新：

湖存储：引入新一代多模存储格式Lance，原生支持多模态数据，提供高性能随机访问和零成本加列能力，解决AI场景下大字段和高频打标难题。

湖处理：采用Daft、Ray等新一代多模态处理引擎，原生支持CPU与GPU异构计算，火山引擎还与Daft创始团队Eventual.Inc携手共建Daft中文社区。

湖管理：拥抱开源Apache Gravitino，构建开放的AI MetaLake；并推出“AI算子广场”，提供超200种预训练算子，覆盖文档解析、图像OCR、音视频处理等，实现全链路自动化。

技术能力的尽头，往往回到一个朴素的问题——数据的质量。火山引擎高质量数据集业务负责人陶景林在分享中提出，“场景牵引 · 数据筑基 · 模型升级 · 智能落地”，正在成为垂类业务实现智能闭环的一条清晰路径。围绕这条路径，火山引擎持续投入高质量数据集建设，为不同行业的模型迭代与智能体数据消费，提供稳定、可信的数据供给。

展望未来，火山引擎数智平台将持续深耕 Daft、Ray、Lance 等新一代技术社区，强化多模态数据管理，数据应用能力，进一步迈向全面的 Agent 驱动。

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

火山引擎 "Data + AI" 双轮驱动，打造面向 Agent 的企业数据新基建

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们