在6月18日中国通信标准化协会主办的2025数据智能大会上,腾讯云大数据TBDS产品中心总经理徐晓敏发表主题演讲,系统阐释了大模型(LLM)对数据分析范式的深刻变革,并分享了腾讯云在Data+AI融合方向的最新实践。他表示,大模型正重塑数据处理架构、分析方法、治理需求与运维模式,腾讯云已构建起覆盖底层存储到上层应用的完整Data+AI技术体系。
进入LLM时代,数据处理和分析正加速演进。计算从CPU走向CPU+GPU混合,治理对象从结构化数据拓展到文本、图像、音视频等多模态数据,分析方式从规则建模向语义理解驱动的智能分析转变,运维从人工修复迈向自动化响应。资源管理正依托动态优化,交互方式从SQL迁移到自然语言,人机协作也从工单驱动进化为智能联动。
应对这些变化,腾讯云构建了以统一元数据视图为核心的坚实底座。通过TBDS-Catalog,平台打通了Hive、Iceberg、MPP数仓等结构化源与图像、音视频、模型等非结构数据,实现统一的元数据视图和权限管理。该服务兼容Hive Metastore,便于承接历史资产,并通过高性能JDBC优化大表处理效率。面向AI场景, TBDS-Catalog可统一管理模型文件和训练数据,保障非结构数据高效可控。
在架构层,腾讯云基于Lakehouse构建了支持批处理、流计算、交互式查询和AI训练的统一平台,灵活调度Spark、Flink、StarRocks等计算引擎。Wedata开发平台融合DataOps与MLOps,支持结构化与非结构化数据资产的统一开发、编排与治理。
为降低使用门槛,腾讯云推出了自然语言驱动的ChatBI。用户无需掌握SQL,只需通过自然语言提问,即可获取实时数据结果。系统还能自动解读数据、识别波动并进行归因分析,大幅提升业务响应效率。
在非结构化数据分析方面,腾讯云推出AI-Search平台(腾讯云ES),打造覆盖语义理解、向量化、检索和生成的一站式RAG平台。该系统支持复杂文档解析与混合搜索,已广泛应用于“微信读书AI问书”、“ima工作台”等场景,借助ES-RAG技术实现生成式回答和问题推荐。腾讯云也是首个通过信通院《检索增强生成技术要求》标准认证的企业。
在运维治理上,腾讯云通过“大数据智能管家”构建了闭环自治体系,覆盖从数据采集、异常诊断到资源优化的全链条。系统通过智能模型提升资源利用率达60%,并支持故障自愈和策略自动演进,显著降低运维成本。
这些能力已在腾讯内外全面落地。目前,腾讯云大数据已服务2000多家政企客户,节点规模超10万。腾讯云将持续推动Data+AI融合,为行业释放更大数据智能价值。