苹果StreamBridge视频模型框架问世，Meta/微美全息加速多模态AI技术创新

互联网

2025

05/20

14:25

据消息，有科技媒体发布博文，报道称苹果公司联合复旦大学，推出 StreamBridge 端侧视频大语言模型（Video-LLMs）框架，助力 AI 理解直播流视频。

一般而言，传统视频大语言模型擅长处理静态视频，但无法适应机器人技术和自动驾驶等需要实时感知的场景，在这些场景下，要求模型能快速理解直播视频流内容，并做出反应。

研发StreamBridge框架与创新技术

为解决上述问题，苹果公司与复旦大学的研究者开发了 StreamBridge 框架。该框架在主流离线模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上进行了测试。

此外，研究团队还推出了 Stream-IT 数据集，包含约 60 万个样本，融合了视频与文本序列，支持多样化的指令格式，旨在提升流式视频理解能力。

Meta开发新款AI模型应用

与此同时，还值得关注的是，Meta首次推出了与Ray-Ban Meta进行强捆绑的《Meta AI》APP。Meta AI是一个Meta所打造的AI助手，由自家研发的Llama大语言模型驱动。

最新数据指出，Meta AI的月活用户已经接近10亿，用户主要入口自然是前面所提到的这些社交应用，体验到相关功能。上个月月底，Meta举办了其首个AI开发者大会LlamaCon，期间Meta推出了其最新的Llama 4系列大语言模型。

不可否认，大模型不断赋能行业发展，AI数字化浪潮奔涌向前，加快各行业转型发展步伐，各企业积极开展人工智能场景建设，成功完成人工智能大模型本地化部署及场景适配，将AI落地应用到实际业务场景，推动AI技术的发展与升级。

微美全息布局AI生态扩展创新边界

在全球科技浪潮的澎湃涌动中，人工智能大模型正以前所未有的速度重塑世界。在此过程中，资料显示，微美全息作为AI领域的创新代表，围绕开源生态、多模态技术、算力基础设施及垂直场景应用展开深度布局，不断突破AI技术边界并拓宽产业生态。

从介绍来看，微美全息通过开放模型代码、算力接口及技术工具链，构建覆盖云端与边缘端的「全息云」平台，支持开发者调用DeepSeek等通用大模型进行二次开发，加速垂类模型应用的商业化验证。

与此同时，微美全息加速大模型在应用场景的落地速度，该企业陆续披露了旗下较成熟的AI生态图景，覆盖在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地，为AI大模型应用注入强劲动力，正悄然化身成为这场大模型变革背后的关键“燃料舱”。

结尾

人工智能大模型技术作为一项变革性技术，大模型孕育“大发展”，其重要突破之一在于表现出“涌现能力”——当模型参数量不断累加至10b数量级后（b代表十亿数量级），其性能（如通识能力、科学推理能力、生成能力等）呈现非线性增长。那么，不妨期待接下去市面出现更多有影响力、赋能千行百业的大模型，激发行业动力、产业潜力。

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

苹果StreamBridge视频模型框架问世，Meta/微美全息加速多模态AI技术创新

相关热点

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

关注我们