小米发布全模态基座模型Xiaomi MiMo-V2-Omni：支持多模态感知、工具调用等

业界

2026

03/19

11:04

凤凰网科技

分享

评论

3月19日，小米发布面向Agent时代的全模态基座模型Xiaomi MiMo-V2-Omni。该模型从底层构建融合文本、视觉、语音的全模态架构，将感知与行动深度绑定，原生支持多模态感知、工具调用、函数执行及GUI操作能力。

在正式发布前，小米将一个早期测试版本以“Healer Alpha”为代号匿名上架OpenRouter。上线期间调用量持续攀升，在OpenClaw测评榜单PinchBench上取得均分第一。

据官方介绍，MiMo-V2-Omni在音频理解方面支持环境声分类、多说话人分离、音频-视觉联合推理及超10小时长音频理解，综合表现超越Gemini 3 Pro。图像理解方面，在多学科视觉推理与复杂图表分析任务中超越Claude Opus 4.6，逼近Gemini 3 Pro等闭源模型水平。视频理解方面支持原生音视频联合输入，具备情境感知与未来推理能力。

智能体能力方面，该模型可在与真实数字环境交互的评测基准上比肩Gemini 3 Pro。在Browser Use场景中，结合OpenClaw框架可实现浏览器操控，完成信息检索、比价、与客服交互及下单等任务。与金山办公合作，接入WPS Office后，模型可根据指令生成Word文档、结构化Excel、排版规范的PDF及PPT。

MiMo-V2-Omni已开放API服务，支持256K上下文长度，输入0.4元/百万tokens，输出2元/百万tokens。小米联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等五大Agent开发框架团队，为全球开发者提供为期一周的限时免费接口支持。

【来源：凤凰网科技】

THE END

广告、内容合作请点击这里寻求合作

小米

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表砍柴网的观点和立场。

相关热点

小米罗福莉AI团队最新突破，使算力成本直降71.2%

3 月 17 日消息，据智能纪元 AGI 昨日（3 月 16 日）报道，前 DeepSeek 研究员、小米 MiMo 大模型负责人罗福莉发表论文，与北京大学联合研发出统一的资源管理系统 ARL-Tangram。

业界

小米、小鹏将入股玛莎拉蒂？Stellantis集团回应

3月13日，据财联社报道，针对与中国车企合作传闻，Stellantis集团称，作为Stellantis集团正常业务运营的一部分，集团与遍布全球的行业优秀企业就各种主题进行讨论，并始终以“向客户提供最佳的出行方式”...

业界

小米加码车载光伏或与前高管李创奇联手布局

3月9日消息，据报道，小米前可穿戴业务负责人李创奇已秘密创业，新项目聚焦于车载光伏领域，将与小米合作。

业界

网友提议小米出Vision Gran Turismo车模，雷军：马

3 月 1 日消息，小米创办人、董事长兼 CEO 雷军今日分享了 Xiaomi Vision Gran Turismo 的宣传视频。

业界

你工作多久买部iPhone！全球手机均价破400美元：苹

1月31日消息，在全球智能手机高端化趋势持续推进的背景下，苹果iPhone的平均售价（ASP）在2025年第四季度首次跨过1000美元大关（已达1011美元，约合7230元人民币）。

业界

最新文章

相关推荐

“特斯拉又割了我 7 万块”

用 eSIM 取代手机卡，究竟难在哪里？

这就是 iPhone 13 的“杀手级新功能”？网友：炒华为冷饭！

谷歌Pixel 6真机曝光：最美安卓屏幕没跑了！

iPhone 13机模曝光：值得等！

苹果计划在美国生产 Apple Car 汽车电池

砍柴网（ikanchai.com）创立于2013年，始终秉承观点独到、全面深入、有料有趣的宗旨，在科技与人文之间寻找商业新价值。

关于我们 | 联系我们 | 商务合作 | 寻求报道 | 投稿须知

意见反馈：kefu@ikanchai.com

稿件投诉：post@ikanchai.com

内容合作QQ：1587015870

商务合作：bd@ikanchai.com

关注我们

关注砍柴网官方微博
每日获取最新科技动态

关注砍柴网微信公众号
探索科技与商业的逻辑

商务合作、媒体邀约
赶紧联系我们

Copyright © 2013-2020 砍柴网 / 京ICP备15042874号-1 / 京公网安备 11010502032797号 / 本站由CMSTOP、阿里云、亿速云、腾讯云提供驱动力