当前,全球科技竞争已进入战略博弈期。以“具身智能”为代表的人工智能作为新一轮科技革命的重要驱动力量,已然成为世界瞩目的前沿阵地。掌握具身智能,就等于掌握了工业4.0时代的新质生产力密码。在这场关乎国运的较量中,中国具身智能民营企业智元机器人近期迎来一场重要检阅。
4月29日,位于徐汇区的上海“模速空间”大模型创新生态社区进行了一次调研。智元机器人代表具身智能行业汇报进展,并现场展示了智元灵犀X2、精灵G1、远征A2等机器人产品及相关场景算法,包含精灵G1清理桌面垃圾、灵犀X2骑自行车、以及汽车仪表盘装配等生活和工业场景应用。相关画面登上央视新闻联播后,引发了全国观众的关注与热议。
为什么智元机器人能够代表中国具身智能行业?
短短不到两个月,智元机器人已三度参与了高层政企对话,持续获得决策层的关注。
作为一家创立还不到两年的具身智能企业,智元机器人能够从具身智能行业中脱颖而出并获此殊荣,绝非偶然。目前诸多人形机器人在不停地尝试走路、跑步、后空翻等 运控能力,但这也意味着全球机器人产业正陷入"单科突进"的技术困局——多数企业仍在单点能力上挣扎,核心痛点直指场景适配不足与量产化难题。
与一众“偏科生”不同的是,智元机器人自创立伊始就锚定了一条差异化路线——以“AI+本体”的融合创新,协同发展机器人运动智能、交互智能、作业智能三大核心AI能力,打造世界级领先的通用具身机器人产品及应用生态。简单来说,就是让机器人在钢铁身躯的基础上,还拥有聪明的大、小脑,变身“全能选手”。
为此,智元机器人构建了领先的机器人“本体+AI”全栈技术,完成了模型-数据-本体部署的全栈具身智能布局。基于此,智元机器人在全球范围内率先实现了人形机器人的规模化量产和商业化落地,产品售往全球多个国家和地区。
此外,智元机器人成立了智元具身研究中心,专注于具身大小脑、空间智能、强化学习等方面的研究,面向软硬件算法一体,全面覆盖AI及机器人核心技术,以问题驱动科研,打造基础科学研究、应用科学研究、科研成果落地的有机闭环。
值得一提的是,智元机器人还致力于推动具身智能行业创新与协同发展,成立以来相继完成了机器人操作系统AimRT、灵犀X1全套图纸及代码、百万真机数据集、海量仿真数据集和仿真评测工具的开源工作,助力构建开放、协作的通用具身智能产业生态。
从运动智能到交互智能,让机器人拥有更多情感互动
当前,具身智能机器人众多企业仍处于“运动能力攻坚期”,多数产品聚焦于双足行走、跑步、跳跃等基础运动控制,其核心能力多围绕平衡性、关节灵活度及环境适应性展开,尚未突破复杂操作与高阶认知的瓶颈。
例如,各地举行的马拉松运动会中,参赛机器人在足球、竞速等项目中频现“被绊倒”“完赛率低”等问题,暴露出动态场景下感知-决策-执行的协同短板。
然而,以智元为代表的头部具身智能企业正通过结合深度强化学习和模仿算法学习优势,尝试将机器人能力从“运动控制”推向“精细化任务执行”阶段。现在,精灵G1已经可以进行垃圾分类,灵犀X2能够举杠铃、掌握骑自行车的动态平衡、完成缝合葡萄的毫米级操作,远征A2则可以跳舞、打太极……智元三大家族产品均展现了从“机械重复”到“类人灵巧”的跨越。
过去几十年,人形机器人领域更在乎的只是“动起来”,冰冷的金属关节和预设程序始终与“生命感”隔着一道鸿沟。当春晚舞台上的机器人扭起秧歌时,人们惊叹的是编排出的模式化动作,而非情感共鸣。
如今,这场革命正转向更本质的命题:如何让机器人的内核“更像人”、“更懂人”,甚至能在对话中捕捉人类的微妙情绪?答案指向一个更具野心的目标——让机器不止于工具,而是成为能理解、回应甚至承载情感的“类生命体”。
在交互方面,智元的机器人堪称教科书级的范式。其中,灵犀X2搭载了基于VLM的多模态交互大模型“硅光动语”,能够实现毫秒级的交互反应,通过人类的面部表情和语音语调精准判断情感状态,并做出相应的回应。
研发团队还将动作模态集成到了模型当中,赋予了灵犀x2更加鲜活的“生命力”,比如模仿人类的呼吸韵律、会“暗中观察”,还有各类细小动作和肢体语言,让机器人拥有更多情绪表达的能力。
当下正在如火如荼举行的上海车展上,智元远征A2也成为了一道靓丽的科技风景线,它与现场靓丽的车模共同迎接观众的到来。在展区前台,与远征A2互动打卡的观众排起长队,网友戏称“销售KPI已拉满”。此外,远征A2还能与国际友人进行英语交流,活脱脱是一个合格的“国际销售”。
从智元机器人的交互表现来看,具身智能技术狂飙的终点并非替代人类,而是创造一种新的共生关系。当机器人能读懂叹息中的疲惫、微笑中的欣慰,甚至对答如流时,它模糊了工具与伴侣的界限,演化为解决老龄化、劳动力短缺等发展困境的解题巧思。
作业智能:十八般武艺,机器人像人一样“生活”
实验室模型在精心设计的桌面上能优雅倒水,却在真实厨房里打翻酱油瓶;仿真环境训练的抓取算法,遇到超市货架上歪斜的薯片袋就瞬间失效。这种“仿真与现实”的割裂,本质是行业对数据闭环与泛化能力的集体焦虑。
当多数企业还在用合成数据“喂养”模型时,智元机器人选择了一条投入巨大但价值最高的道路:让机器人在3000平方米的智元数采中心里,不断完成“犯错-修正-进化”的正循环。
智元数采中心作为全球首个投入运营的数采超级工厂,日均可采集数万条数据,构建了家居、餐饮、工业、商超和办公五大类型的真实场景,全面覆盖机器人在生产、生活中的典型应用需求,为机器人学习和具身智能大模型训练提供高质量的数据养料。
基于海量的数据采集,去年年底,智元推出了世界上首个大规模高质量机器人学习数据集AgiBot World,推动人形机器人产业数据资源开发利用和开放共享,让高质量机器人数据在学术界与工业界都触手可及。
今年3月,智元重磅发布首个通用具身基座模型——智元启元大模型(GO-1),开创性地提出了Vision-Language-Latent-Action (ViLLA)架构,具有人类视频学习、小样本快速泛化、一脑多形、持续进化等突出优势。进一步打通了具身智能从仿真到实体应用的闭环,将具身智能推上了“通用化、开放化、智能化”的新台阶。
4月,智元机器人发布具身智能一站式开发平台Genie Studio,推出“数据采集、模型训练,仿真评测、模型推理”四大核心模块,彻底打通具身智能从数据到部署的完整链路,让具身智能真正成为可编程、可迭代、可规模化的新质生产力。
当全球具身智能开发者还在合成数据的"温室"里蹒跚学步时,智元机器人已构建起具身世界的"数据雨林",月月出成绩,以行业内见所未见的“智元速度”,让机器人系统不断掌握应对复杂物理世界的"十八般武艺"——如果数据不再是稀缺资源,具身智能行业的"iPhone时刻"或许比想象中来得更快。
从实验室走出来,推动人形机器人的商用化国际化
“智元速度”不只是产出数据,也可以落地实体。2024年1月,智元机器人在上海建立全国首个量产规模的人形机器人制造工厂,具备核心零部件自研及整机集成、制造、测试能力、有自主可控、协同运行的供应链体系以及人工智能基础软硬件系统。仅仅1年时间,智元机器人就凭借领先的本体+AI全栈技术,在全球范围内率先实现了第1000台通用具身机器人量产下线,刷新行业纪录。完成了从“实验室技术”向“商业化落地”的关键跨越,为全行业发展注入了强劲信心。
其中,智元的三大机器人家族——“全身高”人形机器人远征A2、“半身高”人形机器人灵犀X2、“轮式机器人”精灵G1,全方位覆盖了人形机器人的应用场景,满足了各行各业的应用需求。
此外,智元机器人也在积极开拓国际市场的合作布局。2025年2月,智元机器人宣布与哈萨克斯坦政府及投资机构合作,推动哈萨克斯坦的机器人生产的本地化,助力其建立机器人技术能力。4月2日,智元机器人宣布与国际顶尖具身智能公司Physical Intelligence(PI)达成合作,攻克长周期复杂任务和跨场景应用难题!目前,双方合作已初见成效——一个通用模型可适应不同指令,实现高效自主任务执行,具身智能进入快车道的未来可期。
奋勇向前,为中国智造装上发展新引擎
站在第四次工业革命的黎明前夜,智元机器人作为中国具身智能的“先锋”,正以“本体+AI”全栈自研的硬核实力和敢为人先的生态布局,为"中国智造"装上发展新引擎。在这场没有终点的科技马拉松中,中国已在人工智能领域找到直线超车的支点。