自变量机器人参与成立RoboChallenge组委会 开源协作开启标准化新阶段

互联网
2025
12/08
13:46
分享
评论

2025年深圳国际人工智能展览会上,一台名为“小量”的机器人正有条不紊地忙碌着:精准地拿起杯子,熟练地接取冰块,细致地添加各类小料,整个流程一气呵成,仅用两分钟就呈上一杯色泽诱人的果味冰沙。周围人群的惊叹声此起彼伏,而更令人瞩目的,是这台机器人背后那股强大的力量——2023年12月才成立的深圳初创公司自变量机器人。这家公司虽成立时间不长,却已成功斩获8轮融资,累计金额超20亿元,成为具身智能赛道上一匹耀眼的“黑马”。而这一切成就的背后,离不开阿里、美团等巨头的鼎力支持,以及一位清华学霸多年坚守的机器人梦想。

在自变量机器人创始人兼CEO王潜的宏伟蓝图中,单点任务不过是通用机器人走向广泛应用的一个小小开端,他真正的目标,是让通用机器人真正走进千家万户,成为人们生活中不可或缺的一部分。

初心:跨界逐梦的机器人情怀

王潜身上有着清华学子鲜明的特质:理性、执着且富有远见卓识。他本硕均毕业于清华大学,是全球最早将注意力机制引入神经网络的学者之一。其相关研究成果与Google在该领域的首篇论文一同登上顶级会议,这一成果后来更是成为Transformer架构的核心,为现代大模型技术奠定了坚实基础。

在美国南加州大学攻读博士期间,王潜毅然将研究重心转向了自己热爱的机器人领域。他在顶级机器人实验室潜心钻研多年,深度参与多项机器人学习与人机交互研究。这段宝贵的经历,让他深刻认识到传统机器人技术存在的诸多局限,也使得打造通用机器人的想法在他心中深深扎根。

博士毕业后,王潜曾在美国创办量化基金公司,事业发展顺风顺水。然而,内心深处那份对机器人的执着热爱从未消减,“晚上经常睡不着,满脑子都是做机器人的想法”成了他当时生活的真实写照。2023年,大语言模型技术取得突破性进展,王潜敏锐地捕捉到机器人行业迎来历史性机遇,于是果断解散基金,毅然回国创业

这一决定并非一时头脑发热。在他看来,中国在硬件制造与供应链领域具备全球领先优势。“美国硬件人才大多被大公司的‘金手铐’束缚,而中国的供应链优势可能领先美国一个数量级。”更关键的是,中国的数据收集成本仅为美国的十分之一,这为具身智能的研发提供了核心支撑。

2023年12月18日,王潜初到深圳,自变量机器人正式宣告成立。这座充满创新活力的城市,其完善的产业生态让他深感震撼。“实验室里机器人所需的硬件及零配件,大多产自深圳,在这里两天甚至半天就能配齐所有零部件。”深圳强大的“产业磁场”,成为他实现梦想的理想土壤。

孤勇:坚守端到端路线的突围

自变量机器人自成立之初,便毅然选择了一条与众不同的技术赛道——“大小脑统一的端到端大模型”路线。这一选择在当时饱受争议,甚至遭到业内专家的直接质疑。

多年前,当王潜首次提出端到端思路时,一位知名机器人教授当面否定:“端到端虽然很有意思,但可能永远只是个玩具,难以真正落地。”面对质疑,王潜始终坚守自己的信念,因为他深知传统技术存在的瓶颈。

所谓端到端模型,与传统分层架构有着本质区别。传统模式将任务拆解为感知、规划、控制等多个独立模块,每个模块各自运作。而端到端模型则通过统一架构,实现从感知、规划到控制的全流程闭环。“分层模型每多一步拆解,就会引入额外误差和不可控噪声,难以实现可靠执行;而端到端统一模型能在‘感知—决策—执行’全流程保持连续性,从根本上解决这一问题。”王潜耐心解释道。

自变量的技术理念可概括为“纵向统一”与“横向统一”:纵向实现从视频、传感器原始输入到机器人运动输出的全流程由同一模型处理;横向让不同任务共用一个模型,训练与推理均在统一架构下完成。这一理念在WALL - A模型上得到了充分验证,该模型使机器人仅用二指夹爪,就能轻松完成拉拉链、叠衣服、浇花等复杂操作,数分钟级任务成功率超过95%。

突破:从模型迭代到场景验证

自变量机器人的产品演化轨迹,清晰地印证了其技术路线的正确性。成立仅两个月,公司便成功研发出第一版具身智能操作模型,可完成切菜、倒水等复杂操作;2024年底,更是发布全球最大参数规模的具身智能通用操作大模型——Great Wall系列WALL - A模型,实现了三大核心突破。

其一,多模态信息融合,能够整合感知数据、自然语言指令与运动控制信号,实现输入到输出的端到端映射;其二,已展现出零样本泛化能力,在部分未见过的新任务场景中无需重新训练即可适配,这是通用机器人的关键标志;其三,在动态环境感知、实时任务规划和超长程任务上取得突破,能完成拉拉链、扣扣子、挂衣服等长序列复杂操作。

定力:坚持真机数据路线

在数据策略上,自变量机器人坚持“高质量真机数据”路线,与行业内依赖仿真数据或互联网视频数据的做法截然不同。王潜态度坚决:“所有涉及复杂物理交互(如接触丰富的手部操作)不应完全使用仿真数据。我们探索了十几年,结论是手部复杂操作无法通过仿真数据进化。”

公司构建了多渠道数据收集体系:集中式数据采集场地、分布式现实环境收集、机器人部署后的数据回流,从三个维度保障数据质量,为模型训练提供坚实支撑。王潜将泛化能力分为四个层次:基础条件泛化(适应光照、物体位置变化)、跨环境泛化(从一个场景扩展到多场景)、对象层面泛化(对未见过的同类物体完成任务)、任务泛化(探索解决未学习过的任务)。目前,自变量模型在前三个层次已展现出优异的通用性。

引力:20亿融资背后的巨头布局

自变量机器人在资本市场的表现堪称惊艳:成立不到两年完成8轮融资,累计金额超20亿元。2025年9月,公司宣布近10亿元A + 轮融资,由阿里云、国科投资领投,国开金融、红杉中国等跟投,老股东美团、联想之星等追投。值得注意的是,这是阿里云首次布局具身智能领域,也是美团第二次加注。

阿里、美团、京东三大巨头在具身智能领域的布局逻辑差异明显。阿里投资数量最多,已布局10家相关企业,核心逻辑是通过云计算和大模型扩展AI应用边界,构建具身智能技术生态;美团布局更早更全,从物流、配送机器人到大模型、AI芯片,覆盖上下游全链条;京东虽起步较晚,但节奏迅猛,4个月内投资6家企业,聚焦零售、物流、家庭三大垂直场景,打造场景导向的技术生态。

路径:从To B切入,剑指家庭市场

面对具身智能领域备受争议的商业化问题,王潜有着清晰且明确的规划。他坚信“家庭是机器人最大市场,预计3 - 4年会出现早期产品”。经济学测算显示,人类家务劳动占比高达四分之一却未计入GDP,这意味着家庭机器人市场潜力巨大,甚至有望超越工业及其他场景。

自变量机器人的商业化路径确定为“To B切入,逐步延展至To C”。王潜表示,2025年公司将在多个功能性场景实现商业化落地,让机器人在开放、随机场景中自主完成复杂操作。对于部分企业将人形机器人送入工厂从事简单重复工作的做法,他直言“那其实就是PR行为”,强调真正有价值的商业化,必须依赖具身智能模型泛化能力的提升。

价格方面,王潜预测,消费者可接受、产业链可支撑的价格区间约为1 - 2万美元(折合人民币10万元上下),目前仍需通过产业链优化降低成本。他同时预判,类GPT - 3水平的具身智能大模型有望一年内出现,而人形机器人的“ChatGPT时刻”则需要3 - 5年。

远方:挑战中构建生态闭环

尽管自变量机器人已取得显著进展,但王潜仍清醒地认识到通用机器人之路充满挑战。他指出,当前限制机器人产业化的核心是“大脑”而非硬件:“展馆里不乏运动能力出色的机器人,但它们提供的实用价值有限,更多是形式价值。”

面对挑战,自变量机器人正积极构建具身智能生态。2025年9月,公司在合肥发布《具身智能生态建设计划》,依托自研具身基础模型,打造全球具身智能创新与产业核心枢纽;此前,开源端到端具身智能基础模型WALL - OSS,这是全球首个面向物理世界交互、具备落地能力的开源端到端具身智能基础模型。

对于长远发展,王潜明确“软硬一体”的商业模式:“机器人无法复制Windows或Android的模式,需软硬件高度耦合,软硬一体是最合理的选择。”

2025年世界机器人大会上,搭载WALL - A模型的“量子1号”机器人自如地完成制作香囊、整理客厅等复杂任务,引来现场观众驻足关注。身高172cm、拥有62个自由度的“量子2号”,展现了全栈自研硬件的实力。王潜站在展台旁,冷静观察着一切,脸上并无太多波澜——对他而言,展台上的掌声只是前进道路上的小小点缀,那个让通用机器人走入千家万户的梦想,正以“深圳速度”一步步从蓝图变为现实。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3