对谈加速进化程昊:从踢好一场球出发,目标是具身智能的“安卓”

一家不追风口的机器人公司该如何穿越芜杂的具身智能周期?
文丨薛良
正值 2026 年世界杯开幕,6 月 6 日,中国外交部发言人毛宁在 X 平台转发了一条机器人踢足球的视频,配文 “中国机器人队已准备好”。
这是加速进化新一代人形机器人 T2,尽管公司成立时间不长,但在机器人踢足球这个场景,从 2006 年入学清华大学自动化系算起,加速进化 CEO 程昊已经做了 20 年。
在与程昊访谈过程中,他说的最多的不是有关大模型的宏大叙事,而是加速进化笃定地分层落地、数据先行路线,也就是说,加速进化希望先让机器人在实际场景里跑起来,通过商业化真实场景沉淀数据形成飞轮。程昊不认同激进押注,相反,他认为,双足人形进工厂没有看到规模化落地的机会,硬件毛利会持续走低,也就是说,算法无法构成真正壁垒,而具身大模型成熟落地仍需五年甚至十年,与其等待空中楼阁,不如先做能落地的操作系统与场景。
这是一家不急于拥抱宏大叙事,甚至不太迎合资本风潮的公司,在具身行业几乎所有人或多或少都被融资、估值和概念裹挟的时候,程昊说,融资是双向选择,宁愿节奏比行业慢半拍,也不编故事、不偏离长期战略,他更在意的是:商业模式是否成立、产品是否真正落地、组织是否踏实笃定。
5 月,加速进化完成近 10 亿元 A 轮系列融资,其中最新一轮由北京高精尖产业基金、京国盛基金与华控基金联合领投,在加速进化的股东名单里,还有深创投、北京市人工智能产业投资基金、北京机器人产业发展投资基金、源码资本、英诺基金、彼岸时代和 IDG 等名字。
从清华自动化系入行机器人领域,到二十年后打造一个现金流健康的公司,交出千台真机,瞄准教育场景试图打开一个新的百亿美元级市场,程昊想证明慢即是快,与其冲刺一时规模,不如做一家十年后依然存在的公司。
这也是程昊眼中移动互联网周期给具身智能周期的最好启示——先找到商业模式,再谈改变世界。
机器人踢足球:二十年磨一剑,验证最小闭环
晚点:20 年前你就在做机器人足球,这一切是怎么开始的?
程昊:我从小想做机器人,高中别人告诉我自动化系是做机器人的,就报了清华自动化系。当时清华只有两个实验室做双足机器人,大二精仪的实验室关了,整个清华只有我们一个。
机器人踢足球,用现在的话说,是唯一可以真正落地的具身 Agent。它需要运动能力(跑跳踢球)、实时决策(何时射门)、多机协作(5v5 团队),规则明确、输赢清晰。篮球依赖手,20 年前到现在技术都很难实现,但足球和走路都用脚,等于把复杂问题相对简化。
晚点:你们的新品 T2 和世界杯一起到来了,很明显它踢球技术会更好对吧?
程昊:T2 是我们针对高动态、高爆发、复杂需求的科研等场景推出的旗舰机型,从自由度、到单臂负载、再到算力和二次开发都到了一个新高度。
外交部发言人毛宁前两天在 X 上发了一个 T2 的踢球视频,它自主踢球的球速可以跟世界一流的金靴运动员相比拟,那是在我们筹备的世界杯内容之一,这次世界杯期间我们会用 T2 和 K1 做一系列点球挑战和互动活动。
晚点:23 年创业后你们依然参加足球赛事,感受有什么变化吗?
程昊:24 年参赛时有点失落,快十年了,大家好像没有本质进步。当年有支德国队碾压全场,后来开源了算法,大家学了十年,水平还那样。特别是当年都用舵机——算法运行效果不好,能力弱,产品化空间小,好比造汽车,三蹦子发动机不能直接用吧?何况舵机还很贵。
但 25 年我们的 K1 和 T1 去踢,类似当年的德国队,几乎碾压所有对手。我们把舵机换成准直驱关节,用最前沿算法,走路稳、不怕撞、射门精准,最大比分 20:0。T2 的能力会更好,它定位在旗舰水平,所以算力拉满,价格区间也能覆盖更广泛的用户。

身高不到 1 米的 K1 能大力抽射,球撞球网后墙壁发出 “咚” 的一声。线下活动不得不限制参与人群年龄,以防有人被球撞伤。这款机器人只要 3.99 万元,22 个自由度,入门版算力 48 TOPS,在京东就可以购买。
晚点:踢赢足球赛,下一步是什么?
程昊:踢赢人类。目标是 2050 年踢赢人类,中期目标 2030 年踢赢 U9 青训队。
晚点:但足球赛既不是商业化赛事,也不是生产力场景,不觉得荒诞吗?
程昊:20 年来人形机器人各种场景只存活下来一个,就是踢足球,其他跳舞、射箭比赛都没了。当人形机器人把足球踢好、踢赢人类的那一刻,它就具备了落地能力。足球涉及运动、感知、决策全流程,如果直接跟人踢,还涉及人机对抗的安全算法优化,这些都可以在足球场闭环实现。这是验证最前沿算法的最小可执行产品(MVP),非常本质。
就像字节跳动,先做内涵段子、再今日头条、最后抖音,本质做的是内容生产-分发-消费,算法同一套,载体不同。最垂直简单的载体也能把算法跑完美。
晚点:足球是具身智能的 MVP?
程昊:对。如果在家庭场景试验,第一很贵,第二很危险,没有家庭敢直接用。但不验证就拿不到真实场景数据迭代算法,这事就锁死了。就像自动驾驶,全世界不允许上路怎么办?所以要先让车跑起来,数据自然来,推动具身飞轮转动。
另外足球有观赏性,中学生以下效果很好。前阵在五棵松办活动,机器人已经可以通过端到端神经网络直接射门,点球一般小学生守不住,力道强还会找角度。今年年中机器人会跑起来、带球传球,观赏性再提升。
晚点:除了足球还有别的场景能实现这种技术验证闭环吗?
程昊:我目前没想到。
分层落地:为什么现在该做操作系统,而非赌端到端
晚点:二十年过去,具身智能现在做的和从前有什么本质不同?
程昊:大逻辑框架一样,但每个模块算法都在升级。比如决策层,现在逻辑是用大模型生成。
晚点:这似乎还是分层逻辑,和许多公司主张的端到端模型不一样。
程昊:终局是端到端解决所有问题,但现在还非常遥远。就连大模型介入决策层也有很多问题,比如足球场景对快速响应要求高,目前还用不了大模型,决策树 + 强化学习更快。如果不是高速响应任务,比如导览,大模型决策可以落地,但这仍是感知→决策→执行的过程,不是端到端解决一切。
晚点:所以加速进化现阶段没有在做具身大模型?
程昊:我们不押注 “空中楼阁” 的端到端大模型,但我们在做分层模型落地,同时用落地场景采集数据——这是特斯拉路线。
具身大模型距离落地还非常非常遥远。首先范式是什么还不知道,从 VLA 到世界模型还在争论;其次训练所需的数据都没有。即便把多模态数据词元化,需要多大算力?语言模型的算力需求你已经看到了,更何况现在还根本没有这些数据,具身模型到底需要什么样的数据也不清楚。
条条大路通罗马,但我们还处于没有鞋的阶段。
晚点:数据和算法哪个更重要?
程昊:人活下来吃饭重要还是喝水重要?都重要,但现在都不知道怎么做。
晚点:但很多人谈数据应用,比如真机数据、遥控操作、仿真数据。
程昊:遥操数据做出来的 demo 拧瓶盖像穿针引线,这是慢思考训练快思考,不合理。真机数据、仿真数据也有类似问题,能拿出 demo,某些情况效果不错,但都是过渡方案。
就像 AI 视觉领域,OpenCV 能识别物体你觉得厉害,但多模态大模型才是终极方案,中间迭代了将近 20 年。做公司不能等 20 年,一两年也不能等。所以我们一直在做机器人足球赛这样的落地,像是在泥里爬,大模型是天上飞的,要先爬出来才能往上飞。
晚点:多久才能往上飞?
程昊:从现在算,最快五年,大概率十年。
晚点:其他走具身大模型路线的公司,需要十年落地?
程昊:反过来想,如果现在没有公司往前推,时间可能更长。就像 OpenAI 做大模型,最初不考虑落地,融很多钱笃定沿 transformer 往下走,从 1.0 到 2.0、3.0,最后才涌现好结果。
晚点:谁做这样的事比较靠谱?
程昊:大厂吧,需要千亿人民币投入。OpenAI 虽不是大厂,但和微软绑定,具备大厂的人才密度和资金,就很笃定敢赌。具身大模型现在就应该做,但不是加速进化做。
晚点:那加速进化做的是什么?
程昊:我们做的是和具身大模型相辅相成的一条路。具身大模型需要数据、需要基于本体的验证、需要落地,而加速进化就在开发机器人本体、操作系统与工具。
我们像苹果或微软,做本体、做端侧系统和工具,大模型像互联网或云。未来具身行业这两类公司都需要,但初创公司说两个都做且都做好,不现实。
OS 时代:构建 Agent 生态与数据飞轮
晚点:开发具身操作系统的前提是?
程昊:软件工程师先用一年时间开发踢足球,成为机器人 Agent 开发者。踢足球本身就是个 Agent,工程师开发过程就会理解机器人需要什么样的系统工程建设。这个世界上懂机器人的不太懂软件工程,懂软件工程的完全不懂具身智能,但踢了一年足球后,我们出现了一批两方面都懂的工程师。
晚点:操作系统具体做什么?
程昊:类比 Windows 和计算机。通用的事——开发工具、环境配置——操作系统都集成了,GUI 本质是降低开发者门槛。过去具身开发要名校硕士,用我们的工具,会 Python 的高中生就能上手。
最终会发展出具身 Agent 生态。不是现在熟悉的大模型 Agent,是具身 Agent,大家把不同算法能力组合起来接入操作系统,解决真正问题。谁能构建 Agent 生态,谁就是最大赢家。
晚点:你们马上要推出一款叫 Booster Studio 的开发工具,听起来像是为开发者准备的 “武器库”。
程昊:是的,这应该是全球第一款专为具身开发而生的工具软件。它内置了完整的仿真环境,从仿真到真机一键部署。
晚点:这让我想到你们之前说的 “最小闭环”。
程昊:对,我们马上会举办一场全球 3v3 机器人足球仿真赛。开发者可以在 Booster Studio 里训练自己的 AI Agent,提交到云端自动对战、自动判分。优胜者的策略可以直接部署到真机 K1 或 T2 上。这正好把我们 20 年来在真实足球场上验证的闭环,开放给全世界的开发者——不需要拥有硬件,也能体验 “从代码到进球” 的全过程。
晚点:可以理解为加速进化要做机器人的安卓系统?
程昊:对,把应用和硬件解耦。我们的操作系统可以适配各种芯片、机型、品牌,上层开发者只专注开发 Agent,既能跑在宇树机器人上,也能跑在加速进化机器人上。
晚点:这样硬件会变得很难卖?
程昊:具身走入本体时代尾声,硬件技术已收敛,会越来越标准化,毛利变得很低。买联想和惠普笔记本有多大差别?其实没有。
晚点:操作系统似乎是大厂才能做的东西?
程昊:苹果和微软是因为先成功才做操作系统,还是因为做了操作系统才成功?其实是后者。操作系统带来的生态是非常强的壁垒。
晚点:加速进化凭什么做好操作系统?
程昊:我们是最擅长做这件事的团队。从成立第一天,团队就分两拨人:做自动化、本体的同学,和来自互联网的开发工程师,近一半是完全软件背景。
全球范围内,加速进化是最重视软件工程的机器人公司。一说具身智能大家都想到硬件、算法,但没意识到,在真正实现具身大模型之前,漫长的 OS 时代需要做非常复杂的软件工程,是 dirty work,代码量极大,但能构建真正壁垒。历史上没有任何公司能靠算法构建壁垒,大模型又一次证明了这一点。
晚点:软件工程壁垒会不会因 AI 变低?
程昊:你不觉得这更有利于我们这样的创业公司成长为巨头吗?(笑)在大厂一个项目 300 人,现在可能三十人就能做到。
晚点:互联网背景工程师不懂具身智能,怎么当架构师?
程昊:先让他们去踢足球。这个世界上两方面都懂的人极少,但踢了一年足球后,我们培养出了一批。
教育市场:百亿美元级的 “Apple II 时刻”
晚点:你们看起来蛮 to C 的,小机器人在京东就能买到。
程昊:我们方向之一就是先做小,更快落地形成商业化。现在出货量最大的还是小人形机器人,小人形领域机器人的出货量我们是第一,今年会有更多同行来做。
晚点:谁在买这些小机器人?
程昊:两款产品:T1 一米二高,围绕科研需求,做运控、导航、多机决策研究;K1 个头更小,适用教育教学场景,价格更便宜,定义叫具身开发入门级平台。
教育是非常大的市场。80 年代美国、90 年代中国大量建设计算机机房,为普及计算机发挥重要作用,打造了中国工程师红利。早年苹果实际上大量机器卖给学校。
具身智能会经历这个阶段,机器人本体 + 操作系统 + 开发工具,能复刻当年 Apple 2 或 DOS 电脑的商业化。很多学生想学机器人但买不起,靠学校建机房。加速进化非常适合这个场景:软件上操作系统已降低开发者门槛,硬件上小尺寸机器人不笨重、很安全。
科研或足球赛事总盘子小,但机房这种教育领域是百亿美元级别市场。
晚点:在中国落地,涉及复杂关系处理?
程昊:我们第一台机器人卖的是海外客户。2025 年加速进化 40% 营收来自海外,今年前两个月升至 60%。
这是真正实打实的商业模式,相比之下大家热衷的翻跟头没有商业模式。
晚点:机器人进工厂呢?
程昊:商业模式要跑通,机器人一定要比人便宜,但现在做不到。工厂里简单的事机械臂就能做,复杂到机械臂干不了的事,机器人同样做不到,或贵很多。比如汽车组装,机器人搞不定柔性线材,最后还得靠人,算下来不如直接雇人。机器人落地工厂这种商业模式,我现在看不到任何机会。
晚点:家庭场景呢?
程昊:做了这么多年,看了这么多年,不乐观。家庭场景太复杂,日常路线上有玩具或椅子怎么绕开?叠衣服的床贴着墙怎么拿?放柜子里怎么开门?这些复杂状况会大大降低成功率。反倒是双足机器人不稳定容易摔倒这种问题,今年就会被很好解决。
晚点:运控能力和宇树相比?
程昊:其实差不多。算法无法构建壁垒,宇树真正的壁垒是高爆发关节,硬件积累很深厚。
晚点:卖了 1000 台,硬件供应链有什么经验?
程昊:一开始用第三方零件而非自研,随着量起来逐渐转向自研。在中国供应链不难,除了招对人,还有就是控量——产能一周一台时,对外就卖一台。有客户要 100 台,我都直接说不行。
因为我们的量产是逐渐爬坡的,从一周只能产一台,提升到一周能产 3 台,再到一周能产 10 台,再到一周能产比如 50 台,这是一步步爬坡上去的,而不是一下子就说要一周量产 100 台、一周量产 1000 台。
我们的商业策略也是同步推进的。前期可能就卖一台,到现在能卖五台,这正好是生产和商业化同步、交替逐步提升的过程。这样做的好处是,早期阶段可以用相对低的成本、招少量的人员,先把一周一台的产能做稳定。
终局愿景:OS 时代的数据资产,换未来大模型的后发先至
晚点:如果大厂现在做具身操作系统乃至大模型,怎么应对?
程昊:大厂很难现在下决心做具身模型,因为看不到明确实现思路,负责的人可能面临未来几年绩效都很差,没人愿意做。即使做,也是把模型成熟时间从 15 年缩短到 12 年。
大厂要做成,必须得 1 号位亲自做,但现在还没有 1 号位愿意亲自下场盯具身大模型,因为技术路线没收敛,我们叫 TPMF(technology product market fit)。
晚点:但一旦有了,对你们是颠覆。
程昊:没错。移动互联网时代软件被打压,Windows 原来卖很贵,现在免费了,但微软靠之前积累的资本和人才,在云时代和大模型时代又追了上来。
晚点:一场又一场不同维度的战役。
程昊:本体时代我们已在为 OS 时代做准备,OS 时代当然要为具身大模型时代做准备。这是有弯道超车可能性的,字节 2023 年才开始做大模型,但豆包现在非常成功。
晚点:前提是先成为字节。
程昊:没错。我经常跟投资人讲,什么时候我们有非常稳定的几十亿收入、几亿利润,一定会养非常大的团队去做具身模型。还是那句话,算法没有壁垒,可以后发先至。
在漫长的 OS 时代,我们通过操作系统与开发工具,可以获得最多的数据,也就是有机会训出最好的模型。我们不做空中的大模型,但我们在泥里爬,爬出来,再往上飞。
晚点:移动互联网周期给现在具身智能周期最大的启示是什么?
程昊:先找到商业模式,再去谈如何改变世界。
商业选择:比起估值,更想做一家十年后依然存在的公司
晚点:感觉你在商业化这块表述得都比较保守。
程昊:对,我觉得找投资本身是一个双向选择的过程。投资人就跟相亲一样,你不用刻意去说服对方、让对方喜欢你。我的想法是应该多快速沟通,找到那个真正看对眼的。找投资也是一样,核心还是非常笃定地把我们的逻辑讲清楚,然后尽快找到认可这套逻辑的投资人。
不过我们的商业化增长势头很迅猛,今年一季度累计出货同比增长 500%,一个季度的量就顶得上 2025 年前 8 个月。1 到 2 月新签的订单同比涨了 800%。
我们已经具备了扎实的商业化自我造血能力,走到哪儿能卖到哪儿。不管是 CES 展会,还是亦庄马拉松,我们带去的机器人,现场就被抢空了,这就是最直接的证明,我们是真能卖货、真能造血,完全不用靠编故事、炒概念来吸引投资。
晚点:不着急吗?现在眼看这个市场环境,大家都有点疯狂。
程昊:心里可能会着急,但我们还是会很笃定地用逻辑把道理讲明白。第二点,其实我们融资进度也还可以,基本每年都能完成三四轮,只是整体上我们不会那么激进,不会去讲大故事、快速拉投资人进场,签下风险很高的投后条款,再把估值迅速做上去。
我们整体节奏,比行业估值提升的速度大概晚半年,这其实没有任何影响。但我们肯定不希望为了迎合投资人的喜好去编故事、做投资人喜欢的事,那样对公司的战略发展方向,影响会非常非常大。
晚点:怎么看待 2026 年市场竞争的激烈程度?
程昊:我一直是这个观点:只要你的产品和商业模式没问题,就不可能拿不到投资。这个市场最终还是会用脚投票,投给能实现商业化成功的企业。
晚点:但你得熬到那个时候才行。
程昊:对,但核心在于,我们的商业模式本身是成立的,整体出货量也在几倍、几十倍地持续增长。这不是单纯的熬。比如你现在估值快速拉高,很快上市了,但如果没有好的商业模式支撑,早晚还是会跌下来,到时候整个团队就会面临巨大变动。
说实话大家到时候就不盯业务、天天盯盘了,整个心态都会受到很大影响。我们的逻辑是:如果这个方向坚持十年能做成一家像微软那样的公司,又何必非要在这两年就冲到某个级别?我觉得这不是最本质的东西。
晚点:大家普遍有一种焦虑,就是拿不到钱可能就会死掉,或者后续资金不会再那么好拿了。
程昊:钱好不好拿,确实有客观规律在,但一家公司会不会死掉,关键看你有没有产品、产品有没有成熟的商业模式。
晚点:投资人提问里,你们最难回答的问题是什么?
程昊:目前还没遇到过。
晚点:招人难吗?
程昊:会比较难。不过另一方面,人才供给本身是存在的,只是很多候选人会在意公司估值够不够高这类问题。其实这反而是好事,以我的经验来看,这类人招进来,很可能会对组织造成伤害——他们往往天天关注这些表面东西,或者在意公司宣传声势,不看本质、不关心自己手头的事情能不能做好。很多方向更容易赚快钱,也更容易做表面化的销售、分析类工作,但我们这个领域,还是需要非常踏实、认准方向、能笃定一点点积累的人。
所以我们之前从来不在 PR 上花钱,因为觉得没意义。直到今年春节,行业竞争环境恶化。但我觉得这反而是好事,相当于倒逼我们。
(让我们)把一些能力补齐、做健全。核心是我觉得现在光靠产品技术是不够的,因为还没法形成消费级 To C 的机会。这时候砸出去的钱,最后只能落在品牌上,而品牌后续又接不住,大众又很健忘,这些信息其实没什么价值。还是要更务实一点,把资金投入到研发上,投入到商业模式的打造上。
题图来源:加速进化
相关推荐
抢占生态主导权:2025年,中国具身智能的“安卓时刻”来到了吗?
“万亿”具身智能的师徒“江湖”
马上评|机器人马拉松,也是具身智能产业的加速跑
对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”
下注端到端:一场具身智能的谨慎豪赌
何为“具身智能”?
具身智能加快产业重构,九牧引领行业从“单品”到“生态”
晚点独家丨2 年半,字节造出千台机器人,长期目标是具身智能
2年半,字节造出千台机器人,长期目标是具身智能
具身智能,究竟还缺什么?
网址: 对谈加速进化程昊:从踢好一场球出发,目标是具身智能的“安卓” https://www.xishuta.cn/newsview150412.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
