4.55亿美元刷新中国具身融资纪录背后:它石智航以实干兑现承诺-新华网
新华网 > > 正文
2026 04/20 16:54:50
来源:新华网

4.55亿美元刷新中国具身融资纪录背后:它石智航以实干兑现承诺

字体:

  近日,它石智航公布获得新一轮4.55亿美金融资,一举创下中国具身智能史上最高单轮及最大Pre-A轮纪录,一年估值领跑第一梯队。红杉、高瓴、美团等11家国内外顶级机构因何为它石掷出重金?它石智航首席战略官Vincent在接受新华网专访时反复提及一个词:兑现。“它石用一年时间,把商业计划书里写的三件事做完了,然后拿着结果回来告诉投资人:我们说到做到。”

  一年时间兑现商业计划书承诺

  2025年初,它石智航第一版商业计划书(BP)面世。在那个时间点,具身智能赛道已经涌入了上百家公司,每一家的PPT上都画着类似的蓝图:通用人形机器人、全场景覆盖、几年内进入家庭、取代人类劳动力。

  它石的第一份商业计划书,只讲了三件事,但其中充满了大量反共识判断与高难度创新选择。

  首先是拒绝遥操作与纯仿真路径,坚持 Human-centric(以人为中心)的真实世界数据范式。它石从一开始就选择最难、却也是最“笔直”的技术路径——直接对齐真实物理世界,不依赖任何形式的近似路线或工程捷径。

  其次,不盲从VLM+Action的范式拼接。在模型方面,没有走简单的VLA(Vision-Language-Action)套壳路线,而是创新性提出AWE(AI World Engine)架构,强调“世界模型 × 动作生成”的深度协同,从结构上统一感知、决策与行动,直指物理世界AI的本质问题。

  第三,主动选择高价值×高难度场景。聚焦如线束装配等上一代机器人体系长期无法攻克的任务,以长时序、强接触、高精度、强约束的真实工业问题作为试金石,坚持以“是否有用、能否落地、是否可规模化部署”作为机器人的试金石,打造超级本体,反向检验数据与AI范式的有效性。

  在创投圈,一年前商业计划书的承诺,往往像新年flag一样,说过就忘了。创业公司能兑现60%,已经算执行力、技术前瞻性不错;而将承诺逐一兑现,是一件极其不简单的事情。

  但它石当真了。

  接下来的一年里,它石低调前行。没有频繁的媒体曝光,没有创始人演讲刷屏。他们做的唯一一件事,就是按照计划书上的时间线,一条一条地“打勾”。

  数据——搭建起了Human-centric数据采集范式和SenseHub数采设备,规模化采集真实数据,开源真实世界多模态数据集。

  模型——发布具身领域专有模型:能干活的具身大模型AWE3.0,让机器人走出温室、通用泛化、落地干活。

  商业——攻破线束装配任务垂直场景,实现“机器人在一小时内装配亚毫米级线束最多次数”,为机器人大规模部署真实产线奠定基础。

  一年后,它石团队带着上述三样东西回来。

  一位参与本轮的投资人评价:它石给市场传递的不是今天有多强,而是上限有多高。兑现承诺,是证明上限最有效的方式。

  它石自己说得更直白:“创业最难的不是做不出来,而是机会太多导致资源不聚焦。我们把商业计划书里的事都实现了,是因为我们敢做取舍。”

  对于老股东,兑现承诺是最直接的体感。而对于新股东,认可技术路线的长期判断更重要。随着曾经的行业共识在持续试错中逐渐褪色,它石对曾是“非共识”的核心路线的长期坚守,以及对外承诺的持续兑现,反而愈发凸显其战略定力与技术前瞻性。这不仅是执行力的体现,更是对第一性原理的深度把握与长期主义的自然结果。

  Vincent表示:“具身智能的认知成本非常高。很多机构经历了一年两年的跟踪,才把行业理解、技术路线理解夯实了,然后觉得这是一个必须投的标的。”

  不囤钱 4.55亿美元要花在模型、人才

  本轮融资公布后,外界最关心的一个问题是:这么多钱,准备怎么用?Vincent给出了两大方向:人才、算力。

  首先是针对人才的思考。它石想提高的是“人才密度”,而不是堆人头。

  “筛选标准变了。过去看学术背景、看论文发表;现在更看重工程化能力,看重候选人做出来过什么作品。软件人才相对丰富,但加上工业、硬件背景,还有完整作品记录的人,非常稀缺。”Vincent说。

  他表示,它石希望吸引到顶尖人才,每个人都能承担重要的角色,同时也给更大的空间。

  其次,它石的战略重心是具身基础大模型。

  在行业里,很多公司倾向于做“场景微调”——拿一个基于互联网数据的开源VLM模型,在具体场景里采集少量真机遥操数据微调,可以很快演示效果,但这样的demo天花板很低,离实用很远。背后的根本原因是具身智能原生数据极其匮乏,导致无法进行真正的预训练和打造基础模型。这种“套壳”的方式在真实世界复杂场景的效果可想而知。

  它石选择了另一条路:自己解决具身原生数据的问题,自己设计具身基础模型,自己做预训练。

  Vincent透露,具身原生数据的规模诉求大约是自动驾驶数据规模的10倍以上,基础模型体量则大约是自动驾驶的3到4倍。虽然不需要大语言模型级别的万卡集群,但这个投入在机器人公司里已经算很大。

  “全世界真正敢于做具身基础模型的公司不多。它石拿到了这么多资源、关注度这么高,如果我们不站出来,谁应该站出来?”Vincent说。

  对于估值,Vincent的态度很克制。“我们尽量遵守创业本身的规律。它石不想把未来的钱提前一次性拿够、估值炒上天。该值多少钱就值多少钱,不过度消耗对未来的预期。”

  “我们也不会囤钱去理财。”Vincent说,“钱一定要大胆投入在战略聚焦点上。它石已经准备好有格局地用大钱了,尤其是到几十亿这个级别,要敢于大量投入预训练,这和团队的胆量、战略眼光、格局是相关的。”

  击穿线束场景 刚需落地验证产业价值

  它石选择的第一个落地聚焦场景是线束。

  线束是汽车、电子设备里必不可少的零部件。生产过程大量依赖人工:插接端口、缠绕胶带、布设线路。这些动作对灵巧操作要求高,自动化设备长期难以替代。

  但更让工厂主焦虑的是另一件事:人,越来越难招了。

  线束厂的平均年龄逐年攀升。一位工厂老板曾对它石团队说过一句话:“现在不是我挑工人,是工人挑我。给钱都没人来,离职率和流动性极高。”

  但它石没有追求一步到位、全流程完美替代。Vincent阐述了它石的“70分哲学”。

  “你可以有5个工序,但先把其中一到两个工序打穿,做到比人更准、更快。哪怕其他工序还只有70分,但只要其中两个足够好,就可以先到场景里去磨练、迭代。但你不能把5个工序都做到70分,那样很难推动。”

  这个逻辑很务实。场景方对当前的机器人产品有一定容忍度,但前提是:你在某一个或几个环节上确实比人强。

  它石透露,线束这个场景目前已经打透,机器人的准确率和效率超过了人工,这点也得到了产业方的认可。

  “速度和准确率是关键。基座模型技术路线的选择,已经决定了速度的上限。我们花大量时间做预训练,跟这个也是息息相关的。”

  更关键的变化发生在工厂的投资回收账本上。

  过去,工厂买机器人要算投资回报率:一年半是否可以回本?节省几个人?现在,逻辑变了。未来劳动力市场是稀缺的。它不是增量市场,是存量市场。工厂部署机器人,是满足刚需的逻辑——甚至愿意用更溢价的方式采购。

  Vincent说:“我们不是在替代人,是在创造和弥补劳动力空缺。它石短期内会全力投入线束场景,像线束这样同时满足多个条件的好场景非常少。要满足AI比重高、商业化空间大、技术门槛高、场景能泛化、市场空间足够大——同时满足这几个条件的场景,可遇不可求。”

  具身智能C端拐点即将到来

  谈及机器人产业,Vincent表示,虽然中国公司在供应链、效率等方面有局部优势,但还是要看到与世界顶尖机器人公司的差距。长远来说,中国公司不能只会整活、炫技,它石要作为中国企业的代表敢于站出来PK。

  关于机器人何时能够走进家庭,Vincent给出了比行业平均预期更乐观的时间表。“2027年末到2028年初,很可能出现一个拐点,甚至是一个类似GPT的时刻。”

  这个判断来自工程师的体感———不是拍脑袋,而是基于具体的技术指标。“工程师的体感非常直接,技术上的前瞻性是可靠的。原来大家觉得至少要五年,现在时间在进一步缩短。”

  但他强调,需要有人先捅破那层纸。“只要一家企业跑出来了,整个行业的信心就起来了,整个行业都会加速。”

  被问到谁最有可能捅破这层纸时,Vincent说:“我希望是它石。但如果是其他同行,我们也会祝贺。”

  当前,在具身智能这个人人都在讲未来的行业里,它石选择用“现在时”说话。这或许是它获得资本集体认可最深层原因——不是因为描绘的故事最动人,而是因为把故事变成现实。

  融资的真正价值,不在于数字本身,而在于它代表了一种正在被行业重新确认的底层逻辑:在具身智能这条需要长期主义的赛道上,真正有价值的不是那些善于制造热点的公司,而是那些能够持续兑现承诺的实干家。

  属于具身智能的“GPT时刻”,也许真的不远了。(记者 陈听雨)

【纠错】 【责任编辑:周靖杰】