从4.55亿美金融资看具身大脑:一场关于「智能本体」的行业洗牌
2019年,我第一次接触机器人行业时,满屏都是「关节自由度」「运动控制精度」这些参数。所有人都在讨论本体多么灵活、能完成多么复杂的动作。
五年后的今天,这个逻辑被彻底颠覆了。
被资本抛弃的「躯壳」
高瓴创投和红杉中国联合领投了它石智航,4.55亿美金。这个数字背后藏着行业最尖锐的判断:没有大脑的本体公司,上限从一开始就被锁死了。
看看那些曾经风光无限的本体公司,如今还在靠「翻跟头」「跳广场舞」博眼球。资本的嗅觉永远最灵敏——当顶级基金集体掉头转向大脑赛道,这场游戏的下半场规则已经写死了:大脑才是胜负手。
为什么?
因为本体和小脑的竞争已经基本结束了。这个结论不是我说的,是资本用真金白银投票得出的。
它石的解法:全栈大脑AWE3.0
它石智航的AWE3.0,不是VLA,不是3D资产生成模型。这是一个从底层架构就统一了感知、决策与行动的原生具身大模型。
三个关键点必须说清楚:
第一,视觉、语言、动作三种模态天然对齐。训练时可以在任意模态之间互相转换。「视觉」到「视觉」是视频预测,「视觉-语言」到「动作」是端到端,「视觉-语言」到「视觉-动作」是世界模型。
第二,FaliureRecovery自我纠错能力。机器人不再是简单模仿动作轨迹,而是在隐空间里持续推演未来多种可能。当插接力度或角度出现异常,机器人会主动把线拔出来,换个角度再试——跟人类一样。
第三,没有用到一秒钟遥操数据。这是最反直觉的地方。整个行业都在说遥操数据精度最高,它石却说这个结论完全站不住脚。
为什么拒绝遥操?
它石首席科学家丁文超的原话:遥操作根本干不了亚毫米级的事。
在对精度要求极高的场景下,人工遥操过程中的犹豫、抖动,反而会变成训练数据中的噪声。而它石的SenseHub方案,只需要一双数采手套加一枚第一视角摄像头,劳动者在日常作业中顺手完成数据采集。
从第一性原理出发:想要习得人的局部微调能力,唯一的方式就是从真人身上采集数据。
这不是技术路线选择问题,而是物理世界的必然要求。
吉尼斯纪录背后的工程硬仗
1小时内完成百余次亚毫米级柔性线束完整装配,刷新吉尼斯世界纪录。这个场景有多难?长程操作、柔性操作、亚毫米精度,「不可能三角」全部集齐于此。
但它石的逻辑是:如果连最柔软、最易变形的线束都能实现精准装配,工厂里其他常规装配任务就是降维打击。
更恐怖的是「机器人柔性操作图灵测试」结果:超过50%的投票者分不清哪个是机器人。
这意味着什么?意味着工业场景的泛化能力已经从理论变为现实。
数据战略:10万小时到1亿小时的野望
目前它石已手握超十万小时Human-centric数据,并发起「具身数据星火计划」,目标直指1亿小时级别的数据共享。
这不是数字游戏。数据-本体-模型全栈自研,不是为了生态,而是遵循「第一性原理」设计出来的。
在行业蛮荒期,技术路线尚未收敛,既无标杆案例,亦无成熟的横向分工。而产业的每个变量都会直接影响大脑能力。所以必须有一定程度的完美主义,抓紧每个细节。
这是从第一性原理推导出的必然。
赢家通吃的时代正在到来。4.55亿美金,是资本对这个终局判断的抢先投票。枪响了。

