银河通用王鹤:合成数据正成为人形机器人新质生产力的”加速引擎”

2025年的夏天,人形机器人与具身智能赛道的热度比天气更灼人。当全球科技界还在为大模型与实体经济的融合寻找突破口时,中国科技创业者已率先在”具身智能”这一前沿领域撕开一道裂缝——7月10日,在新京报贝壳财经年会的”建设开源之都:智AI未来,生态共澎湃”主论坛上,北京大学助理教授、银河通用机器人创始人兼首席技术官王鹤博士,以《合成数据赋能的具身大模型开启工商业场景规模化落地》为题,向外界揭开了中国具身智能产业从”实验室”迈向”生产线”的秘密武器:合成数据正成为破解行业困局的关键钥匙

一、人形机器人的”新质生产力”之问:为何必须突破”数据围墙”?

站在2025年的时间节点回望,人形机器人的发展轨迹耐人寻味。从1967年日本早稻田大学的WABOT-1首次实现自主行走,到波士顿动力Atlas的”跑酷”表演,再到特斯拉Optimus的量产计划,这个被称为”最像人类的机器”的领域,始终在”能走””能跳”的物理能力与”会思考””能干活”的智能水平之间徘徊。直到2022年大模型的爆发,才让行业意识到:具身智能(Embodied AI)或许才是打开人形机器人新质生产力的”命门”

所谓具身智能,简言之就是让机器人不仅能”看懂”世界,更能”理解”指令、”执行”任务,像人类一样用手、眼、脑协同完成复杂操作。作为银河通用的掌舵人,王鹤博士对此有深刻洞察:”人形机器人能否真正成为新质生产力,核心不在于机械结构的精密度,而在于能否通过具身大模型赋予其’自主干活’的智能。”他进一步解释,当前制造业虽有”黑灯工厂”,但多是固定流程的自动化;而人形机器人的价值,在于能适应非标准化、动态变化的生产服务场景——比如灵活分拣药品、陪伴商场顾客、协助老人护理等,这些恰恰是中国应对老龄化、少子化社会挑战所需要的”增量生产力”。

但理想与现实的距离,往往横亘着一条”数据鸿沟”。王鹤直言:”具身智能的发展,正面临’数据短缺’的根本性瓶颈。”他给出一组对比数据:人类要掌握一项通用技能(如开抽屉、摆货架),通常需要成百上千次实践积累;而当前具身大模型的训练数据,公开数据集仅百万条量级,与所需的百亿级数据相差四个数量级。”这就像让小学生参加高考——数据量不够,模型再先进也难以泛化。”

二、VLA大模型:从”能对话”到”能干活”的具身智能新范式

在与大模型的融合探索中,王鹤团队率先提出了VLA(Vision-Language-Action,视觉-语言-动作)大模型的概念。这与当前主流的多模态大模型有何不同?”通用大模型的输出往往是语言或图像,而VLA的输出直接是机器人的动作指令。”王鹤举例说明:当用户说”帮我拿桌上的蓝色保温杯”,通用大模型可能生成一段文字描述,但VLA大模型需要输出”机械臂关节1扭矩3N·m,关节2扭矩2.5N·m…”等具体参数,让机器人能精准执行。

这一跨越看似微小,实则是本质突破。王鹤指出,传统多模态大模型的”可操作性”缺失,正是人形机器人难以规模化落地的关键。”就像教一个孩子干活,只说’去拿杯子’不够,必须告诉他’伸手、握拳、手腕旋转15度’等具体动作。VLA大模型要做的,就是把人类的自然语言指令,转化为机器人能理解的’动作代码’。”

然而,VLA模型的训练面临着双重挑战:一方面,真实场景中机器人难以快速积累海量任务数据(一辆特斯拉每年能回传数百万公里行驶数据,而早期人形机器人年出货量仅千台级别);另一方面,依赖人工遥控采集数据的效率极低——”让机器人重复抓药盒,遥控操作的耗时可能是人工直接操作的2倍,这样的数据采集方式根本不可持续。”

三、合成数据破局:中国具身智能的”冷启动”密码

在王鹤看来,破解数据困局的钥匙,藏在”合成数据”这一新兴技术中。”就像自动驾驶早期用仿真平台模拟路况,人形机器人也可以在虚拟世界里’练手’。”他介绍,银河通用自研的仿真数据合成管线,已构建起覆盖”数字孪生场景-动作轨迹生成-模型训练优化”的全链条能力:通过消费级显卡渲染生成亿级真实场景数据,结合百亿级合成仿真数据,让机器人在虚拟环境中完成”拆箱、摆货、取药”等任务的千万次练习,再将这些”虚拟经验”迁移到真实世界。

这种”先虚拟后现实”的技术路径,正在创造惊人的效率提升。以”拆箱喝水”任务为例:传统方法需要采集数百甚至上千条真实轨迹数据,而基于合成数据训练的GraspVLA大模型,仅需采集200条人工演示轨迹,就能让机器人精准完成拆箱动作;更关键的是,模型具备强大的泛化能力——无论是农夫山泉的瓶装水换成东方树叶的茶包,还是瓶盖颜色从绿变白、尺寸略有调整,机器人都能”举一反三”,无需重新采集数据。

这种能力已在真实商业场景中验证。银河通用推出的全球首个人形机器人智慧零售解决方案,已在北京10家药店落地:24小时无休的机器人能从密集货架中精准抽出药盒,拉开抽屉取药,甚至处理”某款药只剩最后两盒”等复杂情况。”以前需要专人值守的夜间取药需求,现在完全由机器人接管,既降低了人力成本,又提升了服务可靠性。”王鹤透露,该方案今年将在北上广深扩展至100家门店。

四、从”跟跑”到”领跑”:中国具身智能的机会窗口

在演讲的最后,王鹤分享了银河通用的成长故事:这家成立于2023年5月的年轻公司,两年内完成数轮融资,累计金额达24亿元;其自主研发的人形机器人Galbot,不仅能在虚拟世界”刷经验”,更能在真实场景中完成抓药、导购、陪伴等任务。”这背后,是国家政策对具身智能的重视,是产业界对硬科技的持续投入,更是中国科技创业者’换道超车’的勇气。”

与新能源汽车产业不同,中国具身智能企业从起步阶段就站在了技术与模式创新的前沿——当国外同行还在依赖真实数据”慢爬”时,中国团队已通过合成数据实现了”跳跃式发展”。王鹤强调:”具身智能不是简单的’机器人+大模型’,而是需要重新定义人机协作的底层逻辑。银河通用的目标,是让’人能干的活,机器人都能干’,真正开启人形机器人的规模化落地时代。”

站在2025年的节点回望,人形机器人的”冰与火”仍在持续:有人质疑其商业化前景,有人担忧技术泡沫;但更多像王鹤这样的创业者,正用合成数据、VLA大模型等技术突破,将”科幻场景”一步步变为”产业现实”。或许正如王鹤所说:”具身智能的黄金时代,不是等来的,而是造出来的——用中国技术,造中国的新质生产力。”

为您推荐