2024年4月19日波士顿动力用一种另类艺术的方式正式宣布,历时11年的老版人形机器人Atlas退役,并宣布了新一代的电动人形机器人,名字还是叫Atlas。
人形机器人上市开卖后,民用市场里大概不会有人对飞檐走壁的性能有多强提出要求。那个机器人只要能扶老人去卫生间大小便、上下楼、帮人提重物,甚至做饭、沏茶倒水、扫地擦桌子,应该就是最迫切的需求了。这些动作要做好的关键并不是要求身形多么敏捷,而更看重手部的细微操作。
其次,液压版机器人的动作水准远远超过电动版。也就是说,别看波士顿动力在告别液压版机器人的通告里各种吹电动机器人的动作性能,实际上,它在动作性能上是远远不及液压版的。
那为什么当初一定要用液压装置呢?电动马达不好吗?其实液压系统在两个方面是电动马达根本比不了的:
一个是单位体积里的功率密度,液压系统远远强于电动马达。如果指关节、腕关节,尤其是膝关节、踝关节,都要求和真人的形态和尺寸差不多的话,还真找不到那么小的电机可以在短时间爆发出几百公斤的支撑力。
液压系统的第二个优势,是可以实现关节部位的无级调速,于是在力的控制上非常平滑。比如说地震了,有人能被压在房屋下,液压手臂抬起重物会更稳定地持续用力,而电动马达去抬起可能会产生额外的震动,造成二次伤害。这就是液压系统的好处。
液压版Atlas的商业化前景虽然不是没有,但客户只可能是军方了。而现在看起来,公司研发的其他众多四足机器人更有可能拿到军方订单。比如,大家熟悉的大狗(Big Dog),还有大家不熟悉的小狗(Little Dog)、猎豹(Cheetah)、野猫(Wild Cat)、跳蚤(Sand Flea),还有攀爬的RISE和足+轮式机器人Handle。这些机器人都是为不同的复杂环境设计的救援机器人,都是四足的,越野能力出众,关键是执行任务的可靠性还远远高于双足机器人。
波士顿动力此前十年之所以往飞檐走壁这个方向设计机器人,因为它最初就是一个DARPA项目。
DARPA的全称是“美国国防部高级研究计划局”,是一个研发先进军事科技的美国政府机构。2008年的时候,DARPA想测试一系列军事防护服的性能,为了测试的标准化,所以需要一个能做各种动作的机器人,比如行走、奔跑、匍匐前进、关节的反复弯曲,来模拟对衣服的磨损,还有汗水对衣服的腐蚀等等。那次,波士顿动力展示的最初版的机器人PETMAN中标了,2630万美元,而且最终完成得不错。
DARPA觉得,这个测试仪器如果能继续优化,那不就是机械战警之类的东西了吗?于是和波士顿动力商讨后续开发更先进的、可以应对复杂环境下救援任务的机器人。双足款式的机器人直到2013年才首次亮相,虽然也做到了令人瞠目结舌的程度,但上千万美元一台,演示几下,录视频吸引眼球还可以,但靠它完成任务,还差得远。
但就在这几年里,双足机器人行业又冒出几个竞争者,比如Agility、1X、Apptronik,还有特斯拉的Optimus和Figure。
1.Agility的双足机器人可以爬楼梯、蹲下、进入狭小空间、完成货物装卸的任务。
2.1X的机器人差不多就是一个家庭保姆,可以整理房间,从地上捡东西,给人倒咖啡。
3.Apptronik和特斯拉的人形机器人也是能完成基础的走动,角色更像流水线上的工人。
4.Figure的双足机器人根本就没有强调运动能力,它主要展示的是手部动作。最惊艳的功能是高级的视觉和语言智能,边说话边执行任务。比如,你和它说“我饿了”,它能从桌子上一堆杂物中把能吃的东西挑出来给你。
这些双足机器人,才更贴合家庭或者公共空间中给人服务的机器人的样子。要说起运动能力,没一个能飞檐走壁,顶多也就是把走路、转身、蹲起之类的动作做好,但其实已经够用了。
看起来,“如何保持双足行走的平衡”这个仅仅在5年前还是大难题的自动控制方法,在最近几年已经出现了突破。其中最关键的三个技术点分别是:
第一个技术点,使用了深度强化学习(DRL)训练出的算法,能让双足机器人在未知环境中学习适应性的行走。第二个技术是ZMP零力矩点(Zero-Moment Point),能让机器人很好地预测下一步动作。第三个技术点是柔性驱动,能让电动马达的关节高精度模拟人类肌肉的驱动方式。
而且,双足机器人的突破还不是通过零星的创业公司实现的。
在2024年的GTC大会上,英伟达发布了一个多模态人形机器人的通用开发平台Project GR00T。CEO黄仁勋出场的时候,背后一共9个厂商的机器人站在他身后,这些机器人都在开发中或多或少从GR00T平台受益了。
这个平台能实现什么呢?比如说,硬件准备妥当后,给它看打鼓的视频,多看一些,这个机器人就能学会跟着音乐敲架子鼓。通俗地说,就是开发人形机器人的通用模板——它可以理解自然语言,可以通过视觉模仿动作,可以做生成式AI模型的植入,可以仿真模拟,可以对模型做预训练,此外这个平台还有各种有用的库,都不用自己开发了,英伟达已经给大家准备好了。
仅仅在5年前,很多双足机器人公司还可以靠其中这个平台的一些功能,赢得几千万上亿美元的风投。但如今,英伟达把更全面和更优质的功能直接通过开发平台的方式公布出来。不知道有多少投资人在流泪,不知道有多少创业者在欢呼。
今天很多文章分析,机器人还是需要人形,因为是人的样子才有交流感和购买欲,否则只有工业界才会接受。但这一步,是依赖之前十几年很多双足机器人公司“先烈”的巨额资金砸出来的技术,才迈过去的。
今天,有了多模态大语言模型的支持,那个可以平稳行走的机器人还可以做更多的事情——比如对物体的识别、对语言的理解、对动作的学习,都有可能在之后大幅进展,让机器人保姆的科幻世界离我们更近,也许5年,也许10年之后。
总之,人形机器人在技术突飞猛进下的今天越来越不像噱头了。