特斯拉人形机器人擎天柱原型机正式亮相,预计售价不到 2 万美元,未来产量可达数百万台,有哪些技术亮点?

谢邀,我一直坚信物理和工程不会骗人,相比于之前国内外媒体铺天盖地的宣传,Optimus原型机可以说符合技术开发预期,但低于资本市场预期,严重落后于公众预期,目前我认为没有到量产的阶段,2万美元的售价也大概率是个噱头。其实最令我可惜的是,Elon Musk在发布会的QA环节面临诸多人形机器人的落地与前景的问题时,并没有给出一个明确的答案,甚至都没有很自信具体地描述一个场景,而是用“the future is interesting, it won’t be boring”的愿景给搪塞过去,看得出来老马对人形机器人真正能用在哪里还没有想清楚,这可能对行业前景是个不小的打击,毕竟现实版钢铁侠。

下面是一些和我方向相关的技术解读,供大家参考:

硬件架构

Tesla Optimus整体的硬件架构是基于大电池组+电机驱动+刚性金属传动+串并联关节分布+视/力/位传感器的传统人形机器人硬件架构,整体设计理念类似于德国TUM的LOLA与日本AIST的HRP5,与波士顿动力的人形机器人Atlas属于两种完全不用的硬件架构方案。

Tesla Optimus这套硬件架构的优势在于稳定可控易实现,相对来说实现成本低,技术成熟,主要劣势在于动态性能差,自重大,难以支撑高动态大幅度的运动性能。

全身自由度

身体总自由度数目为28(不包括灵巧手),具体分布如下:

  • 左臂/右臂:7+7,肩部3+肘部1+手腕3;
  • 左腿/右腿:6+6,髋部3+膝盖1+脚踝2;
  • 腰部:2,Roll+Yaw;

灵巧手

  • 驱动方式:绳驱;
  • 自锁能力:反向自锁(通过电机输出连接蜗轮蜗杆机构,猜测利用蜗轮蜗杆反向自锁);
  • 6个自由度:拇指2自由度(1个摆动,1个弯曲);其余四指各1个自由度;
  • 11个关节:拇指3个关节,其余四指各2各关节;每根手指均为2个指节联动弯曲;
  • 负载能力:约9kg(实际为机械臂某个特殊工况的负载能力,和灵巧手无关);
  • 仿生性:绳驱,自适应抓握,仿生性较好;

至于灵巧手的指尖抓握力、自重、灵巧度、电子皮肤、触觉反馈等性能,在发布会中均没有涉及,另外,以我个人的经验来看,我对以绳驱(tendon-driven)方式灵巧手的可靠性与量产性提出极大的质疑。

驱动原理

整体采用电池组供电,搭配电驱伺服关节的形式,Optimus中伺服关节如上图所示有两类:基于无框力矩电机+谐波减速器的旋转关节,基于力矩电机+滚珠丝杠的线性关节。旋转关节整体的输出扭矩密度和当前各大人形机器人厂家的关节性能类似,线性关节着重highlight了力输出能力,但极大牺牲了输出速度性能,我觉得这不是一个好的设计方案,可能会限制了下肢的高动态运动能力。

传感器配置

类型 视觉传感器 力觉传感器 位置传感器 IMU
描述 左/右柱相机 鱼眼相机 关节集成非接触式力矩传感器 关节集成双位置编码器 NA

这里提到的“非接触式力矩传感器”,从下面的图片来看,本质上就是基于编码器/或霍尔原理测量材料形变的力矩传感器,非传统的应变片式,起了个挺fancy的名称;

电气线束

从上图可以看到,Tesla Optimus的电气线束设计比较初级,机械臂大量外置裸露线束,在手腕部分甚至未采用中空走线设计,后续包裹ID外壳以及量产都有很大的优化空间,现阶段可以说没有专业成体系的线束设计。

关节模组

  • 上肢采用无框电机+谐波减速器的旋转关节方案:

基本上和当前协作机械臂的关节方案高度类似,无框力矩电机+谐波减速器+高低速双编码器+抱闸+力矩传感器+输出端交叉滚子轴承。这套方案我觉得如果是用在固定基的协作机械臂上没有问题,而用在浮动基的双足上,是不是会显得太过笨重了,尤其是每个关节都集成抱闸。整场发布会看下来,并没有看到特斯拉公布Optimus原型机的重量,可能也对目前原型机的自重不是很满意。

  • 下肢采用无框电机+行星丝杠的线性执行器方案:

下肢这个关节方案较上肢关节相比缺少了抱闸,使用了本身就具备自锁能力的行星丝杠将旋转运动转化为线性。我个人不是很喜欢丝杠传动的方案,因为就像上文中提及到,一般丝杠的传动精度高,输出力能力强,但反驱透明度差,响应速度偏慢,这套驱动方案会极大限制下肢高动态的运动能力,同时成本也不低。

结构传动

  • 整机的身高与重量在发布会中未提及,目测身高约在1.7米左右,重量个人猜测要往70kg靠;
  • 胸腔内部布置电池和主板,如下图,主板两侧设置两颗巨大散热风扇,电池容量2.3kWh,动力电在52v,外部有金属外壳保护,安全性高,这个体积下电池容量做的巨大,这是Tesla做的非常好的地方,应该是复用了其电动汽车电池的技术,实属降维打击了

  • 膝关节如下图所示采用仿生设计,其实我并没有看出来这套仿生设计的明显性能优势在什么地方,行走的时候也并没有能够做到直膝(人类真正的膝盖结构是一个极其复杂的滚动副+移动副的耦合),目前还没有get到这个设计的显著优点;

  • 腰部有2个自由度,形成了Roll+Yaw,这是Tesla做的非常好的地方,腰部增加额外的自由度,有助于各类仿生运动的实现,相比较于小米铁大缺失的腰部自由度,Optimus的一些动作能够呈现得更加自然,这是铁大需要向Optimus学习借鉴的地方。不过腰部的两个自由度设计也极具难度,整体上身的重量都压在这里,设计不佳极易造成上肢操作时的低刚度与抖动,我们在视频中也能看出,locomotion的时候头部和手部的抖动幅度大。

硬件仿真

这块需要着重提一下硬件仿真平台,这是Tesla做的非常出色的地方,依托了成熟的汽车可靠性仿真平台,从量产/成本角度出发为机器人的结构设计和可靠性设计提供了大量的评估和优化技术支撑,一定程度上是降维打击。下面我就以截图的形式给大家看一下此次特斯拉发布会提及到的各类仿真场景,篇幅关系不展开说,感兴趣的可以去回看原视频。

  • 机器人抗摔倒可靠性仿真

  • 机器人预设场景可靠性仿真

  • 结构设计仿真

  • 电机选型/设计仿真

  • 动力学仿真环境及应用(动捕)

运动控制

整体来说,Optimus的下肢行走还是运用的传统Static-ZMP、Linear-ZMP或DCM的方案,和Asimo类似,适合平脚板双足的慢速行走,抵抗外界大干扰能力较弱,动态性差。这边还提到了一个高效率的仿人步态,如下图,摆足时考虑了Toe-off-heel strike,结合上半身的协调摆臂运动,融合人类行走的数据,实现自然摆臂、大跨步以及尽可能的直膝行走,提高了行走效率与姿态。

上肢操作首先借助动捕取得的人体离线运动库,然后进行离线优化与在线(针对具体任务场景的)优化,构建离线运动库的时候可能会用到模仿学习的某些技术,手臂的轨迹规划可能使用伯克利Trajopt的相关算法。

实事求是讲,Optimus这次发布会展现的运动能力及控制算法非常初级和基本,这里就直接上YY硕大佬的评价QAQ:

感知能力

目前Optimus应该只展示了视觉相关的感知能力,并没有看到雷达、ToF、IMU与超声等,在工厂搬东西的应用中,有GPS传感器的应用。

前文中提到,视觉的相机硬件为左右单目相机+鱼眼,硬件成本低,但算法复杂、计算力大,依赖于硬件。下图中可以看到Optimus实现了精确的3D环境建模,同时通过双目测距能实现非常清晰和高精度的深度图像,非常有助于双臂的末端精确抓取。

这边推测也是复用了Tesla汽车上视觉感知的相关算法和能力,快速集成到机器人Optimus上,又一次形成了降维打击。


总结来说,一年的时间Tesla做到今天Optimus原型机的程度,我觉得从工程技术上是非常硬核的,给Tesla的各位工程师们点赞,尤其在灵巧手、腰部自由度、硬件仿真平台、双目视觉等都在有限时间内做得非常出色。但还是回到我前头说的那句话,物理和工程不会骗人,国外的月亮并没有比国内圆,电驱的人形机器人,相比于Tesla,我更呼吁大家去多关注沉淀积累更久的的DigitCassie(Agility Robotics),暂时就不用去对标波士顿动力,Optimus还没有这个能力PK。

最后呢,还是希望大家以一颗包容的心态去看待一个新的细分行业的发展,对Optimus也是,对铁大也是。没有什么新的工程技术是可以在1-2年一蹴而就的(不要高估技术),但如果把战线拉长到10-15年,那可能就会带来翻天覆地的变化(不要低估技术)。

来源:知乎 www.zhihu.com

作者:任赜宇

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 378 个回答,查看全部。
延伸阅读:
特斯拉人形机器人擎天柱原型亮相,其设计怎么样?

特斯拉人形机器人擎天柱将亮相,你对该产品有哪些期待?