直线机

人形机器人行业AI超预期助力产业落地,核

发布时间:2025/4/20 11:51:52   
北京中科白癜风医院郑华国 https://jbk.39.net/yiyuanzaixian/bjzkbdfyy/

(报告出品方/作者:山西证券,徐风)

1.零:人形机器人基本概念

1.1人形机器人的远期目标是通用性

根据国际机器人联合会(IFR)的分类,机器人可分为工业机器人和服务机器人。工业机器人根据机械结构的不同,可以分为线性机器人、SCARA机器人、并联机器人、多关节机器人、圆柱机器人等类型,广泛应用于搬运/上下料、焊接、喷涂、加工和装配等领域。服务机器人是除工业自动化应用外,能为人类或设备完成有用任务的机器人,主要包括个人/家用服务机器人和专用服务机器人。个人/家用服务机器人是指用于非营利性任务的,一般由非专业人士使用的服务机器人,包括家政服务、教育娱乐、养老助残等类型的机器人。专用服务机器人是用于营利性任务的,一般由培训合格的操作员操作的服务机器人,包括专用清洁机器人、医用机器人、物流机器人、建筑破拆机器人、水下机器人、救援安保机器人、动力人体外骨骼机器人等。

人形机器人通过仿生形态,提升应用深度和广度,最终实现和人类共同社会化分工。人形机器人的通用性体现在,由于当前社会环境的建立以人类适应为出发点,人形机器人通过以类似人类的能力不需要改造环境就能应对复杂的人类环境,使用场景更广,能作为简单、重复、危险的劳动力替代,也能适应非标服务场景的同时满足情感需求和交互。工业机器人从功能出发,使用场景相对固定,强调运动控制的精度和稳定性;服务机器人需要环境感知和自主决策,使用场景相对非标化,且家庭场景的使用者通常非专业化。

现代人形机器人起步于上世纪60年代后期,根据产品迭代路线,其发展历程可以分为三个阶段。第一阶段是以日本早稻田大学的人形机器人WABOT-1为代表的早期发展阶段,这一阶段的人形机器人实现了从下半身站立,到下半身行走,组装上半身,最后全身协同、缓慢静态行走的技术突破;第二阶段是以日本本田的人形机器人ASIMO为代表的系统高度集成阶段,这一阶段的人形机器人不仅实现了连续动态行走,还可以通过感知外部环境及时调整步幅、行走速度、绕过障碍物;第三阶段是以波士顿动力的人形机器人ATLAS为代表的高动态运动发展阶段,这一阶段的人形机器人运动性能更强,能完成多种高难度运动动作,展示了人形机器人的平衡能力与敏捷性。

1.2催化频出:Optimus迭代超预期,国内厂商纷纷入局

特斯拉于年AIday发布teslabotconcept,年12月发布了Optimusgen-2,大幅超出市场预期。Gen-2显示了“Tesla”ID,搭载了自研的执行器和传感器,颈部由2自由度驱动,体重减轻10公斤、行走速度提升30%,脚部采用了力/扭矩传感器、铰链化的脚趾部分、脚掌连接的部分更接近人类的足部几何角度,手部11自由度、而且所有手指都有触觉感应,用手指捡起鸡蛋后可完好无损的放下,平衡和全身控制算法继续提升、可以在平衡自身的同时进行深蹲,执行器的电子布线高度集成化。Gen-2的发布表明Optimus研发相对顺利,技术性能正在逐步完善中,其中灵巧手、平衡性能表现亮眼。和概念机相比,Optimus体重仍需降低约7kg,小型化、轻量化仍是其迭代的方向,涉及到一体化电驱、结构设计优化、减重材料的运用等方面。

人形机器人国内玩家增加,发布新机10余款。年,小米的人形机器人CyberOne亮相,身高cm,体重52kg,全身21自由度,能实现各自由度0.5ms级别的实时相应,单手垂直抓握1.5kg重物,同时搭载MiSense视觉空间系统,拥有85种环境语义识别、6类45种人类语义情绪识别。年以来,不完全统计,有10余款人形机器人发布,其中除了机器人厂商如追觅、傅利叶、达闼、宇数、开普勒、乐聚、理工华汇、中科电机器人公司,还包括汽车厂商小鹏,以及偏互联网的企业如小米、科大讯飞、智元。

2.问题一:AI人形机器人,大模型是人形机器人的核心助推力

2.1人形机器人产业链梳理及结构拆分

人形机器人产业链可以分为上中下游三大部分。上游是原材料零部件生产,核心零部件不仅成本占比最高,而且技术难度最大,软件和硬件环节均具备较高的壁垒;以Optimus为例,其软件算法自研,硬件则是我国产业链可以充分切入的环节。中游是本体制造,其技术难度跟随上游零部件,本体制造商会对核心部件做出设计并指定供应商。下游为场景应用,特斯拉机器人制造后或将率先应用于汽车装配工序,优必选机器人此前也发布了在汽车工厂的工作视频等,其他应用场景有望逐步展开。

人形机器人主要由三大系统组成,分别是传感系统、控制系统、执行系统。一、传感系统对应“五官”,包含内部传感器和外部传感器。内部传感器主要用来检测机器人本身的状态,为机器人的运动控制提供必要的本体状态信息,如各关节的位置、速度、加速度等,并将所测得的信息作为反馈信号送至传感器,形成闭环控制,主要有位置传感器、速度传感器等。外部传感器则用来感知机器人所处的工作环境或工作状况信息,使机器人的动作适应外界情况的变化,达到更高层次的自动化,提高机器人的工作精度,常见有视觉传感器、触觉传感器等。二、控制系统对应“大脑”和“小脑”,是机器人的指挥中枢。“大脑”负责环境感知、行为控制、人机交互,通过深度学习和AI技术,实现自主学习和智能决策。“小脑”则负责运动控制包括运动规划、姿态控制、动态平衡等,通过实时感知机器人的状态和环境信息,小脑可以调整机器人的动作,使其能够稳定地行走、跑步、跳跃等。控制系统负责处理作业指令信息、内外环境信息,并依据预定的本体模型、环境模型和控制程序做出决策,产生相应的控制信号,通过驱动器驱动执行机构的各个关节按所需的顺序、确定的轨迹运动,完成特定的作业。三、执行系统对应“肢体”,负责执行控制系统制定的操作。“机器肢”指仿人机械臂、灵巧手、腿足等,“机器体”指骨骼、本体结构等。执行系统的工作流程涉及到伺服系统和执行机构:伺服系统是能根据指令信号精确地控制执行部件的运动速度与位置的驱动系统,一般伺服系统由核心零部件电机、驱动器和传感器/编码器组成;传动机构是把动力从机器的一部分传递到另一部分,实现改变动力机输出转矩或者改变其运动方式(旋转运功和直线运动的转换),机械传动分为两类,一是靠机件间的摩擦力传递动力与摩擦传动,二是靠主动件与从动件啮合或借助中间件啮合传递动力或运动的啮合传动,典型机构有减速器、丝杠、蜗轮蜗杆传动杆等。

2.2大模型为场景泛化提供可能,AI是我们长期面临的难题之一

人形机器人量产,硬件本体是前置条件,更重要的是“AI大脑”,可以说是我们长期面临的最困难的问题之一。《智能机器人智能化等级评价规范》对机器人智能化水平做了分级,其中通用智能化等级的分级则主要基于机器人综合能力的评级,从感知、执行、决策和认知四个方面,对机器人的智能等级进行评价,该评级不对机器人智能化单项要素进行评价,只对机器人智能化综合能力进行评级。机器人综合通用智能化等级从低到高主要分为L1级~L5级:a)L1级(基础型):具备感知功能及部分执行功能;b)L2级(半交互型):具备感知功能和执行功能;c)L3级(交互型):具备感知功能、执行功能和部分决策功能;d)L4级(自主型):具备感知功能、执行功能和决策功能;e)L5级(自适应型):具备感知功能、执行功能、决策功能和认知功能。可见,通用机器人的认知和决策功能是智能化的最高标准,其实现也难于感知和执行功能。

正是大语言模型技术的飞速发展,使得机器人能够自主感知环境、理解任务、动作编排等自主完成一套动作成为可能。基于超大规模的数据预训练的语言和图像大模型,具备强大的语义理解、逻辑推理、图像识别、代码生成能力,智元认为语言和图像大模型对于机器人领域的最大价值在于两点:首先是嵌入在大模型中,庞大的先验知识库和强大的通识理解能力,大模型的出现能够让机器人更好地把原有的能力泛化到更通用的场景中;然后是大模型具有的复杂语义多级推理能力,即所谓的“思维链”。以上两点,对于智能机器人的“认知”和“决策”功能的实现至关重要。智元机器人创始人在公司产品发布会上分享了人形机器人EI-Brain框架。“大脑”提供AI辅助的抽象思维能力,如逻辑推理、思考能力,完成机器人任务级和技能级的调度,如果端侧部署的模型泛化能力不够,还可再配合云端超脑,在线解锁更复杂的任务调度能力;“小脑”负责产生运动控制指令生成,比如设置上身姿态、控制指关节运动、控制头部姿势等,涉及运动学、动力学;另外“脑干”这一层级主要是解决底层的运动控制能力问题,比如所有电机、电流环、速度环、位置环的控制。

3.问题二:Optimus核心零部件拆分,国内供应链主要发力点

3.1特斯拉Optimus主要结构拆分

Optimus结构拆分如下:(1)控制系统:完全自动驾驶FSD,DojoD1超级计算芯片。(2)传感系统:视觉感知采用Autopilot摄像头,手腕、脚踝六维力/力矩传感器,手部电子皮肤,内部编码器等。(3)执行系统:躯干28个执行器,旋转和线性执行器各14个;旋转执行器结构为无框力矩电机+谐波减速器+扭矩传感器+双编码器,采用交叉滚子轴承;线性执行器结构为无框力矩电机+反向行星滚柱丝杠+力传感器,采用4点接触轴承和滚柱轴承;手部共12个执行器,结构为空心杯电机+蜗轮蜗杆+绳驱,其中大拇指2个执行器、其他手指各1个。

3.2感知系统:

转载请注明:http://www.aideyishus.com/lkzp/8271.html

------分隔线----------------------------