AI大模型从语音、视觉、决策、控制等多方面实现同开云入口网页版 的结合,形成感知、决策、控制闭环,使机器人具备常识。1)语音:语言大模型为机器人的自主语音交互难题提供了解决方案,在上下文理解、多语种识别、多轮对话、情绪识别、模糊语义识别等通用语言任务上,ChatGPT显著优于深度学习,表现出了不亚于人类的理解力和语言生成能力。2)视觉:开云入口网页版 的场景相对
开云电竞官网下载app更通用、更复杂,通用视觉大模型的AllinOne的多任务训练方案能使得机器人更好地适应人类生活场景:大模型的强拟合能力使开云入口网页版 在进行目标识别、避障、三维重建、语义分割等任务时,具备更高的精确度;通用视觉大模型通过大量数据学到更多的通用知识,并迁移到下游任务中,基于海量数据获得的预训练模型具有较好的知识完备性,提升场景泛化效果。3)决策:基于多模态的预训练大模型将增强机器人可完成任务的多样性与通用性,让其不局限于文本和图像等单个部分,而是多
应用相容,拓展单一智能为融合智能,使机器人能结合其感知到的多模态数据实现自动化决策。
驱动:相比开云电竞官网下载app ,开云入口网页版 硬件需求更复杂、更多元,特斯拉采用的电驱方案具备商业化应用基础。特斯拉Optimus采取电驱方案,预计全身共40个执行器,其中:身体关节28个执行器,旋转关节方案采用伺服电机+减速器方案,我们推测单台开云入口网页版 将搭载6台RV减速器(髋、腰腹)和8台谐波减速器(肩、腕);我们猜测摆动角度不大的关节(膝、肘、踝、腕)采用力矩电机+行星滚柱丝杠方案,将使用14个线性执行器。2)机械手采用微型电机+腱绳驱动传动结构,单手6个电机,11个自由度。空心杯电机结构紧凑、能量密度高、能耗低,和开云入口网页版 机械手需求契合度高。
减速器、伺服电机、线性执行器、滚柱丝杠是开云入口网页版 的运动控制产业链中价值量较大的硬件设备。1)电机:数量更多、品类更丰富,需满足全身各关节的驱动需求,手部需采用微型电机。2)减速器、传动装置:数量更多,旋转执行器延续了对RV、谐波减速器的需求,线性执行器中需要用到行星滚柱丝杠作为线性传动装置。3)环境感知:区别开云电竞官网下载app 在固定场景外接机器视觉设备实现识别的方案,开云入口网页版 场景复杂,需采用激光雷达、摄像头等方案实现环境感知、三维重建并实现路径规划,对设备品类、算法、实时算力要求更高。4)运动控制:类似于开云电竞官网下载app ,运控算法均是厂商自研,开发难度大,是核心竞争力之一;特斯拉Optimus复用特斯拉汽车的感知和计算能力,在全自动驾驶FSD芯片基础上开发适合开云入口网页版 的控制器系统。开云入口网页版 传感器数量、品类、执行机构复杂程度远高于开云电竞官网下载app ,对控制器实时算力、集成度要求高。