热搜： 佳士科技 irobot 开云电竞官网下载app 机器人 ABB 机器人产业联盟发那科机械手库卡码垛机器人

Google的AI使机器人能够即时做出决策

日期：2020-04-16 来源：贸易经济网作者：阿芬评论：0

标签： 谷歌人工智能机器人决策

　　本周于预印服务器Arxiv.org上发表的一篇论文中，来自Google Brain，Google X和加州大学伯克利分校的研究人员组成的团队描述了对现有AI方法的扩展，这些方法使诸如代理人之类的代理人成为可能。决定执行上一个动作时要采取的动作。其思想是，模仿人或动物行为的行为模型将在将来导致更健壮，更不易发生故障的系统。

　　研究人员指出，尽管AI算法已经在视频游戏， 机器人抓取和操纵任务中取得了成功，但大多数算法都使用了阻塞性的“观察-思考-行动”范例-代理假定其环境在“思考”时保持静态，因此其行动将在计算它们的相同状态下执行。这在仿真中是适用的，但在现实世界中则不然，在现实世界中，环境状态随着代理程序处理观测结果并计划其下一个动作而变化。

　　团队的解决方案是一个可以在机器学习上下文中处理并发环境的框架。它利用标准的强化学习公式-通过奖励推动代理人达到目标的公式-其中，代理人从一组可能的状态中接收一个状态，并根据策略从一组可能的操作中选择一个操作。环境返回从过渡分布和奖励中采样的下一个状态，以便代理学习从每个状态最大化期望的收益。

　　除了上一个动作之外，还有两个附加功能-动作选择时间和走动向量(VTG)-有助于封装并发知识。(研究人员将VTG定义为在测量环境状态时立即执行的最后一个动作。)并发动作环境在执行前一个动作时以及捕获状态之后捕获状态。并且该策略将选择一个操作并执行该操作，而不管先前的操作是否已完成-即使必须中断先前的操作。

　　研究人员在真实世界的机械手臂上进行了实验，他们的任务是抓取并移动垃圾箱中的各种物体。他们说，他们的框架取得了与基线阻止模型相当的抓取成功，但是就策略持续时间(衡量策略的总执行时间)而言，它比阻止模型快49%。此外，并发模型能够执行比基线更平滑的轨迹。

　　共同作者写道：“并发方法可能允许在动态环境中进行机器人控制，在这种环境中，机器人无法在计算动作之前停止环境。”“在这些情况下，机器人必须真正地同时思考和行动。”

　　这项工作是在Google领导的一项研究之后进行的，该研究描述了一种AI系统，该系统从动物的动作中学到了东西，从而使机器人具有更大的灵活性。合着者认为，他们的方法可以促进机器人的发展，该机器人可以完成现实世界中的任务，例如在多层仓库和履行中心之间运输物料。

更多> 相关开云电子链接

0条 相关评论

推荐图文

机器人赋能产业，智赢	机器人也会创造英国
2018年中国智慧机场行	智能工厂全面解读！
艾猫早教机器人亮相20	360智能硬件助力美国

推荐开云电子链接

点击排行

• 谷歌无人驾驶业务Waymo拟融资40亿美元考虑分拆	• 人工智能“将改变一切”！谷歌旗下DeepMind宣布
• Google从用户那里获得人工智能的帮助	• 25年后实现永生？谷歌科学家预言，依靠纳米机器
• 机器人是如何模仿动物行为，执行更复杂的动作？	• 前谷歌机器人主管打造出能够灵活延伸的辅助机器
• 英特尔，谷歌和UC Berekely AI团队训练机器人进	• 谷歌助手可能是杀手机器人但它缺少一个关键功能
• 谷歌母公司使用其Wing无人机在疫情行期间运送药	• 疫情期间需求大增，“谷歌无人机送货”业务量翻

恰佩克奖	机器人高峰论坛	北大机器人	金属加工在线	AI中国网	埃森焊接展	机气林
工博会	赶考网	中国机床网	ITES深圳工业展	电气自动化网	高压电气网	人工智能机器人
亚洲工业网	二手设备网	中国（南京）国际应急产业博览会	库卡机器人	2022SSE职业技术教育现代化博览会	海南教育装备展览会	VLAI未来四足机器人官网
中国传动网	华北机床网	数控机床市场网	国家标准化委员会