一般情况下,脚踏车的运动控制可以分成两种。一种是以传统方式为基础,比如轨迹优化和模型预测控制。这类方法通常需要对机器人的运动学方程、地面形状、摩擦系数等方面的足够的了解。但是,在复杂的环境下,这种方法常常很困难。与此相反,另外一种训练方式在复杂的环境中表现得更好。将一个神经网路在模拟机中直接进行培训,然后移植到现实生活中,这个方法被称作「仿真向实际转移」。由于深层次的强化学习能够极大地降低对某一领域的知识的依赖性,而且所得到的训练策略也会显示出较好的健壮性。
由于现有的深度学习模型的能力不足,很难支撑更多的复杂场景下的机器人进行运动,因此,大多数的增强学习方法都是以单一的机械躯体作为训练对象。经过强化学习和培训后,该控制器仅适用于单一的机械手,当机械手的性能发生变化时,其操作者必须重新进行培训。近几年,基于增强学习的方式,诸如采用模块化网络体系结构、基于机器人条件的策略、基于图神经网络的方式,为机器人的各种具体(比如,不同的外形)的机器人提供了一种公共的控制器。但是,有些算法只是在模拟的情况下得到了证实,并没有在实际的机器人上得到证实。
由于机器人形态与控制方法之间复杂的关系,设计一个跨具身的机器人控制器目前还是一个有挑战性的问题。