摘要:
随着海洋研究与开发的日益扩大, 高速自主水下航行器(AUV)作为重要的无人水下工作平台受到广泛关注。然而由于其模型具有多输入多输出、强耦合欠驱动以及强非线性特性, 因此依赖精确模型的传统控制方法在实际应用中常受到限制。针对此问题, 文中提出一种不依赖精确模型的强化学习位姿控制器, 该控制器通过姿态环和位置环的配合不仅可以实现高速AUV的快速姿态稳定, 还可以更快地完成下潜到指定深度的动作; 同时, 为了降低获取用于训练强化学习控制器数据的成本, 结合神经网络技术提出了一种改进的高速AUV状态估计器, 该估计器可以在已知当前时刻AUV的状态以及所受控制量的情况下估计出下一时刻的状态, 从而为强化学习控制方法提供大量的训练数据。仿真实验结果表明, 估计器达到了较高的估计精度, 基于神经网络状态估计器训练得到的强化学习控制器可以完成原AUV的平稳快速控制, 从而验证了所提方法的可行性及有效性。
郭可建, 林晓波, 郝程鹏, 等. 基于神经网络状态估计器的高速AUV强化学习控制[J]. 水下无人系统学报, 2022, 30(2): 147-156. doi: 10.11993/j.issn.2096-3920.2022.02.002.