当期目录

2025年 第33卷  第2期

刊 首 语
2025, 33(2): 193-193.
摘要:
综述评论
无人艇集群路径规划研究综述: 深度强化学习
侯玉立, 王宁, 邱赤东, 翁永鹏
2025, 33(2): 194-203. doi: 10.11993/j.issn.2096-3920.2025-0034
摘要:
无人艇(USV)集群在复杂海洋任务中展现出显著优势, 但其路径规划面临高维、动态以及多约束等挑战。传统路径规划算法因协同机制薄弱与适应性不足, 难以满足日渐复杂的需求, 而深度强化学习(DRL)技术的发展为USV集群路径规划提供了新的研究方向。文中系统综述了基于DRL的USV集群协同路径规划技术框架及典型算法。首先, 梳理了USV集群路径规划的技术演进脉络与多维约束条件, 分析了集中式和分布式决策框架的适用场景与局限性; 其次, 探讨了多种典型DRL算法的原理、应用场景及改进方向, 分析了其优势与不足; 最后, 总结了该领域面临的主要挑战和发展方向, 旨在为基于DRL的USV集群协同路径规划研究提供参考。
智能水下感知与目标识别
基于小波变换特征增强的水下目标检测方法
魏楠, 杨万扣, 周伟杰, 姜龙玉
2025, 33(2): 204-211. doi: 10.11993/j.issn.2096-3920.2025-0003
摘要:
复杂特殊的水下环境导致水下图像质量较低, 存在对比度低、模糊及水下退化等特性, 这极大地影响了水下目标检测性能。针对这一问题, 文中提出了一种基于小波变换特征增强的水下目标检测方法。引入了离散小波变换(DWT)将深度学习框架中提取到的多层次特征进行高低频分解, 进而将分解得到的频域特征分量通过文中设计的基于注意力机制的频域交互模块进行交互增强, 优化特征表达能力, 经过增强后的特征继续通入目标检测网络用于改善目标检测的性能。实验证明, 文中提出的水下目标检测方法与常见的目标检测方法相比, 在性能上具有一定优势, 能够有效提升水下目标检测能力。
基于场景感知的水下视觉目标跟踪方法
胡千伟, 王代维, 李人杰, 俞晓帆, 康彬, 苏偌宇
2025, 33(2): 212-219, 290. doi: 10.11993/j.issn.2096-3920.2025-0007
摘要:
水下视觉目标跟踪是自主水下航行器(AUV)场景理解的核心技术之一。然而, 复杂水下环境中的光照不均、背景干扰和目标外观变化等问题, 严重影响传统视觉目标跟踪方法的准确性和稳定性。现有方法主要依赖目标的表观建模, 难以实现复杂环境下可靠跟踪, 尤其是在相似目标干扰的情况下, 容易导致误识别和目标漂移。文中提出了一种基于场景感知的水下单目标跟踪方法, 通过基于区域分割的图卷积模块提取场景内所有目标区域, 并结合图卷积网络建模目标区域与周围关键区域的长距离依赖关系, 显著提升对相似目标的区分能力。此外, 文中引入双视图图对比学习策略, 通过生成随机扰动的目标特征视图, 实现图卷积模块的无监督在线更新, 使得模型能够在复杂环境下保持较强的适应性和稳定性。实验表明, 所提方法在跟踪精度和鲁棒性方面显著优于经典方法, 尤其在光照变化大、背景复杂和相似目标干扰较强的场景下, 成功率和精确度均有明显提升。这表明文中研究有效解决了水下目标跟踪中因光照变化和背景干扰导致的目标漂移问题, 能在相似目标存在时保持稳定跟踪, 为水下无人系统提供了高效可靠的目标跟踪解决方案。
基于模糊聚类和动态权重分配的水下传感器网络智能信任评估方法
王照辉, 韩光洁, 杜嘉欣, 林川, 王雷
2025, 33(2): 220-228. doi: 10.11993/j.issn.2096-3920.2024-0176
摘要:
水下传感器网络(USN)在海洋环境监测等领域具有重要作用, 同时面临诸多的安全挑战。信任模型虽能有效抵御内部攻击, 保障网络可靠性,但现有信任评估方法大多依赖于信任特征的线性加权和阈值比较的决策方式。在水下动态环境中, 水流和温度等因素在时空上的不断变化, 会导致节点信任特征的变化差异和信任值的整体波动, 使得最优权重和合理阈值难以有效确定, 影响评估的准确性与决策的可靠性。为解决这一问题, 文中提出了一种基于模糊聚类和动态权重分配的智能信任评估方法。该方法首先对USN进行分层动态拓扑建模, 以增强普适性; 在此基础上综合计算节点的通信、能量和数据特征, 以全面反映节点的状态; 然后使用无监督机器学习算法模糊C均值聚类, 实现自适应的节点信任决策, 同时采用主客观结合策略, 根据网络和环境条件为特征动态分配权重, 从而实现对节点信任度的智能评估。仿真实验结果表明, 该方法能够有效评估水下环境中节点的信任度, 提高信任决策的可靠性, 增强网络安全性。
基于轻量化门控卷积网络的实时Transformer水下目标检测方法
李瑜辉, 崔慧霞, 李耀敏, 贾森平
2025, 33(2): 229-237. doi: 10.11993/j.issn.2096-3920.2024-0182
摘要:
针对水下目标检测算法图像特征处理困难、模型结构冗余以及参数量庞大等问题, 提出一种基于轻量化门控卷积网络的实时Transformer水下目标检测方法。该方法首先基于门控思想构建卷积门控线性单元, 动态调节特征的传递, 并以此为基础提出门控通道交互模块, 该模块通过完全解耦token mixer(词元混合器)和channel mixer(通道混合器), 并针对token mixer部分引入结构重新参数化技术, 极大降低了模型在推理过程中的计算成本。混合编码器针对门控骨干网络提取的3个特征分别进行尺度内信息交互和多尺度特征融合, 实现浅层高频率信息和深层语义空间信息之间的高度融合。文中模型在多个不同模态数据集上进行了大量实验, 实验结果显示, 模型的mAP@0.5达到了0.849, 整体参数量为23.3×106, 检测帧率为136.8。该模型在保持优秀检测精度的同时, 实现了较小的模型参数量和较高的检测速度, 整体性能优于其他模型。结果表明, 与一系列优秀的目标检测模型相比, 文中模型具备较高的检测性能和高效的实时检测能力。
基于自训练YOLO 11模型的低虚警率声呐图像目标检测方法
韩婧祺, 南明星, 张鹏, 陈佳杰, 胡正良
2025, 33(2): 238-248. doi: 10.11993/j.issn.2096-3920.2024-0165
摘要:
声呐图像目标自主检测作为水下无人系统的关键技术, 在实际应用中面临着虚警率高的挑战, 制约了其在水下无人系统中执行任务的质量和效率。为解决这一问题, 文中设计了一种基于YOLO11模型的水下目标检测方法, 为降低其虚警率, 提出采用通过在声呐图像上自训练深度学习检测器的虚警率检测方法。该方法依据声呐图像目标检测数据集自动生成代理分类任务, 通过预训练提高深度学习检测器对目标和背景特征的学习效果, 从而提升检测器对目标和背景的分辨能力,有效降低虚警率。实测结果表明, 在检测器置信各自取F1-score最大值对应的数值时, 文中方法训练得到的YOLO11检测器相较于传统的迁移学习方法,虚警率降低了11.60%, 且具有更高的召回率。该方法在不使用外部数据集的条件下,显著提升了深度学习检测器的泛化性, 为水下小样本目标检测场景提供了一种高效的自训练方式。
融合重参数化与注意力机制的水下视觉多目标跟踪算法
李军毅, 何铭乐, 刘畅, 徐雍
2025, 33(2): 249-260. doi: 10.11993/j.issn.2096-3920.2025-0012
摘要:
复杂的水下环境会严重影响成像设备的稳定性和获取图像的质量, 从而给水下无人自主系统视觉多目标跟踪带来极大挑战。为了解决水下相机抖动和图像退化带来的问题, 文中提出一种适用于水下无人自主系统的融合重参数化与注意力机制的水下视觉多目标跟踪算法。首先, 针对水下目标多样及图像退化等问题, 提出基于重参数化和注意力机制改进的YOLOv8 算法(RA-YOLOv8), 通过融合结构重参数化的多尺度特征提取卷积结构(DBB-RFAConv)和注意力机制, 有效增强网络的多尺度特征提取能力和提高模型的检测精度; 然后, 针对水下相机抖动问题给目标实时跟踪带来的挑战, 提出基于Inner-PIoUv2 改进的ByteTrack算法(IP2-ByteTrack), 使用 Inner-PIoUv2 作为跟踪算法匹配过程中的相似度度量, 增强模型在水下检测和跟踪任务中的性能, 提高跟踪轨迹匹配准确性; 最后, 基于RA-YOLOv8 和IP2-ByteTrack 算法, 提出一种用于水下无人自主系统的融合重参数化与注意力机制的水下视觉多目标跟踪算法。实验结果表明, 所提算法在复杂水下环境中表现出优异的性能, 能够有效解决现有方法在水下多目标跟踪中的不足。
人工智能驱动的水声通信
时变水声信道下基于多智能体强化学习的水声网络跨层传输调度方法
高煜, 肖俏, 王超峰
2025, 33(2): 261-271. doi: 10.11993/j.issn.2096-3920.2025-0015
摘要:
水声通信因其高传播时延、信道时变特性及带宽受限等因素, 在传输调度决策方面面临诸多挑战。为提升复杂水声环境下的通信效率, 文中提出了一种基于多智能体强化学习(MARL)的水声网络跨层传输调度(TS)方法MARL-TS。该方法针对高水声传播时延和动态信道环境, 以传输节点的数据缓存状态与信道条件为基础, 以通信网络的传输效率和传输时延为优化目标, 自适应地进行跨层优化, 实现功率分配与时隙资源调度的联合优化。为学习最优传输策略, 文中构建了可学习的策略网络与价值网络, 并结合多智能体协同学习, 提升策略优化的效率与自适应决策能力。仿真实验表明, 与现有基于强化学习的多路访问控制协议相比, MARL-TS在传输能效优化和传输时延降低等方面表现出显著优势, 尤其在多节点高负载场景下展现了更强的适应性与稳定性, 为复杂水下通信系统的优化提供了新思路。
面向联邦学习的水下无人系统安全通信方法
吴佳佳, 徐明
2025, 33(2): 272-279. doi: 10.11993/j.issn.2096-3920.2025-0010
摘要:
针对水下无人系统中的信息泄露问题, 提出了一种面向联邦学习的安全通信方案。考虑水声信道复杂性和带宽限制, 引入了基于Kashin压缩的无偏梯度压缩方法, 通过正交投影和量化操作降低传输梯度维度, 减少通信成本并保持信息完整性。为应对信息泄露, 设计了基于反馈信道的保密方案, 利用归一化水声信道传递矩阵和随机序列生成密钥, 确保窃听方无法解密模型参数。通过结合多目标优化技术, 找到Pareto最优解实现模型精度和安全吞吐量的平衡。仿真结果显示, 与现有方案相比, 所提方案能够有效提升训练精度和安全吞吐量, 同时保持较低通信延迟。
多制式水声通信接收机智能解译网络设计
刘兰军, 成子宁, 陈家林, 黎明, 刘鸿浩
2025, 33(2): 280-290. doi: 10.11993/j.issn.2096-3920.2024-0174
摘要:
针对复杂应用场景的信道自适应高质量水声通信需求, 提出了一种支持正交频分复用(OFDM)、单载波调制(SCM)、多载波频域扩频(MC-FDSS)和单载波时域扩频(SC-TDSS) 等4种信号调制方式的多制式水声通信接收机智能解译网络设计方案, 分别采用基于全连接深度神经网络(FC-DNN)和长短期记忆(LSTM)网络的智能解译模块代替传统的信道估计和信道均衡模块, 针对非扩频和扩频信号调制方式设计了易于并行扩展的深度学习网络结构。基于5种典型时变信道模型进行了网络训练和测试, 测试结果表明, 设计的2种智能解译网络相较于传统的最小二乘(LS)估计+迫零均衡、LS估计+最小均方误差信道估计均衡方法, 系统性能均有较大提升。在信噪比5 dB条件下, OFDM和SCM非扩频信号调制方式的系统误码率分别降低了约10倍和100倍; 信噪比−5 dB条件下, MC-FDSS和SC-TDSS扩频信号调制方式的系统误码率分别降低了约100倍和1 000倍; 设计的2种智能解译网络的系统性能相当, 均具有良好的泛化性能, 基于FC-DNN的智能解译网络的计算复杂度较低。
基于SVR的水声通信信噪比预测及发送功率自适应方法
郑纪星, 袁屿藩, 卓晓晓, 陆雪松, 瞿逢重, 魏艳
2025, 33(2): 291-298. doi: 10.11993/j.issn.2096-3920.2024-0180
摘要:
海洋环境噪声受海浪、风雨、海洋生物、船舶及工业等诸多因素影响, 其功率具有较强的随机性; 同时, 海面温度及潮汐高度等因素的持续作用也会使其功率具有一定的周期性特征。水下环境噪声在水声通信时会直接影响通信误包率, 提高发送功率可增大接收信噪比、降低误包率, 但也会提高通信平均能耗。因此, 为了降低水声通信的误包率与平均能耗, 文中提出基于支持向量回归(SVR)算法对信噪比时间序列进行分析预测, 并提出基于信噪比预测的水声通信发送功率自适应方法。仿真结果表明, 相比于指数平滑及差分整合移动平均自回归模型(ARIMA)方法, 基于线性核函数的SVR算法对信噪比预测效果最佳, 在测试数据上的预测误差最小。在不同调制方式下, 所提发送功率自适应方法均可在提高数据包传输成功率的同时降低每千字节能耗。
结合深度学习和领域知识的水声快变信道均衡技术
邓珂, 王帅军, 余华, 张健, 陈军帆, 吴州平
2025, 33(2): 299-306. doi: 10.11993/j.issn.2096-3920.2024-0163
摘要:
以正交频分复用(OFDM)为代表的多载波通信是目前水声高谱效传输的主流体制, 可有效应对水声多路径传播带来的频率选择性衰落问题, 然而在快时变场景下的子载波间干扰(ICI)会严重影响传输可靠性。针对水声快变信道下的时-频双选衰落问题, 为了降低OFDM系统的接收误码率, 提出一种结合深度学习和领域知识的水声快变信道均衡方法, 不同于将传统信道估计和均衡检测结果作为深度神经网络(DNN)的预处理结果或者补充信息源, 文中使用经典频域均衡模型的结构化信息辅助DNN模型训练和推理, 以抵抗ICI的不利影响, 并适应实际部署信道环境与训练信道环境失配的场景。仿真和海上测试结果表明, 所提方法能够有效降低接收机误码率, 实现更快的模型收敛速度, 并在未知信道条件下实现更强泛化性能的潜力。
基于变分自动编码器的水下无线传感器网络信任模型
张家豪, 魏思周, 夏娜
2025, 33(2): 307-316. doi: 10.11993/j.issn.2096-3920.2024-0181
摘要:
在水下无线传感器网络(UWSN)中, 复杂的水声通信环境与受限的节点资源使恶意节点的攻击更具隐蔽性和威胁性, 因此研究有效的恶意节点检测方法对维护网络稳定与数据安全至关重要。文中提出了一种基于变分自动编码器的UWSN信任模型, 通过评估节点行为可信度来判定其是否为恶意节点。首先由汇聚节点收集水下节点传输过程中的行为特征数据, 从中提取位置、数据包投递比率及延迟等指标, 构成信任数据集; 然后对数据集进行编码训练, 利用变分推理将数据映射到潜在空间, 并获得该空间的概率分布; 最后依据概率分布解码重构数据, 得到节点行为可信度, 从而完成对节点的信任评估。对比实验结果表明, 相较于基于入侵检测的信任管理系统等方法, 该模型在信任评估准确度方面至少提升了10.5%, 同时在运行稳定性方面也具有明显的优势。
基于深度神经网络的水下分布源波达方向估计算法
梁奕念, 李杰, 陈芳炯, 季飞, 余华
2025, 33(2): 317-324. doi: 10.11993/j.issn.2096-3920.2024-0178
摘要:
针对传统子空间类波达方向(DOA)估计算法在处理不同相干性分布源定位时需依赖先验相干性信息的局限, 文中提出一种基于深度神经网络(DNN)的水下分布源DOA估计方法。该方法利用部分相干分布源信号模型中时间和角度相干分量的可分性, 通过分段均值归一化方法简化模型, 并构建DNN模型,通过多组不同相干系数的样本数据训练, 实现了对不同相干性分布源DOA角度的鲁棒性估计。仿真实验结果表明, 该方法无需相干性先验知识即可有效估计不同相干系数下的分布源参数。将文中方法与4种传统子空间类方法和1种深度卷积神经网络算法进行对比, 结果表明:在相干分布源情况下,文中方法在不同信噪比和快拍数条件下的均方根误差(RMSE)结果比其他方法平均降低0.42°;在非相干分布源情况下,当信噪比大于0 dB且快拍数大于600时,文中方法的RMSE结果比其他方法平均降低0.04°;在全相干系数范围内,文中方法均表现出更优的估计性能,验证了其在复杂水下环境中的适用性。
海上无人系统智能控制
基于深度强化学习的多水下目标拦截策略研究
干文浩, 彭云飞, 乔磊
2025, 33(2): 325-332. doi: 10.11993/j.issn.2096-3920.2025-0004
摘要:
在多自主水下航行器(AUV)拦截水下目标时, AUV需在竞争与合作的双重挑战下根据敌友信息作出精准决策。现有研究多集中于简单环境下的单目标拦截, 缺乏对复杂环境下多目标拦截协作机制的深入探讨。针对这一问题, 文中提出一种多智能体深度强化学习框架, 帮助AUV在具有复杂障碍和时变海流的环境中学习拦截策略, 重点开发其在多对多态势下的协作机制。首先设计了一种分层机动框架, 通过3层循环增强AUV决策能力;然后基于多智能体近端策略优化算法, 构建可伸缩的状态和动作空间, 并设计复合奖励函数, 以提高AUV拦截效率和协同能力;最后在集中训练-分布式执行架构下, 提出种群扩展-课程式学习训练方案, 帮助AUV掌握具有泛化性的协同策略。训练结果表明, 所提框架下的拦截策略能快速收敛, 保障高成功率。仿真实验表明, 训练得到的AUV团队可在多种群配置下使用同一套模型, 在避开障碍物的同时,通过合作有效拦截多个入侵目标。
带有推进器故障的无人艇自适应优化控制
高颖, 路明春, 张汝波, 王宁
2025, 33(2): 333-340, 388. doi: 10.11993/j.issn.2096-3920.2025-0013
摘要:
针对带有推进器失效故障和动力学未知的无人艇(USV)自主控制问题, 提出一种基于模型预测控制的自适应容错控制方法。首先, 针对执行器部分失效故障, 建立含有故障的USV动力学模型,将动力学模型中未知非线性动态和外部扰动形成集总非线性函数, 利用神经网络逼近动力学中未知部分; 为了实现对期望轨迹的高性能精确跟踪, 构造以控制输入和状态误差为变量的指标函数, 结合模型预测控制和反步控制设计了一种自适应自主容错控制策略; 基于李雅普诺夫稳定性理论证明了闭环系统内所有信号都有界, 在此框架下构建的控制策略既可以补偿执行器故障和未知非线性动态对系统造成的影响, 也可以保证系统的跟踪误差收敛到理想精度。仿真结果验证了所提方法的有效性和合理性。
基于极速学习的欠驱动无人艇鲁棒自适应路径跟踪控制
贺新宇, 王宁, 吴浩峻
2025, 33(2): 341-349. doi: 10.11993/j.issn.2096-3920.2024-0170
摘要:
针对欠驱动无人艇(USV)存在未建模动力学、参数不确定性和干扰等未知状况, 提出一种基于极速学习的鲁棒自适应路径跟踪控制方案。首先, 采用纵荡视线制导律, 同时制导纵荡速度与航向角, 避免制导过程的奇异现象, 使得USV快速收敛至期望路径; 其次, 将包含系统不确定性和外部干扰的未知动态封装成一个集总未知项, 利用极速学习机的单隐层前馈网络(SLFN)随机产生隐层节点, 在线辨识该未知项, 避免对USV先验知识的依赖和“维度爆炸”问题; 然后, 通过设计逼近残差自适应补偿器, 同时在线更新SLFN的输出权重和逼近残差, 形成双通道学习机制, 不仅可以增强逼近能力, 而且提高了跟踪精度; 最后, 设计自适应路径跟踪控制器, 使得USV的纵荡速度与航向角制导误差可以渐进收敛到原点附近的小邻域。仿真实验验证了所提方案的有效性和优越性。
基于样条插值的轻量化AIS船舶轨迹预测
胡建涛, 李天姣, 刘辉, 李舒心, 程徐
2025, 33(2): 350-358. doi: 10.11993/j.issn.2096-3920.2024-0164
摘要:
船舶自动识别系统(AIS)能够提供大量实时船舶航行数据, 已成为海上交通管理、搜救行动和风险评估等诸多领域不可或缺的关键数据来源。其中船舶轨迹预测问题受到广泛关注。然而, 实现精准的长时间轨迹预测面临两大问题: 一是AIS数据本身的完整性问题; 二是预测模型的效率问题。因此, 如何有效地处理AIS数据缺失以及如何构建轻量且高效的预测模型,成为了亟待解决的重要问题。文中提出了一种基于样条插值的轻量化AIS船舶轨迹预测方法, 采用样条插值来填补缺失的AIS数据, 并引入了一种轻量化的线性层结构以降低深度学习模型的复杂度。实验结果表明, 该方法能够有效插值缺失的AIS数据, 显著减少深度学习模型的参数量和计算量, 进而提升对船舶轨迹的预测精度。
基于MobileNetV2的船载充电部件检测与岸基机械臂对接方法
夏腾辉, 王曰英, 吴乃龙, 刘福藤
2025, 33(2): 359-366. doi: 10.11993/j.issn.2096-3920.2024-0167
摘要:
为实现无人水面艇(USV)的自主充电, 提出了一种基于MobileNetV2的船载充电部件检测与岸基机械臂对接方法。首先通过双目相机D435i采集RGB图与深度图作为输入, 利用基于MobileNetV2的检测网络估计充电部件的位姿; 随后通过坐标变换计算充电部件在机械臂基座坐标系下的位姿, 驱动机械臂末端充电插头靠近充电部件, 实现初步对接; 再利用对接策略完成内部孔洞的搜索, 从而实现最终对接。在现实环境中搭建充电部件对接实验平台, 验证了该方法的有效性, 该方法能够准确识别出USV上的充电部件, 并采用基于重力补偿的比例-微分力矩控制策略控制机械臂完成充电插头与充电部件的对接, 为USV自主充电提供了新的思路。
空海异构无人系统协同控制与智能优化
柯灿, 陈惠芳, 谢磊
2025, 33(2): 367-379. doi: 10.11993/j.issn.2096-3920.2024-0173
摘要:
为应对日益复杂的海洋任务, 文中构建了一个由空中无人机-无人水面艇-无人水下航行器组成的空海异构无人系统, 研究其协同控制问题。对于异构无人系统的信息交互问题, 各域均由1个领航者与多个跟随者组成, 跨域通信由各域领航者完成。同时, 针对各域领航者轨迹问题, 提出了一种基于人工势场法的协同轨迹规划算法, 使各域领航者能够在避障情况下到达目标位置。对于受限的通信资源问题, 为各域跟随者设计了一种基于间歇通信的脉冲层级编队控制协议, 实现了避障下的编队控制, 且减少了通信开销。另外, 针对协同控制算法的收敛时间和通信能耗的多目标优化问题, 通过设计收缩-扩张系数和动态密集距离策略, 提出了一种改进的多目标量子行为粒子群优化算法, 用于智能选择各域脉冲间隔, 从而使协同控制算法的收敛时间与通信能耗间达到良好折衷。仿真结果表明, 该空海异构无人系统能够在避障下实现编队控制, 同时减少通信开销, 与传统的多目标量子行为粒子群优化算法相比, 所提算法具有更好的收敛性与全局搜索能力。
基于深度强化学习的无人艇集群路径规划
余满江, 何家伟, 邢博闻
2025, 33(2): 380-388. doi: 10.11993/j.issn.2096-3920.2024-0179
摘要:
随着无人艇(USV)在海上搜索领域的广泛应用, 传统的路径规划算法不能满足复杂的救援场景, 会导致局部最优、任务完成率低以及收敛速度慢等情况。为此, 提出了一种USV集群协同搜救的路径规划方法。首先, 基于多智能体深度确定性策略梯度算法引入长短期记忆模块, 增强USV对路径规划中时序信息的利用能力; 其次, 设计了多层级表征经验池, 提高训练效率和数据利用率, 减少不同经验间的干扰; 最后, 采用随机网络蒸馏作为好奇心机制, 为USV探索新区域提供内在奖励, 解决奖励稀疏导致的收敛问题。仿真实验结果表明, 改进后的算法与原始算法相比, 收敛速度提升了约38.46%, 路径长度也缩短了27.02%, 且避障能力上有显著提升。
服务号
订阅号