Frontier of Environmental Science June 2015, Volume 4, Issue 2, PP.64-70
The Task Allocation and Path Planning Based on BISOM Feifei Chen, Daqi Zhu# Laboratory of Underwater Vehicles and Intelligent Systems, Shanghai Maritime University, Haigang Avenue 1550, Pudong new district, Shanghai, 201306, China #
Email: zdq367@aliyun.com
Abstract For the task allocation and path planning of multi-AUV (Autonomous Underwater Vehicle) system in three dimensional underwater environments with obstacles, a novel biological inspired self-organizing task allocation and path planning algorithm is proposed. Firstly, the SOM neural network (the self-organizing map) is developed to assign targets in underwater environment to a team of AUVs. The working process involves the definition of the initial neural weights of the SOM network, the rule of selecting the winner, the computation of the neighborhood function. Then, in order to solve the problem of obstacle avoidance and sharp speed jump, the biological inspired neural dynamics model (BINM) is embedded into the SOM neural network, the biological inspired neural dynamic model is used to update weights of the SOM neural network, and plan a path without sharp speed jump and obstacles. As a result, adaptive task allocation and effective path planning are achieved. Finally, to demonstrate the effectiveness of the proposed approach, simulation results are given in this paper. Keywords: Multi-AUV System; Self-organizing Map (SOM); Task Allocation; Biological Inspired Neural Dynamics Model (BINM); Obstacle Avoidance
基于 BISOM 的多 AUV 任务分配和路径规划算法*
陈飞飞,朱大奇 上海海事大学 水下机器人与智能系统实验室,上海 201306 摘
要:针对三维水下障碍物环境的多 AUV(Autonomous Underwater Vehicle)任务分配与路径规划问题,提出了一种生物
启发自组织任务分配和路径规划算法。 首先, 利用自组织神经网络 SOM(Self-Organizing Map)将水下目标分配给一组 AUV, 这个过程包括自组织神经网络的初始权值的定义、获胜神经元的选取、邻域函数的计算;其次,针对传统 SOM 路径规划 更新的速度跳变与安全避障问题,将生物启发神经动力学模型(BINM: Biological Inspired Neural Dynamics Model)嵌入自组 织神经网络之中,利用生物启发神经动力学模型进行自组织神经网络权值的更新,从而可以规划出一条无速度跳变、无 碰撞的有效路径,实现多 AUV 自适应任务分配与有效路径规划。最后,为了验证所提出方法的有效性,给出了仿真实验 结果。 关键字:多自治水下机器人系统; 自组织神经网络; 任务分配; 生物启发神经动力学; 避障
引言 自治水下机器人 AUV 是人类探索海洋的重要工具。由于 AUV 通讯带宽、携带的动力及搜索范围的有限 性,限制了其使用范围。与单一 AUV 相比,多 AUV 系统具有更高的适应性,通过相互间的合作使得多 AUV 系统具有更高的效率,目前,多 AUV 系统逐渐成为海洋工程界的研究热点。 *
上海市科委创新行动计划(14JC1402800,13510721400),上海市教委科研创新研究重点项目(13ZZ123) - 64 http://www.ivypub.org/fes
多 AUV 系统的核心内容之一是水下任务分配与路径规划,即如何将一个总任务合理分配给多个 AUV, 然后让每个 AUV 沿着最优的路径到达指定的目标。关于多机器人系统任务分配问题,迄今为止,已有很多 的研究成果。如基于行为的方法[1-2]、市场拍卖算法[3-4]等,但是相关研究都局限于于二维工作空间的移动机 器人任务分配,而且很少考虑到单个机器人的路径规划问题。 受到自组织神经网络的启发,A.Zhu[5]等将自组织神经网络应用于多移动机器人系统的任务分配与路径规 划中,提出的算法在保证多机器人系统以最少的总消耗遍历所有目标的前提下,每个移动机器人都能沿着最 短路径到达目标,这个算法有效地解决了确定环境下多移动机器人任务分配与路径规划问题;Sato[6]等人针 对动态二维环境,利用自组织神经网络算法为地面移动机器人开发了一个可控的选择系统,使地面移动机器 人可以根据不同的实际情况,进行系统的动态切换分配;Hendzel[7]等人针对障碍物环境下任务分配问题,应 用自组织神经网络 SOM,提出了一个传感导航算法为地面移动机器人规划路径,该算法使机器人能够自动地 处理突发障碍物。A.Zhu[8]等人在原有算法[11]的基础上,针对地面移动机器人路径规划的方向性问题,进一步 改进 SOM 任务分配与规划算法,给出机器人运行时的最大转向角以及最大转向半径,在完成多任务作业的 基础上,控制机器人沿着平滑的弧线到达目标点。以上有关自组织 SOM 任务分配与路径规划算法,同样是 针对移动机器人二维平面环境展开研究,目前,有关自治水下机器人 AUV 三维环境中的多任务分配与路径 规划研究报道还较少[9-11]。 Beverley Chow[9]提出了一个改进后的 K-均值算法,用来解决常值海流环境下的多 AUV 系统的任务分配 和路径规划问题。这个算法结合了 Dubins 模型、AUV 动态模型以及海流模型。其中改进后的 Dubins 模型使 水下机器人在常值海流环境下,沿弧线到达目标。算法的新颖之处在于将多水下机器人系统的任务分配与路 径规划结合到了一起。但是 K-均值在完成多任务作业时,对移动的目标物不敏感,另外,算法仅研究了二 维常值海流模型和无障碍物的水下环境,对实际的三维水下环境来说,降低了算法的适用性。 针对 K-均值算法的不足,D.Q.Zhu[10-11]等将自组织神经网络模型引入多 AUV 系统,将速度合成算法和 SOM (Self-organizing map)算法相结合,研究多 AUV 系统在二维与三维时变海流环境中的任务分配与路径规 划问题。该算法不仅能解决了三维时变海流环境中多 AUV 任务分配和路径规划问题,而且对每个 AUV 的工 作量进行了优化均衡, 不会出现个别 AUV 任务过重导致任务失败的情况。 但该算法将三维的水下环境和 AUV 的运动能力假设为理想状况,主要不足有两点,一是没有考虑 AUV 单步航行能力的限制,在应用传统 SOM 算法更新权值(也即 AUV 位置)时,AUV 会出现所谓的“速度跳变”问题;二是没有考虑环境中障碍物情 况,这与实际的水下环境差距较大。 本文针对 SOM 算法的“速度跳变”和水下障碍物问题,提出一种新的基于生物启发自组织神经网络 (BISOM)模型,并将其应用到多 AUV 系统的任务分配和路径规划中。通过在自组织神经网络中嵌入生物启 发神经动力学模型来规划出一条无速度跳变无碰撞的有效路径。首先,利用自组织神经网络对一组 AUV 进 行任务分配,确保 AUV 获得最适当的目标。其次,针对 SOM 路径规划更新的速度跳变与安全避障问题,将 生物启发神经动力学模型嵌入自组织神经网络之中,利用生物启发神经动力学模型进行自组织神经网络权值 的更新,从而规划出一条无速度跳变、无碰撞的有效路径,实现多 AUV 任务自适应分配与有效路径规划。
1 生物启发自组织神经网络算法 1.1 传统的自组织神经网络 由于多 AUV 系统与 SOM 算法之间的相似特性,使得自组织神经网络算法能够应用于多 AUV 系统的任 务分配之中。首先,多 AUV 系统可以被认为是一个自组织系统,当环境或系统本身改变时,其基本结构也 会改变。其次,SOM 算法具有竞争、合作和自组织的特点,与多 AUV 系统相似。SOM 可以将输入数据聚 类,如果将目标向量作为输入神经元,AUV 的坐标作为输出神经元,在 SOM 的学习过程中,选出获胜神经 元即目标点,然后权值不断调整,邻域不断缩小,输出神经元分别趋向输入向量所在的区域,从而实现 AUV - 65 http://www.ivypub.org/fes
的路径规划与任务分配。
输出层 AUV的位置
输入层 目标位置
x1
x2
xL
图 1 自组织神经网络结构
自组织神经网络由两层神经元组成。第一层为输入层,代表三维空间下目标的位置坐标;第二层为输出 层,表示三维空间下 AUV 的位置坐标,输入层的神经元与输出层的神经元一一连接,并且输出层的神经元 对输入层的神经元的连接权重由一个三维的权向量给出。 SOM 算法大体包含如下三个步骤:首先,通过计算欧式距离来选取获胜神经元。其次,在某个神经元获 胜以后,设计一个邻域函数。邻域函数决定了输入神经元对获胜神经元和相邻神经元的影响力,获胜神经元 所受到的影响是最大的,邻近的神经元所受到的影响逐渐减小,邻域以外的神经元不受到影响,影响力的大 小决定了在某次迭代过程中邻域中的神经元权重调整的大小。最后,权值的更新,通过三维权向量的更新 AUV 到达目标点。 1.1.1
获胜神经元的选取
获胜神经元的计算式由(1)式给出,其中 Rd 为从第 k 组选出的相对于输入神经元 Ti 的获胜神经元。 Dij 表 示相邻神经元在某一时刻的欧氏距离,具体计算式由(2)式给出。Ti 为输入神经元的位置坐标即目标的位置坐 标,由三维向量 (tix , tiy , tiz ) 表示, R j ( R jx , R jy , R jz ) 为输出神经元的位置坐标,即 AUV 的位置坐标。
Rd min{Dij k 1,2,...K i 1,2,...I
j 1,2,...J }
Ti R j (tix rjx )2 (tiy rjy )2 (tiz rjz )2
(1) (2)
由于 AUV 携带能量的有限性,为了能够更加充分、有效的利用 AUV 自身携带的有限能源,同时防止 AUV 在驶向目标的过程中由于能量耗尽而停止运行,因此在算法中要考虑 AUV 的负载均衡问题。 Cmax 为 AUV 在不更换自身携带能源的情况下能够行使的最大距离, C 为 AUV 所行驶的安全距离。 M j 表示第 j 个 AUV 所移动的距离。S 为一组 AUV 完成某一指定任务时所移动的平均距离。控制 AUV 负载均衡的参数 P 的 表达式为(3):
P
Mj S
CS 考虑到三种不同的情况,相邻神经元之间的欧式距离 Dij 可以归纳为: Ti R j 0Mj C Dij Ti R j (1 P) C M j Cmax M j Cmax - 66 http://www.ivypub.org/fes
(3)
(4)
第一种情况,AUV 自身携带的能源能够保证其自身能够遍历所分配的目标;第二种情况,由于 AUV 要 行驶的距离大于自身所运行的安全距离,所以会自动调用负载均衡函数来解决能量短缺问题;第三种情况, 当 AUV 需要行驶的距离大于自身能够行驶的最远距离的时候,该 AUV 与目标之间欧式距离判据被设定为
,表示该 AUV 不会被选定为获胜神经元。 1.1.2
邻域函数的确定及权值的更新
当确定获胜神经元之后,如何设计邻域函数,选出在邻域范围内受到获胜神经元影响的神经元便成为了 下一步的任务。邻域函数决定了输入神经元对获胜神经元及相邻神经元的影响力。获胜神经元受到的影响最 大,邻近的神经元所受到的影响力逐渐降低,邻域范围以外的神经元不受到影响,影响力的大小决定了在某 次迭代的过程中邻域神经元权重调整的大小。邻域函数的定义表达式如(5)所示:
e dm / g f (d m , g ) 0, 2
2
dm
(t )
(5)
others
很明显 0 f (dm , G) 1 ,其中 dm Rn Rd 为第 n 个神经元与获胜神经元之间的距离。 为邻域半径,
g (t ) (1 )t g0 , t 为迭代次数,迭代的次数增多,邻域函数的值减小,邻域中 AUV 的运动步长减小。 、 2
g 0 为常数,通过它们可以调整邻域中 AUV 的运动步长,从而控制计算精度与运算时间。 在确定获胜神经元与它的邻域函数之后,获胜神经元和相邻神经元向输入神经元移动,而其它的神经元 保持不动。在不考虑障碍物的情况下传统的 SOM 神经网络的权值更新过程由式(6)给出: Tl (t ) Dij Dmin R j (t 1) R j (t ) f (d j , G ) ( R j Ti ) else
(6)
式中加法为矢量相加,Dmin 给出了运算的终止条件,一旦 DijDmin,输出神经元的权值(AUV)会被置 为对应的目标的位置坐标,表明该 AUV(获胜输出神经元)已到达目标点(输入神经元)。 传统的 SOM 神经网络虽然能够完成任务分配与路径规划但是其存在两点不足:(1)没有考虑到环境中存 在障碍物的情况,(2)传统的 SOM 神经网络存在速度跳变问题。通过分析权值更新规则(6)的性质,当 AUV 和对应目标的距离很大时,AUV 会发生速度跳变。特别是 AUV 刚开始运动时,Rj-Ti 非常大,它完全超出了 AUV 的运动学约束,在现实中是不可能实现的。为了克服上述缺点,同时也为了使 AUV 的运动环境更加贴 近真实环境,本文在传统的 SOM 神经网络中嵌入生物启发神经动力学模型,根据环境信息的不同,生物启 发神经动力学模型更新 SOM 神经网络的权值从而可以达到避障的功能同时克服了速度跳变问题。
1.2 生物启发神经动力学模型与路径规划 它是将 AUV 水下工作空间的离散栅格看成一个相互连接的生物启发神经网络模型。基于以下两点生物 启发神经网络可以用于 AUV 三维环境下的安全避碰。首先,AUV 工作环境的三维直角坐标图可以利用三维 生物启发神经网络来表示。神经网络中的神经元与工作环境的三维位置坐标一一对应;然后根据生物启发神 经网络的输出活性值来进行 AUV 的路径规划。
a a
b
a
c j
c
a ( a, a ) (a, b) ( a, c)
i
b
b
b (b, a)
( b, c )
c
c (c, a) ( c, b ) ( c, c ) 图 2(a) 可信区域
图 2(b) 相邻位置栅格地图
- 67 http://www.ivypub.org/fes
为了更方便的阐述上述问题,利用二维生物启发神经网络和二维的工作环境来进行说明。二维的生物启 发神经网络原理图如图 2 所示,图中 r0 =2,由图可知第 i 个神经元的可信区域为半径为 r0 的圆,因此,在圆 内第 i 个神经元存在 8 个横向连接的神经元,图 2(a)中每个神经元与图 2(b)中的位置坐标一一对应,AUV 可 以运动到 8 个位置中的任何一个。对三维水下环境来说,原理完全一样,只是 AUV 相邻的可选位置是 26 个。 生物启发神经网络模型的基本内容就是设计神经网络的结构,网络中不同的输出活性值代表着不同的动 态环境。生物启发神经网络中第 i 个神经元的位置与水下工作环境的位置坐标相对应,由向量 qi 来表示。神 经元的激励输入来自目标物和互相连接的神经元传递累加所得,抑制输入仅来自障碍物。每个神经元和它周 围相邻的横向连接的神经元构成一个感受域,就是神经生理学中第 i 个神经元的可信区域。每个神经元只对 它可信区域内部的神经元具有刺激作用。神经网络中第 i 个神经元的动态活性值输出为[12]: k dxi Axi ( B xi )([ I i ] wij [ xij ] ) ( D xi )[ I i ] dt j 1
(7)
其中,k 为在第 i 可信区域内与其相邻的神经元数。第 i 个神经元的外部输入 I i 定义如下:
E , 目标点 I i E , 障碍物 0, 其他
(8)
式中 E 为一正常数。 Wij 为神经元 i 与相邻神经元 j 的连接权系数,定义为:
, f (| qi q j |) | qi q j | 0,
0 | qi q j | r0
(9)
| qi q j | r0
式中 qi q j 为状态空间上的向量 qi , q j 之间的欧式距离, 和 R 均为正常数。由于神经元之间的侧连接不 具有方向性,所以,连接权系数具有对称性,即 Wij W ji 。 若 Pc , Pp , Pn 为 AUV 的当前位置,前一步位置和下一步位置。当 AUV 选择下一步路径时会对其周围 的神经元活性值进行比较,活性值最大的位置将会成为 AUV 的下一步位置,依次重复,直到到达目标点为 止。具体表达式为:
Pn xPn max x j , j 1,2, , k
(10)
1.3 生物启发自组织神经网络算法 在 AUV 获得下一步的位置之后,为了克服传统 SOM 路径规划中的速度跳变问题,将生物启发神经动力 学模型嵌入到 SOM 神经网络中,结合生物启发神经动力学模型的优点来更新权值:
Dij Dmin Tl (t ) R j (t 1) R j (t ) f (d j , G) ( R j Pn ) else
(11)
式中 Pn ( xn , yn , zn ) 为 AUV 的下一步位置, R j (w jx , w jy , w jz ) 表示 AUV 的当前位置。由于 Pn 为生物启 发神经网络中 Pc 的相邻神经元,因此,( R j Pn )的值完全能够满足 AUV 的航行速度约束,不会产生 AUV 的 速度跳变。此外,由于 AUV 的下一位置 Pn 是由生物启发神经动力学模型获得的,对生物启发神经网络模型 来说,由于障碍物的抑制作用 AUV 会自动的规避障碍物,有关生物启发神经网络模型的移动机器人路径规 划算法的详细内容见参考文献[12]。因此,本文所提出的生物启发自组织神经网络 BISOM 算法既能自动避障, 又能克服传统 SOM 路径规划的速度跳变问题,它能够很好地适用于动态的水下环境。
2 仿真研究 为了验证本文所提出的算法的可行性,在 MATLAB2011a 软件环境下进行了仿真研究。选取参数为: - 68 http://www.ivypub.org/fes
=0.5;A=0.2;B=1;D=1;E=1; =0.3。 在三维水下障碍物环境下进行仿真研究,初始状态如图 3(a)所示,红色的点代表 AUV 的初始位置,蓝 色的点代表目标,黑色的规则的或不规则的方块代表环境中的障碍物。环境中共有 5 个 AUV,4 个目标随机 的分布在三维水下环境之中。AUV 的初始位置坐标为:R1(20,20,20),R2(50,30,30),R3(90,60,60),R4(60,60,30), R5(10,90,80),目标的初始位置坐标为:T1(10,40,20),T2(80,20,20),T3(80,80,70),T4(10,20,100),障碍物的 中心位置为:O1(10,22.5,22.5),O2(7.5,7.5,22.5),O3(62.5,30,22.5),O4(60,95,35)。 传统 SOM 神经网络通过计算每个 AUV(输出神经元)与目标点(输入神经元)的欧式距离的大小来选择选 择获胜神经元,所以 AUV 会朝着离自己最近的目标点运动。因此,R1 分配给 T1;R2 分配给 T2;R3 分配给 T3;R4 分配给 T4,而未被分配任务的 R5 则静止不动,当某一个 AUV 出现故障时就可以启动 R5 代替故障 的 AUV 继续完成任务,从而可以提高多 AUV 系统的可靠性。根据本文提出的 BISOM 生物启发自组织神经 网络算法,在三维水下环境中,由生物启发神经动力学模型可知在目标点出神经元的活性值最大,障碍物处 的活性值最小,AUV 每次都会运动到神经元活性值较高的地方,因此,AUV 可以绕开障碍物到达目标点。 仿真结果如图 3(b)所示。
100
100
T3
T3 80
80
R5
R5
R3
T4
T4
60
R3
60
O4
O4
40
40
R4
R4 20
R2
0 100
T1 80
O1
20
O3
0 100
R1
T1 60
R1 80 60
40
40
20
20 0
T2
O2
60 40
20
O3
100
80
40
O1
80
100
O2
60
R2
T2
20
0
0
图 3(a) 初始状态 图
0
3 (b) 静止状态任务分配与路径规划
图 3 静止障碍物 表 1 R2 的 SOM 和 BISOM 算法的移动速度比较 迭代次数
1
2
3
4
5
6
7
8
9
SOM
3.742
3.293
2.856
2.508
2.213
1.974
1.765
1.638
1.536
BISOM
0.829
0.765
0.731
0.689
0.652
0.625
0.613
0.587
0.564
此外,由于 AUV 每次总是朝着与当前位置相邻的下一个位置前进,( R j Pn )为一有效地适当的数值, 不会使 AUV 发生速度跳变。表 1 给出了 AUVR2 在路径规划过程中,SOM 和 BISOM 算法的每步的航行速 度比较,从中可以明显看出,传统 SOM 规划算法中 R2 航行速度存在跳变,完全超出 AUV 的速度约束(单 位速度 1) ,而 BISOM 均满足 AUV 的速度约束(单位速度 1) ,无任何速度跳变发生。
3 总结 本文将生物启发神经动力学模型嵌入到 SOM 神经网络中,利用生物启发神经动力学模型来更新 SOM 神 经网络中的权值,提出了一种新的生物启发自组织神经网络算法,并将此算法运用到了多 AUV 系统的任务 分配与路径规划中,仿真实验很好的验证了此算法的可行性。
REFERENCES [1]
O'Hara K J, Walker D B, Balch T R. Physical path planning using a pervasive embedded network[J]. IEEE Transactions on - 69 http://www.ivypub.org/fes
Robotics, 24(3): 741-746. 2008 [2]
Parker L E. Heterogeneous multi-robot cooperation[R]. Massachusetts Inst of Tech Cambridge Artificial Intelligence Lab, 1994
[3]
Akkiraju R, Keskinocak P, Murthy S, et al. An agent-based approach for scheduling multiple machines[J]. Applied Intelligence, 14(2): 135-144.2001
[4]
Turner R M. Intelligent control of autonomous underwater vehicles: IEEE International Conference on Systems, Man and Cybernetics. IEEE, 2: 1717-1722.1995
[5]
Zhu A, Yang S X. A neural network approach to dynamic task assignment of multi-robot[J]. IEEE Transactions on Neural Networks, 17(5): 1278-1287.2006
[6]
Sato M, Kanda A, Ishii K. A switching controller system for a wheeled mobile robot[J]. Journal of Bionic Engineering, 4(4): 281-289. 2007
[7]
Hendzel Z. Collision free path planning and control of wheeled mobile robot using Kohonen self-organizing map[J]. Technical Sciences, 53(1). 2005
[8]
Zhu A, Yang S X. An improved som-based approach to dynamic task assignment of multi-robots[C]. World Congress on Intelligent control and Automation. IEEE, 2168-2173. 2010
[9]
Chow B. Assigning closely spaced targets to multiple autonomous underwater vehicles[D]. Master Thesis, University of Waterloo, 2009
[10] Zhu DQ, Huang H, Yang S X. Dynamic task assignment and path planning of multi-AUV system based on an improved self-organizing map and velocity synthesis method in three-dimensional underwater workspace[J]. IEEE Transactions on Cybernetics, 43(2): 504-514. 2013 [11] Huang H, Zhu DQand DingF. Dynamic task assignment and path planning for multi-AUV system in variable ocean current environment[J], Journal of Intelligent & Robotic Systems. 74(2): 999-1012. 2014 [12] Luo C and YangS X. A Bio-inspired Neural Network for Real-Time Concurrent Map Building and Complete Coverage Robot Navigation in Unknown Environments[J], IEEE Transactions on Neural Networks, 19(7): 1279-1298. 2008
【作者简介】 1
陈飞飞(1988-) ,男,汉,硕士研究生,
2
朱大奇(1963-) ,男,汉,博士,教授,
研究方向:智能信息处理及应用。
研究方向:水下机器人与智能信息处理。
Email: gale367272997@163.com
Email: zdq367@aliyun.com
- 70 http://www.ivypub.org/fes