现代优化算法 之 禁忌搜索算法

首先给大家推荐一下我老师大神的人工智能教学网站。教学不仅零基础,通俗易懂,而且非常风趣幽默,还时不时有内涵黄段子!点这里可以跳转到网站

这次是首次接触这个算法,看了一些资料,总结一下。

禁忌搜索算法简介

禁忌搜索算法是组合优化算法的一种,是局部搜索算法的扩展。禁忌搜索算法是人工智能在组合优化算法中的一个成功应用。禁忌搜索算法的特点是采用了禁忌技术。所谓禁忌就是禁止重复前面的工作。禁忌搜索算法用一个禁忌表记录下已经到达过的局部最优点,在下一次搜索中,利用禁忌表中的信息不再或有选择地搜索这些点。

禁忌搜索算法实现的技术问题是算法的关键。禁忌搜索算法涉及侯选集合、禁忌对象、评价函数、特赦规则、记忆频率信息等概念。

邻域

在组合优化中,距离的概念通常不再适用,但是在一点附近搜索另一个下降的点仍然是组合优化数值求解的基本思想。因此,需要重新定义邻域的概念。

一个组合优化问题可用三参数表示,其中表示决策变量的定义域,表示可行解区域, 中的任何一个元素称为该问题的可行解, 表示目标函数。满足
的可行解称为该问题的最优解。 定义 1 对于组合优化问题,上的一个映射:

称为一个邻域映射,其中表示的所有子集组成的集合, 称为 的邻域,
称为 的一个邻居。

侯选集合

侯选集合由邻域中的邻居组成。常规的方法是从邻域中选择若干个目标值或评价值最佳的邻居入选。

禁忌对象和禁忌长度

禁忌表中的两个主要指标是禁忌对象和禁忌长度。禁忌算法中,由于我们要避免一些操作的重复进行,就要将一些元素放到禁忌表中以禁止对这些元素进行操作,这些元素就是我们指的禁忌对象。禁忌长度是被禁对象不允许选取的迭代次数。一般是给被禁对象一个数(禁忌长度) ,要求对象 在 步迭代内被禁,在禁忌表中采用记忆,每迭代一步,该项指标做运算,直到时解禁。于是,我们可将所有元素分成两类,被禁元素和自由元素。禁忌长度 的选取可以有多种方法,例如,或,其中为邻域中邻居的个数;这种规则容易在算法中实现。

评价函数

评价函数是侯选集合元素选取的一个评价公式,侯选集合的元素通过评价函数值来选取。以目标函数作为评价函数是比较容易理解的。目标值是一个非常直观的指标,但有时为了方便或易于计算,会采用其他函数来取代目标函数。

特赦规则

在禁忌搜索算法的迭代过程中,会出现侯选集中的全部对象都被禁忌,或有一对象被禁,但若解禁则其目标值将有非常大的下降情况。在这样的情况下,为了达到全局最优,我们会让一些禁忌对象重新可选。这种方法称为特赦,相应的规则称为特赦规则。

记忆频率信息

在计算的过程中,记忆一些信息对解决问题是有利的。如一个最好的目标值出现的频率很高,这使我们有理由推测:现有参数的算法可能无法再得到更好的解。根据解决问题的需要,我们可以记忆解集合、被禁对象组、目标值集合等的出现频率。

频率信息有助于进一步加强禁忌搜索的效率。我们可以根据频率信息动态控制禁忌的长度。一个最佳的目标值出现的频率很高,有理由终止计算而将此值认为是最优值。

模型及求解

我们用禁忌搜索算法研究如下的两个问题:
(1)研究前几篇现代优化算法解决的问题。
(2)我方有三个基地,经度、纬度分别为,,。假设我方所有无人侦察机的速度都为 公里/小时。三个基地各派出一架飞机侦察敌方目标,怎样划分任务,才能使时间最短,且任务比较均衡。

问题(1)的求解

求解的禁忌搜索算法描述如下:

(1)解空间

解空间 可表为的所有固定起点和终点的循环排列集合,即
。其中每一个循环排列表示侦察 个目标的一个回路, = 表示第次侦察 点。

(2)目标函数

目标函数为侦察所有目标的路径长度。我们要求

(3)候选集合

定义2 任选序号交换与之间的顺序,此时的新路径为:

称为原路径二邻域的一个邻居。

定义 3 任选序号 和 ,将 和之间的路径插到 之后,(设)对应的新路径为:

称为原路径三邻域的一个邻居。

如果要考虑当前解的全部二邻域(或三邻域)的邻居,将面临着太大的工作量。因此我们用随机选取的方法每次选取50 个邻居组成的集合作为侯选集合。而将省下的时间作更多次搜索,这样做同样可以保证较高的精确度,同时可以大大提高算法的效率。

(4)禁忌长度及禁忌对象

对 于 上述定义的二邻域中的邻居总数为, 我们的禁忌长度取为

我们把禁忌表设计成一个循环队列,初始化禁忌表 。从候选集合中选出一个向量,如果 ,并且 不满,则把向量添加到禁忌表中;如果已满,则最早进入禁忌表的向量出列,向量进入到出列的位置。

(5)评价函数(类似启发式搜索的那种,大家有兴趣可以百度一下算法,对评估函数的设计会更加理解)

可以用目标函数作为评价函数,但是这样每选取一个新的路径都得去计算总时间,计算量比较大。对于上述二邻域中的邻居作为侯选集合,每一个新路径中只有两条边发生了变化,因此将目标函数的差值作为评价函数可以极大地提高算法的效率。评价函数取为

禁忌搜索算法的流程如下:

STEP1:
选定一个初始解及给以禁忌表;
STEP2:
若满足停止条件,停止计算;否则,在的邻域中选出满足禁忌要求的侯选集Can_N( ),在Can _ N( ) 中选一个评价值最佳的解,更新禁忌表 ,重复 STEP2。

利用 Matlab 程序求得,我们的巡航时间大约在41 小时左右,其中的一个巡航路径如下图所示

这里写图片描述

问题(2)的求解

对于这个问题,我们的基本想法是,先根据敌方基地的分布特点将敌方的基地大体划分在三个区域之内,并使三架侦察机分别对这三个区域的敌军基地进行侦察,求取各自的最短时间。然后对任务不均衡区域之中的点做适当调整。

我们解决问题的步骤如下:

(1)划分子图。要达到比较均衡,应使每架飞机的巡航时间基本相同,由于敌方目标的分布较均匀,可以将敌方目标的地理位置图分成面积基本相同的三部分。如过点以斜率作一条斜线,过点以斜率作一个斜率,把基地所在的地区划分成三部分。

这里写图片描述

(2)再对每个子图 分别运用禁忌搜索算法求得其最短侦察路径,和最短侦察时间 。
(3)均衡任务。定义均衡率

若接近于,则上面划分的任务就可以接受。否则的话,根据的大小用局部搜索算法,调整的斜率,从而调整各分区内点的个数,直至任务达到均衡。

最后计算结果如下
两直线的斜率分别为。
均衡率
三架飞机侦察完所有目标所用的时间分别为
小时,小时,小时

点这里可以跳转到人工智能网站

发表评论