参考资料

1. 简介

蚁群算法(Ant Colony Algorithm, ACO) 于1991年首次提出,该算法模拟了自然界中蚂蚁的觅食行为。蚂蚁在寻找食物源时, 会在其经过的路径上释放一种信息素,并能够感知其它蚂蚁释放的信息素。 信息素浓度的大小表征路径的远近信息素浓度越高, 表示对应的路径距离越短。通常, 蚂蚁会以较大的概率优先选择信息素浓度较高的路径, 并释放一定量的信息素, 以增强该条路径上的信息素浓度, 这样,会形成一个正反馈。 最终, 蚂蚁能够找到一条从巢穴到食物源的最佳路径, 即距离最短。

2. 基本思想

  • 用蚂蚁的行走路径表示待优化问题的可行解, 整个蚂蚁群体的所有路径构成待优化问题的解空间
  • 路径较的蚂蚁释放的信息素量较, 随着时间的推进, 较短的路径上累积的信息素浓度逐渐增高, 选择该路径的蚂蚁个数也愈来愈多。
  • 最终, 整个蚂蚁会在正反馈的作用下集中到最佳的路径上, 此时对应的便是待优化问题的最优解。

3. 算法精讲

不失一般性,我们定义一个具有N个节点的有权图 G = ( N , A ) G=(N,A) G=(N,A),其中N表示节点集合 N = 1 , 2 , . . . , n N={1,2,...,n} N=1,2,...,n,A表示边, A = ( i , j ) ∣ i , j ∈ N A={(i,j)|i,j\in N} A=(i,j)i,jN。节点之间的距离(权重)设为 ( d i j ) n × n (d_{ij})_{n\times n} (dij)n×n目标函数即最小化起点到终点的距离之和。

  • 设整个蚂蚊群体中蚂蚊的数量为 m m m, 路径节点的数量为 n n n, 节点 i i i 与节点 j j j 之间的相互距离为 d i j ( i , j = 1 , 2 , … , n ) , t d_{i j}(i, j=1,2, \ldots, n), t dij(i,j=1,2,,n),t时刻节点 i i i 与节点 j j j 连接路径上的信息素浓度为 τ i j ( t ) \tau_{i j}(t) τij(t) 。初始时刻, 各个节点间连接路径上的信息素浓度相同, 不妨设为 τ i j ( 0 ) = τ 0 \tau_{i j}(0)=\tau_{0} τij(0)=τ0

  • 蚂蚁 k ( k = 1 , 2 , … , m ) k(k=1,2, \ldots, m) k(k=1,2,,m) 根据各个节点间连接路径上的信息素浓度决定其下一个访问节点, 设 P i j k ( t ) P_{i j}^{k}(t) Pijk(t) 表示 t t t 时刻蚂蚊 k k k 从节点 i i i 转移到节点 j j j 的概率, 其计算公式如下:
    P i j k = { [ τ i j ( t ) ] α ⋅ [ η i j ( t ) ] β ∑ s ∈  allow  k [ τ i s ( t ) ] α ⋅ [ η i s ( t ) ] β s ∈  allow  k 0 s ∉  allow  k (1) \tag{1} P_{i j}^{k}= \begin{cases}\frac{\left[\tau_{i j}(t)\right]^{\alpha} \cdot\left[\eta_{i j}(t)\right]^{\beta}}{\sum_{s \in \text { allow }_{k}}\left[\tau_{i s}(t)\right]^{\alpha} \cdot\left[\eta_{i s}(t)\right]^{\beta}} & s \in \text { allow }_{k} \\ 0 & s \notin \text { allow }_{k}\end{cases} Pijk=s allow k[τis(t)]α[ηis(t)]β[τij(t)]α[ηij(t)]β0s allow ks/ allow k(1)

    其中,

    • η i j ( t ) \eta_{i j}(t) ηij(t)启发函数, η i j ( t ) = 1 / d i j \eta_{i j}(t)=1 / d_{i j} ηij(t)=1/dij, 表示蚂蚊从节点 i i i 转移到节点 j j j 的期望程度,
    • a l l o w k ( k = 1 , 2 , … , m ) allow_{k}(k=1,2, \ldots, m) allowk(k=1,2,,m) 为蚂蚁 k k k待访问节点的集合。开始时, a l l o w k allow_{k} allowk中有(n-1)个元素,即包括除了蚂蚁 k k k出发节点的其它所有节点。随着时间的推进, allow k _{k} k 中的元素不断减少, 直至为空, 即表示所有的节点均访问完毕。
    • α \alpha α信息素重要程度因子, 其值越大, 蚂蚁选择之前走过的路径可能性就越大,搜索路径的随机性减弱, 其值越小,蚁群搜索范围就会减少,容易陷入局部最优。一般取值范围为 [ 0 , 5 ] [0,5] [0,5]
    • β \beta β启发函数重要程度因子, 其值越大, 表示启发函数在转移中的作用越大, 即蚂蚊会以较大的摡率转移到距离短的节点,蚁群就越容易选择局部较短路径,这时算法的收敛速度是加快了,但是随机性却不高,容易得到局部的相对最优。一般取值范围为 [ 0 , 5 ] [0,5] [0,5]
  • 计算完节点间的转移概率后,采用与遗传算法中一样的轮盘赌方法选择下一个待访问的节点。

    依据轮盘赌法来选择下一个待访问的节点, 而不是直接按概率大小选择,是因为这样可以扩大搜索范围,进而寻找全局最优,避免陷入局部最优。

    首先计算每个个体的累积概率 q j q_{j} qj ,如下式:
    q j = ∑ j = 1 l P i j k (2) \tag{2} q_{j}=\sum_{j=1}^{l} P_{i j}^{k} qj=j=1lPijk(2)
    q j q_{j} qj 相当于转盘上的跨度,跨度越大的区域越容易选到, l l l代表下一步可选路径的数量。
    之后随机生成一个 ( 0 , 1 ) (0 , 1) (01) 的小数 r \mathrm{r} r,比较所有 q j q_{j} qj r \mathrm{r} r 的大小,选出大于 r r r 的最小的那个 q j , q_{j} , qj q j q_{j} qj 对应的索引 j j j即为第 k \mathrm{k} k 只蚂蚁在第 i i i条路径时下一步要选择的目标点。
    r = rand ⁡ ( 0 , 1 ) j = index ⁡ { min ⁡ [ q j > r ] } (3) \tag{3} \begin{gathered} r=\operatorname{rand}(0,1) \\ j=\operatorname{index}\left\{\min \left[q_{j}>r\right]\right\} \end{gathered} r=rand(0,1)j=index{min[qj>r]}(3)

  • 在蚂蚁释放信息素的同时,各个节点间连接路径上的信息素逐渐消失,设参数 ρ ( 0 < ρ < 1 , 一 般 取 值 为 0.1 \rho(0<\rho<1,一般取值为0.1 ρ(0<ρ<10.1~ 0.99 ) 0.99) 0.99)表示 信息素的挥发程度。当所有的蚂蚁完成一次循环后,各个节点间链接路径上的信息素浓度需进行更新,计算公式为
    { τ i j ( t + 1 ) = ( 1 − ρ ) τ i j ( t ) + Δ τ i j Δ τ i j = ∑ k = 1 n Δ τ i j k (4) \tag{4} \left\{\begin{array}{l} \tau_{i j}(t+1)=(1-\rho) \tau_{i j}(t)+\Delta \tau_{i j} \\ \Delta \tau_{i j}=\sum_{k=1}^{n} \Delta \tau_{i j}^{k} \end{array}\right. {τij(t+1)=(1ρ)τij(t)+ΔτijΔτij=k=1nΔτijk(4)
    其中, Δ τ i j k \Delta \tau_{i j}^{k} Δτijk表示第 k k k只蚂蚁在节点 i i i与节点 j j j连接路径上释放的信息素浓度; Δ τ i j \Delta \tau_{i j} Δτij表示所有蚂蚁在节点 i i i与节点 j j j连接路径上释放的信息素浓度之和。

  • 蚂蚁信息素更新的模型包括蚁周模型(Ant-Cycle模型)、蚁量模型(Ant-Quantity模型)、蚁密模型(Ant-Density模型)等。

    区别:

    1. 蚁周模型利用的是全局信息,即蚂蚁完成一个循环后更新所有路径上的信息素;

    2. 蚁量和蚁密模型利用的是局部信息,即蚂蚁完成一步后更新路径上的信息素。

    信息素增量不同信息素更新时刻不同信息素更新形式不同
    蚁周模型信息素增量为 Q / L k Q/L_k Q/Lk,它只与搜索路线有关与具体的路径(i,j)无关在第k只蚂蚁完成一次路径搜索后,对线路上所有路径进行信息素的更新信息素增量与本次搜索的整体线路有关,因此属于全局信息更新
    蚁量模型信息素增量为 Q / d i j Q/d_{ij} Q/dij,与路径(i,j)的长度有关在蚁群前进过程中进行,蚂蚁每完成一步移动后更新该路径上的信息素利用蚂蚁所走路径上的信息进行更新,因此属于局部信息更新
    蚁密模型信息素增量为固定值Q在蚁群前进过程中进行,蚂蚁每完成一步移动后更新该路径上的信息素利用蚂蚁所走路径上的信息进行更新,因此属于局部信息更新

    蚁周模型的 Δ τ i j k \Delta \tau_{i j}^{k} Δτijk计算公式如下
    Δ τ i j k = { Q / L k ,  第  k  只蚂蚁从城市  i  访问城市  j 0 ,  其他  (5) \tag{5} \Delta \tau_{i j}^{k}= \begin{cases}Q / L_{k}, & \text { 第 } \mathrm{k} \text { 只蚂蚁从城市 } \mathrm{i} \text { 访问城市 } \mathrm{j} \\ 0, & \text { 其他 }\end{cases} Δτijk={Q/Lk,0,  k 只蚂蚁从城市 i 访问城市 j 其他 (5)
    式中 Q Q Q为信息素常数(一个正的常数),表示蚂蚁循环一次所释放的信息素总量。 L k L_{k} Lk为第k只蚂蚁经过路径的总长度。

4. 算法步骤

  1. 对相关参数进行初始化,如蚁群规模(蚂蚁数量) m m m、信息素重要程度因子 α \alpha α、启发函数重要程度因子 β \beta β、信息素挥发因子 ρ \rho ρ、信息素常数 Q Q Q、最大迭代次数 i t e r m a x itermax itermax

  2. 构建解空间,将各个蚂蚁随机地置于不同的出发点,为每只蚂蚁确定当前候选道路集

  3. 更新信息素计算每个蚂蚁经过路径长度 L k ( k = 1 , 2 , … , m ) L_k(k=1,2,…,m) Lk(k=1,2,m),记录当前迭代次数中的最优解(最短路径)。同时,对各个节点连接路径上信息素浓度进行更新。

  4. 判断是否终止若 i t e r < i t e r m a x iter<itermax iter<itermax,则令 i t e r = i t e r + 1 iter=iter+1 iter=iter+1,清空蚂蚁经过路径的记录表,并返回步骤2;否则,终止计算,输出最优解。

5. python实现

使用蚁群算法解决旅行商问题(TSP),代码来自博客

import numpy as np
import matplotlib.pyplot as plt


# 城市坐标(52个城市)
coordinates = np.array([[565.0,575.0],[25.0,185.0],[345.0,750.0],[945.0,685.0],[845.0,655.0],
            [880.0,660.0],[25.0,230.0],[525.0,1000.0],[580.0,1175.0],[650.0,1130.0],
            [1605.0,620.0],[1220.0,580.0],[1465.0,200.0],[1530.0,  5.0],[845.0,680.0],
            [725.0,370.0],[145.0,665.0],[415.0,635.0],[510.0,875.0],[560.0,365.0],
            [300.0,465.0],[520.0,585.0],[480.0,415.0],[835.0,625.0],[975.0,580.0],
            [1215.0,245.0],[1320.0,315.0],[1250.0,400.0],[660.0,180.0],[410.0,250.0],
            [420.0,555.0],[575.0,665.0],[1150.0,1160.0],[700.0,580.0],[685.0,595.0],
            [685.0,610.0],[770.0,610.0],[795.0,645.0],[720.0,635.0],[760.0,650.0],
            [475.0,960.0],[95.0,260.0],[875.0,920.0],[700.0,500.0],[555.0,815.0],
            [830.0,485.0],[1170.0, 65.0],[830.0,610.0],[605.0,625.0],[595.0,360.0],
            [1340.0,725.0],[1740.0,245.0]])

def getdistmat(coordinates):
    num = coordinates.shape[0]
    distmat = np.zeros((52, 52))
    for i in range(num):
        for j in range(i, num):
            distmat[i][j] = distmat[j][i] = np.linalg.norm(
                coordinates[i] - coordinates[j])
    return distmat


# #//初始化
distmat = getdistmat(coordinates)
numant = 45 ##// 蚂蚁个数
numcity = coordinates.shape[0] ##// 城市个数
alpha = 1 ##// 信息素重要程度因子
beta = 5 ##// 启发函数重要程度因子
rho = 0.1 ##// 信息素的挥发速度
Q = 1 ##//信息素释放总量
iter = 0##//循环次数
itermax = 200#//循环最大值
etatable = 1.0 / (distmat + np.diag([1e10] * numcity)) #// 启发函数矩阵,表示蚂蚁从城市i转移到矩阵j的期望程度
pheromonetable = np.ones((numcity, numcity)) #// 信息素矩阵
pathtable = np.zeros((numant, numcity)).astype(int) #// 路径记录表
distmat = getdistmat(coordinates) #// 城市的距离矩阵
lengthaver = np.zeros(itermax) #// 各代路径的平均长度
lengthbest = np.zeros(itermax) #// 各代及其之前遇到的最佳路径长度
pathbest = np.zeros((itermax, numcity)) #// 各代及其之前遇到的最佳路径长度
#//核心点-循环迭代
while iter < itermax:
    #// 随机产生各个蚂蚁的起点城市
    if numant <= numcity:
        #// 城市数比蚂蚁数多
        pathtable[:, 0] = np.random.permutation(range(0, numcity))[:numant]
    else:
        #// 蚂蚁数比城市数多,需要补足
        pathtable[:numcity, 0] = np.random.permutation(range(0, numcity))[:]
        pathtable[numcity:, 0] = np.random.permutation(range(0, numcity))[
            :numant - numcity]
    length = np.zeros(numant)  # 计算各个蚂蚁的路径距离
    for i in range(numant):
        visiting = pathtable[i, 0]  # 当前所在的城市
        unvisited = set(range(numcity))  # 未访问的城市,以集合的形式存储{}
        unvisited.remove(visiting)  # 删除元素;利用集合的remove方法删除存储的数据内容
        for j in range(1, numcity):  # 循环numcity-1次,访问剩余的numcity-1个城市
            # 每次用轮盘法选择下一个要访问的城市
            listunvisited = list(unvisited)
            probtrans = np.zeros(len(listunvisited))
            for k in range(len(listunvisited)):
                probtrans[k] = np.power(pheromonetable[visiting][listunvisited[k]], alpha) \
                    * np.power(etatable[visiting][listunvisited[k]], beta)
            cumsumprobtrans = (probtrans / sum(probtrans)).cumsum()
            cumsumprobtrans -= np.random.rand()
            k = listunvisited[(np.where(cumsumprobtrans > 0)[0])[0]]
            # 元素的提取(也就是下一轮选的城市)
            pathtable[i, j] = k  # 添加到路径表中(也就是蚂蚁走过的路径)
            unvisited.remove(k)  # 然后在为访问城市set中remove()删除掉该城市
            length[i] += distmat[visiting][k]
            visiting = k
        # 蚂蚁的路径距离包括最后一个城市和第一个城市的距离
        length[i] += distmat[visiting][pathtable[i, 0]]
        # 包含所有蚂蚁的一个迭代结束后,统计本次迭代的若干统计参数
    lengthaver[iter] = length.mean()
    if iter == 0:
        lengthbest[iter] = length.min()
        pathbest[iter] = pathtable[length.argmin()].copy()
    else:
        if length.min() > lengthbest[iter - 1]:
            lengthbest[iter] = lengthbest[iter - 1]
            pathbest[iter] = pathbest[iter - 1].copy()
        else:
            lengthbest[iter] = length.min()
            pathbest[iter] = pathtable[length.argmin()].copy()
    # 更新信息素
    changepheromonetable = np.zeros((numcity, numcity))
    for i in range(numant):
        for j in range(numcity - 1):
            changepheromonetable[pathtable[i, j]][pathtable[i, j + 1]] += Q / distmat[pathtable[i, j]][
                pathtable[i, j + 1]]  # 计算信息素增量
        changepheromonetable[pathtable[i, j + 1]][pathtable[i, 0]] += Q / distmat[pathtable[i, j + 1]][pathtable[i, 0]]
    pheromonetable = (1 - rho) * pheromonetable + \
        changepheromonetable  # 计算信息素公式
    if iter%30==0:
        print("iter(迭代次数):", iter)
    iter += 1  # 迭代次数指示器+1

# 做出平均路径长度和最优路径长度
fig, axes = plt.subplots(nrows=2, ncols=1, figsize=(12, 10))
axes[0].plot(lengthaver, 'k', marker=u'')
axes[0].set_title('Average Length')
axes[0].set_xlabel(u'iteration')

axes[1].plot(lengthbest, 'k', marker=u'')
axes[1].set_title('Best Length')
axes[1].set_xlabel(u'iteration')
fig.savefig('average_best.png', dpi=500, bbox_inches='tight')
plt.show()

# 作出找到的最优路径图
bestpath = pathbest[-1]
plt.plot(coordinates[:, 0], coordinates[:, 1], 'r.', marker=u'$\cdot$')
plt.xlim([-100, 2000])
plt.ylim([-100, 1500])

for i in range(numcity - 1):
    m = int(bestpath[i])
    n = int(bestpath[i + 1])
    plt.plot([coordinates[m][0], coordinates[n][0]], [
             coordinates[m][1], coordinates[n][1]], 'k')
plt.plot([coordinates[int(bestpath[0])][0], coordinates[int(n)][0]],
         [coordinates[int(bestpath[0])][1], coordinates[int(n)][1]], 'b')
ax = plt.gca()
ax.set_title("Best Path")
ax.set_xlabel('X axis')
ax.set_ylabel('Y_axis')

plt.savefig('best path.png', dpi=500, bbox_inches='tight')
plt.show()

Logo

学大模型,用大模型上飞桨星河社区!每天8点V100G算力免费领!免费领取ERNIE 4.0 100w Token >>>

更多推荐