基于聚类与引力斥力优化的选址算法

在众多实际场景中，诸如消防设施选址、基站布局规划以及充电桩站点部署等，都面临着如何利用最少的资源，实现对所有目标对象全面覆盖的难题。为有效解决这类问题，本文提出一种全新的组合算法模型 ------ 基于聚类与引力斥力优化的选址算法。

算法简介

1. K - means 聚类初始化

目的：快速生成初始中心点，初步划分数据分布。
方法：通过 K - means 算法将二维点聚类为 k 组，每组中心作为初始候选点。结合肘部法则或轮廓系数确定最优 k，并使用 K - means++ 优化初始中心选择。

2. 贪心算法补充覆盖

目的：确保所有数据点被覆盖，补充初始聚类未覆盖的区域。
方法：设置中心点覆盖半径 r，标记未被覆盖的点。每次从未覆盖点中选择能覆盖最多未覆盖点的点作为新中心点，直至所有点被覆盖。

3. 引力搜索算法（GSA）优化

目的：动态调整中心点位置，剔除冗余点，实现最少中心点全覆盖。
方法：
引力与斥力：中心点受未覆盖点引力（向数据移动）和其他中心点斥力（避免密集）。
合力驱动：根据引力和斥力的矢量和移动中心点，验证覆盖后更新位置。
剪枝操作：定期尝试删除冗余中心点，确保覆盖性的同时最小化中心点数量。

4. 组合算法优势

高效性：K - means 快速聚类，贪心算法快速覆盖，GSA 精细调优。
鲁棒性：结合几何覆盖与物理启发式优化，适应复杂分布。
可解释性：每一步逻辑清晰，便于根据场景调整参数或替换算法。

算法步骤与公式

第一步：K - means 聚类

1. 初始聚类中心

使用算法初始化聚类中心，选择距离已有中心最远的点作为新中心：

2. 聚类分配与中心更新

计算每个点到中心的欧氏距离并分配：

重新计算中心坐标：

其中Sj是第j个聚类的数据点集合。

第二步：贪心算法覆盖未被覆盖点

1. 覆盖条件

点x被中心cj覆盖当且仅当：

2. 选择最优新中心

每次选择覆盖最多未覆盖点的点：

其中I(·)是指示函数。

第三步：引力搜索算法（GSA）优化中心点

1. 质量定义

中心点ci的质量mi由覆盖点数决定：

2. 引力计算

数据点x对中心ci的引力：

其中是时变引力常数。

3. 斥力计算

其他中心cj对ci的斥力：

4. 合力与位置更新

总合力：

位置更新：

其中 λ是方向系数，step_size是步长。

5. 中心点剔除条件

若剔除中心ci后所有点仍被覆盖：

代码

python代码

复制代码

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans

# 第一步：K - means 聚类
# 随机生成一些示例数据
points = np.random.rand(100, 2)
# 设置聚类中心数
k = 10
# 执行 K - means 聚类
kmeans = KMeans(n_clusters=k, random_state=42)
idx = kmeans.fit_predict(points)
centers = kmeans.cluster_centers_

# 第二步：贪心算法覆盖未被覆盖点
# 设置覆盖半径
r = 0.2
# 标记未被覆盖的点
covered = np.zeros(points.shape[0], dtype=bool)
for center in centers:
    distances = np.linalg.norm(points - center, axis=1)
    covered[distances <= r] = True
uncovered_points = points[~covered]

while len(uncovered_points) > 0:
    max_coverage = 0
    best_point = None
    for point in uncovered_points:
        distances = np.linalg.norm(points - point, axis=1)
        current_coverage = np.sum((distances <= r) & ~covered)
        if current_coverage > max_coverage:
            max_coverage = current_coverage
            best_point = point
    centers = np.vstack((centers, best_point))
    distances = np.linalg.norm(points - best_point, axis=1)
    covered[distances <= r] = True
    uncovered_points = points[~covered]

# 第三步：引力搜索算法（GSA）优化中心点
# 设置参数
T = 100  # 迭代次数
G0 = 1  # 引力常数
alpha = 2  # 质量衰减系数

# 初始化质量
masses = np.zeros(centers.shape[0])
for i in range(centers.shape[0]):
    distances = np.linalg.norm(points - centers[i], axis=1)
    masses[i] = np.sum(distances <= r)

for t in range(T):
    G = G0 * np.exp(-alpha * t / T)
    for i in range(centers.shape[0]):
        force = np.zeros(2)
        # 计算斥力
        for j in range(centers.shape[0]):
            if i != j:
                distance = np.linalg.norm(centers[i] - centers[j])
                if distance > 0:
                    force += G * masses[j] * (centers[i] - centers[j]) / distance
        # 计算引力
        for j in range(points.shape[0]):
            distance = np.linalg.norm(centers[i] - points[j])
            if 0 < distance <= 2 * r:
                force -= G * (centers[i] - points[j]) / distance
        # 移动中心点（先假设移动）
        new_center = centers[i] + force
        # 检查移动后的中心点是否能覆盖所有数据点
        temp_centers = centers.copy()
        temp_centers[i] = new_center
        temp_covered = np.zeros(points.shape[0], dtype=bool)
        for center in temp_centers:
            distances = np.linalg.norm(points - center, axis=1)
            temp_covered[distances <= r] = True
        if np.all(temp_covered):
            centers[i] = new_center
    # 尝试剔除冗余的中心点
    for i in range(centers.shape[0]):
        temp_centers = np.delete(centers, i, axis=0)
        temp_covered = np.zeros(points.shape[0], dtype=bool)
        for center in temp_centers:
            distances = np.linalg.norm(points - center, axis=1)
            temp_covered[distances <= r] = True
        if np.all(temp_covered):
            centers = temp_centers
            masses = np.delete(masses, i)
            break

# 输出最终的中心点
print('最终的中心点坐标：')
print(centers)

# 可视化结果
plt.figure()
plt.scatter(points[:, 0], points[:, 1], s=20, c='b', marker='s', edgecolors='b')
plt.scatter(centers[:, 0], centers[:, 1], s=20, c='r', marker='^', edgecolors='r')
# 为每个中心点绘制覆盖半径的透明圆
theta = np.linspace(0, 2 * np.pi, 100)
for center in centers:
    x = center[0] + r * np.cos(theta)
    y = center[1] + r * np.sin(theta)
    plt.fill(x, y, 'r', alpha=0.1, edgecolor='r')
plt.xlabel('X')
plt.ylabel('Y')
plt.show()

结果图

matlab代码

复制代码

clear
clc
close all

% 第一步：K - means 聚类
% 假设我们有一组二维点数据 points
% 随机生成一些示例数据
points = rand(100, 2); 
% 设置聚类中心数
k = 10; 
% 执行 K - means 聚类
[idx, centers] = kmeans(points, k);

% 第二步：贪心算法覆盖未被覆盖点
% 设置覆盖半径
r = 0.2; 
% 标记未被覆盖的点
covered = false(size(points, 1), 1);
for i = 1:size(centers, 1)
    distances = sqrt(sum((points - repmat(centers(i, :), size(points, 1), 1)).^2, 2));
    covered(distances <= r) = true;
end
uncovered_points = points(~covered, :);

while ~isempty(uncovered_points)
    max_coverage = 0;
    best_point = [];
    for i = 1:size(uncovered_points, 1)
        distances = sqrt(sum((points - repmat(uncovered_points(i, :), size(points, 1), 1)).^2, 2));
        current_coverage = sum(distances <= r & ~covered);
        if current_coverage > max_coverage
            max_coverage = current_coverage;
            best_point = uncovered_points(i, :);
        end
    end
    centers = [centers; best_point];
    distances = sqrt(sum((points - repmat(best_point, size(points, 1), 1)).^2, 2));
    covered(distances <= r) = true;
    uncovered_points = points(~covered, :);
end

% 第三步：引力搜索算法（GSA）优化中心点
% 设置参数
T = 100; % 迭代次数
G0 = 1; % 引力常数
alpha = 2; % 质量衰减系数

% 初始化质量
masses = zeros(size(centers, 1), 1);
for i = 1:size(centers, 1)
    distances = sqrt(sum((points - repmat(centers(i, :), size(points, 1), 1)).^2, 2));
    masses(i) = sum(distances <= r);
end

for t = 1:T
    G = G0 * exp(-alpha * t / T);
    for i = 1:size(centers, 1)
        force = zeros(1, 2);
        % 计算斥力
        for j = 1:size(centers, 1)
            if i ~= j
                distance = sqrt(sum((centers(i, :) - centers(j, :)).^2));
                if distance > 0
                    force = force + G * masses(j) * (centers(i, :) - centers(j, :)) / distance;
                end
            end
        end
        % 计算引力
        for j = 1:size(points, 1)
            distance = sqrt(sum((centers(i, :) - points(j, :)).^2));
            if distance <= 2*r && distance > 0
                force = force - G * (centers(i, :) - points(j, :)) / distance;
            end
        end
        % 移动中心点（先假设移动）
        new_center = centers(i, :) + force;
        % 检查移动后的中心点是否能覆盖所有数据点
        temp_centers = centers;
        temp_centers(i, :) = new_center;
        temp_covered = false(size(points, 1), 1);
        for j = 1:size(temp_centers, 1)
            distances = sqrt(sum((points - repmat(temp_centers(j, :), size(points, 1), 1)).^2, 2));
            temp_covered(distances <= r) = true;
        end
        if all(temp_covered)
            centers(i, :) = new_center;
        end
    end
    % 尝试剔除冗余的中心点
    for i = 1:size(centers, 1)
        temp_centers = centers;
        temp_centers(i, :) = [];
        temp_covered = false(size(points, 1), 1);
        for j = 1:size(temp_centers, 1)
            distances = sqrt(sum((points - repmat(temp_centers(j, :), size(points, 1), 1)).^2, 2));
            temp_covered(distances <= r) = true;
        end
        if all(temp_covered)
            centers(i, :) = [];
            masses(i) = [];
            break;
        end
    end
end

% 输出最终的中心点
disp('最终的中心点坐标：');
disp(centers);

% 可视化结果
figure;
scatter(points(:, 1), points(:, 2), 20, 'bs', 'filled');
hold on;
scatter(centers(:, 1), centers(:, 2), 20,'r^', 'filled');
% 为每个中心点绘制覆盖半径的透明圆
theta = linspace(0, 2*pi, 100);
for i = 1:size(centers, 1)
    x = centers(i, 1) + r * cos(theta);
    y = centers(i, 2) + r * sin(theta);
    h = fill(x, y, 'r');
    set(h, 'FaceAlpha', 0.1); % 设置透明度为 0.1
    set(h, 'EdgeColor', 'r');
end
xlabel('X')
ylabel('Y')
title('基于聚类算法的选址结果')
legend('数据点', '中心点', '覆盖区域', 'Location', 'northeast')