数据科学每日总结--Day14--数据挖掘

数据挖掘

旅行商问题
  • 描述:给定一组城市(白点)及两两之间的距离,要求寻找一条最短的闭合路线,恰好访问每个城市一次并回到起点

  • 决策变量:城市访问顺序(一个排列)

  • 目标函数:总路程最小化

  • 约束:每个城市访问一次;起点=终点;通常为完全图或稀疏图

  • 复杂度:NP-难。n 个城市的哈密顿回路数约为 (n−1)!/2(对称TSP、忽略起点与方向),因此枚举不可行

  • 求解思路:

    • 精确算法:分支定界、动态规划(Held--Karp O(n^2 2^n))、割平面/整数规划(Concorde)。

    • 近似与启发式:最近邻、2-opt/3-opt、Lin--Kernighan、元启发式(GA/ACO/SA/PSO/DE、TabuSearch、VNS)以及混合局部搜索

  • 实物建议:

    • 先用构造法得可行初解,再用k-opt细化

    • 利用距离度量的三角不等式可加速剪枝

    • 对大规模实例,采用分区/分层或岛模型并行搜索

背包问题
  • 描述:给定一组物品,每个物品有价值 v_i和重量/体积 w_i,一只背包有容量上限 W。目标是在不超容量的前提下,选择一部分物品,使总价值最大

  • 决策变量:每个物品是否被选择(0-1变量,或选取数量,取决于问题类型)

  • 目标函数:总价值最小化

  • 约束:所有被选物品的总重量不超过背包容量;每个物品最多选一次(0-1背包);或可选多次(完全背包);或有多个背包(多维/多重背包)

  • 复杂度:NP-难。对于n个物品和容量W,0-1背包的状态空间为2ⁿ,枚举不可行。动态规划时间复杂度O(nW),但W较大时仍不可行。

  • 求解思路:

    • 精确算法:动态规划(0-1背包、完全背包)、分支定界、整数规划。

    • 近似与启发式:贪心法(适用于分数背包)、遗传算法(GA)、模拟退火(SA)、蚁群算法(ACO)、粒子群优化(PSO)、禁忌搜索(TabuSearch)、局部搜索等

  • 实物建议:

    • 对于容量较小或物品数量较少,优先用动态规划或分支定界求精确解

    • 对于大规模实例,采用启发式或元启发式算法快速获得近似解

    • 贪心法仅适用于分数背包(可分割物品),对0-1背包不一定最优

    • 可结合问题结构(如物品价值密度排序)优化搜索过程

    • 多维/多重背包可用分解、分区或并行搜索提升效率

装箱问题
  • 描述:要把一组物品装入容量相同的箱子中,使每个箱子的装载不超过容量,同时最小化所用箱子数量(或在给定箱数下最大化装载利用率)

  • 决策变量:每个物品分配到哪个箱子(物品到箱子的分配方案)

  • 目标函数:所用箱子的数量最小化

  • 约束:每个物品必须被分配到一个箱子;每个箱子的总装载量不超过其容量;通常假设物品不可拆分

  • 复杂度:NP-难。对于n个物品和箱子容量C,状态空间极大,枚举不可行。最优解难以在多项式时间内获得

  • 求解思路:

    • 精确算法:分支定界、动态规划、整数规划、列生成(Column Generation)、割平面法。

    • 近似与启发式:首次适应(First Fit)、最佳适应(Best Fit)、最差适应(Worst Fit)、递归分组(Next Fit)、贪心法、遗传算法(GA)、模拟退火(SA)、蚁群算法(ACO)、粒子群优化(PSO)、禁忌搜索(TabuSearch)、局部搜索等

  • 实物建议:

    • 先用贪心或启发式算法(如First Fit、Best Fit)快速获得可行初解

    • 对于大规模实例,可采用分区、分层或并行搜索提升效率

    • 对物品按体积降序排序可提升贪心算法效果(FFD、BFD)

    • 精确算法适用于物品数量较少或对最优解要求较高的场景

    • 可结合问题结构(如物品分组、箱子预分配)优化搜索过程

相关推荐
OpenCSG2 小时前
AgenticOps 如何重构企业 AI 的全生命周期管理体系
大数据·人工智能·深度学习
阿里云大数据AI技术2 小时前
漫画说:为什么你的“增量计算”越跑越慢?——90%的实时数仓团队都踩过的坑,藏在这几格漫画里
大数据·人工智能
Gavin在路上2 小时前
SpringAIAlibaba之上下文工程与GraphRunnerContext 深度解析(8)
人工智能
撬动未来的支点2 小时前
【AI】光速理解YOLO框架
人工智能·yolo·计算机视觉
电商API_180079052472 小时前
批量获取电商商品数据的主流技术方法全解析
大数据·数据库·人工智能·数据分析·网络爬虫
学境思源AcademicIdeas2 小时前
我在手机上部署了一个AI大模型,用它写完了论文初稿【附提示词】
人工智能·智能手机
week_泽2 小时前
第1课:AI Agent是什么 - 学习笔记_1
人工智能·笔记·学习
kebijuelun2 小时前
REAP the Experts:去掉 MoE 一半专家还能保持性能不变
人工智能·gpt·深度学习·语言模型·transformer
医工交叉实验工坊2 小时前
从零详解WGCNA分析
人工智能·机器学习
百万彩票中奖候选人2 小时前
在trae、qoder、Claude Code、Cursor等AI IDE中使用ui-ux-pro-max-skill
人工智能·ui·ux