数据科学每日总结--Day14--数据挖掘

数据挖掘

旅行商问题
  • 描述:给定一组城市(白点)及两两之间的距离,要求寻找一条最短的闭合路线,恰好访问每个城市一次并回到起点

  • 决策变量:城市访问顺序(一个排列)

  • 目标函数:总路程最小化

  • 约束:每个城市访问一次;起点=终点;通常为完全图或稀疏图

  • 复杂度:NP-难。n 个城市的哈密顿回路数约为 (n−1)!/2(对称TSP、忽略起点与方向),因此枚举不可行

  • 求解思路:

    • 精确算法:分支定界、动态规划(Held--Karp O(n^2 2^n))、割平面/整数规划(Concorde)。

    • 近似与启发式:最近邻、2-opt/3-opt、Lin--Kernighan、元启发式(GA/ACO/SA/PSO/DE、TabuSearch、VNS)以及混合局部搜索

  • 实物建议:

    • 先用构造法得可行初解,再用k-opt细化

    • 利用距离度量的三角不等式可加速剪枝

    • 对大规模实例,采用分区/分层或岛模型并行搜索

背包问题
  • 描述:给定一组物品,每个物品有价值 v_i和重量/体积 w_i,一只背包有容量上限 W。目标是在不超容量的前提下,选择一部分物品,使总价值最大

  • 决策变量:每个物品是否被选择(0-1变量,或选取数量,取决于问题类型)

  • 目标函数:总价值最小化

  • 约束:所有被选物品的总重量不超过背包容量;每个物品最多选一次(0-1背包);或可选多次(完全背包);或有多个背包(多维/多重背包)

  • 复杂度:NP-难。对于n个物品和容量W,0-1背包的状态空间为2ⁿ,枚举不可行。动态规划时间复杂度O(nW),但W较大时仍不可行。

  • 求解思路:

    • 精确算法:动态规划(0-1背包、完全背包)、分支定界、整数规划。

    • 近似与启发式:贪心法(适用于分数背包)、遗传算法(GA)、模拟退火(SA)、蚁群算法(ACO)、粒子群优化(PSO)、禁忌搜索(TabuSearch)、局部搜索等

  • 实物建议:

    • 对于容量较小或物品数量较少,优先用动态规划或分支定界求精确解

    • 对于大规模实例,采用启发式或元启发式算法快速获得近似解

    • 贪心法仅适用于分数背包(可分割物品),对0-1背包不一定最优

    • 可结合问题结构(如物品价值密度排序)优化搜索过程

    • 多维/多重背包可用分解、分区或并行搜索提升效率

装箱问题
  • 描述:要把一组物品装入容量相同的箱子中,使每个箱子的装载不超过容量,同时最小化所用箱子数量(或在给定箱数下最大化装载利用率)

  • 决策变量:每个物品分配到哪个箱子(物品到箱子的分配方案)

  • 目标函数:所用箱子的数量最小化

  • 约束:每个物品必须被分配到一个箱子;每个箱子的总装载量不超过其容量;通常假设物品不可拆分

  • 复杂度:NP-难。对于n个物品和箱子容量C,状态空间极大,枚举不可行。最优解难以在多项式时间内获得

  • 求解思路:

    • 精确算法:分支定界、动态规划、整数规划、列生成(Column Generation)、割平面法。

    • 近似与启发式:首次适应(First Fit)、最佳适应(Best Fit)、最差适应(Worst Fit)、递归分组(Next Fit)、贪心法、遗传算法(GA)、模拟退火(SA)、蚁群算法(ACO)、粒子群优化(PSO)、禁忌搜索(TabuSearch)、局部搜索等

  • 实物建议:

    • 先用贪心或启发式算法(如First Fit、Best Fit)快速获得可行初解

    • 对于大规模实例,可采用分区、分层或并行搜索提升效率

    • 对物品按体积降序排序可提升贪心算法效果(FFD、BFD)

    • 精确算法适用于物品数量较少或对最优解要求较高的场景

    • 可结合问题结构(如物品分组、箱子预分配)优化搜索过程

相关推荐
ATMQuant9 分钟前
量化指标解码11:挤压动量 - 捕捉低波动后的爆发行情
人工智能·ai·量化交易·vnpy
Aurora-silas20 分钟前
Mac 本地运行 Hugging Face 大模型完全指南:PyTorch (MPS) vs Apple MLX
人工智能·pytorch·macos
机器不学习我也不学习35 分钟前
人工智能综合项目开发14----技术文档撰写
人工智能
GISer_Jing37 分钟前
SSE Conf大会分享支付宝xUI引擎:AI时代的多模态交互革命
前端·人工智能·交互
有一个好名字1 小时前
Spring AI ——Java开发者的AI集成神器
java·人工智能·spring
WordPress学习笔记1 小时前
专业建外贸网站公司推荐
大数据·前端·人工智能
p***95001 小时前
DeepSeek R1 简易指南:架构、本地部署和硬件要求
人工智能·架构
John_ToDebug1 小时前
AI时代的浏览器内核开发:从“渲染引擎”到“智能中枢”的范式革命
人工智能·chrome
Julian.zhou1 小时前
Anthropic破解长程任务难题:长期运行智能体的高效控制机制
大数据·人工智能
唯道行1 小时前
计算机图形学·19 Shadings in OpenGL
人工智能·算法·计算机视觉·几何学·计算机图形学·opengl