可视化的决策过程：决策树 Decision Tree

决策树是一种基于树状结构 的分类与回归模型，通过特征判断 逐步划分数据，最终达到"数据纯度最大化"的目标。
关键流程：

信息熵（Entropy） ：衡量节点数据的不确定性。
H ( X ) = − ∑ k = 1 C p k log ⁡ 2 ( p k ) H(X) = -\sum_{k=1}^C p_k \log_2(p_k) H(X)=−k=1∑Cpklog2(pk)
- p k p_k pk：节点中第(k)类样本的占比。
- 低熵：节点内样本类别高度一致（如90%为正类）。
- 高熵：类别分布均匀（如50%正类，50%负类）。
信息增益（ID3算法） ：选择使子节点熵减少最多的特征。
Gain ( D , A ) = H ( D ) − ∑ v = 1 V ∣ D v ∣ ∣ D ∣ H ( D v ) \text{Gain}(D, A) = H(D) - \sum_{v=1}^V \frac{|D^v|}{|D|} H(D^v) Gain(D,A)=H(D)−v=1∑V∣D∣∣Dv∣H(Dv)
- (D)：父节点数据集， D v ) D^v) Dv)：特征(A)的第(v)个子节点数据。
基尼系数（CART算法） ：衡量数据不纯度，计算更高效。
Gini ( D ) = 1 − ∑ k = 1 C p k 2 \text{Gini}(D) = 1 - \sum_{k=1}^C p_k^2 Gini(D)=1−k=1∑Cpk2

算法	任务类型	分割准则	特点
ID3	分类	信息增益最大化	仅支持离散特征，易偏向多值特征
C4.5	分类	信息增益比最大化	解决ID3偏向性，支持连续特征
CART	分类/回归	基尼系数最小化（分类）均方误差最小化（回归）	支持分类与回归，生成二叉树

停止条件：
- 最大深度（max_depth）：限制树的高度，防止过拟合。
- 最小样本分割（min_samples_split）：节点至少包含的样本数才允许分裂。
- 叶节点最小样本数（min_samples_leaf）：确保叶节点数据量合理。
过拟合与欠拟合：
- 过拟合（树过深）：模型复杂，训练集准确率高但测试集差。
- 欠拟合（树过浅）：模型简单，无法捕捉数据规律。
- 调优方法：交叉验证选择最佳参数组合，或使用剪枝（预剪枝/后剪枝）。

维度	决策树	逻辑回归	KNN
可解释性	极高（白盒模型）	高（参数可解释）	低（黑盒，依赖邻居分布）
计算效率	训练慢（高维数据），预测快	训练快，预测极快	训练无成本，预测慢（需遍历）
数据假设	无分布假设	线性边界假设	局部相似性假设
适用问题	分类/回归	分类（概率输出）	分类/回归（需调整距离度量）

决策树以可解释性为核心优势，通过递归划分数据逼近"纯净"子集，是机器学习中最直观的模型之一。其核心挑战在于平衡模型复杂度与泛化能力：