技术栈
databook
wang_yb
9 小时前
ai
·
databook
多变量决策树:机器学习中的“多面手”
在机器学习的广阔领域中,决策树一直是一种备受青睐的算法。它以其直观、易于理解和解释的特点,广泛应用于分类和回归任务。
wang_yb
1 天前
plotly
·
databook
『Plotly实战指南』--雷达图绘制与应用
在数据分析和可视化领域,雷达图是一种适用于多维数据的可视化、综合评估和决策支持的工具。雷达图通过将数据点沿多个轴分布,并通过多边形面积或线条连接来展示数据的多维度特征,能够直观地呈现数据在各个维度上的表现,帮助我们快速识别优势和劣势,从而做出更明智的决策。
wang_yb
2 天前
plotly
·
databook
『Plotly实战指南』--面积图绘制与应用
在数据可视化领域,面积图是一种强大而直观的工具,它通过填充线条与坐标轴之间的区域来量化数据大小,从而帮助我们清晰地展示数据的总量、趋势变化以及不同类别之间的对比。
wang_yb
4 天前
ai
·
databook
当决策树遇上脏数据:连续值与缺失值的解决方案
在机器学习中,决策树算法因其简单易懂、可解释性强而被广泛应用。然而,现实世界中的数据往往复杂多变,尤其是连续值和缺失值的存在,给决策树的构建带来了诸多挑战。
wang_yb
5 天前
ai
·
databook
决策树剪枝:平衡模型复杂性与泛化能力
在机器学习的世界里,决策树是一种简单而强大的算法,但它的 “任性生长” 却常常让数据科学家陷入 “过拟合的困境”。
wang_yb
6 天前
ai
·
databook
决策树:机器学习中的“智慧树”
在机器学习的广阔森林中,决策树(Decision Tree)是一棵独特而强大的“智慧树”。它是一种监督学习算法,既可以用于分类任务,也能用于回归任务,通过树形结构模拟人类决策过程。
wang_yb
7 天前
plotly
·
databook
『Plotly实战指南』--直方图绘制与应用
在数据科学的世界里,直方图是一种不可或缺的可视化工具,它以其简洁而直观的方式,揭示了数据的内在规律,为数据分析和决策提供了有力支持。
wang_yb
8 天前
plotly
·
databook
『Plotly实战指南』--箱线图绘制与应用
在数据可视化领域,箱线图(Box Plot)是一种强大的工具,用于展示数据的分布特征、集中趋势以及异常值。
wang_yb
9 天前
plotly
·
databook
『Plotly实战指南』--散点图绘制进阶篇
在数据分析的世界里,散点图是一种极为重要的可视化工具。 它能够直观地展示两个或多个变量之间的关系,帮助我们快速发现数据中的模式、趋势和异常点。
wang_yb
11 天前
ai
·
databook
不平衡样本数据的救星:数据再分配策略
在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。
wang_yb
12 天前
ai
·
databook
线性模型与多分类问题:简单高效的力量
在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。
wang_yb
13 天前
ai
·
databook
线性判别分析(LDA):降维与分类的完美结合
在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。
wang_yb
14 天前
ai
·
databook
直线思维的进化:线性到广义线性
在数据科学领域,线性模型和广义线性模型是两种基础且重要的统计工具,它们被广泛应用于各种预测和分析任务中,从简单的回归问题到复杂的分类场景。
wang_yb
15 天前
plotly
·
databook
『Plotly实战指南』--饼图绘制高级篇
在数据可视化的世界里,饼图是最直观的展示比例关系的工具之一。然而,传统的静态饼图已经无法满足现代数据分析的需求。Plotly作为一款强大的可视化库,不仅提供了饼图丰富的基础功能,还支持交互效果和动态更新等高级特性。
wang_yb
16 天前
plotly
·
databook
『Plotly实战指南』--饼图绘制基础篇
在数据可视化的世界里,饼图是一种直观且广泛使用的图表类型。它能够将数据各个部分占整体的比例关系清晰地展现出来,适用于诸如市场占有率分析、调查结果分布、预算分配等多个领域。
wang_yb
18 天前
ai
·
databook
比较检验:找出最佳机器学习模型
在机器学习领域,我们常常需要在多个模型之间进行比较,以选择最适合特定任务的模型。模型比较检验为此提供了科学的依据和方法。
wang_yb
20 天前
ai
·
databook
模型的泛化性能度量:方法、比较与实现
在机器学习领域,模型的泛化性能度量是评估模型在未知数据上表现的关键环节。通过合理的性能度量,不仅能了解模型的优劣,还能为模型的优化和选择提供科学依据。
wang_yb
22 天前
ai
·
databook
掌握机器学习数据集划分
在机器学习的流程中,数据集的合理划分是模型训练与评估的关键前提。恰当的划分方式不仅能有效利用数据资源,还能确保模型评估结果的可靠性,为模型的泛化能力提供有力保障。
wang_yb
23 天前
plotly
·
databook
『Plotly实战指南』--柱状图绘制高级篇
在数据可视化的世界里,柱状图是一种直观且强大的工具,用于展示数据的分布、比较和趋势。从基础的柱状图出发,我们可以进一步探索更复杂的图表类型,如分组柱状图和堆积柱状图,它们在处理多维数据和复杂关系时具有独特的优势。
wang_yb
25 天前
plotly
·
databook
『Plotly实战指南』--柱状图绘制基础篇
柱状图作为最基础的数据可视化形式之一,能直观展示不同类别数据的对比关系,适用于一下的场景:今天,我们就来深入探索Plotly柱状图的绘制基础,掌握垂直柱状图和水平柱状图的绘制方法。