技术栈
scikit-learn
大雄野比
1 天前
学习
·
分类
·
scikit-learn
【scikit-learn基础】--『监督学习』之 贝叶斯分类
贝叶斯分类是一种统计学分类方法,基于贝叶斯定理,对给定的数据集进行分类。 它的历史可以追溯到18世纪,当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理,这个定理为统计决策提供了理论基础。
大雄野比
2 天前
学习
·
分类
·
scikit-learn
【scikit-learn基础】--『监督学习』之 K-近邻分类
KNN(K-近邻),全称K-Nearest Neighbors,是一种常用的分类算法。 KNN算法的历史可以追溯到1957年,当时Cover和Hart提出了“最近邻分类”的概念。 但是,这个算法真正得到广泛认知和应用是在1992年,由Altman发表的一篇名为“K-Nearest Neighbors”的文章。
databook
2 天前
python
·
机器学习
·
scikit-learn
多变量决策树:机器学习中的“多面手”
在机器学习的广阔领域中,决策树一直是一种备受青睐的算法。它以其直观、易于理解和解释的特点,广泛应用于分类和回归任务。
大雄野比
2 天前
学习
·
支持向量机
·
scikit-learn
【scikit-learn基础】--『监督学习』之 支持向量机回归
在机器学习中,支持向量机(Support Vector Machine)算法既可以用于回归问题,也可以用于分类问题。
大雄野比
2 天前
学习
·
决策树
·
scikit-learn
【scikit-learn基础】--『监督学习』之 决策树回归
决策树算法是一种既可以用于分类,也可以用于回归的算法。决策树回归是通过对输入特征的不断划分来建立一棵决策树,每一步划分都基于当前数据集的最优划分特征。 它的目标是最小化总体误差或最大化预测精度,其构建通常采用自上而下的贪心搜索方式,通过比较不同划分标准来选择最优划分。
大雄野比
3 天前
学习
·
回归
·
scikit-learn
【scikit-learn基础】--『监督学习』之 岭回归
岭回归(Ridge Regression)是一种用于处理共线性数据的线性回归改进方法。 和上一篇用基于最小二乘法的线性回归相比,它通过放弃最小二乘的无偏性, 以损失部分信息、降低精度为代价来获得更实际和可靠性更强的回归系数。
大雄野比
3 天前
python
·
机器学习
·
scikit-learn
【scikit-learn基础】--『预处理』之 缺失值处理
数据的预处理是数据分析,或者机器学习训练前的重要步骤。 通过数据预处理,可以本篇介绍的缺失值处理,是数据预处理中非常重要的一步,因为很多机器学习算法都假设数据是完整的,算法的执行过程中没有考虑缺失值的影响。 所以,为了提高数据质量、改进数据分析结果、提高数据挖掘和机器学习的效果,缺失值处理必不可少。
大雄野比
5 天前
人工智能
·
分类
·
scikit-learn
【scikit-learn基础】--『预处理』之 分类编码
数据的预处理是数据分析,或者机器学习训练前的重要步骤。 通过数据预处理,可以本篇介绍的分类编码处理,主要用于将类别型数据转换为可以用于分析或机器学习的形式。 类别型数据是指具有离散、不连续取值的数据,例如性别(男/女)、等级(优/良/中/差)之类数据。 对这些数据进行适当的编码,可以提高数据处理效率和准确度。
databook
7 天前
python
·
机器学习
·
scikit-learn
当决策树遇上脏数据:连续值与缺失值的解决方案
在机器学习中,决策树算法因其简单易懂、可解释性强而被广泛应用。然而,现实世界中的数据往往复杂多变,尤其是连续值和缺失值的存在,给决策树的构建带来了诸多挑战。
灵均666
8 天前
人工智能
·
机器学习
·
线性回归
·
numpy
·
pandas
·
scikit-learn
·
matplotlib
机器学习-线性回归模型
文章使用的数据集:ex1data2.txt在线性回归中,我们希望通过向量化来高效计算预测值:传统公式(单个样本):
databook
8 天前
python
·
机器学习
·
scikit-learn
决策树剪枝:平衡模型复杂性与泛化能力
在机器学习的世界里,决策树是一种简单而强大的算法,但它的 “任性生长” 却常常让数据科学家陷入 “过拟合的困境”。
程序猿阿伟
9 天前
mysql
·
架构
·
scikit-learn
《 Scikit-learn与MySQL的深度协同:构建智能数据生态系统的架构哲学》
在机器学习工程实践中,数据存储与模型训练的割裂始终是制约算法效能的关键瓶颈。Scikit-learn作为经典机器学习库,其与MySQL的深度协同并非简单的数据管道连接,而是构建了一个具备自组织能力的智能数据生态系统。这种集成突破了传统ETL流程的线性思维,使得特征矩阵的构建过程与数据库的实时状态形成量子纠缠般的动态关联,模型训练过程实质上是数据库知识图谱的连续映射过程。
databook
9 天前
python
·
机器学习
·
scikit-learn
决策树:机器学习中的“智慧树”
在机器学习的广阔森林中,决策树(Decision Tree)是一棵独特而强大的**“智慧树”**。它是一种监督学习算法,既可以用于分类任务,也能用于回归任务,通过树形结构模拟人类决策过程。
大雄野比
9 天前
python
·
机器学习
·
scikit-learn
【scikit-learn基础】--『预处理』之 数据缩放
数据的预处理是数据分析,或者机器学习训练前的重要步骤。 通过数据预处理,可以本篇介绍的数据缩放处理,主要目的是消除数据的不同特征之间的量纲差异,使得每个特征的数值范围相同。这样可以避免某些特征对模型的影响过大,从而提高模型的性能。
木尘152132
9 天前
机器学习
·
支持向量机
·
scikit-learn
机器学习课堂7用scikit-learn库训练SVM模型
代码结果结果图
databook
14 天前
python
·
机器学习
·
scikit-learn
不平衡样本数据的救星:数据再分配策略
在机器学习领域,数据是模型训练的基础,而数据的分布情况往往会对模型的性能产生重要影响。不平衡样本数据是我们在实际项目中经常会遇到的问题,它可能导致模型对多数类过度拟合,而对少数类的预测能力不足。
databook
15 天前
python
·
机器学习
·
scikit-learn
线性模型与多分类问题:简单高效的力量
在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。
databook
16 天前
python
·
机器学习
·
scikit-learn
线性判别分析(LDA):降维与分类的完美结合
在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。
databook
17 天前
python
·
机器学习
·
scikit-learn
直线思维的进化:线性到广义线性
在数据科学领域,线性模型和广义线性模型是两种基础且重要的统计工具,它们被广泛应用于各种预测和分析任务中,从简单的回归问题到复杂的分类场景。
花果山-马大帅
19 天前
人工智能
·
python
·
算法
·
机器学习
·
scikit-learn
我的机器学习学习之路
学习python的初衷• hi,今天给朋友们分享一下我是怎么从0基础开始学习机器学习的。• 我是2023年9月开始下定决心要学python的,目的有两个,一是为了提升自己的技能和价值,二是将所学的知识应用到工作中去,提升工作效率。