sklearn

郝学胜-神的一滴3 天前
人工智能·程序人生·机器学习·scikit-learn·sklearn
基于30年教学沉淀的清华大学AI通识经典:《人工智能的底层逻辑》在人工智能技术席卷全球的今天,你是否曾好奇:《人工智能的底层逻辑》正是为解答这些疑问而生!这本书由清华大学张长水教授基于30年教学与科研经验精心撰写,以通俗易懂的方式揭开AI技术的神秘面纱。
郝学胜-神的一滴3 天前
人工智能·python·程序人生·算法·机器学习·数据挖掘·sklearn
线性判别分析(LDA)原理详解与实战应用在机器学习领域,降维是一项至关重要的预处理技术。当我们面对高维数据时,往往会遇到"维度灾难"问题——数据稀疏性增加、计算复杂度上升、模型性能下降。此时,我们需要找到一种方法,能够在保留数据关键信息的同时降低维度。
果粒蹬i4 天前
人工智能·python·sklearn
降维实战:PCA与LDA在sklearn中的实现在高维数据日益普遍的今天,降维技术已成为数据预处理、可视化和提升模型性能的关键步骤。主成分分析(PCA)和线性判别分析(LDA)作为两种经典且广泛应用的降维方法,分别从无监督和有监督的角度出发,有效提取数据的主要特征并降低计算复杂度。Python 的 scikit-learn(sklearn)库提供了简洁高效的接口,使得 PCA 与 LDA 的实现变得极为便捷。本文将通过实际数据集,详细演示如何在 sklearn 中调用 PCA 和 LDA,对比二者在降维效果、类别可分性及运行效率上的差异,并探讨其适用场
郝学胜-神的一滴6 天前
人工智能·python·程序人生·算法·机器学习·sklearn
机器学习中的特征提取:PCA与LDA详解及sklearn实践在机器学习领域,特征提取(Feature Extraction) 是数据预处理中至关重要的一环。它通过将原始数据转换为更能代表问题本质的特征,来提高模型的性能和效率。特征提取的主要目标可以概括为:
郝学胜-神的一滴8 天前
人工智能·python·程序人生·机器学习·数据分析·scikit-learn·sklearn
特征选择利器:深入理解SelectKBest与单变量特征选择在机器学习的世界里,我们常常面临一个有趣的困境:数据越多越好吗? 🤔实际上,过多的特征可能带来一系列问题:
Fleshy数模10 天前
人工智能·分类·sklearn
Sklearn实战KNN:快速实现分类任务的入门指南在机器学习的入门算法里,KNN(k近邻)绝对是最友好的那一个。它没有复杂的训练过程,核心思想用一句话就能讲明白:“物以类聚,人以群分”。最近我跟着兰智数加学院的课程,从理论到代码完整走了一遍KNN的实践,今天就把这个过程和大家分享一下。
郝学胜-神的一滴15 天前
开发语言·人工智能·python·机器学习·概率论·sklearn
机器学习特征选择:深入理解移除低方差特征与sklearn的VarianceThreshold在机器学习项目中,特征工程是决定模型性能的关键因素之一。特征选择作为特征工程的核心环节,能够帮助我们:
(; ̄ェ ̄)。17 天前
机器学习·矩阵·sklearn
机器学习入门(九)为什么sklearn正规方程法矩阵不可逆却可以计算出结果核心问题:必须计算 ,而这个矩阵可能不可逆!这里的 就是矩阵 X 的 Moore-Penrose 伪逆(Moore-Penrose pseudoinverse),记作。
小饼干超人17 天前
python·scikit-learn·sklearn
如何兼容不同版本的 scikit-learn(sklearn)库,统一获取“均方根误差(RMSE)”的计算函数下面这段代码通过 try-except 异常捕获机制,适配 sklearn 新旧版本中 RMSE 函数的不同写法:
郝学胜-神的一滴17 天前
开发语言·人工智能·python·程序人生·机器学习·sklearn
机器学习数据预处理:深入理解标准化与sklearn的StandardScaler在机器学习的实践中,我们常常听到这样一句话:“Garbage in, garbage out”(垃圾进,垃圾出)。这句话生动地说明了数据质量对模型性能的决定性影响。数据预处理作为机器学习流程中的第一步,其重要性不言而喻。
郝学胜-神的一滴19 天前
人工智能·python·程序人生·机器学习·性能优化·sklearn
机器学习数据预处理:归一化与sklearn的MinMaxScaler详解在机器学习项目中,数据预处理是构建高效模型的关键步骤!据统计,数据科学家80%的时间都花在数据清洗和预处理上。原始数据往往存在以下问题:
郝学胜-神的一滴24 天前
人工智能·python·程序人生·机器学习·性能优化·sklearn
机器学习特征预处理:缺失值处理全攻略在现实世界的数据分析项目中,缺失数据几乎是不可避免的!无论是传感器故障、用户未填写信息,还是数据采集过程中的技术问题,缺失值都会对我们的机器学习模型造成严重影响。根据统计,超过80%的数据科学项目都需要处理缺失值问题!
灯下夜无眠25 天前
人工智能·python·sklearn
sklearn中fit、transform、fit_transform用法详解这三个方法是 scikit-learn 转换器(Transformer)的核心方法:fit() - 学习数据的参数(如均值、标准差等)
郝学胜-神的一滴25 天前
数据结构·人工智能·python·程序人生·机器学习·sklearn
《机器学习》经典教材全景解读:周志华教授匠心之作的技术深探“工欲善其事,必先利其器” ——在人工智能蓬勃发展的时代,周志华教授的《机器学习》无疑成为了无数AI研习者的"利器"。这部被誉为"西瓜书"的经典教材,自2016年问世以来便洛阳纸贵,首印5000册一周售罄,截至2024年已重印45次,被全球500余所高校采用,堪称中文机器学习教材的里程碑式作品。
郝学胜-神的一滴1 个月前
开发语言·人工智能·python·程序人生·机器学习·tf-idf·sklearn
机器学习特征提取:TF-IDF模型详解与实践指南文本数据浩如烟海,特征提取乃机器学习之基石。TF-IDF(Term Frequency-Inverse Document Frequency)算法,实为文本挖掘领域之明珠,兼具简洁与高效之特性。本文将深入剖析TF-IDF之原理,辅以sklearn实现之实践,并探讨中文处理之特殊考量。
郝学胜-神的一滴1 个月前
开发语言·人工智能·python·程序人生·机器学习·sklearn
机器学习数据工程之基石:论数据集划分之道与sklearn实践夫机器学习之成,首在数据;数据之用,贵在划分。若划分失当,则模型如盲人摸象,或过拟合而失泛化,或欠拟合而难精进。故曰:“工欲善其事,必先利其器;器欲尽其用,必先明其法。” 今撰此文,详述数据集划分之要义,并辅以scikit-learn(sklearn)之利器,以飨读者。
郝学胜-神的一滴1 个月前
人工智能·程序人生·机器学习·scikit-learn·sklearn
数据为壤,特征为苗:机器学习特征提取艺术探微夫欲筑九层之台,必先固其地基;欲训智能之器,必先精其特征。数据者,璞玉也,藏于芜杂,隐于无序。特征提取,乃雕琢之术,化混沌为清晰,变无序为有序,为模型奉上琼浆玉食,助其洞察秋毫,预判吉凶。今且论特征工程之基石:** 独热编码与字典特征提取**,并辅以sklearn神器,以飨读者。
郝学胜-神的一滴1 个月前
人工智能·python·程序人生·机器学习·scikit-learn·sklearn
机器学习数据集完全指南:从公开资源到Sklearn实战在机器学习领域,数据集就如同建筑师的砖瓦,是构建模型的基础。高质量的数据集能够:数据集数据清洗特征工程
python机器学习ML1 个月前
人工智能·python·神经网络·机器学习·计算机视觉·scikit-learn·sklearn
论文复现-以动物图像分类为例进行多模型性能对比分析论文示例项目流程该项目旨在对动物图像进行分类,并通过对比多种深度学习模型的性能,深入分析不同模型在图像分类任务上的优劣。项目流程可概括为:数据准备、模型构建与训练、性能评估与对比分析、高级可视化分析。
Jerryhut2 个月前
算法·kmeans·sklearn
sklearn函数总结十二 —— 聚类分析算法K-Means纯手打,代码整理中,持续更新中^-^序号延用总结十一聚类分析算法是一类强大的无监督学习工具,其核心思想是“物以类聚”,通过度量数据点之间的相似性,自动地将数据划分成不同的组(簇),从而帮助我们发现数据中内在的、未知的有价值结构。 scikit-learn(sklearn)中提供了多种常用的聚类算法,如K-Means(K均值),DBSCAN(基于密度的 噪声应用空间聚类),Agglomerative Clustering(凝聚层次聚类)