scikit-learn

龙腾AI白云3 小时前
scikit-learn·知识图谱
从GPT到开源大模型从GPT到开源大模型一、 GPT的崛起:闭源大模型的“奇点时刻” 二、开源的力量:大模型不再是少数人特权 三、核心差异:闭源 vs 开源,各有什么优劣 四、开源生态:从LLaMA到魔搭,百花齐放 五、未来展望:开源与闭源将长期共存
SilentSamsara4 小时前
开发语言·人工智能·python·机器学习·青少年编程·numpy·scikit-learn
scikit-learn 工作流工程化:Pipeline、ColumnTransformer 与自定义转换器没有 Pipeline 的机器学习代码通常在 Jupyter Notebook 中散落为以下碎片:StandardScaler().fit_transform(X_train) 在一行,model.fit() 在翻了好几页后的另一个 Cell 里,预处理和训练之间被分析和可视化的代码隔开。更致命的是,交叉验证时很容易把 fit_transform 应用于整个数据集而非仅训练集,导致测试集信息泄漏到训练过程中——这种 Bug 不会报错,只会让交叉验证分数虚高,而模型上线后的真实表现远低于预期。scikit-
weixin_468466857 天前
人工智能·神经网络·机器学习·scikit-learn·sklearn·评价指标·网络模型
神经网络模型评价指标新手实战指南在机器学习模型的开发过程中,很多开发者容易陷入一个误区:认为只要模型的“准确率”高,就是一个好模型。但在实际业务中,尤其是面对数据分布不均的场景时,单纯依赖准确率往往会掩盖模型的真实表现。比如在一个欺诈检测系统中,如果欺诈样本只占总量的 1%,那么即使模型将所有样本都预测为“正常”,其准确率也能高达 99%,但这个模型实际上毫无用处,因为它漏掉了所有的欺诈行为。
恣艺17 天前
python·机器学习·scikit-learn
Python 实用工具与机器学习入门:Rich + Tqdm + Faker + Schedule + Scikit-learn专栏:Python 常用工具库实战教程 | 第五篇 适合人群:Python 开发者、数据分析师、自动化运维工程师
Omics Pro20 天前
人工智能·python·深度学习·plotly·numpy·pandas·scikit-learn
填补蛋白质组深度学习预处理教学空白质谱蛋白质组学可生成表征生物样品中肽段/蛋白质组分的复杂数据,各类机器学习是串联质谱肽段鉴定及数据分析全流程的核心计算方法。随着深度学习成为数据建模与解析的强力机器学习手段,蛋白质组学计算研究者利用海量公开数据集训练机器学习模型,用于预测肽段碎裂谱与液相色谱保留时间。ProteomicsML等资源为这类学习任务提供了详尽的演示教程,缩小了蛋白质组学与机器学习领域的隔阂。但现有深度学习教学材料普遍缺失数据预处理嵌入这一关键步骤:肽段文本序列必须转换为数值格式(即嵌入)才能用于模型训练。肽段嵌入方法种类繁多,
龙腾AI白云20 天前
plotly·scikit-learn·dash
AI前沿技术中国人工智能培训网—AI系列录播课在人工智能与新一代信息技术加速融合的时代背景下,前沿技术人才的系统培养已成为产业升级的关键驱动力。 我们推出系列高端研修课程,涵盖生成式AI、大模型、多模态技术、数字孪生、嵌入式AI(含FPGA与Linux平台)、深度强化学习、迁移学习、边缘计算与边缘智能、量子计算、大数据建模与挖掘、知识图谱与大模型应用、深度学习与图神经网络,以及具身智能等十余个核心方向。课程采用“理论讲解+工程实践”的模式,由一线资深专家授课,帮助学员系统掌握算法原理、开发框架与落地方法,加速技术向实
Captain_Data24 天前
python·机器学习·数据分析·scikit-learn·风控建模
Python机器学习实战:用Scikit-learn从0构建信用风险评分模型(含WOE编码+AUC/KS/PSI评估+评分卡转换)在银行、消费金融、互联网信贷等领域,信用风险评分模型(Credit Scoring Model)是核心业务模型之一。它决定了一个用户是否能拿到贷款、能拿多少、利率是多少。
小许同学记录成长1 个月前
python·算法·scikit-learn
基于幅度形态与参数聚类的工作模式判别解决的是:在缺少实时成像链与原始回波相位的前提下,仅凭分脉冲汇总后的参数行与幅度序列,对观测段给出条带、聚束,并在双文件场景下给出疑似同一观测/重复观测/干涉候选(。
deephub1 个月前
人工智能·python·机器学习·pandas·scikit-learn
Feature Engineering 实战:Pandas + Scikit-learn的机器学习特征工程的完整代码示例Feature engineering 是机器学习 pipeline 里最关键的一环。算法再好,如果输入数据噪声大、不一致或者缺乏有意义的特征,模型表现都不会很好
MediaTea1 个月前
人工智能·学习·算法·机器学习·scikit-learn
Scikit-learn:从数据到结构——无监督学习的最小闭环在 Scikit-learn 中,学习无监督学习并不只是学习某个聚类算法或降维方法的调用方式,更重要的是理解:当数据没有现成标签时,如何从一批样本中发现结构、生成结果,并判断这种结构是否具有解释价值。
贫民窟的勇敢爷们1 个月前
算法·机器学习·scikit-learn
Scikit-learn算法:从入门到精通的机器学习工具箱在Python机器学习生态中,Scikit-learn(简称sklearn)无疑是最受欢迎的工具库之一。它以简洁的API、丰富的算法实现和完善的文档,成为初学者入门机器学习的首选,也被工业界广泛用于快速原型开发。本文将系统梳理Scikit-learn的核心算法体系,从分类、回归到聚类、降维,带你全面认识这个“机器学习瑞士军刀”。
贫民窟的勇敢爷们1 个月前
python·机器学习·scikit-learn
Scikit-learn机器学习项目:从入门到实战的价值与实践在人工智能与数据科学蓬勃发展的今天,机器学习已成为解决复杂问题、挖掘数据价值的核心技术之一。而在众多机器学习框架中,Scikit-learn以其简洁的API设计、丰富的算法库和强大的生态支持,成为初学者入门和工程师实践的首选工具。围绕“Scikit-learn机器学习项目”展开的实践与探索,不仅能够帮助学习者掌握算法原理,更能通过真实场景的落地,理解数据驱动决策的核心逻辑。
谙弆悕博士1 个月前
python·学习·算法·决策树·机器学习·数据分析·scikit-learn
【附Python源码】基于决策树的信用卡欺诈检测实战⚠️完整源码地址:https://github.com/anjuxi/Decision_tree-credit_card_fraud_detection
MediaTea1 个月前
人工智能·python·机器学习·scikit-learn
人工智能通识课:Scikit-learn 机器学习工具库Scikit-learn 是 Python 生态中最常用的经典机器学习库之一。它围绕分类、回归、聚类、降维、数据预处理、模型选择与模型评估等内容,提供了较统一的接口和较完整的工具链。
MediaTea1 个月前
人工智能·深度学习·机器学习·计算机视觉·scikit-learn
Scikit-learn:preprocessing 模块Scikit-learn 的 preprocessing 模块,主要用于把原始特征转换成更适合模型使用的数据表示。它提供了标准化、归一化、类别编码、特征变换、特征扩展等工具,是 Scikit-learn 建模流程中的重要组成部分。Scikit-learn 官方说明中也强调,sklearn.preprocessing 提供的工具函数和转换器类,目的就是把原始特征向量变成更适合下游估计器使用的表示。
MediaTea2 个月前
人工智能·python·机器学习·scikit-learn
Scikit-learn:数据集在机器学习中,模型并不是学习的起点,数据才是。对于初学者来说,很多困难并不来自算法公式,而是来自对“数据从哪里来、以什么形式存在、怎样进入模型”的认识不清。
万粉变现经纪人2 个月前
人工智能·python·深度学习·tensorflow·pandas·scikit-learn·pip
如何解决 pip install jaxlib[cuda] 报错 CUDA 版本与轮子标签不匹配 问题🎯 摘要:在使用PyCharm控制台执行 pip install "jax[cuda]" 或 pip install jaxlib[cuda] 时,经常遇到 ERROR: No matching distribution found 或 CUDA 版本与轮子标签(wheel tag)不匹配 的报错。本文将深入剖析这一错误的底层原因,从 开发环境配置、CUDA版本兼容性、平台架构限制 等维度,提供一套完整的排查与解决方案,助你彻底解决PyCharm中的pip安装难题。
MediaTea2 个月前
人工智能·python·机器学习·scikit-learn
Scikit-learn:一个最小机器学习工作流示例在机器学习的学习过程中,样本、特征、标签、模型、训练、预测、评估等概念往往同时出现。若分别孤立地理解,容易显得零散;若把这些概念放在一个完整任务中加以观察,则更容易把握它们之间的联系。
xiaotao1312 个月前
学习·机器学习·scikit-learn
02-机器学习基础: 无监督学习——scikit-learn实战与模型管理模型保存方式对比:最佳实践:
MediaTea2 个月前
人工智能·python·机器学习·矩阵·scikit-learn
Scikit-learn:特征矩阵与目标变量在机器学习中,模型通常不是直接接收“房子”“邮件”“图像”这样的现实对象,而是接收一种更抽象、更统一的数据表示形式:输入部分记为 X,输出目标记为 y。在 Scikit-learn 中,这几乎是最基本、最频繁出现的接口约定:监督学习模型通常通过 fit(X, y) 进行训练,其中 X 保存样本的特征表示,y 保存对应的目标值或类别标签。