特征工程

&永恒的星河&20 天前
人工智能·机器学习·特征工程·特征选择·机器学习特征选择方法·特征选择常用方法
机器学习中的常用特征选择方法及其应用案例工业界中,特征选择是机器学习模型开发的重要步骤,可以提高模型性能、减少过拟合和加速计算。针对类别型特征和数值型特征,特征选择方法有所不同。以下详细讲解方法和案例。
哔哩哔哩技术25 天前
特征工程·数据流
B站推荐模型数据流的一致性架构推荐系统的模型,通过学习用户历史行为来达到个性化精准推荐的目的,因此模型训练依赖的样本数据,需要包括用户特征、服务端推荐的视频特征,以及用户在推荐视频上是否有一系列的消费行为。
九年义务漏网鲨鱼1 个月前
人工智能·算法·机器学习·推荐算法·特征工程
【推荐算法】推荐系统中的特征工程前言:这篇文章是阅读石塔西《互联网大厂推荐算法实战》第二章推荐系统中的特征工程的学习笔记,在未来对于特征向量的学习笔记会在此基础上进行补充。编者认为特征工程已经过时的言论是错误的,该言论认为DNN模型可以自主的完成对数据特征的提取,但是在Deep Cross Network网络中,作者直接指出仅采用DNN模型是无法实现对二阶、三阶的特征进行交互的;并且虽然在DIN、SIM模型中可以从数据中挖掘用户的短期兴趣和长期兴趣,是因为模型足够复杂,需要通过复杂的计算才能提取这些兴趣特征。因此,一个好的特征工程在深度
我感觉。2 个月前
人工智能·机器学习·主成分分析·特征工程
【机器学习chp4】特征工程本文遗留问题:(1)本文4.5中地那个巧合。(2)附录5.6方差的无偏估计的证明还需理解目录前言一、数据探索
爱学习不掉头发2 个月前
数据分析·特征工程·特征衍生
【金融风控项目-08】:特征构造**举例:**下图中,蓝色框为二月当期账单,红色框为订单data.shape data.isnull() data.info() data.describe()
AIAdvocate2 个月前
人工智能·python·机器学习·金融·特征工程
【金融风控】特征评估与筛选详解掌握单特征分析的衡量指标知道 IV,PSI等指标含义知道多特征筛选的常用方法掌握Boruta,VIF,RFE,L1等特征筛选的使用方法
deephub4 个月前
人工智能·python·机器学习·numpy·sklearn·特征工程
8种数值变量的特征工程技术:利用Sklearn、Numpy和Python将数值转化为预测模型的有效特征特征工程是机器学习流程中的关键步骤,在此过程中,原始数据被转换为更具意义的特征,以增强模型对数据关系的理解能力。
uncle_ll5 个月前
机器学习·特征·建模·特征工程·风控
风控领域特征工程在金融行业,风险控制(风控)是核心环节,它关乎资产安全、合规性以及机构的长期稳健发展。随着大数据时代的到来,金融机构面临着前所未有的数据量和复杂性。在这样的背景下,风控领域特征工程应运而生,成为连接原始数据与精准风险评估的桥梁。
几度春风里7 个月前
python·特征工程·数据归一化
Python特征工程 — 1.4 特征归一化方法详解目录1 Min-Max归一化方法1:自定义的Min-Max归一化封装函数方法2: scikit-learn库中的MinMaxScaler
数据科学作家1 年前
开发语言·人工智能·python·机器学习·数据挖掘·数据分析·特征工程
Python数据科学视频讲解:特征归一化、特征标准化、样本归一化5.1 特征归一化、特征标准化、样本归一化视频为《Python数据科学应用从入门到精通》张甜 杨维忠 清华大学出版社一书的随书赠送视频讲解5.1节内容。本书已正式出版上市,当当、京东、淘宝等平台热销中,搜索书名即可。内容涵盖数据科学应用的全流程,包括数据科学应用和Python的入门,数据清洗与特征工程,以及数据挖掘与建模、数据可视化等。
小胡说人工智能1 年前
人工智能·python·深度学习·cnn·django·tensorflow·特征工程
基于CNN+数据增强+残差网络Resnet50的少样本高准确度猫咪种类识别—深度学习算法应用(含全部工程源码)+数据集+模型(一)基于CNN+数据增强+残差网络Resnet50的少样本高准确度猫咪种类识别—深度学习算法应用(含全部工程源码)+数据集+模型(一)
无风听海1 年前
python·机器学习·特征工程·缺失值·删除缺少行
处理数据中的缺失值--删除缺少值的行两个最主要的处理缺失值的方法是: ❏ 删除缺少值的行; ❏ 填充缺失值;我们首先将serum_insulin的中的字段值0替换为None,可以看到缺失值的数量为374个;
又见阿郎1 年前
特征工程·alink
聊聊基于Alink库的特征工程方法示例代码及相关内容来源于《Alink权威指南(Java版)》OneHotEncoder 是用于将类别型特征转换为独热编码的类。独热编码是一种常用的特征编码方式,特别适用于处理类别型特征,将其转换为数值型特征。 对于每个类别型特征,OneHotEncoder 将其编码成一个长度为类别数量的向量。 每个类别对应一个维度,如果样本的该特征值为该类别,则对应维度置1,其他维度置0。
deephub1 年前
python·机器学习·特征工程
Python中进行特征重要性分析的9个常用方法特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。
逐梦苍穹1 年前
人工智能·python·机器学习·chatgpt·特征工程
机器学习重要内容:特征工程之特征抽取目录1、简介2、⭐为什么需要特征工程3、特征抽取3.1、简介3.2、特征提取主要内容
逐梦苍穹1 年前
人工智能·python·机器学习·chatgpt·特征工程·特征预处理
机器学习:特征工程之特征预处理目录特征预处理1、简述2、内容3、归一化3.1、鲁棒性3.2、存在的问题