sklearn-提取字典特征

1.所用函数

1.sklearn.feature_extraction:sklearn中的特征提取API

2.DictVectorizer:专门提取字典文本特征的函数

2.示例

python 复制代码
from sklearn.feature_extraction import DictVectorizer

##字典特征提取:可以提取是字典结构的数据或者是包含字典的迭代器
trans=DictVectorizer(sparse=False)##生成提取器对象,sparse=False表示返回的是one-hot编码的数据,不加默认是返回稀疏矩阵的形式即无0的表示方法
data=[{"city":"北京","temperature":100},{"city":"上海","temperature":60},{"city":"深圳","temperature":30}]#包含字典的迭代器
tezheng=trans.fit_transform(data)##对象.fit_transform(data)提取字典的特征数据
print(trans.feature_names_)##获取特征名称
print(tezheng)#获取特征数据是one-hot编码的形式
复制代码
one-hot编码格式

系数矩阵格式

注意:第一列是第二列values数据的位置是用下标构成的(对比one-hot图可验证)

相关推荐
智算菩萨6 分钟前
从对话演示到智能工作平台:ChatGPT的三年演进史(2022-2025)
人工智能·chatgpt
lsrsyx8 分钟前
以科技守护长寿:Quantum Life 自主研发AI驱动平台助力港怡医疗,开启香港精准预防医疗新时代
人工智能·科技
Good kid.14 分钟前
基于XGBoost的中文垃圾分类系统实战(TF-IDF + XGBoost)
人工智能·分类·tf-idf
源代码•宸7 小时前
分布式缓存-GO(分布式算法之一致性哈希、缓存对外服务化)
开发语言·经验分享·分布式·后端·算法·缓存·golang
It's now7 小时前
Spring AI 基础开发流程
java·人工智能·后端·spring
Glad_R7 小时前
巧用AI流程图,让信息呈现更全面
人工智能·信息可视化·产品运营·流程图·产品经理
yongui478348 小时前
MATLAB的指纹识别系统实现
算法
高山上有一只小老虎8 小时前
翻之矩阵中的行
java·算法
西南胶带の池上桜8 小时前
1.Pytorch模型应用(线性与非线性预测)
人工智能·pytorch·python