sklearn-提取字典特征

1.所用函数

1.sklearn.feature_extraction:sklearn中的特征提取API

2.DictVectorizer:专门提取字典文本特征的函数

2.示例

python 复制代码
from sklearn.feature_extraction import DictVectorizer

##字典特征提取:可以提取是字典结构的数据或者是包含字典的迭代器
trans=DictVectorizer(sparse=False)##生成提取器对象,sparse=False表示返回的是one-hot编码的数据,不加默认是返回稀疏矩阵的形式即无0的表示方法
data=[{"city":"北京","temperature":100},{"city":"上海","temperature":60},{"city":"深圳","temperature":30}]#包含字典的迭代器
tezheng=trans.fit_transform(data)##对象.fit_transform(data)提取字典的特征数据
print(trans.feature_names_)##获取特征名称
print(tezheng)#获取特征数据是one-hot编码的形式
复制代码
one-hot编码格式

系数矩阵格式

注意:第一列是第二列values数据的位置是用下标构成的(对比one-hot图可验证)

相关推荐
研究点啥好呢9 分钟前
途游游戏AI产品经理面试题精选:10道高频考题+答案解析
人工智能·游戏·产品经理
KG_LLM图谱增强大模型12 分钟前
从数据孤岛到知识融合:用友大型本体模型LOM如何赋能企业知识管理和智能决策
人工智能·知识图谱
码以致用12 分钟前
用 DeepAgents 自动分析表格数据,一键生成图表与报告
人工智能·ai编程
码上掘金17 分钟前
基于深度学习的行人计数与人群密度分析系统设计与实现
人工智能·深度学习
北京软秦科技有限公司22 分钟前
灌封胶耐候测试报告为何更依赖“AI报告审核”?IACheck如何提升长期环境可靠性判断精度
人工智能
程序员果子25 分钟前
Agent设计手册:四层架构、工程约束、框架选型
人工智能·agent·智能体·agent框架
2401_8322981029 分钟前
SaaS 到 Agent-as-a-Service——OpenClaw 生态爆发,开启企业数字化新时代
人工智能
~|Bernard|32 分钟前
二.go语言中map的底层原理(2026-5-8)
算法·golang·哈希算法
AI产品测评官36 分钟前
2026年AI招聘架构深潜:多Agent协同如何打造主动出击智能体代表?
人工智能·架构
captain_AIouo41 分钟前
Captain AI:全阶段适配不同规模OZON商家
大数据·人工智能·经验分享·aigc