sklearn-提取字典特征

1.所用函数

1.sklearn.feature_extraction:sklearn中的特征提取API

2.DictVectorizer:专门提取字典文本特征的函数

2.示例

python 复制代码
from sklearn.feature_extraction import DictVectorizer

##字典特征提取:可以提取是字典结构的数据或者是包含字典的迭代器
trans=DictVectorizer(sparse=False)##生成提取器对象,sparse=False表示返回的是one-hot编码的数据,不加默认是返回稀疏矩阵的形式即无0的表示方法
data=[{"city":"北京","temperature":100},{"city":"上海","temperature":60},{"city":"深圳","temperature":30}]#包含字典的迭代器
tezheng=trans.fit_transform(data)##对象.fit_transform(data)提取字典的特征数据
print(trans.feature_names_)##获取特征名称
print(tezheng)#获取特征数据是one-hot编码的形式
复制代码
one-hot编码格式

系数矩阵格式

注意:第一列是第二列values数据的位置是用下标构成的(对比one-hot图可验证)

相关推荐
冬哥聊AI1 分钟前
滴滴Agent岗二面:RAG 系统的 LLM 幻觉怎么治?从两类根源讲到四道防线
人工智能
lyshlc7 分钟前
# AI Agent的推迟判定协议:不确定性下的最优策略
人工智能
用户3299016750511 分钟前
用zod在运行时兜住AI返回的JSON
人工智能
George37512 分钟前
第一章:本体论是什么(以及它不是什么)
人工智能
贵慜_Derek12 分钟前
《从零实现 Agent 系统》连载 32|闭集 IE 与小模型:分类、意图与字段抽取
人工智能·架构·agent
IT_陈寒37 分钟前
Java 并行流把我坑惨了,这6小时加班值了
前端·人工智能·后端
火山引擎开发者社区1 小时前
告别长期密码:火山引擎云数据库 MySQL IAM 鉴权全解析
人工智能
火山引擎开发者社区2 小时前
从仓库维护者到架构师|首个大规模真实仓库长程任务 SWE 数据集 DeNovoSWE 发布,火山引擎云沙箱提供支撑
人工智能
火山引擎开发者社区8 小时前
火山 DTS 正式支持 MySQL 同步到 Milvus , 解决业务库到向量库最后一公里
人工智能
火山引擎开发者社区8 小时前
@开发者,提前解锁 FORCE 原动力大会五大看点,限时赢取门票福利
人工智能