sklearn-提取字典特征

1.所用函数

1.sklearn.feature_extraction:sklearn中的特征提取API

2.DictVectorizer:专门提取字典文本特征的函数

2.示例

python 复制代码
from sklearn.feature_extraction import DictVectorizer

##字典特征提取:可以提取是字典结构的数据或者是包含字典的迭代器
trans=DictVectorizer(sparse=False)##生成提取器对象,sparse=False表示返回的是one-hot编码的数据,不加默认是返回稀疏矩阵的形式即无0的表示方法
data=[{"city":"北京","temperature":100},{"city":"上海","temperature":60},{"city":"深圳","temperature":30}]#包含字典的迭代器
tezheng=trans.fit_transform(data)##对象.fit_transform(data)提取字典的特征数据
print(trans.feature_names_)##获取特征名称
print(tezheng)#获取特征数据是one-hot编码的形式
复制代码
one-hot编码格式

系数矩阵格式

注意:第一列是第二列values数据的位置是用下标构成的(对比one-hot图可验证)

相关推荐
2401_891482171 小时前
多平台UI框架C++开发
开发语言·c++·算法
SuniaWang2 小时前
《Spring AI + 大模型全栈实战》学习手册系列 · 专题六:《Vue3 前端开发实战:打造企业级 RAG 问答界面》
java·前端·人工智能·spring boot·后端·spring·架构
88号技师2 小时前
2026年3月中科院一区SCI-贝塞尔曲线优化算法Bezier curve-based optimization-附Matlab免费代码
开发语言·算法·matlab·优化算法
t198751282 小时前
三维点云最小二乘拟合MATLAB程序
开发语言·算法·matlab
x_xbx2 小时前
LeetCode:148. 排序链表
算法·leetcode·链表
Darkwanderor2 小时前
三分算法的简单应用
c++·算法·三分法·三分算法
IDZSY04303 小时前
AI社交平台进阶指南:如何用AI社交提升工作学习效率
人工智能·学习
2401_831920743 小时前
分布式系统安全通信
开发语言·c++·算法
七七powerful3 小时前
运维养龙虾--AI 驱动的架构图革命:draw.io MCP 让运维画图效率提升 10 倍,使用codebuddy实战
运维·人工智能·draw.io
水星梦月3 小时前
大白话讲解AI/LLM核心概念
人工智能