scikit-learn中OneHotEncoder用法

One-Hot编码,又称为一位有效编码,是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值,然后,每个整数值被表示为二进制向量,将整数索引标记为1,其余都标为0。

OneHotEncoder()常用参数解释

  • drop=None:用于从每个特征中舍去特定的分类,默认为None,且不能与categoriesn_values同用。
  • dtype=np.float64:表示编码数值格式,默认是浮点型。
  • sparse=True:表示编码的格式,默认为True,即为稀疏的格式,指定False则就不用 toarray()
  • handle_unknown='error':其值可以指定为 "error" 或者 "ignore",即如果碰到未知的类别,是返回一个错误还是忽略它。

OneHotEncoder()用法





相关推荐
哥布林学者2 小时前
高光谱成像(一)高光谱图像
机器学习·高光谱成像
罗西的思考3 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
孟健5 小时前
Karpathy 用 200 行纯 Python 从零实现 GPT:代码逐行解析
python
HXhlx7 小时前
CART决策树基本原理
算法·机器学习
码路飞7 小时前
写了个 AI 聊天页面,被 5 种流式格式折腾了一整天 😭
javascript·python
曲幽9 小时前
FastAPI压力测试实战:Locust模拟真实用户并发及优化建议
python·fastapi·web·locust·asyncio·test·uvicorn·workers
敏编程14 小时前
一天一个Python库:jsonschema - JSON 数据验证利器
python
前端付豪14 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
databook14 小时前
ManimCE v0.20.1 发布:LaTeX 渲染修复与动画稳定性提升
python·动效
花酒锄作田1 天前
使用 pkgutil 实现动态插件系统
python