scikit-learn中OneHotEncoder用法

One-Hot编码,又称为一位有效编码,是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值,然后,每个整数值被表示为二进制向量,将整数索引标记为1,其余都标为0。

OneHotEncoder()常用参数解释

  • drop=None:用于从每个特征中舍去特定的分类,默认为None,且不能与categoriesn_values同用。
  • dtype=np.float64:表示编码数值格式,默认是浮点型。
  • sparse=True:表示编码的格式,默认为True,即为稀疏的格式,指定False则就不用 toarray()
  • handle_unknown='error':其值可以指定为 "error" 或者 "ignore",即如果碰到未知的类别,是返回一个错误还是忽略它。

OneHotEncoder()用法





相关推荐
量化投资和人工智能几秒前
【CUDA编程】OptionalCUDAGuard详解
c++·人工智能·python·机器学习·云计算·cuda
Ryo_Yuki8 分钟前
【上市公司文本分析】根据句号和分号进行文本分割,提取含有特定关键词的语句并导出为EXCEL
python·excel
盛夏绽放15 分钟前
Python 目录操作详解
java·服务器·python
冷月半明20 分钟前
Python重试机制终极指南:两种重试并增加日志记录方法详解
python
CryptoPP33 分钟前
全球金融数据实时对接实战:基于WebSocket的印度、马来西亚、韩国股票API集成指南
python·websocket·金融
学掌门1 小时前
用Python做数据分析之数据处理及数据提取
开发语言·python·数据分析
微信公众号:AI创造财富1 小时前
执行 PGPT_PROFILES=ollama make run下面报错,
python
微信公众号:AI创造财富1 小时前
推荐轻量级文生视频模型(Text-to-Video)
python·深度学习·音视频
小白学大数据1 小时前
Python爬取豆瓣短评并生成词云分析
开发语言·python
代码老y2 小时前
爬虫技术:数据获取的利器与伦理边界
爬虫·python