解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
大数据魔法师15 小时前
云南省天气数据可视化分析大屏的设计与实现(二)- 云南省各城市天气数据预处理
python·mysql·pandas
Hello.Reader15 小时前
Apache Arrow 在 PySpark 中的使用提速 Pandas 转换与 UDF 的关键武器
apache·pandas
Hello.Reader16 小时前
Pandas API on Spark 配置选项系统、默认索引与性能调优
大数据·spark·pandas
Python大数据分析@2 天前
Pandas相比Excel的优势是哪些?
excel·pandas
Hello.Reader3 天前
Pandas API on Spark 快速入门像写 Pandas 一样使用 Spark
大数据·spark·pandas
白日与明月6 天前
Pandas 读取文本数据 (Text I/O) 速查表
爬虫·python·pandas
一晌小贪欢7 天前
Python办公自动化指南:Pandas与Openpyxl的全面比较与选择
开发语言·python·pandas·python基础·python入门·python小白
无心水7 天前
Python时间处理通关指南:datetime/arrow/pandas实战
开发语言·人工智能·python·pandas·datetime·arrow·金融科技
RE-19018 天前
Polars:告别 Pandas 性能瓶颈,用 Rust 驱动的 DataFrame 库处理亿级数据
开发语言·rust·pandas·polars·ai生成
B站_计算机毕业设计之家9 天前
计算机毕业设计:Python当当网图书数据全链路处理平台 Django框架 爬虫 Pandas 可视化 大数据 大模型 书籍(建议收藏)✅
爬虫·python·机器学习·django·flask·pandas·课程设计