解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
RE-19015 小时前
Polars:告别 Pandas 性能瓶颈,用 Rust 驱动的 DataFrame 库处理亿级数据
开发语言·rust·pandas·polars·ai生成
B站_计算机毕业设计之家2 天前
计算机毕业设计:Python当当网图书数据全链路处理平台 Django框架 爬虫 Pandas 可视化 大数据 大模型 书籍(建议收藏)✅
爬虫·python·机器学习·django·flask·pandas·课程设计
万粉变现经纪人2 天前
如何解决 pip install shapely 报错 GEOS C 库未找到 问题
c语言·开发语言·python·pycharm·bug·pandas·pip
B站计算机毕业设计之家2 天前
计算机毕业设计源码:Python图书数据智能采集与可视化大屏 当当网 Django框架 爬虫 Pandas 可视化 大数据 大模型 书籍(建议收藏)✅
爬虫·python·机器学习·信息可视化·django·pandas·课程设计
小陈工3 天前
FastAPI性能优化实战:从每秒100请求到1000的踩坑记录
python·性能优化·django·flask·numpy·pandas·fastapi
deepxuan3 天前
Day1--python三大库-Pandas
人工智能·python·pandas
万粉变现经纪人3 天前
如何解决 pip install pillow-simd 报错 需要 AVX2/特定编译器 支持 问题
python·scrapy·beautifulsoup·aigc·pandas·pillow·pip
百年੭ ᐕ)੭*⁾⁾4 天前
DataFrame存入mysql以及读取操作
数据库·mysql·numpy·pandas·ipython
李昊哲小课5 天前
国际足球比赛数据集分析报告(1872-2025)
信息可视化·数据挖掘·数据分析·pandas·matplotlib·pyecharts·seaborn
howard20056 天前
Pandas加载Avro文件
pandas·avro