解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
李昊哲小课6 天前
PyArrow 完整教程
大数据·数据分析·pandas·pyarrow
云和数据.ChenGuang6 天前
T5大模型
人工智能·机器人·pandas·数据预处理·数据训练
MATLAB代码顾问8 天前
Python Pandas数据分析入门指南
python·数据分析·pandas
themingyi10 天前
Abaqus2024安装python包pandas
开发语言·python·pandas
一晌小贪欢10 天前
第26节:自动化办公——利用 Python 自动生成动态分析报告 (PPT/PDF)
开发语言·python·数据分析·自动化·powerpoint·pandas·数据可视化
留白_10 天前
pandas练习题
python·数据分析·pandas
留白_10 天前
pandas进阶学习
学习·pandas
abcy07121311 天前
python pandas csv异步后台清洗前端优先返回成功信息
前端·python·pandas
留白_12 天前
pandas文件读取与存储
开发语言·python·pandas
SilentSamsara12 天前
特征工程系统方法论:编码、分箱、交互特征与特征选择
开发语言·人工智能·python·机器学习·青少年编程·信息可视化·pandas