解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
万粉变现经纪人1 天前
如何解决 pip install -r requirements.txt 私有索引未设为 trusted-host 导致拒绝 问题
开发语言·python·scrapy·flask·beautifulsoup·pandas·pip
万粉变现经纪人2 天前
如何解决 pip install -r requirements.txt 私有仓库认证失败 401 Unauthorized 问题
开发语言·python·scrapy·flask·beautifulsoup·pandas·pip
m***记3 天前
Python 数据分析入门:Pandas vs NumPy 全方位对比
python·数据分析·pandas
小钱c73 天前
Python使用 pandas操作Excel文件并新增列数据
python·excel·pandas
虎头金猫5 天前
我的远程开发革命:从环境配置噩梦到一键共享的蜕变
网络·python·网络协议·tcp/ip·beautifulsoup·负载均衡·pandas
悟乙己6 天前
PandasAI :使用 AI 优化你的分析工作流
人工智能·pandas·pandasai
weixin_456904278 天前
# Pandas 与 Spark 数据操作完整教程
大数据·spark·pandas
dlraba8028 天前
Pandas:机器学习数据处理的核心利器
人工智能·机器学习·pandas
猫头虎10 天前
如何查看局域网内IP冲突问题?如何查看局域网IP环绕问题?arp -a命令如何使用?
网络·python·网络协议·tcp/ip·开源·pandas·pip
peter676810 天前
pandas学习小结
学习·pandas