解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
Keep__Fighting7 小时前
【机器学习:集成算法】
人工智能·算法·机器学习·pandas·集成学习·sklearn
Hi_kenyon8 小时前
Pandas Cheatsheet I
python·pandas
万粉变现经纪人10 小时前
如何解决 pip install 网络报错 403 Forbidden(访问被阻止)问题
数据库·python·pycharm·beautifulsoup·bug·pandas·pip
咚咚王者11 小时前
人工智能之数据分析 Pandas:第十一章 项目实践
人工智能·数据分析·pandas
咚咚王者13 小时前
人工智能之数据分析 Pandas:第十章 知识总结
人工智能·数据分析·pandas
编程设计3661 天前
pandas 中 DataFrame、mean()、groupby 和 fillna 函数的核心作用
机器学习·数据挖掘·pandas
咚咚王者1 天前
人工智能之数据分析 Pandas:第九章 性能优化
人工智能·数据分析·pandas
爱打代码的小林1 天前
python基础(pandas库)
服务器·python·pandas
Yawesh_best1 天前
在 openEuler 上使用 Pandas 进行数据分析实战
数据挖掘·数据分析·pandas
Hcoco_me1 天前
大模型面试题12:Torch的基本操作
pytorch·深度学习·pandas