解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
唐骁虎20 小时前
使用SQLAlchemy查询Pandas DataFrame
数据库·oracle·pandas
万粉变现经纪人21 小时前
如何解决 pip install jaxlib[cuda] 报错 CUDA 版本与轮子标签不匹配 问题
人工智能·python·深度学习·tensorflow·pandas·scikit-learn·pip
Yu_Lijing2 天前
Python数据分析和数据处理库Pandas(数据组合函数)
人工智能·数据挖掘·数据分析·pandas
Yu_Lijing3 天前
Python数据分析和数据处理库Pandas(DataFrame数据分析入门)
人工智能·python·数据分析·pandas
星越华夏4 天前
Pandas实现excel的IF函数功能
excel·pandas
啦啦啦_99995 天前
Pandas之Series对象
pandas
xiaotao1316 天前
01-编程基础与数学基石:概率与统计
人工智能·python·numpy·pandas
人工干智能9 天前
科普:python的pandas包中的DataFrame就是二维表
开发语言·python·pandas
橙露9 天前
Polars 极速数据框架:比 Pandas 更快的大数据处理
pandas
Yu_Lijing10 天前
Python数据分析和数据处理库Pandas(Series篇)
人工智能·python·数据分析·pandas