解决方案:Pandas如何用np.where将值分成两类,及处理异常值更新数据

文章目录


一、现象

用SQL将值分成两类,就是使用case when,来进行处理。

我平常用SQL处理数据这方面比较多,但用Pandas处理数据这方面比较少,所以一时犯了难,百度一下解决了,鉴于此,就发篇博客记录一下

二、解决方案

举个例子:

第一种方式:用pandas处理该值,当<= 0,赋值为0,反之为1,成为新字段

python 复制代码
df['chazhi_flag'] = np.where(df['chazhi'] <= 0, '0', '1')

第二种方式:用pandas处理该值,当消费金额< 0.01,是异常值赋值为0,反之为当前值

python 复制代码
df['money_amt'] = np.where(df['money_amt'] < 0.01, 0, df['money_amt'])

解决方案:网上各种资料尝试一番

相关推荐
咚咚王者12 小时前
人工智能之数据分析 Pandas:第二章 Series
人工智能·数据分析·pandas
咚咚王者13 小时前
人工智能之数据分析 Pandas:第一章 简介和安装
人工智能·数据分析·pandas
王大傻09281 天前
Series创建
pandas
dubochao_xinxi2 天前
fastapi 接收10g 以上的文件 pandas 读取超过 10GB 的 Excel 文件
excel·pandas·fastapi
N***73853 天前
后端数据一致性
hdfs·pandas·sstable
江上月5134 天前
Pandas 高级教程:解锁数据分析的强大潜能
数据挖掘·数据分析·pandas
AI小云6 天前
【数据操作与可视化】Pandas数据处理-其他操作
python·pandas
飞梦工作室11 天前
突破 pandas 瓶颈:实时读写 Excel 与超透视汇总函数的双维解决方案
python·excel·pandas
Python大数据分析@12 天前
Vaex :突破pandas,快速分析100G大数据量
pandas
AI小云12 天前
【数据操作与可视化】Pandas数据处理-Series数据结构
开发语言·数据结构·python·numpy·pandas