Python的Pandas库(二)进阶使用

Python开发实用教程

DataFrame的运算

DataFrame重载了运算符,支持许多的运算

算术运算

|---------------------|----------------------------|
| 运算方法 | 运算说明 |
| df.add(other) | 对应元素的加,如果是标量,就每个元素加上标量 |
| df.radd(other) | 等效于other+df |
| df.sub(other) | 对应元素相减,如果是标量,就每个元素减去标量 |
| df.rsub(other) | other-df |
| df.mul(other) | 对应元素相乘,如果是标量,每个元素乘以标量 |
| df.rmul(other) | other*df |
| df.div(other) | 对应元素相除,如果是标量,每个元素除以标量 |
| df.rdiv(other) | other/df |
| df.truediv(other) | 对应元素相除,如果是标量,每个元素除以标量 |
| df.rtruediv(other) | other/df |
| df.floordiv(other) | 对应元素相除取整,如果是标量,每个元素除以标量 |
| df.rfloordiv(other) | other//df |
| df.mod(other) | 对应元素相除取余,如果是标量,每个元素除以标量 |
| df.rmod(other) | other%df |
| df.pow(other) | 对应元素的次方,如果是标量,每个元素的other次方 |
| df.rpow(other) | other**df |

python 复制代码
import pandas as pd

df1 = pd.DataFrame({'c1':[1,2,3,4],'c2':[5,6,7,8],'c3':[10,11,12,13]})
df2 = pd.DataFrame({'c1':[11,12,13,14],'c2':[10,20,30,40],'c3':[100,200,300,400]})
df3 = df1 + df2
print(df3)
'''
   c1  c2   c3
0  12  15  110
1  14  26  211
2  16  37  312
3  18  48  413
'''

df4 = pd.DataFrame({'c1':[11,12,13,14]})
df5 = df1 + df4
print(df5)
'''
   c1  c2  c3
0  12 NaN NaN
1  14 NaN NaN
2  16 NaN NaN
3  18 NaN NaN
'''

df6 = df1 + 1
print(df6)
'''
   c1  c2  c3
0   2   6  11
1   3   7  12
2   4   8  13
3   5   9  14
'''

df7 = df1 -2
print(df7)
'''
   c1  c2  c3
0  -1   3   8
1   0   4   9
2   1   5  10
3   2   6  11
'''

df8 = 2 - df1
print(df8)
'''
   c1  c2  c3
0   1  -3  -8
1   0  -4  -9
2  -1  -5 -10
3  -2  -6 -11
'''

比较运算

比较运算如果是标量,就是每个元素与标量的比较,如果是两个形状一样的DataFrame,生成一个每个元素对应比较的DataFrame。

DataFrame读写文件

|-----------------------------------------------------|----------------------------------|
| 方法名 | 说明 |
| read_table(filepath_or_buffer, *[, sep, ...]) | 从带分隔符的文件读取 |
| read_csv(filepath_or_buffer, *[, sep, ...]) | 读csv格式文件 |
| DataFrame.to_csv([path_or_buf, sep, na_rep, ...]) | 写csv格式文件 |
| read_fwf(filepath_or_buffer, *[, colspecs, ...]) | 读固定宽度的格式文件 |
| read_excel(io[, sheet_name, header, names, ...]) | 读excel文件 |
| DataFrame.to_excel(excel_writer[, ...]) | 写excel文件 |
| ExcelFile(path_or_buffer[, engine, ...]) | 用于将表格格式Excel工作表解析为DataFrame对象的类。 |
| ExcelFile.parse([sheet_name, header, names, ...]) | 解析一个指定的sheet |
| Styler.to_excel(excel_writer[, sheet_name, ...]) | 写指定的sheet |
| ExcelWriter(path[, engine, date_format, ...]) | 用于写入Excel的类 |
| read_json(path_or_buf, *[, orient, typ, ...]) | 从JSON格式读取数据 |
| DataFrame.to_json([path_or_buf, orient, ...]) | 转为为JSON对象字符串 |
| read_html(io, *[, match, flavor, header, ...]) | 从HTML表格读取数据 |
| DataFrame.to_html([buf, columns, col_space, ...]) | 生成HTML表格 |
| Styler.to_html([buf, table_uuid, ...]) | 生成HTML表格 |

相关推荐
IVEN_1 小时前
只会Python皮毛?深入理解这几点,轻松进阶全栈开发
python·全栈
Ray Liang3 小时前
用六边形架构与整洁架构对比是伪命题?
java·python·c#·架构设计
AI攻城狮3 小时前
如何给 AI Agent 做"断舍离":OpenClaw Session 自动清理实践
python
千寻girling3 小时前
一份不可多得的 《 Python 》语言教程
人工智能·后端·python
字节跳动数据平台5 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
AI攻城狮6 小时前
用 Playwright 实现博客一键发布到稀土掘金
python·自动化运维
得物技术6 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
曲幽6 小时前
FastAPI分布式系统实战:拆解分布式系统中常见问题及解决方案
redis·python·fastapi·web·httpx·lock·asyncio
武子康8 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive