Pandas库学习之DataFrame.replace()函数
一、简介
DataFrame.replace()
函数用于替换DataFrame中的指定值。该函数允许使用单个值、列表、字典或正则表达式进行替换操作,非常灵活。
二、语法和参数
python
DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')
- to_replace :需要替换的值,可以是单个值、列表、字典或正则表达式。
- value:替换后的值,可以是单个值、列表或字典。
- inplace:布尔值,是否在原DataFrame上进行替换,默认False。
- limit:整数,限制替换的数量。
- regex :布尔值,是否将
to_replace
作为正则表达式处理,默认False。 - method :当
to_replace
是NA值时,指定填充方法,如'pad'、'ffill'、'bfill'。
三、实例
3.1 替换单个值
python
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# 替换值
df.replace(1, 10, inplace=True)
print(df)
输出:
A B
0 10 4
1 2 5
2 3 6
3.2 使用字典替换值
python
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# 使用字典替换值
df.replace({'A': 1, 'B': 4}, 100, inplace=True)
print(df)
输出:
A B
0 100 100
1 2 5
2 3 6
3.3 使用列表替换值
python
import pandas as pd
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# 使用列表替换值
df.replace([1, 4], [100, 400], inplace=True)
print(df)
输出:
A B
0 100 400
1 2 5
2 3 6
3.4 使用正则表达式替换值
python
import pandas as pd
data = {'A': ['foo', 'bar', 'baz'], 'B': ['fuz', 'buz', 'faz']}
df = pd.DataFrame(data)
# 使用正则表达式替换值
df.replace(to_replace=r'^b', value='new', regex=True, inplace=True)
print(df)
输出:
A B
0 foo fuz
1 new newz
2 new faz
四、注意事项
- 当使用
inplace=True
时,DataFrame会直接修改,无需重新赋值。 - 当
to_replace
为字典时,value
的值必须与to_replace
的键相对应。 - 使用正则表达式时,需将
regex
参数设置为True。