一、文件的编码
1. 编码概念
编码是内容和二进制间相互转换的规则集合,由于计算机仅识别0和1,所以需通过编码将文本转二进制存储,也需编码将二进制转回可识别内容。
不同编码的转换规则不同,使用错误编码读写文件会导致内容乱码。

2. 常见编码
-
UTF-8 :全球通用编码,推荐优先使用
-
GBK:主要用于中文简体环境
-
Big5:主要用于中文繁体环境
3. 查看文件编码
Windows系统可通过记事本打开文件,在底部状态栏查看编码格式。

二、文件的基本操作
1. 文件操作核心步骤
-
打开文件
-
读写/追加文件
-
关闭文件
(可仅打开并关闭文件,不执行读写操作)
2. 打开文件:open()函数
语法
python
open(name, mode, encoding)
-
name:文件路径(字符串,可含绝对/相对路径) -
mode:文件打开模式(只读r、写入w、追加a) -
encoding:编码格式(关键字参数,推荐UTF-8)
示例
python
# 以只读模式打开python.txt,编码为UTF-8
f = open('python.txt', 'r', encoding='UTF-8')
注意 :f为文件对象,是Python特殊数据类型,后续通过该对象执行文件操作。
3. 常用打开模式
| 模式 | 描述 |
|---|---|
| r | 只读,文件指针在开头,默认模式;文件不存在则报错 |
| w | 只写,文件不存在则创建,文件存在则清空原有内容 |
| a | 追加,文件不存在则创建,新内容写在原有内容之后 |
三、文件的读取
1. 核心读取方法
(1)read(num):读取指定字节数
num:可选,指定读取字节数;不指定则读取全部内容
python
f = open('python.txt', 'r', encoding='UTF-8')
# 读取10个字节
content1 = f.read(10)
# 读取剩余全部内容
content2 = f.read()
f.close()
print(content1, content2)
(2)readline():一次读取一行内容
python
f = open('python.txt', 'r', encoding='UTF-8')
# 读取第一行
line1 = f.readline()
# 读取第二行
line2 = f.readline()
f.close()
print(f'第一行:{line1}')
print(f'第二行:{line2}')
(3)readlines():读取全部行,返回列表(每行是一个元素)
python
f = open('python.txt', 'r', encoding='UTF-8')
# 得到列表,元素含换行符\n
content = f.readlines()
f.close()
print(content) # 示例:['hello world\n', 'python\n', 'itheima\n']
(4)for循环读取:逐行读取,高效省内存
python
# 直接遍历文件对象,每次循环得到一行内容
for line in open('python.txt', 'r', encoding='UTF-8'):
print(line)
2. 关闭文件:close()
释放文件占用,若不关闭,程序运行时文件会被Python持续占用。
python
f = open('python.txt', 'r', encoding='UTF-8')
content = f.read()
# 必须关闭文件
f.close()
3. 自动关闭:with open语法
无需手动调用close(),代码块执行完自动关闭文件,推荐使用!
python
f = open('python.txt', 'r', encoding='UTF-8')
content = f.read()
# 必须关闭文件
f.close()
4. 读取练习:单词计数
需求 :读取word.txt,统计itheima出现的次数
word.txt内容:
python
itheima itcast python
itheima python itcast
beijing shanghai itheima
shenzhen guangzhou itheima
wuhan hangzhou itheima
zhengzhou bigdata itheima
实现代码:
python
# 初始化计数器
count = 0
# 打开文件逐行读取
with open('word.txt', 'r', encoding='UTF-8') as f:
for line in f:
# 去除行尾换行符,按空格分割成单词列表 strip () 去首尾空白 split () 按符号切分数据
words = line.strip().split()
# 遍历单词,统计itheima
for word in words:
if word == 'itheima':
count += 1
print(f'itheima出现的次数:{count}') # 结果:6
四、文件的写入
1. 核心语法
使用w模式打开文件,通过write()写入内容,flush()刷新到硬盘(避免缓冲区积压)。
python
# 1. 以w模式打开文件(不存在则创建,存在则清空)
f = open('python.txt', 'w', encoding='UTF-8')
# 2. 写入内容(仅存于缓冲区,未真正写入文件)
f.write('hello world\nI love Python')
# 3. 刷新缓冲区,内容写入硬盘
f.flush()
# 4. 关闭文件(close自带flush功能,可省略flush)
f.close()
2. 简化写法(with open)
python
with open('python.txt', 'w', encoding='UTF-8') as f:
f.write('hello world\nI love Python')
# 自动close,自带flush,无需手动操作
3. 注意事项
-
w模式下,文件不存在自动创建 ,文件存在清空原有内容 -
写入的内容必须是字符串 ,数字需先通过
str()转换
五、文件的追加
1. 核心语法
使用a模式打开文件,写入方法与w模式一致,新内容追加在文件末尾。
python
# 以a模式打开文件(不存在则创建,存在则追加)
with open('python.txt', 'a', encoding='UTF-8') as f:
# 追加内容,\n实现换行
f.write('\n这是追加的内容')
2. 注意事项
-
a模式下,文件指针默认在文件末尾,始终追加写入 -
可通过
\n实现换行追加,避免内容连在一起 -
同样支持
write()和flush(),close()自带flush功能
六、文件操作综合案例:账单备份与数据过滤
1. 需求
-
读取
bill.txt账单文件 -
备份文件到
bill.txt.bak -
过滤掉标记为测试 的行,仅保留正式行写入备份文件
2. bill.txt原始内容
python
name,date,money,type,remarks
周杰轮,2022-01-01,100000,消费,正式
周杰轮,2022-01-02,300000,收入,正式
周杰轮,2022-01-03,100000,消费,测试
林俊节,2022-01-01,300000,收入,正式
林俊节,2022-01-02,100000,消费,测试
林俊节,2022-01-03,100000,消费,正式
林俊节,2022-01-04,100000,消费,测试
林俊节,2022-01-05,500000,收入,正式
张学油,2022-01-01,100000,消费,正式
张学油,2022-01-02,500000,收入,正式
张学油,2022-01-03,900000,收入,测试
王力鸿,2022-01-01,500000,消费,正式
王力鸿,2022-01-02,300000,消费,测试
王力鸿,2022-01-03,950000,收入,正式
刘德滑,2022-01-01,300000,消费,测试
刘德滑,2022-01-02,100000,消费,正式
刘德滑,2022-01-03,300000,消费,正式
3. 实现代码
python
# 打开原文件(读)和备份文件(写),同时操作
with open('bill.txt', 'r', encoding='UTF-8') as f_read, open('bill.txt.bak', 'w', encoding='UTF-8') as f_write:
# 逐行读取原文件
for line in f_read:
# 去除行尾换行符,按逗号分割
line_list = line.strip().split(',')
# 判断是否为测试行(最后一列是remarks)
if line_list[-1] == '测试':
# 跳过测试行
continue
# 正式行,写入备份文件(保留原换行符)
f_write.write(line)
print('账单备份并过滤完成,备份文件:bill.txt.bak')
七、核心知识点总结
-
编码优先使用UTF-8,避免文件乱码;
-
文件操作三步骤:打开→操作→关闭 ,推荐
with open自动关闭; -
三种核心模式:
r(读)、w(写,清空)、a(追加); -
读取方法:
read()、readline()、readlines()、for循环(推荐); -
写入/追加:
write()写入内容,flush()刷新硬盘,close()自带flush; -
w和a模式:文件不存在自动创建,w清空原有内容,a追加末尾。