python基础学习笔记第七章——文件操作

一、文件的编码

1. 编码概念

编码是内容和二进制间相互转换的规则集合，由于计算机仅识别0和1，所以需通过编码将文本转二进制存储，也需编码将二进制转回可识别内容。

不同编码的转换规则不同，使用错误编码读写文件会导致内容乱码。

2. 常见编码

UTF-8 ：全球通用编码，推荐优先使用
GBK：主要用于中文简体环境
Big5：主要用于中文繁体环境

3. 查看文件编码

Windows系统可通过记事本打开文件，在底部状态栏查看编码格式。

二、文件的基本操作

1. 文件操作核心步骤

打开文件
读写/追加文件
关闭文件

（可仅打开并关闭文件，不执行读写操作）

2. 打开文件：`open()`函数

语法

python 复制代码

open(name, mode, encoding)

name：文件路径（字符串，可含绝对/相对路径）
mode：文件打开模式（只读r、写入w、追加a）
encoding：编码格式（关键字参数，推荐UTF-8）

示例

python 复制代码

# 以只读模式打开python.txt，编码为UTF-8
f = open('python.txt', 'r', encoding='UTF-8')

注意：f为文件对象，是Python特殊数据类型，后续通过该对象执行文件操作。

3. 常用打开模式

模式	描述
r	只读，文件指针在开头，默认模式；文件不存在则报错
w	只写，文件不存在则创建，文件存在则清空原有内容
a	追加，文件不存在则创建，新内容写在原有内容之后

三、文件的读取

1. 核心读取方法

（1）`read(num)`：读取指定字节数

num：可选，指定读取字节数；不指定则读取全部内容

python 复制代码

f = open('python.txt', 'r', encoding='UTF-8')
# 读取10个字节
content1 = f.read(10)
# 读取剩余全部内容
content2 = f.read()
f.close()
print(content1, content2)

（2）`readline()`：一次读取一行内容

python 复制代码

f = open('python.txt', 'r', encoding='UTF-8')
# 读取第一行
line1 = f.readline()
# 读取第二行
line2 = f.readline()
f.close()
print(f'第一行：{line1}')
print(f'第二行：{line2}')

（3）`readlines()`：读取全部行，返回列表（每行是一个元素）

python 复制代码

f = open('python.txt', 'r', encoding='UTF-8')
# 得到列表，元素含换行符\n
content = f.readlines()
f.close()
print(content)  # 示例：['hello world\n', 'python\n', 'itheima\n']

（4）for循环读取：逐行读取，高效省内存

python 复制代码

# 直接遍历文件对象，每次循环得到一行内容
for line in open('python.txt', 'r', encoding='UTF-8'):
    print(line)

2. 关闭文件：`close()`

释放文件占用，若不关闭，程序运行时文件会被Python持续占用。

python 复制代码

f = open('python.txt', 'r', encoding='UTF-8')
content = f.read()
# 必须关闭文件
f.close()

3. 自动关闭：`with open`语法

无需手动调用close()，代码块执行完自动关闭文件，推荐使用！

python 复制代码

f = open('python.txt', 'r', encoding='UTF-8')
content = f.read()
# 必须关闭文件
f.close()

4. 读取练习：单词计数

需求：读取word.txt，统计itheima出现的次数

word.txt内容：

python 复制代码

itheima itcast python
itheima python itcast
beijing shanghai itheima
shenzhen guangzhou itheima
wuhan hangzhou itheima
zhengzhou bigdata itheima

实现代码：

python 复制代码

# 初始化计数器
count = 0
# 打开文件逐行读取
with open('word.txt', 'r', encoding='UTF-8') as f:
    for line in f:
        # 去除行尾换行符，按空格分割成单词列表 strip () 去首尾空白  split () 按符号切分数据
        words = line.strip().split()
        # 遍历单词，统计itheima
        for word in words:
            if word == 'itheima':
                count += 1
print(f'itheima出现的次数：{count}')  # 结果：6

四、文件的写入

1. 核心语法

使用w模式打开文件，通过write()写入内容，flush()刷新到硬盘（避免缓冲区积压）。

python 复制代码

# 1. 以w模式打开文件（不存在则创建，存在则清空）
f = open('python.txt', 'w', encoding='UTF-8')
# 2. 写入内容（仅存于缓冲区，未真正写入文件）
f.write('hello world\nI love Python')
# 3. 刷新缓冲区，内容写入硬盘
f.flush()
# 4. 关闭文件（close自带flush功能，可省略flush）
f.close()

2. 简化写法（with open）

python 复制代码

with open('python.txt', 'w', encoding='UTF-8') as f:
    f.write('hello world\nI love Python')
# 自动close，自带flush，无需手动操作

3. 注意事项

w模式下，文件不存在自动创建 ，文件存在清空原有内容
写入的内容必须是字符串 ，数字需先通过str()转换

五、文件的追加

1. 核心语法

使用a模式打开文件，写入方法与w模式一致，新内容追加在文件末尾。

python 复制代码

# 以a模式打开文件（不存在则创建，存在则追加）
with open('python.txt', 'a', encoding='UTF-8') as f:
    # 追加内容，\n实现换行
    f.write('\n这是追加的内容')

2. 注意事项

a模式下，文件指针默认在文件末尾，始终追加写入
可通过\n实现换行追加，避免内容连在一起
同样支持write()和flush()，close()自带flush功能

六、文件操作综合案例：账单备份与数据过滤

1. 需求

读取bill.txt账单文件
备份文件到bill.txt.bak
过滤掉标记为测试的行，仅保留正式行写入备份文件

2. bill.txt原始内容

python 复制代码

name,date,money,type,remarks
周杰轮,2022-01-01,100000,消费,正式
周杰轮,2022-01-02,300000,收入,正式
周杰轮,2022-01-03,100000,消费,测试
林俊节,2022-01-01,300000,收入,正式
林俊节,2022-01-02,100000,消费,测试
林俊节,2022-01-03,100000,消费,正式
林俊节,2022-01-04,100000,消费,测试
林俊节,2022-01-05,500000,收入,正式
张学油,2022-01-01,100000,消费,正式
张学油,2022-01-02,500000,收入,正式
张学油,2022-01-03,900000,收入,测试
王力鸿,2022-01-01,500000,消费,正式
王力鸿,2022-01-02,300000,消费,测试
王力鸿,2022-01-03,950000,收入,正式
刘德滑,2022-01-01,300000,消费,测试
刘德滑,2022-01-02,100000,消费,正式
刘德滑,2022-01-03,300000,消费,正式

3. 实现代码

python 复制代码

# 打开原文件（读）和备份文件（写），同时操作
with open('bill.txt', 'r', encoding='UTF-8') as f_read, open('bill.txt.bak', 'w', encoding='UTF-8') as f_write:
    # 逐行读取原文件
    for line in f_read:
        # 去除行尾换行符，按逗号分割
        line_list = line.strip().split(',')
        # 判断是否为测试行（最后一列是remarks）
        if line_list[-1] == '测试':
            # 跳过测试行
            continue
        # 正式行，写入备份文件（保留原换行符）
        f_write.write(line)
print('账单备份并过滤完成，备份文件：bill.txt.bak')

七、核心知识点总结

编码优先使用UTF-8，避免文件乱码；
文件操作三步骤：打开→操作→关闭 ，推荐with open自动关闭；
三种核心模式：r（读）、w（写，清空）、a（追加）；
读取方法：read()、readline()、readlines()、for循环（推荐）；
写入/追加：write()写入内容，flush()刷新硬盘，close()自带flush；
w和a模式：文件不存在自动创建，w清空原有内容，a追加末尾。

python基础学习笔记第七章——文件操作

一、文件的编码

1. 编码概念

2. 常见编码

3. 查看文件编码

二、文件的基本操作

1. 文件操作核心步骤

2. 打开文件：open()函数

语法

示例

3. 常用打开模式

三、文件的读取

1. 核心读取方法

（1）read(num)：读取指定字节数

（2）readline()：一次读取一行内容

（3）readlines()：读取全部行，返回列表（每行是一个元素）

（4）for循环读取：逐行读取，高效省内存

2. 关闭文件：close()

3. 自动关闭：with open语法

4. 读取练习：单词计数

四、文件的写入

1. 核心语法

2. 简化写法（with open）

3. 注意事项

五、文件的追加

1. 核心语法

2. 注意事项

六、文件操作综合案例：账单备份与数据过滤

1. 需求

2. bill.txt原始内容

3. 实现代码

七、核心知识点总结

2. 打开文件：`open()`函数

（1）`read(num)`：读取指定字节数

（2）`readline()`：一次读取一行内容

（3）`readlines()`：读取全部行，返回列表（每行是一个元素）

2. 关闭文件：`close()`

3. 自动关闭：`with open`语法