python从入门到精通：文件操作

1、文件编码

2、文件的读取

[open( )打开函数](#open( )打开函数)

3、文件的写入

4、文件的追加

5、文件的操作（综合案例）

1、文件编码

因为计算机只能识别0和1，所以我们是通过编码技术（密码本）将内容翻译成0和1存入，从而识别文本文件。

编码技术：翻译的规则，记录了如何将内容翻译成二进制，以及如何将二进制翻译回可识别内容。

计算机中有许多可用编码：UTF-8、GBK、Big5等等，不同的编码，将内容翻译成二进制也是不同的。

UTF-8是目前全球通用的编码格式，除非有特殊需求。否则，一律以UTF-8格式进行文件编码即可。

2、文件的读取

文件的概念：内存中存放的数据正在计算机关机后就会消失。要长久保存数据，就要使用硬盘、光盘、U盘等设备。为了便于数据的管理与检索，引入了"文件"的概念。

一篇文章、一段视频、一个可执行程序，都可以被保存为一个文件，并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说，文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。

文件的基本操作：打开文件、读写文件、关闭文件（可以仅打开和关闭，不进行任何操作）

open( )打开函数

在python中，使用open函数，可以打开一个已经存在的文件，或者创建一个新文件，语法：

open(name,mode,encoding)

name:是要打开的目标文件名的字符串（可以包含文件所在的具体路径）。

mode:设置文件打开的模式：只读、写入、追加等

encoding:编码格式（默认UTF-8）

示例：

python 复制代码

f = open("python.txt","r",encoding="UTF-8")
# encoding的顺序不是第三位，所以不能用位置参数，用关键字参数直接指定
print(type(f)) # <class '_io.TextIOWrapper'>

此时的"f"是"open"函数的文件对象，对象是python中一种特殊的数据类型，拥有属性和方法可以使用对象。

|----|-----------------------------------------------------------|
| 模式 | 描述 |
| r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式 |
| w | 打开一个文件只用于写入。如果该文件已经存在则打开文件，并从头开始编辑，原有内容被删除，若该文件不存在，则创建新文件 |
| a | 打开一个文件用于追加。如果该文件已经存在，新的内容将会被写入到已有内容之后。若该文件不存在，创建新文件进行写入 |

read( )方法：

文件对象.read(num)

num表示要从文件中读取的数据的长度（单位是字符），如果没有传入num，那么就表示读取文件中所有的数据。

readlinnes( )方法：

readlines可以按照行的方式把整个文件的内容进行一次性读取，并且返回的是一个列表，其中每一行的数据为一个元素

python 复制代码

f = open("python.txt","r",encoding="UTF-8")
# content = f.read()
# print(content) # 文本中的内容为：你好
# f.close()
content =f.readlines()
print(content) # ['你好\n', '世界\n', '很大']
f.close()

readline( )方法：一次读取一行内容

python 复制代码

# 一次读取一行内容：readline()
f = open("python.txt","r",encoding="UTF-8")
content = f.readline()
print(f"第一行：{content}")
content = f.readline()
print(f"第二行：{content}")
f.close()

for循环读取文件行：

python 复制代码

# for循环读取文件行
for line in open("python.txt","r",encoding="UTF-8"):
    print(line)
# 每一个line临时变量，就纪录了文件的一行数据
time.sleep(500000) # 暂停执行，休眠
# f.close()

注意：最后要通过close，关闭文件对象，也就是关闭对文件的占用，如果不调用close，同时程序没有停止运行，那么这个文件将一直被python程序占用。

with open语法：

python 复制代码

with open("python.txt","r",encoding="UTF-8") as f:
    f.readlines()
# 通过在with open的语句块对文件进行操作，可以在操作完成后自动关闭close文件，避免一是忘掉close方法

python 复制代码

# 案例：统计文档：测试.txt中hello字符串的数量
# 方法1：
f=open("测试.txt","r",encoding="utf-8")
content=f.read()
count=content.count("itheima")
print(count)
f.close()
# 方法2：
f=open("测试.txt","r",encoding="utf-8")
count=0
for line in f:
    # line=line.strip()
    line=line.replace("\n","")
    words = line.split(" ")
    for word in words:
        if word == "itheima":
            count+=1
print(count)
f.close()

3、文件的写入

文件写入：

打开文件

f=open(name,"w",encoding="UTF-8")

文件写入

f.write(内容)

内容刷新

f.flush( ）

注意：

1、直接调用write，内容并未真正写入文件，而是会积攒在程序的内存中，称之为缓冲区

2、当调用flush的时候，内容会真正写入文件

3、这样做是为了避免频繁的操作硬盘，导致效率下降

python 复制代码

import time
f=open("test.txt","w")
f.write("你好，世界！")
f.flush()
time.sleep(50000)
f.close() # close方法，内置了flush的功能
#当文件已经存在，会把原来的内容清空
f=open("test.txt","w")
f.write("哈哈")
f.close()

4、文件的追加

语法：

打开文件

f=open(name,"a",encoding="UTF-8")

文件写入

f.write(内容)

内容刷新

f.flush( ）

python 复制代码

f=open("dwq.txt","a",encoding="utf-8")
f.write("保持热爱")
f.close()
f=open("dwq.txt","a",encoding="utf-8")
f.write("，共赴山海")
f.close()
# 结果为：保持热爱，共赴山海

5、文件的操作（综合案例）

python 复制代码

# 文件备份案例，有一份账单，记录了消费和收入的具体记录：将文件写出到csdn.txt.bak文件作为备份，同时，将文件内标记为测试的数据丢弃
fr=open("csdn.txt","r",encoding="utf-8")
fw=open("csdn.txt.bak","w",encoding="utf-8")
for line in f:
    line=line.strip()
    if line.split("，")[4] == "测试":
        continue
    fw.write(line)
    # 由于前面对内容加了strip()操作，需手动写出换行符
    fw.write("\n")
fr.close()
fw.close()