Python基础:18、Python文件操作

1)文件的编码
  1. 什么是编码?

    编码就是一种规则集合,记录了内容和二进制间进行相互转换的逻辑。

    编码有许多中,我们最常用的是UTF-8编码

  2. 为什么需要使用编码?

    计算机只认识0和1,所以需要将内容翻译成0和1才能保存在计算机中。

    同时也需要编码, 将计算机保存的0和1,反向翻译回可以识别的内容

2)文件的读写

打开、关闭、读、写

1.open() 打开函数

python 复制代码
open(name, mode, encoding)
open("文件路径", "打开文件的模式",encoding="编码格式")

name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。

mode:设置打开文件的模式(访问模式):只读、写入、追加等。

encoding:编码格式(推荐使用UTF-8)

模式 描述
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。 如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。 如果该文件不存在,创建新文件进行写入。

read()方法

python 复制代码
文件对象.read(num)

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

readlines()方法

readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。

readline()方法

一次读取一行内容

python 复制代码
# 打开文件
f = open("C:/Users/Lenovo/Desktop/txt/1.txt", "r", encoding="gbk")
print(type(f))
​
# 读取文件 - read()
# Read = f.read(10)
# print(f"读取10个字节的结果是:{Read}")
# print(f"read()方法读取的结果是:{f.read()}")
​
# 读取文件 - readLines()
# lines = f.readlines()
# print(f"lines对象的类型是:{type(lines)}")
# print(f"lines对象的内容是:{lines}")
​
# 读取文件 - readLine()
line1 = f.readline()
line2 = f.readline()
line3 = f.readline()
print(f"第一行数据是:{line1}")
print(f"第二行数据是:{line2}")
print(f"第三行数据是:{line3}")
​
# for循环读取文件行
for line in f:
    print(f"每一行数据是:{line}")
​
# 文件的关闭
f.close()

注意:文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被一直占用

with open方法

python 复制代码
# with open 语法操作文件    执行完程序后会自动的close
with open("C:/Users/Lenovo/Desktop/txt/1.txt", "r", encoding="gbk") as f:
    for line in f:
        print(f"with open每一行数据是:{line}")

总结:

操作 功能
文件对象 = open(file, mode, encoding) 打开文件获得文件对象
文件对象.read(num) 读取指定长度字节 不指定num读取文件全部
文件对象.readline() 读取一行
文件对象.readlines() 读取全部行,得到列表
for line in 文件对象 for循环文件行,一次循环得到一行数据
文件对象.close() 关闭文件对象
with open() as f 通过with open语法打开文件,可以自动关闭

例子:

python 复制代码
"""
通过文件读取操作,统计itheima单词出现的次数
​
itheima itcast python
itheima python itcast
beijing shanghai itheima
shenzhen guangzhou itheima
wuhan hangzhou itheima
zhengzhou bigdata itheima
​
"""
f = open("F:/Vscode-project/Python_project/Word.txt", "r", encoding="utf-8")
# 方式1,读取全部内容,通过字符串count方式统计itheima单词的数量
# Read = f.read()
# print(f"文件的内容是:{Read}")
#
# count = Read.count("itheima")
# print(f"单词itheima在文件中出现的次数是:{count}次")
​
# 方式2:一行行读取
count = 0
for line in f:
    line = line.strip()  # 去除首尾的空格以及换行符
    words = line.split(" ")
    for word in words:
        # 判断单词出现的次数累计
        if word == "itheima":
            count += 1
​
print(f"单词itheima在文件中出现的次数是:{count}次")
​
# 关闭文件
f.close()
python 复制代码
单词itheima在文件中出现的次数是:6次
3)文件的写入

1. 打开文件

python 复制代码
f = open('python.txt', 'w')

2. 文件写入

python 复制代码
f.write('hello world')

#3.内容刷新

python 复制代码
f.flush()

注意:

  • 直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区

  • 当调用flush的时候,内容会真正写入文件

  • 这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)

python 复制代码
# 打开文件,不存在的文件
f = open("F:/Vscode-project/Python_project/test_txt/2.txt", "w", encoding="UTF-8")
​
# write写入
f.write("hello world!")  # 内容写到内存中
​
# flush刷新
f.flush()      # 将内存中积攒的内容,写入到硬盘的文件中
​
# 关闭文件
f.close()      # close的方法,内置了flush的功能
  1. 写入文件使用open函数的"w"模式进行写入

  2. 写入的方法有:

    •wirte(),写入内容

    •flush(),刷新内容到硬盘中

  3. 注意事项:

  • w模式,文件不存在,会创建新文件

  • w模式,文件存在,会清空原有内容

  • close()方法,带有flush()方法的功能

4)文件的追加

注意:

  • a模式,文件不存在会创建文件

  • a模式,文件存在会在最后,追加写入文件

python 复制代码
# 打开文件,不存在的文件
f = open("F:/Vscode-project/Python_project/test_txt/3.txt", "a", encoding="UTF-8")
​
# write写入
f.write("hello world!")  # 内容写到内存中
​
# flush刷新
f.flush()      # 将内存中积攒的内容,写入到硬盘的文件中
​
# 关闭文件
f.close()      # close的方法,内置了flush的功能
​
# 打开文件,存在的文件
f = open("F:/Vscode-project/Python_project/test_txt/3.txt", "a", encoding="UTF-8")
​
# write写入
f.write("你好,世界!")  # 内容写到内存中
​
# flush刷新
f.flush()      # 将内存中积攒的内容,写入到硬盘的文件中
​
# 关闭文件
f.close()      # close的方法,内置了flush的功能
  1. 追加写入文件使用open函数的"a"模式进行写入

  2. 追加写入的方法有(和w模式一致):

    wirte(),写入内容

    flush(),刷新内容到硬盘中

  3. 注意事项:

    a模式,文件不存在,会创建新文件

    a模式,文件存在,会在原有内容后面继续写入

    可以使用"\n"来写出换行符

5)文件操作的综合案例

例子:文件备份

python 复制代码
# 完成文件的备份,将测试部分数据丢弃
# 打开bill.txt文件
f1 = open("F:/Vscode-project/Python_project/test_txt/bill.txt", "r", encoding="UTF-8")
​
# 打开bill.txt.bak文件
f2 = open("F:/Vscode-project/Python_project/test_txt/bill.txt.bak", "w", encoding="UTF-8")
​
# 循环读取f1的内容
for line in f1:
    line = line.strip()
    # 写入内容
    if line.split(",")[4] == "测试":
        continue
​
    f2.write(line)
    # 由于前面的内容进行了strip()的操作,需要手动的写出换行符
    f2.write("\n")
​
# 关闭f1,f2
f1.close()
f2.close()
相关推荐
湫ccc9 分钟前
《Python基础》之pip换国内镜像源
开发语言·python·pip
hakesashou11 分钟前
Python中常用的函数介绍
java·网络·python
菜鸟的人工智能之路21 分钟前
极坐标气泡图:医学数据分析的可视化新视角
python·数据分析·健康医疗
菜鸟学Python22 分钟前
Python 数据分析核心库大全!
开发语言·python·数据挖掘·数据分析
小白不太白95023 分钟前
设计模式之 责任链模式
python·设计模式·责任链模式
喜欢猪猪29 分钟前
Django:从入门到精通
后端·python·django
糖豆豆今天也要努力鸭34 分钟前
torch.__version__的torch版本和conda list的torch版本不一致
linux·pytorch·python·深度学习·conda·torch
何大春1 小时前
【弱监督语义分割】Self-supervised Image-specific Prototype Exploration for WSSS 论文阅读
论文阅读·人工智能·python·深度学习·论文笔记·原型模式
在下不上天1 小时前
Flume日志采集系统的部署,实现flume负载均衡,flume故障恢复
大数据·开发语言·python
SEVEN-YEARS1 小时前
深入理解TensorFlow中的形状处理函数
人工智能·python·tensorflow