python的文件处理

文件分为文本文件和二进制文件:

我这样理解:就是电脑上用记事本打开我们可以看懂的文件就是文本文件,比如docx,txt,cpp,json,md等。直接点开看不懂的就是二进制文件,比如png,m4a,这些需要特定的解码器我们才能看懂。

差异体现在编码逻辑上。

文本文件和二进制文件的定义:

文本文件 是一种计算机文件,其内容主要是人类可读的字符数据,如字母、数字、标点符号以及可能的特殊控制字符。这些字符信息依据一定的字符编码标准(如ASCII、UTF-8等)被转换为二进制数据存储在文件中。
二进制文件是一种以二进制格式存储数据或程序指令的计算机文件。与文本文件(如ASCII文件)不同,二进制文件不仅包含可打印字符,还可能包括无法直接阅读的字节,如图像像素数据、音频波形、数据库数据结构、编译后的程序代码等。在二进制文件中,信息按特定的值编码,每个值的位数(即多少个比特代表一个值)依据文件格式和用途而定,这使得二进制文件能够高效地存储复杂的数据结构和程序指令。

文本文件 二进制文件
编码 计算机使用字符编码将文本字符(如字母、数字、符号)转换为字节(即0和1的序列) 将数据以二进制形式编码。这些数据可以代表任何内容,从图像的像素到音频的波形,或者程序的机器码。
文件访问 文件系统会根据文件的存储位置读取字节序列,然后操作系统或应用程序根据相应的字符编码将这些字节转换回字符,以便于显示或处理 读取二进制文件时,必须使用理解特定文件格式的程序来正确解释文件内容。
拓展名 1.普通文件:txt 2.编程语言源代码文件:py、java、c/cpp、js、html/css 3.配置文件:json、xml、ini、yaml/yml 4.脚本文件:sh、bat 5.数据文件:csv、log 6.文档和标记语言文件:md、tex 1.图像文件:jpeg、png、gif、bmp、tiff、raw、webp、svg、heif、psd 2.音频文件:mp3、wav、aac、flac 3.视频文件:mp4、avi
相关推荐
明月_清风26 分钟前
Python 内存手术刀:sys.getrefcount 与引用计数的生死时速
后端·python
明月_清风29 分钟前
Python 消失的内存:为什么 list=[] 是新手最容易踩的“毒苹果”?
后端·python
Flittly15 小时前
【从零手写 ClaudeCode:learn-claude-code 项目实战笔记】(3)TodoWrite (待办写入)
python·agent
千寻girling19 小时前
一份不可多得的 《 Django 》 零基础入门教程
后端·python·面试
databook1 天前
探索视觉的边界:用 Manim 重现有趣的知觉错觉
python·动效
明月_清风1 天前
Python 性能微观世界:列表推导式 vs for 循环
后端·python
明月_清风1 天前
Python 性能翻身仗:从 O(n) 到 O(1) 的工程实践
后端·python
helloweilei2 天前
python 抽象基类
python
用户8356290780512 天前
Python 实现 PPT 转 HTML
后端·python
zone77392 天前
004:RAG 入门-LangChain读取PDF
后端·python·面试