python的文件处理

文件分为文本文件和二进制文件:

我这样理解:就是电脑上用记事本打开我们可以看懂的文件就是文本文件,比如docx,txt,cpp,json,md等。直接点开看不懂的就是二进制文件,比如png,m4a,这些需要特定的解码器我们才能看懂。

差异体现在编码逻辑上。

文本文件和二进制文件的定义:

文本文件 是一种计算机文件,其内容主要是人类可读的字符数据,如字母、数字、标点符号以及可能的特殊控制字符。这些字符信息依据一定的字符编码标准(如ASCII、UTF-8等)被转换为二进制数据存储在文件中。
二进制文件是一种以二进制格式存储数据或程序指令的计算机文件。与文本文件(如ASCII文件)不同,二进制文件不仅包含可打印字符,还可能包括无法直接阅读的字节,如图像像素数据、音频波形、数据库数据结构、编译后的程序代码等。在二进制文件中,信息按特定的值编码,每个值的位数(即多少个比特代表一个值)依据文件格式和用途而定,这使得二进制文件能够高效地存储复杂的数据结构和程序指令。

文本文件 二进制文件
编码 计算机使用字符编码将文本字符(如字母、数字、符号)转换为字节(即0和1的序列) 将数据以二进制形式编码。这些数据可以代表任何内容,从图像的像素到音频的波形,或者程序的机器码。
文件访问 文件系统会根据文件的存储位置读取字节序列,然后操作系统或应用程序根据相应的字符编码将这些字节转换回字符,以便于显示或处理 读取二进制文件时,必须使用理解特定文件格式的程序来正确解释文件内容。
拓展名 1.普通文件:txt 2.编程语言源代码文件:py、java、c/cpp、js、html/css 3.配置文件:json、xml、ini、yaml/yml 4.脚本文件:sh、bat 5.数据文件:csv、log 6.文档和标记语言文件:md、tex 1.图像文件:jpeg、png、gif、bmp、tiff、raw、webp、svg、heif、psd 2.音频文件:mp3、wav、aac、flac 3.视频文件:mp4、avi
相关推荐
wt_cs18 分钟前
银行回单ocr api集成解析-图像文字识别-文字识别技术
开发语言·python
_WndProc40 分钟前
【Python】Flask网页
开发语言·python·flask
互联网搬砖老肖42 分钟前
Python 中如何使用 Conda 管理版本和创建 Django 项目
python·django·conda
测试者家园1 小时前
基于DeepSeek和crewAI构建测试用例脚本生成器
人工智能·python·测试用例·智能体·智能化测试·crewai
大模型真好玩1 小时前
准确率飙升!Graph RAG如何利用知识图谱提升RAG答案质量(四)——微软GraphRAG代码实战
人工智能·python·mcp
前端付豪1 小时前
11、打造自己的 CLI 工具:从命令行到桌面效率神器
后端·python
前端付豪1 小时前
12、用类写出更可控、更易扩展的爬虫框架🕷
后端·python
江太翁1 小时前
Pytorch torch
人工智能·pytorch·python
网安INF2 小时前
深度学习中的逻辑回归:从原理到Python实现
人工智能·python·深度学习·算法·逻辑回归
青苔猿猿2 小时前
(5)aconda之.condarc文件配置
python·镜像源·.condarc文件