文件分为文本文件和二进制文件:
我这样理解:就是电脑上用记事本打开我们可以看懂的文件就是文本文件,比如docx,txt,cpp,json,md等。直接点开看不懂的就是二进制文件,比如png,m4a,这些需要特定的解码器我们才能看懂。
差异体现在编码逻辑上。
文本文件和二进制文件的定义:
文本文件 是一种计算机文件,其内容主要是人类可读的字符数据,如字母、数字、标点符号以及可能的特殊控制字符。这些字符信息依据一定的字符编码标准(如ASCII、UTF-8等)被转换为二进制数据存储在文件中。
二进制文件是一种以二进制格式存储数据或程序指令的计算机文件。与文本文件(如ASCII文件)不同,二进制文件不仅包含可打印字符,还可能包括无法直接阅读的字节,如图像像素数据、音频波形、数据库数据结构、编译后的程序代码等。在二进制文件中,信息按特定的值编码,每个值的位数(即多少个比特代表一个值)依据文件格式和用途而定,这使得二进制文件能够高效地存储复杂的数据结构和程序指令。
文本文件 | 二进制文件 | |
---|---|---|
编码 | 计算机使用字符编码将文本字符(如字母、数字、符号)转换为字节(即0和1的序列) | 将数据以二进制形式编码。这些数据可以代表任何内容,从图像的像素到音频的波形,或者程序的机器码。 |
文件访问 | 文件系统会根据文件的存储位置读取字节序列,然后操作系统或应用程序根据相应的字符编码将这些字节转换回字符,以便于显示或处理 | 读取二进制文件时,必须使用理解特定文件格式的程序来正确解释文件内容。 |
拓展名 | 1.普通文件:txt 2.编程语言源代码文件:py、java、c/cpp、js、html/css 3.配置文件:json、xml、ini、yaml/yml 4.脚本文件:sh、bat 5.数据文件:csv、log 6.文档和标记语言文件:md、tex | 1.图像文件:jpeg、png、gif、bmp、tiff、raw、webp、svg、heif、psd 2.音频文件:mp3、wav、aac、flac 3.视频文件:mp4、avi |