C语言文本模式和二进制模式

前言

本篇文章介绍一下C语言的文本模式和二进制模式

文本文件和二进制文件

从宏观上看,无论是文本文件还是二进制文件,文件中保存的都是0和1的序列,因为磁盘只有这两种状态。不同的文件只是对0、1序列的解释不同,如果文件内容是以字符编码的方式保存到文件中的,无论是以哪种编码方式,比如使用ascii编码,unicode编码都可以,这样的文件就是文本文件,也就是文本文件中存在的是一个个字符。如果文件保存的是机器可以识别的数值在内存中的表示,或者是图片、音频等编码的数据,那这种文件就是二进制文件,举个简单的例子,对于数字

int i=10000;

如果我们用文本方式保存该值,应该保存'1'、'0'、'0'、'0'、'0'五个字符,但是如果以二进制表示呢,我们只需要保存i的二进制表示
00000000 00000000 00100111 00010000

按照小端法保存依此应该是00010000 00100111 00000000 00000000

C语言的文本模式和二进制模式

C语言之所以要区分文本模式和二进制模式,主要原因就是不同的平台对文本文件的操作不一样,看下面这段代码:

#include <stdio.h>
int main(void)
{
    printf("\\r=%hhd,\\n=%hhd\n",'\r','\n');
    FILE* file = fopen("test.d", "w");
    fprintf(file, "A\nB");
    fclose(file);
    file = fopen("test.d", "rb");
    char ch=' ';
    while((ch=getc(file))!=EOF)
    {
        printf("%c,%hhd\n",ch,ch);
    }
    fclose(file);
    return 0;
}

在mac上显示结果如下:

\r=13,\n=10
A,65

,10
B,66

在win上显示结果如下:

\r=13,\n=10
A,65
,13

,10
B,66

可以发现,在mac上以文本模式存储换行符存储的是\n (据说老版mac存的是\r),在windows系统上存储的是\r\n ,鉴于此,C标准针对文本模式读取写入换行符的时候进行了处理,读取换行符的时候,统一转换成\n,写入换行符的时候,根据不同系统写入不同的数据,比如windows就写入\r\n,把上面的例子读取文件从二进制模式修改为文本模式

#include <stdio.h>
int main(void)
{
    printf("\\r=%hhd,\\n=%hhd\n",'\r','\n');
    FILE* file = fopen("test.d", "w");
    fprintf(file, "A\nB");
    fclose(file);
    file = fopen("test.d", "r");
    char ch=' ';
    while((ch=getc(file))!=EOF)
    {
        printf("%c,%hhd\n",ch,ch);
    }
    fclose(file);
    return 0;
}

在windows上执行结果如下:

\r=13,\n=10
A,65

,10
B,66

可以发现\r\n转换成了\n

还有一点需要注意,对于文本模式和二进制模式,我们使用ftell获取字节数大小的时候

  • windows系统换行符算两个字节,不管文本模式还是二进制模式,mac系统换行符算一个字节

  • 对于windows系统,文本模式获取的换行符为虽然算两个字符,但是打印出来的都是\n
    看下面的例子:

    #include <stdio.h>
    int main(void)
    {
    printf("\r=%hhd,\n=%hhd\n", '\r', '\n');
    FILE* file = fopen("test.d", "r");
    fseek(file, 0, SEEK_END);
    long size = ftell(file);
    for (int i=1;i<=size;i++)
    {
    fseek(file, -i, SEEK_END);
    printf("%hhd\n",getc(file));
    }
    printf("size:%ld\n", size);
    fclose(file);
    return 0;
    }

在mac系统下,输出的字节大小都是3,

在windows系统下,输出的字节大小是4,文本模式输出如下:

\r=13,\n=10
66
10
10
65
size:4

二进制模式输出如下:

\r=13,\n=10
66
10
13
65
size:4

总结

我们一般使用二进制模式保存的数据都是我们定义好的数据结构数据,这种数据是不需要换行符这种东西的,基本是为了数据的安全或者更紧凑。我们自己负责数据的修改和解析

如果是为了显示或者便于别人编辑的数据,建议保存成文本文件。

相关推荐
一点媛艺3 小时前
Kotlin函数由易到难
开发语言·python·kotlin
姑苏风3 小时前
《Kotlin实战》-附录
android·开发语言·kotlin
奋斗的小花生4 小时前
c++ 多态性
开发语言·c++
魔道不误砍柴功4 小时前
Java 中如何巧妙应用 Function 让方法复用性更强
java·开发语言·python
闲晨4 小时前
C++ 继承:代码传承的魔法棒,开启奇幻编程之旅
java·c语言·开发语言·c++·经验分享
老猿讲编程4 小时前
一个例子来说明Ada语言的实时性支持
开发语言·ada
Chrikk5 小时前
Go-性能调优实战案例
开发语言·后端·golang
幼儿园老大*5 小时前
Go的环境搭建以及GoLand安装教程
开发语言·经验分享·后端·golang·go
canyuemanyue5 小时前
go语言连续监控事件并回调处理
开发语言·后端·golang
杜杜的man5 小时前
【go从零单排】go语言中的指针
开发语言·后端·golang