C语言文本模式和二进制模式

前言

本篇文章介绍一下C语言的文本模式和二进制模式

文本文件和二进制文件

从宏观上看,无论是文本文件还是二进制文件,文件中保存的都是0和1的序列,因为磁盘只有这两种状态。不同的文件只是对0、1序列的解释不同,如果文件内容是以字符编码的方式保存到文件中的,无论是以哪种编码方式,比如使用ascii编码,unicode编码都可以,这样的文件就是文本文件,也就是文本文件中存在的是一个个字符。如果文件保存的是机器可以识别的数值在内存中的表示,或者是图片、音频等编码的数据,那这种文件就是二进制文件,举个简单的例子,对于数字

复制代码
int i=10000;

如果我们用文本方式保存该值,应该保存'1'、'0'、'0'、'0'、'0'五个字符,但是如果以二进制表示呢,我们只需要保存i的二进制表示
00000000 00000000 00100111 00010000

按照小端法保存依此应该是00010000 00100111 00000000 00000000

C语言的文本模式和二进制模式

C语言之所以要区分文本模式和二进制模式,主要原因就是不同的平台对文本文件的操作不一样,看下面这段代码:

复制代码
#include <stdio.h>
int main(void)
{
    printf("\\r=%hhd,\\n=%hhd\n",'\r','\n');
    FILE* file = fopen("test.d", "w");
    fprintf(file, "A\nB");
    fclose(file);
    file = fopen("test.d", "rb");
    char ch=' ';
    while((ch=getc(file))!=EOF)
    {
        printf("%c,%hhd\n",ch,ch);
    }
    fclose(file);
    return 0;
}

在mac上显示结果如下:

复制代码
\r=13,\n=10
A,65

,10
B,66

在win上显示结果如下:

复制代码
\r=13,\n=10
A,65
,13

,10
B,66

可以发现,在mac上以文本模式存储换行符存储的是\n (据说老版mac存的是\r),在windows系统上存储的是\r\n ,鉴于此,C标准针对文本模式读取写入换行符的时候进行了处理,读取换行符的时候,统一转换成\n,写入换行符的时候,根据不同系统写入不同的数据,比如windows就写入\r\n,把上面的例子读取文件从二进制模式修改为文本模式

复制代码
#include <stdio.h>
int main(void)
{
    printf("\\r=%hhd,\\n=%hhd\n",'\r','\n');
    FILE* file = fopen("test.d", "w");
    fprintf(file, "A\nB");
    fclose(file);
    file = fopen("test.d", "r");
    char ch=' ';
    while((ch=getc(file))!=EOF)
    {
        printf("%c,%hhd\n",ch,ch);
    }
    fclose(file);
    return 0;
}

在windows上执行结果如下:

复制代码
\r=13,\n=10
A,65

,10
B,66

可以发现\r\n转换成了\n

还有一点需要注意,对于文本模式和二进制模式,我们使用ftell获取字节数大小的时候

  • windows系统换行符算两个字节,不管文本模式还是二进制模式,mac系统换行符算一个字节

  • 对于windows系统,文本模式获取的换行符为虽然算两个字符,但是打印出来的都是\n
    看下面的例子:

    #include <stdio.h>
    int main(void)
    {
    printf("\r=%hhd,\n=%hhd\n", '\r', '\n');
    FILE* file = fopen("test.d", "r");
    fseek(file, 0, SEEK_END);
    long size = ftell(file);
    for (int i=1;i<=size;i++)
    {
    fseek(file, -i, SEEK_END);
    printf("%hhd\n",getc(file));
    }
    printf("size:%ld\n", size);
    fclose(file);
    return 0;
    }

在mac系统下,输出的字节大小都是3,

在windows系统下,输出的字节大小是4,文本模式输出如下:

复制代码
\r=13,\n=10
66
10
10
65
size:4

二进制模式输出如下:

复制代码
\r=13,\n=10
66
10
13
65
size:4

总结

我们一般使用二进制模式保存的数据都是我们定义好的数据结构数据,这种数据是不需要换行符这种东西的,基本是为了数据的安全或者更紧凑。我们自己负责数据的修改和解析

如果是为了显示或者便于别人编辑的数据,建议保存成文本文件。

相关推荐
为何创造硅基生物17 小时前
C语言 结构体内存对齐规则(通俗易懂版)
c语言·开发语言
吃好睡好便好17 小时前
在Matlab中绘制横直方图
开发语言·学习·算法·matlab
星寂樱易李18 小时前
iperf3 + Python-- 网络带宽、网速、网络稳定性
开发语言·网络·python
仰泳之鹅18 小时前
【C语言】自定义数据类型2——联合体与枚举
c语言·开发语言·算法
之歆18 小时前
DAY_12JavaScript DOM 完全指南(二):实战与性能篇
开发语言·前端·javascript·ecmascript
jolimark18 小时前
C语言自学攻略:小白入门三步走
c语言·编程入门·学习路线·实践项目·自学攻略
cen__y19 小时前
Linux12(Git01)
linux·运维·服务器·c语言·开发语言·git
AI人工智能+电脑小能手19 小时前
【大白话说Java面试题 第65题】【JVM篇】第25题:谈谈对 OOM 的认识
java·开发语言·jvm
社交怪人20 小时前
【算平均分】信息学奥赛一本通C语言解法(题号2071)
c语言·开发语言
郭涤生20 小时前
不同主机之间网络通信-以太网连接复习
开发语言·rk3588