C语言文本模式和二进制模式

前言

本篇文章介绍一下C语言的文本模式和二进制模式

文本文件和二进制文件

从宏观上看,无论是文本文件还是二进制文件,文件中保存的都是0和1的序列,因为磁盘只有这两种状态。不同的文件只是对0、1序列的解释不同,如果文件内容是以字符编码的方式保存到文件中的,无论是以哪种编码方式,比如使用ascii编码,unicode编码都可以,这样的文件就是文本文件,也就是文本文件中存在的是一个个字符。如果文件保存的是机器可以识别的数值在内存中的表示,或者是图片、音频等编码的数据,那这种文件就是二进制文件,举个简单的例子,对于数字

int i=10000;

如果我们用文本方式保存该值,应该保存'1'、'0'、'0'、'0'、'0'五个字符,但是如果以二进制表示呢,我们只需要保存i的二进制表示
00000000 00000000 00100111 00010000

按照小端法保存依此应该是00010000 00100111 00000000 00000000

C语言的文本模式和二进制模式

C语言之所以要区分文本模式和二进制模式,主要原因就是不同的平台对文本文件的操作不一样,看下面这段代码:

#include <stdio.h>
int main(void)
{
    printf("\\r=%hhd,\\n=%hhd\n",'\r','\n');
    FILE* file = fopen("test.d", "w");
    fprintf(file, "A\nB");
    fclose(file);
    file = fopen("test.d", "rb");
    char ch=' ';
    while((ch=getc(file))!=EOF)
    {
        printf("%c,%hhd\n",ch,ch);
    }
    fclose(file);
    return 0;
}

在mac上显示结果如下:

\r=13,\n=10
A,65

,10
B,66

在win上显示结果如下:

\r=13,\n=10
A,65
,13

,10
B,66

可以发现,在mac上以文本模式存储换行符存储的是\n (据说老版mac存的是\r),在windows系统上存储的是\r\n ,鉴于此,C标准针对文本模式读取写入换行符的时候进行了处理,读取换行符的时候,统一转换成\n,写入换行符的时候,根据不同系统写入不同的数据,比如windows就写入\r\n,把上面的例子读取文件从二进制模式修改为文本模式

#include <stdio.h>
int main(void)
{
    printf("\\r=%hhd,\\n=%hhd\n",'\r','\n');
    FILE* file = fopen("test.d", "w");
    fprintf(file, "A\nB");
    fclose(file);
    file = fopen("test.d", "r");
    char ch=' ';
    while((ch=getc(file))!=EOF)
    {
        printf("%c,%hhd\n",ch,ch);
    }
    fclose(file);
    return 0;
}

在windows上执行结果如下:

\r=13,\n=10
A,65

,10
B,66

可以发现\r\n转换成了\n

还有一点需要注意,对于文本模式和二进制模式,我们使用ftell获取字节数大小的时候

  • windows系统换行符算两个字节,不管文本模式还是二进制模式,mac系统换行符算一个字节

  • 对于windows系统,文本模式获取的换行符为虽然算两个字符,但是打印出来的都是\n
    看下面的例子:

    #include <stdio.h>
    int main(void)
    {
    printf("\r=%hhd,\n=%hhd\n", '\r', '\n');
    FILE* file = fopen("test.d", "r");
    fseek(file, 0, SEEK_END);
    long size = ftell(file);
    for (int i=1;i<=size;i++)
    {
    fseek(file, -i, SEEK_END);
    printf("%hhd\n",getc(file));
    }
    printf("size:%ld\n", size);
    fclose(file);
    return 0;
    }

在mac系统下,输出的字节大小都是3,

在windows系统下,输出的字节大小是4,文本模式输出如下:

\r=13,\n=10
66
10
10
65
size:4

二进制模式输出如下:

\r=13,\n=10
66
10
13
65
size:4

总结

我们一般使用二进制模式保存的数据都是我们定义好的数据结构数据,这种数据是不需要换行符这种东西的,基本是为了数据的安全或者更紧凑。我们自己负责数据的修改和解析

如果是为了显示或者便于别人编辑的数据,建议保存成文本文件。

相关推荐
鸽鸽程序猿14 分钟前
【前端】javaScript
开发语言·前端·javascript
小林熬夜学编程17 分钟前
【Linux系统编程】第五十弹---构建高效单例模式线程池、详解线程安全与可重入性、解析死锁与避免策略,以及STL与智能指针的线程安全性探究
linux·运维·服务器·c语言·c++·安全·单例模式
kylin王国20 分钟前
R语言p值矫正整的方法
开发语言·r语言·p值
我qq不是4515165225 分钟前
C语言指针作业
c语言
苏言の狗27 分钟前
小R的二叉树探险 | 模拟
c语言·数据结构·算法·宽度优先
加载中loading...28 分钟前
C/C++实现tcp客户端和服务端的实现(从零开始写自己的高性能服务器)
linux·运维·服务器·c语言·网络
凯子坚持 c37 分钟前
C++之二叉搜索树:高效与美的极致平衡
开发语言·c++
菜鸟起航ing1 小时前
Java中日志采集框架-JUL、Slf4j、Log4j、Logstash
java·开发语言·log4j·logback
凤枭香1 小时前
Python Scikit-learn简介(二)
开发语言·python·机器学习·scikit-learn
gkdpjj1 小时前
C++优选算法十四 优先级队列(堆)
开发语言·数据结构·c++·算法