【C语言进阶】给数据一个“家”:从零开始掌握文件操作

目录

[1. 文本文件 vs 二进制文件:存 10000 的两种姿势](#1. 文本文件 vs 二进制文件:存 10000 的两种姿势)

[2. 文件的"生老病死":打开与关闭](#2. 文件的“生老病死”:打开与关闭)

[2.1 核心指针:FILE*](#2.1 核心指针:FILE*)

[2.2 fopen 与 fclose](#2.2 fopen 与 fclose)

[3. 读写函数的"全家桶"](#3. 读写函数的“全家桶”)

[💡 重点推荐:fprintf / fscanf](#💡 重点推荐:fprintf / fscanf)

[💡 序列化神器:sprintf / sscanf](#💡 序列化神器:sprintf / sscanf)

[4. 文件的"随机穿越":fseek 与 ftell](#4. 文件的“随机穿越”:fseek 与 ftell)

[5. 经典面试坑:feof 的误用](#5. 经典面试坑:feof 的误用)

[6. 为什么需要缓冲区?](#6. 为什么需要缓冲区?)

[📝 总结](#📝 总结)


前言:

写了这么久代码,不知道你有没有和我一样的苦恼:

辛辛苦苦在控制台输入了一堆学生成绩,程序一关,数据全没了。下次运行还得重新输一遍。

以前我们的数据都在内存 里,内存是"健忘"的,断电即失。 今天我们要学习文件操作 ,把数据存到硬盘 里,实现数据的持久化


1. 文本文件 vs 二进制文件:存 10000 的两种姿势

文件在硬盘上都是二进制存的,但根据组织形式,我们把文件分为文本文件二进制文件

举个经典的栗子:整数 10000

  • 文本形式: 把它看作字符 '1','0','0','0','0'。每个字符占 1 字节,共占用 5 个字节

  • 二进制形式: 直接存它的二进制补码。在 32 位系统下,int4 个字节 (10 27 00 00,小端存储)。

结论: 二进制通常更省空间,但文本文件肉眼可读 。


2. 文件的"生老病死":打开与关闭

操作文件就三步走:打开 -> 读写 -> 关闭

2.1 核心指针:FILE*

每个被使用的文件在内存中都有一个"文件信息区",用来存放文件名、状态、位置等。这个区域由系统声明为 FILE 结构体。我们通过 FILE* 指针来维护它 。

2.2 fopen 与 fclose

C

复制代码
// 打开文件
FILE* fopen(const char* filename, const char* mode);
// 关闭文件
int fclose(FILE* stream);

⚠️ 避坑指南:

  1. 路径: 可以是绝对路径,也可以是相对路径 。

  2. 判空: 打开失败会返回 NULL一定要检查返回值!

  3. 模式: w 会清空文件(慎用!),a 是追加,r 是只读。如果是二进制文件,记得加上 b(如 wb, rb) 。


3. 读写函数的"全家桶"

C 语言提供了一堆读写函数,我把它们整理成了表格,方便记忆:

功能 函数名 (读/写) 适用对象 备注
单个字符 fgetc / fputc 所有流 就像 getchar/putchar 的文件版
文本行 fgets / fputs 所有流 读文本最常用,读到 \n 或满 buffer 为止
格式化 fscanf / fprintf 所有流 就像 scanf/printf,能处理结构体
二进制块 fread / fwrite 文件流 直接读写内存块,效率高,虽然肉眼看不懂

💡 重点推荐:fprintf / fscanf

这两个函数简直是神技。如果你有一个结构体:

C

复制代码
struct Stu { char name[20]; int age; float score; };

fprintf(fp, "%s %d %f", s.name, s.age, s.score) 就能直接把结构体格式化写进文件,非常方便 。

💡 序列化神器:sprintf / sscanf

这两个家伙不操作文件,它们操作字符串

  • sprintf:把结构体变成字符串(序列化)。

  • sscanf:把字符串还原成结构体(反序列化)。 在做网络传输或日志记录时,这俩函数非常有用 。


4. 文件的"随机穿越":fseek 与 ftell

谁说读文件只能从头读到尾?我们可以像进度条一样随意拖动。

  • fseek: 定位文件指针。

    C

    复制代码
    int fseek(FILE* stream, long offset, int origin);

    origin 有三种:SEEK_SET (开头), SEEK_CUR (当前), SEEK_END (末尾) 。

  • ftell: 告诉我当前指针在哪(偏移量) 。

  • rewind: 一键回到开头 。


5. 经典面试坑:feof 的误用

很多同学(包括以前的我)喜欢这样写循环:

C

复制代码
// ❌ 错误写法
while (!feof(fp)) {
    fscanf(fp, ...);
}

千万别这么写!

feof 的作用是:当文件读取结束了,用来判断是因为"读到了末尾"结束的,还是因为"读取出错"结束的 。 它不应该用来作为循环停止的条件。正确的判断应该基于 fgetcfscanf 的返回值。


6. 为什么需要缓冲区?

你有没有想过,为什么我们用 fwrite 写数据,不是写一个字节硬盘就动一下?

那样硬盘早就挂了。

C 语言采用缓冲文件系统

  1. 输出缓冲区: 内存里的数据先堆到缓冲区,装满 了或者遇到 fflush / fclose 时,才一起送到硬盘 。

  2. 输入缓冲区: 从硬盘一次读一堆数据到缓冲区,程序再从缓冲区里拿。

实战教训: 如果你写了数据但还没 fclose,程序突然崩了,数据可能会丢失!因为它们还卡在缓冲区里没送出去。 所以,文件操作完一定要记得 fclose,它不仅关闭文件,还会自动刷新缓冲区 。


📝 总结

文件操作是 C 语言与外部世界沟通的桥梁。

  1. 选对模式: 文本用文本流,图片/视频用二进制流 (rb, wb)。

  2. 选对函数: 存配置信息用 fprintf,存大量数据用 fwrite

  3. 善后工作: 永远记得 fclose,防止内存泄漏和数据丢失。

相关推荐
roman_日积跬步-终至千里6 分钟前
【LangGraph4j】LangGraph4j 核心概念与图编排原理
java·服务器·数据库
汇智信科7 分钟前
打破信息孤岛,重构企业效率:汇智信科企业信息系统一体化运营平台
数据库·重构
野犬寒鸦28 分钟前
从零起步学习并发编程 || 第六章:ReentrantLock与synchronized 的辨析及运用
java·服务器·数据库·后端·学习·算法
saber_andlibert1 小时前
TCMalloc底层实现
java·前端·网络
wangjialelele1 小时前
平衡二叉搜索树:AVL树和红黑树
java·c语言·开发语言·数据结构·c++·算法·深度优先
森G1 小时前
七、04ledc-sdk--------makefile有变化
linux·c语言·arm开发·c++·ubuntu
晚霞的不甘2 小时前
揭秘 CANN 内存管理:如何让大模型在小设备上“轻装上阵”?
前端·数据库·经验分享·flutter·3d
市场部需要一个软件开发岗位2 小时前
JAVA开发常见安全问题:纵向越权
java·数据库·安全
海奥华22 小时前
mysql索引
数据库·mysql
weixin_395448912 小时前
mult_yolov5_post_copy.c_cursor_0205
c语言·python·yolo