C语言课后大作业项目实战,微型数据库,文件操作详解从基础到实战

C语言课后大作业项目实战,微型数据库,文件操作详解从基础到实战

1. 引言

在计算机编程中,文件操作是一项基础而重要的技能。无论是存储用户数据、配置信息,还是实现复杂的数据库系统,都离不开文件操作。C语言作为一种底层编程语言,提供了丰富的文件操作函数,使得开发者能够直接与操作系统的文件系统进行交互。

本文将从基础的文件操作开始,逐步深入到复杂的数据库实现,通过大量的代码示例和详细的注释,全面讲解C语言文件操作的核心知识点和实战技巧。

2. 基础文件操作

2.1 文件打开与关闭

在C语言中,文件操作的第一步是打开文件。使用fopen函数可以打开一个文件,并返回一个FILE类型的指针,后续的所有文件操作都将通过这个指针进行。

复制代码
复制代码
FILE *fp = fopen("data.txt", "w");
if (fp == NULL) {
    printf("failed to open file\n");
    exit(1);
}
// 文件操作...
fclose(fp);

代码注释:

  • fopen函数接受两个参数:文件名和打开模式
  • 打开模式决定了文件的操作权限和行为
  • 常见的打开模式有:
    • "r" - 只读模式,文件必须存在
    • "w" - 只写模式,文件不存在则创建,存在则清空
    • "a" - 追加模式,文件不存在则创建,存在则在末尾追加
    • "r+" - 读写模式,文件必须存在
    • "w+" - 读写模式,文件不存在则创建,存在则清空
    • "a+" - 读写模式,文件不存在则创建,存在则在末尾追加
    • "rb""wb"等 - 二进制模式

注意事项:

  • 打开文件后一定要检查返回值是否为NULL,以处理文件打开失败的情况
  • 操作完成后一定要使用fclose关闭文件,以释放系统资源

2.2 文本文件读写

文本文件是人类可读的文件格式,C语言提供了fprintffscanf函数来进行格式化的文本读写。

2.2.1 fprintf函数
复制代码
复制代码
FILE *fp = fopen("data.txt", "w");
if (fp == NULL) {
    printf("failed to open file\n");
    exit(1);
}
fprintf(fp, "hello world\n");
int a = 123, b = 456;
fprintf(fp, "a = %d, b = %d\n", a, b);
fclose(fp);

代码注释:

  • fprintf函数的用法与printf类似,只是多了一个文件指针参数
  • 它会将格式化的数据写入到指定的文件中
  • 格式化字符串中的占位符与printf相同
2.2.2 fscanf函数
复制代码
复制代码
FILE *fp = fopen("data.txt", "r");
if (fp == NULL) {
    printf("failed to open file\n");
    exit(1);
}
char s[100];
fscanf(fp, "%[^^\n]", s);
printf("s = %s\n", s);
fclose(fp);

代码注释:

  • fscanf函数的用法与scanf类似,只是多了一个文件指针参数
  • 它会从指定的文件中读取格式化的数据
  • %[^^\n]表示读取直到换行符为止的所有字符

2.3 二进制文件读写

二进制文件是计算机直接处理的文件格式,C语言提供了fwritefread函数来进行二进制文件的读写。

2.3.1 fwrite函数
复制代码
复制代码
int arr[MAX_N];
for (int i = 0; i < MAX_N; i++) {
    arr[i] = rand() % 10000;
}
FILE *fp = fopen("data10.dat", "wb");
fwrite(arr, sizeof(int), MAX_N, fp);
fclose(fp);

代码注释:

  • fwrite函数接受四个参数:
    • 数据缓冲区指针
    • 每个数据项的大小
    • 数据项的数量
    • 文件指针
  • 它会将二进制数据直接写入到文件中,不进行任何格式化
2.3.2 fread函数
复制代码
复制代码
int arr[MAX_N];
FILE *fp = fopen("data10.dat", "rb");
fread(arr, sizeof(int), MAX_N, fp);
fclose(fp);

代码注释:

  • fread函数的参数与fwrite相同
  • 它会从文件中读取二进制数据,直接存储到指定的缓冲区中

2.4 文件指针定位

在文件操作中,有时需要随机访问文件的不同位置,这就需要使用fseekftell函数来定位文件指针。

2.4.1 fseek函数
复制代码
复制代码
fseek(fp, 2, SEEK_SET);  // 从文件开头偏移2字节
fseek(fp, 0, SEEK_END);  // 定位到文件末尾
fseek(fp, -5, SEEK_CUR); // 从当前位置向前偏移5字节

代码注释:

  • fseek函数接受三个参数:
    • 文件指针
    • 偏移量
    • 起始位置(SEEK_SET:文件开头,SEEK_CUR:当前位置,SEEK_END:文件末尾)
  • 它会将文件指针移动到指定的位置
2.4.2 ftell函数
复制代码
复制代码
long offset = ftell(fp);
printf("current position: %ld\n", offset);

代码注释:

  • ftell函数返回当前文件指针的位置(相对于文件开头的字节数)
  • 它可以用来获取文件的大小:先定位到文件末尾,再调用ftell

3. 中级应用:学生管理系统

3.1 系统设计

学生管理系统是文件操作的一个典型应用,它需要实现以下功能:

  • 读取学生数据从文件
  • 显示学生列表
  • 添加新学生
  • 修改学生信息
  • 删除学生
  • 保存学生数据到文件

3.2 数据结构设计

复制代码
复制代码
typedef struct Student {
    char name[20];    // 学生姓名
    int age;          // 学生年龄
    int class;        // 班级
    double height;    // 身高
} Student;

#define MAX_N 10000    // 最大学生数量
Student stus[MAX_N + 5];  // 学生数组
int scnt;  // 学生数量

代码注释:

  • 使用结构体来存储每个学生的信息
  • 定义了一个足够大的数组来存储所有学生
  • 使用全局变量scnt来跟踪当前学生数量

3.3 文件操作函数

3.3.1 从文件读取数据
复制代码
复制代码
int read_from_file(Student *arr) {
    int i = 0;
    FILE *fp = fopen(file_name, "r");
    if (fp == NULL) return 0;  // 文件不存在则返回0
    while (fscanf(fp, "%s", arr[i].name) != EOF) {
        fscanf(fp, "%d%d%lf", 
            &arr[i].age, 
            &arr[i].class,
            &arr[i].height
        );
        i += 1;
    }
    fclose(fp);
    return i;  // 返回读取的学生数量
}

代码注释:

  • 使用fscanf从文件中读取学生信息
  • EOF(文件结束符)作为循环结束条件
  • 返回实际读取的学生数量
3.3.2 写入数据到文件
复制代码
复制代码
void output_to_file(Student *arr, int n) {
    FILE *fp = fopen(file_name, "a");  // 追加模式
    for (int i = 0; i < n; i++) {
        fprintf(fp, "%s %d %d %.2lf\n",
            arr[i].name, arr[i].age,
            arr[i].class, arr[i].height
        );
    }
    fclose(fp);
    return ;
}

代码注释:

  • 使用fprintf将学生信息写入到文件中
  • 使用追加模式("a"),这样新添加的学生信息会被添加到文件末尾
3.3.3 清空文件
复制代码
复制代码
void clear_file() {
    FILE *fp = fopen(file_name, "w");  // 写入模式会清空文件
    fclose(fp);
    return ;
}

代码注释:

  • 使用写入模式("w")打开文件,这样会自动清空文件内容
  • 打开后立即关闭文件,实现清空文件的效果
3.3.4 恢复数据到文件
复制代码
复制代码
void restor_data_to_file(Student *arr, int n) {
    clear_file();  // 先清空文件
    output_to_file(arr, n);  // 再写入所有数据
    return ;
}

代码注释:

  • 先清空文件,然后将所有学生信息重新写入
  • 用于修改或删除学生后,更新文件内容

3.4 功能实现

3.4.1 显示学生列表
复制代码
复制代码
void list_students() {
    int len = printf("%4s|%10s|%4s|%6s|%7s|",
        "id", "name", "age", "class", "height"
    );
    printf("\n");
    for (int i = 0; i < len; i++) printf("=");
    printf("\n");
    for (int i = 0; i < scnt; i++) {
        printf("%4d|%10s|%4d|%6d|%7.2lf|\n", 
            i, stus[i].name,
            stus[i].age, stus[i].class,
            stus[i].height
        );
    }
    return ;
}

代码注释:

  • 先打印表头
  • 然后打印分隔线
  • 最后遍历所有学生,打印每个学生的信息
  • 使用格式化输出,使表格对齐美观
3.4.2 添加新学生
复制代码
复制代码
void add_a_student() {
    printf("add new item : (name, age, class, height)\n");
    printf("mysql > ");
    scanf("%s%d%d%lf", 
        stus[scnt].name, 
        &stus[scnt].age,
        &stus[scnt].class,
        &stus[scnt].height
    );
    output_to_file(stus + scnt, 1);  // 写入到文件
    scnt += 1;  // 增加学生数量
    printf("add a new student success\n");
    return ;
}

代码注释:

  • 提示用户输入新学生的信息
  • 读取用户输入并存储到学生数组中
  • 将新学生信息写入到文件中
  • 增加学生数量计数器
3.4.3 修改学生信息
复制代码
复制代码
void modify_a_student() {
    list_students();  // 先显示学生列表
    int id;
    do {
        printf("modify id : ");
        scanf("%d", &id);
    } while (id < 0 || id >= scnt);  // 验证id是否有效
    printf("modify a item : (name, age, class, height)\n");
    printf("mysql > ");
    scanf("%s%d%d%lf", 
        stus[id].name, 
        &stus[id].age,
        &stus[id].class,
        &stus[id].height
    );
    restor_data_to_file(stus, scnt);  // 重新写入所有数据
    return ;
}

代码注释:

  • 先显示学生列表,方便用户选择要修改的学生
  • 读取用户输入的id,并验证其有效性
  • 提示用户输入修改后的学生信息
  • 读取用户输入并更新学生数组
  • 重新写入所有数据到文件中
3.4.4 删除学生
复制代码
复制代码
void delete_a_student() {
    if (scnt == 0) {
        printf("there is no student\n");
        return ;
    }
    list_students();  // 先显示学生列表
    int id;
    do {
        printf("delete id : ");
        scanf("%d", &id);
    } while (id < 0 || id >= scnt);  // 验证id是否有效
    char s[100];
    printf("confim (y / n) : ");
    fflush(stdin);  // 清空输入缓冲区
    scanf("%[^^\n]", s);  // 读取确认信息
    if (s[0] != 'y') return ;  // 如果用户不确认,则取消删除
    for (int i = id + 1; i < scnt; i++) {
        stus[i - 1] = stus[i];  // 后面的学生向前移动
    }
    scnt -= 1;  // 减少学生数量
    restor_data_to_file(stus, scnt);  // 重新写入所有数据
    return ;
}

代码注释:

  • 先检查是否有学生
  • 显示学生列表,方便用户选择要删除的学生
  • 读取用户输入的id,并验证其有效性
  • 提示用户确认删除操作
  • 如果用户确认,则将后面的学生向前移动,覆盖要删除的学生
  • 减少学生数量计数器
  • 重新写入所有数据到文件中

3.5 主函数与菜单

复制代码
复制代码
enum NO_TYPE {
    LIST = 1,
    ADD,
    MODIFY,
    DELETE,
    QUIT
};

int usage() {
    int no;
    do {
        printf("%d : list students\n", LIST);
        printf("%d : add a new student\n", ADD);
        printf("%d : modify a student\n", MODIFY);
        printf("%d : delete a student\n", DELETE);
        printf("%d : quit\n", QUIT);
        printf("mysql > ");
        scanf("%d", &no);
    } while (no < LIST || no > QUIT);
    return no;
}

int main() {
    scnt = read_from_file(stus);  // 从文件读取数据
    while (1) {
        int no = usage();  // 显示菜单并获取用户选择
        switch (no) {
            case LIST: {
                list_students();
            } break;
            case ADD: {
                add_a_student();
            } break;
            case MODIFY: {
                modify_a_student();
            } break;
            case DELETE: {
                delete_a_student();
            } break;
            case QUIT: printf("quit\n"); exit(0);
        }
    }
    return 0;
}

代码注释:

  • 使用枚举类型定义菜单选项,使代码更清晰
  • usage函数显示菜单并获取用户选择,验证输入的有效性
  • 主函数先从文件读取数据,然后进入无限循环,根据用户选择执行相应的操作

4. 高级应用:完整数据库实现

4.1 架构设计

完整的数据库实现是文件操作的高级应用,它需要考虑以下几个方面:

  • 表结构的设计与管理
  • 数据的存储与检索
  • 内存与文件的同步
  • 多表支持
  • 通用的操作接口

4.2 学生管理系统实战

4.2.1 项目概述

学生管理系统是一个功能完整的C语言项目,它展示了如何使用文件操作来实现一个简单但实用的数据库系统。该系统具有以下特点:

  • 完整的CRUD操作:创建、读取、更新、删除学生信息
  • 文件持久化存储:使用文本文件存储学生数据
  • 友好的用户界面:提供交互式命令行界面
  • 数据验证:确保用户输入的合法性
4.2.2 数据结构设计
复制代码
复制代码
typedef struct Student {
    char name[20];    // 学生姓名
    int age;          // 学生年龄
    int class;        // 班级
    float height;     // 身高
} Student;

#define MAX_ARR 10000  // 最大学生数量
int stu_cnt = 0;       // 当前学生数量
Student stu_arr[MAX_ARR + 5];  // 学生数组
const char *file_name = "student_data.txt";  // 数据文件路径

代码注释:

  • Student结构体:封装了学生的基本信息,包括姓名、年龄、班级和身高
  • MAX_ARR:定义了系统支持的最大学生数量
  • stu_cnt:全局变量,用于跟踪当前系统中的学生数量
  • stu_arr:存储所有学生信息的数组
  • file_name:数据文件的路径,用于持久化存储学生信息
4.2.3 核心功能实现
4.2.3.1 数据库初始化
复制代码
复制代码
int main() {
    int n;
    char s[100];
    printf("Does the database exist?(是否存在数据库?) (y / n) : ");
    scanf("%s", s);
    printf("\n");
    if(s[0] != 'y') {
        printf("Please enter how many data items there are in total?(请输入共有多少项数据?) : ");
        scanf("%d", &n);
        printf("\n");
        for (int i = 0; i < n; i++) {
            create_file();
        }
    }
    else {
        stu_cnt = read_from_file(stu_arr);
    }
    while(1) {
        int no = usage();
        switch(no) {
          case 1: student_list(); break;
          case 2: student_add(); break;
          case 3: student_modify(); break;
          case 4: student_delete();break;
          case 5: exit(0);
        }
    }
    return 0;
}

代码注释:

  • 程序启动时,首先询问用户是否存在数据库
  • 如果数据库不存在,引导用户创建初始数据
  • 如果数据库存在,从文件中读取现有数据
  • 进入主循环,根据用户选择执行相应的操作
4.2.3.2 创建数据库文件
复制代码
复制代码
void create_file() {
    FILE *fp = fopen(file_name, "w");
    printf("add a new item : (name, age, class, height)\n");
    printf("mysql > ");
    scanf("%s%d%d%f",
        stu_arr[stu_cnt].name, &stu_arr[stu_cnt].age, &stu_arr[stu_cnt].class, &stu_arr[stu_cnt].height
    );
    stu_cnt += 1;
    fclose(fp);
    output_arr_file(stu_arr, stu_cnt);
    return ;
}

代码注释:

  • 以写入模式打开文件(如果文件不存在则创建)
  • 提示用户输入学生信息
  • 读取用户输入并存储到学生数组中
  • 增加学生数量计数器
  • 关闭文件
  • 调用output_arr_file函数将数据写入文件
4.2.3.3 写入数据到文件
复制代码
复制代码
void output_arr_file(Student *arr, int n) {
    FILE *fp = fopen(file_name, "a");
    for (int i = 0; i < n; i++) {
        fprintf(fp, "%s %d %d %.2f\n",
            arr[i].name, arr[i].age, arr[i].class, arr[i].height
        );
    }
    fclose(fp);
    return ;
}

代码注释:

  • 以追加模式打开文件
  • 遍历学生数组,将每个学生的信息写入文件
  • 使用格式化输出,确保数据格式一致
  • 关闭文件
4.2.3.4 从文件读取数据
复制代码
复制代码
int read_from_file(Student *arr) {
    int i = 0;
    FILE *fp = fopen(file_name, "r");
    if (fp == NULL) return i;
    while (fscanf(fp, "%s", arr[i].name) != EOF) {
        fscanf(fp, "%d%d%f",
            &arr[i].age, &arr[i].class, &arr[i].height
        );
        i += 1;
    }
    fclose(fp);
    return i;
}

代码注释:

  • 以读取模式打开文件
  • 检查文件是否成功打开
  • 使用fscanf从文件中读取学生信息,直到文件结束
  • 每次读取一个学生的信息后,增加计数器
  • 关闭文件
  • 返回读取的学生数量
4.2.3.5 用户交互界面
复制代码
复制代码
int usage() {
    int no;
    do {
       printf("1 : list students\n");
       printf("2 : add a student\n");
       printf("3 : modify a student\n");
       printf("4 : delete a student\n");
       printf("5 : quit\n");
       printf("mysql > ");
       scanf("%d", &no);
    } while (no < 1 || no > 5);
    return no;
}

代码注释:

  • 显示菜单选项
  • 提示用户输入选择
  • 使用do-while循环确保用户输入的是有效的选项
  • 返回用户的选择
4.2.3.6 显示学生列表
复制代码
复制代码
void student_list() {
    int n = printf("%4s|%10s|%5s|%6s|%7s|\n",
                "id", "name", "age", "class", "height"
            );
    for (int i = 0; i < n; i++) {
        printf("=");
    }
    printf("\n");
    for (int i = 0; i < stu_cnt; i++) {
        printf("%4d|%10s|%5d|%6d|%7.2f|\n",
            i, stu_arr[i].name, stu_arr[i].age, stu_arr[i].class, stu_arr[i].height
        );
    }
    printf("\n");
    for (int i = 0; i < n; i++) {
        printf("-");
    }
    printf("\n\n");
    return ;
}

代码注释:

  • 打印表头,包括id、name、age、class和height
  • 打印分隔线,增强可读性
  • 遍历学生数组,打印每个学生的详细信息
  • 打印底部分隔线
4.2.3.7 添加学生
复制代码
复制代码
void student_add() {
    FILE *fp = fopen(file_name, "a");
    printf("add new item : (name, age, class, height)\n");
    printf("mysql > ");
    scanf("%s%d%d%f",
        stu_arr[stu_cnt].name, &stu_arr[stu_cnt].age, &stu_arr[stu_cnt].class, &stu_arr[stu_cnt].height
    );
    fprintf(fp, "%s %d %d %.2f\n",
        stu_arr[stu_cnt].name, stu_arr[stu_cnt].age, stu_arr[stu_cnt].class, stu_arr[stu_cnt].height
    );
    fclose(fp);
    stu_cnt += 1;
    int n = printf("add a student success!\n");
    printf("\n");
    for (int i = 0; i < n; i++) {
        printf("-");
    }
    printf("\n\n");
    return ;
}

代码注释:

  • 以追加模式打开文件
  • 提示用户输入新学生的信息
  • 读取用户输入并存储到学生数组中
  • 将新学生信息写入文件
  • 关闭文件
  • 增加学生数量计数器
  • 打印成功信息和分隔线
4.2.3.8 修改学生信息
复制代码
复制代码
void student_modify() {
    int id;
    student_list();
    do {
       printf("modify id : ");
       scanf("%d", &id);
    } while (id < 0 || id >= stu_cnt);
    printf("modify the item : (name, age, class, height)\n");
    printf("mysql > ");
    scanf("%s%d%d%f",
        stu_arr[id].name, &stu_arr[id].age, &stu_arr[id].class, &stu_arr[id].height
    );
    // 重新写入所有数据
    FILE *fp = fopen(file_name, "w");
    for (int i = 0; i < stu_cnt; i++) {
        fprintf(fp, "%s %d %d %.2f\n",
            stu_arr[i].name, stu_arr[i].age, stu_arr[i].class, stu_arr[i].height
        );
    }
    fclose(fp);
    printf("modify success!\n");
    return ;
}

代码注释:

  • 先显示学生列表,方便用户选择要修改的学生
  • 提示用户输入要修改的学生ID,并验证ID的有效性
  • 提示用户输入修改后的学生信息
  • 读取用户输入并更新学生数组
  • 以写入模式打开文件(清空原有内容)
  • 将所有学生信息重新写入文件
  • 关闭文件
  • 打印成功信息
4.2.3.9 删除学生
复制代码
复制代码
void student_delete() {
    int id;
    student_list();
    do {
       printf("delete id : ");
       scanf("%d", &id);
    } while (id < 0 || id >= stu_cnt);
    // 确认删除
    char confirm[10];
    printf("confirm delete? (y/n) : ");
    scanf("%s", confirm);
    if (confirm[0] != 'y') return;
    
    // 从数组中删除学生
    for (int i = id; i < stu_cnt - 1; i++) {
        stu_arr[i] = stu_arr[i + 1];
    }
    stu_cnt -= 1;
    
    // 重新写入所有数据
    FILE *fp = fopen(file_name, "w");
    for (int i = 0; i < stu_cnt; i++) {
        fprintf(fp, "%s %d %d %.2f\n",
            stu_arr[i].name, stu_arr[i].age, stu_arr[i].class, stu_arr[i].height
        );
    }
    fclose(fp);
    printf("delete success!\n");
    return ;
}

代码注释:

  • 先显示学生列表,方便用户选择要删除的学生
  • 提示用户输入要删除的学生ID,并验证ID的有效性
  • 提示用户确认删除操作
  • 如果用户取消删除,直接返回
  • 从数组中删除学生(将后面的学生向前移动)
  • 减少学生数量计数器
  • 以写入模式打开文件(清空原有内容)
  • 将所有学生信息重新写入文件
  • 关闭文件
  • 打印成功信息
4.2.4 项目特点与技术亮点
  1. 完整的功能实现

    • 支持数据库初始化
    • 支持学生信息的添加、修改、删除和查询
    • 支持数据的持久化存储
  2. 用户友好界面

    • 提供清晰的菜单选项
    • 支持中英文提示
    • 格式化显示学生信息
  3. 数据验证

    • 验证用户输入的菜单选项
    • 验证学生ID的有效性
    • 提供删除确认机制
  4. 文件操作技巧

    • 灵活使用不同的文件打开模式("w"、"a"、"r")
    • 正确处理文件不存在的情况
    • 实现数据的完整写入和更新
  5. 代码结构清晰

    • 函数职责明确
    • 代码逻辑清晰
    • 易于理解和维护
4.2.5 项目改进空间
  1. 错误处理

    • 增加更详细的错误处理机制
    • 处理文件读写失败的情况
  2. 性能优化

    • 对于大量数据,考虑使用动态内存分配
    • 优化文件读写操作,减少I/O次数
  3. 功能扩展

    • 添加学生信息查询功能
    • 支持按不同字段排序
    • 添加数据备份和恢复功能
  4. 用户界面

    • 增加更美观的界面设计
    • 支持命令行参数
  5. 安全性

    • 增加输入验证,防止缓冲区溢出
    • 考虑添加简单的权限控制
4.2.6 实战价值

学生管理系统虽然是一个小型项目,但它展示了C语言文件操作的实际应用,具有以下实战价值:

  1. 学习文件操作:通过实际项目学习C语言的文件操作函数和技巧
  2. 理解数据库原理:了解简单数据库系统的设计和实现原理
  3. 掌握项目开发流程:从需求分析到代码实现的完整开发流程
  4. 培养编程习惯:学习良好的代码组织和注释习惯
  5. 为大型项目打下基础:掌握小型项目的开发方法,为开发更大型的系统打下基础

4.3 核心数据结构

4.3.1 数据库结构
复制代码
复制代码
struct Database {
    FILE *table;           // 表文件指针
    const char *table_name;  // 表名
    const char *table_file;  // 表文件路径
    const char **header_name;  // 表头名称数组
    int header_cnt;         // 表头数量
    int *header_len;        // 表头长度数组
    struct table_data head;  // 表数据链表头
    size_t (*getDataSize)();  // 获取数据大小的函数指针
    void (*printData)(void *);  // 打印数据的函数指针
    void (*scanData)(void *);   // 扫描数据的函数指针
};

代码注释:

  • table:当前打开的表文件指针
  • table_name:当前表的名称
  • table_file:当前表的文件路径
  • header_name:表头名称数组,用于显示和提示
  • header_cnt:表头数量
  • header_len:表头长度数组,用于格式化输出
  • head:表数据链表头,用于在内存中管理表数据
  • getDataSize:函数指针,用于获取每条数据的大小
  • printData:函数指针,用于打印一条数据
  • scanData:函数指针,用于从用户输入扫描一条数据
4.2.2 表数据结构
复制代码
复制代码
struct table_data {
    void *data;            // 数据指针
    long offset;           // 数据在文件中的偏移量
    struct table_data *next;  // 指向下一条数据的指针
};

代码注释:

  • data:指向实际数据的指针,类型为void*,以支持不同类型的数据
  • offset:数据在文件中的偏移量,用于定位和更新数据
  • next:指向下一条数据的指针,用于构建链表
4.2.3 表信息结构
复制代码
复制代码
struct TableInfo {
    const char *table_name;  // 表名
    InitTable_T init_table;  // 初始化表的函数指针
};

代码注释:

  • table_name:表的名称
  • init_table:初始化表的函数指针,用于注册新表

4.3 核心功能实现

4.3.1 数据库初始化
复制代码
复制代码
__attribute__((constructor))
void init_db() {
    db.table      = NULL;
    db.table_file = NULL;
    db.table_name = NULL;
    db.head.next  = NULL;
    return ;
}

代码注释:

  • 使用__attribute__((constructor))属性,使函数在main函数之前自动执行
  • 初始化数据库结构体的各个成员
4.3.2 表注册
复制代码
复制代码
void register_table(const char *table_name, InitTable_T init_table) {
    tables[table_cnt].table_name = table_name;
    tables[table_cnt].init_table = init_table;
    table_cnt += 1;
    return ;
}

代码注释:

  • 将表名和初始化函数添加到表信息数组中
  • 增加表数量计数器
4.3.3 表数据管理
4.3.3.1 创建新表数据
复制代码
复制代码
static struct table_data *getNewTableData(void *data, long offset) {
    struct table_data *p = (struct table_data *)malloc(sizeof(struct table_data));
    p->data = malloc(db.getDataSize());
    memcpy(p->data, data, db.getDataSize());
    p->offset = offset;
    p->next = NULL;
    return p;
}

代码注释:

  • 分配表数据结构体的内存
  • 分配数据缓冲区的内存
  • 复制数据到缓冲区
  • 设置偏移量和next指针
  • 返回新创建的表数据指针
4.3.3.2 销毁表数据
复制代码
复制代码
static void destroyTableData(struct table_data *p) {
    free(p->data);
    free(p);
    return ;
}

代码注释:

  • 释放数据缓冲区的内存
  • 释放表数据结构体的内存
4.3.3.3 加载表数据
复制代码
复制代码
static void load_table_data() {
    char buff[db.getDataSize()];
    struct table_data *p = &(db.head);
    int data_cnt = 0;
    while (1) {
        long offset = ftell(db.table);
        if (fread(buff, db.getDataSize(), 1, db.table) == 0) break;
        p->next = getNewTableData(buff, offset);
        p = p->next;
        data_cnt += 1;
    }
    printf("load data success : %d items\n", data_cnt);
    return ;
}

代码注释:

  • 分配一个缓冲区用于读取数据
  • 从文件开头开始,逐个读取数据
  • 对于每个读取的数据,创建一个新的表数据节点,并添加到链表中
  • 记录数据的偏移量和数量
  • 打印加载成功的信息
4.3.4 表操作
4.3.4.1 打开表
复制代码
复制代码
static void open_table() {
    db.table = fopen(db.table_file, "rb+");
    if (db.table == NULL) {
        printf("can't open file : %s\n", db.table_file);
        exit(1);
    }
    load_table_data();
    return ;
}

代码注释:

  • 以二进制读写模式打开表文件
  • 检查文件是否打开成功
  • 加载表数据到内存中
4.3.4.2 关闭表
复制代码
复制代码
static void close_table() {
    clear_table();
    if (db.table == NULL) return ;
    fclose(db.table);
    return ;
}

static void clear_table() {
    struct table_data *p = db.head.next, *q;
    while (p) {
        q = p->next;
        destroyTableData(p);
        p = q;
    }
    return ;
}

代码注释:

  • close_table:关闭表文件,并清空内存中的表数据
  • clear_table:遍历表数据链表,销毁每个节点
4.3.5 数据操作
4.3.5.1 添加数据
复制代码
复制代码
static long add_one_table_data(void *buff) {
    fseek(db.table, 0, SEEK_END);
    long offset = ftell(db.table);
    struct table_data *p = &(db.head);
    while (p->next) p = p->next;
    p->next = getNewTableData(buff, offset);
    fwrite(buff, db.getDataSize(), 1, db.table);
    fflush(db.table);
    return offset;
}

代码注释:

  • 定位到文件末尾
  • 获取当前偏移量(新数据的存储位置)
  • 找到链表的末尾
  • 创建新的表数据节点,并添加到链表末尾
  • 将数据写入到文件中
  • 刷新文件缓冲区,确保数据写入磁盘
  • 返回新数据的偏移量
4.3.5.2 修改数据
复制代码
复制代码
static void modify_one_table_data(void *buff, int id) {
    struct table_data *p = db.head.next;
    for (int i = 0; i < id; i++) p = p->next;
    memcpy(p->data, buff, db.getDataSize());
    fseek(db.table, p->offset, SEEK_SET);
    fwrite(buff, db.getDataSize(), 1, db.table);
    fflush(db.table);
    return ;
}

代码注释:

  • 找到要修改的数据节点
  • 更新内存中的数据
  • 定位到文件中对应的数据位置
  • 将修改后的数据写入到文件中
  • 刷新文件缓冲区
4.3.5.3 删除数据
复制代码
复制代码
static void clearTableData() {
    fclose(db.table);
    db.table = fopen(db.table_file, "w");
    fclose(db.table);
    db.table = fopen(db.table_file, "rb+");
    struct table_data *p = db.head.next, *q;
    while (p) {
        q = p->next;
        destroyTableData(p);
        p = q;
    }
    db.head.next = NULL;
    return ;
}

static void restoreTableData() {
    struct table_data *p = db.head.next, *q;
    db.head.next = NULL;
    clearTableData();
    while (p) {
        q = p->next;
        add_one_table_data(p->data); 
        destroyTableData(p);
        p = q;
    }
    return ;
}

代码注释:

  • clearTableData:清空表文件和内存中的数据
  • restoreTableData:重新创建表文件,并将内存中的数据写回文件
  • 删除操作的实现:先从链表中删除节点,然后调用restoreTableData重新组织文件
4.3.6 用户交互
4.3.6.1 选择表
复制代码
复制代码
static enum OP_TYPE choose_table() {
    for (int i = 0; i < table_cnt; i++) {
        printf("%d : %s\n", i, tables[i].table_name);
    }
    printf("%d : quit\n", table_cnt);
    int x;
    do {
        printf("input : ");
        scanf("%d", &x);
    } while (x < 0 || x > table_cnt);
    if (x < table_cnt) {
        close_table();
        tables[x].init_table(&db);
        open_table();
        return TABLE_USAGE;
    }
    return OP_END;
}

代码注释:

  • 显示所有可用的表
  • 提示用户选择一个表或退出
  • 验证用户输入的有效性
  • 如果用户选择了一个表:
    • 关闭当前打开的表
    • 调用该表的初始化函数
    • 打开新表
    • 返回表使用状态
  • 如果用户选择退出,返回结束状态
4.3.6.2 表操作菜单
复制代码
复制代码
static enum OP_TYPE table_usage() {
    printf("1 : list %s\n", db.table_name);
    printf("2 : add an item to %s\n", db.table_name);
    printf("3 : modify an item in %s\n", db.table_name);
    printf("4 : delete an item from %s\n", db.table_name);
    printf("5 : back\n");
    int x;
    do {
        printf("input : ");
        scanf("%d", &x);
    } while (x < 1 || x > 5);
    if (x  1) return LIST_TABLE;
    if (x  2) return ADD_TABLE;
    if (x  3) return MODIFY_TABLE;
    if (x  4) return DELETE_TABLE;
    return CHOOSE_TABLE;
}

代码注释:

  • 显示当前表的操作菜单
  • 提示用户选择一个操作
  • 验证用户输入的有效性
  • 根据用户选择返回相应的操作状态
4.3.6.3 运行数据库
复制代码
复制代码
void run_database() {
    enum OP_TYPE status = CHOOSE_TABLE;
    while (1) {
        status = run(status);
        if (status == OP_END) break;
    }
    return ;
}

enum OP_TYPE run(enum OP_TYPE status) {
    switch (status) {
        case CHOOSE_TABLE: {
            return choose_table();
        } break;
        case TABLE_USAGE: {
            return table_usage();
        } break;
        case LIST_TABLE: {
            return list_table();
        } break;
        case ADD_TABLE: {
            return add_table();
        } break;
        case MODIFY_TABLE: {
            return modify_table();
        } break;
        case DELETE_TABLE: {
            return delete_table();
        } break;
        default : {
            printf("unknown status : %d\n", status);
        } break;
    }
    return OP_END;
}

代码注释:

  • run_database:数据库的主循环,从选择表开始
  • run:根据当前状态执行相应的操作,并返回下一个状态
  • 使用状态机的方式来管理程序流程,使代码结构清晰

4.4 表的实现

4.4.1 学生表实现

学生表是数据库中的一个具体表,它需要实现以下功能:

  • 定义学生数据结构
  • 实现表的初始化函数
  • 实现数据大小、打印和扫描函数
4.4.2 班级表实现

班级表是数据库中的另一个具体表,它的实现方式与学生表类似,但数据结构和操作会有所不同。

5. 实战技巧与最佳实践

5.1 文件操作技巧

5.1.1 错误处理

错误处理是文件操作中非常重要的一环,良好的错误处理可以提高程序的健壮性和可靠性。

复制代码
复制代码
// 正确的错误处理示例
FILE *fp = fopen("data.txt", "r");
if (fp  NULL) {
    perror("fopen");
    fprintf(stderr, "Failed to open file: %s\n", "data.txt");
    return -1;
}

// 读取文件时的错误处理
char buffer[1024];
if (fgets(buffer, sizeof(buffer), fp)  NULL) {
    if (feof(fp)) {
        printf("End of file reached\n");
    } else {
        perror("fgets");
        printf("Error reading file\n");
    }
}

fclose(fp);

错误处理技巧:

  • 使用perror函数打印系统错误信息
  • 使用feofferror函数区分文件结束和真正的错误
  • 为错误处理添加详细的日志信息
  • 考虑使用全局错误处理函数,统一处理错误
5.1.2 缓冲区管理

缓冲区管理对于提高文件操作性能至关重要,合理的缓冲区使用可以减少磁盘I/O次数,提高程序运行速度。

复制代码
复制代码
// 使用自定义缓冲区
#define BUFFER_SIZE 4096

void copy_file(const char *src, const char *dest) {
    FILE *fp_src = fopen(src, "rb");
    FILE *fp_dest = fopen(dest, "wb");
    if (!fp_src || !fp_dest) {
        perror("fopen");
        return;
    }

    char buffer[BUFFER_SIZE];
    size_t bytes_read;
    while ((bytes_read = fread(buffer, 1, BUFFER_SIZE, fp_src)) > 0) {
        fwrite(buffer, 1, bytes_read, fp_dest);
    }

    fclose(fp_src);
    fclose(fp_dest);
}

缓冲区管理技巧:

  • 根据文件大小和系统特性选择合适的缓冲区大小
  • 对于顺序读写,使用较大的缓冲区
  • 对于随机读写,使用较小的缓冲区
  • 及时使用fflush函数刷新缓冲区,确保数据写入磁盘
5.1.3 文件锁定

在多线程或多进程环境中,文件锁定是避免并发冲突的重要手段。

复制代码
复制代码
// 文件锁定示例
#include <fcntl.h>
#include <unistd.h>

int lock_file(int fd) {
    struct flock fl;
    fl.l_type = F_WRLCK;  // 写锁
    fl.l_whence = SEEK_SET;
    fl.l_start = 0;
    fl.l_len = 0;  // 0表示锁定整个文件
    
    return fcntl(fd, F_SETLK, &fl);
}

int unlock_file(int fd) {
    struct flock fl;
    fl.l_type = F_UNLCK;
    fl.l_whence = SEEK_SET;
    fl.l_start = 0;
    fl.l_len = 0;
    
    return fcntl(fd, F_SETLK, &fl);
}

文件锁定技巧:

  • 根据需要选择读锁(F_RDLCK)或写锁(F_WRLCK)
  • 考虑使用非阻塞锁定(F_SETLK)或阻塞锁定(F_SETLKW)
  • 锁定文件的特定区域,而不是整个文件,以提高并发性能
  • 确保在文件操作完成后解锁文件
5.1.4 文件权限

文件权限的设置对于系统安全至关重要,合理的权限设置可以防止未授权的访问和修改。

复制代码
复制代码
// 创建具有特定权限的文件
#include <sys/stat.h>

void create_file_with_permissions(const char *path) {
    // 创建文件,权限为644(所有者可读写,组和其他可读)
    FILE *fp = fopen(path, "w");
    if (fp) {
        fclose(fp);
        // 更改文件权限
        chmod(path, S_IRUSR | S_IWUSR | S_IRGRP | S_IROTH);
    }
}

文件权限技巧:

  • 使用最小权限原则,只授予必要的权限
  • 对于敏感文件,设置更严格的权限
  • 定期检查和更新文件权限
  • 在程序中明确设置文件权限,而不是依赖系统默认值
5.1.5 文件路径处理

文件路径的正确处理对于跨平台应用程序尤为重要,不同操作系统的路径分隔符和路径规则可能不同。

复制代码
复制代码
// 路径处理示例
#include <stdlib.h>
#include <string.h>

char *get_full_path(const char *path) {
    char *full_path = realpath(path, NULL);
    if (full_path == NULL) {
        perror("realpath");
        return NULL;
    }
    return full_path;
}

void normalize_path(char *path) {
    // 简单的路径规范化,处理"../"和"./"
    char *p = path;
    char *q = path;
    
    while (*p) {
        if (strncmp(p, "./", 2) == 0) {
            p += 2;
            continue;
        }
        *q++ = *p++;
    }
    *q = '\0';
}

文件路径处理技巧:

  • 使用realpath函数获取绝对路径
  • 注意处理路径中的特殊字符和符号链接
  • 对于跨平台应用,使用条件编译处理不同操作系统的路径差异
  • 避免硬编码路径,使用配置文件或环境变量

5.2 性能优化

文件操作的性能对于数据密集型应用程序至关重要,合理的性能优化可以显著提高程序的运行速度和响应时间。

5.2.1 减少文件操作次数

文件系统调用是相对昂贵的操作,减少文件操作次数是提高性能的关键。

复制代码
复制代码
// 批量写入示例
void batch_write(const char *filename, const char **data, int count) {
    FILE *fp = fopen(filename, "w");
    if (!fp) return;
    
    // 批量写入,减少fwrite调用次数
    for (int i = 0; i < count; i++) {
        fputs(data[i], fp);
        fputs("\n", fp);
    }
    
    fclose(fp);
}

减少文件操作次数的技巧:

  • 批量读写数据,减少系统调用次数
  • 使用缓冲区,将多次小操作合并为一次大操作
  • 对于频繁访问的文件,考虑使用内存映射(mmap)
  • 避免在循环中打开和关闭文件
5.2.2 选择合适的文件格式

不同的文件格式对于不同的应用场景有不同的性能表现,选择合适的文件格式可以提高操作效率。

文件格式选择指南:

  • 文本格式:适用于人类可读的数据,如配置文件、日志文件
  • 二进制格式:适用于机器处理的数据,如图像、音频、视频文件
  • 压缩格式:适用于需要节省存储空间的数据,如备份文件
  • 结构化格式:适用于需要快速解析的数据,如JSON、XML、Protocol Buffers
5.2.3 索引优化

对于大型数据库或文件系统,索引是提高查询性能的重要手段。

复制代码
复制代码
// 简单的内存索引示例
typedef struct {
    char key[64];
    long offset;
} IndexEntry;

IndexEntry *build_index(const char *filename, int *count) {
    FILE *fp = fopen(filename, "r");
    if (!fp) return NULL;
    
    IndexEntry *index = NULL;
    int capacity = 100;
    *count = 0;
    
    index = malloc(capacity * sizeof(IndexEntry));
    if (!index) {
        fclose(fp);
        return NULL;
    }
    
    char buffer[1024];
    while (fgets(buffer, sizeof(buffer), fp)) {
        long offset = ftell(fp) - strlen(buffer);
        
        // 提取关键字(假设每行的第一个字段是关键字)
        char *key = strtok(buffer, ",");
        if (key) {
            if (*count >= capacity) {
                capacity *= 2;
                index = realloc(index, capacity * sizeof(IndexEntry));
                if (!index) break;
            }
            strcpy(index[*count].key, key);
            index[*count].offset = offset;
            (*count)++;
        }
    }
    
    fclose(fp);
    return index;
}

// 使用索引查找
char *find_by_key(const char *filename, IndexEntry *index, int count, const char *key) {
    for (int i = 0; i < count; i++) {
        if (strcmp(index[i].key, key) == 0) {
            FILE *fp = fopen(filename, "r");
            if (!fp) return NULL;
            
            fseek(fp, index[i].offset, SEEK_SET);
            static char buffer[1024];
            if (fgets(buffer, sizeof(buffer), fp)) {
                fclose(fp);
                return buffer;
            }
            fclose(fp);
            break;
        }
    }
    return NULL;
}

索引优化技巧:

  • 根据数据特征选择合适的索引结构,如B树、哈希表、跳表等
  • 考虑使用内存索引和磁盘索引相结合的方式
  • 定期维护和更新索引,避免索引失效
  • 对于大型数据集,考虑使用专业的索引库
5.2.4 缓存策略

合理的缓存策略可以减少重复的磁盘I/O,提高数据访问速度。

复制代码
复制代码
// 简单的LRU缓存实现
#define CACHE_SIZE 100

typedef struct CacheEntry {
    char key[64];
    char value[1024];
    struct CacheEntry *prev;
    struct CacheEntry *next;
} CacheEntry;

typedef struct {
    CacheEntry *entries[CACHE_SIZE];
    CacheEntry *head;
    CacheEntry *tail;
    int size;
} LRUCache;

void init_cache(LRUCache *cache) {
    cache->size = 0;
    cache->head = NULL;
    cache->tail = NULL;
    memset(cache->entries, 0, sizeof(cache->entries));
}

// 哈希函数
int hash(const char *key) {
    int hash = 0;
    while (*key) {
        hash = (hash * 31 + *key++) % CACHE_SIZE;
    }
    return hash;
}

// 获取缓存项
char *get_cache(LRUCache *cache, const char *key) {
    int h = hash(key);
    CacheEntry *entry = cache->entries[h];
    
    while (entry) {
        if (strcmp(entry->key, key) == 0) {
            // 移动到链表头部
            if (entry != cache->head) {
                // 从当前位置移除
                if (entry->prev) entry->prev->next = entry->next;
                if (entry->next) entry->next->prev = entry->prev;
                if (entry == cache->tail) cache->tail = entry->prev;
                
                // 添加到头部
                entry->next = cache->head;
                entry->prev = NULL;
                if (cache->head) cache->head->prev = entry;
                cache->head = entry;
            }
            return entry->value;
        }
        entry = entry->next;
    }
    return NULL;
}

// 设置缓存项
void set_cache(LRUCache *cache, const char *key, const char *value) {
    int h = hash(key);
    
    // 检查是否已存在
    CacheEntry *entry = cache->entries[h];
    while (entry) {
        if (strcmp(entry->key, key) == 0) {
            strcpy(entry->value, value);
            // 移动到链表头部
            if (entry != cache->head) {
                if (entry->prev) entry->prev->next = entry->next;
                if (entry->next) entry->next->prev = entry->prev;
                if (entry == cache->tail) cache->tail = entry->prev;
                
                entry->next = cache->head;
                entry->prev = NULL;
                if (cache->head) cache->head->prev = entry;
                cache->head = entry;
            }
            return;
        }
        entry = entry->next;
    }
    
    // 创建新项
    entry = malloc(sizeof(CacheEntry));
    if (!entry) return;
    
    strcpy(entry->key, key);
    strcpy(entry->value, value);
    
    // 添加到哈希表
    entry->next = cache->entries[h];
    cache->entries[h] = entry;
    
    // 添加到链表头部
    entry->prev = NULL;
    entry->next = cache->head;
    if (cache->head) cache->head->prev = entry;
    cache->head = entry;
    if (!cache->tail) cache->tail = entry;
    
    cache->size++;
    
    // 如果超出缓存大小,删除最久未使用的项
    if (cache->size > CACHE_SIZE) {
        CacheEntry *old = cache->tail;
        if (old) {
            // 从链表中移除
            if (old->prev) old->prev->next = NULL;
            cache->tail = old->prev;
            
            // 从哈希表中移除
            int h_old = hash(old->key);
            CacheEntry *p = cache->entries[h_old];
            if (p == old) {
                cache->entries[h_old] = old->next;
            } else {
                while (p && p->next != old) p = p->next;
                if (p) p->next = old->next;
            }
            
            free(old);
            cache->size--;
        }
    }
}

缓存策略技巧:

  • 根据数据访问模式选择合适的缓存策略,如LRU、LFU、FIFO等
  • 合理设置缓存大小,平衡内存使用和缓存命中率
  • 考虑使用多级缓存,如内存缓存和磁盘缓存
  • 对于频繁访问的数据,优先缓存
  • 定期清理和刷新缓存,避免缓存过期

5.3 安全注意事项

文件操作中的安全问题不容忽视,不当的文件操作可能导致系统漏洞和安全风险。

5.3.1 缓冲区溢出

缓冲区溢出是最常见的安全漏洞之一,在文件操作中尤为常见。

复制代码
复制代码
// 不安全的代码
char buffer[100];
FILE *fp = fopen("input.txt", "r");
fgets(buffer, 200, fp);  // 错误:读取的字节数超过缓冲区大小

// 安全的代码
char buffer[100];
FILE *fp = fopen("input.txt", "r");
fgets(buffer, sizeof(buffer), fp);  // 正确:使用sizeof(buffer)限制读取大小

防止缓冲区溢出的技巧:

  • 始终使用安全的输入函数,如fgets代替gets
  • 明确指定缓冲区大小,避免硬编码数字
  • 使用sizeof运算符获取缓冲区大小
  • 对输入数据进行验证和过滤
  • 考虑使用动态内存分配,根据实际需要调整缓冲区大小
5.3.2 文件注入

文件注入是一种常见的安全攻击,攻击者通过操纵文件路径来访问未授权的文件。

复制代码
复制代码
// 不安全的代码
char filename[100];
printf("Enter filename: ");
scanf("%s", filename);
FILE *fp = fopen(filename, "r");  // 危险:用户可以输入任意路径

// 安全的代码
char filename[100];
printf("Enter filename: ");
scanf("%s", filename);

// 验证文件名,只允许特定目录下的文件
char safe_path[200];
sprintf(safe_path, "/safe/dir/%s", filename);

// 检查路径是否在安全目录内
char *real = realpath(safe_path, NULL);
if (real && strstr(real, "/safe/dir/") == real) {
    FILE *fp = fopen(real, "r");
    free(real);
} else {
    printf("Access denied\n");
    if (real) free(real);
}

防止文件注入的技巧:

  • 验证和过滤用户输入的文件名和路径
  • 使用白名单机制,只允许访问特定目录下的文件
  • 使用realpath函数解析路径,避免符号链接和相对路径攻击
  • 限制文件权限,避免以特权用户运行程序
  • 对文件路径进行规范化处理,移除"../"等特殊序列
5.3.3 权限提升

权限提升是指攻击者通过文件操作获取高于其应有权限的访问能力。

复制代码
复制代码
// 不安全的代码
FILE *fp = fopen("/etc/passwd", "w");  // 尝试写入系统文件
if (fp) {
    fprintf(fp, "newuser:x:1000:1000:New User:/home/newuser:/bin/bash\n");
    fclose(fp);
}

// 安全的代码
// 检查文件权限
struct stat st;
if (stat("/etc/passwd", &st)  0) {
    if ((st.st_mode & S_IWUSR) && geteuid()  0) {
        // 只有root用户可以写入
        FILE *fp = fopen("/etc/passwd", "a");
        if (fp) {
            fprintf(fp, "newuser:x:1000:1000:New User:/home/newuser:/bin/bash\n");
            fclose(fp);
        }
    } else {
        printf("Permission denied\n");
    }
}

防止权限提升的技巧:

  • 使用最小权限原则,程序只获取必要的权限
  • 避免以root或管理员权限运行程序
  • 对特权操作进行严格的权限检查
  • 使用权限分离,将特权操作和非特权操作分开
  • 定期审计和检查文件权限
5.3.4 数据备份与恢复

数据备份是防止数据丢失的重要手段,特别是对于重要的文件和数据库。

复制代码
复制代码
// 简单的文件备份函数
void backup_file(const char *source, const char *dest) {
    FILE *fp_src = fopen(source, "rb");
    FILE *fp_dest = fopen(dest, "wb");
    
    if (!fp_src || !fp_dest) {
        perror("fopen");
        if (fp_src) fclose(fp_src);
        if (fp_dest) fclose(fp_dest);
        return;
    }
    
    char buffer[4096];
    size_t bytes_read;
    
    while ((bytes_read = fread(buffer, 1, sizeof(buffer), fp_src)) > 0) {
        if (fwrite(buffer, 1, bytes_read, fp_dest) != bytes_read) {
            perror("fwrite");
            break;
        }
    }
    
    fclose(fp_src);
    fclose(fp_dest);
    
    printf("Backup completed: %s -> %s\n", source, dest);
}

// 自动备份函数
void auto_backup(const char *path, int interval) {
    char backup_path[200];
    time_t now;
    struct tm *tm_now;
    
    while (1) {
        time(&now);
        tm_now = localtime(&now);
        
        // 创建带时间戳的备份文件名
        strftime(backup_path, sizeof(backup_path), "%Y%m%d_%H%M%S.bak", tm_now);
        
        backup_file(path, backup_path);
        sleep(interval);
    }
}

数据备份与恢复的技巧:

  • 制定合理的备份策略,包括备份频率、备份方式和备份存储位置
  • 使用增量备份或差异备份,减少备份时间和存储空间
  • 对备份数据进行加密,保护敏感信息
  • 定期测试备份数据的完整性和可恢复性
  • 建立灾难恢复计划,确保在数据丢失时能够快速恢复

5.4 文件系统原理

了解文件系统的基本原理对于优化文件操作和解决文件系统相关问题非常重要。

5.4.1 文件系统层次结构

现代操作系统通常采用分层的文件系统架构,从上到下依次为:

  1. 应用程序层:用户程序和库函数
  2. 文件系统接口层:系统调用和标准库函数
  3. 文件系统实现层:具体的文件系统实现(如EXT4、NTFS等)
  4. 缓存层:页缓存和缓冲区缓存
  5. 设备驱动层:存储设备驱动程序
  6. 硬件层:物理存储设备
5.4.2 文件操作的系统调用

C语言的文件操作函数最终会调用操作系统的系统调用,常见的系统调用包括:

  • open:打开文件
  • close:关闭文件
  • read:读取文件
  • write:写入文件
  • lseek:定位文件指针
  • stat:获取文件状态
  • unlink:删除文件
  • mkdir:创建目录
  • rmdir:删除目录
5.4.3 文件描述符

在操作系统内部,文件是通过文件描述符来标识的,文件描述符是一个非负整数,用于索引进程的文件描述符表。

复制代码
复制代码
// 文件描述符示例
#include <unistd.h>
#include <fcntl.h>

int main() {
    int fd = open("data.txt", O_RDONLY);
    if (fd < 0) {
        perror("open");
        return 1;
    }
    
    char buffer[100];
    ssize_t n = read(fd, buffer, sizeof(buffer));
    if (n > 0) {
        write(STDOUT_FILENO, buffer, n);
    }
    
    close(fd);
    return 0;
}
5.4.4 内存映射

内存映射是一种将文件映射到进程虚拟内存的技术,可以提高文件访问速度。

复制代码
复制代码
// 内存映射示例
#include <sys/mman.h>
#include <sys/stat.h>
#include <fcntl.h>

int main() {
    int fd = open("data.txt", O_RDONLY);
    if (fd < 0) {
        perror("open");
        return 1;
    }
    
    struct stat st;
    if (fstat(fd, &st) < 0) {
        perror("fstat");
        close(fd);
        return 1;
    }
    
    char *addr = mmap(NULL, st.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
    if (addr == MAP_FAILED) {
        perror("mmap");
        close(fd);
        return 1;
    }
    
    // 直接访问内存中的文件内容
    printf("%s", addr);
    
    munmap(addr, st.st_size);
    close(fd);
    return 0;
}
5.4.5 文件锁定机制

文件锁定机制用于协调多个进程对同一文件的访问,避免并发冲突。

复制代码
复制代码
// 文件锁定示例
#include <fcntl.h>

int lock_file(int fd, int type) {
    struct flock fl;
    fl.l_type = type;  // F_RDLCK, F_WRLCK, F_UNLCK
    fl.l_whence = SEEK_SET;
    fl.l_start = 0;
    fl.l_len = 0;  // 0表示锁定整个文件
    
    return fcntl(fd, F_SETLK, &fl);
}

int try_lock_file(int fd, int type) {
    struct flock fl;
    fl.l_type = type;
    fl.l_whence = SEEK_SET;
    fl.l_start = 0;
    fl.l_len = 0;
    
    return fcntl(fd, F_SETLK, &fl);  // 非阻塞
}

int wait_lock_file(int fd, int type) {
    struct flock fl;
    fl.l_type = type;
    fl.l_whence = SEEK_SET;
    fl.l_start = 0;
    fl.l_len = 0;
    
    return fcntl(fd, F_SETLKW, &fl);  // 阻塞
}

5.5 高级文件操作

5.5.1 二进制文件格式

二进制文件格式是一种紧凑、高效的文件格式,适用于存储结构化数据。

复制代码
复制代码
// 二进制文件格式示例
typedef struct {
    uint32_t magic;      // 魔数,用于标识文件格式
    uint32_t version;    // 版本号
    uint32_t count;      // 数据项数量
    uint32_t offset;     // 数据区偏移量
} Header;

typedef struct {
    char name[32];       // 名称
    uint32_t id;         // ID
    uint32_t size;       // 大小
    double value;        // 值
} DataItem;

// 写入二进制文件
void write_binary_file(const char *path, DataItem *items, int count) {
    FILE *fp = fopen(path, "wb");
    if (!fp) return;
    
    Header header;
    header.magic = 0x12345678;
    header.version = 1;
    header.count = count;
    header.offset = sizeof(Header);
    
    fwrite(&header, sizeof(Header), 1, fp);
    fwrite(items, sizeof(DataItem), count, fp);
    
    fclose(fp);
}

// 读取二进制文件
DataItem *read_binary_file(const char *path, int *count) {
    FILE *fp = fopen(path, "rb");
    if (!fp) return NULL;
    
    Header header;
    if (fread(&header, sizeof(Header), 1, fp) != 1) {
        fclose(fp);
        return NULL;
    }
    
    if (header.magic != 0x12345678) {
        fclose(fp);
        return NULL;
    }
    
    DataItem *items = malloc(header.count * sizeof(DataItem));
    if (!items) {
        fclose(fp);
        return NULL;
    }
    
    if (fread(items, sizeof(DataItem), header.count, fp) != header.count) {
        free(items);
        fclose(fp);
        return NULL;
    }
    
    *count = header.count;
    fclose(fp);
    return items;
}
5.5.2 随机访问文件

随机访问文件是一种可以在任意位置读写数据的文件,适用于数据库和索引文件等场景。

复制代码
复制代码
// 随机访问文件示例
typedef struct {
    int id;
    char name[50];
    float score;
} Record;

#define RECORD_SIZE sizeof(Record)

// 写入记录
void write_record(const char *path, int index, Record *record) {
    FILE *fp = fopen(path, "rb+");
    if (!fp) {
        fp = fopen(path, "wb+");
        if (!fp) return;
    }
    
    fseek(fp, index * RECORD_SIZE, SEEK_SET);
    fwrite(record, RECORD_SIZE, 1, fp);
    
    fclose(fp);
}

// 读取记录
Record *read_record(const char *path, int index) {
    FILE *fp = fopen(path, "rb");
    if (!fp) return NULL;
    
    Record *record = malloc(RECORD_SIZE);
    if (!record) {
        fclose(fp);
        return NULL;
    }
    
    fseek(fp, index * RECORD_SIZE, SEEK_SET);
    if (fread(record, RECORD_SIZE, 1, fp) != 1) {
        free(record);
        fclose(fp);
        return NULL;
    }
    
    fclose(fp);
    return record;
}

// 获取记录数量
int get_record_count(const char *path) {
    FILE *fp = fopen(path, "rb");
    if (!fp) return 0;
    
    fseek(fp, 0, SEEK_END);
    long size = ftell(fp);
    fclose(fp);
    
    return size / RECORD_SIZE;
}
5.5.3 内存映射文件

内存映射文件是一种将文件内容映射到进程虚拟内存的技术,可以提高文件访问速度。

复制代码
复制代码
// 内存映射文件示例
#include <sys/mman.h>
#include <sys/stat.h>
#include <fcntl.h>

void *map_file(const char *path, size_t *size) {
    int fd = open(path, O_RDWR);
    if (fd < 0) return NULL;
    
    struct stat st;
    if (fstat(fd, &st) < 0) {
        close(fd);
        return NULL;
    }
    
    void *addr = mmap(NULL, st.st_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
    if (addr == MAP_FAILED) {
        close(fd);
        return NULL;
    }
    
    *size = st.st_size;
    close(fd);  // 映射后可以关闭文件描述符
    
    return addr;
}

void unmap_file(void *addr, size_t size) {
    munmap(addr, size);
}

// 使用内存映射文件
void use_mmap(const char *path) {
    size_t size;
    char *data = map_file(path, &size);
    if (!data) return;
    
    // 直接操作内存,相当于操作文件
    printf("First 100 bytes: %.*s\n", 100, data);
    
    // 修改文件内容
    if (size > 0) {
        data[0] = 'X';
    }
    
    unmap_file(data, size);
}
5.5.4 异步文件I/O

异步文件I/O是一种非阻塞的文件操作方式,可以提高I/O密集型应用程序的性能。

复制代码
复制代码
// 异步文件I/O示例(使用POSIX AIO)
#include <aio.h>

void async_read(const char *path) {
    int fd = open(path, O_RDONLY);
    if (fd < 0) return;
    
    char buffer[1024];
    struct aiocb cb;
    memset(&cb, 0, sizeof(cb));
    cb.aio_fildes = fd;
    cb.aio_buf = buffer;
    cb.aio_nbytes = sizeof(buffer);
    cb.aio_offset = 0;
    
    // 发起异步读操作
    if (aio_read(&cb) < 0) {
        perror("aio_read");
        close(fd);
        return;
    }
    
    // 等待操作完成
    while (aio_error(&cb) == EINPROGRESS) {
        // 可以做其他工作
        printf("Waiting for I/O completion...\n");
        sleep(1);
    }
    
    // 获取操作结果
    ssize_t n = aio_return(&cb);
    if (n > 0) {
        printf("Read %zd bytes: %.*s\n", n, (int)n, buffer);
    }
    
    close(fd);
}

void async_write(const char *path, const char *data, size_t size) {
    int fd = open(path, O_WRONLY | O_CREAT | O_TRUNC, 0644);
    if (fd < 0) return;
    
    struct aiocb cb;
    memset(&cb, 0, sizeof(cb));
    cb.aio_fildes = fd;
    cb.aio_buf = (void *)data;
    cb.aio_nbytes = size;
    cb.aio_offset = 0;
    
    // 发起异步写操作
    if (aio_write(&cb) < 0) {
        perror("aio_write");
        close(fd);
        return;
    }
    
    // 等待操作完成
    while (aio_error(&cb) == EINPROGRESS) {
        // 可以做其他工作
        printf("Waiting for I/O completion...\n");
        sleep(1);
    }
    
    // 获取操作结果
    ssize_t n = aio_return(&cb);
    if (n > 0) {
        printf("Wrote %zd bytes\n", n);
    }
    
    close(fd);
}

5.6 跨平台文件操作

跨平台文件操作是指在不同操作系统上都能正常工作的文件操作代码。

5.6.1 路径分隔符

不同操作系统使用不同的路径分隔符:

  • Windows:使用反斜杠(\)
  • Unix/Linux:使用正斜杠(/)
复制代码
复制代码
// 跨平台路径处理
#ifdef _WIN32
#define PATH_SEP '\\'
#else
#define PATH_SEP '/'
#endif

char *join_path(const char *dir, const char *file) {
    size_t dir_len = strlen(dir);
    size_t file_len = strlen(file);
    char *path = malloc(dir_len + file_len + 2);
    if (!path) return NULL;
    
    strcpy(path, dir);
    if (dir[dir_len - 1] != PATH_SEP) {
        path[dir_len] = PATH_SEP;
        strcpy(path + dir_len + 1, file);
    } else {
        strcpy(path + dir_len, file);
    }
    
    return path;
}
5.6.2 文件权限

不同操作系统的文件权限模型也有所不同:

  • Unix/Linux:使用rwx权限模型
  • Windows:使用ACL(访问控制列表)
复制代码
复制代码
// 跨平台文件权限设置
#ifdef _WIN32
#include <windows.h>

void set_file_permissions(const char *path, bool readable, bool writable) {
    DWORD access = 0;
    if (readable) access |= GENERIC_READ;
    if (writable) access |= GENERIC_WRITE;
    
    HANDLE hFile = CreateFile(path, access, 0, NULL, OPEN_EXISTING, FILE_ATTRIBUTE_NORMAL, NULL);
    if (hFile != INVALID_HANDLE_VALUE) {
        CloseHandle(hFile);
    }
}
#else
#include <sys/stat.h>

void set_file_permissions(const char *path, bool readable, bool writable) {
    mode_t mode = 0;
    if (readable) mode |= S_IRUSR | S_IRGRP | S_IROTH;
    if (writable) mode |= S_IWUSR | S_IWGRP | S_IWOTH;
    
    chmod(path, mode);
}
#endif
5.6.3 文件时间戳

不同操作系统获取和设置文件时间戳的方法也不同:

复制代码
复制代码
// 跨平台文件时间戳
#ifdef _WIN32
#include <windows.h>

void get_file_time(const char *path, time_t *create, time_t *access, time_t *modify) {
    HANDLE hFile = CreateFile(path, GENERIC_READ, FILE_SHARE_READ, NULL, OPEN_EXISTING, FILE_ATTRIBUTE_NORMAL, NULL);
    if (hFile == INVALID_HANDLE_VALUE) return;
    
    FILETIME ftCreate, ftAccess, ftModify;
    if (GetFileTime(hFile, &ftCreate, &ftAccess, &ftModify)) {
        // 转换FILETIME到time_t
        *create = (time_t)((ftCreate.dwHighDateTime << 32) | ftCreate.dwLowDateTime) / 10000000 - 11644473600LL;
        *access = (time_t)((ftAccess.dwHighDateTime << 32) | ftAccess.dwLowDateTime) / 10000000 - 11644473600LL;
        *modify = (time_t)((ftModify.dwHighDateTime << 32) | ftModify.dwLowDateTime) / 10000000 - 11644473600LL;
    }
    
    CloseHandle(hFile);
}
#else
#include <sys/stat.h>
#include <unistd.h>

void get_file_time(const char *path, time_t *create, time_t *access, time_t *modify) {
    struct stat st;
    if (stat(path, &st) < 0) return;
    
    *access = st.st_atime;
    *modify = st.st_mtime;
    
#ifdef __APPLE__
    // macOS支持创建时间
    struct stat st_birth;
    if (stat(path, &st_birth) == 0) {
        *create = st_birth.st_birthtime;
    }
#else
    // 其他Unix系统可能不支持创建时间
    *create = st.st_mtime;
#endif
}
#endif
5.6.4 目录操作

不同操作系统的目录操作也有所不同:

复制代码
复制代码
// 跨平台目录遍历
#ifdef _WIN32
#include <windows.h>

void list_directory(const char *path) {
    char search_path[MAX_PATH];
    sprintf(search_path, "%s\\*", path);
    
    WIN32_FIND_DATA find_data;
    HANDLE hFind = FindFirstFile(search_path, &find_data);
    if (hFind == INVALID_HANDLE_VALUE) return;
    
    do {
        if (strcmp(find_data.cFileName, ".") != 0 && strcmp(find_data.cFileName, "..") != 0) {
            printf("%s\n", find_data.cFileName);
        }
    } while (FindNextFile(hFind, &find_data));
    
    FindClose(hFind);
}
#else
#include <dirent.h>

void list_directory(const char *path) {
    DIR *dir = opendir(path);
    if (!dir) return;
    
    struct dirent *entry;
    while ((entry = readdir(dir)) != NULL) {
        if (strcmp(entry->d_name, ".") != 0 && strcmp(entry->d_name, "..") != 0) {
            printf("%s\n", entry->d_name);
        }
    }
    
    closedir(dir);
}
#endif

// 跨平台创建目录
#ifdef _WIN32
#include <windows.h>

bool create_directory(const char *path) {
    return CreateDirectory(path, NULL) != 0;
}
#else
#include <sys/stat.h>

bool create_directory(const char *path) {
    return mkdir(path, 0755) == 0;
}
#endif

5.7 实战案例

5.7.1 日志系统

日志系统是文件操作的常见应用,用于记录应用程序的运行状态和错误信息。

复制代码
复制代码
// 简单的日志系统
#define LOG_LEVEL_DEBUG 0
#define LOG_LEVEL_INFO 1
#define LOG_LEVEL_WARN 2
#define LOG_LEVEL_ERROR 3
#define LOG_LEVEL_FATAL 4

static int log_level = LOG_LEVEL_INFO;
static FILE *log_file = NULL;
static bool log_to_stdout = true;

const char *level_names[] = {
    "DEBUG",
    "INFO", 
    "WARN", 
    "ERROR",
    "FATAL"
};

void log_init(const char *path, int level, bool to_stdout) {
    log_level = level;
    log_to_stdout = to_stdout;
    
    if (path) {
        log_file = fopen(path, "a");
        if (!log_file) {
            perror("fopen");
            log_file = NULL;
        }
    }
}

void log_message(int level, const char *file, int line, const char *format, ...) {
    if (level < log_level) return;
    
    time_t now;
    struct tm *tm_now;
    char timestamp[20];
    
    time(&now);
    tm_now = localtime(&now);
    strftime(timestamp, sizeof(timestamp), "%Y-%m-%d %H:%M:%S", tm_now);
    
    va_list args;
    va_start(args, format);
    
    char message[1024];
    vsnprintf(message, sizeof(message), format, args);
    va_end(args);
    
    char log_line[2048];
    snprintf(log_line, sizeof(log_line), "[%s] [%s] %s:%d: %s\n",
             timestamp, level_names[level], file, line, message);
    
    if (log_to_stdout) {
        fprintf(stderr, "%s", log_line);
    }
    
    if (log_file) {
        fprintf(log_file, "%s", log_line);
        fflush(log_file);
    }
}

void log_close() {
    if (log_file) {
        fclose(log_file);
        log_file = NULL;
    }
}

// 日志宏
#define LOG_DEBUG(format, ...) log_message(LOG_LEVEL_DEBUG, __FILE__, __LINE__, format, ##__VA_ARGS__)
#define LOG_INFO(format, ...) log_message(LOG_LEVEL_INFO, __FILE__, __LINE__, format, ##__VA_ARGS__)
#define LOG_WARN(format, ...) log_message(LOG_LEVEL_WARN, __FILE__, __LINE__, format, ##__VA_ARGS__)
#define LOG_ERROR(format, ...) log_message(LOG_LEVEL_ERROR, __FILE__, __LINE__, format, ##__VA_ARGS__)
#define LOG_FATAL(format, ...) log_message(LOG_LEVEL_FATAL, __FILE__, __LINE__, format, ##__VA_ARGS__)

// 使用示例
int main() {
    log_init("app.log", LOG_LEVEL_DEBUG, true);
    
    LOG_INFO("Application started");
    LOG_DEBUG("Debug message: %d", 42);
    LOG_WARN("Warning message");
    LOG_ERROR("Error message");
    
    log_close();
    return 0;
}
5.7.2 配置文件解析

配置文件解析是文件操作的另一个常见应用,用于读取和解析应用程序的配置信息。

复制代码
复制代码
// 简单的配置文件解析
#include <string.h>

#define MAX_KEY_LEN 64
#define MAX_VALUE_LEN 256
#define MAX_LINE_LEN 512

typedef struct {
    char key[MAX_KEY_LEN];
    char value[MAX_VALUE_LEN];
} ConfigEntry;

typedef struct {
    ConfigEntry *entries;
    int count;
    int capacity;
} Config;

Config *config_create() {
    Config *config = malloc(sizeof(Config));
    if (!config) return NULL;
    
    config->entries = NULL;
    config->count = 0;
    config->capacity = 0;
    
    return config;
}

void config_destroy(Config *config) {
    if (config) {
        if (config->entries) {
            free(config->entries);
        }
        free(config);
    }
}

void config_set(Config *config, const char *key, const char *value) {
    // 检查是否已存在
    for (int i = 0; i < config->count; i++) {
        if (strcmp(config->entries[i].key, key) == 0) {
            strcpy(config->entries[i].value, value);
            return;
        }
    }
    
    // 扩容
    if (config->count >= config->capacity) {
        config->capacity += 10;
        config->entries = realloc(config->entries, config->capacity * sizeof(ConfigEntry));
        if (!config->entries) return;
    }
    
    // 添加新项
    strcpy(config->entries[config->count].key, key);
    strcpy(config->entries[config->count].value, value);
    config->count++;
}

const char *config_get(Config *config, const char *key, const char *default_value) {
    for (int i = 0; i < config->count; i++) {
        if (strcmp(config->entries[i].key, key) == 0) {
            return config->entries[i].value;
        }
    }
    return default_value;
}

int config_get_int(Config *config, const char *key, int default_value) {
    const char *value = config_get(config, key, NULL);
    if (value) {
        return atoi(value);
    }
    return default_value;
}

double config_get_double(Config *config, const char *key, double default_value) {
    const char *value = config_get(config, key, NULL);
    if (value) {
        return atof(value);
    }
    return default_value;
}

bool config_get_bool(Config *config, const char *key, bool default_value) {
    const char *value = config_get(config, key, NULL);
    if (value) {
        return strcmp(value, "true")  0 || strcmp(value, "1")  0;
    }
    return default_value;
}

Config *config_load(const char *path) {
    FILE *fp = fopen(path, "r");
    if (!fp) return NULL;
    
    Config *config = config_create();
    if (!config) {
        fclose(fp);
        return NULL;
    }
    
    char line[MAX_LINE_LEN];
    while (fgets(line, sizeof(line), fp)) {
        // 跳过空行和注释
        char *p = line;
        while (*p  ' ' || *p  '\t') p++;
        if (*p  '#' || *p  '\n' || *p == '\0') continue;
        
        // 解析键值对
        char *key = p;
        char *value = strchr(p, '=');
        if (!value) continue;
        
        *value = '\0';
        value++;
        
        // 去除空格
        p = key + strlen(key) - 1;
        while (p >= key && (*p  ' ' || *p  '\t')) *p-- = '\0';
        
        p = value;
        while (*p  ' ' || *p  '\t') p++;
        value = p;
        
        p = value + strlen(value) - 1;
        while (p >= value && (*p  ' ' || *p  '\t' || *p == '\n')) *p-- = '\0';
        
        config_set(config, key, value);
    }
    
    fclose(fp);
    return config;
}

void config_save(Config *config, const char *path) {
    FILE *fp = fopen(path, "w");
    if (!fp) return;
    
    for (int i = 0; i < config->count; i++) {
        fprintf(fp, "%s=%s\n", config->entries[i].key, config->entries[i].value);
    }
    
    fclose(fp);
}

// 使用示例
int main() {
    Config *config = config_load("config.ini");
    if (!config) {
        config = config_create();
        config_set(config, "host", "localhost");
        config_set(config, "port", "8080");
        config_set(config, "debug", "false");
        config_save(config, "config.ini");
    }
    
    const char *host = config_get(config, "host", "localhost");
    int port = config_get_int(config, "port", 8080);
    bool debug = config_get_bool(config, "debug", false);
    
    printf("Host: %s\n", host);
    printf("Port: %d\n", port);
    printf("Debug: %s\n", debug ? "true" : "false");
    
    config_destroy(config);
    return 0;
}
5.7.3 简单的文件压缩

文件压缩是文件操作的高级应用,用于减少文件大小和节省存储空间。

复制代码
复制代码
// 简单的Run-Length Encoding (RLE)压缩算法
void rle_compress(const char *input, const char *output) {
    FILE *fp_in = fopen(input, "rb");
    FILE *fp_out = fopen(output, "wb");
    if (!fp_in || !fp_out) {
        if (fp_in) fclose(fp_in);
        if (fp_out) fclose(fp_out);
        return;
    }
    
    int count = 0;
    unsigned char prev = 0, curr;
    
    if (fread(&prev, 1, 1, fp_in) == 1) {
        count = 1;
        
        while (fread(&curr, 1, 1, fp_in)  1) {
            if (curr  prev && count < 255) {
                count++;
            } else {
                fwrite(&count, 1, 1, fp_out);
                fwrite(&prev, 1, 1, fp_out);
                prev = curr;
                count = 1;
            }
        }
        
        fwrite(&count, 1, 1, fp_out);
        fwrite(&prev, 1, 1, fp_out);
    }
    
    fclose(fp_in);
    fclose(fp_out);
}

void rle_decompress(const char *input, const char *output) {
    FILE *fp_in = fopen(input, "rb");
    FILE *fp_out = fopen(output, "wb");
    if (!fp_in || !fp_out) {
        if (fp_in) fclose(fp_in);
        if (fp_out) fclose(fp_out);
        return;
    }
    
    int count;
    unsigned char value;
    
    while (fread(&count, 1, 1, fp_in)  1 && fread(&value, 1, 1, fp_in)  1) {
        for (int i = 0; i < count; i++) {
            fwrite(&value, 1, 1, fp_out);
        }
    }
    
    fclose(fp_in);
    fclose(fp_out);
}

// 使用示例
int main() {
    const char *original = "original.txt";
    const char *compressed = "compressed.rle";
    const char *decompressed = "decompressed.txt";
    
    // 创建测试文件
    FILE *fp = fopen(original, "w");
    if (fp) {
        for (int i = 0; i < 100; i++) {
            fprintf(fp, "AAAABBBCCDDDD");
        }
        fclose(fp);
    }
    
    // 压缩
    rle_compress(original, compressed);
    printf("Compression completed\n");
    
    // 解压
    rle_decompress(compressed, decompressed);
    printf("Decompression completed\n");
    
    // 验证
    long original_size, compressed_size, decompressed_size;
    
    fp = fopen(original, "rb");
    fseek(fp, 0, SEEK_END);
    original_size = ftell(fp);
    fclose(fp);
    
    fp = fopen(compressed, "rb");
    fseek(fp, 0, SEEK_END);
    compressed_size = ftell(fp);
    fclose(fp);
    
    fp = fopen(decompressed, "rb");
    fseek(fp, 0, SEEK_END);
    decompressed_size = ftell(fp);
    fclose(fp);
    
    printf("Original size: %ld bytes\n", original_size);
    printf("Compressed size: %ld bytes\n", compressed_size);
    printf("Decompressed size: %ld bytes\n", decompressed_size);
    printf("Compression ratio: %.2f%%\n", (1.0 - (double)compressed_size / original_size) * 100);
    
    return 0;
}
5.7.4 内存文件系统

内存文件系统是一种将文件存储在内存中的虚拟文件系统,具有极高的读写速度。

复制代码
复制代码
// 简单的内存文件系统
typedef struct {
    char name[64];
    char *data;
    size_t size;
    time_t mtime;
} MemFile;

typedef struct {
    MemFile *files;
    int count;
    int capacity;
} MemFS;

MemFS *memfs_create() {
    MemFS *fs = malloc(sizeof(MemFS));
    if (!fs) return NULL;
    
    fs->files = NULL;
    fs->count = 0;
    fs->capacity = 0;
    
    return fs;
}

void memfs_destroy(MemFS *fs) {
    if (fs) {
        for (int i = 0; i < fs->count; i++) {
            if (fs->files[i].data) {
                free(fs->files[i].data);
            }
        }
        free(fs->files);
        free(fs);
    }
}

int memfs_create_file(MemFS *fs, const char *name, const char *data, size_t size) {
    // 检查是否已存在
    for (int i = 0; i < fs->count; i++) {
        if (strcmp(fs->files[i].name, name) == 0) {
            // 更新现有文件
            if (fs->files[i].data) {
                free(fs->files[i].data);
            }
            fs->files[i].data = malloc(size);
            if (!fs->files[i].data) return -1;
            memcpy(fs->files[i].data, data, size);
            fs->files[i].size = size;
            fs->files[i].mtime = time(NULL);
            return 0;
        }
    }
    
    // 扩容
    if (fs->count >= fs->capacity) {
        fs->capacity += 10;
        fs->files = realloc(fs->files, fs->capacity * sizeof(MemFile));
        if (!fs->files) return -1;
    }
    
    // 创建新文件
    strcpy(fs->files[fs->count].name, name);
    fs->files[fs->count].data = malloc(size);
    if (!fs->files[fs->count].data) return -1;
    memcpy(fs->files[fs->count].data, data, size);
    fs->files[fs->count].size = size;
    fs->files[fs->count].mtime = time(NULL);
    fs->count++;
    
    return 0;
}

int memfs_read_file(MemFS *fs, const char *name, char *buffer, size_t size) {
    for (int i = 0; i < fs->count; i++) {
        if (strcmp(fs->files[i].name, name) == 0) {
            size_t read_size = fs->files[i].size;
            if (read_size > size) read_size = size;
            memcpy(buffer, fs->files[i].data, read_size);
            return read_size;
        }
    }
    return -1;
}

int memfs_delete_file(MemFS *fs, const char *name) {
    for (int i = 0; i < fs->count; i++) {
        if (strcmp(fs->files[i].name, name) == 0) {
            if (fs->files[i].data) {
                free(fs->files[i].data);
            }
            // 移动其他文件
            for (int j = i; j < fs->count - 1; j++) {
                fs->files[j] = fs->files[j + 1];
            }
            fs->count--;
            return 0;
        }
    }
    return -1;
}

void memfs_list_files(MemFS *fs) {
    for (int i = 0; i < fs->count; i++) {
        printf("%s\t%zu bytes\t%ld\n", 
               fs->files[i].name, 
               fs->files[i].size, 
               fs->files[i].mtime);
    }
}

// 使用示例
int main() {
    MemFS *fs = memfs_create();
    if (!fs) return 1;
    
    // 创建文件
    const char *data1 = "Hello, memory file system!";
    const char *data2 = "This is another file.";
    
    memfs_create_file(fs, "file1.txt", data1, strlen(data1));
    memfs_create_file(fs, "file2.txt", data2, strlen(data2));
    
    // 列出文件
    printf("Files in memory filesystem:\n");
    memfs_list_files(fs);
    
    // 读取文件
    char buffer[100];
    int size = memfs_read_file(fs, "file1.txt", buffer, sizeof(buffer));
    if (size > 0) {
        buffer[size] = '\0';
        printf("\nContent of file1.txt:\n%s\n", buffer);
    }
    
    // 删除文件
    memfs_delete_file(fs, "file2.txt");
    
    // 列出文件
    printf("\nFiles after deletion:\n");
    memfs_list_files(fs);
    
    memfs_destroy(fs);
    return 0;
}

6. 总结与展望

6.1 总结

本文详细介绍了C语言文件操作的各个方面,从基础的文件读写到高级的数据库实现,涵盖了以下内容:

  1. 基础文件操作

    • 文件的打开与关闭
    • 文本文件的读写
    • 二进制文件的读写
    • 文件指针的定位
  2. 中级应用

    • 学生管理系统的设计与实现
    • 学生管理系统的详细分析
  3. 高级应用

    • 完整数据库的架构设计
    • 核心数据结构的实现
    • 表操作和数据操作的实现
    • 多表支持和通用接口
  4. 实战技巧与最佳实践

    • 文件操作技巧:错误处理、缓冲区管理、文件锁定、文件权限、文件路径处理
    • 性能优化:减少文件操作次数、选择合适的文件格式、索引优化、缓存策略
    • 安全注意事项:缓冲区溢出、文件注入、权限提升、数据备份与恢复
    • 文件系统原理:文件系统层次结构、文件操作的系统调用、文件描述符、内存映射、文件锁定机制
    • 高级文件操作:二进制文件格式、随机访问文件、内存映射文件、异步文件I/O
    • 跨平台文件操作:路径分隔符、文件权限、文件时间戳、目录操作
    • 实战案例:日志系统、配置文件解析、简单的文件压缩、内存文件系统
  5. 技术深度

    • 深入讲解了文件操作的底层原理
    • 提供了大量实用的代码示例和详细注释
    • 分析了各种文件操作技巧的优缺点
    • 展示了文件操作在实际项目中的应用

6.2 展望

C语言文件操作是一项基础而重要的技能,它不仅适用于传统的桌面应用,也适用于嵌入式系统、游戏开发、系统编程等领域。随着技术的发展,文件操作的方式也在不断演变,未来可能会出现以下趋势:

  1. 异步文件I/O的普及

    • 随着硬件性能的提升和操作系统的发展,异步文件I/O将成为主流
    • 异步文件I/O可以显著提高I/O密集型应用程序的性能
  2. 分布式文件系统的应用

    • 随着云计算和大数据的发展,分布式文件系统的应用将越来越广泛
    • 分布式文件系统可以提供更高的可靠性、可扩展性和性能
  3. 文件系统虚拟化

    • 文件系统虚拟化技术将使得文件操作更加灵活和高效
    • 容器技术的发展将推动文件系统虚拟化的广泛应用
  4. 安全文件操作

    • 随着网络安全威胁的增加,安全文件操作将变得越来越重要
    • 加密文件系统、安全文件传输等技术将得到更多关注
  5. 智能文件系统

    • 人工智能技术的应用将使得文件系统更加智能
    • 智能缓存、智能压缩、智能索引等技术将提高文件系统的性能和效率

无论技术如何发展,文件操作的基本原理和核心概念是不变的。掌握C语言文件操作的基础知识,将为你打开编程世界的大门,使你能够开发更加复杂和实用的应用程序。

7. 附录

7.1 常用文件操作函数

函数名 功能 参数 返回值
fopen 打开文件 文件名,打开模式 文件指针,失败返回NULL
fclose 关闭文件 文件指针 成功返回0,失败返回EOF
fprintf 格式化写入文件 文件指针,格式化字符串,参数列表 成功返回写入的字符数,失败返回负值
fscanf 格式化读取文件 文件指针,格式化字符串,参数列表 成功返回读取的项目数,失败返回EOF
fwrite 二进制写入文件 数据指针,每个数据项大小,数据项数量,文件指针 成功返回写入的数据项数
fread 二进制读取文件 数据指针,每个数据项大小,数据项数量,文件指针 成功返回读取的数据项数
fseek 定位文件指针 文件指针,偏移量,起始位置 成功返回0,失败返回非0
ftell 获取文件指针位置 文件指针 当前位置,失败返回-1L
rewind 重置文件指针到文件开头 文件指针
feof 检查文件是否结束 文件指针 文件结束返回非0,否则返回0
ferror 检查文件操作是否出错 文件指针 出错返回非0,否则返回0
clearerr 清除文件错误标志 文件指针
fflush 刷新文件缓冲区 文件指针 成功返回0,失败返回EOF

7.2 文件打开模式

模式 说明
"r" 只读模式,文件必须存在
"w" 只写模式,文件不存在则创建,存在则清空
"a" 追加模式,文件不存在则创建,存在则在末尾追加
"r+" 读写模式,文件必须存在
"w+" 读写模式,文件不存在则创建,存在则清空
"a+" 读写模式,文件不存在则创建,存在则在末尾追加
"rb" 二进制只读模式
"wb" 二进制只写模式
"ab" 二进制追加模式
"rb+" 二进制读写模式
"wb+" 二进制读写模式
"ab+" 二进制读写模式

7.3 常见错误代码

错误代码 说明
ENOENT 文件不存在
EACCES 权限不足
EEXIST 文件已存在
EISDIR 路径是目录
ENOTDIR 路径不是目录
ENOMEM 内存不足
EIO I/O错误

7.4 代码风格指南

7.4.1 文件操作代码风格
  1. 函数命名

    • 使用动词+名词的形式,如read_filewrite_data
    • 函数名应清晰表达函数的功能
  2. 变量命名

    • 使用有意义的变量名,如file_pointerbuffer_size
    • 避免使用单个字母的变量名(除了循环变量)
  3. 注释

    • 为每个函数添加函数注释,说明函数的功能、参数和返回值
    • 为复杂的代码块添加注释,解释代码的逻辑
    • 为重要的变量和常量添加注释,说明其用途
  4. 错误处理

    • 总是检查文件操作的返回值
    • 使用perror或自定义函数打印错误信息
    • 错误处理代码应清晰、简洁
  5. 资源管理

    • 总是在文件操作完成后关闭文件
    • 使用fclose函数关闭文件,不要依赖系统自动关闭
    • 对于动态分配的内存,应在使用完毕后释放
7.4.2 代码缩进与格式
  1. 缩进

    • 使用4个空格或1个制表符进行缩进
    • 保持缩进的一致性
  2. 大括号

    • 左大括号放在行尾
    • 右大括号放在单独的一行,与对应的语句对齐
  3. 空行

    • 在函数之间添加空行
    • 在逻辑块之间添加空行
    • 保持代码的可读性
  4. 行长度

    • 每行代码长度不应超过80个字符
    • 对于长行,应适当换行

7.5 推荐学习资源

  1. 书籍

    • 《The C Programming Language》by Brian W. Kernighan and Dennis M. Ritchie
    • 《Advanced Programming in the UNIX Environment》by W. Richard Stevens and Stephen A. Rago
    • 《C Primer Plus》by Stephen Prata
  2. 在线资源

    • C语言标准库文档
    • GNU C Library Reference Manual
    • MSDN C Runtime Library Reference
  3. 实践项目

    • 实现一个简单的文本编辑器
    • 开发一个小型数据库系统
    • 编写一个文件压缩工具
    • 实现一个日志系统

7.6 常见问题与解决方案

7.6.1 文件操作常见问题
  1. 文件打开失败

    • 检查文件路径是否正确
    • 检查文件权限是否足够
    • 检查文件是否存在
  2. 文件读写错误

    • 检查文件指针是否有效
    • 检查缓冲区大小是否足够
    • 检查文件是否被其他进程锁定
  3. 文件指针定位错误

    • 检查偏移量是否有效
    • 检查起始位置是否正确
    • 检查文件是否支持随机访问
  4. 内存泄漏

    • 检查是否所有打开的文件都已关闭
    • 检查是否所有动态分配的内存都已释放
  5. 性能问题

    • 减少文件操作次数
    • 使用合适的缓冲区大小
    • 选择合适的文件格式
7.6.2 解决方案
  1. 文件打开失败

    • 使用绝对路径或相对路径
    • 确保文件权限设置正确
    • 使用access函数检查文件是否存在
  2. 文件读写错误

    • 总是检查文件操作的返回值
    • 使用ferror函数获取错误信息
    • 实现错误恢复机制
  3. 文件指针定位错误

    • 使用ftell函数获取当前位置
    • 确保偏移量在文件大小范围内
    • 对于文本文件,注意换行符的处理
  4. 内存泄漏

    • 使用RAII(资源获取即初始化)技术
    • 实现资源管理函数,统一管理资源的获取和释放
    • 使用工具如Valgrind检测内存泄漏
  5. 性能问题

    • 使用内存映射技术
    • 实现缓存策略
    • 批量处理文件操作

8. 参考文献

  1. Kernighan, Brian W., and Dennis M. Ritchie. "The C Programming Language." Prentice Hall, 1988.
  2. Stevens, W. Richard, and Stephen A. Rago. "Advanced Programming in the UNIX Environment." Addison-Wesley, 2013.
  3. ISO/IEC 9899:2018, "Programming languages - C."
  4. Microsoft Docs. "C Run-Time Library Reference."
  5. GNU C Library Reference Manual.

通过本文的学习,相信你已经对C语言文件操作有了全面的了解。从基础的fopenfclose到高级的数据库实现,从简单的文本文件到复杂的二进制文件,文件操作是C语言编程中的重要组成部分。

希望本文能够帮助你掌握文件操作的核心知识点和实战技巧,为你的编程之路打下坚实的基础。如果你有任何问题或建议,欢迎随时交流讨论。祝你编程愉快!

相关推荐
安科士andxe2 小时前
深入解析|安科士1.25G CWDM SFP光模块核心技术,破解中长距离传输痛点
服务器·网络·5g
小高不会迪斯科5 小时前
CMU 15445学习心得(二) 内存管理及数据移动--数据库系统如何玩转内存
数据库·oracle
deephub5 小时前
Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/AutoGen 都能用
人工智能·microsoft·langchain·大语言模型·agent·强化学习
e***8905 小时前
MySQL 8.0版本JDBC驱动Jar包
数据库·mysql·jar
l1t5 小时前
在wsl的python 3.14.3容器中使用databend包
开发语言·数据库·python·databend
儒雅的晴天6 小时前
大模型幻觉问题
运维·服务器
失忆爆表症7 小时前
03_数据库配置指南:PostgreSQL 17 + pgvector 向量存储
数据库·postgresql
通信大师7 小时前
深度解析PCC策略计费控制:核心网产品与应用价值
运维·服务器·网络·5g
AI_56787 小时前
Excel数据透视表提速:Power Query预处理百万数据
数据库·excel
SQL必知必会8 小时前
SQL 窗口帧:ROWS vs RANGE 深度解析
数据库·sql·性能优化