【C++高并发服务器WebServer】-5:内存映射与进程通信

本文目录

一、内存映射与进程通信

内存映射Memory-mapped I/O指的是将磁盘文件的数据映射到内存,用户通过修改内存就能够修改磁盘文件,如下图所示(进程地址空间指的是虚拟地址空间)。

如果两个进程都对同一块文件进行内存映射,也可以达到进程通信(进程之间有无关系都可以实现)的效果。

如果两个进程都使用了 MAP_SHARED 标志,那么它们共享同一块物理内存区域。这意味着操作系统会将文件的内容加载到物理内存中,并将两个进程的虚拟地址空间中的相应地址映射到同一块物理内存。

当一个进程修改了共享内存区域中的数据时,这些修改会反映到物理内存中,其他进程访问时也会看到这些修改。

虚拟地址空间本身并不是"加载"到物理内存中的。虚拟地址空间是一个逻辑上的地址范围,由操作系统管理。物理内存是实际存储数据的地方。当进程访问虚拟地址空间中的某个地址时,操作系统会通过页表将虚拟地址映射到物理内存地址。如果物理内存不足,操作系统会将一些不常用的页面交换到磁盘上的交换空间(Swap Space)中,以释放物理内存供其他用途。虚拟地址空间中的地址并不是直接对应物理内存的地址,而是通过页表(Page Table)映射到物理内存或其他存储设备(如磁盘)。

打个比方,假设现在有两个进程:
进程1:虚拟地址空间中的地址范围 [0x1000, 0x2000) 被映射到文件 shared_file。操作系统将这个虚拟地址范围映射到物理内存中的某个区域,例如 [0x10000, 0x11000)。
对于进程2:进程2:虚拟地址空间中的地址范围 [0x3000, 0x4000) 也被映射到文件 shared_file。操作系统将这个虚拟地址范围映射到相同的物理内存区域 [0x10000, 0x11000)。

下面是内存映射相关系统的调用。

cpp 复制代码
#include <sys/mman.h>
void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t
offset);
int munmap(void *addr, size_t length);

我们来使用个简单的案例demo来看看如何通过内存映射进行进程通信。

首先创建实现mmap的代码,然后在同级目录下写一个test.txt文件,里面可以写任意数据。

cpp 复制代码
/*
    #include <sys/mman.h>
    void *mmap(void *addr, size_t length, int prot, int flags,int fd, off_t offset);
        - 功能:将一个文件或者设备的数据映射到内存中(在当前调用进程的虚拟地址空间中)
        - 参数:
            - void *addr: NULL, 由内核指定
            - length : 要映射的数据的长度,这个值不能为0。建议使用文件的长度。
                    获取文件的长度:stat lseek(默认取分页的大小)
            - prot : 对申请的内存映射区的操作权限
                -PROT_EXEC :可执行的权限
                -PROT_READ :读权限
                -PROT_WRITE :写权限
                -PROT_NONE :没有权限
                要操作映射内存,必须要有读的权限。
                PROT_READ、PROT_READ|PROT_WRITE(Read按位或Write)
            - flags :
                - MAP_SHARED : 映射区的数据会自动和磁盘文件进行同步,进程间通信,必须要设置这个选项
                - MAP_PRIVATE :不同步,内存映射区的数据改变了,对原来的文件不会修改,会重新创建一个新的文件。(copy on write)
            - fd: 需要映射的那个文件的文件描述符
                - 通过open得到,open的是一个磁盘文件
                - 注意:文件的大小不能为0,open指定的权限不能和prot参数有冲突。
                    prot: PROT_READ                open:只读/读写 
                    prot: PROT_READ | PROT_WRITE   open:读写
            - offset:偏移量,一般不用。必须指定的是4k的整数倍,0表示不偏移。
        - 返回值:返回创建的内存的首地址
            失败返回MAP_FAILED,(void *) -1

    int munmap(void *addr, size_t length);
        - 功能:释放内存映射
        - 参数:
            - addr : 要释放的内存的首地址
            - length : 要释放的内存的大小,要和mmap函数中的length参数的值一样。
*/

/*
    使用内存映射实现进程间通信:
    1.有关系的进程(父子进程)
        - 还没有子进程的时候
            - 通过唯一的父进程,先创建内存映射区
            - 子进程会继承父进程的虚拟内存空间,包括所有已映射的内存区域。
            如果先创建子进程,再在父进程中创建内存映射区,
            那么子进程将无法访问这个映射区,因为它是在子进程创建之后才被创建的。
        - 有了内存映射区以后,创建子进程
        - 父子进程共享创建的内存映射区
    
    2.没有关系的进程间通信
        - 准备一个大小不是0的磁盘文件
        - 进程1 通过磁盘文件创建内存映射区
            - 得到一个操作这块内存的指针
        - 进程2 通过磁盘文件创建内存映射区
            - 得到一个操作这块内存的指针
        - 使用内存映射区通信

    注意:内存映射区通信,是非阻塞。
*/
#include <stdio.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
#include <wait.h>

int main() {

    // 1.打开一个文件
    int fd = open("test.txt", O_RDWR);
    int size = lseek(fd, 0, SEEK_END);  // 获取文件的大小

    // 2.创建内存映射区
    void *ptr = mmap(NULL, size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);
    //MAP_FAILED是一个宏,通常是一个空指针(NULL)或者一个特殊的无效地址。
    if(ptr == MAP_FAILED) {
        perror("mmap");
        exit(0);
    } 

    // 3.创建子进程
    pid_t pid = fork();
    if(pid > 0) {
        wait(NULL);
        // 父进程
        char buf[64];

        //strcpy的原型;char *strcpy(char *dest, const char *src);
        //buf 是目标字符串的指针,类型为 char *。
        //ptr 是 void * 类型,而strcpy的第二个参数需要的是 const char *类型
        //所以进行了强制转换。
        strcpy(buf, (char *)ptr); //strncpy 会在遇到 \0 时停止拷贝
        printf("read data : %s\n", buf);
       
    }else if(pid == 0){
        // 子进程
        strcpy((char *)ptr, "nihao a, son!!!");
    }

    // 关闭内存映射区
    munmap(ptr, size);

    return 0;
}

下面是一些使用内存映射的注意事项:

  1. 如果对mmap的返回值(ptr)做++操作(ptr++), munmap是否能够成功?

    可以对ptr进行++操作,但是munmap会错误,需要提前保存++前的内存地址

  2. 如果open时O_RDONLY, mmap时prot参数指定 PROT_READ | PROT_WRITE 会怎样?

    错误, 会返回 MAP_FAILED (即,void* -1)

    open() 函数中的权限建议和prot参数的权限保持一致。

  3. 如果文件偏移量为1000会怎样?

    偏移量必须是4k的整数倍, 返回MAP_FAILED (分页大小)

  4. mmap什么情况下会调用失败?

    • 第二个参数: length = 0
    • 第三个参数: prot权限有问题
      • 只指定了写权限
      • prot PROT_READ | PROT_WRITE
        第五个参数fd 通过open函数时 未指定 O_RDONLY | O_WRONLY
  5. 可以open的时候O_CREATE一个新文件来创建映射区吗?

    • 可以, 但是创建文件大小为0的话,肯定不行
    • 可以对新的文件进行扩展
      • lseek()
      • truncate()
  6. mmap后关闭文件描述符,对mmap映射有没有影响?

    int fd = open("xxx")

    mmap(, fd, 0);

    close(fd);

    映射区还存在, 创建映射区的fd被关闭, 没有任何影响

  7. 对ptr越界操作会怎样?

    越界操作,操作的是非法内存,-> 段错误

接下来我们实现一个使用内存映射来完成文件拷贝的功能demo:

cpp 复制代码
/*
    基于内存映射实现文件的拷贝功能
    思路:
        1、对原始文件进行内存映射。
        2、创建一个新文件(拓展该文件)
        3、把新文件的数据映射到内存中。
        3、通过内存拷贝将第一个文件的内存数据拷贝到新的文件内存中。 
        5、释放资源。
*/

#include<stdio.h>
#include<sys/mman.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>
#include<unistd.h>
#include<string.h>
#include<stdlib.h>


int main(){


    int fd = open("english.txt",O_RDWR);
    if (fd == -1){
        perror("open");
        exit(0);
    }
    int len = lseek(fd,0,SEEK_END);


    int fd1 =open("cpy.txt",O_RDWR | O_CREAT,0664);
    if(fd1==-1){
        perror("open");
    }
    truncate("cpy.txt",len);
    write(fd1,"",1);


    //分别做一个内存映射
    void *ptr = mmap(NULL,len,PROT_READ | PROT_WRITE,MAP_SHARED,fd,0);
    void *ptr1 = mmap(NULL,len,PROT_READ | PROT_WRITE,MAP_SHARED,fd1,0);
    if(ptr==MAP_FAILED){
        perror("ptr");
        exit(0);
    }
    if(ptr1==MAP_FAILED){
        perror("ptr1");
        exit(0);
    }
    //执行内存拷贝
    memcpy(ptr1,ptr,len);
    //释放资源+关闭
    munmap(ptr1,len);
    munmap(ptr,len);
    close(fd1);
    close(fd);
    return 0;
}

二、匿名映射与进程通信

匿名映射(Anonymous Mapping)是 mmap 函数的一种特殊用法,它不与任何文件关联,而是直接在进程的虚拟地址空间中分配一块内存区域。这种映射方式常用于创建匿名共享内存或分配动态内存。

匿名映射的初始内容通常被清零(即所有字节都设置为 0)匿名映射不涉及任何文件描述符(fd),因此不会从文件中加载数据。它直接在进程的虚拟地址空间中分配一块内存区域。

匿名映射可以用于动态分配内存,类似于 malloc,但更灵活。它可以直接在虚拟地址空间中分配内存,而不需要通过堆分配器。

cpp 复制代码
/*
    匿名映射:不需要文件实体进程一个内存映射
*/

#include <stdio.h>
#include <sys/mman.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <string.h>
#include <stdlib.h>
#include <sys/wait.h>

int main() {

    // 1.创建匿名内存映射区
    int len = 4096;
    void * ptr = mmap(NULL, len, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0);
    if(ptr == MAP_FAILED) {
        perror("mmap");
        exit(0);
    }

    // 父子进程间通信
    pid_t pid = fork();

    if(pid > 0) {
        // 父进程
        strcpy((char *) ptr, "hello, world");
        wait(NULL);
    }else if(pid == 0) {
        // 子进程
        sleep(1);
        printf("%s\n", (char *)ptr);
    }

    // 释放内存映射区
    int ret = munmap(ptr, len);

    if(ret == -1) {
        perror("munmap");
        exit(0);
    }
    return 0;
}
相关推荐
Icomi_9 分钟前
【PyTorch】6.张量运算函数:一键开启!PyTorch 张量函数的宝藏工厂
c语言·c++·人工智能·pytorch·python·深度学习·机器学习
lljss202025 分钟前
python实现http文件服务器访问下载
服务器·python·http
martian66538 分钟前
第27篇:Python开发进阶:python多线程与多进程编程
服务器·python
YoYoYoWhatIsUp1 小时前
Linux运维之Linux的安装和配置
linux·运维·服务器
软工在逃男大学生1 小时前
8642 快速排序
c语言·数据结构·c++·算法
最后一个bug2 小时前
linux的/proc 和 /sys目录差异
linux·c语言·arm开发·单片机·嵌入式硬件
努力的小T2 小时前
Linux二进制部署K8s集群的平滑升级教程
linux·运维·服务器·云原生·容器·kubernetes·云计算
单蠢小威2 小时前
UE5 GAS RPG Character Classes
c++·ue5
DARLING Zero two♡2 小时前
C++传送锚点的内存寻址:内存管理
开发语言·c++·内存管理