Linux笔记之使用系统调用sendfile高速拷贝文件

Linux笔记之使用系统调用sendfile高速拷贝文件

code review!

文章目录

sendfile 系统调用是 Linux 特有的函数,用于在两个文件描述符之间直接传输数据。这可以减少用户态和内核态之间的数据拷贝,从而提高文件拷贝的性能。sendfile 通常比使用普通的 readwrite 系统调用更快,尤其是在处理大文件时。

sendfile 性能优势

  1. 减少数据拷贝sendfile 在内核内直接把数据从一个文件描述符传输到另一个文件描述符,而不需要将数据从内核态拷贝到用户态再拷贝回内核态。
  2. 减少系统调用的开销 :对于大文件拷贝,sendfile 只需要一次系统调用,而传统方法可能需要多次 readwrite 调用。
  3. 更少的上下文切换 :由于减少了系统调用次数,sendfile 也减少了用户态和内核态之间的上下文切换。

sendfile 系统调用

sendfile 它主要用于网络传输,但也可以用于文件复制。sendfile 的设计目的是减少数据复制的次数,从而提高性能。

优点:

  1. 减少上下文切换: sendfile 可以直接在内核空间处理数据传输,避免了用户空间和内核空间之间的上下文切换。
  2. 高效: 它可以减少内存拷贝的次数,因为数据不需要从内核空间拷贝到用户空间再回到内核空间。
  3. 适合大文件传输: 对于大文件传输,sendfile 可以显著减少 CPU 占用和提高传输速度。

缺点:

  1. 灵活性较低: sendfile 主要用于文件描述符之间的传输,不如一些用户空间的工具灵活。
  2. 依赖于内核版本: sendfile 的性能和功能可能会受到内核版本的影响。

cp 命令

cp 是一个用户空间工具,用于复制文件和目录。它使用标准的文件 I/O 操作来实现文件复制。

优点:

  1. 易用性: cp 命令简单易用,支持各种选项,可以处理复杂的文件复制需求。
  2. 广泛支持: 几乎所有的 Unix/Linux 系统都支持 cp 命令,且不依赖于特定的内核版本。
  3. 灵活: cp 命令支持递归复制、保留文件属性等多种操作。

缺点:

  1. 性能较低: 由于 cp 命令在用户空间运行,涉及多次上下文切换和内存拷贝,性能可能不如 sendfile
  2. 高 CPU 使用率: 对于大文件复制,cp 命令可能会占用较高的 CPU 资源。

实际测试:拷贝5.8个G的文件,cp使用25s,sendfile只用7.49s,快了四倍

代码

cpp 复制代码
#include <sys/sendfile.h>
#include <fcntl.h>
#include <unistd.h>
#include <iostream>
#include <chrono>
#include <sys/stat.h>

bool copyFileSendfile(const std::string& src, const std::string& dest) {
    int source = open(src.c_str(), O_RDONLY);
    int destination = open(dest.c_str(), O_WRONLY | O_CREAT | O_TRUNC, 0644);

    if (source < 0 || destination < 0) {
        std::cerr << "Error opening files!" << std::endl;
        return false;
    }

    struct stat stat_buf;
    fstat(source, &stat_buf);
    off_t offset = 0;

    auto start = std::chrono::high_resolution_clock::now();
    if (sendfile(destination, source, &offset, stat_buf.st_size) == -1) {
        std::cerr << "Error using sendfile!" << std::endl;
        close(source);
        close(destination);
        return false;
    }
    auto end = std::chrono::high_resolution_clock::now();

    close(source);
    close(destination);

    std::chrono::duration<double> duration = end - start;
    std::cout << "Sendfile copy took " << duration.count() << " seconds" << std::endl;

    return true;
}

int main(int argc, char* argv[]) {
    if (argc != 3) {
        std::cerr << "Usage: " << argv[0] << " <source_file> <destination_file>" << std::endl;
        return 1;
    }

    std::string sourceFile = argv[1];
    std::string destinationFile = argv[2];

    if (copyFileSendfile(sourceFile, destinationFile)) {
        std::cout << "File copied successfully!" << std::endl;
    } else {
        std::cerr << "File copy failed!" << std::endl;
        return 1;
    }

    return 0;
}

编译

复制代码
g++ main.cpp -o main
相关推荐
编码小笨猪3 小时前
浅谈Linux中一次系统调用的执行过程
linux·服务器·c++
囚生CY3 小时前
【学习笔记】Langchain基础(二)
笔记·学习·langchain
早起鸟儿4 小时前
docker-Dockerfile 配置
java·linux·运维·docker
tiantianuser5 小时前
RDMA简介7之RoCE v2可靠传输
服务器·fpga开发·verilog·xilinx·rdma·可编程逻辑
忘川w6 小时前
《网络安全与防护》知识点复习
笔记·安全·web安全·网络安全
zkinglin7 小时前
AORSA编译指南
笔记·其他·能源
国际云,接待7 小时前
微软云注册被阻止怎么解决?
服务器·网络·microsoft·云原生·微软·云计算
love530love7 小时前
是否需要预先安装 CUDA Toolkit?——按使用场景分级推荐及进阶说明
linux·运维·前端·人工智能·windows·后端·nlp
m0_694845578 小时前
日本云服务器租用多少钱合适
linux·运维·服务器·安全·云计算
一心0928 小时前
Linux部署bmc TrueSight 监控agent步骤
linux·运维·服务器·监控·bmc truesight