如何实现大文件的切片上传与断点续传

背景

在我们实际开发中,难免会遇到需要使用上传文件的功能。比较小的文件我们也许不会考虑文件的切片上传,一旦涉及文件比较大,例如几十、上百MB,甚至是GB级别的文件,这种情况下又将如何呢?传输时间将会很长,一旦中途传输产生错误,之前传输的内容都将失效,从头再来。

功能设计

首先思考是两个主体功能,即切片上传与断点续传。在上传过程中肯定会占用用户大量的带宽,再考虑用户再上传中可能会临时处理其他问题,需要暂停上传,于是我们思考合计需要增加暂停与继续上传功能。此场景下,上传需要一定量的时间,所以还要增加上传进度的功能。

如何实现文件切片呢?首先,我们可以通过 input[type=file] 获取用户勾选的文件,它是包含一系列 File 对象的 FileList 对象。这里我们取 files[0] 即可。在 MDN 的介绍中可以了解到,File 对象是特殊类型的 Blob,且可以用在任意的 Blob 类型的 context 中。比如说, FileReader, URL.createObjectURL(), createImageBitmap() (en-US), 及 XMLHttpRequest.send() 都能处理 BlobFile。这里我们可以按照一定大小,将选择的文件切成一系列的 chunks ,然后再以此上传,待上传完毕后,由服务端将 chunks 合并完整文件。

如何实现断点续传呢?由于服务端无法感知到我们上传的是什么文件,将文件名发给服务端验证也不可靠,因为你无法确定服务端是否有同名文件。在此基础上,我们可以先计算出文件的 MD5 值交给服务端去查询是否有相同的文件,文件是否传输完毕,已经上传了多少 chunks 。这时可能有小伙伴提出来 MD5 已经发现有碰撞,用它验证文件的唯一性有一定概率出错。这时我们可以考虑同时搭配其他方法共同验证,比如 SHA1 ,使用 MD5 + SHA1 已经足够确保文件的唯一性。这里我们主要讲思路,后面的例子就统一使用 MD5 来举例。

那又如何实现暂停与继续上传呢?这个就比较简单了。上传 chunks 的时候,我们通常使用递归或循环来做。由此想到可以设置一个标识位,当标识为 true 时就暂停后续上传,当点击继续时,重置标识位,同时重新调用上传逻辑。

功能实现

首先我们需要安装 JavaScript-MD5 到项目中。

shell 复制代码
npm install blueimp-md5

页面上需要一个文件选择框,一个功能按钮。

html 复制代码
<input type="file" name="file" id="file">
<button id="upload" onClick="upload()">upload</button>

上传逻辑。

js 复制代码
import md5 from 'blueimp-md5';

let md5hash = '';
let flag = false;
const chunkSize = 1 * 1024 * 1024;

const input = document.getElementById('file');
const file = input.files[0];

const fr = new FileReader();

fr.addEventListener(
    "load",
    () => {
      md5hash = md5(fr.result);
    },
    false,
);

fr.readAsText(file);

const verifyFile = () => {
    return new Promise((resolve, reject) => {
        const xhr = new XMLHttpRequest();
        xhr.open('POST', 'https://example.com/files/verify', true);
        xhr.onload = (response) => {
            resolve(response);
        };
        xhr.send(md5hash);
    });
};

const uploadChunk = (fileChunk, chunkName) => {
    return new Promise((resolve, reject) => {
        const formData = new FormData()
        formData.append('file', fileChunk, chunkName);

        const xhr = new XMLHttpRequest();
        xhr.open('POST', 'https://example.com/files/upload', true);
        xhr.onload = (response) => {
            resolve(response);
        };
        xhr.send(formData);
    });
};

const upload = async () => {
    const response = await verifyFile();
    const { data }  = response ?? {};
    const { chunkIndex, done } = data ?? {};
    const totalChunks = parseInt(file.size / chunkSize);
    let index = chunkIndex || 0;

    while (!done && !flag && index < totalChunks) {
        count chunk = file.slice(chunkSize * index, chunkSize);
        const chunkName = file.name + 'chunk_' + index;
        
        await uploadChunk(chunk, chunkName);
    };
};

参考文献或文章

相关推荐
晓13132 小时前
JavaScript加强篇——第七章 浏览器对象与存储要点
开发语言·javascript·ecmascript
海底火旺2 小时前
浏览器渲染全过程解析
前端·javascript·浏览器
前端付豪2 小时前
15、前端可配置化系统设计:从硬编码到可视化配置
前端·javascript·架构
aPurpleBerry3 小时前
hot100 hot75 栈、队列题目思路
javascript·算法
颜漠笑年3 小时前
可迭代对象≠数组,一起来揭开for...of背后隐藏的秘密吧
前端·javascript
脑袋大大的4 小时前
判断当前是否为钉钉环境
开发语言·前端·javascript·钉钉·企业应用开发
军军君014 小时前
基于Springboot+UniApp+Ai实现模拟面试小工具二:后端项目搭建
前端·javascript·spring boot·spring·微信小程序·前端框架·集成学习
江城开朗的豌豆6 小时前
退出登录后头像还在?这个缓存问题坑过多少前端!
前端·javascript·vue.js
江城开朗的豌豆6 小时前
Vue的'读心术':它怎么知道数据偷偷变了?
前端·javascript·vue.js
江城开朗的豌豆6 小时前
手把手教你造一个自己的v-model:原来双向绑定这么简单!
前端·javascript·vue.js