阿里云存储的下载验证

之前写了一篇关于阿里云存储的博客，基本都是关于阿里云存储上传的问题，但是后续在下载时又遇到了一些新的问题，主要是涉及到下载时的校验与安全，所以记录一下这个问题：

不要相信任何单一来源的信息（Header / 文件名 / MIME），而是通过「预检 → 下载中校验 → 下载后终检」三道防线，逐步降低风险。

这套流程解决的核心问题是：

其中有一个概念是ETag，ETag其实是一个标识符，这个标识符存储的可能是多种方式，可能存的是版本、缓存标记、文件内容等等，所以此处使用ETag校验是校验其是否为MD5文件，方便后续进行文件内容匹配，防止文件被改动

此处是整个流程的核心安全点，采用的是流式的方式进行下载，可以实时做安全判断，而且也可以进行打断

这里实时计算的MD5是可以叠加进行计算的，内容如果一致通过流式的方式来叠加计算出来的MD5也是一样的结果，但是此处实时计算也确实需要下载完成后才能最终进行判断。

终检是对文件检查的兜底检查，是将文件下载完成之后再进行一次检查

其中libmagic是对整体文件进行鉴定检查，会涉及文件结构、内容分布、编码方式、内部特征等