在现代网络应用中,我们习以为常的功能,如断点续传、多线程下载和在线视频快进快退,都依赖于 HTTP 协议中的一个强大特性:范围请求(Range Requests)。这项技术让客户端能够聪明地只请求文件的一部分,而不是一次性获取整个资源。
1. 为什么我们需要它?
传统的 HTTP 请求模式效率低下,特别是在处理大型文件时。如果一个 2GB 的下载任务因网络中断而失败,传统的做法是只能从头开始重新下载。这不仅耗费用户的时间,也浪费了服务器的带宽。
范围请求的出现,就是为了解决这个痛点。它的核心思想很简单:客户端可以告诉服务器,我只需要文件从第 X 个字节到第 Y 个字节的内容。 这极大地提升了数据传输的效率和可靠性。
2. 客户端:如何"提出要求"?
客户端通过在 HTTP 请求头中添加一个特殊的字段来实现范围请求,这个字段就是 Range
。它精确地定义了客户端所需要的字节范围。
-
请求部分文件 :要请求文件从 0 字节到 499 字节的部分,请求头如下。这是最基础的范围请求形式。
GET /movie.mp4 HTTP/1.1 Host: movie.com Range: bytes=0-499
-
从某个位置开始,一直到文件末尾 :这是实现"断点续传"的关键。客户端检查已下载的字节数,然后请求从该位置开始继续下载。
GET /movie.mp4 HTTP/1.1 Host: movie.com Range: bytes=500-
-
请求文件的最后若干字节 :省略起始字节,常用于流媒体应用,快速获取文件末尾的元数据(如视频总时长)。
GET /movie.mp4 HTTP/1.1 Host: movie.com Range: bytes=-500
-
请求多个不连续的部分 :通过逗号分隔,可以一次性请求文件的多个片段。这在多线程下载器中非常常见。
GET /movie.mp4 HTTP/1.1 Host: movie.com Range: bytes=0-499, 1000-1499
3. 服务器:如何"回应要求"?
服务器收到包含 Range
的请求后,会根据请求的有效性做出回应。
-
成功响应:
206 Partial Content
这是最常见的成功状态码,表示服务器已满足客户端的部分内容请求。在
206
响应中,服务器会返回两个关键头部:Content-Range
和Content-Length
。Content-Length
指示当前响应体中数据的实际字节数。Content-Range
告知客户端本次响应的字节范围以及文件的总大小。其格式为bytes [起始]-[结束]/[总大小]
。
报文示例:
HTTP/1.1 206 Partial Content Content-Type: application/zip Content-Length: 500 Content-Range: bytes 0-499/12345
此报文告诉客户端,返回了文件总长 12345 字节中的第 0 到 499 字节,共 500 字节。
-
请求无效:
416 Range Not Satisfiable
如果客户端请求的范围超出了文件的实际大小,服务器会返回
416
状态码。此时,Content-Range
头部会设置为*/[总大小]
,明确告知客户端请求的范围无法满足。HTTP/1.1 416 Range Not Satisfiable Content-Range: bytes */12345
-
不支持范围请求:
200 OK
如果服务器不支持
Range
请求,它会忽略Range
头部,直接返回200 OK
状态码,并发送整个文件。客户端必须做好相应的处理。
4. 高级应用:If-Range
确保数据一致性
在断点续传场景中,一个潜在的风险是文件在服务器上可能已经被修改。如果客户端继续请求旧文件的剩余部分,并与新文件拼接,将导致数据损坏。为解决这个问题,HTTP 引入了 If-Range
头部。
-
工作原理 :客户端在发起范围请求时,会同时附带
If-Range
头部,其值通常是上次下载时服务器返回的Etag
(文件唯一标识符)或Last-Modified
时间。- 如果服务器上的文件标识符与
If-Range
值匹配,说明文件未改变,服务器返回206
并继续发送数据。 - 如果标识符不匹配,说明文件已更新,服务器会忽略
Range
请求,返回200 OK
并发送整个最新的文件,强制客户端重新下载。
报文示例:
GET /large-file.zip HTTP/1.1 Host: example.com Range: bytes=1000- If-Range: "abcde-12345"
- 如果服务器上的文件标识符与
5. 复杂场景:多范围请求与 multipart/byteranges
当客户端一次性请求多个不连续的范围时,服务器会返回一个多部分响应(Multipart Response)。
Content-Type
:响应头中的Content-Type
会设置为multipart/byteranges; boundary=...
,其中boundary
是一个随机生成的字符串,用于在响应体中分隔不同的文件部分。- 响应体 :每个部分都有独立的
Content-Type
和Content-Range
头部,详细说明其内容。最后一个分隔符后会加上--
后缀,表示响应的结束。
报文示例:
HTTP/1.1 206 Partial Content
Content-Type: multipart/byteranges; boundary=THIS_STRING_SEPARATES
Content-Length: 797
--THIS_STRING_SEPARATES
Content-Type: application/zip
Content-Range: bytes 0-499/12345
...[前500字节的数据]...
--THIS_STRING_SEPARATES
Content-Type: application/zip
Content-Range: bytes 1000-1499/12345
...[第1000到1499字节的数据]...
--THIS_STRING_SEPARATES--
这个复杂的报文结构确保了即使是多段不连续的数据,客户端也能准确地解析和重组。
通过这些关键头部、状态码和报文结构,HTTP 范围请求实现了高效、可靠的数据分块传输,是现代网络应用中不可或缺的一项关键技术。