HTTP 快速解析

一、HTTP请求结构

HTTP请求和响应报文由以下部分组成（以请求报文为例）：

请求报文结构：
1. 请求行：包含HTTP方法（如GET/POST）、请求URL和协议版本（如HTTP/1.1，HTTP/2.0，HTTP/3.0），格式为 方法 URL 协议版本。
2. 请求头（Headers）：包含元数据如 Host（目标域名）、Content-Length（报文主体长度）、Accept（客户端支持的数据格式）等。
3. 空行：用于分隔请求头和报文主体。
4. 报文主体：通常为请求参数（GET方法无主体）或JSON/表单数据（POST/PUT方法）。
响应报文结构：状态行（含状态码）、响应头、空行、响应主体。

二、常用HTTP状态码分类

1. 1xx（信息性状态码）

100 Continue：服务器已接收请求头，客户端可继续发送请求体。
101 Switching Protocols：协议切换（如WebSocket）。

2. 2xx（成功状态码）

200 OK：请求成功，返回完整数据。
204 No Content：请求成功但无返回数据（如DELETE操作）。
206 Partial Content：返回部分资源（如断点续传）。

3. 3xx（重定向状态码）

响应头里使用字段 Location，指明后续要跳转的 URL，浏览器会自动重定向新的 URL。

301 Moved Permanently：资源永久迁移，搜索引擎需更新URL。
304 Not Modified：客户端缓存有效，服务器不返回新内容。
307 Temporary Redirect：临时重定向，保留原始请求方法（如POST）。
302 Temporary Redirect：临时重定向，可能将POST转为GET。
303 Temporary Redirect：临时重定向，强制转GET，如，POST后跳转到GET页面（如表单提交）。

4. 4xx（客户端错误）

400 Bad Request：请求语法错误。
403 Forbidden：服务器拒绝请求（权限不足）。
404 Not Found：资源不存在。
416 Requested Range Not Satisfiable：断点下载时客户端头range 超过资源大小。

5. 5xx（服务器错误）

500 Internal Server Error：服务器内部错误。
503 Service Unavailable：服务器过载或维护。
502 BadGateway：作为网关或者代理工作的服务器（如Nginx）尝试执行请求时，从上游服务器接收到无效的响应。
504 GatewayTime-out：作为网关或者代理工作的服务器（如Nginx）尝试执行请求时，未能及时从上游服务器收到响应。

三、状态码使用场景

1. 206 Partial Content

场景：客户端通过 Range 头请求资源的某部分（如大文件分块下载或视频流播放）。
示例：
http 复制代码
```
GET /large-file.mp4 HTTP/1.1
Range: bytes=0-999
```
服务器返回 206 Partial Content 和对应数据块。

2. 304 Not Modified

场景：客户端携带 If-Modified-Since（最后修改时间）或 If-None-Match（ETag）请求资源，服务器验证后确认未修改。
流程：
1. 客户端首次请求，服务器返回资源及 Last-Modified 或 ETag。
2. 客户端再次请求时携带上述字段，服务器返回 304，客户端使用本地缓存。

小结

206 用于分块传输，304 用于缓存优化，两者均减少网络传输量。

四、HTTP缓存机制

1. 强制缓存

原理：客户端直接使用本地缓存，无需请求服务器。
控制字段：
- Cache-Control: max-age=3600（缓存3600秒）。
- Expire: Wed, 20 Jan 2026 12:00:00 GMT（过期时间）。
Cache-Control 的优先级高于 Expires

2. 协商缓存

原理：客户端与服务器协商是否使用缓存。
实现方式：
- Last-Modified：客户端发送 If-Modified-Since，服务器比对时间。
- ETag：客户端发送 If-None-Match，服务器校验资源哈希值。
优先级：ETag > Last-Modified（更精确）。 Last-Modified基于时间实现，ETag是基于唯一标识实现，故而ETag可以避免由于时间篡改导致的不可信问题。
304 Not Modified：客户端缓存有效，服务器不返回新内容。
使用时与强制缓存配合使用，只有强制缓存失效才会使用协商缓存。

3. 缓存失效

主动失效：服务器通过 Cache-Control: no-cache 或 Cache-Control: no-store 强制客户端重新请求。
被动失效：资源更新后，客户端下次请求会触发重新校验。

小结

HTTP缓存通过强制和协商机制提升性能，开发者需根据场景选择合适策略（如静态资源用强制缓存，动态内容用协商缓存）。

五、应用

基于 Java 原生 `HttpURLConnection` 的文件下载：

java 复制代码

import java.io.*;
import java.net.HttpURLConnection;
import java.net.URL;

public class FileDownloadExample {
    public static void main(String[] args) {
    
        URL url = new URL("https://blog.csdn.net/xiaolingting?type=blog");
        HttpURLConnection urlConnection = (HttpURLConnection)url.openConnection();
        urlConnection.setRequestMethod("GET");
        urlConnection.setConnectTimeout(5000);
        urlConnection.setReadTimeout(10000);
        int responseCode = urlConnection.getResponseCode();
        
        if (responseCode != HttpURLConnection.HTTP_OK) {
            System.out.println("download error");
            return;
        }
// 1.0 传统方式   
        try (InputStream inputStream = urlConnection.getInputStream();
        		FileOutputStream download = new FileOutputStream("download");) {
        
            BufferedInputStream bis = new BufferedInputStream(inputStream);
            
            BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(download);

            int bytesRead = 0;
            byte[] buffer = new byte[4 * 1024];
            while ((bytesRead = bis.read(buffer))  != -1) {
                bufferedOutputStream.write(buffer, 0, bytesRead);
            }

        } catch (IOException e) {
            throw new RuntimeException(e);
        }

// 2.0 NIO 优化
// 		try(InputStream inputStream = urlConnection.getInputStream();
//            FileChannel download = FileChannel.open(Paths.get("download"),
//                    StandardOpenOption.CREATE, StandardOpenOption.WRITE,StandardOpenOption.READ)) {
//
//            MappedByteBuffer mapBuffer = download.map(FileChannel.MapMode.READ_WRITE, 0,
//                    urlConnection.getContentLength());
//
//            int bytesRead = 0;
//            byte[] buffer = new byte[4 * 1024];
//            while ((bytesRead = inputStream.read(buffer))  != -1) {
//                mapBuffer.put(buffer, 0, bytesRead);
//            }
//
//
//        } catch (IOException e) {
//            throw new RuntimeException(e);
//        }        

        urlConnection.disconnect();
    }
}

代码说明

HTTP 连接建立
- 使用 HttpURLConnection 建立与目标 URL 的连接，设置超时时间避免阻塞。
响应码检查
- 通过 connection.getResponseCode() 获取响应码，仅当状态码为 200 OK 时继续下载。
流处理
- 输入流：通过 connection.getInputStream() 获取服务器返回的字节流。
- 缓冲流：使用 BufferedInputStream 和 BufferedOutputStream 提升读写效率。
- 分块读取：通过 4KB 缓冲区循环读取数据，避免大文件内存溢出。
异常处理
- 使用 try-with-resources 自动关闭流，防止资源泄漏。
- 捕获 IOException 处理网络或IO错误。

扩展功能

断点续传

添加 Range 请求头指定下载范围：

java 复制代码

connection.setRequestProperty("Range", "bytes=0-");

处理 206 Partial Content 状态码。

java 复制代码

if (responseCode == HttpURLConnection.HTTP_PARTIAL) { // 206 Partial Content
    //  获取输入流并计算总文件大小
    try (InputStream inputStream = connection.getInputStream;
         RandomAccessFile file = new RandomAccessFile(savePath, "rw")) {
                
        // 跳过已下载的字节位置
        file.seek(file.length);
                
        byte[] buffer = new byte[4 * 1024];
        int bytesRead;
        while ((bytesRead = inputStream.read(buffer)) != -1) {
               file.write(buffer, 0, bytesRead);
               downloadedBytes += bytesRead;
               updateCheckpoint(checkpointFile, downloadedBytes); // 更新断点记录
        }
                
   }
}

请求头：

Range头格式：Range: bytes=START-END，支持灵活范围（如bytes=-500表示最后500字节）。

响应头：

Content-Range: bytes START-END/TOTAL：指示返回的字节范围及文件总大小。

Content-Length：当前片段的长度。

Accept-Ranges: bytes 或 Accept-Ranges: none。

进度监控

在 while 循环中累加已读字节数，结合总文件大小（从 Content-Length 头获取）计算下载进度。
MD5 校验

添加 ETag 或 Last-Modified 头验证文件一致性。

注意事项

HTTPS 支持：需处理证书问题（默认信任所有证书可能不安全）,参考HTTPS实现安全的关键方法及技术细节。
大文件下载：建议使用 NIO 或异步流提升性能。
生产环境：推荐使用 Apache HttpClient 或 OkHttp 等成熟库。

六、其它细节

1、HTTP版本差异

HTTP/1.1使用长连接的方式改善了 HTTP/1.0 短连接造成的性能开销。

HTTP的Keep-Alive，可以使用同一个TCP连接来发送和接收多个HTTP请求/应答，避免了连接建立和释放的开销，这就是HTTP长连接。
HTTP/2.0 协议是基于 HTTPS 的，即 HTTP/2.0 是安全的。
- HTTP 默认端口号是 80，HTTPS 默认端口号是 443。
- HTTP/2 .0 相比 HTTP/1.1 性能上的改进:
  - 头部压缩：采用 HPACK 算法：在客户端和服务器同时维护一张头信息表，所有字段都会存入这个表，生成一个索引号，后续请求不必发送相同字段，只发送索引号，这样就提高速度了。
  - 二进制格式：头信息和数据体都是二进制，并且统称为帧（frame）：头信息帧（HeadersFrame）和数据帧（DataFrame）。服务端可以直接解析二进制报文，这增加了数据传输的效率。
  - 并发传输：单个TCP连接可并行传输多个请求/响应，通过数据流（Stream）标识区分不同请求，彻底解决队头阻塞。
  - 服务器主动推送资源：HTTP/2还在一定程度上改善了传统的「请求－应答」工作模式，服务端不再是被动地响应，可以主动向客户端发送消息。服务器可预判客户端需求，主动推送资源（如CSS/JS文件），减少往返次数。
HTTP/1.1 和 HTTP/2.0 传输协议使用的是 TCP 协议，而到了 HTTP/3.0 传输协议改用了 UDP 协议。

关于HTTPS细节可以参考HTTPS实现安全的关键方法及技术细节

一、HTTP请求结构

二、常用HTTP状态码分类

1. 1xx（信息性状态码）

2. 2xx（成功状态码）

3. 3xx（重定向状态码）

4. 4xx（客户端错误）

5. 5xx（服务器错误）

三、状态码使用场景

1. 206 Partial Content

2. 304 Not Modified

小结

四、HTTP缓存机制

1. 强制缓存

2. 协商缓存

3. 缓存失效

小结

五、应用

基于 Java 原生 HttpURLConnection 的文件下载：

六、其它细节

1、HTTP版本差异

基于 Java 原生 `HttpURLConnection` 的文件下载：