HTTP协议:互联网通信的基石与核心技术解析

《HTTP协议:互联网通信的基石与核心技术解析》

一、HTTP协议的本质与结构

作为互联网通信的基础协议,HTTP定义了客户端与服务器之间的请求-响应规范:

  1. 请求结构

    • 首行包含方法(GET/POST等)和路径

    • 关键头部:

      http 复制代码
      User-Agent: Mozilla/5.0...  # 标识客户端类型(浏览器/爬虫)
      Referer: https://previous.page # 请求来源页(拼写应为Referrer)
      Cookie: sessionId=abc123     # 身份凭证
    • Body存放POST数据(JSON/表单/文件等)

  2. 响应结构

    • 状态行决定请求结果

    • 关键头部:

      http 复制代码
      Content-Type: application/json # 响应体类型
      Set-Cookie: sessionId=abc123  # 设置客户端Cookie

二、状态码:HTTP的"语言"

分类 含义 常见状态码
1xx 信息性响应 101 协议切换
2xx 成功 200 OK
3xx 重定向 301 永久移动
4xx 客户端错误 404 未找到,405 方法不被允许
5xx 服务器错误 500 内部服务器错误

特殊状态码趣闻:

  • 418 I'm a teapot:来自1998年愚人节玩笑(RFC2324)
  • 451 Unavailable For Legal Reasons:源于《华氏451度》小说

三、HTTP无状态与Cookie机制

HTTP本质是无状态协议,Cookie技术解决了会话保持问题:

  1. 工作流程

    sequenceDiagram participant 客户端 participant 服务器 客户端->>服务器: 首次请求(无Cookie) 服务器-->>客户端: 响应头包含Set-Cookie 客户端->>服务器: 后续请求自动携带Cookie
  2. Java模拟带Cookie请求

    java 复制代码
    // 创建带Cookie的请求
    HttpGet httpGet = new HttpGet("http://example.com/protected");
    httpGet.addHeader("Cookie", "sessionId=abc123"); 
    
    // 执行请求并获取响应
    try (CloseableHttpResponse response = httpClient.execute(httpGet)) {
        String html = IOUtils.toString(response.getEntity().getContent(), "UTF-8");
        System.out.println(html);
    }

四、反爬虫实战:Header伪装

通过设置User-Agent模拟浏览器行为:

java 复制代码
// 伪装成Chrome浏览器
httpGet.addHeader("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64)");
httpGet.addHeader("Accept-Language", "zh-CN,zh;q=0.9");

五、Java文件读写三种方式

  1. 基础流操作

    java 复制代码
    // 读取
    InputStream is = new FileInputStream(file);
    while((readInt = is.read()) != -1) {
        sb.append((char) readInt);
    }
    
    // 写入
    FileOutputStream fos = new FileOutputStream(file);
    fos.write(line.getBytes());
  2. 缓冲字符流

    java 复制代码
    // 高效读取
    BufferedReader br = new BufferedReader(new FileReader(file));
    String line;
    while((line = br.readLine()) != null) {
        lines.add(line);
    }
  3. NIO快捷操作

    java 复制代码
    // JDK7+ 单行读写
    List<String> lines = Files.readAllLines(file.toPath());
    Files.write(file.toPath(), lines);
相关推荐
修己xj7 分钟前
SpringBoot解析.mdb文件实战指南
java·spring boot·后端
lpfasd12326 分钟前
Spring Boot 定时任务详解(从入门到实战)
spring boot·后端·python
moxiaoran575329 分钟前
Go语言的文件操作
开发语言·后端·golang
赴前尘1 小时前
记一次golang进程执行卡住的问题排查
开发语言·后端·golang
码农小卡拉1 小时前
Prometheus 监控 SpringBoot 应用完整教程
spring boot·后端·grafana·prometheus
计算机毕设VX:Fegn08951 小时前
计算机毕业设计|基于springboot + vue球鞋购物系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·课程设计
苏渡苇1 小时前
用 Spring Boot 项目给工厂装“遥控器”:一行 API 控制现场设备!
java·人工智能·spring boot·后端·网络协议·边缘计算
短剑重铸之日2 小时前
《设计模式》第五篇:策略模式
java·后端·设计模式·策略模式
步步为营DotNet3 小时前
深入理解ASP.NET Core Middleware:管道执行机制与高效应用
后端·asp.net
独断万古他化3 小时前
【Spring 事务】事务隔离级别与事务传播机制:从理论到业务落地实操
java·后端·spring·事务隔离·事务传播