javaweb--08

一、乱码产生的根本原因

HTTP 传输中,中文会经过URL 编码解码两个环节,编码 / 解码格式不匹配就会产生乱码:

  1. 浏览器端 :将中文按 UTF-8 编码为二进制,再转为 %E5%BC%A0%E4%B8%89 格式的 URL 编码串
  2. Tomcat 端 :默认按 ISO-8859-1(单字节编码,不支持中文)进行 URL 解码,导致中文被错误解析为乱码(如 å¼ ä¸‰

二、分请求方式的解决方案

1. POST 请求(最常用,方案简单)

POST 请求的参数在请求体 中,通过 getReader() 字符流读取,直接设置输入流编码即可解决:

java

运行

复制代码
// 必须在获取参数前调用!
request.setCharacterEncoding("UTF-8");

// 再获取参数
String username = request.getParameter("username");
System.out.println(username);
  • 核心要求 :必须在第一次获取参数前调用该方法,否则设置无效
  • 原理 :统一请求体的解码格式为 UTF-8,与浏览器编码格式一致,从根源解决乱码

2. GET/POST 通用方案(兼容所有请求方式)

适用于 GET 请求(参数在 URL 中,setCharacterEncoding 对 GET 无效),或需要统一处理所有请求的场景:

java

运行

复制代码
// 1. 先按ISO-8859-1获取字节(还原Tomcat的错误解码)
String username = request.getParameter("username");
// 2. 用UTF-8重新编码,还原正确中文
username = new String(username.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF_8);
  • 原理 :先将乱码字符串按 ISO-8859-1 转回原始字节,再用 UTF-8 正确解码,彻底解决编码不匹配问题
  • 兼容性:对 POST 请求同样有效,可作为全局通用方案

三、URL 编码与解码原理

1. URL 编码规则

  1. 将字符串按指定编码(如 UTF-8)转为二进制字节
  2. 每个字节转为 2 个 16 进制数,并在前面加上 %
    • 示例:张三 → UTF-8 编码 → %E5%BC%A0%E4%B8%89

2. Java 手动编码 / 解码 API

java

运行

复制代码
import java.net.URLEncoder;
import java.net.URLDecoder;
import java.nio.charset.StandardCharsets;

// 1. 编码(浏览器端逻辑)
String str = "张三";
String encodedStr = URLEncoder.encode(str, StandardCharsets.UTF_8);
// 结果:%E5%BC%A0%E4%B8%89

// 2. 解码(Tomcat端逻辑)
String decodedStr = URLDecoder.decode(encodedStr, StandardCharsets.UTF_8);
// 结果:张三
  • 注意 :Tomcat 8+ 已默认将 GET 请求的 URL 解码格式改为 UTF-8,GET 乱码问题在高版本 Tomcat 中已自动解决,仅需处理 POST 请求

四、完整实战示例(Servlet 中处理乱码)

java

运行

复制代码
@WebServlet("/encoding-demo")
public class EncodingServlet extends HttpServlet {
    @Override
    protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
        // 方案1:POST专用,优先使用
        request.setCharacterEncoding("UTF-8");
        String username = request.getParameter("username");
        System.out.println("POST方式获取:" + username);

        // 方案2:GET/POST通用,兼容所有场景
        String username2 = request.getParameter("username");
        username2 = new String(username2.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF_8);
        System.out.println("通用方式获取:" + username2);
    }

    @Override
    protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
        // GET请求直接用通用方案
        String username = request.getParameter("username");
        username = new String(username.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF_8);
        System.out.println("GET方式获取:" + username);
    }
}
相关推荐
小李子呢02112 小时前
前端八股Vue---生命周期函数
前端·javascript·vue.js
浪客川2 小时前
【百例RUST - 007】结构体
java·前端·rust
美狐美颜sdk2 小时前
视频平台如何实现实时美颜?Android/iOS直播APP美颜SDK接入指南
android·前端·人工智能·ios·音视频·第三方美颜sdk·视频美颜sdk
ZHENGZJM2 小时前
前端流式通信 Hook:useBlogStream 详解
前端·全栈开发
人道领域2 小时前
【黑马点评日记02】Redis解决Tomcat集群Session共享问题
java·前端·后端·架构·tomcat·firefox
MRDONG12 小时前
从 Prompt 到智能体:深入理解 APE、Active-Prompt、DSP、PAL、ReAct 与 Reflexion
前端·react.js·prompt
翻斗包菜2 小时前
实战:使用 HAProxy 搭建高可用 Web 负载均衡集群
运维·前端·负载均衡
小松加哲2 小时前
Tomcat 核心原理全解析(含请求流转+组件源码+多应用配置)
java·tomcat·firefox
凯强同学2 小时前
不上班,想裸辞,可以不可以?
服务器·前端·javascript