XML解析小坑记录[正则表达式解析]

一、问题描述

在做 SSO 单点登录时( 认证中为CAS服务对接 )。在完成对用户ticket票根校验后,返回了用户信息有关 XML 数据片段,例如下:

xml 复制代码
<cas:serviceResponse xmlns:cas="http://www.xxx.xx/xx/cas">
  <cas:authenticationSuccess>
    <cas:user>200161</cas:user>
    <cas:username>张三</cas:username>
    <cas:usertype>TEACHER</cas:usertype>
  </cas:authenticationSuccess>
</cas:serviceResponse>

获取到CAS 认证中心返回的数据后,通过 Java中的 PatternMatcher 对象来获取XML 中的数据!

Pattern 和 Matcher 是用于处理正则表达式的两个主要类。

它们的主要作用和用途如下:

  1. Pattern 类
  • 作用:Pattern类是用于编译正则表达式的类。它代表一个编译后的正则表达式,可以对输入的字符串执行匹配操作。
  • 创建:通过调用静态方法 Pattern.compile() 来创建 Pattern 对象,并传入需要的正则表达式作为参数。
  1. Matcher 类
  • 作用:Matcher 类是对输入字符串进行匹配和搜索的类。它与 Pattern 对象一起使用,用于执行匹配操作。
  • 创建:通过调用 Pattern 对象的 matcher 方法创建 Matcher 对象,并传入需要匹配的字符串。
java 复制代码
// 解析XML数据,获取指定信息
Pattern pt = Pattern.compile("<cas:user>(.*)</cas:user>");
Matcher matcher = pt.matcher(resultXml);
while (matcher.find()){
    group0 = matcher.group(0).trim();
    group1 = matcher.group(1).trim();
}

​ 上面通过 Pattern 和 **Matcher **来解析出用户信息,但是使用到了 matcher.group(0) 获取的用户信息! 导致后续操作(我的后续操作是拿到的用户信息进行特定的加密后封装一个重定向路径)中使用获取到的用户信息一直失败,也没找到原因!!

  • 后面找到问题所在:使用 group(n) 方法获取匹配的内容:group(0) 返回整个匹配的部分,group(1) 返回第一个括号内的内容 !

这里至于为什么没有发现 通过 matcher.group(0) 和 matcher.group(1) 获取到的值不一样! 是因为我将这两值都直接返回到视图中渲染了,但在视图中展示的内容 他们是一样的!!

二、复现坑

controller 层代码:

java 复制代码
package com.example.gsxy_sso_u8cloud.controller;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @ClassName : XmlBugController
 * @Description : 测试解析XML文件时出现的坑!
 * @Author : AD
 */

@RestController
@RequestMapping("/xmlbug")
public class XmlBugController {

    /**
     * Description: 模拟解析XML文件的接口
     *  通过 group(0) / group(1)  对比从XML数据中提取的值!
     *
     * @param
     * @return java.lang.String
     * @date 2024-10-24
    */
    @GetMapping("/getXmlInfo")
    public String getXmlInfo(HttpServletRequest request, HttpServletResponse response) throws IOException {


        // 模拟Cas认证校验成功后,返回的用户信息数据 resultXml
        String resultXml = "<cas:serviceResponse xmlns:cas=\"http://www.xxx.xxx/xx/cas\"> "+
                            " <cas:authenticationSuccess> "+
                            " <cas:user>200161</cas:user> "+
                            " <cas:username>张三</cas:username> "+
                            " <cas:usertype>TEACHER</cas:usertype> "+
                           " </cas:authenticationSuccess> "+
                         " </cas:serviceResponse> ";

        /**
         * 定于两个接收解析数据的对象 分别接收 group(0) 和 group(1)
         * */
        String group0 = "";
        String group1 = "";

        // 解析XML数据,获取指定信息
        Pattern pt = Pattern.compile("<cas:user>(.*)</cas:user>");
        Matcher matcher = pt.matcher(resultXml);
        while (matcher.find()){
            group0 = matcher.group(0).trim();
            group1 = matcher.group(1).trim();
        }
        System.out.println("从XML中解析出来的 group0 = " + group0);
        System.out.println("从XML中解析出来的 group1 = " + group1);

        /*
        // 设置响应内容类型为 XML
        response.setContentType("application/xml;charset=UTF-8");
        // 创建 XML 内容
        String xmlContent = "<cas:user>200161</cas:user>";
        // 输出 XML 内容
        response.getWriter().write(xmlContent);
        */

        return "group0 = "+ group0+" \t\n"+
                "group1 = "+ group1+" \t\n";
    }
}

访问controller 接口查看响应数据:

可以看出在浏览器中渲染出来的数据,显式的结果是一样的!!!~~ 所以这里就导致我没发现端倪( 因为远程服务器的配置特殊 )!!!

但是我们可以通过 页面元素 和 网络响应中看出他们的不同之处!

  • 页面元素:
  • 网络响应:

为什么是使用 group(1) 而不是 group(0) 呢?

在使用正则表达式时,group(0) 和 group(1) 的含义是不同的:

  1. group(0):

○ 返回整个匹配的字符串。这是正则表达式匹配结果的完整文本,包括所有的匹配内容。

○ 在你的例子中,group(0) 将返回整个匹配的内容,例如:"cas:user200161</cas:user>"。

  1. group(1):

○ 返回第一个捕获组中的内容。当你在正则表达式中使用括号 () 来创建捕获组时,你可以通过 group(1) 访问第一个捕获组所匹配的内容。

○ 在你的例子中,group(1) 将返回被 cas:user 标签包围的内容,即实际的用户 ID,例如 "200161"。

相关推荐
工业互联网专业5 分钟前
基于springboot+vue的高校社团管理系统的设计与实现
java·vue.js·spring boot·毕业设计·源码·课程设计
九圣残炎7 分钟前
【ElasticSearch】 Java API Client 7.17文档
java·elasticsearch·搜索引擎
m0_748251521 小时前
Ubuntu介绍、与centos的区别、基于VMware安装Ubuntu Server 22.04、配置远程连接、安装jdk+Tomcat
java·ubuntu·centos
Bro_cat1 小时前
深入浅出JSON:数据交换的轻量级解决方案
java·ajax·java-ee·json
等一场春雨1 小时前
Java设计模式 五 建造者模式 (Builder Pattern)
java·设计模式·建造者模式
hunzi_11 小时前
Java和PHP开发的商城系统区别
java·php
V+zmm101342 小时前
教育培训微信小程序ssm+论文源码调试讲解
java·数据库·微信小程序·小程序·毕业设计
十二同学啊2 小时前
Spring Boot 中的 InitializingBean:Bean 初始化背后的故事
java·spring boot·后端
我劝告了风*2 小时前
NIO | 什么是Java中的NIO —— 结合业务场景理解 NIO (二)
java·nio
阿乾之铭2 小时前
NIO 和 Netty 在 Spring Boot 中的集成与使用
java·开发语言·网络