XML学习

XML 概述

XML(Extensible Markup Language)是一种可扩展标记语言,是 SGML 的子集。与 HTML 不同,XML 标签可以由用户自定义,具有极高的灵活性。W3C 于 1998 年发布 XML 1.0 版本,2004 年发布 1.1 版本,但因不向下兼容而未被广泛使用,目前主流仍为 1.0 版本。

XML 的主要作用包括作为程序的配置文件、不同语言之间的数据交换媒介以及作为小型数据库存储数据。与 HTML 相比,XML 的标签是自定义的,需要自定义解析器进行解析,主要用于数据存储、配置和交换。


XML 语法基础

XML 文档声明必须位于第一行第一列,格式如下:

XML 复制代码
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
  • version:必须指定,当前主流为 1.0。
  • encoding:可选,默认为 UTF-8。
  • standalone:可选,表示是否依赖外部约束文件。

XML 元素必须有且仅有一个根元素,元素命名区分大小写,不能以数字或 xml 开头,不能包含空格。空元素可以简写为 <hello/>

属性必须用引号(单引号或双引号)包裹,同一元素中不能有重复属性名。注释格式为 <!-- 这是注释 -->

特殊字符需要使用转义字符,例如 < 转义为 &lt;> 转义为 &gt;。大量特殊字符可以使用 CDATA 区:

XML 复制代码
<![CDATA[ <a> 这里不需要转义 </a> ]]>

XML 约束:DTD 与 Schema

DTD(Document Type Definition)是一种平面式文档,扩展名为 .dtd,用于约束元素、顺序和数量。例如:

dtd 复制代码
<!ELEMENT students (student+)>
<!ELEMENT student (name,age,sex)>
<!ELEMENT name (#PCDATA)>

Schema(.xsd)本身是 XML 文档,支持数据类型、命名空间和继承等功能,推荐使用 Schema,因其功能更强大且语法统一。


XML 解析技术

DOM 和 SAX 是两种常见的 XML 解析方式。DOM 将 XML 加载为树结构,适合增删改查,但大文件性能较差;SAX 采用事件驱动方式,内存占用小,但只能读取。

DOM4J 是专为 Java 开发者设计的 XML 解析规范,比 DOM 更简洁。常用操作包括读取 XML、获取根元素、遍历子元素以及保存 XML。例如:

java 复制代码
SAXReader reader = new SAXReader();
Document doc = reader.read("students.xml");
Element root = doc.getRootElement();
List<Element> students = root.elements();

for (Element stu : students) {
    String number = stu.attributeValue("number");
    String name = stu.elementText("name");
    System.out.println(number + " : " + name);
}

保存 XML 的示例:

java 复制代码
OutputFormat format = new OutputFormat("\t", true);
format.setEncoding("UTF-8");
XMLWriter writer = new XMLWriter(new FileWriter("out.xml"), format);
writer.write(doc);
writer.close();

XPath:快速定位 XML 节点

XPath 是一种 XML 查询语言,DOM4J 对其提供了良好支持。常用操作包括:

java 复制代码
List<Node> nodes = document.selectNodes("//student[@number='1001']");
Node node = document.selectSingleNode("/students/student[1]");
String value = document.valueOf("//student/name");

常用 XPath 表达式示例:

表达式 含义
/persons/person 根路径下所有 person
//age 任意位置的 age
//person[1] 第一个 person
//@id 所有 id 属性
//person[@id='p1'] idp1person
相关推荐
不恋水的雨2 分钟前
手动调用spring的@Validated校验
java·spring
YCY^v^4 分钟前
PSW、PFW、SPSW、SPFW 是信捷TouchWin
学习
xxjj998a11 分钟前
【Spring】Spring MVC案例
java·spring·mvc
阿巴斯甜22 分钟前
Android:MagicIndicator的使用
java
Nyarlathotep011326 分钟前
并发集合类(1):CopyOnWriteArrayList
java·后端
千寻girling29 分钟前
被内推的面试 , 第一次
java·前端·python·面试·职场和发展·typescript·node.js
Engineer邓祥浩1 小时前
JVM学习笔记(13) 第五部分 高效并发 第12章 Java内存模型与线程
jvm·笔记·学习
我命由我123451 小时前
程序员的心理学学习笔记 - 反刍思维
经验分享·笔记·学习·职场和发展·求职招聘·职场发展·学习方法
GISer_Jing1 小时前
AI知识学习
人工智能·redis·学习
星辰_mya1 小时前
PV之系统与并发的核心wu器
java·开发语言·后端·学习·面试·架构师