使用dom4j.jar包读取xml内的标签等信息

1.Xml文件

XML 复制代码
<?xml version="1.0" encoding="utf-8"?>

<users>
    <user1>
        <name>张三</name>
        <age>22</age>
        <sex>男</sex>
    </user1>
    <user2>
        <name>李四</name>
        <age>21</age>
        <sex>女</sex>
    </user2>
    <user3>
        <name>可乐</name>
        <age>5</age>
        <sex>男</sex>
    </user3>
    <user4 name="xx" age="13" sex="男"/>
    <user5 name="yy" age="18" sex="男"/>
    <user6 name="zz" age="23" sex="女"/>

</users>
java 复制代码
package com.test1;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.util.List;


public class Test1 {
    public static void main(String[] args) throws FileNotFoundException, DocumentException {
        FileInputStream fis = new FileInputStream("E:\\Java buka\\0827\\src\\com/X.xml");
        SAXReader reader = new SAXReader();
        Document read = reader.read(fis);
        Element e = read.getRootElement();
        List<Element> users = e.elements();
        for (Element user : users) {
            System.out.println(user.getName());
            List<Element> us = user.elements();
            for (Element u : us) {
                String uu = u.getText();
                System.out.println(uu);
            }
            List<Attribute> atts = user.attributes();
            for (Attribute att : atts) {
                System.out.println(att.getName() + "=" + att.getText());
            }
            System.out.println("------------------");
        }

    }
}
  1. 首先通过FileInputStream指定要读取的 XML 文件路径,这里使用了绝对路径,可能会降低代码的可移植性。
  2. 创建SAXReader对象用于解析 XML 文件,SAXReader是一种基于事件驱动的 XML 解析器,适用于处理大型 XML 文件,因为它在解析过程中不会将整个 XML 文件加载到内存中。
  3. 通过reader.read(fis)读取 XML 文件并生成一个Document对象,这个对象代表整个 XML 文档。
  4. Document对象中获取根元素e,然后通过e.elements()获取根元素下的所有子元素列表users
  5. 外层循环遍历users列表中的每个元素user,打印元素名称,获取该元素的子元素列表us和属性列表atts
  6. 内层第一个循环遍历子元素列表us,打印每个子元素的文本内容。
  7. 内层第二个循环遍历属性列表atts,打印每个属性的名称和值。
  8. 最后打印一个分隔符------------------,用于区分不同的元素组。

二、优缺点分析

优点

  • 使用dom4j库进行 XML 解析,该库功能强大,提供了丰富的 API 来操作 XML 文档。
  • 通过SAXReader进行解析,对于大型 XML 文件具有较好的性能,不会一次性将整个文件加载到内存中。

缺点

  • 硬编码的文件路径使得代码的可维护性和可移植性较差。如果文件路径发生变化,需要修改代码中的路径。
  • 缺乏错误处理的详细信息。只是简单地抛出异常,没有对异常进行更具体的处理和错误信息的输出,不利于问题的排查。
  • 代码的灵活性不足。如果需要解析不同的 XML 文件或者进行更复杂的 XML 处理操作,需要对代码进行较大的修改。

三、改进建议

  1. 使用相对路径或配置文件来指定 XML 文件的位置,提高代码的可移植性。
  2. 加强错误处理,可以使用try-catch块捕获异常,并输出更详细的错误信息,以便于调试。
  3. 考虑将 XML 解析的功能封装成一个方法或类,以便于在不同的项目中复用,同时也可以提高代码的可维护性和可读性。
  4. 如果可能的话,可以添加一些参数来控制 XML 解析的行为,例如是否输出属性、是否递归遍历子元素等,提高代码的灵活性。
相关推荐
Faker66363aaa13 小时前
中国传统园林建筑检测与识别---RetinaNet_PVT-M_FPN_1x_COCO原创
python
清水白石00814 小时前
NumPy 向量化实战指南:从原理到实践的性能革命
python·numpy
Coding茶水间14 小时前
基于深度学习的猪识别系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·python·深度学习·yolo·目标检测
X54先生(人文科技)14 小时前
启蒙灯塔起源团预言—碳硅智能时代到来
人工智能·python·机器学习·语言模型
qq_242188633215 小时前
快速搭建跨环境检测服务的步骤
linux·开发语言·windows·python·macos
JaydenAI15 小时前
[拆解LangChain执行引擎]三种持久化模式的差异
python·langchain
老赵全栈实战15 小时前
《从零搭建RAG系统第4天:问题向量化+Milvus检索匹配+结果优化》
python·ai编程
Katecat9966315 小时前
【葡萄病害检测】基于SABL-RetinaNet的葡萄叶片黑腐病、霜霉病、白粉病和锈病自动识别系统
python
FL162386312915 小时前
windows从源码安装python版本paddleocr3.4.0
开发语言·windows·python
七夜zippoe15 小时前
模型解释性实战:从黑盒到白盒的SHAP与LIME完全指南
人工智能·python·机器学习·shap·lime