使用TinyXML-2解析XML文件

一、XML介绍

当我们想要在不同的程序、系统或平台之间共享信息时,就需要一种统一的方式来组织和表示数据。XML(EXtensible Markup Language,即可扩展标记语言)是一种用于描述数据的标记语言,它让数据以一种结构化的方式呈现,使得计算机程序能够轻松理解和处理这些数据。

XML有以下特点:

  • 可扩展性:XML 标记集合不是固定的,可以根据需要进行扩展。它允许用户自定义标记,因此可以根据需要创建自定义的数据结构和标记集合,使其适应各种不同的应用场景。
  • 自我描述性:XML 文档包含标签(元素)和属性,这些标签和属性的名称通常反映了其所包含数据的含义。因此,XML 文档本身提供了关于数据结构和含义的信息。
  • 结构化:XML 使用标记来标识数据,并通过元素之间的嵌套关系来表示数据的结构,使其更易于理解和处理。
  • 跨平台性:XML是一种独立于平台和编程语言的标记语言,可以在各种不同的操作系统和软件环境中使用,并且能够轻松地与网络上的其他系统进行数据交换。
  • 数据分离:XML将数据与其格式和结构分离开来,使得数据和显示方式之间有了清晰的分界,这有助于更灵活地管理和维护数据。
  • 通用性:XML 广泛应用于各种领域,例如数据交换、配置文件、Web服务等,因其通用性而受到广泛支持和应用。

二、XML的解析

常见的XML解析方式有以下几种:

  • DOM 解析:DOM(Document Object Model,文档对象模型)解析器会将整个 XML 文档加载到内存中,并将其表示为一个树形结构,开发者可以通过遍历树节点来访问和操作 XML 元素和属性。
  • SAX 解析:SAX(Simple API for XML)解析器是一种基于事件驱动的解析方式,它顺序读取 XML 文档,当遇到 XML 元素、文本或其他事件时,会触发相应的回调函数,开发者可以在回调函数中处理这些事件。
  • XPath:XPath 是一种用于在 XML 文档中定位节点的语言,可以通过路径表达式来指定节点的位置和关系,从而实现对 XML 数据的精确访问和提取。
  • XSLT:可扩展样式表语言转换(EXtensible Stylesheet Language Transformations)是一种基于 XML 的语言,用于对 XML 数据进行转换和处理。可以将XML数据档转换为另外的XML或其它格式,如HTML网页,纯文字等。
  • 第三方库和工具:除了语言内置的解析库外,还有许多第三方库和工具可用于解析 XML 文件,如 lxml(Python)、Jsoup(Java)、XmlReader(C#)等。

三、TinyXML-2简介

TinyXML-2 是一个简单、小型、高效的 C++ XML 解析器,可被轻易地集成到其他程序中。它使用文档对象模型(DOM)的方式解析XML,可使用它解析 XML 文档,并读取、修改和保存的文档对象模型。

使用TinyXML-2可以实现对XML文件的:创建、解析、修改等功能。

该项目的GitHub链接如下:

TinyXML-2 【github项目】

也可以从此处下载TinyXML2源码(免费,不需要积分):

【免费】XML解析工具-TinyXML2-源代码-C++资源-CSDN文库

四、XML解析示例

4.1 创建测试用的XML文件

创建testXML.xml,内容如下所示:

XML 复制代码
<?xml version="1.0" encoding="utf-8"?>
<!--for test-->
<system>
  <android>
    <NULL>null</NULL>
  </android>

  <windows>
    <windows7>
      <apps>
        <app>windows7 c</app>
        <app>windows7 c++</app>
        <app>windows7 java</app>
        <app>windows7 python</app>
      </apps>
    </windows7>
    <windows10>
      <apps>
        <app>windows10 c</app>
        <app>windows10 c++</app>
        <app>windows10 java</app>
        <app>windows10 python</app>
      </apps>
    </windows10>
    <windows11>
      <apps>
        <app>windows11 c</app>
        <app>windows11 c++</app>
        <app>windows11 java</app>
        <app>windows11 python</app>
      </apps>
    </windows11>
  </windows>

  <linux>
    <ubuntu>
      <apps>
        <app>ubuntu_c</app>
        <app>ubuntu_c++</app>
        <app>ubuntu_java</app>
        <app>ubuntu_python</app>
      </apps>
    </ubuntu>
    <centos>
      <apps>
        <app>centos_c</app>
        <app>centos_c++</app>
        <app>centos_java</app>
        <app>centos_python</app>
      </apps>
    </centos>
  </linux>
</system>

注:

  • 根元素为 system ,其中包含 android、windows、linux三个操作系统大类。

  • 每个操作系统大类下又包含具体的操作系统版本,如windows包含windows7、windows10、windows11等。

  • 对每一个具体的操作系统版本,包含了用以存储若干app的 apps 。

  • 每个应用存储到具体的某个app中。

4.2 拷贝TinyXML-2项目的代码

将TinyXML-2项目中的 tinyxml2.cpp、tinyxml2.h 两个文件拷贝到当前的工作目录。

4.3 编写XML解析的测试代码

本次以 **读取并输出 "**某类操作系统" 中的 "各个具体操作系统版本" 的 "app内容" 为例:

创建readxml.cpp并编辑,该文件内容如下:

cpp 复制代码
#include <iostream>
#include <vector>
#include "tinyxml2.h"

using namespace tinyxml2;
using namespace std;

//定义结构体OS_APPS以进行数据存储
typedef struct os_apps{
    string osname;
    vector<string> apps;
} OS_APPS;

//输出容器中的所有信息
void show(vector<OS_APPS> &v)
{
    cout<<"\n----------print----------" << endl;
    for(OS_APPS oa : v)
    {
        cout << "osname: " << oa.osname << endl;
        int cnt = 1;
        for(auto app : oa.apps)
        {
            cout << "app" << cnt << ": " << app << endl;
            cnt ++;
        }
        cout << endl;
    }
}

//从XMLDocument中读取指定的操作系统大类,并存储到容器中
void read_xml(XMLDocument* doc, vector<OS_APPS> &v, const char* target_os)
{
    // 获取根元素
    XMLElement* root = doc->RootElement(); 
    if (!root) {
        std::cout << "No root element found!" << std::endl;
        exit(1);
    }

    // 查找指定OS类别
    XMLElement* os_element = root->FirstChildElement(target_os);
    if (!os_element) 
    {
        // 未找到指定元素
        cout << "os_element not found!" << endl;
        exit(1);
    }

    
    // 遍历所有指定分类下的所有子OS
    XMLElement* sub_os_element = os_element -> FirstChildElement();
    if(!sub_os_element)
    {
        cout << "can't get sub_os_element!" << endl;
        exit(1);
    }

    while(sub_os_element)
    {
        OS_APPS oa;
        vector<string> s;

        //获取子操作系统的名称
        oa.osname = sub_os_element -> Value();

        //获取存储apps列表的节点
        XMLElement* apps_element = sub_os_element -> FirstChildElement();
        if(!apps_element)
        {
            cout << "can't read " << oa.osname << "'apps, please check XML file!" << endl;
            exit(1);
        }
        else
        {
            cout << "begin to read " << oa.osname << "'s apps" << endl;
        }

        //获取每一个app元素,并继续读取其他同级app内容
        XMLElement* app_element = apps_element -> FirstChildElement();
        while(app_element)
        {
            s.push_back(app_element -> GetText());
            app_element = app_element -> NextSiblingElement();
        }

        //存储
        oa.apps = s;
        v.push_back(oa);

        //继续处理同级的其他子OS
        sub_os_element = sub_os_element -> NextSiblingElement();
    }

}


int main( int argc, const char ** argv)
{
    //读取的数据将存放在容器v中
    vector<OS_APPS> v;

    //参数校验
    if(argc == 1)
    {
        cout << "please input the XML filename!" << endl;
        exit(0);
    }

    //打开文件
    XMLDocument* doc = new XMLDocument();
    doc->LoadFile( argv[1] );
    if (doc->ErrorID() != XML_SUCCESS) 
    {
        cout << "Error loading XML file!" << endl;
        return 1;
    }
    printf( "XML file '%s' is loaded.\n", argv[1]);

    //读取指定类别信息,并存储到容器v中
    read_xml(doc, v, "windows");

    //输出读取的信息
    show(v);
    
    return 0;
}

4.4 生成可执行程序

在命令行执行以下命令:

bash 复制代码
g++ -g -c tinyxml2.cpp -o tinyxml2.o
g++ -g -c readxml.cpp -o readxml.o

g++ -g -o read_xml_test tinyxml2.o readxml.o

4.5 执行程序

执行程序:

bash 复制代码
./read_xml_test testXML.xml

执行结果如下所示:

可以看到,XML中的文件已经被成功读取。

五、示例代码下载

这里是以上测试代码文件(为了方便测试,补充了makefile文件和shell脚本)。

run_test.sh shell文件,清理当前目录,重新执行make命令,并运行代码

Makefile makefile文件,编译并链接项目

readxml.cpp XML解析测试源文件

tinyxml2.cpp TinyXML-2 源文件

tinyxml2.h TinyXML-2头文件

testXML.xml 测试用xml文件

执行结果如下:

下载链接:

【免费】XML解析示例项目-读取并输出xml的指定内容示例资源-CSDN文库

六、函数的参数及功能

在tinyxml2.h 中,给出了函数的定义,功能及参数类型,可根据需求寻找与使用相应的函数。

如有不当或错误之处,恳请您的指正,谢谢!!!

相关推荐
我们的五年6 分钟前
【Linux课程学习】:进程描述---PCB(Process Control Block)
linux·运维·c++
程序猿阿伟22 分钟前
《C++ 实现区块链:区块时间戳的存储与验证机制解析》
开发语言·c++·区块链
爱摸鱼的孔乙己1 小时前
【数据结构】链表(leetcode)
c语言·数据结构·c++·链表·csdn
烦躁的大鼻嘎1 小时前
模拟算法实例讲解:从理论到实践的编程之旅
数据结构·c++·算法·leetcode
IU宝2 小时前
C/C++内存管理
java·c语言·c++
fhvyxyci2 小时前
【C++之STL】摸清 string 的模拟实现(下)
开发语言·c++·string
C++忠实粉丝2 小时前
计算机网络socket编程(4)_TCP socket API 详解
网络·数据结构·c++·网络协议·tcp/ip·计算机网络·算法
古月居GYH2 小时前
在C++上实现反射用法
java·开发语言·c++
Betty’s Sweet2 小时前
[C++]:IO流
c++·文件·fstream·sstream·iostream
敲上瘾2 小时前
操作系统的理解
linux·运维·服务器·c++·大模型·操作系统·aigc