XML标记语言

最近在学XXE-XML外部实体注入漏洞时候,浅浅学习了一下XML,谨做此学习笔记。


目录

一:XML概述

二:XML语法

XML中的CDATA

三:使用PHP解析XML文档

添加节点

四:Xpath语言

绝对查找

相对查找

使用*匹配

条件,匹配查找


一:XML概述

XML:可扩展性标记语言

(HTML是超文本标记语言,XML和HTML极为相似)

下面是一段标准的XML数据格式:

(不同浏览器上展示形式可能不同)

XML数据格式最主要的功能就是数据传输

XML也可以用作配置文件,如:config.xml pom.xml

XML也可以存储数据,充当小型数据库

XML被发明的目的是传输和存储数据,而不是展示数据(HTML是展示数据)

XML标签必须自定义,必须有一个根节点<root></root>(不是root也行,也可以自定义),而且它是W3C推举的数据传输格式。


二:XML语法

XML语法要求极其严格:

1.必须有根节点。

2.XML的头声明:可有可无,但是建议写上。

<?xml version="1.0" encoding="utf-8"?>

3.所有标签都必须成对出现,没有HTML中的单标签。

4.大小写敏感。

5.标签不能交叉,XML的注释和HTML是一样的。

6.特殊字符需要实体转义:

XML属性:就是表示标签自身的一些额外信息

一个标签可以有多个属性,属性的值必须使用引号引起来;

命名规则:数字字母下划线,数字不能开头;

还有,在解析数据时,属性会带来额外的解析代码(多了一步,比较麻烦);所以属性就是鸡肋(食之无肉,弃之有味);

XML中的CDATA

当有一段文本包含很多特殊字符时候,这个时候一个一个转成实体过于麻烦,所以我们可以使用XML中的CDATA

XML 复制代码
<![CDATA[这里是文本内容]]>

三:使用PHP解析XML文档

在 PHP5版本以后,提供了一个非常非常强大的类库,SimpleXML类库,专门用于实现对XML文档的解析操作。

通过使用simplexml_load_file() 这个函数来解析XML文档,返回PHP对象:

会返回一个数组形式(键值对)的冬冬:(根节点root是不解析的)

object(SimpleXMLElement)#1 (3)

{ ["id"]=> string(3) "num" ["user"]=> string(5) "he11o" ["qw"]=> string(9) "good girl" }

并且可以通过echo $q->user 来获取到对应的字符串

PHP 解析XML共分为3步:

  1. 读取文档到内存
  2. 形成 DOM树
  3. 由 DOM树生成对象并返回.

解析其中,如果有相同的标签名,就会转为数组,XML中的标签作为了PHP中的属性,XML标签中的内容作为PHP属性值。

这个其实自己试试理解更为深刻。。

XML:

XML 复制代码
<root>
<man>
<id>num</id>
<user>he11o</user>
<qw>good girl</qw>
</man>
</root>

PHP返回到页面:

object(SimpleXMLElement)#1 (1)

{ ["man"]=> object(SimpleXMLElement)#2 (3)

{

["id"]=> string(3) "num"

["user"]=> string(5) "he11o"

["qw"]=> string(9) "good girl"

}

}

可以使用for循环或者foreach来遍历XML数据。

添加节点

首先还是拿simplexml_load_file() 获取到XML文档

然后可以用addChild()函数给获取到的 $q 来添加子节点,看图:

添加节点:

最后还有一个asXML的操作,也就是把这个修改给加到XML文档中去。

总体来说,就是创建一个变量获取(接收)XML文档,然后修改,再把这个变量给返回到XML文档中去。


四:Xpath语言

Xpath:他是专门用来查找XML数据内容的一门语言,对XML元素以及属性进行遍历。

比如说要想找到一个XML文档中的所有user属性的值,直接用Xpath函数:

xpath('路径')

绝对查找

(这里是 / 开头的绝对查找)

php 复制代码
<?php
$q = simplexml_load_file('z.xml');
$w = $q->xpath('/root/man/user');
var_dump($w);
?>

Xpath查找后仍然返回的是数组,每一个值仍是一个对象。

相对查找

$w = $q->xpath('//user'); 注意这里是双杠

意为寻找XML文档里所有user属性的值

使用*匹配

比如: //man/* 意为man下面的所有节点都找到

条件,匹配查找

//man[age>10] age为man中的子节点(子标签)

//man[last()] 拿到man节点下的最后一个节点值

//man[@msg] 查找man节点下的有msg属性的所有节点

总结如有不当之处,欢迎大家批评指正!

ヾ(•ω•`)o ヾ(•ω•`)o

相关推荐
小百菜4 小时前
dom4j实现xml转map,xml转json字符串
xml·json·xml转map·xml转json
 嘘 18 小时前
文件操作:Xml转Excel
xml·python·excel
q5673152318 小时前
使用 Python 编辑 XML 文件中的文本字段
xml·java·数据库·python·sqlite
爱敲代码的小冰1 天前
java mapper 的 xml讲解
xml·java·mybatis
子非鱼9211 天前
【Ajax】原生Ajax与jQuery中的Ajax
xml·ajax·node.js·jquery
天天进步20152 天前
X2JS: XML与JSON的完美转换工具
xml·json
法迪2 天前
解读JobScheduler的jobs.xml
xml·功耗
残花月伴2 天前
配置文件格式(xml、properties、yml/yaml)
xml·java
zhangxiang_ouc2 天前
Caché/IRIS file2Xml 一个将文件转换成Studio导出的xml格式的工具
xml