XML标记语言

最近在学XXE-XML外部实体注入漏洞时候,浅浅学习了一下XML,谨做此学习笔记。


目录

一:XML概述

二:XML语法

XML中的CDATA

三:使用PHP解析XML文档

添加节点

四:Xpath语言

绝对查找

相对查找

使用*匹配

条件,匹配查找


一:XML概述

XML:可扩展性标记语言

(HTML是超文本标记语言,XML和HTML极为相似)

下面是一段标准的XML数据格式:

(不同浏览器上展示形式可能不同)

XML数据格式最主要的功能就是数据传输

XML也可以用作配置文件,如:config.xml pom.xml

XML也可以存储数据,充当小型数据库

XML被发明的目的是传输和存储数据,而不是展示数据(HTML是展示数据)

XML标签必须自定义,必须有一个根节点<root></root>(不是root也行,也可以自定义),而且它是W3C推举的数据传输格式。


二:XML语法

XML语法要求极其严格:

1.必须有根节点。

2.XML的头声明:可有可无,但是建议写上。

<?xml version="1.0" encoding="utf-8"?>

3.所有标签都必须成对出现,没有HTML中的单标签。

4.大小写敏感。

5.标签不能交叉,XML的注释和HTML是一样的。

6.特殊字符需要实体转义:

XML属性:就是表示标签自身的一些额外信息

一个标签可以有多个属性,属性的值必须使用引号引起来;

命名规则:数字字母下划线,数字不能开头;

还有,在解析数据时,属性会带来额外的解析代码(多了一步,比较麻烦);所以属性就是鸡肋(食之无肉,弃之有味);

XML中的CDATA

当有一段文本包含很多特殊字符时候,这个时候一个一个转成实体过于麻烦,所以我们可以使用XML中的CDATA

XML 复制代码
<![CDATA[这里是文本内容]]>

三:使用PHP解析XML文档

在 PHP5版本以后,提供了一个非常非常强大的类库,SimpleXML类库,专门用于实现对XML文档的解析操作。

通过使用simplexml_load_file() 这个函数来解析XML文档,返回PHP对象:

会返回一个数组形式(键值对)的冬冬:(根节点root是不解析的)

object(SimpleXMLElement)#1 (3)

{ "id"=> string(3) "num" "user"=> string(5) "he11o" "qw"=> string(9) "good girl" }

并且可以通过echo $q->user 来获取到对应的字符串

PHP 解析XML共分为3步:

  1. 读取文档到内存
  2. 形成 DOM树
  3. 由 DOM树生成对象并返回.

解析其中,如果有相同的标签名,就会转为数组,XML中的标签作为了PHP中的属性,XML标签中的内容作为PHP属性值。

这个其实自己试试理解更为深刻。。

XML:

XML 复制代码
<root>
<man>
<id>num</id>
<user>he11o</user>
<qw>good girl</qw>
</man>
</root>

PHP返回到页面:

object(SimpleXMLElement)#1 (1)

{ "man"=> object(SimpleXMLElement)#2 (3)

{

"id"=> string(3) "num"

"user"=> string(5) "he11o"

"qw"=> string(9) "good girl"

}

}

可以使用for循环或者foreach来遍历XML数据。

添加节点

首先还是拿simplexml_load_file() 获取到XML文档

然后可以用addChild()函数给获取到的 $q 来添加子节点,看图:

添加节点:

最后还有一个asXML的操作,也就是把这个修改给加到XML文档中去。

总体来说,就是创建一个变量获取(接收)XML文档,然后修改,再把这个变量给返回到XML文档中去。


四:Xpath语言

Xpath:他是专门用来查找XML数据内容的一门语言,对XML元素以及属性进行遍历。

比如说要想找到一个XML文档中的所有user属性的值,直接用Xpath函数:

xpath('路径')

绝对查找

(这里是 / 开头的绝对查找)

php 复制代码
<?php
$q = simplexml_load_file('z.xml');
$w = $q->xpath('/root/man/user');
var_dump($w);
?>

Xpath查找后仍然返回的是数组,每一个值仍是一个对象。

相对查找

w = q->xpath('//user'); 注意这里是双杠

意为寻找XML文档里所有user属性的值

使用*匹配

比如: //man/* 意为man下面的所有节点都找到

条件,匹配查找

//manage\>10 age为man中的子节点(子标签)

//manlast() 拿到man节点下的最后一个节点值

//man@msg 查找man节点下的有msg属性的所有节点

总结如有不当之处,欢迎大家批评指正!

ヾ(•ω•`)o ヾ(•ω•`)o

相关推荐
San813_LDD10 小时前
[深度学习] 数据序列化格式对比:以日志级别配置为例
xml·java·前端
摇滚侠14 小时前
Spring 零基础入门到进阶 基于 XML 的声明式事务 71
xml·数据库·spring
摇滚侠1 天前
Spring 零基础入门到进阶 基于 XML 管理 Bean 14-28
xml·数据库·spring
摇滚侠2 天前
Spring 零基础入门到进阶 基于 XML 管理 Bean 29-37
xml·java·数据库·后端·spring·intellij-idea
hashiqimiya2 天前
每日android布局xml文件
android·xml·gitee
2601_961194023 天前
27考研资料|百度网盘|夸克网盘
android·xml·考研·ios·iphone·xcode·webview
许彰午6 天前
在PowerBuilder里手写XML序列化——没有现成库的年代怎么拼报文
xml·linux·服务器
坚果的博客6 天前
鸿蒙PC三方库适配OAT.xml 与 SHA512SUM 解读:开源合规与源码校验
xml·开源·harmonyos
奇树谦7 天前
YAML、XML、JSON、TOML、INI、CSV 全面对比:配置文件和数据交换到底该怎么选?
xml·json
南山丶无梅落7 天前
XXE漏洞
xml·漏洞·xxe·网安