XML与HTML的区别汇总

XML的基本格式规则

  • 主要规则:

    • XML文档必须格式良好(well-formed)
    • 所有标签必须关闭
    • 标签名称区分大小写
    • HTML内容需要转义
    • 属性值必须使用引号
    • 不能有交叉嵌套
  • XML声明(可选但推荐):

xml 复制代码
<?xml version="1.0" encoding="UTF-8"?>
  • 根元素:
    • 必须有且只有一个根元素
    • 所有其他元素都必须在根元素内
xml 复制代码
<root>
    <!-- 所有其他元素 -->
</root>
  • 元素规则:
    • 必须有开始和结束标签
    • 标签区分大小写
    • 标签名不能包含空格
xml 复制代码
<element>内容</element>
<emptyElement></emptyElement>
<!-- 或自闭合标签 -->
<emptyElement/>
  • 属性规则:
    属性值必须用引号(单引号或双引号)
xml 复制代码
<element attribute="value">
<item id="1" name="example">
  • 嵌套规则:
    元素必须正确嵌套,不能交叉
xml 复制代码
<!-- 正确 -->
<outer><inner>内容</inner></outer>

<!-- 错误 -->
<outer><inner>内容</outer></inner>
  • 特殊字符转义:
xml 复制代码
&lt;    表示 <
&gt;    表示 >
&amp;   表示 &
'  表示 '
&quot;  表示 "
  • 注释:
xml 复制代码
<!-- 这是XML注释 -->
  • 完整示例:
xml 复制代码
<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
    <channel>
        <title>频道标题</title>
        <link>https://example.com</link>
        <description>频道描述</description>
        <item>
            <title>文章标题</title>
            <link>https://example.com/article</link>
            <description>文章描述&lt;br/&gt;包含HTML需要转义</description>
            <pubDate>发布日期</pubDate>
            <author>作者</author>
        </item>
    </channel>
</rss>

XML和HTML的区别

用途对比:

  • HTML:专门用于显示数据和网页展示,更注重实用性和容错性
  • XML:用于存储和传输数据,更注重规范性和可扩展性,是一种通用的数据格式

标签规则:

html 复制代码
<!-- HTML: 预定义标签 -->
<p>段落</p>
<div>区块</div>
<span>行内元素</span>
xml 复制代码
<!-- XML: 自定义标签 -->
<书籍> 
	<标题>XML教程</标题> 
	<作者>张三</作者>
</书籍>

语法严格性:

html 复制代码
<!-- HTML: 语法相对宽松 -->
<p>可以不关闭标签
<br>可以单标签
<div>标签可以交叉<p></div></p>
xml 复制代码
<!-- XML: 语法严格 -->
<paragraph>必须关闭标签</paragraph>
<line-break/>必须自闭合
<outer><inner>不允许交叉嵌套</inner></outer>

大小写敏感性:

html 复制代码
<!-- HTML: 不区分大小写 -->
<DIV>等同于<div>
xml 复制代码
<!-- XML: 区分大小写 -->
<Name>与<name>是不同的标签

属性值规则:

html 复制代码
<!-- HTML: 属性值可以不加引号 -->
<div class=container>
<input type=text>
xml 复制代码
<!-- XML: 属性值必须加引号 -->
<element attribute="value">
<user type="admin">

空格处理:

  • HTML:多个空格会被合并为一个
  • XML:保留所有空格

文档结构:

html 复制代码
<!-- HTML: 固定的文档结构 -->
<!DOCTYPE html>
<html>
<head>
    <title>网页标题</title>
</head>
<body>
    内容
</body>
</html>
xml 复制代码
<!-- XML: 灵活的文档结构 -->
<?xml version="1.0" encoding="UTF-8"?>		
<任意根元素>
	<任意子元素> 内容 </任意子元素>
</任意根元素>

特殊字符处理:

html 复制代码
<!-- HTML: 可以直接使用特殊字符 -->
<div>< > & " '</div>
xml 复制代码
<!-- XML: 必须使用转义字符 -->
<text>&lt; &gt; &amp; &quot; '</text>

错误处理:

  • HTML:浏览器会尝试修复错误并继续渲染
  • XML:解析器遇到错误会停止处理并报错

版本兼容:

  • HTML:有多个版本(HTML4, XHTML, HTML5)
  • XML:始终保持一致的规范
相关推荐
Wcowin9 分钟前
MkDocs文档日期插件【推荐】
前端·mkdocs
xw51 小时前
免费的个人网站托管-Cloudflare
服务器·前端
网安Ruler1 小时前
Web开发-PHP应用&Cookie脆弱&Session固定&Token唯一&身份验证&数据库通讯
前端·数据库·网络安全·php·渗透·红队
!win !1 小时前
免费的个人网站托管-Cloudflare
服务器·前端·开发工具
饺子不放糖1 小时前
基于BroadcastChannel的前端多标签页同步方案:让用户体验更一致
前端
饺子不放糖1 小时前
前端性能优化实战:从页面加载到交互响应的全链路优化
前端
Jackson__1 小时前
使用 ICE PKG 开发并发布支持多场景引用的 NPM 包
前端
饺子不放糖1 小时前
前端错误监控与异常处理:构建健壮的Web应用
前端
cos1 小时前
FE Bits 前端周周谈 Vol.1|Hello World、TanStack DB 首个 Beta 版发布
前端·javascript·css
饺子不放糖1 小时前
CSS的float布局,让我怀疑人生
前端