【前端】ikun-pptx编辑器前瞻问题二: pptx的压缩包结构,以及xml正文树及对应元素介绍

文章目录

PPTX文件本质:一个压缩包

PPTX文件实际上是一个遵循Open XML标准的ZIP压缩包,包含多个XML文件和其他资源。我们可以通过解压工具查看其内部结构:

复制代码
pptx文件
├── [Content_Types].xml
├── _rels/
├── docProps/
│   ├── app.xml
│   ├── core.xml
│   └── thumbnail.jpeg
└── ppt/
    ├── presentation.xml
    ├── slides/
    │   ├── slide1.xml
    │   ├── slide2.xml
    │   └── ...
    ├── slideLayouts/
    ├── slideMasters/
    ├── media/          # 存放图片等媒体资源
    ├── theme/
    └── _rels/

可以看到,每一页幻灯片是一个独立的xml文件

而图片,可能以链接

核心文件解析

1. 幻灯片内容文件 (ppt/slides/slideX.xml)

每个幻灯片对应一个XML文件,包含以下关键结构:

xml 复制代码
<p:sld>
  <p:cSld>       <!-- 幻灯片画布 -->
    <p:spTree>   <!-- 形状树 -->
      <p:sp>     <!-- 形状/文本框 -->
        <p:nvSpPr>  <!-- 非可视属性 -->
        <p:spPr>    <!-- 形状属性 -->
        <p:txBody>  <!-- 文本内容 -->
      </p:sp>
      <p:pic>    <!-- 图片元素 -->
        <p:nvPicPr>
        <p:blipFill>  <!-- 图片填充 -->
        <p:spPr>
      </p:pic>
    </p:spTree>
  </p:cSld>
</p:sld>

2. 元素类型解析

文本框元素 (p:sp)
xml 复制代码
<p:sp>
  <p:nvSpPr>
    <p:cNvPr id="1" name="TextBox 1"/>
    <p:cNvSpPr/>
  </p:nvSpPr>
  <p:spPr>  <!-- 样式属性 -->
    <a:xfrm>  <!-- 位置/尺寸 -->
      <a:off x="1524000" y="1524000"/>
      <a:ext cx="2743200" cy="914400"/>
    </a:xfrm>
    <a:prstGeom prst="rect">  <!-- 预设形状 -->
      <a:avLst/>
    </a:prstGeom>
  </p:spPr>
  <p:txBody>  <!-- 文本内容 -->
    <a:bodyPr/>
    <a:p>      <!-- 段落 -->
      <a:r>    <!-- 文本运行 -->
        <a:rPr lang="zh-CN" sz="1800"/>  <!-- 文本属性 -->
        <a:t>Hello World</a:t>  <!-- 文本内容 -->
      </a:r>
    </a:p>
  </p:txBody>
</p:sp>
图片元素 (p:pic)
xml 复制代码
<p:pic>
  <p:nvPicPr>
    <p:cNvPr id="2" name="Picture 1"/>
    <p:cNvPicPr>
      <a:picLocks noChangeAspect="1"/>
    </p:cNvPicPr>
  </p:nvPicPr>
  <p:blipFill>  <!-- 图片填充 -->
    <a:blip r:embed="rId1"/>  <!-- 引用关系ID -->
    <a:stretch>
      <a:fillRect/>
    </a:stretch>
  </p:blipFill>
  <p:spPr>  <!-- 样式属性 -->
    <a:xfrm>
      <a:off x="1524000" y="1524000"/>
      <a:ext cx="2743200" cy="1828800"/>
    </a:xfrm>
    <a:prstGeom prst="rect">
      <a:avLst/>
    </a:prstGeom>
  </p:spPr>
</p:pic>

单位系统

PPTX中使用EMU(English Metric Unit)作为基本单位:

  • 1英寸 = 914400 EMU
  • 1厘米 = 360000 EMU
  • 1磅 = 12700 EMU

转换公式:

javascript 复制代码
function emuToPx(emu, dpi = 96) {
  return Math.round((emu / 914400) * dpi);
}

开发注意事项

  1. 关系映射 :所有资源引用都通过 ppt/_rels目录下的关系文件映射
  2. 媒体资源 :图片存储在 ppt/media目录,通过 r:embed引用
  3. 样式继承:幻灯片会继承slideMaster和slideLayout中的样式
  4. 命名空间:XML中使用大量命名空间前缀,解析时需注意

参考工具

  1. Open XML SDK
  2. PPTX.js
  3. Office XML文档

下期预告:如何在前端实现PPTX的页面元素解析与渲染

pptx渲染路线图

在此,我们简单确定一个渲染路线图, 后续按照此顺序对 每一页的元素完成解析并进行还原度评估

相关推荐
qq_1777673710 小时前
React Native鸿蒙跨平台数据使用监控应用技术,通过setInterval每5秒更新一次数据使用情况和套餐使用情况,模拟了真实应用中的数据监控场景
开发语言·前端·javascript·react native·react.js·ecmascript·harmonyos
烬头882110 小时前
React Native鸿蒙跨平台应用实现了onCategoryPress等核心函数,用于处理用户交互和状态更新,通过计算已支出和剩余预算
前端·javascript·react native·react.js·ecmascript·交互·harmonyos
天人合一peng12 小时前
Unity中button 和toggle监听事件函数有无参数
前端·unity·游戏引擎
方也_arkling13 小时前
别名路径联想提示。@/统一文件路径的配置
前端·javascript
毕设源码-朱学姐13 小时前
【开题答辩全过程】以 基于web教师继续教育系统的设计与实现为例,包含答辩的问题和答案
前端
web打印社区13 小时前
web-print-pdf:突破浏览器限制,实现专业级Web静默打印
前端·javascript·vue.js·electron·html
RFCEO13 小时前
前端编程 课程十三、:CSS核心基础1:CSS选择器
前端·css·css基础选择器详细教程·css类选择器使用方法·css类选择器命名规范·css后代选择器·精准选中嵌套元素
Amumu1213814 小时前
Vuex介绍
前端·javascript·vue.js
We་ct14 小时前
LeetCode 54. 螺旋矩阵:两种解法吃透顺时针遍历逻辑
前端·算法·leetcode·矩阵·typescript
2601_9494800614 小时前
【无标题】
开发语言·前端·javascript