Python-docx 深入word源码 自定义字符间距

代码和实现效果

python 复制代码
from docx import Document
from docx.oxml import OxmlElement
from docx.oxml.ns import qn
from docx.shared import Pt


# 调整pt设置字间距
def SetParagraphCharSpaceByPt(run, pt=1):
    '''
    通过修改word源码方式, 添加w:spacing标签
    直接通过调整pt来设置字符间距
    '''
    # 获取或创建<w:rPr>元素
    rPr = run._element.find(qn('w:rPr'))
    if rPr is None:
        rPr = OxmlElement('w:rPr')
        run._element.insert(0, rPr)

    # 创建<w:spacing>元素
    spaceChar = OxmlElement('w:spacing')
    spaceChar.set(qn('w:val'), str(pt * 20))

    # 添加<w:spacing>到<w:rPr>
    rPr.append(spaceChar)


def AddParagraph(doc, text):
    p = doc.add_paragraph()
    run = p.add_run(text)
    return p, run


doc = Document()
p, run = AddParagraph(doc, text='这是一个段落')
SetParagraphCharSpaceByPt(run=run, pt=3)
doc.save('test.docx')

原理和代码思路

通过解压的方式打开一个已经提前设置好字符间距的word文档,在word/document.xml可以看到具体关于字符间距设置的XML标签代码

xml 复制代码
<w:p>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="黑体" w:hAnsi="黑体" w:eastAsia="黑体"/>
            <w:b w:val="0"/>
            <w:i w:val="0"/>
            <w:sz w:val="32"/>
            <w:spacing w:val="150.0"/>
        </w:rPr>
        <w:t>这是一个段落</w:t>
    </w:r>
</w:p>
  1. <w:p>表示word:paragraph
  2. <w:r>表示word:run
  3. <w:t>表示word:text,定义段落的文本内容;
  4. <w:rPr>表示word:runProperty,而在<w:rPr>标签下的是各类属性标签,其中<w:spacing>为字符间距,这是需要coding为我们自定义的标签。而上述示例Python代码也在对这个标签进行创建并赋值;
  5. <w:spacing>标签中的属性w:val代表字符间距大小,其值等于pt(磅) * 20
相关推荐
千寻girling2 小时前
一份不可多得的 《 Django 》 零基础入门教程
后端·python·面试
databook6 小时前
探索视觉的边界:用 Manim 重现有趣的知觉错觉
python·动效
明月_清风7 小时前
Python 性能微观世界:列表推导式 vs for 循环
后端·python
明月_清风7 小时前
Python 性能翻身仗:从 O(n) 到 O(1) 的工程实践
后端·python
helloweilei1 天前
python 抽象基类
python
用户8356290780511 天前
Python 实现 PPT 转 HTML
后端·python
zone77391 天前
004:RAG 入门-LangChain读取PDF
后端·python·面试
zone77391 天前
005:RAG 入门-LangChain读取表格数据
后端·python·agent
树獭非懒2 天前
AI大模型小白手册|Embedding 与向量数据库
后端·python·llm
唐叔在学习2 天前
就算没有服务器,我照样能够同步数据
后端·python·程序员