Python-docx 深入word源码 自定义字符间距

代码和实现效果

python 复制代码
from docx import Document
from docx.oxml import OxmlElement
from docx.oxml.ns import qn
from docx.shared import Pt


# 调整pt设置字间距
def SetParagraphCharSpaceByPt(run, pt=1):
    '''
    通过修改word源码方式, 添加w:spacing标签
    直接通过调整pt来设置字符间距
    '''
    # 获取或创建<w:rPr>元素
    rPr = run._element.find(qn('w:rPr'))
    if rPr is None:
        rPr = OxmlElement('w:rPr')
        run._element.insert(0, rPr)

    # 创建<w:spacing>元素
    spaceChar = OxmlElement('w:spacing')
    spaceChar.set(qn('w:val'), str(pt * 20))

    # 添加<w:spacing>到<w:rPr>
    rPr.append(spaceChar)


def AddParagraph(doc, text):
    p = doc.add_paragraph()
    run = p.add_run(text)
    return p, run


doc = Document()
p, run = AddParagraph(doc, text='这是一个段落')
SetParagraphCharSpaceByPt(run=run, pt=3)
doc.save('test.docx')

原理和代码思路

通过解压的方式打开一个已经提前设置好字符间距的word文档,在word/document.xml可以看到具体关于字符间距设置的XML标签代码

xml 复制代码
<w:p>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="黑体" w:hAnsi="黑体" w:eastAsia="黑体"/>
            <w:b w:val="0"/>
            <w:i w:val="0"/>
            <w:sz w:val="32"/>
            <w:spacing w:val="150.0"/>
        </w:rPr>
        <w:t>这是一个段落</w:t>
    </w:r>
</w:p>
  1. <w:p>表示word:paragraph
  2. <w:r>表示word:run
  3. <w:t>表示word:text,定义段落的文本内容;
  4. <w:rPr>表示word:runProperty,而在<w:rPr>标签下的是各类属性标签,其中<w:spacing>为字符间距,这是需要coding为我们自定义的标签。而上述示例Python代码也在对这个标签进行创建并赋值;
  5. <w:spacing>标签中的属性w:val代表字符间距大小,其值等于pt(磅) * 20
相关推荐
Open-AI4 分钟前
Python如何判断一个数是几位数
python
IT技术分享社区4 分钟前
C#实战:使用腾讯云识别服务轻松提取火车票信息
开发语言·c#·云计算·腾讯云·共识算法
极客代码7 分钟前
【Python TensorFlow】入门到精通
开发语言·人工智能·python·深度学习·tensorflow
义小深9 分钟前
TensorFlow|咖啡豆识别
人工智能·python·tensorflow
疯一样的码农13 分钟前
Python 正则表达式(RegEx)
开发语言·python·正则表达式
&岁月不待人&35 分钟前
Kotlin by lazy和lateinit的使用及区别
android·开发语言·kotlin
StayInLove39 分钟前
G1垃圾回收器日志详解
java·开发语言
无尽的大道1 小时前
Java字符串深度解析:String的实现、常量池与性能优化
java·开发语言·性能优化
爱吃生蚝的于勒1 小时前
深入学习指针(5)!!!!!!!!!!!!!!!
c语言·开发语言·数据结构·学习·计算机网络·算法
binishuaio1 小时前
Java 第11天 (git版本控制器基础用法)
java·开发语言·git