Python-docx 深入word源码 自定义字符间距

代码和实现效果

python 复制代码
from docx import Document
from docx.oxml import OxmlElement
from docx.oxml.ns import qn
from docx.shared import Pt


# 调整pt设置字间距
def SetParagraphCharSpaceByPt(run, pt=1):
    '''
    通过修改word源码方式, 添加w:spacing标签
    直接通过调整pt来设置字符间距
    '''
    # 获取或创建<w:rPr>元素
    rPr = run._element.find(qn('w:rPr'))
    if rPr is None:
        rPr = OxmlElement('w:rPr')
        run._element.insert(0, rPr)

    # 创建<w:spacing>元素
    spaceChar = OxmlElement('w:spacing')
    spaceChar.set(qn('w:val'), str(pt * 20))

    # 添加<w:spacing>到<w:rPr>
    rPr.append(spaceChar)


def AddParagraph(doc, text):
    p = doc.add_paragraph()
    run = p.add_run(text)
    return p, run


doc = Document()
p, run = AddParagraph(doc, text='这是一个段落')
SetParagraphCharSpaceByPt(run=run, pt=3)
doc.save('test.docx')

原理和代码思路

通过解压的方式打开一个已经提前设置好字符间距的word文档,在word/document.xml可以看到具体关于字符间距设置的XML标签代码

xml 复制代码
<w:p>
    <w:r>
        <w:rPr>
            <w:rFonts w:ascii="黑体" w:hAnsi="黑体" w:eastAsia="黑体"/>
            <w:b w:val="0"/>
            <w:i w:val="0"/>
            <w:sz w:val="32"/>
            <w:spacing w:val="150.0"/>
        </w:rPr>
        <w:t>这是一个段落</w:t>
    </w:r>
</w:p>
  1. <w:p>表示word:paragraph
  2. <w:r>表示word:run
  3. <w:t>表示word:text,定义段落的文本内容;
  4. <w:rPr>表示word:runProperty,而在<w:rPr>标签下的是各类属性标签,其中<w:spacing>为字符间距,这是需要coding为我们自定义的标签。而上述示例Python代码也在对这个标签进行创建并赋值;
  5. <w:spacing>标签中的属性w:val代表字符间距大小,其值等于pt(磅) * 20
相关推荐
汤姆yu2 小时前
基于python大数据的小说数据可视化及预测系统
大数据·python·信息可视化
x***J3482 小时前
Python多线程爬虫
开发语言·爬虫·python
m***D2862 小时前
Python网络爬虫实战案例
开发语言·爬虫·python
保持低旋律节奏2 小时前
C++——C++11特性
开发语言·c++·windows
ID_180079054732 小时前
基于 Python 的淘宝商品详情数据结构化解析:SKU、价格与库存字段提取
开发语言·数据结构·python
星释2 小时前
Rust 练习册 82:Hamming与字符串处理
开发语言·算法·rust
时间不说谎2 小时前
c/c++的语法糖
开发语言
Laughtin2 小时前
终端Python环境的选择与切换
开发语言·python
头发还在的女程序员3 小时前
基于JAVA语言的短剧小程序-抖音短剧小程序
java·开发语言·小程序
JHC0000003 小时前
Python PDF 相关操作
开发语言·python·pdf