【Python】python使用docxtpl生成word模板

python使用docxtpl生成word模板

python-docxtpl包简单使用和实战,Python处理word,docx文件。

最近需要处理一些爬虫得到的数据来进行一些自动化报告的操作,因为需要生成的是word的报告,所以估选用docxtpl库来直接生成模板

docxtpl 模板标签主要来自jinja2,可以了解 jinja2语法,也有些额外的不一样,可以自行百度或者参考官方文档

开始

使用Pip安装docxtpl

pip install docxtpl

简单demo

根据官网的简单举例:

from docxtpl import DocxTemplate

doc = DocxTemplate("my_word_template.docx") # 读取模板

context = { 'company_name' : "World company" } # 需要传入的字典, 需要在word对应的位置输入 {{ company_name }}

doc.render(context) # 渲染到模板中

doc.save("generated_doc.docx") # 生成一个新的模板

至此,就可以直接拿来实战了, 实战中包含了图片的替换和表格文本的一些插入。都是很简单的,就是将组成的字典渲染到word中去就可以

实战

#!/usr/bin/env python

-- encoding: utf-8 --

'''

@File : generate_word.py

@Time : 2021/05/28 15:52:57

@Author : OD

@Version : 1.0

'''

here put the import lib

from docx import Document

from docx.shared import Pt

import datetime

from docxtpl import DocxTemplate, RichText, InlineImage

from docx.shared import Mm

import json

根据模板生成一个周报内容

class Generate2Word:

def init (self):

self.now = str(datetime.date.today() - datetime.timedelta(days=0)).replace("-", "").replace(" ", "")

self.last = str(datetime.date.today() - datetime.timedelta(days=7)).replace("-", "").replace(" ", "")

self.now = self.now[4:6] + '.' + self.now[6:] # 现在时间

self.last = self.last[4:6] + '.' + self.last[6:] # 7天前时间

def generate_report(self, tpl_file, report_file):

tpl= DocxTemplate(tpl_file)

第一个图表

context = {

'start_time' : self.last,

'end_time' : self.now,

'total_attention': 123,

'add_attention': 20,

'dau': 100,

'dau_per':20 / 100,

'theme_tiezi':1234,

'all_tiezi': 12345,

'add_theme_tiezi': 25,

'add_tiezi': 20,

'official_pub':12,

'del_tiezi': 5,

}

image1_path = r'1.png' # 要生成的图片地址

image2_path = r'2.png' # 要生成的图片地址

insert_image1 = InlineImage(tpl, image1_path, width=Mm(140))

insert_image2 = InlineImage(tpl, image2_path, width=Mm(140))

作为图片的替换

img_context = {

'img1': insert_image1,

'img2': insert_image2

}

管理帖子,需要渲染

bawu_lists = {

"bawu_table":

[{

'publish_time': '2021/5/7',

'title': '测试1',

'link': 'https://www.baidu,com,

'reply_num': 27

},

{

'publish_time': '2021/5/8',

'title': '测试2',

'link': 'https://www.baidu,com',

'reply_num': 4

},

{

'publish_time': '2021/5/31',

'title': '湖人浓眉伤退',

'link': 'https://www.baidu,com',

'reply_num': 40

},

{

'publish_time': '2021/6/2',

'title': '勒布朗詹姆斯率队拿下g5',

'link': 'https://www.baidu,com',

'reply_num': 444

}

],

"navy_table":

[{

'publish_time': '2021/4/23',

'title': '测试3',

'link': 'https://www.baidu,com',

'reply_num': 444

},

{

'publish_time': '2021/4/30',

'title': '测试4',

'link': 'https://www.baidu,com',

'reply_num': 444

},

{

'publish_time': '2021/5/30',

'title': '测试5',

'link': 'https://www.baidu,com',

'reply_num': 444

}

]

}

bawu_summary = dict()

bawu_sum_reply = 0 # 总有多少个回复

for bawu_data in bawu_lists.get('bawu_table'):

bawu_summary['bawu_publish_num'] = len(bawu_lists.get('bawu_table', 0))

bawu_sum_reply += int(bawu_data.get('reply_num', 0))

bawu_summary['bawu_sum_reply'] = bawu_sum_reply

navy_summary = dict()

navy_sum_reply = 0

for navy_data in bawu_lists.get('navy_table'):

navy_summary['navy_publish_num'] = len(bawu_lists.get('navy_table', 0))

navy_sum_reply += int(navy_data.get('reply_num', 0))

navy_summary['navy_sum_reply'] = navy_sum_reply

tpl.render({**context, **img_context, ** bawu_lists, **bawu_summary, **navy_summary}) # 多个字典解构

print('生成模板成功...')

tpl.save(report_file)

def main(self):

tpl_file = "文件模板.docx" # 指定的模板

report_file = f"新得{self.last}-{self.now}报告.docx" # 指定生成的报告位置

self.generate_report(tpl_file, report_file)

if name == 'main ':

demo = Generate2Word()

demo.main()

这样 就可以生成一个保留 word 格式的一个报告。

相关推荐
yyfhq39 分钟前
sdnet
python
测试19981 小时前
2024软件测试面试热点问题
自动化测试·软件测试·python·测试工具·面试·职场和发展·压力测试
love_and_hope1 小时前
Pytorch学习--神经网络--搭建小实战(手撕CIFAR 10 model structure)和 Sequential 的使用
人工智能·pytorch·python·深度学习·学习
海阔天空_20131 小时前
Python pyautogui库:自动化操作的强大工具
运维·开发语言·python·青少年编程·自动化
零意@1 小时前
ubuntu切换不同版本的python
windows·python·ubuntu
思忖小下2 小时前
Python基础学习_01
python
q567315232 小时前
在 Bash 中获取 Python 模块变量列
开发语言·python·bash
是萝卜干呀2 小时前
Backend - Python 爬取网页数据并保存在Excel文件中
python·excel·table·xlwt·爬取网页数据
代码欢乐豆2 小时前
数据采集之selenium模拟登录
python·selenium·测试工具
狂奔solar3 小时前
yelp数据集上识别潜在的热门商家
开发语言·python