import os
import sys
import asyncio
from urllib.parse import urlparse
from pyppeteer import launch
# 直接写你的真实文件路径
INPUT_HTML = r"C:\Users\70292727\Desktop\test\报价单.html"
OUTPUT_PDF = r"C:\Users\70292727\Desktop\test\报价单.pdf"
BROWSER_EXE = r"C:\Program Files (x86)\Microsoft\Edge\Application\msedge.exe"
def is_url(path: str) -> bool:
"""判断是否为 URL"""
if not path:
return False
parsed = urlparse(path)
return parsed.scheme in ("http", "https")
def path_to_file_url(path: str) -> str:
"""本地路径转 file:/// URL"""
abs_path = os.path.abspath(path)
return "file:///" + abs_path.replace("\\", "/")
async def html_to_pdf(input_path: str, output_pdf: str, browser_exe: str) -> None:
if not input_path:
raise ValueError("input_path 不能为空")
if not output_pdf:
raise ValueError("output_pdf 不能为空")
if not browser_exe:
raise ValueError("browser_exe 不能为空")
if not os.path.isfile(browser_exe):
raise FileNotFoundError(f"浏览器程序不存在:{browser_exe}")
input_path = os.path.abspath(input_path)
if not is_url(input_path) and not os.path.isfile(input_path):
raise FileNotFoundError(f"HTML 文件不存在:{input_path}")
output_pdf = os.path.abspath(output_pdf)
output_dir = os.path.dirname(output_pdf)
if output_dir and not os.path.exists(output_dir):
os.makedirs(output_dir, exist_ok=True)
browser = await launch(
executablePath=browser_exe,
headless=True,
autoClose=True,
args=[
"--no-sandbox",
"--disable-setuid-sandbox",
"--disable-dev-shm-usage",
"--disable-gpu",
"--allow-file-access-from-files",
"--enable-local-file-accesses",
"--disable-web-security",
],
)
try:
page = await browser.newPage()
if is_url(input_path):
print(f"检测到输入为网页地址:{input_path}")
await page.goto(input_path, {"waitUntil": "networkidle2"})
else:
print(f"检测到输入为本地 HTML 文件:{input_path}")
file_url = path_to_file_url(input_path)
await page.goto(file_url, {"waitUntil": "networkidle2"})
await page.pdf({
"path": output_pdf,
"format": "A4",
"printBackground": True,
"margin": {
"top": "15mm",
"right": "15mm",
"bottom": "15mm",
"left": "15mm",
}
})
print(f"PDF 生成成功:{output_pdf}")
finally:
await browser.close()
def main():
try:
asyncio.run(html_to_pdf(INPUT_HTML, OUTPUT_PDF, BROWSER_EXE))
except Exception as e:
print(f"转换失败:{e}")
sys.exit(1)
if __name__ == "__main__":
main()
python实现HTML转PDF
小文大数据2026-04-02 17:44
相关推荐
wang3zc几秒前
HTML函数能否用外接显卡坞提升性能_eGPU对HTML函数帮助【汇总】PBitW7 分钟前
一个skill,让项目管理和写绩效变得简单!難釋懷8 分钟前
Redis网络模型-Redis是单线程的吗?为什么使用单线程2301_781571429 分钟前
mysql如何配置自增ID预留_mysql innodb_autoinc_lock_mode参数晚风烟火10 分钟前
从“落地实践”和“应试通关”两个维度,拆解每一章到底要掌握什么解决问题no解决代码问题13 分钟前
Quartz 1.6.5Dxy123931021614 分钟前
CSS中的filter属性详解桂花很香,旭很美17 分钟前
Redis-智能体开发中的大杀器dinglu1030DL24 分钟前
CSS如何实现背景颜色的棋盘格分布_利用repeating-gradient2303_8212873828 分钟前
Golang reflect反射怎么用_Golang反射教程【通俗】