文章目录
AI大模型开发工程师
005 OpenAI大模型案例实践
1 AI 翻译助手需求分析
项目起源
市场价格和市场前景
基于大模型的翻译软件
核心功能设计
2 AI 翻译助手架构设计
架构设计
代码结构设计
3 AI 翻译助手核心功能
文档解析
文档操作
python
## 导入操作word文档和PDF文档的依赖库
! pip install pdfplumber
PDF文档操作
- 读取文档
python
import pdfplumber
pdf = pdfplumber.open("测试文档/test1.pdf")
pages = pdf.pages
# 读取所有页面的文本内容
with pdfplumber.open("测试文档/test1.pdf") as pdf:
for page in pdf.pages:
print(page.extract_text())
# 获取单页文本(保留布局)
text = pages[0].extract_text(layout=True)
text
表格操作
python
table = pages[1].extract_table()
table
import pandas as pd
df = pd.DataFrame(table[1:], columns=table[0])
print(df)
图片操作
python
pages[2].images
img = pages[2].images[0]
bbox = (img["x0"], img["top"], img["x1"], img["bottom"])
cropped_page = pages[2].crop(bbox)
cropped_page.to_image()
Prompt封装
- 方式一
- 方式二:使用 LangChain
4 AI 翻译助手代码落地
-
github开源代码实现:
-
项目地址:https://github.com/shouwangyw/AIGC/tree/main/Code/005/ai-translator-helper