还在手动写正则解析GPT的返回内容么,试试Pydantic吧少年

在开发过程中,我们经常需要与GPT等大模型进行交互,并解析其返回的内容。传统的做法可能是手动编写正则表达式来提取所需的信息,但这种方式不仅繁琐,还容易出错。今天,我将介绍一种更优雅、更高效的方式------使用Pydantic来解析GPT的返回内容。

什么是Pydantic?

Pydantic 是一个Python库,主要用于数据验证和设置管理。它通过Python类型注解来定义数据模型,并自动验证输入数据的合法性。Pydantic的强大之处在于它能够将复杂的JSON数据直接转换为Python对象,极大地简化了数据处理流程。

为什么选择Pydantic?

  1. 类型安全:Pydantic利用Python的类型注解,确保数据的类型正确性。
  2. 自动验证:Pydantic会自动验证输入数据是否符合定义的模型,减少手动检查的工作量。
  3. 代码简洁:通过定义数据模型,代码更加清晰易读,维护起来也更加方便。
  4. 与GPT完美结合:Pydantic可以轻松解析GPT返回的JSON数据,并将其转换为Python对象。

示例代码

下面是一个使用Pydantic解析GPT返回内容的示例代码:

python 复制代码
from pydantic import BaseModel
from openai import OpenAI

# 定义数据模型
class Step(BaseModel):
    explanation: str
    output: str

class MathResponse(BaseModel):
    steps: list[Step]
    final_answer: str

# 初始化OpenAI客户端
client = OpenAI(
    base_url="http://your_base_url/v1/",
    api_key="your_api_key_here"
)

# 发送请求并解析返回内容
completion = client.beta.chat.completions.parse(
    model="gpt-4o",
    extra_headers={
        "apikey": "your_api_key_here"
    },
    messages=[
        {"role": "system", "content": "You are a helpful math tutor."},
        {"role": "user", "content": "solve 8x + 31 = 2"},
    ],
    response_format=MathResponse,
)

# 处理返回结果
message = completion.choices[0].message
print(message.parsed)

if message.parsed:
    print(message.parsed.steps)
    print("---\n")
    print(message.parsed.final_answer)
else:
    print(message.refusal)

代码解析

  1. 定义数据模型 :我们首先定义了两个Pydantic模型StepMathResponse,分别表示解题步骤和最终的数学解答。
  2. 初始化OpenAI客户端:通过OpenAI库初始化客户端,并设置API密钥和基础URL。
  3. 发送请求并解析返回内容 :使用client.beta.chat.completions.parse方法发送请求,并将返回的JSON数据解析为MathResponse对象。
  4. 处理返回结果:根据解析结果,输出解题步骤和最终答案。

运行结果

lua 复制代码
steps=[Step(explanation='Start by isolating the term with the variable. To do that, subtract 31 from both sides of the equation to maintain the equality.', output='8x + 31 - 31 = 2 - 31'), Step(explanation='Simplify both sides of the equation. On the left side, the 31 and -31 cancel out, leaving you with 8x. On the right side, 2 - 31 equals -29.', output='8x = -29'), Step(explanation='To solve for x, divide both sides of the equation by 8 to isolate x.', output='x = -\frac{29}{8}')] final_answer='x = -\frac{29}{8}'
[Step(explanation='Start by isolating the term with the variable. To do that, subtract 31 from both sides of the equation to maintain the equality.', output='8x + 31 - 31 = 2 - 31'), Step(explanation='Simplify both sides of the equation. On the left side, the 31 and -31 cancel out, leaving you with 8x. On the right side, 2 - 31 equals -29.', output='8x = -29'), Step(explanation='To solve for x, divide both sides of the equation by 8 to isolate x.', output='x = -\frac{29}{8}')]
---

x = -\frac{29}{8}

总结

通过使用Pydantic,我们可以轻松地将GPT返回的JSON数据转换为Python对象,避免了手动编写正则表达式的繁琐过程。这种方式不仅提高了代码的可读性和可维护性,还减少了出错的可能性。如果你还在手动解析GPT的返回内容,不妨试试Pydantic吧,少年!

相关推荐
葫芦和十三3 小时前
图解 MongoDB 26|片键设计:决定集群命运的一个决定
后端·mongodb·agent
Avan_菜菜4 小时前
使用 Docker + rclone 自建 WebDAV
后端·agent·claude
阳光是sunny5 小时前
别再被 worktree 绕晕了!AI 编程时代你必须掌握的 Git 隔离神器
前端·人工智能·后端
万少6 小时前
万少的博客 - 技术分享与解决方案
前端·javascript·后端
咖啡八杯7 小时前
GoF设计模式——备忘录模式
java·后端·spring·设计模式
苍何7 小时前
腾讯再放大招,企微 Agent 大圆开启内测
后端
ethantan7 小时前
一篇讲解AI Agent 组成:像人一样思考的智能体
人工智能·后端·程序员
Cosolar9 小时前
vLLM 生产级部署完全指南
人工智能·后端·架构
IT_陈寒10 小时前
垃圾回收器选错了,我的Java服务内存炸了
前端·人工智能·后端
用户83562907805110 小时前
使用 Python 在 PDF 中创建与管理书签
后端·python