OpenAI助手API接入-问答对自动生成

支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo

import json

import openai

from pathlib import Path

import os

client = openai.OpenAI(base_url=base_url, api_key=api_key)

file = client.files.create(

file=open("H3.pdf", "rb"),

purpose='assistants'

)

assistant = client.beta.assistants.create(

name="问答生成",

instructions="你是一个问答生成助手,可以帮助用户去生成问答对。",

model="gpt-4-1106-preview",

tools=[{"type":"retrieval"}],

file_ids= [file.id]

)

print(assistant.id)

thread = client.beta.threads.create(

messages=[

{

"role": "user",

"content": """

这个文档可以分为多个部分,分别输出。针对每个部分生成3个问答对,合并后以中文JSON格式输出。

"""

}

]

)

print(thread.id)

run = client.beta.threads.runs.create(

thread_id=thread.id,

assistant_id=assistant.id

)

print(run.id)

import time

def wait_on_run(run, thread):

while run.status == "queued" or run.status == "in_progress":

run = client.beta.threads.runs.retrieve(

thread_id=thread.id,

run_id=run.id,

)

time.sleep(1)

print("等待响应中...")

return run

run = wait_on_run(run, thread)

print(run.id)

messages = client.beta.threads.messages.list(thread_id=thread.id)

messages = json.loads(messages.model_dump_json())

messages['data'][0]['content'][0]['text']['value']

复制代码
'接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。\n\n### 第一部分(发展历程、主营业务、财务分析、公司治理)\n\n1. 福昕软件成立于哪一年?\n   A: 福昕软件成立于2001年。\n\n2. 福昕软件的主营业务是什么?\n   A: 福昕软件的主营业务是聚焦PDF相关解决方案。\n\n3. 福昕软件在员工利益方面采取了哪些措施?\n   A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】\n\n### 第二部分(所处行业分析)\n\n1. 福昕软件公司的产品在哪些方面具有竞争力?\n   A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。\n\n2. 福昕软件未来的市场发展潜力如何?\n   A: 福昕软件公司后续有望抢占更多市场份额。【14†source】\n\n### 第三部分(订阅+渠道双转型)\n\n1. “订阅+渠道”双转型的核心策略是什么?\n   A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。\n\n2. 福昕软件订阅模式为客户提供了哪些增值服务?\n   A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】\n\n### 第四部分(境外收入占比、境内市场拓展)\n\n1. 福昕软件在境内市场拓展方面的策略是什么?\n   A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】\n\n### 第五部分(AIGC赋能、产品竞争力)\n\n1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?\n   A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】\n\n2. 接入ChatGPT后的产品变化有哪些?\n   A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。\n\n### 第六部分(盈利预测、估值与投资评级)\n\n1. 福昕软件的投资评级如何?\n   A: 福昕软件的投资评级为“买入”。【18†source】\n\n2. 根据估值模型,福昕软件的目标市值是多少?\n   A: 根据估值模型,福昕软件的目标市值为117.0亿元。\n\n将以上问答对合并并转换为JSON格式如下:\n```json\n[\n  {\n    "part": "第一部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件成立于哪一年?",\n        "answer": "福昕软件成立于2001年。"\n      },\n      {\n        "question": "福昕软件的主营业务是什么?",\n        "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"\n      },\n      {\n        "question": "福昕软件在员工利益方面采取了哪些措施?",\n        "answer": "福昕软件制定了长期持股计划以绑定员工利益。"\n      }\n    ]\n  },\n  {\n    "part": "第二部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件公司的产品在哪些方面具有竞争力?",\n        "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"\n      },\n      {\n        "question": "福昕软件未来的市场发展潜力如何?",\n        "answer": "福昕软件公司后续有望抢占更多市场份额。"\n      }\n    ]\n  },\n  {\n    "part": "第三部分",\n    "qa_pairs": [\n      {\n        "question": "“订阅+渠道”双转型的核心策略是什么?",\n        "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"\n      },\n      {\n        "question": "福昕软件订阅模式为客户提供了哪些增值服务?",\n        "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"\n      }\n    ]\n  },\n  {\n    "part": "第四部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件在境内市场拓展方面的策略是什么?",\n        "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"\n      }\n    ]\n  },\n  {\n    "part": "第五部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",\n        "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"\n      },\n      {\n        "question": "接入ChatGPT后的产品变化有哪些?",\n        "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"\n      }\n    ]\n  },\n  {\n    "part": "第六部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件的投资评级如何?",\n        "answer": "福昕软件的投资评级为“买入”。"\n      },\n      {\n        "question": "根据估值模型,福昕软件的目标市值是多少?",\n        "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"\n      }\n    ]\n  }\n]\n```'

print(messages['data'][0]['content'][0]['text']['value'])

复制代码
接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。

### 第一部分(发展历程、主营业务、财务分析、公司治理)

1. 福昕软件成立于哪一年?
   A: 福昕软件成立于2001年。

2. 福昕软件的主营业务是什么?
   A: 福昕软件的主营业务是聚焦PDF相关解决方案。

3. 福昕软件在员工利益方面采取了哪些措施?
   A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】

### 第二部分(所处行业分析)

1. 福昕软件公司的产品在哪些方面具有竞争力?
   A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。

2. 福昕软件未来的市场发展潜力如何?
   A: 福昕软件公司后续有望抢占更多市场份额。【14†source】

### 第三部分(订阅+渠道双转型)
复制代码
1. “订阅+渠道”双转型的核心策略是什么?
   A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。

2. 福昕软件订阅模式为客户提供了哪些增值服务?
   A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】

### 第四部分(境外收入占比、境内市场拓展)

1. 福昕软件在境内市场拓展方面的策略是什么?
   A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】

### 第五部分(AIGC赋能、产品竞争力)

1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?
   A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】

2. 接入ChatGPT后的产品变化有哪些?
   A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。

### 第六部分(盈利预测、估值与投资评级)

1. 福昕软件的投资评级如何?
   A: 福昕软件的投资评级为“买入”。【18†source】

2. 根据估值模型,福昕软件的目标市值是多少?
   A: 根据估值模型,福昕软件的目标市值为117.0亿元。
复制代码
将以上问答对合并并转换为JSON格式如下:
```json
[
  {
    "part": "第一部分",
    "qa_pairs": [
      {
        "question": "福昕软件成立于哪一年?",
        "answer": "福昕软件成立于2001年。"
      },
      {
        "question": "福昕软件的主营业务是什么?",
        "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"
      },
      {
        "question": "福昕软件在员工利益方面采取了哪些措施?",
        "answer": "福昕软件制定了长期持股计划以绑定员工利益。"
      }
    ]
  },
  {
    "part": "第二部分",
    "qa_pairs": [
      {
        "question": "福昕软件公司的产品在哪些方面具有竞争力?",
        "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"
      },
      {
        "question": "福昕软件未来的市场发展潜力如何?",
        "answer": "福昕软件公司后续有望抢占更多市场份额。"
      }
    ]
  },
{
    "part": "第三部分",
    "qa_pairs": [
      {
        "question": "“订阅+渠道”双转型的核心策略是什么?",
        "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"
      },
      {
        "question": "福昕软件订阅模式为客户提供了哪些增值服务?",
        "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"
      }
    ]
  },
  {
    "part": "第四部分",
    "qa_pairs": [
      {
        "question": "福昕软件在境内市场拓展方面的策略是什么?",
        "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"
      }
    ]
  },
  {
    "part": "第五部分",
    "qa_pairs": [
      {
        "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",
        "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"
      },
      {
        "question": "接入ChatGPT后的产品变化有哪些?",
        "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"
      }
    ]
  },
{
    "part": "第六部分",
    "qa_pairs": [
      {
        "question": "福昕软件的投资评级如何?",
        "answer": "福昕软件的投资评级为“买入”。"
      },
      {
        "question": "根据估值模型,福昕软件的目标市值是多少?",
        "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"
      }
    ]
  }
]
```

res = messages['data'][0]['content'][0]['text']['value']

json_start = res.find("```json\n")

json_end = res.find("```\n")

if json_start>=0:

if json_end > json_start:

res = res[json_start+8:json_end]

elif json_end ==-1:

res = res[json_start+8:len(res)-3]

data = json.loads(res)

data

复制代码
[{'part': '第一部分',
  'qa_pairs': [{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},
   {'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},
   {'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'}]},
 {'part': '第二部分',
  'qa_pairs': [{'question': '福昕软件公司的产品在哪些方面具有竞争力?',
    'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},
   {'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'}]},
 {'part': '第三部分',
  'qa_pairs': [{'question': '“订阅+渠道”双转型的核心策略是什么?',
    'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},
   {'question': '福昕软件订阅模式为客户提供了哪些增值服务?',
    'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'}]},
 {'part': '第四部分',
  'qa_pairs': [{'question': '福昕软件在境内市场拓展方面的策略是什么?',
    'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'}]},
 {'part': '第五部分',
  'qa_pairs': [{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?',
    'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},
   {'question': '接入ChatGPT后的产品变化有哪些?',
    'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'}]},
 {'part': '第六部分',
  'qa_pairs': [{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},
   {'question': '根据估值模型,福昕软件的目标市值是多少?',
    'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]}]

rows = []

for x in data:

for y in x['qa_pairs']:

rows.append(y)

rows

复制代码
[{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},
 {'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},
 {'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'},
 {'question': '福昕软件公司的产品在哪些方面具有竞争力?',
  'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},
 {'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'},
 {'question': '“订阅+渠道”双转型的核心策略是什么?',
  'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},
 {'question': '福昕软件订阅模式为客户提供了哪些增值服务?',
  'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'},
 {'question': '福昕软件在境内市场拓展方面的策略是什么?',
  'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'},
 {'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?',
  'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},
 {'question': '接入ChatGPT后的产品变化有哪些?',
  'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'},
 {'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},
 {'question': '根据估值模型,福昕软件的目标市值是多少?', 'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]

import pandas as pd

df = pd.DataFrame(rows)

df

thread_message = client.beta.threads.messages.create(

thread_id=thread.id,

role="user",

content="每个部分可以拆分为几个子部分,分别输出。"

)

print(thread_message)

run = client.beta.threads.runs.create(

thread_id=thread.id,

assistant_id=assistant.id,

model = "gpt-3.5-turbo"

)

print(run)

run = wait_on_run(run, thread)

print(run.id)

messages = client.beta.threads.messages.list(thread_id=thread.id)

messages = json.loads(messages.model_dump_json())

print(messages['data'][0]['content'][0]['text']['value'])

复制代码
根据文档内容,可以将文档分为以下子部分并逐个输出:

### 第一部分(发展历程、主营业务、财务分析、公司治理)

1.1 发展历程:公司成立时间较早,聚焦海外市场开拓
- 福昕软件成立于2001年。

1.2 主营业务:聚焦PDF相关解决方案
- 福昕软件的主营业务是聚焦PDF相关解决方案。

1.3 财务分析:依托优秀的成长性和稳固的行业地位,公司长期财务数据表现亮眼
- 公司长期财务数据表现亮眼,依托优秀的成长性和稳固的行业地位。

1.4 公司治理:股权清晰且稳定,长期持股计划绑定员工利益
- 公司股权清晰且稳定,采取长期持股计划绑定员工利益。

### 第二部分(所处行业分析)

2.1 行业空间:无纸化、电子化办公已成趋势,PDF赛道规模剑指千亿
- 行业天花板高,公司竞争力强。

2.2 公司竞争力分析:公司产品在功能、价格、用户评价三个维度均有一定竞争力,后续有望抢占更多市场份额
- 公司产品在功能、价格、用户评价三个维度均有一定竞争力。

### 第三部分(订阅+渠道双转型)

3.1 订阅转型:订阅模式下可为客户提供丰富的增值服务,并提升客户终生价值
- “订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。

3.2 渠道转型:核心在于通过渠道触达海量客户资源,进而抢占更多市场份额
- 通过渠道触达海量客户资源,抢占更多市场份额。

### 第四部分(境外收入占比、境内市场拓展)

4.1 福昕家装解决方案
- 谈及福昕家装解决方案。

4.2 福昕船舶图纸管理系统
- 谈及福昕船舶图纸管理系统。

4.3 电子签名解决方案
- 谈及电子签名解决方案。

### 第五部分(AIGC赋能、产品竞争力)

5.1 AIGC赋能正在进行时,产品竞争力日益凸显
- 福昕的产品具备AIGC赋能,竞争力日益突出。

### 第六部分(盈利预测、估值与投资评级)

6.1 盈利预测及假设
- 公司的盈利预测及假设。

6.2 估值与投资评级
- 估值模型与投资评级。

这样,每个部分都被细分并输出了各自的子部分内容。
相关推荐
AI_NEW_COME29 分钟前
知识库管理系统可扩展性深度测评
人工智能
海棠AI实验室1 小时前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
hunteritself1 小时前
AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!
人工智能·gpt·chatgpt·github·openai·copilot
IT古董2 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
centurysee2 小时前
【最佳实践】Anthropic:Agentic系统实践案例
人工智能
mahuifa2 小时前
混合开发环境---使用编程AI辅助开发Qt
人工智能·vscode·qt·qtcreator·编程ai
四口鲸鱼爱吃盐2 小时前
Pytorch | 从零构建GoogleNet对CIFAR10进行分类
人工智能·pytorch·分类
蓝天星空2 小时前
Python调用open ai接口
人工智能·python
睡觉狂魔er2 小时前
自动驾驶控制与规划——Project 3: LQR车辆横向控制
人工智能·机器学习·自动驾驶
scan7242 小时前
LILAC采样算法
人工智能·算法·机器学习