OpenAI助手API接入-问答对自动生成

支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo

import json

import openai

from pathlib import Path

import os

client = openai.OpenAI(base_url=base_url, api_key=api_key)

file = client.files.create(

file=open("H3.pdf", "rb"),

purpose='assistants'

)

assistant = client.beta.assistants.create(

name="问答生成",

instructions="你是一个问答生成助手,可以帮助用户去生成问答对。",

model="gpt-4-1106-preview",

tools=[{"type":"retrieval"}],

file_ids= [file.id]

)

print(assistant.id)

thread = client.beta.threads.create(

messages=[

{

"role": "user",

"content": """

这个文档可以分为多个部分,分别输出。针对每个部分生成3个问答对,合并后以中文JSON格式输出。

"""

}

]

)

print(thread.id)

run = client.beta.threads.runs.create(

thread_id=thread.id,

assistant_id=assistant.id

)

print(run.id)

import time

def wait_on_run(run, thread):

while run.status == "queued" or run.status == "in_progress":

run = client.beta.threads.runs.retrieve(

thread_id=thread.id,

run_id=run.id,

)

time.sleep(1)

print("等待响应中...")

return run

run = wait_on_run(run, thread)

print(run.id)

messages = client.beta.threads.messages.list(thread_id=thread.id)

messages = json.loads(messages.model_dump_json())

messages['data'][0]['content'][0]['text']['value']

复制代码
'接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。\n\n### 第一部分(发展历程、主营业务、财务分析、公司治理)\n\n1. 福昕软件成立于哪一年?\n   A: 福昕软件成立于2001年。\n\n2. 福昕软件的主营业务是什么?\n   A: 福昕软件的主营业务是聚焦PDF相关解决方案。\n\n3. 福昕软件在员工利益方面采取了哪些措施?\n   A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】\n\n### 第二部分(所处行业分析)\n\n1. 福昕软件公司的产品在哪些方面具有竞争力?\n   A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。\n\n2. 福昕软件未来的市场发展潜力如何?\n   A: 福昕软件公司后续有望抢占更多市场份额。【14†source】\n\n### 第三部分(订阅+渠道双转型)\n\n1. “订阅+渠道”双转型的核心策略是什么?\n   A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。\n\n2. 福昕软件订阅模式为客户提供了哪些增值服务?\n   A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】\n\n### 第四部分(境外收入占比、境内市场拓展)\n\n1. 福昕软件在境内市场拓展方面的策略是什么?\n   A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】\n\n### 第五部分(AIGC赋能、产品竞争力)\n\n1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?\n   A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】\n\n2. 接入ChatGPT后的产品变化有哪些?\n   A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。\n\n### 第六部分(盈利预测、估值与投资评级)\n\n1. 福昕软件的投资评级如何?\n   A: 福昕软件的投资评级为“买入”。【18†source】\n\n2. 根据估值模型,福昕软件的目标市值是多少?\n   A: 根据估值模型,福昕软件的目标市值为117.0亿元。\n\n将以上问答对合并并转换为JSON格式如下:\n```json\n[\n  {\n    "part": "第一部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件成立于哪一年?",\n        "answer": "福昕软件成立于2001年。"\n      },\n      {\n        "question": "福昕软件的主营业务是什么?",\n        "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"\n      },\n      {\n        "question": "福昕软件在员工利益方面采取了哪些措施?",\n        "answer": "福昕软件制定了长期持股计划以绑定员工利益。"\n      }\n    ]\n  },\n  {\n    "part": "第二部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件公司的产品在哪些方面具有竞争力?",\n        "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"\n      },\n      {\n        "question": "福昕软件未来的市场发展潜力如何?",\n        "answer": "福昕软件公司后续有望抢占更多市场份额。"\n      }\n    ]\n  },\n  {\n    "part": "第三部分",\n    "qa_pairs": [\n      {\n        "question": "“订阅+渠道”双转型的核心策略是什么?",\n        "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"\n      },\n      {\n        "question": "福昕软件订阅模式为客户提供了哪些增值服务?",\n        "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"\n      }\n    ]\n  },\n  {\n    "part": "第四部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件在境内市场拓展方面的策略是什么?",\n        "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"\n      }\n    ]\n  },\n  {\n    "part": "第五部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",\n        "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"\n      },\n      {\n        "question": "接入ChatGPT后的产品变化有哪些?",\n        "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"\n      }\n    ]\n  },\n  {\n    "part": "第六部分",\n    "qa_pairs": [\n      {\n        "question": "福昕软件的投资评级如何?",\n        "answer": "福昕软件的投资评级为“买入”。"\n      },\n      {\n        "question": "根据估值模型,福昕软件的目标市值是多少?",\n        "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"\n      }\n    ]\n  }\n]\n```'

print(messages['data'][0]['content'][0]['text']['value'])

复制代码
接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。

### 第一部分(发展历程、主营业务、财务分析、公司治理)

1. 福昕软件成立于哪一年?
   A: 福昕软件成立于2001年。

2. 福昕软件的主营业务是什么?
   A: 福昕软件的主营业务是聚焦PDF相关解决方案。

3. 福昕软件在员工利益方面采取了哪些措施?
   A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】

### 第二部分(所处行业分析)

1. 福昕软件公司的产品在哪些方面具有竞争力?
   A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。

2. 福昕软件未来的市场发展潜力如何?
   A: 福昕软件公司后续有望抢占更多市场份额。【14†source】

### 第三部分(订阅+渠道双转型)
复制代码
1. “订阅+渠道”双转型的核心策略是什么?
   A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。

2. 福昕软件订阅模式为客户提供了哪些增值服务?
   A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】

### 第四部分(境外收入占比、境内市场拓展)

1. 福昕软件在境内市场拓展方面的策略是什么?
   A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】

### 第五部分(AIGC赋能、产品竞争力)

1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?
   A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】

2. 接入ChatGPT后的产品变化有哪些?
   A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。

### 第六部分(盈利预测、估值与投资评级)

1. 福昕软件的投资评级如何?
   A: 福昕软件的投资评级为“买入”。【18†source】

2. 根据估值模型,福昕软件的目标市值是多少?
   A: 根据估值模型,福昕软件的目标市值为117.0亿元。
复制代码
将以上问答对合并并转换为JSON格式如下:
```json
[
  {
    "part": "第一部分",
    "qa_pairs": [
      {
        "question": "福昕软件成立于哪一年?",
        "answer": "福昕软件成立于2001年。"
      },
      {
        "question": "福昕软件的主营业务是什么?",
        "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"
      },
      {
        "question": "福昕软件在员工利益方面采取了哪些措施?",
        "answer": "福昕软件制定了长期持股计划以绑定员工利益。"
      }
    ]
  },
  {
    "part": "第二部分",
    "qa_pairs": [
      {
        "question": "福昕软件公司的产品在哪些方面具有竞争力?",
        "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"
      },
      {
        "question": "福昕软件未来的市场发展潜力如何?",
        "answer": "福昕软件公司后续有望抢占更多市场份额。"
      }
    ]
  },
{
    "part": "第三部分",
    "qa_pairs": [
      {
        "question": "“订阅+渠道”双转型的核心策略是什么?",
        "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"
      },
      {
        "question": "福昕软件订阅模式为客户提供了哪些增值服务?",
        "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"
      }
    ]
  },
  {
    "part": "第四部分",
    "qa_pairs": [
      {
        "question": "福昕软件在境内市场拓展方面的策略是什么?",
        "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"
      }
    ]
  },
  {
    "part": "第五部分",
    "qa_pairs": [
      {
        "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",
        "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"
      },
      {
        "question": "接入ChatGPT后的产品变化有哪些?",
        "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"
      }
    ]
  },
{
    "part": "第六部分",
    "qa_pairs": [
      {
        "question": "福昕软件的投资评级如何?",
        "answer": "福昕软件的投资评级为“买入”。"
      },
      {
        "question": "根据估值模型,福昕软件的目标市值是多少?",
        "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"
      }
    ]
  }
]
```

res = messages['data'][0]['content'][0]['text']['value']

json_start = res.find("```json\n")

json_end = res.find("```\n")

if json_start>=0:

if json_end > json_start:

res = res[json_start+8:json_end]

elif json_end ==-1:

res = res[json_start+8:len(res)-3]

data = json.loads(res)

data

复制代码
[{'part': '第一部分',
  'qa_pairs': [{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},
   {'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},
   {'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'}]},
 {'part': '第二部分',
  'qa_pairs': [{'question': '福昕软件公司的产品在哪些方面具有竞争力?',
    'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},
   {'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'}]},
 {'part': '第三部分',
  'qa_pairs': [{'question': '“订阅+渠道”双转型的核心策略是什么?',
    'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},
   {'question': '福昕软件订阅模式为客户提供了哪些增值服务?',
    'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'}]},
 {'part': '第四部分',
  'qa_pairs': [{'question': '福昕软件在境内市场拓展方面的策略是什么?',
    'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'}]},
 {'part': '第五部分',
  'qa_pairs': [{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?',
    'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},
   {'question': '接入ChatGPT后的产品变化有哪些?',
    'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'}]},
 {'part': '第六部分',
  'qa_pairs': [{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},
   {'question': '根据估值模型,福昕软件的目标市值是多少?',
    'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]}]

rows = []

for x in data:

for y in x['qa_pairs']:

rows.append(y)

rows

复制代码
[{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},
 {'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},
 {'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'},
 {'question': '福昕软件公司的产品在哪些方面具有竞争力?',
  'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},
 {'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'},
 {'question': '“订阅+渠道”双转型的核心策略是什么?',
  'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},
 {'question': '福昕软件订阅模式为客户提供了哪些增值服务?',
  'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'},
 {'question': '福昕软件在境内市场拓展方面的策略是什么?',
  'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'},
 {'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?',
  'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},
 {'question': '接入ChatGPT后的产品变化有哪些?',
  'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'},
 {'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},
 {'question': '根据估值模型,福昕软件的目标市值是多少?', 'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]

import pandas as pd

df = pd.DataFrame(rows)

df

thread_message = client.beta.threads.messages.create(

thread_id=thread.id,

role="user",

content="每个部分可以拆分为几个子部分,分别输出。"

)

print(thread_message)

run = client.beta.threads.runs.create(

thread_id=thread.id,

assistant_id=assistant.id,

model = "gpt-3.5-turbo"

)

print(run)

run = wait_on_run(run, thread)

print(run.id)

messages = client.beta.threads.messages.list(thread_id=thread.id)

messages = json.loads(messages.model_dump_json())

print(messages['data'][0]['content'][0]['text']['value'])

复制代码
根据文档内容,可以将文档分为以下子部分并逐个输出:

### 第一部分(发展历程、主营业务、财务分析、公司治理)

1.1 发展历程:公司成立时间较早,聚焦海外市场开拓
- 福昕软件成立于2001年。

1.2 主营业务:聚焦PDF相关解决方案
- 福昕软件的主营业务是聚焦PDF相关解决方案。

1.3 财务分析:依托优秀的成长性和稳固的行业地位,公司长期财务数据表现亮眼
- 公司长期财务数据表现亮眼,依托优秀的成长性和稳固的行业地位。

1.4 公司治理:股权清晰且稳定,长期持股计划绑定员工利益
- 公司股权清晰且稳定,采取长期持股计划绑定员工利益。

### 第二部分(所处行业分析)

2.1 行业空间:无纸化、电子化办公已成趋势,PDF赛道规模剑指千亿
- 行业天花板高,公司竞争力强。

2.2 公司竞争力分析:公司产品在功能、价格、用户评价三个维度均有一定竞争力,后续有望抢占更多市场份额
- 公司产品在功能、价格、用户评价三个维度均有一定竞争力。

### 第三部分(订阅+渠道双转型)

3.1 订阅转型:订阅模式下可为客户提供丰富的增值服务,并提升客户终生价值
- “订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。

3.2 渠道转型:核心在于通过渠道触达海量客户资源,进而抢占更多市场份额
- 通过渠道触达海量客户资源,抢占更多市场份额。

### 第四部分(境外收入占比、境内市场拓展)

4.1 福昕家装解决方案
- 谈及福昕家装解决方案。

4.2 福昕船舶图纸管理系统
- 谈及福昕船舶图纸管理系统。

4.3 电子签名解决方案
- 谈及电子签名解决方案。

### 第五部分(AIGC赋能、产品竞争力)

5.1 AIGC赋能正在进行时,产品竞争力日益凸显
- 福昕的产品具备AIGC赋能,竞争力日益突出。

### 第六部分(盈利预测、估值与投资评级)

6.1 盈利预测及假设
- 公司的盈利预测及假设。

6.2 估值与投资评级
- 估值模型与投资评级。

这样,每个部分都被细分并输出了各自的子部分内容。
相关推荐
Hugo_Hoo几秒前
构建LangChain应用程序的示例代码:53、利用多模态大型语言模型在RAG应用中处理混合文档的示例
人工智能·langchain·ai编程
人工智能小豪16 分钟前
LLM大模型企业应用实战-----为Langchain Agent添加记忆功能
人工智能·langchain·大模型·llm·私有化部署·产品经理·ai大模型
Elfin_z19 分钟前
【深度学习练习】心脏病预测
人工智能·深度学习
山东仁科22 分钟前
现代农业利器:土壤检测仪器的应用与未来
人工智能·土壤监测
迅腾文化36 分钟前
品牌推广的深层逻辑:自我提升与市场认同的和谐共生
大数据·人工智能·物联网·信息可视化·媒体
九芯电子38 分钟前
语音声控灯:置入NRK3301离线语音识别ic 掌控的灯具新风尚
人工智能·语音识别
meitiyaoyue39 分钟前
「媒体邀约」上海请媒体的费用
人工智能
zhangbin_23740 分钟前
【Python机器学习】处理文本数据——将文本数据表示为词袋
人工智能·python·算法·机器学习·分类
旭华智能1 小时前
智能井盖采集装置 开启井下安全新篇章
人工智能
奔袭的算法工程师1 小时前
毫米波雷达深度学习技术-1.7训练一个神经网络
人工智能·深度学习·神经网络·目标检测·自动驾驶