支持GPT-3.5-Turbo, GPT-4o, GPT-4-Turbo
import json
import openai
from pathlib import Path
import os
client = openai.OpenAI(base_url=base_url, api_key=api_key)
file = client.files.create(
file=open("H3.pdf", "rb"),
purpose='assistants'
)
assistant = client.beta.assistants.create(
name="问答生成",
instructions="你是一个问答生成助手,可以帮助用户去生成问答对。",
model="gpt-4-1106-preview",
tools=[{"type":"retrieval"}],
file_ids= [file.id]
)
print(assistant.id)
thread = client.beta.threads.create(
messages=[
{
"role": "user",
"content": """
这个文档可以分为多个部分,分别输出。针对每个部分生成3个问答对,合并后以中文JSON格式输出。
"""
}
]
)
print(thread.id)
run = client.beta.threads.runs.create(
thread_id=thread.id,
assistant_id=assistant.id
)
print(run.id)
import time
def wait_on_run(run, thread):
while run.status == "queued" or run.status == "in_progress":
run = client.beta.threads.runs.retrieve(
thread_id=thread.id,
run_id=run.id,
)
time.sleep(1)
print("等待响应中...")
return run
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
messages['data'][0]['content'][0]['text']['value']
'接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。\n\n### 第一部分(发展历程、主营业务、财务分析、公司治理)\n\n1. 福昕软件成立于哪一年?\n A: 福昕软件成立于2001年。\n\n2. 福昕软件的主营业务是什么?\n A: 福昕软件的主营业务是聚焦PDF相关解决方案。\n\n3. 福昕软件在员工利益方面采取了哪些措施?\n A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】\n\n### 第二部分(所处行业分析)\n\n1. 福昕软件公司的产品在哪些方面具有竞争力?\n A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。\n\n2. 福昕软件未来的市场发展潜力如何?\n A: 福昕软件公司后续有望抢占更多市场份额。【14†source】\n\n### 第三部分(订阅+渠道双转型)\n\n1. “订阅+渠道”双转型的核心策略是什么?\n A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。\n\n2. 福昕软件订阅模式为客户提供了哪些增值服务?\n A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】\n\n### 第四部分(境外收入占比、境内市场拓展)\n\n1. 福昕软件在境内市场拓展方面的策略是什么?\n A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】\n\n### 第五部分(AIGC赋能、产品竞争力)\n\n1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?\n A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】\n\n2. 接入ChatGPT后的产品变化有哪些?\n A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。\n\n### 第六部分(盈利预测、估值与投资评级)\n\n1. 福昕软件的投资评级如何?\n A: 福昕软件的投资评级为“买入”。【18†source】\n\n2. 根据估值模型,福昕软件的目标市值是多少?\n A: 根据估值模型,福昕软件的目标市值为117.0亿元。\n\n将以上问答对合并并转换为JSON格式如下:\n```json\n[\n {\n "part": "第一部分",\n "qa_pairs": [\n {\n "question": "福昕软件成立于哪一年?",\n "answer": "福昕软件成立于2001年。"\n },\n {\n "question": "福昕软件的主营业务是什么?",\n "answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"\n },\n {\n "question": "福昕软件在员工利益方面采取了哪些措施?",\n "answer": "福昕软件制定了长期持股计划以绑定员工利益。"\n }\n ]\n },\n {\n "part": "第二部分",\n "qa_pairs": [\n {\n "question": "福昕软件公司的产品在哪些方面具有竞争力?",\n "answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"\n },\n {\n "question": "福昕软件未来的市场发展潜力如何?",\n "answer": "福昕软件公司后续有望抢占更多市场份额。"\n }\n ]\n },\n {\n "part": "第三部分",\n "qa_pairs": [\n {\n "question": "“订阅+渠道”双转型的核心策略是什么?",\n "answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"\n },\n {\n "question": "福昕软件订阅模式为客户提供了哪些增值服务?",\n "answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"\n }\n ]\n },\n {\n "part": "第四部分",\n "qa_pairs": [\n {\n "question": "福昕软件在境内市场拓展方面的策略是什么?",\n "answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"\n }\n ]\n },\n {\n "part": "第五部分",\n "qa_pairs": [\n {\n "question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",\n "answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"\n },\n {\n "question": "接入ChatGPT后的产品变化有哪些?",\n "answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"\n }\n ]\n },\n {\n "part": "第六部分",\n "qa_pairs": [\n {\n "question": "福昕软件的投资评级如何?",\n "answer": "福昕软件的投资评级为“买入”。"\n },\n {\n "question": "根据估值模型,福昕软件的目标市值是多少?",\n "answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"\n }\n ]\n }\n]\n```'
print(messages['data'][0]['content'][0]['text']['value'])
接下来,根据您的文档,我将对每个部分生成问答对,并以中文JSON格式输出。
### 第一部分(发展历程、主营业务、财务分析、公司治理)
1. 福昕软件成立于哪一年?
A: 福昕软件成立于2001年。
2. 福昕软件的主营业务是什么?
A: 福昕软件的主营业务是聚焦PDF相关解决方案。
3. 福昕软件在员工利益方面采取了哪些措施?
A: 福昕软件制定了长期持股计划以绑定员工利益。【13†source】
### 第二部分(所处行业分析)
1. 福昕软件公司的产品在哪些方面具有竞争力?
A: 福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。
2. 福昕软件未来的市场发展潜力如何?
A: 福昕软件公司后续有望抢占更多市场份额。【14†source】
### 第三部分(订阅+渠道双转型)
1. “订阅+渠道”双转型的核心策略是什么?
A: 福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。
2. 福昕软件订阅模式为客户提供了哪些增值服务?
A: 福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。【15†source】
### 第四部分(境外收入占比、境内市场拓展)
1. 福昕软件在境内市场拓展方面的策略是什么?
A: 福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。【16†source】
### 第五部分(AIGC赋能、产品竞争力)
1. 福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?
A: 福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。【17†source】
2. 接入ChatGPT后的产品变化有哪些?
A: 接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。
### 第六部分(盈利预测、估值与投资评级)
1. 福昕软件的投资评级如何?
A: 福昕软件的投资评级为“买入”。【18†source】
2. 根据估值模型,福昕软件的目标市值是多少?
A: 根据估值模型,福昕软件的目标市值为117.0亿元。
将以上问答对合并并转换为JSON格式如下:
```json
[
{
"part": "第一部分",
"qa_pairs": [
{
"question": "福昕软件成立于哪一年?",
"answer": "福昕软件成立于2001年。"
},
{
"question": "福昕软件的主营业务是什么?",
"answer": "福昕软件的主营业务是聚焦PDF相关解决方案。"
},
{
"question": "福昕软件在员工利益方面采取了哪些措施?",
"answer": "福昕软件制定了长期持股计划以绑定员工利益。"
}
]
},
{
"part": "第二部分",
"qa_pairs": [
{
"question": "福昕软件公司的产品在哪些方面具有竞争力?",
"answer": "福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。"
},
{
"question": "福昕软件未来的市场发展潜力如何?",
"answer": "福昕软件公司后续有望抢占更多市场份额。"
}
]
},
{
"part": "第三部分",
"qa_pairs": [
{
"question": "“订阅+渠道”双转型的核心策略是什么?",
"answer": "福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。"
},
{
"question": "福昕软件订阅模式为客户提供了哪些增值服务?",
"answer": "福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。"
}
]
},
{
"part": "第四部分",
"qa_pairs": [
{
"question": "福昕软件在境内市场拓展方面的策略是什么?",
"answer": "福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。"
}
]
},
{
"part": "第五部分",
"qa_pairs": [
{
"question": "福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?",
"answer": "福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。"
},
{
"question": "接入ChatGPT后的产品变化有哪些?",
"answer": "接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。"
}
]
},
{
"part": "第六部分",
"qa_pairs": [
{
"question": "福昕软件的投资评级如何?",
"answer": "福昕软件的投资评级为“买入”。"
},
{
"question": "根据估值模型,福昕软件的目标市值是多少?",
"answer": "根据估值模型,福昕软件的目标市值为117.0亿元。"
}
]
}
]
```
res = messages['data'][0]['content'][0]['text']['value']
json_start = res.find("```json\n")
json_end = res.find("```\n")
if json_start>=0:
if json_end > json_start:
res = res[json_start+8:json_end]
elif json_end ==-1:
res = res[json_start+8:len(res)-3]
data = json.loads(res)
data
[{'part': '第一部分',
'qa_pairs': [{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},
{'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},
{'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'}]},
{'part': '第二部分',
'qa_pairs': [{'question': '福昕软件公司的产品在哪些方面具有竞争力?',
'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},
{'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'}]},
{'part': '第三部分',
'qa_pairs': [{'question': '“订阅+渠道”双转型的核心策略是什么?',
'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},
{'question': '福昕软件订阅模式为客户提供了哪些增值服务?',
'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'}]},
{'part': '第四部分',
'qa_pairs': [{'question': '福昕软件在境内市场拓展方面的策略是什么?',
'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'}]},
{'part': '第五部分',
'qa_pairs': [{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?',
'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},
{'question': '接入ChatGPT后的产品变化有哪些?',
'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'}]},
{'part': '第六部分',
'qa_pairs': [{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},
{'question': '根据估值模型,福昕软件的目标市值是多少?',
'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]}]
rows = []
for x in data:
for y in x['qa_pairs']:
rows.append(y)
rows
[{'question': '福昕软件成立于哪一年?', 'answer': '福昕软件成立于2001年。'},
{'question': '福昕软件的主营业务是什么?', 'answer': '福昕软件的主营业务是聚焦PDF相关解决方案。'},
{'question': '福昕软件在员工利益方面采取了哪些措施?', 'answer': '福昕软件制定了长期持股计划以绑定员工利益。'},
{'question': '福昕软件公司的产品在哪些方面具有竞争力?',
'answer': '福昕软件公司的产品在功能、价格和用户评价上具有一定的竞争力。'},
{'question': '福昕软件未来的市场发展潜力如何?', 'answer': '福昕软件公司后续有望抢占更多市场份额。'},
{'question': '“订阅+渠道”双转型的核心策略是什么?',
'answer': '福昕软件的“订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。'},
{'question': '福昕软件订阅模式为客户提供了哪些增值服务?',
'answer': '福昕软件订阅模式为客户提供丰富的增值服务,并提升客户终生价值。'},
{'question': '福昕软件在境内市场拓展方面的策略是什么?',
'answer': '福昕软件在境内市场拓展方面,进入行业垂直领域,依托PDF核心技术与底层代码,结合特定行业与专业垂直领域的业务场景,拓展PDF技术的应用。'},
{'question': '福昕软件的哪一款产品接入了ChatGPT,带来了哪些功能?',
'answer': '福昕软件的Foxit PDF Editor Cloud已成功接入ChatGPT,带来了文档整理、文档重写、文档翻译、文档问答、文本解析、拼写及语法纠错等功能。'},
{'question': '接入ChatGPT后的产品变化有哪些?',
'answer': '接入ChatGPT后的产品具备一定提价预期,同时功能不断完善和迭代。'},
{'question': '福昕软件的投资评级如何?', 'answer': '福昕软件的投资评级为“买入”。'},
{'question': '根据估值模型,福昕软件的目标市值是多少?', 'answer': '根据估值模型,福昕软件的目标市值为117.0亿元。'}]
import pandas as pd
df = pd.DataFrame(rows)
df
thread_message = client.beta.threads.messages.create(
thread_id=thread.id,
role="user",
content="每个部分可以拆分为几个子部分,分别输出。"
)
print(thread_message)
run = client.beta.threads.runs.create(
thread_id=thread.id,
assistant_id=assistant.id,
model = "gpt-3.5-turbo"
)
print(run)
run = wait_on_run(run, thread)
print(run.id)
messages = client.beta.threads.messages.list(thread_id=thread.id)
messages = json.loads(messages.model_dump_json())
print(messages['data'][0]['content'][0]['text']['value'])
根据文档内容,可以将文档分为以下子部分并逐个输出:
### 第一部分(发展历程、主营业务、财务分析、公司治理)
1.1 发展历程:公司成立时间较早,聚焦海外市场开拓
- 福昕软件成立于2001年。
1.2 主营业务:聚焦PDF相关解决方案
- 福昕软件的主营业务是聚焦PDF相关解决方案。
1.3 财务分析:依托优秀的成长性和稳固的行业地位,公司长期财务数据表现亮眼
- 公司长期财务数据表现亮眼,依托优秀的成长性和稳固的行业地位。
1.4 公司治理:股权清晰且稳定,长期持股计划绑定员工利益
- 公司股权清晰且稳定,采取长期持股计划绑定员工利益。
### 第二部分(所处行业分析)
2.1 行业空间:无纸化、电子化办公已成趋势,PDF赛道规模剑指千亿
- 行业天花板高,公司竞争力强。
2.2 公司竞争力分析:公司产品在功能、价格、用户评价三个维度均有一定竞争力,后续有望抢占更多市场份额
- 公司产品在功能、价格、用户评价三个维度均有一定竞争力。
### 第三部分(订阅+渠道双转型)
3.1 订阅转型:订阅模式下可为客户提供丰富的增值服务,并提升客户终生价值
- “订阅+渠道”双转型的核心策略是通过渠道转型抢占竞争对手现有的客户,再通过订阅转型获得更多的持续性收入。
3.2 渠道转型:核心在于通过渠道触达海量客户资源,进而抢占更多市场份额
- 通过渠道触达海量客户资源,抢占更多市场份额。
### 第四部分(境外收入占比、境内市场拓展)
4.1 福昕家装解决方案
- 谈及福昕家装解决方案。
4.2 福昕船舶图纸管理系统
- 谈及福昕船舶图纸管理系统。
4.3 电子签名解决方案
- 谈及电子签名解决方案。
### 第五部分(AIGC赋能、产品竞争力)
5.1 AIGC赋能正在进行时,产品竞争力日益凸显
- 福昕的产品具备AIGC赋能,竞争力日益突出。
### 第六部分(盈利预测、估值与投资评级)
6.1 盈利预测及假设
- 公司的盈利预测及假设。
6.2 估值与投资评级
- 估值模型与投资评级。
这样,每个部分都被细分并输出了各自的子部分内容。