简数采集器支持调用百度智能AI文心一言大模型API接口,可对采集的数据进行研究分析,内容创作。
文心一言API使用方法如下:
目录
[1. 采集数据](#1. 采集数据)
[2. 申请API](#2. 申请API)
[3. 对接文心一言API](#3. 对接文心一言API)
[4. 设置文心一言API的执行指令](#4. 设置文心一言API的执行指令)
[5. 使用文心一言API处理采集数据](#5. 使用文心一言API处理采集数据)
1. 采集数据
先在简数采集器配置采集规则,完成数据采集,采集教程可看:免费网页数据抓取工具教程-CSDN博客
2. 申请API
注册并登录百度千帆大模型平台,点击左侧菜单的 "应用接入" 功能 --》再点击 "+创建应用" 按钮,开通预置的大模型服务应用 --》成功后,获取对应的 "API Key
" 和 "Secret Key
" 。
3. 对接文心一言API
在简数采集器进入 "第三方API接入管理" 页面,点击 "+百度AI(千帆大模型平台API)" 按钮,选择大模型API类型( "ERNIE-Bot" 就是文心一言的底层模型),填写文心一言接口的 "API Key" 和 "Secret Key" 。
4. 设置文心一言API的执行指令
设置文心一言API对采集数据的哪些字段内容进行处理,执行什么指令。
进入简数采集器的 "API处理规则管理" 页面,点击 "添加API处理规则" 按钮 --》设置调用文心一言API接口分析处理数据的哪些字段,字段前后可选择添加自定义的AI指令(prompt)。
例如:请用[ + title + ]生成一段描述
5. 使用文心一言API处理采集数据
在简数采集器的任务 "结果数据&导出" 页面,点击 "翻译规则分析等API执行" 按钮 --》选择 "第三方API执行" 选项 --》选择相应的API处理规则,然后执行,等待执行完成即可。
简数采集器也支持自动执行API处理规则,在采集任务 的 "自动化配置" 页面处配置。
文心一言API规则执行成功后,会生成新的字段,并不是替换掉原来字段中的内容,可以在 "结果数据" 页面查看。