使用智能AI文心一言处理采集数据

简数采集器支持调用百度智能AI文心一言大模型API接口,可对采集的数据进行研究分析,内容创作。

文心一言API使用方法如下:

目录

[1. 采集数据](#1. 采集数据)

[2. 申请API](#2. 申请API)

[3. 对接文心一言API](#3. 对接文心一言API)

[4. 设置文心一言API的执行指令](#4. 设置文心一言API的执行指令)

[5. 使用文心一言API处理采集数据](#5. 使用文心一言API处理采集数据)


1. 采集数据

先在简数采集器配置采集规则,完成数据采集,采集教程可看:免费网页数据抓取工具教程-CSDN博客

2. 申请API

注册并登录百度千帆大模型平台,点击左侧菜单的 "应用接入" 功能 --》再点击 "+创建应用" 按钮,开通预置的大模型服务应用 --》成功后,获取对应的 "API Key" 和 "​​​​​​​Secret Key" 。

3. 对接文心一言API

在简数采集器进入 "第三方API接入管理" 页面,点击 "+百度AI(千帆大模型平台API)" 按钮,选择大模型API类型( "ERNIE-Bot" 就是文心一言的底层模型),填写文心一言接口的 "API Key" 和 "Secret Key" 。

4. 设置文心一言API的执行指令

设置文心一言API对采集数据的哪些字段内容进行处理,执行什么指令。

进入简数采集器的 "API处理规则管理" 页面,点击 "添加API处理规则" 按钮 --》设置调用文心一言API接口分析处理数据的哪些字段,字段前后可选择添加自定义的AI指令(prompt)。

例如:请用[ + title + ]生成一段描述

5. 使用文心一言API处理采集数据

在简数采集器的任务 "结果数据&导出" 页面,点击 "翻译规则分析等API执行" 按钮 --》选择 "第三方API执行" 选项 --》选择相应的API处理规则,然后执行,等待执行完成即可。

简数采集器也支持自动执行API处理规则,在采集任务 的 "自动化配置" 页面处配置。

文心一言API规则执行成功后,会生成新的字段,并不是替换掉原来字段中的内容,可以在 "结果数据" 页面查看。

相关推荐
一个处女座的程序猿2 小时前
LLMs之SLMs:《Small Language Models are the Future of Agentic AI》的翻译与解读
人工智能·自然语言处理·小语言模型·slms
ManageEngineITSM2 小时前
技术的秩序:IT资产与配置管理的现代重构
大数据·运维·数据库·重构·工单系统
一周困⁸天.4 小时前
Elasticsearch+Logstash+Filebeat+Kibana部署【7.1.1版本】
大数据·elk·elasticsearch·jenkins
档案宝档案管理4 小时前
档案宝:企业合同档案管理的“安全保险箱”与“效率加速器”
大数据·数据库·人工智能·安全·档案·档案管理
IT_Beijing_BIT6 小时前
TensorFlow Keras
人工智能·tensorflow·keras
workflower6 小时前
FDD(Feature Driven Development)特征驱动开发
大数据·数据库·驱动开发·需求分析·个人开发
mit6.8246 小时前
[手机AI开发sdk] 安卓上的Linux环境
人工智能·智能手机
张较瘦_6 小时前
[论文阅读] AI + 教育 | AI赋能“三个课堂”的破局之道——具身认知与技术路径深度解读
论文阅读·人工智能
小雨青年7 小时前
Cursor 项目实战:AI播客策划助手(二)—— 多轮交互打磨播客文案的技术实现与实践
前端·人工智能·状态模式·交互
西西弗Sisyphus7 小时前
线性代数 - 初等矩阵
人工智能·线性代数·机器学习