使用智能AI文心一言处理采集数据

简数采集器支持调用百度智能AI文心一言大模型API接口,可对采集的数据进行研究分析,内容创作。

文心一言API使用方法如下:

目录

[1. 采集数据](#1. 采集数据)

[2. 申请API](#2. 申请API)

[3. 对接文心一言API](#3. 对接文心一言API)

[4. 设置文心一言API的执行指令](#4. 设置文心一言API的执行指令)

[5. 使用文心一言API处理采集数据](#5. 使用文心一言API处理采集数据)


1. 采集数据

先在简数采集器配置采集规则,完成数据采集,采集教程可看:免费网页数据抓取工具教程-CSDN博客

2. 申请API

注册并登录百度千帆大模型平台,点击左侧菜单的 "应用接入" 功能 --》再点击 "+创建应用" 按钮,开通预置的大模型服务应用 --》成功后,获取对应的 "API Key" 和 "​​​​​​​Secret Key" 。

3. 对接文心一言API

在简数采集器进入 "第三方API接入管理" 页面,点击 "+百度AI(千帆大模型平台API)" 按钮,选择大模型API类型( "ERNIE-Bot" 就是文心一言的底层模型),填写文心一言接口的 "API Key" 和 "Secret Key" 。

4. 设置文心一言API的执行指令

设置文心一言API对采集数据的哪些字段内容进行处理,执行什么指令。

进入简数采集器的 "API处理规则管理" 页面,点击 "添加API处理规则" 按钮 --》设置调用文心一言API接口分析处理数据的哪些字段,字段前后可选择添加自定义的AI指令(prompt)。

例如:请用[ + title + ]生成一段描述

5. 使用文心一言API处理采集数据

在简数采集器的任务 "结果数据&导出" 页面,点击 "翻译规则分析等API执行" 按钮 --》选择 "第三方API执行" 选项 --》选择相应的API处理规则,然后执行,等待执行完成即可。

简数采集器也支持自动执行API处理规则,在采集任务 的 "自动化配置" 页面处配置。

文心一言API规则执行成功后,会生成新的字段,并不是替换掉原来字段中的内容,可以在 "结果数据" 页面查看。

相关推荐
梓羽玩Python36 分钟前
太牛了!OWL:Manus 最强开源复现,开源框架GAIA基准测试中排第一!
人工智能·python
DavidSoCool42 分钟前
Elasticsearch Java API Client [8.17] 使用
java·大数据·elasticsearch
莓事哒1 小时前
静态网页的爬虫(以电影天堂为例)
爬虫·python
q567315231 小时前
使用CPR库编写的爬虫程序
开发语言·爬虫·golang·音视频
HerrFu1 小时前
可狱可囚的爬虫系列课程 18:成都在售新房数据爬虫(lxml 模块)实战
爬虫·python
m0_748236581 小时前
Python数据分析案例30——中国高票房电影分析(爬虫获取数据及分析可视化全流程)
爬虫·python·数据分析
用户199701080181 小时前
淘宝买家/卖家订单列表、订单详情、订单物流 API 接口全攻略
大数据
Arbori_262151 小时前
大数据 spark hive 总结
大数据·hive·spark
詹天佐1 小时前
ICCE 数字车钥匙介绍
人工智能·算法