使用智能AI文心一言处理采集数据

简数采集器支持调用百度智能AI文心一言大模型API接口,可对采集的数据进行研究分析,内容创作。

文心一言API使用方法如下:

目录

[1. 采集数据](#1. 采集数据)

[2. 申请API](#2. 申请API)

[3. 对接文心一言API](#3. 对接文心一言API)

[4. 设置文心一言API的执行指令](#4. 设置文心一言API的执行指令)

[5. 使用文心一言API处理采集数据](#5. 使用文心一言API处理采集数据)


1. 采集数据

先在简数采集器配置采集规则,完成数据采集,采集教程可看:免费网页数据抓取工具教程-CSDN博客

2. 申请API

注册并登录百度千帆大模型平台,点击左侧菜单的 "应用接入" 功能 --》再点击 "+创建应用" 按钮,开通预置的大模型服务应用 --》成功后,获取对应的 "API Key" 和 "​​​​​​​Secret Key" 。

3. 对接文心一言API

在简数采集器进入 "第三方API接入管理" 页面,点击 "+百度AI(千帆大模型平台API)" 按钮,选择大模型API类型( "ERNIE-Bot" 就是文心一言的底层模型),填写文心一言接口的 "API Key" 和 "Secret Key" 。

4. 设置文心一言API的执行指令

设置文心一言API对采集数据的哪些字段内容进行处理,执行什么指令。

进入简数采集器的 "API处理规则管理" 页面,点击 "添加API处理规则" 按钮 --》设置调用文心一言API接口分析处理数据的哪些字段,字段前后可选择添加自定义的AI指令(prompt)。

例如:请用[ + title + ]生成一段描述

5. 使用文心一言API处理采集数据

在简数采集器的任务 "结果数据&导出" 页面,点击 "翻译规则分析等API执行" 按钮 --》选择 "第三方API执行" 选项 --》选择相应的API处理规则,然后执行,等待执行完成即可。

简数采集器也支持自动执行API处理规则,在采集任务 的 "自动化配置" 页面处配置。

文心一言API规则执行成功后,会生成新的字段,并不是替换掉原来字段中的内容,可以在 "结果数据" 页面查看。

相关推荐
爱打代码的小林1 分钟前
机器学习(TF-IDF)
人工智能·tf-idf
麦兜*5 分钟前
Spring Boot 整合 Apache Doris:实现海量数据实时OLAP分析实战
大数据·spring boot·后端·spring·apache
云启数智YQ6 分钟前
深入解析云桌面:定义、主流方案与行业实践
大数据
档案宝档案管理6 分钟前
权限分级+加密存储+操作追溯,筑牢会计档案安全防线
大数据·网络·人工智能·安全·档案·档案管理
数据光子7 分钟前
【YOLO数据集】国内交通信号检测
人工智能·python·安全·yolo·目标检测·目标跟踪
源代码•宸7 分钟前
Golang基础语法(go语言指针、go语言方法、go语言接口、go语言断言)
开发语言·经验分享·后端·golang·接口·指针·方法
武子康12 分钟前
大数据-207 如何应对多重共线性:使用线性回归中的最小二乘法时常见问题与解决方案
大数据·后端·机器学习
霍格沃兹测试开发学社测试人社区12 分钟前
GitLab 测试用例:实现 Web 场景批量自动化执行的方法
人工智能·智能体
Mintopia13 分钟前
🤖 AI 应用自主决策的可行性 — 一场从逻辑电路到灵魂选择的奇妙旅程
人工智能·aigc·全栈
百***787513 分钟前
2026 优化版 GPT-5.2 国内稳定调用指南:API 中转实操与成本优化
开发语言·人工智能·python