Agent
coze平台Agent开发:
1.让Bot听懂人话 重点:实现提示词工程
2.让Bot专业 重点:实现RAG应用
3.让Bot做事 重点:实现插件制作
4.让Bot工作 重点:实现工作流的编排
5.让Bot应用 重点:发布运营,触达用户
如何设置提示词:
1,角色定位 明确Bot身份,建立专业形象
2,技能描述 清晰的目标,让Bot知道做什么
3,输出格式 结构化回复要求,确保输出规范
4,约束条件 限制不当行为,保证安全合规
RAG基本原理
Bot遇到的难题传统LLM的缺陷
消息滞后(无法获取最新知识)
问题:知识过时,无法回答,用户体验差,Bot价值大大折扣
解决方案:
RAG索引增强技术
RAG是一种结合知识检索和语言生成的人工智能技术,主要用于解决大型语言模型幻觉问题
基本原理:
在生成回答时,先从知识库中检索相关文档,将检索到的文档与原始问题一起输入LLM,LLM基于检索内容生成最终答案
RAG解决了什么问题?
大模型幻觉问题
RAG知识库构建的基本流程
文件类型
文档类型:PDF Word TXT
适用场景:公略文章,教程文档,
LOL案例:英雄攻略PDF
表格类型:Excel,CSV
使用场景:结构化数据,统计信息
LOL案例:英雄属性表
照片类型:JPG,JPEG,PNG
适用场景:图像生成
LOL案例:英雄战斗画面
文档预处理建议
清理无关内容(广告,水印)
按主题分类整理
文件命名规范(含关键信息)
文档切片
目的:为了适应大语言模型的上下文长度限制,并提升检索的精确度和效率
切片方式:按照字符数切分,按符号切分,按语义切分
一般选择方式:按照符号和字符长度一块切分:一般200-500字/段
长度太小,上下文不完整,检索不准,长度太大,无关信息过多,干扰判断
文档向量化
将切分后的文本进行向量数字化,便于计算问题和文档的相似性
向量化作用:语义理解,相似度计算,快速检索
便于计算问题和文档的相似性
coze平台鉴权方式:
鉴权方式:
| 鉴权方式 | 说明 |
|---|---|
| 个人访问令牌 | Personal Access Token,简称 PAT。扣子编程中生成的个人访问令牌。每个令牌可以关联多个空间,并开通指定的接口权限。生成方式可参考添加个人访问令牌。 虽然 PAT 生成和使用便捷,但其本质上是一种预授权的明文令牌。如果保管不当,极易导致令牌泄露,进而被黑灰产盗用,引发安全风险。 建议仅在测试环境、调试场景中使用 PAT,并严格限制其使用范围和有效期。 在生产环境中应谨慎使用 PAT,优先考虑更安全的认证方式 OAuth。 |
| 服务访问令牌 | Service Access Token(简称 SAT)是以服务身份创建的访问凭证,可长期有效访问扣子编程资源,通常用于服务/应用程序的身份验证和授权。SAT 与 OAuth JWT 鉴权方式相比,具有更长的有效期(可设置为永久有效),操作简单,能够有效简化授权流程。 |
| OAuth 访问令牌 | OAuth Access Token,通过 OAuth 2.0鉴权方式生成的 OAuth 访问令牌。该鉴权方式通常用于应用程序的身份验证和授权,和 PAT 鉴权方式相比,令牌有效期短,安全性更高,适用于线上生产环境。 扣子编程目前支持授权码(Authorization Code Grant)、JWT **模式(JSON Web Tokens)**等多种 OAuth 授权类型,详细说明请参见下文中的OAuth 授权方式说明。 |