大家好,我是弼小侠,一个执着于应用AI技术解决实际问题的AI博主。
目前深度研究使用AI Agent技术应用无法自拔,欢迎感兴趣的伙伴交流!
首先说个好消息, 【弼小侠AI基地】 上线近一个月,已收获数千粉丝的认可,感谢大家。
很多伙伴问我Coze是个啥玩意!
看了很多网上有关Coze的教程,感觉不够入门,多数都是炫技、探索为主。
于是就有这篇文章,花费一周时间,万字长文分享顶级入门教程,本文会分为上、下两篇分别讲解。话不多说,直接开干!
接下来我会从以下四个方面带着大家一起学习:
上篇:
一、认识AI智能体(AI Agnet)
二、coze入门保姆式教程
下篇:
三、coze实战教学打造第一个商用AI客服
四、coze商业价值探讨
开始之前,希望大家评论、点赞加关注支持小侠!谢谢。
一、认识AI智能体(AI Agnet)
1.为什么需要一个AI Agent?
已经有了AI,为什么又要冒出个AI Agent,这是刻意装逼显得厉害搞出来的概念吗?
列举个案例:
当你要让大模型(AI)帮你整理一篇文章,假设你这样问AI:
请你帮我生成一篇100万字的言情小说
这个时候,AI给你什么答案!是不是写不出这么多字,也给不出你想要的答案?
为什么会出现这种问题?是AI不够厉害?还是AI就是伪概念?
假设这件事是我们人类来做,我们会有哪些动作?
1)上网查阅相关内容;
2)规划大纲;
3)分步整理;
4)审核和检查;
通过上述步骤,我们是不是就能完成这个任务!
思考一下,完成这个任务,你用到了哪些操作?
1)上网查询;
2)分解任务;
3)逐步规划;
4)排查;
这里面涉及到工具,思考过程,完成过程,复盘等操作,还用到大脑,手,电脑或者助手等"工具"。
那AI是什么?
AI在这个过程中只充当了大脑的角色,他没有额外的工具或者步骤,因此这个任务交给它,它是无法单独完成的。
为了让AI能够真正实现工作,我们得给他配备上网查询能力,使用工具能力,分解任务能力等等。
这就是AI Agent的价值,让AI不仅是一个大脑,而是能使用"工具"的类人智能体。
在举个例子:
假设你让普通AI帮你写日报,能不能行?
可以,但是你的操作会很复杂。
Agent写日报就不同了,设定好格式,语气,任务等关键信息,你只需要口语化告诉它做了什么,剩下的事他会帮你整理。
假设你让普通AI帮你做写篇软文,能不能行?
可以,但是操作同样复杂,来来回回折腾几遍可能还不满意。
Agent写就不同了,提前设定好标题,开头,内容和语气等关键信息,你只需要告诉Agent你要写什么主题内容,它就能按照设定一步一步帮你整理。
假设你去旅游,让AI给你介绍景点信息,能不能行?
可以,但是每次你都要问,还不一定回答是否正确。
Agent就不同了,按照景点情况设定好Agent,你走到哪,他就告诉你什么,你问他WC在哪,它还可以根据你的位置给你指定最近的WC。
通过上面这些小案例,你是不是理解了Agent和AI到底有什么不同了,简单说,AI相当于可以咨询的大脑,Agent相当于能干活的机器。
2.认识AI Agent
首先先看这张图:
AI Agent = LLM(大模型) + Planning(规划) + Memory(记忆) + Tools(工具)+Action(行动)
这张图代表着Agent的构成,类似人的大脑、四肢、思考、执行。
有这些能力,是不是和上文说的类人智能体靠近了!
接下来我们看看Agent的具体定义:
AI Agent 就是一种能代替人类执行任务的智能助手。它集成了感知、学习、推理、决策、内容生成等多种 AI 能力,可以与人进行自然语言交互,根据人的需求提供个性化、多样化的服务。
让我们分别讲解一下这些名词的具体含义:
-
规划
- 子目标和分解:Agent 将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务,以开个餐馆为例,任务开一家餐馆,分解就是把开餐馆这件事划分成不同的步骤或者任务,比如取名、选址、装修、备货、营业,分解越细工作就越简单越容易达成目标。
- 反思和完善:Agent 可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。
- 思维链:让Agent 像人类一样一步一步思考,比如计算数学题,一步一步推理计算,保证最后的答案正确性,这点在高效使用AI上非常常见,比如不要AI直接给出最后的答案,而是让AI把推理过程一起写出来。
-
记忆
- 短期记忆:我们与朋友沟通过程中,是不是要记住沟通上下文,但是时间久远的一次对话,我们是不是又不会记住对话过程? 短期记忆就类似于对话现场记下来的内容。
- 长期记忆:长期记忆类似于把久远的聊天整理成一个记忆点,随时让能够回忆当时说了什么重要的事。
-
工具使用
- 让AI能够使用外部工具,比如上网查询信息,代码执行等能力。在coze中表现为插件等工具的使用。
3.AI Agent有什么用?
前文我们了解到,单独的AI能力很强大,但是面对复杂任务时,他需要"助手"帮忙,有"助手"的帮忙,AI能够实现解决实际问题的能力,小侠认为:" AI要融入场景,解决实际问题为目的",因此探索AI Agent也是我们最为核心的一个探索研究方向。
AI Agent可以把它想象为"超级助理",AI相当于大学刚毕业的学生,Agent相当于去企业上班后要完成的工作任务,一个学生能变成什么岗位的精英,在于岗位对他的培养和实践,比如:
- 软文Agent助理:根据企业软文要求,全网收集相关内容并整理成营销软文。
- 数据分析Agent:给他企业数据,让他根据要求分析数据情况做出相关报告。
- 行政Agent:按照行政审批流程,让AI做好入职审批工作。
- 客服Agent:让它服务客户,解决客户咨询问题。
还有很多,可以说只有你想不到,没有AI做不到!
那为什么企业很少用AI Agent来工作解决问题?
以下是我对Agent的一点看法:
首先,22年到23年主流方向是训练出一个更高智能的AI本体,这是主流趋势,AI应用的前提还是得有个靠谱的"大脑"。
23年到24年开始关注Agent方向,也就是AI应用场景,市场上开始完善Agent开发配套培训,比如coze、dify等,这些平台的完善加上基础AI能力的提升,才有可能将Agent变成现实。
那为什么现在要开始研究学习Agent了?
因为过去半年时间coze、dify等平台功能逐步完善,已经有开发Agent的软硬件条件,因此今年下半年一定是Agent起步的元年。
这点你还别不信,看看海外版coze平台开始收费,国内上架专业版coze平台等等信息,你就不难发现,Agent平民化开发平台已经显现。
本文下篇会分享"弼小侠AI基地-学些助理bot"的实操教程,这个bot(Agent)也是我们用于服务粉丝和解决学习问题的AI学习助理,你在弼小侠AI基地遇到的任何问题,都可以通过这个AI助理帮你解决。
简单说一下这个bot的功能:
- AI客服:解决操作和使用上的问题,比如链接怎么打不开!怎么分享给身边朋友等等问题,都可以询问它。
- AI知识助理:在学习上遇到的问题,特别是弼小侠AI基地里面分享的知识有不懂的,可以咨询它。
- AI学习规划:如何一步一步打开AI大门,不知道自己适合学习哪些内容,没关系,问它,他会根据你的情况帮你规划学习路线。
总之,你在弼小侠AI基地遇到的问题,都可以借助这个Agent帮你解决,这既是一个实操案例,也是一个解决实际工作问题的Agent。
二、coze入门保姆式教程
1.打开Agent大门从认识coze开始
coze中文又名扣子,由字节跳动推出的AI大模型智能体开发平台,在coze里,智能体称之为bot。
coze是集成插件(工具使用)、知识库(数据源)、数据库、记忆、工作流(图像流、工作流)等多功能为一体的Agent开发平台。
大家别被开发平台给吓着了!Agent开发和传统软件开发不是一回事,直白点说就是不管之前是否是程序员,面对Agent开发,大家都是新手,都是零基础,都是同一起跑线。
Agent开发比传统软件开发,更看重的不是软件编程能力,而是考验综合规划理解能力,下篇实操商用AI客服学习,大家就能明白为什么软件编程能力不是优先考核项,反而是规划理解能力为第一考核项的原因。
因此,对于非技术出身的伙伴,不要被开发平台吓怕了,我们日常很多工作其实都是规划理解能力,这方面有优势,开发Agent就简单许多。
没有规划理解能力也没关系,这个咱们可以培养,一步一步来,也不是过不去的坎。
接下来简单介绍一下coze平台比较重要的组成部分。
平台特点介绍:
1)Coze 里面除了外部 API 调用之外,所有的功能都是免费(但是近期海外版已经收费,国内版已经发布专业版,有消息称马上要变成付费,还没学习的伙伴要抓紧时间上手,不然以后就...) ;
2)相比其他Agent开发平台,coze可以说非常适合小白上手 的平台,不需要任何编程基础也可以轻松创建自己的 AI Bot;
3)创建的bot可以轻松对接发布多个平台,比如支持coze商店、豆包、飞书、抖音、微信、掘金、自有渠道等;
4)内置多个大模型,比如豆包·Function call 32k
、通义千问-Max 8k
、智普 GLM-4 128k
、MiniMax6.5(8k、245k)
、Moonshot(8k/32k/128k)
、百川智能Baichuan4 32k
等主流模型
这里的8k、32k可以理解为能阅读多少数量的文本,越大上下文阅读能力就越强,但是不是所有的工作都选择越大越好,比如回答要快,问题简单的,就不一定要用128k的模型。
5)创建的bot不仅可以电脑端使用,还可以手机端应用,比如发布到豆包app,在豆包中搜索bot名称,就能使用,还可以语音交流,提高了用户体验。
2.coze功能介绍
接下来,我们一点点入门了���coze各个功能的具体作用和能力。
1)插件
插件,相当AI使用的工具或者技能,比如上网查询文章,要用到搜索插件(工具),查询头条热点,要用到头条查询等等,coze平台插件目前对外称超过1万+,算国内外插件数量最多的Agent开发平台,总的说插件越多,能做的事就越多。
coze的插件涵盖范围及广,有图像类,文本类,搜索类、数据分析、语音识别等等,开发者可以根据实际需求选择不同插件,满足不同的业务场景。
除此之外,coze还支持定制化插件开发,有些企业自己内部有系统或者网站,个人可能有自己的博客等等,都可以打包成各自插件用于自己的业务。
意想不到的是,插件商店还有便利生活插件,像私人AI助理,帮我们查快递,查地图,查房价等等,都可以调用这些插件实现,真正做到AI帮我们打点日常生活和工作。
- 墨迹天气: 提供的省、市、区县的未来40天的天气情况,包括温度、湿度、日夜风向等信息,你可以用于从事天气预报类文章撰写或者私人使用。
- 飞常准: 航班信息查询插件,根据用户提供的出发城市名称(dep)、到达城市名称(arr)及出发日期(depTime)以获取相应的航班列表,配置好只需一句话,Agent就能帮你查询。
- 医药大全: 查询中西药、医院、医生、疾病信息,有了这个插件,就有了靠谱的家庭医生。
- 什么值得买: 一个购物插件,帮助用户查询商品的优惠信息,根据用户输入的商品相关提问,返回商品概况、价格、购买渠道、性价比推荐等信息,并给出优惠商品的链接地址,有这样一个助手,就不用来来回回几个平台自己对比价格了。
还有很多,我就不一一例举,有兴趣的伙伴,自己到coze平台查看。
以上插件,适用于定制开发私人Agent助理,可以想象一下,如果你身边有这样一个AI助理,是不是很多App你都不用打开就能使用,想想都是一种乐趣。
对于动手能力强或者企业主,上面的插件可能满足不了企业的需求,coze也贴心的为大家开通了自定义插件功能,具体操作如下图:
2)知识库
先问大家一个问题:AI有没有短板?
有,还很多!不过最大的短板就是它不属于我,学习的知识也未必是最新的,比如刚刚发生的事,你问AI,它就回答不出来。
那怎么解决这个短板?、
答案就是:知识库。
coze平台集成了知识库功能,用来储存外部知识,并且还提供了RAG(不清楚的伙伴可以在弼小侠AI基地学习)的能力,那知识库能用来干嘛?
先看看知识库功能包含哪些!
可以看到知识库里包含文本格式,表格格式,图片类型,也就是说文本类和图片类的数据,都可以储存在知识库里面,随时让AI调用,举个简单例子:
假设你要创建一个AI客服,介绍公司和产品,我们就可以用到知识库的能力。
首先,梳理公司和产品的介绍,形成FAQ。
其次,上传到知识库中。
最后将知识库配置到bot里,让bot可以调用这个知识库的内容作为回复。
以上步骤完成,当用户咨询AI有关公司或者产品的问题时,AI就会根据FAQ的内容进行回答。
这里提一下,传统的机器人客服,只能硬套FAQ,不懂变通。
Agent客服,它是根据RAG的能力,优化了回答的方式,并且还融合了bot本身的人设和目标进行回答,直白点就是Agent客服,感觉更像真人客服,不是呆板的机器。
在知识库的创建时,我们需要注意RAG技术检索分析数据的特点,我们上传一份文件到知识库,这份文件并不是单纯的储存,而是会将内容进行切片,切片后的内容更有助于AI检索信息,提升了AI回答内容的关联性。
这里也顺带再说一遍前面说的为什么现在可以学习Agent的原因,23年之前,都是在搞大模型,像RAG这样的配套工具都不完善,因此23年之前你想让AI给你干活,是非常难的一件事。
但是随着项目的发展,AI配套的工具越来越多,并且投入的研发成本越来越高,可商用的Agent就越来越近,如果你还停留在去年的思维,还认为AI只是可以聊聊天没其他用途,那还是蛮危险的。
3)数据库
很多小伙伴在面对数据库和知识库的时候会迷糊,小侠今天一次给你讲清楚,让你不迷糊。
感觉小侠分享还不错的,点赞,关注,评论一键三连,支持一下。
传统软件开发所说的数据库是一门专业的学科,比如:Oracle、MySQL、SQL Server 等,如果放在过去,普通人想利用数据库解决数据管理问题,可以说是不可能的事。
但是coze在AI加持下,数据就不再是难事了!
上面提到的各种数据库,都可以不用懂,我们只需要用自然语言(口语化)告诉AI要记录什么,他就能帮你转换成数据库的语言进行记录,里面到底怎么运行的,不用管。
那数据库和知识库有啥区别?
- 数据库: 相当于可以随时更改数据的储存空间,比如一个班级排名表,里面包含姓名,科目,班级,分数,排名,当老师告诉AI"小明同学,语文,三班,18分,55名"等信息,AI就会记录到班级排名的表格中,后面你发现小明考了59分,你告诉AI"帮我改一下小明的分数,改成59分",AI就会对数据进行更新。数据库相当于AI可以随时调用改变里面内容的存储空间。
- 知识库: 与之相反,知识库相当于静态储存,只有新增或者删除,比如你下载了好看的小电影,存到硬盘里,要么存一个新电影,要么删除一个新电影,你不可能把电影片段进行更改(举例子哈!有些大神也可以消除马赛克)。
通过这样的类比,我们就清楚他们的使用场景和区别,数据库类似电脑内存,知识库类似电脑硬盘,都是用来存储,一个是电脑可以自己更新,一个是只能人为更新。
coze数据有以下特点:
- 高效创建:可以让AI帮你创建数据库格式,你只需要告诉它你的想法,AI就能帮你把表建好,比如:帮我创建一个班级排名表,里面包含排名,班级,姓名,学号,科目,成绩等信息。
- 多种模式数据库:数据库有多种模式,单用户模式和多用户模式,单用户指一个数据库只能自己存储,比如个人记账AI。多用户模式就是同一个数据库可以多个bot来用,比如刚刚提的班级排名,可以是一个学校一个数据库,一拉全校的排名也出来了,再比如开发一个漂流瓶游戏,所有人的漂流瓶都会记录到多用户数据库中,大家可以随时点开别人的漂流瓶查看里面的信息。
4)图像流
coze图像流可玩性非常高,上手门槛也很低,只需简单的拖拉拽操作,就能快速整理出一个具有确定图像目标的图片处理工具,操作界面类似ComfyUI 工作流,不过上手难度简单许多。
它的功能包括:
- 智能生成: 图像生成:也就是常见的文生图功能,通过自然语言描述生成想要的图片。 图像参考:图生图功能,给AI一个参考图片,让它基于参考图片生成想要的图片。
- 风格模版: 风格滤镜:给照片创建风格化的滤镜,比如毛毡、粘土、积木、美漫、玉石、搞笑涂鸦等风格。 人像风格化:调整人物风格,凸显人物特性,适合人像场景使用。 宠物风格化:与人物风格类似,适合宠物场景使用。
- 智能编辑: 提示词推理:给他一张参考图,让AI推理出图片的提示词,便于复制使用。 提示词优化:对已写的提示词进行优化,让AI更容易理解。 智能换脸:替换图片中的人脸。 背景替换:替换背景。 还有就是光影融合,智能扩图,智能抠图,画质提升,美颜,拉伸修复,透视矫正等等功能,具体怎么用,有什么用,大家可以参考coze官方文档或者上手体验。
- 基础编辑: 基础功能包含裁剪,添加文字,叠图,亮度调节,对比度调节,旋转和缩放。
有伙伴可能会说,这些功能很多App不是都有吗?干嘛还要coze里面学一遍?
这里就说两个点,大家自行体会:
(1)coze中的图像处理是基于AI能力实现,与传统的图像处理原理有所不同,AI基础能力越强,它的效果就越好,可能当前有些能力不能与设计师相提并论,但是AI的迭代速度不是人能跟得上的,因此要学会接受新事物。
(2)coze图像流是集成到coze平台,创建bot的时候,你可以让bot引用图像流,实现bot图像处理的能力,举个例子:
假设某连锁品牌,旗下门店要做个主题活动,需要一张宣传海报。
传统方法要完成这件事,门店要么申报总部,让总部设计部门设计下发,或者门店自己去打印店出钱设计。
如果是用coze Agent来实现,门店只需要告诉bot要什么海报,内容是什么,bot就能按照预设的流程,风格等信息,自动生成一张宣传海报给门店。
过程中不仅不需要人工干预,还能确保设计标准符合总部要求。
5)工作流
与图像流类似,工作流更加适用于更多复杂场景的任务,可以说coze如果没有工作流,那coze的价值将直接降低80分。
AI要实现真实世界工作问题,不仅需要强大的大脑,还需要强大的分解任务能力。
一个任务往往包含非常多的子任务,如果AI不具备一步一步拆解并分步完成任务的能力,那这个AI只能作为闲聊的百科全书。
coze因为有了工作流这个功能,可以说是质的飞跃,也是小侠深入探索,成谜AI的核心原因。
那么到底工作流有什么神奇之处,能够让小侠如此称赞?
先看看工作流的基本配置:
开始节点:表示一个工作启动节点,有了具体需要做的事才有后面产生的结果。
结束节点:一个具体任务完成后输出的结果的地方。
再看看节点类型:
当下发一个任务给AI后,它要完成这个任务,可能需要用到多种工具,红色框里的节点相当于不同的工具。我们只需要给AI配置不同的工具,它就能把这个工具用起来。
- 插件: 和前面提到的插件是一样的,这里不再赘述。
- 大模型节点:可以调用具体模型解决问题,比如标题撰写,就可以单独配置一个撰写标题的大模型。
- 代码节点:通过 IDE 编写代码处理输入参数,并通过自定义代码来返回输出值。
- 知识库节点:和前面提到的知识库是一致的,工作流可以调用知识库返回相关数据。
- 工作流节点:工作流嵌套工作流,实现更复杂的功能。
- 图像流:工作流嵌套图像流,可以执行嵌套子任务。
- 选择器节点:if-else 逻辑节点,链接多个下游分支,设定是/否条件,判断是否运行对应分支。
- 文本处理: 用于处理多个字符串类型变量的格式。
- 消息:支持工作流中间过程的消息输出,支持流式和非流式两种方式。
- 变量:用于读取和写入 AI Bot 中的变量,变量名称必须与机器人中的变量名称相匹配。
- 数据库节点:用于对数据库进行增删改查操作,前提是需要先在 Bot 添加过数据库。
6)多Agent协作
在coze平台上,除了单Agent模式以外,还有多Agent模式,多Agent模式可以更加全面处理更复杂的工作。
首先,单Agent模式设定的bot只能单一解决某个一个问题,比如图片处理bot,你想让这个bot处理文本,又处理图片,不是不能实现,而是目前的AI会容易出现工作任务理解不清导致事情做错的问题。
如何更好解决这种多任务组合的问题?
答案就是多Agent模式,我们可以先制作多个单Agent,每一个Agent都只负责某一个具体工作,比如负责产品介绍的bot,负责处理售后的bot,负责品牌宣传的bot。
将这些bot统统放在多Agent下面,作为一个个独立的员工,在此基础上,配置一个管理者bot,让他根据用户提的问题进行判断,判断出这个问题到底谁的工作内容,谁来服务客户还会更好等等。、
管理bot识别好任务后,就能把具体任务分配给具体bot从而更加高效的完成任务。
多Agent的优势有以下几点:
- 统一管理多个bot,让他们协同工作,避免工作内容冲突。
- 避免多个入口,假设没有多Agent模式,我们要用bot制作海报,就要单独找到制作海报的bot,要写文案就要找写文案的bot,但是有了多Agent模式,只需要一个入口,就能把这些功能集合起来。
- 发挥了AI最大的功效,多Agent模式下���不仅能够发挥出单个Agnet的效果,还能单独调用数据库,插件等等技能。
可以说,平台优化的足够好,多Agent模式就是未来超级AI的基础。
下篇文章我们会提到弼小侠AI基地-学习助理bot,它就是基于多Agent开发的bot,里面包含客服bot,知识助理bot和学习规划bot,这些单bot都是由学习助理bot统一管理,根据用户咨询的信息分配任务。
三、小结
以上是手把手教你用coze打造第一个商用AI客服(上篇)的主要内容,本文主要带大家从零开始认识AI、AI Agent,也认识到Agent的世界价值。
另外也带大家从零开始认识coze这个平台,把平台主要的功能都跟大家讲解了一遍,希望大家通过本文阅读都有所收获。
下一篇,我们将继续分享coze教程,带着大家一起学习如何打造第一个商用AI客服。
感兴趣的伙伴,记得点赞,关注并评论,支持小侠,谢谢。
文章由小侠整理,如需转载或引用,记得联系小侠。