coze 可以用来创建简单的应用啦,这样测试起来会比原本的 Agent 更加方便,我们来看看如何创建一个"语音Real不Real"的应用。这个应用就是来检测语音是否是伪造的,克隆或者是合成的。先看下原本 Agent 的样子:
深度伪造语音检测,其实只要设置 app 和 语音路径,但是选择及输入其实还是有一些麻烦,所以创建一个简单的应用来测试或者给内部使用都是一个很方便的选择。
创建应用
左上角的加号,原本是创建智能体,现在是可以选择应用了。
进入应用后,会分为业务逻辑和用户界面,相当于后端逻辑跟前端逻辑。前端负责UI,后端负责逻辑。要创建一个应用其实跟创建一个 Agent 的逻辑是类似的,只不过是 UI 更加直观。
业务逻辑的组成部分,主要是工作流、插件和数据,当然设置里面的会话管理和变量也是可以使用的,相当于代码里面的全局变量还有状态管理。
用户界面就可以理解为是低代码创建可视化界面。
选择工作流
工作流可以直接创建,也可以从创建好的资源里面选择,这边我们选择的是已经发布的 speech_deep_fake_detect 这个工作流。
选择完之后,我们就可以去界面那边设计,然后选择某个按钮触发逻辑,最后展示出来。
用户界面
coze 还是提供了挺多的组件供选择,这边可能之前一点都没有接触过前端设计的同学会有点不适应,不知道组件如何使用,以及如何把结果进行赋值。我们在这边,简单讲一下选择的组件以及组件的用法。
应用Title
应用 title 模块直接用的是模板里面的样式,直接拖进来,然后去修改文本框里面的内容。
点击右侧的内容就可以修改展示的信息。注意,右侧上方的 Text7
表示是这个组件的名称,可以理解为对象名称。
文本输入
原本想要通过文件上传组件来实现语音上传,但是这个组件只允许文本文件以及图片文件,不允许音频文件。这点倒是有些奇怪,在创建 Agent 里面选择文件的话,是可以上传语音的。
所以,后面选择通过文本输入的方式,输入可以访问的语音连接,来给后面工作流调用
选择按钮
我们要通过工作流来触发业务逻辑,当然就要有个地方来触发,按钮就是常见的触发器。添加按钮就是拖动左侧组件,到中间画布区。
既然是触发,当然要设置事件,就是右侧属性旁边的事件。
事件可以选择点击时和加载时:
- 点击时可以执行的动作:调用工作流、页面跳转、展示提示信息、控制组件
- 加载时可以执行的动作:调用工作流、展示提示信息
我们的目的就是在点击的时候,调用工作流,所以我们选择点击时执行调用工作流。
- 选择我们刚才加到业务逻辑里面的工作流
- 设置入参配置,入参配置可以是直接填写,也可以是通过输入到组件里面的值来获取。这里注意,使用组件赋值的时候,不是只填一个组件名称,而是要选择组件的value,即如图的 Textarea1.value,不然取到的是一个对象。
想要引用系统里面的变量或者组件的值、工作流的值,通过输入 {{ }} 会弹出一个下来选择框来选择
这样我们触发工作流的逻辑就配置好了,因为我们的接口可能需要一点时间,所以需要有个地方告诉使用者正常执行中。因此,我们再加一个点击事件,来控制一个文本框里面展示的内容。这个文本框,即可以用来展示最后识别的结果,也可以同时用来展示进度过程。
就是下面的 Text5,Text5 的内容,可以直接引用工作流的结果,{{speech_deep_fake_detect.data}}。
我们上面说到用这个文本框来展示处理状态怎么做呢,就是在点击按钮的时候,修改这个组件的展示内容。
这样子我们的前端设计,以及前后端逻辑的构建就做好了,在发布之前,可以通过预览按钮来测试一下我们设计好的页面。
预览
coze 的组件都是有自适应样式的(当然前端的组件需要修改),我们可以看下选择一个语音链接,然后测试一下,当然伪造检测结果可以直接看到是个伪造的。
这是应用链接:Real不Real
这是资源链接:快商通AI开放平台coze插件
欢迎大家来尝试~