第三个类型就是让模型做信息的转化
最直观的例子就是翻译
去翻译英文,它的效果都非常好
除此之外,给大家举一个让大模型翻译代码的例子,
还有就是让大模型写代码的
这是一个数据分析场景,其实数据分析场景一直追求的就是一个积极分析,让每个人都成为分析师,这也是这个领域一直在追求的一个效果。
那真正能够做到让每个人都是分析师,通过什么样的方式呢,那通过什么方式呢,那现在从我们看来在大模型时代,通过自然语言的方式让它去生成可执行的sql,是一个非常有效的方式
那我觉得整体的价值就是让写代码这件事情变得不再是一个特别转的技能,普惠化,让每个人都能像程序员那样去写一些代码
这样的好处相当于让大家也掌握了一门更多的语言,而这个语言呢,它不是人与人之间交流的语言,而是人与机器之间交流的语言。我们可以通过遮掩更多语言,可以增加与物理世界互动的一个新的渠道、通道。
最后一个类型就是agent
这也是大模型能够做到的一个能力
它做到的事情就不像刚才讲到的三类,是信息之间的变化,而是通过agent这样一套模型的能力,再加上外围的一个技能架构,可以让大模型去完成一个整体的任务。也就是把任务背后的若干个工作都给做好了。
这里面比如说智能工单系统
这里面给大家举一个具体的场景,也就是智能导购系统
通过我们在前端构建一个用户和机器的聊天的一个交互界面,背后呢我们把丰富的接口,商品搜索的接口,下订单的接口,都链接起来,让用户在和大模型对话的过程中就把各种后端各种的工具都执行了。
完成了我们用户的一个闭环的任务。这就是目前agent能做到的一个效果。
这里面的一个价值是让模型把丰富的api充分利用起来,这样的话我们每个人都可以构建完成自己小领域、垂直小领域的一个agent的机器人,然后调用平台各种开放的工具去完成自己想要去完成的一个特定任务。
这个就是就是给大家通用讲一下模型在这里面能发挥怎么样的价值。
刚才讲的这些大模型的能力,其实想要去落地,那我们一般来讲的,可以分为两个环节
左侧是在模型这一侧
那模型这一侧的话,其实想要他落地,刚才这些能力就是让模型学会它领域的知识,这里面包含预训练环节、微调环节和指令工程环节
右侧是在产品应用这一侧
然后更进一步,到了这个具体的场景当中
我们可以通过微调和指令工程这两个方式然后去调动大模型的能力,去解决具体的业务问题
那微调和指令工程的差别其实就是
我们微调这个环节我们可以通过比较多一点的监督性的语言,然后去改变模型的参数,然后让它在具体的这个事情上做的更充分
指令工程这个事情,其实我们对于简单的任务就可能不需要微调模型,我们只需要把指令写好,然后让模型在指令里面给一些具体的要求,或者是一些fewshot,然后让模型在这个具体的环节,场景中的任务上做的比较好。
如果通过工程化的方式写好指令呢?
那我们先来讲讲原则和原理
原则有两个方面:
原则1:清晰具体
原则2:给模型思考的路径
我们需要把模型做这个事情,解决这个问题,所需要思考的过程
也就是如果你要解决这个,你的思考过程
尽可能的详细、具体的讲清楚
开头的时候通过要提及
如何获取到岗位信息的,然后在中间描述你的哪些经验和这个岗位是匹配的
结尾表示对这个描绘的期待
告诉我如果要完成这个事情,我该怎么去做
其实很多事情,你自己就有你自己的思路,你有你自己独到的思考逻辑,你只需要把你独到的思考逻辑转化成文字,然后放入到指令里面,再引导大模型,相当于通过自然语言的描述方式,给模型演示你解决这个问题的思考逻辑。