欢迎关注公众号:前端研习圈。内容同步发布哦~
大家好,欢迎来到前端研习圈。今天我们来聊聊 Claude3
Claude3 简介
最近大家应该都看到了这张图,Anthropic
发布了 Claude3,其中包括了 3 个版本 - Opus, Sonnet, Haiku
从各项指标来看
- Opus 已经全面超越了 GPT4,但这是一个付费版本
- Sonnet 与 GPT4 各有优劣,但和 GPT3.5 相比就是碾压之势了,并且是免费版本
- Haiku 也有部分指标逼近 GPT4,整体还是 GPT4 更占优势。但这个版本官方似乎没有在
试用站
中开放出来
TIPS
Anthropic是一家专注于发展高水平人工智能技术的公司,由前OpenAI研究员Dario Amodei、Paul Christiano和其他一些人工智能专家于2021年创立。该公司的愿景是开发出真正安全、符合人类价值观的人工智能系统。
使用体验
既然 Claude3 这么强大,那我们必然要来体验一下了,由于 Opus
是付费版本,我们就只能用 Sonnet
了(合理规避开销)
这里我们提一个语音采集+识别的需求
现在帮我实现一个需求,需要一个 web应用 和 一个 python服务端
- web应用使用 React 和 antd 实现一个基于 webRTC 的语音采集功能,页面上需要有一个按钮用来控制录音;一个列表用来记录每次录音后调用 python 服务识别语音后返回的识别内容
- python服务端用 fastAPI 实现一个 audioToText 接口,用于语音转文本,识别模型采用 whisper
在这段需求中,我们描述了需要实现的功能以及对技术栈的要求,整体描述得比较随意,没有做详细的拆解
接下来丢给 Claude3 看看它的表现,通过下图我们可以看到对于这种较为笼统
的需求,Claude3 回复不能实现完整的代码,只能给出实现步骤和指导性的代码
首先它给出如何创建项目
以及安装依赖
,这里没什么问题,使用了 React 的官方脚手架来生成项目,是可采纳的方案
对于前端部分的实现代码,以它给出的录音组件
为例,整体上来说也没有什么问题,放到项目中可以直接运行,功能
也符合要求。以下是部分截图
同样的问题和 通义千问
相比,Claude3 优势在于它正确使用 antd 的组件来实现了我们的需求
而 通义千问
只有部分正确,列表部分使用了原生的 ul/li
python 部分,接口实现没有问题,但逻辑部分存在明显的错误
,调用 whisper 语音识别部分的入参不对,需要人工
增加部分逻辑后才能使用
通过上面的使用,我们发现对于笼统的需求描述,Claude3 能帮我们完成的部分是
组件级别
的代码实现接口级别
的参考实现
综上来看,claude3 sonnet 对比 通义千问
,GPT3.5 有明显的提升,但从使用上来说,还是处在帮助我们提升开发效率的阶段,并不足以取代人
开发者将与 AI 共存
同时,我们提问都知道, 要想得到准确的回答,那么描述就需要越详细,越专业,为了尽可能让 AI
生成与预期相符的代码,如何将日常需求转述为专业术语,这件事也只能由程序员来做,最终在写代码这件事上,AI
与 开发者
还得相爱相杀
并且 AI
写出来的代码也需要审核,能不能用,质量如何都需要人来判断,而且审核人
所具备的编码能力,知识储备一定是要高于实现所提需求需要的能力的,否则 AI
一顿操作写了一堆代码,结果看的人能力不够看不明白,拿去使用出了问题,可能最终也是一脸懵逼
并且上升到 工程化,项目管理 的角度,肯定是 程序员
大于 AI
,为什么这么说,听我细细狡辩
首先 AI
目前最大的弊端在于,根据一个需求生成代码的过程是从 0 到 1 的,也就是一锤子买卖
。这意味着每当你修改提示词后从新生成代码,都会和之前有所不同。
可能有人会说这有什么关系,我只关注最终结果。
而我的回答是,但凡参与过大型项目开发的同学都知道,需求变更,功能迭代都是家常便饭,最初项目中的代码可能都是由 AI
生成,然后人工 组织
好的,但随着项目的不断迭代,慢慢就会出现很多小功能点的改动,不管是人为改动还是通过 AI
修改的,当再次出现新需求时,你都不能通过改动最初的提示词来加入新功能
,否则代码全部重新生成,以前所有的小改动都将丢失。
甚至可能因为提示词的变更,重新生成的代码也都变了样,这样 高昂
的维护成本显然是不能接受的。
并且一个功能点变更,往往需要同时修改几处文件中的内容,这样分散的处理场景也是目前 AIGC
的短板,因此最终还是需要 开发者
介入
基于上述分析,在工程化方面,我始终认为在 AI
能独立完成从 需求 -> 编码 -> 运维
这条链路之前,将始终扮演开发者强有力的 生产力工具
一角