从工程化的角度聊聊为什么 Claude3 还是无法替代开发者

欢迎关注公众号:前端研习圈。内容同步发布哦~

大家好,欢迎来到前端研习圈。今天我们来聊聊 Claude3

Claude3 简介

最近大家应该都看到了这张图,Anthropic 发布了 Claude3,其中包括了 3 个版本 - Opus, Sonnet, Haiku

从各项指标来看

  • Opus 已经全面超越了 GPT4,但这是一个付费版本
  • Sonnet 与 GPT4 各有优劣,但和 GPT3.5 相比就是碾压之势了,并且是免费版本
  • Haiku 也有部分指标逼近 GPT4,整体还是 GPT4 更占优势。但这个版本官方似乎没有在 试用站 中开放出来

TIPS

Anthropic是一家专注于发展高水平人工智能技术的公司,由前OpenAI研究员Dario Amodei、Paul Christiano和其他一些人工智能专家于2021年创立。该公司的愿景是开发出真正安全、符合人类价值观的人工智能系统。

使用体验

既然 Claude3 这么强大,那我们必然要来体验一下了,由于 Opus 是付费版本,我们就只能用 Sonnet 了(合理规避开销)

这里我们提一个语音采集+识别的需求

现在帮我实现一个需求,需要一个 web应用 和 一个 python服务端

  • web应用使用 React 和 antd 实现一个基于 webRTC 的语音采集功能,页面上需要有一个按钮用来控制录音;一个列表用来记录每次录音后调用 python 服务识别语音后返回的识别内容
  • python服务端用 fastAPI 实现一个 audioToText 接口,用于语音转文本,识别模型采用 whisper

在这段需求中,我们描述了需要实现的功能以及对技术栈的要求,整体描述得比较随意,没有做详细的拆解

接下来丢给 Claude3 看看它的表现,通过下图我们可以看到对于这种较为笼统的需求,Claude3 回复不能实现完整的代码,只能给出实现步骤和指导性的代码

首先它给出如何创建项目以及安装依赖,这里没什么问题,使用了 React 的官方脚手架来生成项目,是可采纳的方案

对于前端部分的实现代码,以它给出的录音组件为例,整体上来说也没有什么问题,放到项目中可以直接运行,功能也符合要求。以下是部分截图

同样的问题和 通义千问 相比,Claude3 优势在于它正确使用 antd 的组件来实现了我们的需求

通义千问 只有部分正确,列表部分使用了原生的 ul/li

python 部分,接口实现没有问题,但逻辑部分存在明显的错误,调用 whisper 语音识别部分的入参不对,需要人工增加部分逻辑后才能使用

通过上面的使用,我们发现对于笼统的需求描述,Claude3 能帮我们完成的部分是

  • 组件级别的代码实现
  • 接口级别的参考实现

综上来看,claude3 sonnet 对比 通义千问,GPT3.5 有明显的提升,但从使用上来说,还是处在帮助我们提升开发效率的阶段,并不足以取代人

开发者将与 AI 共存

同时,我们提问都知道, 要想得到准确的回答,那么描述就需要越详细,越专业,为了尽可能让 AI 生成与预期相符的代码,如何将日常需求转述为专业术语,这件事也只能由程序员来做,最终在写代码这件事上,AI开发者 还得相爱相杀

并且 AI 写出来的代码也需要审核,能不能用,质量如何都需要人来判断,而且审核人所具备的编码能力,知识储备一定是要高于实现所提需求需要的能力的,否则 AI 一顿操作写了一堆代码,结果看的人能力不够看不明白,拿去使用出了问题,可能最终也是一脸懵逼

并且上升到 工程化,项目管理 的角度,肯定是 程序员 大于 AI,为什么这么说,听我细细狡辩

首先 AI 目前最大的弊端在于,根据一个需求生成代码的过程是从 0 到 1 的,也就是一锤子买卖。这意味着每当你修改提示词后从新生成代码,都会和之前有所不同。

可能有人会说这有什么关系,我只关注最终结果。

而我的回答是,但凡参与过大型项目开发的同学都知道,需求变更,功能迭代都是家常便饭,最初项目中的代码可能都是由 AI 生成,然后人工 组织 好的,但随着项目的不断迭代,慢慢就会出现很多小功能点的改动,不管是人为改动还是通过 AI 修改的,当再次出现新需求时,你都不能通过改动最初的提示词来加入新功能,否则代码全部重新生成,以前所有的小改动都将丢失。

甚至可能因为提示词的变更,重新生成的代码也都变了样,这样 高昂 的维护成本显然是不能接受的。

并且一个功能点变更,往往需要同时修改几处文件中的内容,这样分散的处理场景也是目前 AIGC 的短板,因此最终还是需要 开发者 介入

基于上述分析,在工程化方面,我始终认为在 AI 能独立完成从 需求 -> 编码 -> 运维 这条链路之前,将始终扮演开发者强有力的 生产力工具 一角

相关推荐
u0104058364 分钟前
构建可扩展的Java Web应用架构
java·前端·架构
程序员三木18 分钟前
[AIGC] ClickHouse的表引擎介绍
clickhouse·aigc
swimxu1 小时前
npm 淘宝镜像证书过期,错误信息 Could not retrieve https://npm.taobao.org/mirrors/node/latest
前端·npm·node.js
Wincyfu1 小时前
FuTalk设计周刊-Vol.064
人工智能·ui·aigc
qq_332394201 小时前
pnpm的坑
前端·vue·pnpm
雾岛听风来1 小时前
前端开发 如何高效落地 Design Token
前端
不如吃茶去1 小时前
一文搞懂React Hooks闭包问题
前端·javascript·react.js
alwn1 小时前
新知识get,vue3是如何实现在style中使用响应式变量?
前端
来之梦1 小时前
uniapp中 uni.previewImage用法
前端·javascript·uni-app
野猪佩奇0071 小时前
uni-app使用ucharts地图,自定义Tooltip鼠标悬浮显示内容并且根据@getIndex点击事件获取点击的地区下标和地区名
前端·javascript·vue.js·uni-app·echarts·ucharts