从工程化的角度聊聊为什么 Claude3 还是无法替代开发者

欢迎关注公众号:前端研习圈。内容同步发布哦~

大家好,欢迎来到前端研习圈。今天我们来聊聊 Claude3

Claude3 简介

最近大家应该都看到了这张图,Anthropic 发布了 Claude3,其中包括了 3 个版本 - Opus, Sonnet, Haiku

从各项指标来看

  • Opus 已经全面超越了 GPT4,但这是一个付费版本
  • Sonnet 与 GPT4 各有优劣,但和 GPT3.5 相比就是碾压之势了,并且是免费版本
  • Haiku 也有部分指标逼近 GPT4,整体还是 GPT4 更占优势。但这个版本官方似乎没有在 试用站 中开放出来

TIPS

Anthropic是一家专注于发展高水平人工智能技术的公司,由前OpenAI研究员Dario Amodei、Paul Christiano和其他一些人工智能专家于2021年创立。该公司的愿景是开发出真正安全、符合人类价值观的人工智能系统。

使用体验

既然 Claude3 这么强大,那我们必然要来体验一下了,由于 Opus 是付费版本,我们就只能用 Sonnet 了(合理规避开销)

这里我们提一个语音采集+识别的需求

现在帮我实现一个需求,需要一个 web应用 和 一个 python服务端

  • web应用使用 React 和 antd 实现一个基于 webRTC 的语音采集功能,页面上需要有一个按钮用来控制录音;一个列表用来记录每次录音后调用 python 服务识别语音后返回的识别内容
  • python服务端用 fastAPI 实现一个 audioToText 接口,用于语音转文本,识别模型采用 whisper

在这段需求中,我们描述了需要实现的功能以及对技术栈的要求,整体描述得比较随意,没有做详细的拆解

接下来丢给 Claude3 看看它的表现,通过下图我们可以看到对于这种较为笼统的需求,Claude3 回复不能实现完整的代码,只能给出实现步骤和指导性的代码

首先它给出如何创建项目以及安装依赖,这里没什么问题,使用了 React 的官方脚手架来生成项目,是可采纳的方案

对于前端部分的实现代码,以它给出的录音组件为例,整体上来说也没有什么问题,放到项目中可以直接运行,功能也符合要求。以下是部分截图

同样的问题和 通义千问 相比,Claude3 优势在于它正确使用 antd 的组件来实现了我们的需求

通义千问 只有部分正确,列表部分使用了原生的 ul/li

python 部分,接口实现没有问题,但逻辑部分存在明显的错误,调用 whisper 语音识别部分的入参不对,需要人工增加部分逻辑后才能使用

通过上面的使用,我们发现对于笼统的需求描述,Claude3 能帮我们完成的部分是

  • 组件级别的代码实现
  • 接口级别的参考实现

综上来看,claude3 sonnet 对比 通义千问,GPT3.5 有明显的提升,但从使用上来说,还是处在帮助我们提升开发效率的阶段,并不足以取代人

开发者将与 AI 共存

同时,我们提问都知道, 要想得到准确的回答,那么描述就需要越详细,越专业,为了尽可能让 AI 生成与预期相符的代码,如何将日常需求转述为专业术语,这件事也只能由程序员来做,最终在写代码这件事上,AI开发者 还得相爱相杀

并且 AI 写出来的代码也需要审核,能不能用,质量如何都需要人来判断,而且审核人所具备的编码能力,知识储备一定是要高于实现所提需求需要的能力的,否则 AI 一顿操作写了一堆代码,结果看的人能力不够看不明白,拿去使用出了问题,可能最终也是一脸懵逼

并且上升到 工程化,项目管理 的角度,肯定是 程序员 大于 AI,为什么这么说,听我细细狡辩

首先 AI 目前最大的弊端在于,根据一个需求生成代码的过程是从 0 到 1 的,也就是一锤子买卖。这意味着每当你修改提示词后从新生成代码,都会和之前有所不同。

可能有人会说这有什么关系,我只关注最终结果。

而我的回答是,但凡参与过大型项目开发的同学都知道,需求变更,功能迭代都是家常便饭,最初项目中的代码可能都是由 AI 生成,然后人工 组织 好的,但随着项目的不断迭代,慢慢就会出现很多小功能点的改动,不管是人为改动还是通过 AI 修改的,当再次出现新需求时,你都不能通过改动最初的提示词来加入新功能,否则代码全部重新生成,以前所有的小改动都将丢失。

甚至可能因为提示词的变更,重新生成的代码也都变了样,这样 高昂 的维护成本显然是不能接受的。

并且一个功能点变更,往往需要同时修改几处文件中的内容,这样分散的处理场景也是目前 AIGC 的短板,因此最终还是需要 开发者 介入

基于上述分析,在工程化方面,我始终认为在 AI 能独立完成从 需求 -> 编码 -> 运维 这条链路之前,将始终扮演开发者强有力的 生产力工具 一角

相关推荐
EnCi Zheng18 分钟前
M5-markconv自定义CSS样式指南 [特殊字符]
前端·css·python
kyriewen22 分钟前
你的网页慢,用户不说直接走——前端性能监控教你“读心术”
前端·性能优化·监控
广州华水科技23 分钟前
北斗GNSS变形监测在大坝安全监测中的应用与优势分析
前端
前端老石人34 分钟前
前端开发中的 URL 完全指南
开发语言·前端·javascript·css·html
CAE虚拟与现实35 分钟前
五一假期闲来无事,来个前段、后端的说明吧
前端·后端·vtk·three.js·前后端
Sarvartha1 小时前
三目运算符
linux·服务器·前端
晓晨的博客1 小时前
ROS1录制的bag包转换为ROS2格式
前端·chrome
Wect1 小时前
LeetCode 72. 编辑距离:动态规划经典题解
前端·算法·typescript
donecoding1 小时前
别再让 pnpm 跟着 nvm 跑了!独立安装终极指南
前端·node.js·前端工程化
AI趣实验1 小时前
Hermes Agent LLM Wiki + Obsidian Git 免费替代 Obsidian Sync:保姆级配置教程
aigc·agent