Claude 3.5学习使用电脑,就像给人装上翅膀练习飞翔

凌晨醒来,AI圈终于有大事发生。否则沉寂太久,大家都不知道写什么了。今天早上,"革命"、"大事"、"颠覆",又要刷屏了。

简单谈下这次更新。

首先,最让我兴奋的是Claude 3.5 Sonnet的更新,据说更新后的 Claude 3.5 Sonnet 编码方面,它将 SWE-bench Verified 的性能从 33.4% 提高到 49.0%,得分高于所有公开可用的模型,包括 OpenAI o1-preview 。

我一直在使用cursor,我现在95%以上的代码都是AI写的,Claude 3.5、gpt-4o、o1都会使用,对他们的水平是有直接体感的。对于Claude宣传的进步,我还是充满期待的,早上看了下,cursor果然已经更新,迫不及待想写代码了。

之前的o1除了贵和慢,写代码是真的强,不知道新的Sonnet能否真正的超越o1。

另外一个令行业兴奋的大更新,是Claude开发了一个API,通过这个API,Claude 能够感知计算机界面并操作电脑。

这个功能确实比较新颖,而且也有一定的实用性,能够将人解放出来,但是我不是很看好这个功能,单纯从产品看(先抛开技术进步),我认为它短期没有什么价值,长期没有大价值,​中期可能会有些价值。

短期看,现在的操作成功率还是非常低,根据官网的数据,Claude 3.5 Sonnet 在屏幕截图类别任务中得分最高,也才是 14.9%。可能在非常垂直的小场景中能发挥价值,很难​大规模使用。

长期看,AI和数字世界交互的方式,肯定不是​像人一样使用电脑去交互。这就是我认为的,Claude 3.5学习使用电脑,就像是给人装上翅膀来练习飞翔 。现在我们都知道飞翔的底层原理是空气动力学,AI和数字世界交互的"空气动力学",是AI直接通过协议​和数字世界交互,而不是UI。​这才是最高效,也是AI最擅长的方式

中期看,数字世界的改造还需要很长时间,如果AI操作电脑的准确率提高到一个可以​解决人们问题的水平,这个功能还是有一定的价值的。问题这是在于适用范围,以及​能够发挥价值的时间有多长。


最后,对整个AI行业比较好的一件事情是,参与者在交替领先,现在可以等待OpenAI的​产品发布了。​

相关推荐
长空任鸟飞_阿康3 分钟前
Node.js 核心模块详解:fs 模块原理与应用
前端·人工智能·ai·node.js
可触的未来,发芽的智生8 分钟前
触摸未来2025-10-18:生成文字的小宇宙矩阵溯源
人工智能·python·神经网络·程序人生·自然语言处理
武子康16 分钟前
AI-调查研究-106-具身智能 机器人学习数据采集工具和手段:传感器、API、遥操作、仿真与真人示教全流程
人工智能·深度学习·机器学习·ai·系统架构·机器人·具身智能
Python智慧行囊19 分钟前
图像处理-opencv(一)
人工智能·opencv·计算机视觉
StarPrayers.32 分钟前
损失函数(Loss Function)、反向传播(Backward Propagation)和优化器(Optimizer)学习笔记
人工智能·笔记·深度学习·学习
IT_陈寒37 分钟前
Vite 5个隐藏技巧让你的项目构建速度提升50%,第3个太香了!
前端·人工智能·后端
孤廖40 分钟前
吃透 C++ 栈和队列:stack/queue/priority_queue 用法 + 模拟 + STL 标准实现对比
java·开发语言·数据结构·c++·人工智能·深度学习·算法
麦麦麦造1 小时前
有了 MCP,为什么Claude 还要推出 Skills?
人工智能·aigc·ai编程
jerryinwuhan1 小时前
利用舵机实现机器人行走
人工智能·机器人
武子康1 小时前
AI-调查研究-107-具身智能 强化学习与机器人训练数据格式解析:从状态-动作对到多模态轨迹标准
人工智能·深度学习·机器学习·ai·系统架构·机器人·具身智能