🌟 爆炸性新闻! 在这个科技飞速发展的时代,AI的每一次进步都让我们惊叹不已。而今,Claude 3.5的横空出世,更是让我们看到了AI领域的一次革命性突破。这不仅仅是一次简单的版本更新,这是AI在模拟人类操作电脑方面迈出的一大步。Claude 3.5不仅能够查看屏幕、移动光标、点击按钮、输入文本,还能查找代码错误、自动搜集信息填表。这是否意味着AI推理的瓶颈已被突破,我们即将迎来AI操作电脑的新纪元?
Claude 3.5:深夜升级,功能惊艳
在Anthropic AI的深夜升级中,Claude 3.5以两个版本------Claude 3.5 Haiku和Claude 3.5 Sonnet------亮相。这次升级不仅在性能上全面超越了之前的版本,更是在编码能力上取得了业界领先的成就。Claude 3.5 Sonnet在推理模型中的卓越表现,一举击溃了OpenAI的o1,成为了目前最强的推理模型。
更令人惊艳的是,Claude现在能够模拟人类操作计算机。这不仅是人机交互的新范式,也是AI模型应该具备的新基础能力。这一功能的引入,使得许多做浏览器智能体的初创公司一夜之间显得过时。
会使用电脑的AI:Claude 3.5 Sonnet
Claude 3.5 Sonnet是首个在公测中提供计算机使用功能的模型。尽管这项功能仍处于实验阶段,但它已经能够完成一系列复杂的任务,如搜索信息、查找距离、安排日程等。这些任务的完成,展示了AI在操作电脑方面的潜力。
在演示中,Claude展示了如何使用浏览器、地图、日历等常用软件,甚至能够自动编码写网站。这些操作的实现,不仅提高了工作效率,也为AI的未来发展打开了新的可能性。
编码能力:Claude 3.5 Sonnet的王者地位
在编码能力方面,Claude 3.5 Sonnet在SWE-bench Verified测试中的性能从33.4%大幅提升至49.0%,超越了所有公开可用的模型,包括OpenAI的o1-preview。在TAU-bench测试中,Claude 3.5 Sonnet也表现出色,无论是在零售领域还是更具挑战性的航空领域,都取得了显著的成绩。
这些成绩的取得,不仅证明了Claude 3.5 Sonnet在智能体编码、工具使用任务中的突破,也展示了其在AI驱动编码领域的"质"的飞跃。
Claude 3.5 Haiku:性能全面提升
Claude 3.5 Haiku作为速度最快的模型,不仅保持了与上一代相同的运行成本和处理速度,还在各项技能上全面提升。在编码任务上,Claude 3.5 Haiku的表现尤为卓越,超越了许多使用公开可用的最先进模型的AI智能体。
Claude 3.5 Haiku的低延迟响应、精准的指令执行能力和准确的工具使用,使其成为面向用户的产品开发、专门的子智能体任务处理、基于海量数据生成个性化体验的理想选择。
教会Claude操作电脑:未来的AI开发新方向
Anthropic表示,人类轻松执行的操作------滚动、拖拽、缩放,目前对Claude来说仍然很有挑战性。而对于垃圾邮件、虚假信息、欺诈这类风险,公司正在寻找安全部署的策略,比如开发了识别系统,检测是否发生危害。
在工具使用和多模态的工作基础上,Claude还需要推理如何以及何时根据屏幕内容执行操作。为此,研究者训练Claude准确计算像素,从而完成命令,因为它必须计算出需要垂直或水平移动鼠标指针多少像素,才能点击正确的位置。
结语
Claude 3.5的发布,不仅是一次技术的升级,更是AI发展史上的一次革命。AI操作电脑的能力,将为软件开发、数据分析、智能对话系统等多个领域带来深远的影响。随着技术的不断进步,我们有理由相信,AI将在未来的计算机操作中发挥越来越重要的作用。
🌟 想要亲身体验Claude 3.5的强大功能吗? 赶快访问Anthropic的官方博客,开始你的AI操作电脑之旅吧!
记得关注我们,获取更多AI的最新资讯!#Claude3.5# #AI操作电脑# #编程革命#
BuluAI算力平台已上线,详情请进入官网https://www.buluai.cn/home/index详细了解吧!!!!!