谈大模型到Agent应用,火山引擎Force大会开发者论坛详细总结

Datawhale干货

火山引擎Force大会:开发者论坛

如果把时间倒回三年前,跟一个产品经理说"你也可以开发Agent应用",对方多半会以为你在开玩笑。但在12月19日的火山引擎Force大会开发者论坛上,这个曾经的玩笑正在变成现实。

大模型技术的突破,不仅改变了AI的能力边界,更重要的是,它正在重新定义"谁是开发者"。当技术的门槛被一层层拆解,当复杂的底层逻辑被封装成自然语言交互,开发这件事,似乎不再是专业程序员的专属领地。

一个有趣的细节是,这次大会的参会Agent应用------那个帮你完成报名、签到和会议总结的智能助手------就是用AgentKit搭建的。相比传统开发方式,代码量减少了96%,不到70行代码就完成了三个Agent的构建。这种效率革命的背后,是整个开发范式的转变。

从基础设施到创造力释放:火山方舟的"隐身术"

在Agent开发的链条中,最令人头疼的往往不是创意本身,而是那些繁琐的底层技术问题------模型该怎么调用?工具接口如何对接?上下文记忆怎么管理?

火山方舟的思路颇为直接:既然这些问题都是"必答题",那就把它们变成"选择题"。作为一站式大模型服务平台,它做的事情本质上是一种"隐身术"------将复杂的技术细节封装起来,让开发者只需要关注真正有挑战性的部分。

Responses API:多模态时代的新基建

火山方舟推出的 Responses API 有两个关键特点。第一是原生的上下文管理能力,能够轻松支持多轮对话的链式管理,文本、图像等多模态数据都能无缝衔接。当它与缓存能力结合后,命中缓存的上文tokens可以享受很低的折扣,在实际企业应用中整体成本下降幅度可能高达80%。

第二个特点是自主工具调用能力。用户发起单次请求后,API可以自动组合调用多个内置工具或自定义函数,解决更为复杂的Agent任务。

在电商场景中,Responses API 构建的系统结合联网搜索、知识库等工具,实现了从采集、查重到比价的全流程自动化审核,最终帮助齐心集团将业务效率提升了80%,并将错漏率控制在2%以下。

veRL:从内部框架到开源生态

在强化学习领域,火山引擎也在做一件有意思的事情。字节跳动内部开发的veRL强化学习框架,在2024年10月正式开源后,已经有将近460个贡献者在Github上活跃,另有40多个框架和开源库基于veRL原生构建,且大多获得了不错的Star数和Fork数。veRL正在成为颇有影响力的强化学习开源框架之一。

更重要的是,火山方舟正在把veRL产品化,提供更低门槛的强化学习服务体验。开发者只需关注奖励函数、数据闭环等与业务紧密连接的部分,把复杂的工程细节交给平台。

Viking:让Agent真正"懂"你的需求

在上下文管理和知识检索领域,Viking系列产品正在解决一个关键问题:如何让Agent更准确地理解复杂意图?

Viking向量库升级了递进式信息检索方案,先用向量相似度尽量找全可能相关的结果,再用豆包大模型的Rerank方法对召回结果做精细的语义化排序。这让Viking能够处理"找不包含某某元素的图片"这类否定逻辑等以往难以应对的复杂查询。

在Embedding和Rerank模型的支撑下,Viking体系能够处理以往难以应对的复杂查询。比如"找不包含某某元素的图片"这类否定逻辑,传统相似度检索往往会召回包含该元素更多的图片,因为它们在语义上更接近。而升级后的Viking能够准确理解这种反向需求。

Viking记忆库也在持续升级。除了记住纯文本内容,现在还能记住图文等多模态内容。在性能上,通过策略改进实现了关键记忆片段的高度压缩,并能在对话过程中针对性地召回。这些技术改进有效节约了模型输入的Tokens消耗。

此外,火山方舟全面升级"协作奖励计划",向认证企业用户提供每日500万免费tokens、个人用户每日200万免费tokens,助力开发者更快、更好构建Agent。传送门:https://www.volcengine.com/docs/82379/1391869

8分钟的魔法:AgentKit现场演示背后的工程哲学

论坛上最令人印象深刻的环节,莫过于AgentKit的现场live demo------8分钟内,从零开始开发一个能生图、能生视频的AI Agent,并完成打包部署和构建观测。

演示从一个空白环境开始。通过veADK,用几行命令创建应用、定义Agent的基本元素(名称、描述、提示词、模型选择),然后引入工具类。当开发者选择豆包1.8作为模型,并配置好生图生视频工具后,Agent就已经能够开始工作了------接收"生成上海东方明珠视频"的指令,自动调用相应工具,完成创作任务。

更神奇的是部署环节。AgentKit提供的一键部署命令,会自动完成一系列复杂操作:构建本地TOS对象、在云端进行CI/CD、创建角色和权限、生成API Key、启动Runtime环境。整个过程大约1分20秒,开发者无需关心底层的服务器配置、容器编排、网络设置等繁琐细节。

这不是魔术,而是模块化设计带来的效率革命。AgentKit 侧重于"企业级系统集成"和"专业开发者的深度定制",为了让现有的复杂系统Agent化而诞生。它将开发、部署、运维、调优各个阶段需要的能力,拆解成八个独立模块:身份认证、运行时、云沙箱、网关、记忆库、可观测性、评测、安全围栏......就像搭积木一样,开发者可以根据需求灵活组合。

AgentKit架构图

更值得关注的是AgentKit的"渐进式改造"理念。对于企业来说,推倒重来的成本太高。AgentKit提供的是一条渐进式的智能化路径。

企业最头疼的问题之一,就是那些堆积如山的老系统、老接口。它们可能是十年前写的,文档早就找不到了,但业务还离不开它们。AgentKit Gateway做的事情很直接------把这些"哑巴"接口变成Agent能听懂、能调用的工具。依托字节内部5000+微服务治理经验,只需要零代码或少量代码就能完成转换。

更关键的是,Gateway内置了一个"智能搜索"功能。就像给Agent配了个聪明的助手------即使企业有成百上千个API,即使模型偶尔"犯糊涂",这个助手也能快速找到最合适的那个,大大提升调用的准确度。

企业的数据和知识往往散落各处:有的在数据库里,有的在文档系统中,有的甚至只存在于老员工的脑子里。AgentKit的Memory和Knowledge做的,就是把这些资源整合成Agent能直接调用的"知识底座"。这套能力与头条、抖音、豆包同源,在亿级用户场景中久经考验。

权限管理可能是企业里最复杂的事情之一------谁能看什么数据,谁能执行什么操作,一旦出错后果严重。AgentKit Identity能够把企业既有的用户管理、权限体系无缝接入,确保每个Agent都有明确的权限边界,实现零信任的身份控制。

有了工具、知识和权限,还需要一个稳定的运行环境。AgentKit Runtime、Sandbox和Gateway可以分钟级搭建数十万实例,配合启动时的严格管控,以及新发布的Skills产品化技能,让Agent不只是个"Demo",而是真正能在生产环境中稳定运行的系统。

但渐进式改造不是终点。它是比较务实的选择,但不是最终形态。真正的Agent-Native应用,不以流程为中心,不以界面为中心,而是以目标驱动,通过能力组合完成任务。就像田涛涛在演讲中强调的:"Think Like An Agent, Build Like a System"------模型只是大脑,而工程体系决定它能不能成为一个长期可以工作、可以信赖的系统。

Vibe Coding:当开发变成一场对话

如果说火山方舟和AgentKit解决的是"能不能做"的问题,那么扣子编程关注的就是"怎么做更爽"。

在本次火山引擎 Force 原动力大会上,扣子负责人宣布"扣子开发平台"升级为"扣子编程",进化为了一个真正释放开发者创造力的原生平台。

最近最火的"Vibe Coding",即通过自然语言对话来构建智能体、工作流乃至全栈应用------扣子编程给出了自己的实战级答案。基于过去2年服务千万级业务场景的积累,扣子编程打造了四大核心功能:

Vibe Agent 让你只需把需求告诉扣子编程,Agent就可以自己装知识库,甚至自己给自己开发工具。现场演示的数据分析Agent和SEO专家Agent,都是10分钟左右就能搭建完成的。

Vibe Workflow 的产物依然可以看到整个工作流的可视化流程,并且可以分节点进行调试和修改。电商图片处理工作流等典型场景,通过描述需求就能快速自动生成。

Vibe App 让你只需要把想法传达给扣子编程,它就会自动生成适配不同终端的界面和逻辑。现场演示的数据可视化大屏,产品经理通过自然语言和两三轮对话就能完成。

Vibe Infra 则是本次升级中最值得关注的新能力。它打破了从开发到上线之间的最后一道屏障------基础设施配置。

传统开发中,写完代码只是第一步,后续还要购买服务器、配置环境、设置域名、部署应用,这些繁琐的运维工作往往让很多好想法止步于"Demo"阶段。

Vibe Infra 结合火山引擎的云计算基础设施,将整个部署流程简化为"一键发布"。

从服务器资源自动分配、容器环境自动配置,到应用打包部署、域名和证书自动绑定,开发者不需要离开扣子编程的界面,就能让应用真正跑在生产环境中。

Vibe Infra 的推出,让"人人都能发布应用"从理想变成了现实。

当 AI Coding 遇上企业级需求:TRAE CN 企业版推出

如果把视角切换到企业研发场景,AI Coding已经从"可选项"变成了"必选项"。但企业拥抱AI Coding并不容易,稳定性、适配性、管理复杂度、安全风险,每一个问题都可能成为拦路虎。

也就是在这样的背景下,大会上发布的TRAE CN企业版,透露出火山引擎正在认真审视企业客户的深层需求。个人开发者用 AI 写代码,可能更关注"快不快""好不好用"。但企业要考虑的问题复杂得多------那可能是庞大的代码库、数十个团队的协作,以及一堆历史包袱。

针对这些痛点,TRAE CN 企业版选择在稳定、适配、管理与安全四个核心维度集中发力。

它不仅通过配备 GPU 集群支持,致力于将响应延迟压缩至毫秒级,支持10万文件、1.5亿行代码的超大仓库索引,以解决性能焦虑;更在适配性上提供了灵活的接入方式,支持切换不同 AI 模型乃至企业自研模型。与此同时,为了化解企业对安全的顾虑,它在实现使用情况可视化的基础上,严格保证了全链路加密传输与云端零存储,为企业核心资产守住了底线。

从工具到生态:一个开发者社区的进化样本

技术工具再强大,如果没有配套的学习资源和社区支持,也很难真正普及。这或许是火山引擎在Force大会上宣布的几项开发者计划值得关注的原因。

首先,火山引擎开发者社区已经全面转型为Agent开发者社区,围绕"学习-体验-动手-测评"的完整流程提供支持。特别值得一提的是动手实验室,它提供开箱即用的沙箱环境、免费的实验云资源,以及场景化实验内容。

此外,新发布的Agent核心开发者计划,入选的核心开发者将获得代金券、技术培训等多重支持。同时,Agent开发者城市社区(ADG)目前已在北京、上海、深圳、成都建立,它由本地技术爱好者和志愿者发起,让开发者能在线下找到志同道合的伙伴,一起探索Agent开发的可能性。

重新定义"开发者"

回到最初的问题:谁是开发者?

在传统的软件开发时代,答案很明确------那些掌握编程语言、熟悉算法和数据结构的专业人士。但在Agent开发的新范式下,这个定义正在被重写。

火山引擎展示的这套从大模型服务平台到Agent开发工具的完整生态,本质上在做一件事:降低创造的门槛。当技术不再是障碍,当"说清楚需求"就能构建应用,开发这件事的主角,就不再局限于程序员群体。

产品经理可以快速验证自己的想法,运营人员可以搭建自动化工具,业务专家可以把领域知识封装成智能应用。"人人都是开发者"不再是一句口号,而是正在发生的现实。

当然,这并不意味着专业开发者会被取代。恰恰相反,当那些重复性的、模板化的工作被AI承担,专业开发者可以把精力集中在更有挑战性、更需要创造力的问题上。

技术的进步,从来不是为了替代人,而是为了释放人的潜能。从这个角度看,火山引擎正在做的,不只是提供一套工具,而是在重新定义一个时代的"开发者"。

一起" 赞" 三连

相关推荐
程序员洲洲7 小时前
【TextIn大模型加速器 + 火山引擎】用Coze+TextIn+飞书搭建全自动论文处理AI工作流
火山引擎·coze·ai工作流·textin·textin大模型加速器
小黄人202511 小时前
【TextIn大模型加速器 + 火山引擎】用RAG来完成专业知识解答功能
火山引擎·扣子·textin
糖炒狗子13 小时前
Textin模型加速器+火山引擎打造商业计划书智能体
人工智能·火山引擎
火山引擎开发者社区2 天前
AI 时代的“无限”记忆:火山引擎 TOS Vectors 开启向量存储新范式
人工智能·火山引擎
JH灰色2 天前
【大模型】-火山引擎扣子
火山引擎
数智前线3 天前
火山引擎智能3D视频启动商业化,计划落地直播应用
3d·音视频·火山引擎
初恋叫萱萱3 天前
【TextIn大模型加速器 + 火山引擎】文件智能体构建全路径指南
大数据·数据库·火山引擎
L.EscaRC3 天前
【TextIn大模型加速器 + 火山引擎】通过COZE平台构建企业级数字投标专家Agent
agent·火山引擎·工作流
字节数据平台4 天前
刚刚,火山引擎多模态数据湖解决方案发布大数据运维Agent
大数据·运维·火山引擎