【一手实测】字节豆包 1.6 + Trae + 火山 MCP + FaaS:AI云原生 Agent 开发部署全流程体验!

原创 Aitrainee AI进修生 2025年06月13日 16:42 湖南 标题已修改

缘起 ------

火山引擎在 2025 原动力大会上,也端出了自家的豆包大模型:Doubao-Seed-1.6 系列。

这三兄弟都支持文本、图片、视频输入,都带着 256K 的长上下文。

Doubao-Seed-1.6-thinking,这是火山目前最强的思考模型,在编码、数学、逻辑推理这些基础能力上又进了一步。它的思考模式是强制开启的,关不掉。

然后是 Doubao-Seed-1.6,All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。

此外,你给它一段文字或图片描述,它能直接给你生成高质量的前端页面,样式还挺精美(我们后文用它做网站、构建Agent)。

最后是 Doubao-Seed-1.6-flash,主打一个字:快。TPOT 只要 10ms,延迟极低,适用于对速度要求高的场景。

Doubao 1.6 设计一个落地页?我给它喂了一份"超纲"需求

前段时间,在优化公众号文章排版,积累了些经验。我想把这些想法、经验转化成一个产品原型,同时测试一下这些AI。

这玩意儿是个"AI 智能排版增强服务",专门给内容创作者用的。

我想看看,现在的 AI,能不能帮我设计一个高转化率的落地页。

于是,我没跟它客气,直接扔过去一份堪称"变态级"的设计需求文档。

BeforeAfter魔法般的转变

从【导航栏】到【主视觉区】,每个细节都得安排得明明白白。主视觉,我要求它搞个特有冲击力的"Before & After"对比动画,要那种"魔法般"的转变效果,让用户一眼就看到产品的价值。然后是【社会认同】,得有 logo 墙,告诉大家"超过 1000+ 创作者和 50+ 新媒体团队都在用"。

核心功能,我让它用卡片网格布局展示三个点:

  • 能读懂你:不光排版,还能修正语法、理顺句子,但保留你的个人风格。

  • 专属设计师:一键应用各种风格模板,或者直接跟 AI 说你想要的"感觉"。

  • 让图片讲故事:自动处理图片,加圆角、阴影,智能推荐图注、加入SVG等等。

工作流程,我让它设计成"三步,见证奇迹":粘贴初稿 -> 选择风格 -> 一键复制。

我还给 AI 提了更"玄学"的要求。

我让它把这个落地页,构想成一个 有空间意境 的地方,比如"深夜的灵感阁楼"、"充满活力的创意工坊",整体氛围要"神秘并激发好奇,简约却不失格调"。交互体验,要像"与一位有趣的灵魂对话"或者"翻阅一本精心编排的互动书籍"。

我喜欢 玄学。我想让ai自己发挥,就像以前的AI自己决策思考提示词一样。

灵感阁楼创意工坊玄学空间意境

布局逻辑,我给了它"主题岛屿式"、"时间轴式"、"仪表盘式"这些选项。

动效设计,我也没放过。板块过渡要像"电影胶片切换"或者"水墨在宣纸上晕开",交互反馈要清晰明确,信息强调要用"微妙的脉冲效果"或者"呼吸灯动画"。

基本上,我把一个资深产品经理+设计师+前端工程师可能要思考的所有东西,都压缩成了一份指令,一股脑儿地喂给了 AI。我想看看,它到底能消化多少,又能给我带来怎样的惊喜。

在火山引擎:https://exp.volcengine.com/ark?model=doubao-seed-1-6-250615,这里我们选择Doubao-Seed-1.6来试试。

打开canvas模式,把提示词输给他,先通过生成单个Html网页来实现。

效果非常不错,你能想到通过一个提示词,就能把你的想法变成了现实吗:

不过,通过单个htm实现的网页,在某些点击、动效等等还是比不上现代化Web开发框架。

所以我用Trae + Doubao-Seed-1.6 + Next.js + Shadcn UI 重写了一遍。这并不难,先初始化 Next.js框架(如下命令)得到项目文件夹:

npx create-next-app@latest FinalTouch-AI --ts --tailwind --eslint --src-dir --app --import-alias "@/*" -y && cd my-app && npx shadcn-ui@latest init -y && npx shadcn-ui@latest add all -y

接着用Trae(因为上线了1.6)打开这个文件夹再输入上面的提示词。

效果如下:

,时长00:24

是不是好看、工整、优秀的许多?后面我还让他加入了豆包模型做核心服务支撑。

核心服务如下:

通过AI实现了文本排版。这一块的更多细节,我们以后再单独写。这个提示词的构建设计了许多东西:关于saas网站如何提高转化率?怎么根据你一个想法让ai来构建?让他自发的适配更好的风格等等...

接下来我要介绍一个更有意思的:

AI 云原生正在加速 Agentic AI 时代的到来

工具调用模型推理应用部署Trae豆包1.6FaaS火山方舟 MCP全链路闭环开发范式模块化组装,专注业务逻辑

在 2025 原动力大会上,字节跳动提出了全新的 AI 云原生 Agent 开发范式:借助 Trae + 火山方舟 MCP + 豆包大模型 + FaaS,开发者可以实现从 工具调用 → 模型推理 → 应用部署 的全链路闭环,打通了智能 Agent 开发的完整流程。

这一范式的核心,是通过"模块化组装"的方式,彻底摆脱过去繁琐的手动集成与开发,真正让开发者专注于业务逻辑,而非底层细节。我们具体来看一下。

我想构建一个Agent:

你是一个名为"CityWalk AI Planner"的智能城市漫游助手。你的核心使命是为用户提供高度个性化、充满惊喜、且充分考虑实时情况的一日城市漫游(CityWalk)路线规划。你不仅是一个信息聚合器,更是一位懂生活、有品味、善于规划的本地向导。将你最终规划好的所有内容,构思并编程生成一个【精美的、交互式的单页HTML网页】。

我们需要使用这几个MCP

其中 VeFaaS MCP用于前端网页应用部署,比如这个html做好了之后可以一键调用,发布到火山引擎。并返回可访问的链接。

这样就可以在一个IDE里面开发和部署了,就像以前说Windsurf那个功能一样。

IDE一键部署云端可访问链接

这些mcp都是火山引擎云端托管的,配置很简单。去火山引擎,安装步骤如下:

注意,你选择远程即可。免费。

接着我们需要在Trae里面创建一个Agent(类似于Cursor自定义Agent),可以配置使用哪些工具和MCP,以及提示词:

从提示词的设计可以看出,我们构建的并不只是一个简单的旅游问答助手。考虑到 1.6 模型具备 Auto-Think 的能力,我们在提示词中巧妙加入了大量问号,以此引导模型进行更深层次的主动思考。

这种提示词设计,既有明确的结构规范,也保留了足够的开放性,目的是激发模型的"思考本能",而不是仅仅被动回答。它更像是在与一个具备判断力和意图感的智能体对话,而不是传统的工具式交互。

然后我们就直接@刚创建的这个智能体给需求即可。

📱 可上下滑动查看完整内容

效果如下:

📱 可上下滑动查看完整内容

case2:西安七日游

📱 可上下滑动查看完整内容

case3:新加坡七日游

📱 可上下滑动查看完整内容

接着,VeFaaS MCP可以用于前端网页部署:网页可以一键部署。

这样提示:把这个html网页发布到faas,并返回一个可访问链接。

你可以在火山引擎函数服务这里查看:

可以看到他部署好的代码以及连接信息:

火山引擎可能也是国内第一个把 MCP 部署搞得这么端到端的云厂商。

有了这个。我们下面的测评内容,也可以一键被其他人访问。

Doubao Seed 1.6 模型测评

这三个模型都是支持视频的。我们可以试试让他看视频生成网页。这是一个鼠标点击按钮滑动+变色的视频。

,时长00:22

很有挑战性。丢给它

除了logo那小部分,基本上很还原了。

视频理解AI生成网页视频理解与代码生成多模态交互新体验

以前gemini说的那些,都可以试试了。编码封神,Gemini 2.5 Pro (I/O 版)视频秒转 App!网友:比 o3/Claude 强,Vibe 程序员集结!

另外有一点。蛮爽的是他图片上传竟然支持gif。gemini不支持。

我上传了一个解释RAG、Agentic相关的GIF和一张排版不错的网页截图。想让他理解MCP内容然后按照第二种风格转换表现形式。

输出:

📱 可上下滑动查看完整内容

其实按照gif里面的mcp的内容来说,选择第2种表现形式并不是一种很好的方式。不过他也按照我们的要求改成了这种方框的形式。

并且方框里面都加入了能体现gif流程的标号。

原GIF RAG、Agentic RAG 分别是7个和12个标号,豆包都一一找到并且对应了,视觉理解能力这块确实不错。

多模态输入和风格转化视觉理解。可玩性很高了。

要个啥的UI 动效组件,搞个啥广告展示页、作品集、动态专题页等等

它甚至可以把思维导图一键转化成课程介绍网页

"请根据思维导图生成一个课程介绍 html 网页":

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

内容详实美观,还留了个报名地址。

你的头脑风暴,模糊的想法,可以一键传递给他人了。

还有这种写了个草稿大概的,它也能转化的很好。

有些模糊不清的数据表格也可以做成美观的网页。

根据这些数据生成一个美观的 html 介绍网页:

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

你把网页长截图给他,它能复刻一个高度相似的html

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

让它参考下面Openai的排版格式,改改颜色,帮我写一个介绍 Claude的 html 网页

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

截图网站复刻:

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

参考下面截图网页的风格,帮我写一个介绍 deepseek 的 html 网页

📱 可上下滑动查看完整内容

📱 可上下滑动查看完整内容

按照我的这个Saas网站的风格。

帮我生成一个风格类似的旅行日记网页:

📱 可上下滑动查看完整内容

模型表现总结

编码能力vsClaude 4价格优性能与性价比双优不输Claude,比Deepseek好用

豆包大模型升级之后效果非常不错。从测试体验来看。1.6 模型在处理复杂提示指令(用上思考模型很强)、编码上效果上不输Claude 4,比Deepseek好用。

此外,上次卡总的"7家大模型做高考数学题的真实分数",豆包位列第二,也是看得出来有点东西。

价格相比Claude也便宜很多,豆包 1.6 模型价格对照:

AI 云原生生态的未来

字节生态工具链云服务MCP全栈Agent开发生态开箱即用的企业级解决方案

最后,字节内部已经有豆包 App、Coze 空间这些成熟的 Agent 应用了。这也让火山引擎能更好的这些复刻成熟产品的经验。

我们搭建Agent并部署的门槛现在其实已经很低了。

在这次 火山引擎 Force 大会 大会上,他们会现场演示好几个 Agent demo 的完整开发过。

Trae + 火山方舟 MCP + 豆包大模型 + Faas"这么一套组合拳,是一个新理念:AI 云原生开发。

火山引擎提供的是强大的模型+全栈的 Agent 开发工具和丰富的生态,再加上自然语言调度云的能力,能让你开发出生产环境里跑的、对开发者友好的 Agent。

工具服务、云服务、字节的生态服务,全都支持 MCP 协议。

这就实现了一个"工具调用 → 模型推理 → 部署运营"的深度协同。云服务也支持 MCP,形成了一套标准化的协作生态,能直接复用云上成熟的部署运维体系,避免了 Agent 开发和部署环境脱节的尴尬,还能动态调度算力。主打一个企业级 Agent 构建"开箱即用"。

这套平台能力,不只是停留在 PPT 上。

有关信息显示,汽车行业,有将近八成的主流车企,把豆包大模型用在了智能座舱、AI 升级这些核心场景里。

教育领域,浙江大学用火山引擎的 HiAgent 平台和豆包大模型,花了一个星期,就搞定了一个叫"浙大先生"的智能体平台。服务着超过五万名师生。

体验开发部署

One More Thing

从简单的文本生成,到复杂的应用开发与云端部署,豆包 1.6 + 火山方舟的全栈解决方案,展现了 AI 云原生时代的无限可能。

未来,每一个创意都可能在几分钟内变成现实。

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

探索AI前沿,分享实战经验

Aitrainee

暗色模式,我贼亮

喜欢作者

SOTA 模型 · 目录

上一篇Gemini 2.5 Pro 再升级!竞技场分数创新高+思考预算,更强 Kingfall 在路上?

阅读 1933

修改于2025年06月13日

留言 3

写留言

幼笙
朋友湖南2天前

文章中火山引擎MCP安装教程视频:https://lf3-static.bytednsdoc.com/obj/eden-cn/lm_sth/ljhwZthlaukjlkulzlp/ark/assistant/videos/LAS.mp4
*

AI进修生
作者3天前

漏了一图,使用 vefaas mcp部署时(还要手动去火山引擎函数服务的触发器那里创建实例和服务)


*

AI进修生
作者3天前

第二个构建Agent的提示词是这个,排版后给漏了

已无更多数据

相关推荐
风象南24 分钟前
Claude Code这个隐藏技能,让我告别PPT焦虑
人工智能·后端
Mintopia1 小时前
OpenClaw 对软件行业产生的影响
人工智能
陈广亮2 小时前
构建具有长期记忆的 AI Agent:从设计模式到生产实践
人工智能
会写代码的柯基犬2 小时前
DeepSeek vs Kimi vs Qwen —— AI 生成俄罗斯方块代码效果横评
人工智能·llm
Mintopia2 小时前
OpenClaw 是什么?为什么节后热度如此之高?
人工智能
爱可生开源社区2 小时前
DBA 的未来?八位行业先锋的年度圆桌讨论
人工智能·dba
叁两5 小时前
用opencode打造全自动公众号写作流水线,AI 代笔太香了!
前端·人工智能·agent
前端付豪5 小时前
LangChain记忆:通过Memory记住上次的对话细节
人工智能·python·langchain
strayCat232555 小时前
Clawdbot 源码解读 7: 扩展机制
人工智能·开源