国产首款视觉理解能力模型-Claude Code测评

文字目录

前言
[安装Calude Code](#安装Calude Code)
使用PowerShell配置环境变量
[使用Claude Code](#使用Claude Code)
功能测评
总结

前言

近期，火山引擎发布了豆包编程相关模型：Doubao-Seed-Code。

按照介绍推文来看，Doubao-Seed-Code是国内首个具备视觉理解能力的编程模型，可参考手绘稿、UI设计封面或给予目标网站的配色等，自主完成样式修复和Bug修复，大幅提升前端开发效率。除此之外，原生支持 256K 长上下文，轻松处理长代码文件、多模块依赖等复杂场景，实现端到端自主编程，全栈开发友好，前端能力突出。

在国内市场中，DeepSeek V3.1、Kimi K2、GLM 4.6、MiniMax M2 等 Coding 模型均不具备视觉理解能力，或需要依赖MCP实现，将图片转化成语义描述供模型理解，过程中信息折损会很大，效果远不及原生VLM能力；

一个强大的知识大脑加上可理解的视觉神经，回答或许可以不再是盲盒式地自我输出。

嗯，这对于在工作中日常和产品经理battle或想工作增效的开发人员来说是一个不可多得的"帮手"，也因时常关注国内市场的大模型更新状态，所以这段时间闲暇之余对Doubao-Seed-Code进行了一些测试。

安装使用

看了介绍，我在Windows 11 安装了Claud Code，对底层调用模型进行更换，无需集成环境或其他MCP，相对于测评来说也比较方便。

首先在火山方舟上，开通这个模型的API Key。如果只是想轻量级体验的话，也可以通过火山引擎体验中心，选择Doubao-Seed-Code。

安装Calude Code

基础环境要求：

安装Node.js 18+
安装Git for windows

就这么简单！安装完基础环境在命令行界面（WIN + R ------不用我教吧），执行以下命令安装。

bash 复制代码

npm install -g @anthropic-ai/claude-code

安装结束后，执行以下命令查看安装结果。

bash 复制代码

claude --version

使用PowerShell配置环境变量

完场Claude Code安装后，配置以下环境变量。

ANTHROPIC_BASE_URL：https://ark.cn-beijing.volces.com/api/coding
ANTHROPIC_AUTH_TOKEN：<你的API Key>
ANTHROPIC_MODEL: doubao-seed-code-preview-latesdt。
一步一步来，步骤如下：

在PowerShell中执行以下命令，设置环境变量。

bash 复制代码

# 去平台复制一下自己的api Key，其他不变
setx ANTHROPIC_AUTH_TOKEN <YOUR ARK_API_KEY>
setx ANTHROPIC_BASE_URL https://ark.cn-beijing.volces.com/api/coding
setx ANTHROPIC_MODEL doubao-seed-code-preview-latest

在新的PowerShell窗口执行以下命令，检查环境变量是否生效。

bash 复制代码

echo $env:ANTHROPIC_AUTH_TOKEN
echo $env:ANTHROPIC_BASE_URL
echo $env:ANTHROPIC_MODEL

使用Claude Code

启动Claude Code：进入项目目录，执行claude命令，即可开始使用Claude Code。

bash 复制代码

# 进入你自己的项目目录
cd my-project
# 启动Claude-Code
claude

模型状态验证：输入/status确认模型状态

Model后面跟着"doubao-seed-code-preview-latest"就是成功接上了！

功能测评

视觉理解能力

首先先测试一下模型的视觉理解能力，毕竟都这么宣传了，指定有它的优势之处。我的想法是：给它一个前端页面需求的手绘稿，然后参考某个网站的截图配色，生成对应的前端代码。

手绘稿：

参考苹果官网截图：

prompt：@AIlearning.jpg @mytheme2.png 我需要生成一个前端页面，为了展示在线学习网站的错题展示页面，主要以康奈尔笔记法结构展示，同时旁边有一个AI小助手供学习者提问。具体布局请参考我给出的手绘稿，网站的配色请参考我给出的网站截图。

第一次生成的效果就还可以，结构分布上和我的手绘稿差不多，配色也完美参考了我上传的网站截图配色，因此我没有做二次的prompt调整。只是在一些细节问题上，需要二次去页面上的内容作细化调整。在页面上，它自己生成了一些数学公式，但是却没有正常显示。针对这个问题我对它提出了疑问。（写代码就像聊天一样！( •̀ ω •́ )y）