国内三家大模型修图能力对比

因为工作需要,想找一个UART数据帧的图片做PPT用,于是就在网上搜了一下,最后感觉下面这张图最合适:

但这张图的背景是黑色的,字和线条都是蓝色的,感觉还是白底黑字的格式最好。于是就想用word里的图片编辑功能,试了很久效果也不好,背景虽然可以通过设置透明色去掉,但字和线条始终改不好。突然想到了大模型,于是就把这张图片分别发给了三家支持图片处理的国产大模型:

  1. 百度文心助手(https://chat.baidu.com/

  2. 豆包(https://www.doubao.com/chat/

  3. 千问(https://www.qianwen.com/

使用的提示词都是"把背景的黑色变成白色,把内容线条变成黑色"。以下是三家返回的结果:

  1. 百度文心助手:
  1. 豆包:
  1. 千问:

对比可以发现以下几点:

  1. 背景都从黑色变成了白色,字和线条都改成了黑色;

  2. 百度文心助手和豆包都有水印,而千问是没有水印的;

  3. 豆包的图片分辨率最高,千问次之,百度文心助手最低;

  4. 豆包的文字内容有错,比如起始位改成了起闲位,数据位改成了起始位,校验位改成了数验位,空闲位改成了校验位,最右侧的起始位改成了停止位。

因此,最后我使用了千问的图片。

相关推荐
硅谷秋水16 小时前
SkillOpt:自演化智体技能的执行策略
大数据·人工智能·深度学习·机器学习·语言模型
硅谷秋水17 小时前
Qwen-VLA:跨任务、环境与机器人形态的视觉-语言-动作统一建模
人工智能·深度学习·算法·计算机视觉·语言模型·机器人
SXJR17 小时前
langchain4j是如何保证tools或者funcation call不出错的
java·网络·数据库·ai·语言模型
lqqjuly18 小时前
语言模型理论与术语(LLM Theory & Terminology)
人工智能·语言模型·自然语言处理
AndrewHZ20 小时前
【LLM技术全景】Transformer架构深度解析:Encoder-Decoder全理解
人工智能·深度学习·语言模型·大模型·llm·transformer·编解码技术
承渊政道1 天前
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(新时代的曙光之大模型与人工智能)
人工智能·pytorch·python·深度学习·机器学习·语言模型·自然语言处理
我爱cope1 天前
【Agent智能体17 | 工具使用-MCP协议】
人工智能·语言模型·职场和发展
YueJoy.AI1 天前
低算力场景下中小企业接入大模型的商业化路径
人工智能·ai·语言模型
活跃的煤矿打工人2 天前
【星海出品】大模型微调-Part-One
人工智能·语言模型·gpu算力
笑尘~Y2 天前
每日GitCode开源项目精选
语言模型