国内三家大模型修图能力对比

因为工作需要,想找一个UART数据帧的图片做PPT用,于是就在网上搜了一下,最后感觉下面这张图最合适:

但这张图的背景是黑色的,字和线条都是蓝色的,感觉还是白底黑字的格式最好。于是就想用word里的图片编辑功能,试了很久效果也不好,背景虽然可以通过设置透明色去掉,但字和线条始终改不好。突然想到了大模型,于是就把这张图片分别发给了三家支持图片处理的国产大模型:

  1. 百度文心助手(https://chat.baidu.com/

  2. 豆包(https://www.doubao.com/chat/

  3. 千问(https://www.qianwen.com/

使用的提示词都是"把背景的黑色变成白色,把内容线条变成黑色"。以下是三家返回的结果:

  1. 百度文心助手:
  1. 豆包:
  1. 千问:

对比可以发现以下几点:

  1. 背景都从黑色变成了白色,字和线条都改成了黑色;

  2. 百度文心助手和豆包都有水印,而千问是没有水印的;

  3. 豆包的图片分辨率最高,千问次之,百度文心助手最低;

  4. 豆包的文字内容有错,比如起始位改成了起闲位,数据位改成了起始位,校验位改成了数验位,空闲位改成了校验位,最右侧的起始位改成了停止位。

因此,最后我使用了千问的图片。

相关推荐
阿杰学AI11 小时前
AI核心知识115—大语言模型之 自监督学习(简洁且通俗易懂版)
人工智能·学习·ai·语言模型·aigc·监督学习·自监督学习
Zzj_tju11 小时前
大语言模型技术指南:Transformer 为什么能成为基础架构?核心模块与参数怎么理解
人工智能·语言模型·transformer
gorgeous(๑>؂<๑)11 小时前
【CVPR26-韩国科学技术院】令牌扭曲技术助力多模态大语言模型从邻近视角观察场景
人工智能·语言模型·自然语言处理
Zzj_tju13 小时前
大语言模型和视觉语言模型技术指南:从 Transformer 到多模态系统,全景看懂主流路线
人工智能·语言模型·transformer
2301_7644413315 小时前
2026年1月至4月期间,大模型招投标市场态势
人工智能·语言模型·信息与通信
kyle-fang15 小时前
主流微调工具
人工智能·语言模型
飞Link18 小时前
【AI大模型实战】万字长文肝透大语言模型(LLM):从底层原理解析到企业级Python项目落地
开发语言·人工智能·python·语言模型·自然语言处理
nap-joker19 小时前
基于大语言模型的大规模人群中的生物年龄预测
人工智能·语言模型·自然语言处理·生物年龄·器官特异的生物年龄
Omics Pro19 小时前
上海AI Lab+复旦大学:双轨协同实现自动化虚拟细胞建模
运维·人工智能·语言模型·自然语言处理·数据挖掘·数据分析·自动化
sp_fyf_202420 小时前
【大语言模型】 揭秘OPD:大语言模型的长度膨胀与稳定化策略
人工智能·深度学习·神经网络·机器学习·语言模型