国内三家大模型修图能力对比

因为工作需要,想找一个UART数据帧的图片做PPT用,于是就在网上搜了一下,最后感觉下面这张图最合适:

但这张图的背景是黑色的,字和线条都是蓝色的,感觉还是白底黑字的格式最好。于是就想用word里的图片编辑功能,试了很久效果也不好,背景虽然可以通过设置透明色去掉,但字和线条始终改不好。突然想到了大模型,于是就把这张图片分别发给了三家支持图片处理的国产大模型:

  1. 百度文心助手(https://chat.baidu.com/

  2. 豆包(https://www.doubao.com/chat/

  3. 千问(https://www.qianwen.com/

使用的提示词都是"把背景的黑色变成白色,把内容线条变成黑色"。以下是三家返回的结果:

  1. 百度文心助手:
  1. 豆包:
  1. 千问:

对比可以发现以下几点:

  1. 背景都从黑色变成了白色,字和线条都改成了黑色;

  2. 百度文心助手和豆包都有水印,而千问是没有水印的;

  3. 豆包的图片分辨率最高,千问次之,百度文心助手最低;

  4. 豆包的文字内容有错,比如起始位改成了起闲位,数据位改成了起始位,校验位改成了数验位,空闲位改成了校验位,最右侧的起始位改成了停止位。

因此,最后我使用了千问的图片。

相关推荐
小超同学你好13 小时前
Langgraph 18. Skill 四种形态 —— Inline / File-based / External / Meta(含代码示例)
人工智能·语言模型·langchain
Tadas-Gao13 小时前
Mem0分层记忆系统:大语言模型长期记忆的架构革命与实现范式
人工智能·语言模型·自然语言处理·架构·大模型·llm·transformer
吴佳浩 Alben13 小时前
GPU 生产环境实践:硬件拓扑、显存管理与完整运维体系
运维·人工智能·pytorch·语言模型·transformer·vllm
lifallen18 小时前
从零推导多 Agent 协作网络 (Flow Agent)
人工智能·语言模型
KG_LLM图谱增强大模型19 小时前
MedHELM:真实临床医疗任务大语言模型的整体评估框架
人工智能·语言模型·自然语言处理
小超同学你好20 小时前
Langgraph 17. Skills 三级加载与 Token 优化(含代码示例)
人工智能·语言模型·langchain
吴佳浩 Alben20 小时前
GPU 编号错乱踩坑指南:PyTorch cuda 编号与 nvidia-smi 不一致
人工智能·pytorch·python·深度学习·神经网络·语言模型·自然语言处理
吴佳浩 Alben20 小时前
CUDA_VISIBLE_DEVICES、多进程与容器化陷阱
人工智能·pytorch·语言模型·transformer
大模型任我行21 小时前
腾讯:揭示评估幻觉并构建知识驱动新范式
人工智能·语言模型·自然语言处理·论文笔记