第五十三篇-Ollama+V100+Qwen3:4B-性能

环境

复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

启动测速

复制代码
ollama run qwen3:4b --verbose
你好,介绍下CPU,要2000字

速度

复制代码
total duration:       40.465474485s
load duration:        47.768665ms
prompt eval count:    337 token(s)
prompt eval duration: 89.529239ms
prompt eval rate:     3764.13 tokens/s
eval count:           3787 token(s)
eval duration:        40.294106008s
eval rate:            93.98 tokens/s

GPU

复制代码
Thu Dec  4 23:17:11 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla PG503-216                Off | 00000000:04:00.0 Off |                    0 |
| N/A   29C    P0             179W / 300W |   4466MiB / 32768MiB |     84%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

总结

复制代码
1.V100还是比较强的,比P40性能高很多。
2.水冷还是非常给力的,能压在40度以下。
3.V100的转接板的噪音有些不好,负载下一直叫。
4.升级成功,速度还是很不错的。
相关推荐
阿杰学AI10 分钟前
AI核心知识115—大语言模型之 自监督学习(简洁且通俗易懂版)
人工智能·学习·ai·语言模型·aigc·监督学习·自监督学习
IT_陈寒17 分钟前
为什么我的JavaScript异步回调总是乱序执行?
前端·人工智能·后端
Zzj_tju21 分钟前
大语言模型技术指南:Transformer 为什么能成为基础架构?核心模块与参数怎么理解
人工智能·语言模型·transformer
gorgeous(๑>؂<๑)28 分钟前
【CVPR26-韩国科学技术院】令牌扭曲技术助力多模态大语言模型从邻近视角观察场景
人工智能·语言模型·自然语言处理
AC赳赳老秦42 分钟前
OpenClaw email技能:批量发送邮件、自动回复,高效处理工作邮件
运维·人工智能·python·django·自动化·deepseek·openclaw
用户7824520807791 小时前
一些容易混淆的点(个人记录)
人工智能
胡志辉1 小时前
OpenClaw 教程:新 Mac 从 0 配到国产 AI、飞书微信和无人值守
人工智能·神经网络
机器之心1 小时前
全球第一,13个SOTA!我们找到了龙虾界掌管GUI的神
人工智能·openai
AI问答工程师1 小时前
Meta Muse Spark 的"思维压缩"到底是什么?我用 Python 复现了核心思路(附代码)
人工智能·python
机器之心1 小时前
大佬深度解析:Coding Agent的底层运行逻辑是什么?
人工智能·openai