第五十三篇-Ollama+V100+Qwen3:4B-性能

环境

复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

启动测速

复制代码
ollama run qwen3:4b --verbose
你好,介绍下CPU,要2000字

速度

复制代码
total duration:       40.465474485s
load duration:        47.768665ms
prompt eval count:    337 token(s)
prompt eval duration: 89.529239ms
prompt eval rate:     3764.13 tokens/s
eval count:           3787 token(s)
eval duration:        40.294106008s
eval rate:            93.98 tokens/s

GPU

复制代码
Thu Dec  4 23:17:11 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla PG503-216                Off | 00000000:04:00.0 Off |                    0 |
| N/A   29C    P0             179W / 300W |   4466MiB / 32768MiB |     84%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

总结

复制代码
1.V100还是比较强的,比P40性能高很多。
2.水冷还是非常给力的,能压在40度以下。
3.V100的转接板的噪音有些不好,负载下一直叫。
4.升级成功,速度还是很不错的。
相关推荐
恣逍信点4 小时前
《凌微经 · 理悖相涵》第七章 形性一体——本然如是之元观
人工智能·科技·学习·程序人生·生活·交友·哲学
stars-he4 小时前
AI工具配置学习笔记
人工智能·笔记·学习
Master_oid4 小时前
机器学习32:机器终生学习(Life Long Learning)
人工智能·学习·机器学习
芷栀夏4 小时前
CANN ops-math:为上层 AI 算子库提供核心支撑的基础计算模块深度拆解
人工智能·深度学习·transformer·cann
袁气满满~_~4 小时前
深度学习笔记三
人工智能·笔记·深度学习
风象南5 小时前
OpenSpec 与 Spec Kit 使用对比:规范驱动开发该选哪个?
人工智能
草莓熊Lotso5 小时前
Linux 文件描述符与重定向实战:从原理到 minishell 实现
android·linux·运维·服务器·数据库·c++·人工智能
Coder_Boy_6 小时前
技术发展的核心规律是「加法打底,减法优化,重构平衡」
人工智能·spring boot·spring·重构
会飞的老朱8 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º10 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算