第五十四篇-Ollama+V100+Qwen3:14B-性能

环境

复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

启动测速

复制代码
ollama run qwen3:14b --verbose
你好,介绍下内存,要2000字

速度

复制代码
 total duration:       52.754181331s
load duration:        47.845498ms
prompt eval count:    2291 token(s)
prompt eval duration: 1.737233872s
prompt eval rate:     1318.76 tokens/s
eval count:           2556 token(s)
eval duration:        50.871698922s
eval rate:            50.24 tokens/s

GPU

复制代码
 Thu Dec  4 23:21:30 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla PG503-216                Off | 00000000:04:00.0 Off |                    0 |
| N/A   36C    P0             246W / 300W |  15198MiB / 32768MiB |     92%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

总结

相关推荐
智枢圈几秒前
Function-Calling与工具使用
人工智能
司南-70491 分钟前
Dense结构下的 大模型系统架构研究
服务器·人工智能·后端
GISer_Jing1 分钟前
AI全栈转型_TS后端学习路线
前端·人工智能·后端·学习
漫游的渔夫1 分钟前
前端开发者做 Agent:别只会执行,用 4 类失败策略让 AI 知道怎么停
前端·人工智能·typescript
娃娃略2 分钟前
Frame
人工智能·深度学习·机器学习
Python私教7 分钟前
Pure-Admin-Thin 深度解析:完整版和精简版到底怎么选?
vue.js·人工智能·开源
星马梦缘10 分钟前
强化学习实战8.3——用PPO打赢星际争霸【编写自定义环境GYM】
人工智能·强化学习·gymnasium·星际争霸·sc2·starcraft2·sb3
翔云12345610 分钟前
大模型部署全流程深度解析
人工智能·ai·大模型
BU摆烂会噶11 分钟前
【LangGraph】持久化实现的三大能力——人机交互
数据库·人工智能·python·langchain·人机交互
沐风老师12 分钟前
开发AI机器人操作系统用什么编程语言?
人工智能·ai编程·机器人操作系统