第五十四篇-Ollama+V100+Qwen3:14B-性能

环境

复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

启动测速

复制代码
ollama run qwen3:14b --verbose
你好,介绍下内存,要2000字

速度

复制代码
 total duration:       52.754181331s
load duration:        47.845498ms
prompt eval count:    2291 token(s)
prompt eval duration: 1.737233872s
prompt eval rate:     1318.76 tokens/s
eval count:           2556 token(s)
eval duration:        50.871698922s
eval rate:            50.24 tokens/s

GPU

复制代码
 Thu Dec  4 23:21:30 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla PG503-216                Off | 00000000:04:00.0 Off |                    0 |
| N/A   36C    P0             246W / 300W |  15198MiB / 32768MiB |     92%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

总结

相关推荐
lnix几秒前
当“大龙虾”养在本地:我们离“反SaaS”的AI未来还有多远?
人工智能·aigc
泉城老铁4 分钟前
Dify知识库如何实现多关键词AND检索?
人工智能
阿星AI工作室7 分钟前
给openclaw龙虾造了间像素办公室!实时看它写代码、摸鱼、修bug、写日报,太可爱了吧!
前端·人工智能·设计模式
Halo咯咯8 分钟前
别再学写代码了,顶级工程师现在在学管理AI agent | 值得一读
人工智能
明明如月学长15 分钟前
被 Claude Code 劝退?这款免费开源好用的 AI 神器更适合普通人
人工智能
恋猫de小郭2 小时前
AI 正在造就你的「认知卸载」,但是时代如此
前端·人工智能·ai编程
飞哥数智坊9 小时前
我的“龙虾”罢工了!正好对比下GLM、MiniMax、Kimi 3家谁更香
人工智能
风象南10 小时前
很多人说,AI 让技术平权了,小白也能乱杀老师傅 ?
人工智能·后端
董董灿是个攻城狮12 小时前
大模型连载1:了解 Token
人工智能
RoyLin14 小时前
沉睡三十年的标准:HTTP 402、生成式 UI 与智能体原生软件的时代
人工智能