第五十四篇-Ollama+V100+Qwen3:14B-性能

环境

复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

启动测速

复制代码
ollama run qwen3:14b --verbose
你好,介绍下内存,要2000字

速度

复制代码
 total duration:       52.754181331s
load duration:        47.845498ms
prompt eval count:    2291 token(s)
prompt eval duration: 1.737233872s
prompt eval rate:     1318.76 tokens/s
eval count:           2556 token(s)
eval duration:        50.871698922s
eval rate:            50.24 tokens/s

GPU

复制代码
 Thu Dec  4 23:21:30 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla PG503-216                Off | 00000000:04:00.0 Off |                    0 |
| N/A   36C    P0             246W / 300W |  15198MiB / 32768MiB |     92%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

总结

相关推荐
soragui1 小时前
【AI内容生成】解锁Z-Image Turbo的10大高级提示词
人工智能
腾飞开源1 小时前
16_Spring AI 干货笔记之 Docker 模型运行器聊天
人工智能·自动配置·函数调用·springai·docker 模型运行器·运行时选项·容器化ai
渡我白衣1 小时前
并行的野心与现实——彻底拆解 C++ 标准并行算法(<execution>)的模型、陷阱与性能真相
java·开发语言·网络·c++·人工智能·windows·vscode
龙亘川1 小时前
开箱即用的智慧城市一网统管AI平台—平台简介与核心架构(1、2)
人工智能·架构·智慧城市·一网统管
冬虫夏草19931 小时前
使用householder反射推广ROPE相对位置编码
人工智能·pytorch·python
FserSuN1 小时前
Agent开发总结学习
人工智能·学习
LCG米1 小时前
从训练到部署:基于PyTorch与TensorFlow Lite的端侧AI花卉分类系统完整指南
人工智能·pytorch·tensorflow
冴羽1 小时前
太好看了!3 个动漫变真人 Nano Banana Pro 提示词
前端·人工智能·aigc
悟纤1 小时前
Suno 创作《亲爱的你》歌词模式全流程制作 | 从零开始用Suno Ai | 第4篇
人工智能·suno·suno ai