第五十四篇-Ollama+V100+Qwen3:14B-性能

环境

复制代码
系统:CentOS-7
CPU : E5-2680V4 14核28线程
内存:DDR4 2133 32G * 2
显卡:Tesla V100-32G【PG503】 (水冷)
驱动: 535
CUDA: 12.2

启动测速

复制代码
ollama run qwen3:14b --verbose
你好,介绍下内存,要2000字

速度

复制代码
 total duration:       52.754181331s
load duration:        47.845498ms
prompt eval count:    2291 token(s)
prompt eval duration: 1.737233872s
prompt eval rate:     1318.76 tokens/s
eval count:           2556 token(s)
eval duration:        50.871698922s
eval rate:            50.24 tokens/s

GPU

复制代码
 Thu Dec  4 23:21:30 2025
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.129.03             Driver Version: 535.129.03   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla PG503-216                Off | 00000000:04:00.0 Off |                    0 |
| N/A   36C    P0             246W / 300W |  15198MiB / 32768MiB |     92%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

总结

相关推荐
w2sfot4 小时前
反AI逆向JS加密
javascript·人工智能·反ai
独隅4 小时前
PyTorch 分布式训练完整指南:策略、实现与模型选型
人工智能·pytorch·分布式
冷色系里的一抹暖调4 小时前
OpenClaw Docker 部署避坑指南:服务启动成功但网页打不开?
人工智能·windows·docker·ai·容器·opencode
沪漂阿龙4 小时前
卷积神经网络(CNN)零基础通关指南:原理、图解与PyTorch实战
人工智能·pytorch·cnn
Data-Miner4 小时前
54页可编辑PPT | 数据中台建设方案汇报
大数据·人工智能
语戚4 小时前
深度解析:Stable Diffusion 底层原理 + U-Net Denoise 去噪机制全拆解
人工智能·ai·stable diffusion·aigc·模型
舒一笑5 小时前
AI 时代最火的新岗位,不是提示词工程师,而是 Harness 工程师
人工智能·程序员·设计
明月醉窗台5 小时前
[jetson] AGX Xavier 安装Ubuntu18.04及jetpack4.5
人工智能·算法·nvidia·cuda·jetson
青稞社区.5 小时前
从最基础的模型出发,深度剖析高性能 VLA 的设计空间
人工智能·agi
夜猫逐梦5 小时前
【AI】 Claude Code 源码泄露:一场关于安全与学习的风波
人工智能·安全·claude code·源码泄漏