【华为昇腾|CUDA】服务器A6000显卡部署LLM实战记录

安装驱动

  • https://www.nvidia.cn/drivers/lookup/
  • 搜索对应gpu的kylin版本即可
  • 先使用wget 下载rpm包
  • rpm -i 安装
  • 最后使用dnf install nvidia-driver即可
    • 上面安装的是驱动仓库

安装CUDA

安装Ollama

ollama官方提供aarch64 docker,按照https://hub.docker.com/r/ollama/ollama文档操作即可

启动Ollama

同样按文档--gpus=all使用gpu资源启动容器

在启动后建议:

  • docker exec -it ollama bash进入下容器
  • 运行nvidia-smi,重点查看cuda是否正确显示版本号
    • 错误则显示N/A
  • 一般看到cuda版本号ollama即可正常使用gpu推理
相关推荐
nashane4 小时前
HarmonyOS 6学习:外接键盘CapsLock与长截图功能的实战调试与完整解决方案
学习·华为·计算机外设·harmonyos
米高梅狮子4 小时前
03.网络类服务实践
linux·运维·服务器·网络·kubernetes·centos·openstack
June`4 小时前
网络编程时内核究竟做了什么???
linux·服务器·网络
原来是猿4 小时前
腾讯云服务器端口开放完全指南
服务器·网络·腾讯云
你的保护色5 小时前
【无标题】
java·服务器·网络
Elnaij5 小时前
Linux系统与系统编程(9)——自设计shell与基础IO
linux·服务器
IMPYLH6 小时前
Linux 的 unexpand 命令
linux·运维·服务器·bash
想唱rap6 小时前
IO多路转接之poll
服务器·开发语言·数据库·c++
|_⊙6 小时前
Linux 文件知识 补充
linux·运维·服务器
落羽的落羽7 小时前
【算法札记】练习 | Week4
linux·服务器·数据结构·c++·人工智能·算法·动态规划