【华为昇腾|CUDA】服务器A6000显卡部署LLM实战记录

安装驱动

  • https://www.nvidia.cn/drivers/lookup/
  • 搜索对应gpu的kylin版本即可
  • 先使用wget 下载rpm包
  • rpm -i 安装
  • 最后使用dnf install nvidia-driver即可
    • 上面安装的是驱动仓库

安装CUDA

安装Ollama

ollama官方提供aarch64 docker,按照https://hub.docker.com/r/ollama/ollama文档操作即可

启动Ollama

同样按文档--gpus=all使用gpu资源启动容器

在启动后建议:

  • docker exec -it ollama bash进入下容器
  • 运行nvidia-smi,重点查看cuda是否正确显示版本号
    • 错误则显示N/A
  • 一般看到cuda版本号ollama即可正常使用gpu推理
相关推荐
HMS Core22 分钟前
京东携手HarmonyOS SDK首发家电AR高精摆放功能
华为·ar·harmonyos
Code Warrior2 小时前
【Linux】基础开发工具(3)
linux·服务器
夕泠爱吃糖4 小时前
Linux中的静态库和动态库
linux·运维·服务器
Vic101015 小时前
Java 开发笔记:多线程查询逻辑的抽象与优化
java·服务器·笔记
moppol6 小时前
探索下一代云存储技术:对象存储、文件存储与块存储的区别与选择
服务器
ZeroNews内网穿透7 小时前
服装零售企业跨区域运营难题破解方案
java·大数据·运维·服务器·数据库·tcp/ip·零售
神的孩子都在歌唱7 小时前
常见的网络攻击方式及防御措施
运维·服务器·网络
请叫我小蜜蜂同学8 小时前
【鸿蒙】鸿蒙操作系统发展综述
华为·harmonyos
深度学习04078 小时前
【Linux服务器】-安装ftp与sftp服务
linux·运维·服务器
HMS Core9 小时前
借助HarmonyOS SDK,《NBA巅峰对决》实现“分钟级启动”到“秒级进场”
华为·harmonyos