k8s兼容昆仑芯p800

主机xpu-smi

K8S device

节点资源

Notebook


推理服务


镜像:ccr.ccs.tencentyun.com/cube-studio/xtrtllm_ubuntu_2004_x86_64_deepseek-v3:v20

挂载目录:kubeflow-user-workspace(pvc):/mnt,/mnt/model(hostpath):/workspace

/mnt/model内容在文件夹model中

启动命令:

source /home/pt201/bin/activate && export LD_LIBRARY_PATH=/usr/local/xpu/so:$LD_LIBRARY_PATH && bash /workspace/deepseek_server/run_server.sh /workspace/DeepSeek-R1-tokenizer /workspace/DeepSeek-R1-0528-BF16-engine r1

测试

相关推荐
OpenCSG几秒前
GLM-OCR:轻量级多模态OCR的技术突破
人工智能
ofoxcoding3 分钟前
Qwen3.5 API 接入实测:和 GPT-4o 比到底差多少
人工智能·qwen3.5
摄影图5 分钟前
智能汽车领域应用图素材 汽车AI研发转型
人工智能·科技·aigc
一只落魄的蜂鸟13 分钟前
【2026年-11期】Where lies the future of humanity in the age of AI?
人工智能
IT阳晨。15 分钟前
PyTorch深度学习实践
人工智能·pytorch·深度学习
老师用之于民16 分钟前
【DAY29】嵌入式系统基础概念总结
人工智能
一水鉴天18 分钟前
整体设计 定稿 的 整理 和完成20260320 之2:文档解析辅助工具编码实现手册 (豆包助手)
人工智能·架构·自动化
欧阳小猜19 分钟前
Transformer革命:从序列建模到通用人工智能的架构突破
人工智能·架构·transformer
海兰22 分钟前
【原理】OpenClaw插件系统深度解析
人工智能·插件·skill·openclaw
软件供应链安全指南23 分钟前
跟随 Gartner 洞察:AIST 从单点能力到全域安全治理的蜕变
大数据·人工智能·安全·gartner·问境aist·aist