QCS8550运行ModelFarm上的DeepSeek-R1-Distill-Qwen-7B模型

1.点击链接aiot.aidlux.com/zh/models打开模型广场,找到对应的模型

2.下载对应模型,将文件包push到板卡上 可直接拖拽到aidlux的文件浏览器或者通过adb push的方式上传

3.生成式模型需找到开发指南下的AidGen推理框架进行使用AidGen | APLUX Doc Center

4.根据操作解压模型资源

bash 复制代码
 cp -r /usr/local/share/aidgen/examples/genie ./
 cd genie/data #此路径下进行解压

5.修改解压后模型资源中后缀为htp.json的配置文件中的路径

6.根据data路径下aidgen_chat_template.txt模板修改/genie/cpp路径下的test_prompt_serial.cpp文件中的提示词模板部分

注意提示模板的提示词修改,给 prompt_template 添加占位符"{}",例如:

ini 复制代码
 if(prompt_template_type == "qwen2"){
     prompt_template = "<|begin▁of▁sentence|>You are Deepseek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries in Chinese.<|User|>{}<|Assistant|>";
 }

7.保存修改后,在当前路径下按照操作进行编译:

bash 复制代码
 mkdir build && cd build
 cmake .. && make
 #编译成功后运行 test_prompt_serial
 ./test_prompt_serial /home/aidlux/genie/data/DeepSeek-R1-Distill-Qwen-7B-htp.json

若提示fatal error: fmt/format.h: No such file or directory,未找到 fmt/format.h 库,先安装相关库:

sql 复制代码
 sudo apt update
 sudo apt install libfmt-dev

运行结果:

相关推荐
Cosolar1 天前
LangChain实战:基于Streamlit+ LangChain + Qwen 快速构建一个多会话AI聊天页面
人工智能·llm·agent
云端FFF1 天前
LLM-based Agent 技术演进 —— 从 Prompt Engineering 到 Harness
llm·agent·skill·ai engineering
小手智联老徐1 天前
OpenClaw 三小时连更三个版本
llm·ai编程·openclaw
得物技术2 天前
财务数仓 Claude AI Coding 应用实战|得物技术
大数据·llm·aiops
jiguanghover2 天前
Playwright_Langgraph
llm
@atweiwei2 天前
用 Rust 构建 LLM 应用的高性能框架
开发语言·后端·ai·rust·langchain·llm
CoderJia程序员甲2 天前
GitHub 热榜项目 - 日榜(2026-04-07)
ai·大模型·llm·github·ai教程
羊小猪~~2 天前
LLM--大模型快速展示(Gradio)
人工智能·python·大模型·llm·部署·gradio·ai算法
sun_tao12 天前
主流大语言模型的损失函数异同
人工智能·llm·损失函数·loss
EdisonZhou2 天前
MAF快速入门(22)声明式Agent实战
llm·aigc·agent·.net core