QCS8550运行ModelFarm上的DeepSeek-R1-Distill-Qwen-7B模型

1.点击链接aiot.aidlux.com/zh/models打开模型广场,找到对应的模型

2.下载对应模型,将文件包push到板卡上 可直接拖拽到aidlux的文件浏览器或者通过adb push的方式上传

3.生成式模型需找到开发指南下的AidGen推理框架进行使用AidGen | APLUX Doc Center

4.根据操作解压模型资源

bash 复制代码
 cp -r /usr/local/share/aidgen/examples/genie ./
 cd genie/data #此路径下进行解压

5.修改解压后模型资源中后缀为htp.json的配置文件中的路径

6.根据data路径下aidgen_chat_template.txt模板修改/genie/cpp路径下的test_prompt_serial.cpp文件中的提示词模板部分

注意提示模板的提示词修改,给 prompt_template 添加占位符"{}",例如:

ini 复制代码
 if(prompt_template_type == "qwen2"){
     prompt_template = "<|begin▁of▁sentence|>You are Deepseek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries in Chinese.<|User|>{}<|Assistant|>";
 }

7.保存修改后,在当前路径下按照操作进行编译:

bash 复制代码
 mkdir build && cd build
 cmake .. && make
 #编译成功后运行 test_prompt_serial
 ./test_prompt_serial /home/aidlux/genie/data/DeepSeek-R1-Distill-Qwen-7B-htp.json

若提示fatal error: fmt/format.h: No such file or directory,未找到 fmt/format.h 库,先安装相关库:

sql 复制代码
 sudo apt update
 sudo apt install libfmt-dev

运行结果:

相关推荐
Hyyy15 小时前
Function Calling / Tool Use的原理和实现模式
前端·llm·ai编程
智泊AI15 小时前
Loop Engineering 为什么会出现?一个 Loop 的组成部分有哪些?
llm
凌奕17 小时前
别用文档约束你的 Agent:聊聊 Agent 开发流程的思想
llm·github·agent
Java之美2 天前
vLLM 是怎么工作的?
llm
JouYY2 天前
聊一下多 Agent 编排架构的应用实践
架构·llm·agent
To_OC3 天前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
想要成为糕糕手4 天前
深入理解AI Agent工具调用:从原理到代码实现
llm·agent
yLDeveloper4 天前
从矩阵乘法到多模态大模型 - LLM 篇
llm·nlp
前端君4 天前
Claude Code 如何配置本地Ollama模型或别的模型(Deepseek等)
llm·agent·claude
Darling噜啦啦4 天前
LLM 数据工程实战:从数据集划分到交叉验证——大模型智能的根基
llm