QCS8550运行ModelFarm上的DeepSeek-R1-Distill-Qwen-7B模型

1.点击链接aiot.aidlux.com/zh/models打开模型广场,找到对应的模型

2.下载对应模型,将文件包push到板卡上 可直接拖拽到aidlux的文件浏览器或者通过adb push的方式上传

3.生成式模型需找到开发指南下的AidGen推理框架进行使用AidGen | APLUX Doc Center

4.根据操作解压模型资源

bash 复制代码
 cp -r /usr/local/share/aidgen/examples/genie ./
 cd genie/data #此路径下进行解压

5.修改解压后模型资源中后缀为htp.json的配置文件中的路径

6.根据data路径下aidgen_chat_template.txt模板修改/genie/cpp路径下的test_prompt_serial.cpp文件中的提示词模板部分

注意提示模板的提示词修改,给 prompt_template 添加占位符"{}",例如:

ini 复制代码
 if(prompt_template_type == "qwen2"){
     prompt_template = "<|begin▁of▁sentence|>You are Deepseek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries in Chinese.<|User|>{}<|Assistant|>";
 }

7.保存修改后,在当前路径下按照操作进行编译:

bash 复制代码
 mkdir build && cd build
 cmake .. && make
 #编译成功后运行 test_prompt_serial
 ./test_prompt_serial /home/aidlux/genie/data/DeepSeek-R1-Distill-Qwen-7B-htp.json

若提示fatal error: fmt/format.h: No such file or directory,未找到 fmt/format.h 库,先安装相关库:

sql 复制代码
 sudo apt update
 sudo apt install libfmt-dev

运行结果:

相关推荐
沛沛老爹5 小时前
Web开发者5分钟上手:Agent Skills环境搭建与基础使用实战
java·人工智能·llm·llama·rag·agent skills
bl4ckpe4ch9 小时前
LLM提示词,究极提高效率【WIP】
llm·大语言模型·提示词工程·llm提示词
irises12 小时前
开源项目next-ai-draw-io核心能力拆解
前端·后端·llm
irises12 小时前
通过`ai.js`与`@ai-sdk`实现前后端tool注入与交互
前端·后端·llm
課代表12 小时前
大语言模型能够理解的11种文件格式
人工智能·语言模型·自然语言处理·llm·markdown·token·模型
智泊AI21 小时前
一文讲清:主流大模型推理部署框架:vLLM、SGLang、TensorRT-LLM、ollama、XInference
llm
大霸王龙1 天前
MinIO 对象存储系统架构图集
人工智能·llm·minio
MoonOut1 天前
LLM | ARC-AGI:有趣的 benchmark
llm
栀秋6661 天前
🌟从“抽卡式编程”到规范驱动: 深度解析「Vibe Coding」的三层跃迁
微信小程序·llm·vibecoding
YuTaoShao1 天前
【Prompt】Prompt 工程入门指南
人工智能·llm·prompt·提示词