V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)

V100 显卡编译 llama.cpp

参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372

确认自己的版本

遇到的错误:

cc: fatal error: cannot execute 'cc1plus': execvp:

解决方法:

find / -name cc1plus 2>/dev/null

发现文件在:

/usr/lib/gcc/x86_64-linux -gnu/11/cc1plus

将位置加入 PATH:

export PATH=$PATH:/usr/lib/gcc/x86_64-linux-gnu/11/

https://blog.csdn.net/sinat_40471574/article/details/146016380

Docker GPU插件(NVIDIA Container Toolkit)安装

https://blog.csdn.net/weixin_50233496/article/details/156447496

https://cloud.tencent.com/developer/article/2415295

使用教程

llama.cpp

./llama-server --model /home/gy/LLM/models/Qwen3.5-0.8B-gguf/Qwen3.5-0.8B-IQ4_NL.gguf --host 0.0.0.0 --port 8080

网页的运行示例

相关推荐
带刺的坐椅20 小时前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
MomentYY1 天前
Temperature:AI 的“脑洞旋钮”
前端·llm·ai编程
Darling噜啦啦1 天前
上下文工程实战:从 Prompt 到 Harness 的三次 AI 工程化浪潮
llm·ai编程
Hyyy2 天前
Function Calling / Tool Use的原理和实现模式
前端·llm·ai编程
智泊AI2 天前
Loop Engineering 为什么会出现?一个 Loop 的组成部分有哪些?
llm
凌奕2 天前
别用文档约束你的 Agent:聊聊 Agent 开发流程的思想
llm·github·agent
Java之美3 天前
vLLM 是怎么工作的?
llm
JouYY3 天前
聊一下多 Agent 编排架构的应用实践
架构·llm·agent
To_OC5 天前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
想要成为糕糕手5 天前
深入理解AI Agent工具调用:从原理到代码实现
llm·agent