V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)

V100 显卡编译 llama.cpp

参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372

确认自己的版本

遇到的错误:

cc: fatal error: cannot execute 'cc1plus': execvp:

解决方法:

find / -name cc1plus 2>/dev/null

发现文件在:

/usr/lib/gcc/x86_64-linux -gnu/11/cc1plus

将位置加入 PATH:

export PATH=$PATH:/usr/lib/gcc/x86_64-linux-gnu/11/

https://blog.csdn.net/sinat_40471574/article/details/146016380

Docker GPU插件(NVIDIA Container Toolkit)安装

https://blog.csdn.net/weixin_50233496/article/details/156447496

https://cloud.tencent.com/developer/article/2415295

使用教程

llama.cpp

./llama-server --model /home/gy/LLM/models/Qwen3.5-0.8B-gguf/Qwen3.5-0.8B-IQ4_NL.gguf --host 0.0.0.0 --port 8080

网页的运行示例

相关推荐
缘友一世8 小时前
PentestGPT V2源码研究之langfuse模型记录模块
渗透测试·llm·langfuse
EdisonZhou17 小时前
MAF快速入门(21)RC5引入的Script运行能力
llm·agent·.net core
带刺的坐椅1 天前
SolonCode CLI v2026.4.5 发布(编码智能体)
ai·llm·ai编程·cli·claudecode·opencode·sloncode
蜘蛛侠..1 天前
什么是 Plan-and-Execute 模式?与ReAct模式区别?
java·ai·大模型·llm·agent·react·plan模式
MoonOut1 天前
LLM | 项目推荐:LLM 后训练 / Agent 相关的小规模开源项目
llm
deep_drink1 天前
1.2、Python 与编程基础:文件处理与常用库
开发语言·python·elasticsearch·llm
chaors2 天前
Agent来了0x0a:AutoGen 进阶
程序员·llm·agent
iiiiii112 天前
【LLM学习笔记】Batch Normalization vs Layer Normalization,为什么 NLP 中使用 LN 而非 BN
笔记·深度学习·学习·语言模型·大模型·llm·transformer
蜘蛛侠..2 天前
什么是React模式?ReAct 是怎么实现的?你的项目中有实际体现React吗?
ai·llm·agent·react·reasoning·acting
gujunge2 天前
Spring with AI (6): 记忆保持——会话与长期记忆
ai·大模型·llm·openai·qwen·rag·spring ai·deepseek