V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)

V100 显卡编译 llama.cpp

参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372

确认自己的版本

遇到的错误:

cc: fatal error: cannot execute 'cc1plus': execvp:

解决方法:

find / -name cc1plus 2>/dev/null

发现文件在:

/usr/lib/gcc/x86_64-linux -gnu/11/cc1plus

将位置加入 PATH:

export PATH=$PATH:/usr/lib/gcc/x86_64-linux-gnu/11/

https://blog.csdn.net/sinat_40471574/article/details/146016380

Docker GPU插件(NVIDIA Container Toolkit)安装

https://blog.csdn.net/weixin_50233496/article/details/156447496

https://cloud.tencent.com/developer/article/2415295

使用教程

llama.cpp

./llama-server --model /home/gy/LLM/models/Qwen3.5-0.8B-gguf/Qwen3.5-0.8B-IQ4_NL.gguf --host 0.0.0.0 --port 8080

网页的运行示例

相关推荐
sg_knight9 小时前
openCode、Claude Code、Cursor、Copilot,到底怎么选
llm·agent·ai编程·claude·codex·opencode·claude-code
JouYY10 小时前
我是如何在业务 Agent 项目中应用 Harness 的
llm·aigc·agent
装不满的克莱因瓶12 小时前
学习 LLM 的函数回调及格式化输出,让 LLM 拥有更强的能力
人工智能·ai·大模型·llm·agent·智能体
CoderJia程序员甲13 小时前
GitHub 热榜项目 - 周榜(2026-06-06)
ai·大模型·llm·github
AI破壁猿13 小时前
我做了一个 AI 工具,把 GitHub 仓库 5 分钟转成专利交底书
人工智能·llm·saas
冬奇Lab18 小时前
Agent 系列(15):Agent 记忆系统进阶——短期、长期、压缩,三层记忆架构
人工智能·llm·agent
Esaka_Forever19 小时前
Agent = LLM + Tools + Knowledge + Memory
llm
星马梦缘20 小时前
MCP 模型上下文协议、Agent Skills 智能体技能、Harness操作系统 课程内容
人工智能·大模型·llm·agent·智能体·mcp·skills
lhxcc_fly1 天前
6.3.1RAG--存储(嵌入向量)
langchain·llm·embedding
心之伊始1 天前
Java 后端接入大模型:从 Token、并发到推理成本的完整估算方法
java·spring boot·性能优化·大模型·llm