V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)

V100 显卡编译 llama.cpp

参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372

确认自己的版本

遇到的错误:

cc: fatal error: cannot execute 'cc1plus': execvp:

解决方法:

find / -name cc1plus 2>/dev/null

发现文件在:

/usr/lib/gcc/x86_64-linux -gnu/11/cc1plus

将位置加入 PATH:

export PATH=$PATH:/usr/lib/gcc/x86_64-linux-gnu/11/

https://blog.csdn.net/sinat_40471574/article/details/146016380

Docker GPU插件(NVIDIA Container Toolkit)安装

https://blog.csdn.net/weixin_50233496/article/details/156447496

https://cloud.tencent.com/developer/article/2415295

使用教程

llama.cpp

./llama-server --model /home/gy/LLM/models/Qwen3.5-0.8B-gguf/Qwen3.5-0.8B-IQ4_NL.gguf --host 0.0.0.0 --port 8080

网页的运行示例

相关推荐
梦想不只是梦与想15 分钟前
构建智能问答或RAG系统:三个关键组件
llm·智能问答·rag·reranker·embedding model
小马过河R2 小时前
RAG检索优化策略:系统性四层框架解析
人工智能·python·算法·ai·llm·rag·问答
数据智能老司机3 小时前
大语言模型:那些硬核难题——面向安全性的 LLM 评估
llm
数据智能老司机5 小时前
大语言模型:那些硬核难题——第一性原理:在开始用 LLM 构建之前,我们需要考虑什么
llm
swipe5 小时前
Agentic RAG:用 LangGraph 构建会路由、会纠错、会收敛的闭环 RAG
后端·langchain·llm
冬奇Lab7 小时前
RAG 系列(十八):Conversational RAG——多轮对话中的代词陷阱
人工智能·llm
nujnewnehc8 小时前
第一次接触 agent 概念分享
人工智能·llm·agent
Wilber的技术分享8 小时前
【大模型面试八股 2】Function Call、MCP、Skill的区别
人工智能·面试·职场和发展·大模型·llm·agent·智能体开发
深度学习机器9 小时前
从RAG到LLM Wiki:用AI构建持续进化的个人知识库
人工智能·llm·agent
树獭非懒9 小时前
AI大模型小白手册 | Function Calling-大模型与真实世界交互的桥梁
人工智能·llm·ai编程