V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)

V100 显卡编译 llama.cpp

参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372

确认自己的版本

遇到的错误:

cc: fatal error: cannot execute 'cc1plus': execvp:

解决方法:

find / -name cc1plus 2>/dev/null

发现文件在:

/usr/lib/gcc/x86_64-linux -gnu/11/cc1plus

将位置加入 PATH:

export PATH=$PATH:/usr/lib/gcc/x86_64-linux-gnu/11/

https://blog.csdn.net/sinat_40471574/article/details/146016380

Docker GPU插件(NVIDIA Container Toolkit)安装

https://blog.csdn.net/weixin_50233496/article/details/156447496

https://cloud.tencent.com/developer/article/2415295

使用教程

llama.cpp

./llama-server --model /home/gy/LLM/models/Qwen3.5-0.8B-gguf/Qwen3.5-0.8B-IQ4_NL.gguf --host 0.0.0.0 --port 8080

网页的运行示例

相关推荐
薛定谔的猫36942 分钟前
DeepSeek-V3 模型架构与训练技术深度解析
深度学习·ai·llm·machine learning·moe·deepseek
.柒宇.2 小时前
LangChain入门教程
ai·langchain·llm·agent·rag
AIFrontiers3 小时前
transformer进阶之路:#1 整体概述
llm
Lazy_zheng3 小时前
用 Python 接入大模型 API:从 0 到 1 实现文本分类/抽取/匹配
llm·openai·agent
薛定谔的猫3694 小时前
基于 MCP (Model Context Protocol) 的智能 Agent 开发指南
ai·llm·agent·mcp·software engineering
Irissgwe20 小时前
LangChain快速上手
ai·langchain·llm·ai编程
x_lrong1 天前
昇腾Ascend环境微调部署Qwen3(LlamaFactory+vLLM-Ascend)
微调·部署·昇腾·ascend·llamafactory·qwen3·vllm-ascend
山顶夕景1 天前
【VLM】结合Python沙箱的以图思辨S1-VL模型
python·大模型·llm·agent·多模态·vlm
深念Y1 天前
大模型API缓存的底层原理:从显存到网关
缓存·ai·llm·api·硬件·显存·kvcache
冬奇Lab1 天前
一天一个开源项目(第83篇):karpathy/autoresearch —— 开启 AI“自演化”实验室时代
人工智能·开源·llm