V100 显卡编译 llama.cpp(详细教程,适用于其他显卡)

V100 显卡编译 llama.cpp

参考教材:https://blog.csdn.net/weixin_27918373/article/details/158796372

确认自己的版本

遇到的错误:

cc: fatal error: cannot execute 'cc1plus': execvp:

解决方法:

find / -name cc1plus 2>/dev/null

发现文件在:

/usr/lib/gcc/x86_64-linux -gnu/11/cc1plus

将位置加入 PATH:

export PATH=$PATH:/usr/lib/gcc/x86_64-linux-gnu/11/

https://blog.csdn.net/sinat_40471574/article/details/146016380

Docker GPU插件(NVIDIA Container Toolkit)安装

https://blog.csdn.net/weixin_50233496/article/details/156447496

https://cloud.tencent.com/developer/article/2415295

使用教程

llama.cpp

./llama-server --model /home/gy/LLM/models/Qwen3.5-0.8B-gguf/Qwen3.5-0.8B-IQ4_NL.gguf --host 0.0.0.0 --port 8080

网页的运行示例

相关推荐
mirari2 小时前
养一只会跑去酒馆吐槽的龙虾是什么体验?
llm
盐焗乳鸽还要砂锅2 小时前
亲手造一只有灵魂的 AI 小龙虾是种什么体验?
前端·llm·agent
CoderJia程序员甲8 小时前
GitHub 热榜项目 - 日榜(2026-03-08)
ai·大模型·llm·github·ai教程
带娃的IT创业者13 小时前
Prompt Engineering 进阶:让 AI 写出人类味道(完整指南)
人工智能·大模型·llm·prompt·写作技巧·ai 教学
CHPCWWHSU13 小时前
初识llama.cpp - 轻量级推理引擎
llm·llama·cpp·cudatoolkit
树獭非懒14 小时前
AI大模型小白手册 | RAG技术与应用
人工智能·llm
吴佳浩16 小时前
大模型垂直领域微调系列(一):认识微调
人工智能·llm
core51218 小时前
openclaw部署及qwen模型配置
部署·模型·qwen·卸载·百炼·openclaw·小龙虾
AndrewHZ18 小时前
【大模型通关指南】2. 大模型发展时间线:从GPT-1到当前主流模型的演进逻辑
人工智能·gpt·语言模型·大模型·llm·主流模型