1.1 llama.cpp 编译

llama.cpp 更新太快,当前下载 llama.cpp-b7907.tar.gz 进行学习。编译环境选择在windows 11下,采用mingw.环境如下:

软件 版本 说明
windows win11 操作系统
llama.cpp b7907 llama.cpp
mingw64 15.2 支持c++23

编译过程:

解压llama.cpp,在解压文件中创建一个build目录,进入build目录执行cmake命令,进行配置,接着执行make命令进行编译,之后进行make install 进行安装。整个过程我整合成一个bat文件,双击即可执行对应流程。

bat 复制代码
echo Compile llama.cpp
set path=D:\tool_lite\mingw64_152\bin;%path%

cd llama.cpp-b7907
mkdir build
cd build

cmake -G "MinGW Makefiles" ^
 -DCMAKE_C_COMPILER=gcc ^
 -DCMAKE_CXX_COMPILER=g++ ^
 -DCMAKE_INSTALL_PREFIX=E:\workspace\llama\llama.cpp_install ^
 ..


mingw32-make install

@REM VERBOSE=ON

cmd

编译后自动安装到指定目录,如下图

运行测试,未报错

打印版本,版本为0

模型测试,我下载一个模型名字: unsloth_Llama-3.2-3B-Instruct-GGUF_Llama-3.2-3B-Instruct-Q4_K_M.gguf

大小1.87GB 进行测试,参照网上建议,编写一个简单bat脚本启动测试,脚本内容如下:

bat 复制代码
set path=D:\tool_lite\mingw64_152\bin;E:\workspace\llama\llama.cpp_install\bin;%path%

set model=unsloth_Llama-3.2-3B-Instruct-GGUF_Llama-3.2-3B-Instruct-Q4_K_M.gguf

llama-cli.exe -m %model% ^
 -n -1 ^
 --color on ^
 -r "User" 

cmd

运行效果如下,我在源码目录下tools/cli.cpp 231行添加打印:

测试交互如下:

这一节到这里结束

相关推荐
zhy295636 小时前
【DNN】基于llama.cpp的Qwen3-0.6B量化部署微调
人工智能·lora·dnn·llama·qwen3
kuokay1 天前
MLOps 与 AIOps 的核心概
人工智能·分布式·大模型·agent·llama
Trouville012 天前
windows系统使用llama.cpp进行本地大模型部署
llama
棒棒的唐2 天前
windows 直接安装llama.cpp的方法
llama
troubles maker2 天前
LLaMA-Adapter V2: Parameter-Efficient Visual Instruction Model
llm·nlp·llama·多模态
xyz_CDragon2 天前
把旧电脑变成AI算力:llama.cpp RPC 局域网分布式推理验证与实战
人工智能·分布式·python·rpc·llama
wengad3 天前
llama.cpp进行模型格式转换和量化
llama
小七-七牛开发者4 天前
本地模型为什么能跑起来?从 llama.cpp 量化说起
agent·llama·模型部署·ollama·本地模型
七牛云行业应用4 天前
Llama 4 实战指南:Scout/Maverick 本地部署 + API 调用完整流程【2026】
llama