【大模型系列】llama.cpp本地运行大模型

上一篇链接: 【大模型系列】使用ollama本地运行千问2.5模型 我们讲了ollama本地运行大模型,这里我们介绍另一种本地运行大模型的方法:llamacpp

软件下载

下载地址:https://github.com/ggml-org/llama.cpp/releases

下载cpu版本的llamacpp;建议下载3982版本的,新版本我试了在win上运行不了

下载后是一个压缩包,解压后配置Path

配置path

把解压后的路径加入到path中

校验

任意新开命令行,输入指令:

cpp 复制代码
llama-cli -v

出现以下内容表示安装成功

启动

到模型所在目录,执行以下命令即可;下载模型可见我另一篇:链接: 【大模型系列】入门常识备忘 ,这里我们下载的gguf格式的模型

cpp 复制代码
llama-server -m qwen2.5-7b-instruct-q5_0.gguf --port 8088 -c 2048

port 是服务的端口

c 是context的意思,即最大能处理多少个token

启动后就可以通过浏览器 http://localhost:8088 访问服务了

调试开始

over~~

相关推荐
zhongken2591 分钟前
AI智能混剪工具:AnKo打造高效创作的利器!
人工智能·ai·ai编程·ai网站·ai工具·ai软件·ai平台
Elastic 中国社区官方博客3 小时前
拆解 “ES 已死“ 伪命题:Agentic RAG 时代搜索引擎的终极形态
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
非晓为骁4 小时前
【Agent】OpenManus-Agent架构详细分析
ai·agent·agi·manus·openmanus
路漫漫,求索不息4 小时前
通过 API 将Deepseek响应流式内容输出到前端
ai
非晓为骁4 小时前
【Agent】OpenManus-Agent-Memory详细设计
ai·架构·agent·agi·manus·openmanus
非晓为骁6 小时前
【Agent】OpenManus-Prompt组件详细分析
ai·架构·prompt·agent·agi·manus·openmanus
孔令飞15 小时前
16 | 实现简洁架构的 Store 层
人工智能·ai·云原生·golang·kubernetes
mirrornan20 小时前
AI建模智能生成:从2D到3D,AI只需一步!
人工智能·3d·ai·3d模型·三维建模·ai建模
自由鬼21 小时前
OpenAI定义的Agent新范式如何构建自动化系统
运维·ai·自动化·agent