纯离线部署本地知识库LLM大模型

Xiaohu_BigData2025-02-26 20:11

纯离线部署本地知识库LLM大模型

一、下载离线大模型

下载的网址：https://hf-mirror.com/

复制代码

deepseek qwen 相关的模型，只建议使用1.5B的，GGUF后缀的模型
推荐下载llama相关模型，同样是GGUF后缀的，自己笔记本电脑推荐下载8B的

二、下载大模型管理平台 LM Studio

下载网址：https://lmstudio.ai/

安装过程只需要修改一个安装路径，后面一直下一步安装成功。

三、将离线大模型导入到 LM Studio 中

注意：默认情况下，LM Studio 所识别的大模型的目录在C盘

默认路径：C:\Users\用户名\.lmstudio\models

修改大模型的加载目录

先创建一个根目录，例如：F:\LMStudioModels

再创建一个二级目录，例如：F:\LMStudioModels\shujia_models 【必须要有一个二级目录】

将模型除.gguf意外的名字拷贝出来，当作一个文件夹的名字

将该模型放在这个文件夹里面

上面操作做完后，LM Studio就可以读取到我们的大模型。

四、通过LM Studio加载我们的大模型【重要，涉及GPU的能力】

点击对话正上方的select a model to load ,选择该对象要使用的大模型
参数解释：
- Context Length: 该模型一次最大可以加载多少个token
  - 若是简单的问答，推荐4096
  - 若是小红书文案，推荐10000以上
  - 若是写作文，小说，推荐100000左右
- GPU Offload: 运行时，所占用的GPU显存，建议先给一半
- CPU Thread Pool Size: 拉满
- Evaluation Batch Size: 512
- 后面不动，都以推荐为准

五、调整参数，进行对话

点击右上角实验室器皿图标，show settings，设置Preset，例如添加一个：数学家

理解为：将当前对话的大模型设置成一个固定的角色

设置System Prompt，形容一下这个数学家

六、使用AnythingLLM工具使用LM Studio中的模型，加载知识库

将LM Studio作为一个服务对外提供，让AnythingLLM连接上LM Studio
- 打开LM Studio点击左边的Developer
- 打开 Start Server按钮
再AnythingLLM中，点击聊天设置，配置LM Studio，选择，模型

七、提供API服务

在AnythingLLM中左下角点击open settings
点击工具
点击API密钥，生成密钥

上一篇：Java后端面试八股文：系统化学习指南，告别零散知识点

下一篇：Axios 取消请求

热门推荐

01GitHub 镜像站点 02【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 03OpenClaw 使用和管理 MCP 完全指南 04OpenClaw + 飞书（Feishu）环境搭建指南 05Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 06OpenClaw优化飞书API 额度已耗尽问题 07Window 10部署openclaw报错node.exe : npm error code 128 08Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 09OpenClaw 接入阿里云百炼 Coding Plan 指南 10OpenClaw大龙虾机器人完整安装教程