deepseek本地部署

ollama+anythingllm本地环境搭建与rag检索增强环境搭建

1 ollama

1 下载安装文件

ollama官网下载安装文件对应系统的安装文件,我这里是在windows上安装,所以下载OllamaSetup.exe

2 执行安装命令

这里可以直接双击exe安装,但是应用程序默认会安装的用户目录下面取,如果想改变安装路径,可以使用下面命令安装:

OllamaSetup.exe /DIR="D:\programs\ollama"

3 设置模型保存路径(可选)

点击设置可以可以修改模型保存路径

4 下载模型

选择好模型后,可以做出一个提问,就会自动下载模型了

2 AnythingLLM

1 安装

下载anythingllm然后点击安装文件安装,配置过程中选择ollama和对应的模型,最后勾选运行即可

2 ‌Workspace(工作区)‌

‌ 一个独立的 AI 对话环境,可以绑定特定用户组,实现细粒度权限隔离。核心属性‌:

|-------------------------------------------------------------------------------------------------------------------------|
| id:唯一标识。 name:工作区名称。 slug:URL 友好标识。 openAiPrompt:系统提示词。 openAiTemp:温度参数。 similarityThreshold:相似度阈值。 chatProvider:聊天提供商。 |

|-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| openAiTemp: 1. ‌温度值范围‌ ‌取值范围‌:0.0(最确定)到 1.0(最随机)。 ‌默认值‌:通常为 0.7(平衡状态)。 2. ‌作用机制‌ ‌温度 0.0‌:生成结果高度确定,输出内容更固定、可预测。 ‌温度 1.0‌:生成结果更随机,输出内容更多样化、创新。 ‌实际效果‌: ‌0.0-0.3‌:适合需要精准答案的场景(如代码补全、事实查询)。 ‌0.4-0.6‌:平衡状态,适合日常对话。 ‌0.7-1.0‌:适合创意写作、生成多样化内容。 |

|--------------------------------------------------------------------------------------------|
| similarityThreshold : 是一个介于 0 到 1 之间的浮点数,用于衡量文档与用户问题的语义相似度。通过设定阈值,过滤低相关性文档,提升回答的准确性和聚焦度。 |

‌功能‌:

支持多用户协作与权限隔离,例如"财务制度"Workspace 只对财务部门开放

将私有文档转化为可对话的知识库,支持多格式文档(Word/PDF/图片等)

3 Thread

工作区内的一个独立对话线程,用于管理用户与 AI 的交互历史。核心属性‌:

|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| id:聊天会话 ID。 workspaceId:所属工作区 ID。 prompt:用户输入。 response:AI 响应。 user_id:用户 ID。 thread_id:线程 ID。 include:是否包含在历史中。 feedbackScore:反馈评分。 chatMode:聊天模式。 vectorSearchMode:向量搜索模式 |

4 准本RAG文档内容和验证

text.txt内容如下

复制代码
问题:张三和李四是什么亲属关系?
答案:张三和李四夫妻关系

首先提问(此时没有把上面的文本嵌入AnythinLLM向量数据库):

上传数据到AnythinLLM向量数据库保存后再次提问:

看,回答正确。

5 权限

桌面版没有看到有设置用户权限的地方

发现的问题

有时候思考的时候显示的是英文内容,这有点恶心。你问的是中文,它直接用英文回答你。

相关推荐
不惑_2 小时前
通俗理解神经网络的反向传播
人工智能·深度学习·神经网络
mubei-1232 小时前
Self-RAG:通过自我反思学习检索、生成和批判
人工智能·llm·rag·检索增强生成
集芯微电科技有限公司2 小时前
替代LMG1020 5V 7A/5A 低侧 GaN 和 MOSFET 驱动具有1ns 最小输入脉冲宽度
人工智能·神经网络·生成对抗网络
明天好,会的2 小时前
分形生成实验(二):API 合约驱动的轻量化强类型协作框架
人工智能
北京迅为2 小时前
【北京迅为】iTOP-4412精英版使用手册-第七十八章 Qt界面切换
linux·人工智能·嵌入式·4412
掘金酱2 小时前
2025年度稀土掘金影响力榜单发布!
前端·人工智能·后端
Data-Miner2 小时前
精品PPT | 某制造集团灯塔工厂解决方案
大数据·人工智能·制造
爱写代码的小朋友2 小时前
智启新程,数育未来:码龄11载的成长突破与平衡之道
人工智能
AI浩2 小时前
基于特征信息驱动的位置高斯分布估计的小目标检测
人工智能·目标检测·计算机视觉