Ubuntu+deepseek+Dify本地部署

1.deepseek本地部署

Ollama官网下载

需要魔法下载

python 复制代码
curl -fsSL https://ollama.com/install.sh | sh

在官网找到需要下载的deepseek模型版本

复制命令到终端

python 复制代码
ollama run deepseek-r1:7b

停止ollama服务

python 复制代码
sudo systemctl stop ollama # sudo systemctl stop ollama.service

开启ollama服务

python 复制代码
 sudo systemctl start ollama.service

查看ollama服务状态

python 复制代码
sudo systemctl status ollama.service

使用allama_gui

一个简易界面来使用模型

  • 安装:python -m pip install ollama_gui
  • 运行:python -m ollama_gui

2.Dify本地部署

安装好docker

python 复制代码
git clone https://github.com/langgenius/dify.git
python 复制代码
cd dify
cd docker
cp .env.example .env
#########
#在.env文件的最后添加
#启用自定义模型
CUSTOM_MODEL_ENABLED=true
#指定Ollama的API地址(根据部署环境调整IP)
OLLAMA_API_BASE_URL=host.docker.internal:11434OLLAMA_API_BASE_URL=host.docker.internal:11434
########
docker compose up -d

此处若报错

python 复制代码
+] Running 9/9
 ✘ sandbox Error       Cannot connect to the Docker daemon at unix:///var...                3.8s 
 ✘ api Error           Cannot connect to the Docker daemon at unix:///var/run...            3.8s 
 ✘ worker Error        Cannot connect to the Docker daemon at unix:///var/...               3.8s 
 ✘ weaviate Error      Cannot connect to the Docker daemon at unix:///va...                 3.8s 
 ✘ web Error           Cannot connect to the Docker daemon at unix:///var/run...            3.8s 
 ✘ db Error            Cannot connect to the Docker daemon at unix:///var/run/...           3.8s 
 ✘ ssrf_proxy Error    Get "https://registry-1.docker.io/v2/": proxyco...                   3.8s 
 ✘ redis Error         Get "https://registry-1.docker.io/v2/": proxyconnect...              3.8s 
 ✘ plugin_daemon Error Cannot connect to the Docker daemon at unix:...                      3.8s 
Error response from daemon: Get "https://registry-1.docker.io/v2/": proxyconnect tcp: dial tcp 11.0.250.2:10023: connect: connection refused

配置代理下载

python 复制代码
systemctl edit docker.service
python 复制代码
[Service]
Environment="HTTP_PROXY=http://ip:port/"
Environment="HTTPS_PROXY=http://ip:port/"
Environment="NO_PROXY=localhost,127.0.0.0/8"

访问http://localhost/install 如果服务器没有界面可在另外浏览器访问http://服务器IP/install

登陆后进入界面点击右上角设置

点击模型供应商下滑找到Ollama

点击添加模型

服务器终端输入ollama list找到添加的模型名称拷贝输入

基础URL填入可能报错

python 复制代码
2f0>: Failed to establish a new connection: [Errno 111] Connection refused'))

解决办法

python 复制代码
systemctl edit ollama.service

对于每个环境变量,在 [Service] 部分下添加一行 Environment

python 复制代码
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
python 复制代码
systemctl daemon-reload
systemctl restart ollama

添加模型以及基础的URL之后,在右上角的系统设置中添加基本模型,找不到就刷新页面重试

点击创建空白应用

输入应用名称并点击创建

在界面中进行对话

打造本地的RAG

选择bge-m3 或者 nomic-embed-text模型

在终端执行命令

python 复制代码
ollama pull bge-m3 #ollama pull nomic-embed-text

下载完毕后在模型供应商中添加嵌入模型

保存后出现在系统模型设置里面添加模型,若没有出现刷新页面即可

点击知识库

点击创建知识库

上传文档后点击下一步,默认设置不用改,点击保存并处理即可

出现一下界面创建完成

点击工作室和聊天助手

点击上下文添加按钮添加文档

在对话框提问即可

API调用python实现

python 复制代码
import requests
import json

# API的基本信息
url = 'your-API/chat-messages'  # 替换为实际的API端点
api_key = 'your-API_KEY'  # 替换为你的API密钥

# 设置请求头
headers = {
    'Authorization': f'Bearer {api_key}',
    'Content-Type': 'application/json'
}

# 设置请求数据
data = {
    "inputs": {
        # "text": "你的输入文本"
    },
    "query": "你好",
    "responsemode": "blocking",
    "conversationid": "",
    "user": "1"
}

# 发送POST请求
response = requests.post(url, headers=headers, json=data)

# 检查响应
if response.status_code == 200:
    # 请求成功,解析JSON响应
    print(response.json())
else:
    # 请求失败,打印错误信息
    print(f"Error: Received status code {response.status_code}")
    print(response.text)

参考链接

https://zhuanlan.zhihu.com/p/22000177368

相关推荐
binary思维几秒前
Ubuntu挂起和休眠
linux·运维·ubuntu
初叶 crmeb18 分钟前
JAVA单商户易联云小票打印替换模板
java·linux·python
qq_4474294119 分钟前
数据结构与算法:图论——拓扑排序
linux·c语言·学习·图论
緈福的街口21 分钟前
【leetcode】459.重复的子字符串
linux·算法·leetcode
某不知名網友29 分钟前
linux信号详解
linux·运维·服务器
Logan Lie32 分钟前
Linux运维笔记:服务器安全加固
linux·运维·服务器·安全
ROC_bird..33 分钟前
linux——文件系统
linux
UFIT37 分钟前
使用Haproxy搭建Web群集
linux·运维
会飞的土拨鼠呀38 分钟前
监控 100 台服务器磁盘内存CPU利用率
运维·服务器
AI风老师40 分钟前
4、ubuntu系统 | 文本和目录操作函数
linux·运维·服务器