Ubuntu+deepseek+Dify本地部署

1.deepseek本地部署

Ollama官网下载

需要魔法下载

python 复制代码
curl -fsSL https://ollama.com/install.sh | sh

在官网找到需要下载的deepseek模型版本

复制命令到终端

python 复制代码
ollama run deepseek-r1:7b

停止ollama服务

python 复制代码
sudo systemctl stop ollama # sudo systemctl stop ollama.service

开启ollama服务

python 复制代码
 sudo systemctl start ollama.service

查看ollama服务状态

python 复制代码
sudo systemctl status ollama.service

使用allama_gui

一个简易界面来使用模型

  • 安装:python -m pip install ollama_gui
  • 运行:python -m ollama_gui

2.Dify本地部署

安装好docker

python 复制代码
git clone https://github.com/langgenius/dify.git
python 复制代码
cd dify
cd docker
cp .env.example .env
#########
#在.env文件的最后添加
#启用自定义模型
CUSTOM_MODEL_ENABLED=true
#指定Ollama的API地址(根据部署环境调整IP)
OLLAMA_API_BASE_URL=host.docker.internal:11434OLLAMA_API_BASE_URL=host.docker.internal:11434
########
docker compose up -d

此处若报错

python 复制代码
+] Running 9/9
 ✘ sandbox Error       Cannot connect to the Docker daemon at unix:///var...                3.8s 
 ✘ api Error           Cannot connect to the Docker daemon at unix:///var/run...            3.8s 
 ✘ worker Error        Cannot connect to the Docker daemon at unix:///var/...               3.8s 
 ✘ weaviate Error      Cannot connect to the Docker daemon at unix:///va...                 3.8s 
 ✘ web Error           Cannot connect to the Docker daemon at unix:///var/run...            3.8s 
 ✘ db Error            Cannot connect to the Docker daemon at unix:///var/run/...           3.8s 
 ✘ ssrf_proxy Error    Get "https://registry-1.docker.io/v2/": proxyco...                   3.8s 
 ✘ redis Error         Get "https://registry-1.docker.io/v2/": proxyconnect...              3.8s 
 ✘ plugin_daemon Error Cannot connect to the Docker daemon at unix:...                      3.8s 
Error response from daemon: Get "https://registry-1.docker.io/v2/": proxyconnect tcp: dial tcp 11.0.250.2:10023: connect: connection refused

配置代理下载

python 复制代码
systemctl edit docker.service
python 复制代码
[Service]
Environment="HTTP_PROXY=http://ip:port/"
Environment="HTTPS_PROXY=http://ip:port/"
Environment="NO_PROXY=localhost,127.0.0.0/8"

访问http://localhost/install 如果服务器没有界面可在另外浏览器访问http://服务器IP/install

登陆后进入界面点击右上角设置

点击模型供应商下滑找到Ollama

点击添加模型

服务器终端输入ollama list找到添加的模型名称拷贝输入

基础URL填入可能报错

python 复制代码
2f0>: Failed to establish a new connection: [Errno 111] Connection refused'))

解决办法

python 复制代码
systemctl edit ollama.service

对于每个环境变量,在 [Service] 部分下添加一行 Environment

python 复制代码
[Service]
Environment="OLLAMA_HOST=0.0.0.0"
python 复制代码
systemctl daemon-reload
systemctl restart ollama

添加模型以及基础的URL之后,在右上角的系统设置中添加基本模型,找不到就刷新页面重试

点击创建空白应用

输入应用名称并点击创建

在界面中进行对话

打造本地的RAG

选择bge-m3 或者 nomic-embed-text模型

在终端执行命令

python 复制代码
ollama pull bge-m3 #ollama pull nomic-embed-text

下载完毕后在模型供应商中添加嵌入模型

保存后出现在系统模型设置里面添加模型,若没有出现刷新页面即可

点击知识库

点击创建知识库

上传文档后点击下一步,默认设置不用改,点击保存并处理即可

出现一下界面创建完成

点击工作室和聊天助手

点击上下文添加按钮添加文档

在对话框提问即可

API调用python实现

python 复制代码
import requests
import json

# API的基本信息
url = 'your-API/chat-messages'  # 替换为实际的API端点
api_key = 'your-API_KEY'  # 替换为你的API密钥

# 设置请求头
headers = {
    'Authorization': f'Bearer {api_key}',
    'Content-Type': 'application/json'
}

# 设置请求数据
data = {
    "inputs": {
        # "text": "你的输入文本"
    },
    "query": "你好",
    "responsemode": "blocking",
    "conversationid": "",
    "user": "1"
}

# 发送POST请求
response = requests.post(url, headers=headers, json=data)

# 检查响应
if response.status_code == 200:
    # 请求成功,解析JSON响应
    print(response.json())
else:
    # 请求失败,打印错误信息
    print(f"Error: Received status code {response.status_code}")
    print(response.text)

参考链接

https://zhuanlan.zhihu.com/p/22000177368

相关推荐
洋芋土豆13 分钟前
linux文件及目录管理和vim编辑
linux·vim
柳鲲鹏34 分钟前
RGB转换为NV12,查表式算法
linux·c语言·算法
程序猿(雷霆之王)38 分钟前
Linux——线程安全
linux·运维·服务器
飞雁科技1 小时前
CRM客户管理系统定制开发:如何精准满足企业需求并提升效率?
大数据·运维·人工智能·devops·驻场开发
wanhengidc1 小时前
云手机畅玩 梦幻西游
运维·服务器·arm开发·智能手机·自动化
wdfk_prog1 小时前
[Linux]学习笔记系列 -- [kernel][time]timer
linux·笔记·学习
fy zs1 小时前
linux下动静态库
linux
佐杰1 小时前
Jenkins安装部署
运维·servlet·jenkins
深耕AI2 小时前
如何在云服务器上找回并配置宝塔面板:完整指南
运维·服务器
zly35002 小时前
360极速浏览器 安装猫抓插件的方法
运维