Dify1.11.1+Ollama0.13.5安装说明

安装环境

系统:virtualbox虚拟机安装的centos stream 10系统。

网络:virtualbox采用 桥接模式,使虚拟机系统与宿主机一个ip段,方便测试

虚拟机IP:192.168.1.104

Dify安装:

1.下载官方github源码,手动安装在centos10 中,容器化部署的。

Dify最新版本查询:https://github.com/langgenius/dify/releases
Dify源码仓库:https://github.com/langgenius/dify

安装命令(根据实际路径):

复制代码
cd dify  # 进入dify目录,根据实际
cd docker
cp .env.example .env  # 备份为正式使用的.env
docker compose up -d  # docker compose 一键部署dify

运行成功后, http://192.168.1.104/install 设置账号密码登录即可

Ollama安装:

按照官方linux脚本,直接安装在centos10中。
ollama官网:https://ollama.com/download,选择适合自己系统的
大模型地址:https://ollama.com/search

安装命令(linux):

复制代码
curl -fsSL https://ollama.com/install.sh | sh

注意事项:

ollama安装完成后只能本机访问,

输入命令curl http://localhost:11434,

显示ollama is running 说明已经成功,

但是,需要容器中的dify调用ollama的模型,就需要添加ollama的环境变量,否则dify添加不上模型,在原始url位置会报错

linux设置环境变量

复制代码
Linux设置环境变量操作步骤(永久生效):
#  1.永久生效(避免重启失效,推荐)也就是在系统中添加一个service
sudo vi /etc/systemd/system/ollama.service

# 2.编辑ollama.service内容:
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/local/bin/ollama serve
User=root
Restart=always
RestartSec=3
# 新增:设置监听地址和端口,否则只能本机访问
Environment="OLLAMA_HOST=0.0.0.0:11434"

[Install]
WantedBy=multi-user.target
# 3.保存后重载配置并重启
sudo systemctl daemon-reload
sudo systemctl restart ollama

# 4.检测是否可以任意IP访问
curl http://192.168.1.104:11434     返回:Ollama is running  说明已经生效

window10设置环境变量

复制代码
在 Windows10 中,可以通过以下步骤来设置环境变量 OLLAMA_HOST:

打开系统属性:
右键 此电脑 -选择 属性
关于页面往下,找到相关设置->高级系统设置
环境变量:
在弹出的窗口中,点击 环境变量
新建系统环境变量:
在 系统变量 部分,点击 新建。
在 变量名 中,输入 OLLAMA_HOST
在 变量值 中,输入 0.0.0.0,点击 确定。
重启:
确认保存后,重启电脑,重新打开软件

Ollama拉取大数据模型

1.在ollama大模型库中找到需要安装的模型,网址:https://ollama.com/search

运行命令:

复制代码
ollama run qwen3-vl:2b

显示:为成功拉取大模型。初次拉取时候,可能会有一定时间,若是拉取速度慢可以自行查询一下方法,在此不做说明

Dify中设置ollama的qwen3-vl:2b

至此,完成Dify+Ollama绑定成功

验证:

相关推荐
量子-Alex1 小时前
【大模型RLHF】Training language models to follow instructions with human feedback
人工智能·语言模型·自然语言处理
阿杰学AI2 小时前
AI核心知识92——大语言模型之 Self-Attention Mechanism(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·transformer·自注意力机制
AI资源库2 小时前
microsoftVibeVoice-ASR模型深入解析
人工智能·语言模型
算法狗23 小时前
大模型面试题:在混合精度训练中如何选择合适的精度
人工智能·深度学习·机器学习·语言模型
静听松涛1333 小时前
大语言模型长上下文技术突破:如何处理超长文本的注意力机制与架构图解
人工智能·语言模型·架构
硅谷秋水3 小时前
REALM:用于机器人操作泛化能力的真实-仿真验证基准测试
人工智能·机器学习·计算机视觉·语言模型·机器人
AI资源库4 小时前
nvidiapersonaplex-7b-v1模型深入解析
人工智能·语言模型·回归
程序员ken4 小时前
深入理解大语言模型(8) 使用 LangChain 开发应用程序之上下文记忆
人工智能·python·语言模型·langchain
盼小辉丶4 小时前
Transformer实战——微调多语言Transformer模型
深度学习·语言模型·transformer
WK-Q5 小时前
【论文解读】Transformers are RNNs
人工智能·语言模型·大模型·线性注意力