Dify内网项目解决tiktoken连接问题

问题:

在使用Dify内网环境项目中,出现:当对话正常开始后,系统尝试连接openaipublic.blob.core.windows.net的443端口失败,出现名称解析错误的问题。

原因:

在Dify项目中使用的tiktoken库默认会尝试从OpenAI的公共存储服务下载必要的词汇表文件。在内网环境下无法正常访问。tiktoken库需要两个关键文件来正常工作:1、vocab.bpe - 字节对编码词汇表文件 2、encoder.json - 编码器映射文件

解决方式:

(1)创建本地缓存目录:

bash 复制代码
mkdir tiktoken
cd tiktoken

(2)下载并重命名文件:

bash 复制代码
wget https://openaipublic.blob.core.windows.net/gpt-2/encodings/main/vocab.bpe
cp vocab.bpe 6d1cbeee0f20b3d9449abfede4726ed8212e3aee

wget https://openaipublic.blob.core.windows.net/gpt-2/encodings/main/encoder.json
cp encoder.json 6c7ea1a7e38e3a7f062df639a5b80947f075ffe6

(3)配置Docker环境

修改Docker Compose文件,添加api-service环境变量:

bash 复制代码
environment:
  TIKTOKEN_CACHE_DIR: /app/api/.tiktoken/

添加卷映射,将本地缓存目录挂载到容器中:

bash 复制代码
volumes:
  - ./volumes/plugin_daemon:/app/storage
  - ./tiktoken:/app/api/.tiktoken

(3)修改库文件路径

对于特定模型插件(如Ollama),可能需要直接修改相关Python库文件中的路径设置:

定位到相关库文件:

Ollama: /App/storage/cwd/langgenius/ollama.../.venv/lib/site-packages/tiktoken_ext/openai_public.py

修改文件中的资源路径,指向本地缓存位置,修改以下位置:

bash 复制代码
def gpt2():
    mergeable_ranks = data_gym_to_mergeable_bpe_ranks(
        vocab_bpe_file="/app/api/tiktoken_cache/vocab.bpe",
        encoder_json_file="/app/api/tiktoken_cache/encoder.json",
        vocab_bpe_hash="1ce1664773c50f3e0cc8842619a93edc4624525b728b188a9e0be33b7726adc5",
        encoder_json_hash="196139668be63f3b5d6574427317ae82f612a97c5d1cdaf36ed2256dbf636783",
    )
相关推荐
IT199512 小时前
Dify笔记-知识库创建后设置和召回测试
笔记·dify
倔强的石头10614 小时前
Dify 接入蓝耘 MaaS:从 0 搭建一个企业知识库问答助手
人工智能·dify·蓝耘
key_3_feng3 天前
基于Dify+EdgeOne的化学试剂反应在线展示系统
dify·difyxedgeone
眼眸流转5 天前
Dify学习笔记
笔记·学习·agent·dify
程序员柒叔5 天前
Dify 一周动态-2026-W22
人工智能·大模型·github·agent·知识库·dify
不懒不懒7 天前
【从零搭建本地电商智能客服 Agent:Dify+Ollama+Qwen3.5 部署全流程】
dify·ollama·本地大模型·qwen3.5·电商智能客服·react 智能体;
HeLiang78 天前
【DIFY】插件安装错误问题解决
ai·dify
m_sophia8 天前
Dify搭建Agent输出旅游规划
agent·dify
m_sophia11 天前
Dify搭建数据可视化工作流
信息可视化·工作流·dify