Dify内网项目解决tiktoken连接问题

问题:

在使用Dify内网环境项目中,出现:当对话正常开始后,系统尝试连接openaipublic.blob.core.windows.net的443端口失败,出现名称解析错误的问题。

原因:

在Dify项目中使用的tiktoken库默认会尝试从OpenAI的公共存储服务下载必要的词汇表文件。在内网环境下无法正常访问。tiktoken库需要两个关键文件来正常工作:1、vocab.bpe - 字节对编码词汇表文件 2、encoder.json - 编码器映射文件

解决方式:

(1)创建本地缓存目录:

bash 复制代码
mkdir tiktoken
cd tiktoken

(2)下载并重命名文件:

bash 复制代码
wget https://openaipublic.blob.core.windows.net/gpt-2/encodings/main/vocab.bpe
cp vocab.bpe 6d1cbeee0f20b3d9449abfede4726ed8212e3aee

wget https://openaipublic.blob.core.windows.net/gpt-2/encodings/main/encoder.json
cp encoder.json 6c7ea1a7e38e3a7f062df639a5b80947f075ffe6

(3)配置Docker环境

修改Docker Compose文件,添加api-service环境变量:

bash 复制代码
environment:
  TIKTOKEN_CACHE_DIR: /app/api/.tiktoken/

添加卷映射,将本地缓存目录挂载到容器中:

bash 复制代码
volumes:
  - ./volumes/plugin_daemon:/app/storage
  - ./tiktoken:/app/api/.tiktoken

(3)修改库文件路径

对于特定模型插件(如Ollama),可能需要直接修改相关Python库文件中的路径设置:

定位到相关库文件:

Ollama: /App/storage/cwd/langgenius/ollama.../.venv/lib/site-packages/tiktoken_ext/openai_public.py

修改文件中的资源路径,指向本地缓存位置,修改以下位置:

bash 复制代码
def gpt2():
    mergeable_ranks = data_gym_to_mergeable_bpe_ranks(
        vocab_bpe_file="/app/api/tiktoken_cache/vocab.bpe",
        encoder_json_file="/app/api/tiktoken_cache/encoder.json",
        vocab_bpe_hash="1ce1664773c50f3e0cc8842619a93edc4624525b728b188a9e0be33b7726adc5",
        encoder_json_hash="196139668be63f3b5d6574427317ae82f612a97c5d1cdaf36ed2256dbf636783",
    )
相关推荐
gc_22997 天前
学习在Windows中基于Docker部署Dify的步骤
windows·docker·dify
User_芊芊君子8 天前
蓝耘元生代×魔珐星云:我用蓝耘MaaS大模型搭建一款共情具身智能数字人
人工智能·dify·蓝耘
腾飞开源9 天前
05_Dify接入Ollama本地大模型
人工智能·项目实战·dify·ai智能体·ollama·企业级应用·接入模型
腾飞开源9 天前
06_Dify接入阿里云百炼API大模型
人工智能·项目实战·dify·ai智能体·ai应用开发·阿里云百炼·接入大模型
m_sophia10 天前
Dify整合MCP查询火车票
dify
量子物理学14 天前
Dify 1.13与1.14自部署 安装插件失败
dify
量子物理学17 天前
Ubuntu上本地部署Dify
dify
jcbut17 天前
离线安装dify 1.7
linux·运维·dify
是烨笙啊17 天前
如何获取 dify-deploy skill 所需要的三个key值
人工智能·ai编程·dify
难以触及的高度17 天前
Dify 本地部署实操全教程:零基础快速搭建私有化 AI 应用
人工智能·ai·github·ai编程·dify