tensorflow-dataset 内网下载 指定目录

内网下载报错

解决办法是设置环境变量,指向你的代理服务器TFDS_HTTP_PROXY=http://xxxTFDS_HTTPS_PROXY=http://xxx

留意到,赋值的是你的代理服务器,且最好协议都使用http(即使TFDS_HTTPS_PROXY也要使用http协议连服务器)。如果不这么做,可能会遇到ProxyError

指定目录

如果你的数据集创建是通过tfds.builder创建的,可以使用以下参数,指定数据集下载到指定目录:

py 复制代码
dataset_builder = tfds.builder(config.dataset, data_dir='/home/xxx/dataset/tensorflow-datasets')
dataset_builder.download_and_prepare(download_dir='/home/xxx/dataset/tensorflow-datasets/downloads')
相关推荐
邵宇然2 分钟前
跨沙箱动态传递:WASM 与宿主环境间变长文本数据的零拷贝读取
人工智能
JOJO数据科学8 分钟前
JupyterLab Electron 鸿蒙 PC 适配全记录:从 Python 原生崩溃到 node-static 本地工作台
python·electron·harmonyos
小小小花儿11 分钟前
如何使用Codex进行Vibe Coding
人工智能
信也科技布道师14 分钟前
Agent Skills + Vibe Testing:构建人机协作的测试闭环
人工智能·agent skills
xufengzhu14 分钟前
第三方 Python 库 redis-py + hiredis 的使用
开发语言·redis·python
朱大喜15 分钟前
BI 平台搭建:从数仓到自助分析的实战路径
人工智能
一切皆是因缘际会18 分钟前
LLM轻量化联邦微调机理
数据结构·人工智能·数学建模·ai
Lkstar21 分钟前
万字长文Query改写与多路召回实战|从HyDE到RRF融合,召回率提升22%的完整方案
数据库·人工智能·llm
星辰AI打工人25 分钟前
Agent-Reach 源码级解析:一个 30-200 行的插件系统凭什么治理 14 个平台
人工智能